Puede sorprenderle que haya pocas herramientas sofisticadas necesarias. MS Excel casi siempre forma parte del kit de herramientas. Hace que los datos sean fáciles de ver y es una herramienta omnipresente. Cualquier tipo de transformación o métrica básica que desee crear a partir de los datos puede ejemplificarse en Excel.
Un buen editor de texto capaz de manejar archivos grandes también es útil. Recomiendo Sublime, que es multiplataforma. Puede realizar transformaciones de texto utilizando filtros regex, y se realiza rápidamente.
En tercer lugar, algún tipo de herramienta gráfica que le permitirá describir los flujos de datos. Por lo general, será Visio o alguna herramienta compatible. Yo uso OmniGraffle en la Mac.
- ¿Qué tan necesario es una comprensión profunda de la computación paralela para un científico de datos?
- ¿Podrá Kaggle sobrevivir a la explosión en la industria del software de análisis?
- ¿Es SPSS una herramienta de minería de datos más apropiada que Weka?
- ¿Cuáles son las diferencias entre Data Science y Data Mining, son las mismas?
- ¿Cómo se compara el programa inmersivo de ciencia de datos de la Asamblea General con los cursos de ciencia de datos, inteligencia artificial y aprendizaje automático / aprendizaje profundo de los MOOC?
En términos de compartir datos con cualquier equipo, hay muchas herramientas de colaboración y han mejorado constantemente con el tiempo. Dropbox es un deber. Si la seguridad es una prioridad, recomendaría Amazon S3 en su lugar. Pero en términos de gestión de proyectos, he encontrado que la combinación de Trello y Slack es inmejorable.