Un buen científico de datos solo tiene un trabajo: aprovechar los datos para mejorar los resultados comerciales. Para los principales científicos de datos, entonces, no necesariamente necesitan “vencer” a estos otros generalistas porque tienen un conjunto completamente diferente de habilidades.
Por un lado, a menudo son más versátiles para adquirir nuevos tipos de datos, porque conocen SQL y otras tecnologías que les permiten reunir un conjunto de datos más grande. Luego, en lugar de ejecutar análisis con herramientas simples como Excel, aprovechan herramientas altamente adaptables como Python, Stata, R, etc., que les permiten intentar ejecutar varios modelos y análisis diferentes.
Específicamente para el análisis predictivo, el aspecto más importante es adquirir datos, analizarlos y probarlos en datos REALES para ver cómo funcionan. Al igual que la ingeniería de software, si no puede emular cómo podría funcionar en la producción, no hay forma de evaluar el modelo. Un buen científico de datos no solo entrenará modelos predictivos, sino que también los probará en datos reales en vivo y monitoreará su desempeño. Otros generalistas a menudo no tendrán las habilidades para ir de principio a fin desde la recopilación de datos, el análisis hasta las pruebas de producción.
- Uso mucho Python y R, y me gustaría comenzar una empresa que ofrezca servicios de análisis de datos. ¿Cómo puedo monetizar big data? ¿Donde debería empezar?
- ¿Por qué Two Sigma diseñó su concurso de Kaggle para eliminar cualquier beneficio del conocimiento del dominio?
- A medida que la tecnología está cambiando tan rápido, ¿una maestría en ciencia de datos será de algún valor en los próximos años?
- ¿Cuál es el mejor sitio web tutorial para aprender el lenguaje Big Data, Hadoop & R?
- ¿Cuál es la mayor barrera para la adopción de soluciones de big data en la asistencia sanitaria?
Con herramientas como Jupyter Notebooks y Datmo, eso puede cambiar muy bien, aunque en su mayor parte, los principales científicos de datos se desempeñan mejor que los generalistas debido a sus habilidades en las 3 etapas del proceso.