Si está buscando un trabajo en la industria, un doctorado en física es un excelente lugar para comenzar. Muchos de los mejores científicos de datos que conozco son ex físicos. Suponiendo que recogió las estadísticas estándar en su investigación, lo siguiente que debe hacer es adquirir algunas habilidades de codificación ligeras. Python parece ser el lenguaje de propósito general más popular para la ciencia de datos, pero el dominio de los fundamentos de cualquier otro lenguaje de programación estándar es suficiente. Probablemente no necesite construir los sistemas complejos o los algoritmos sofisticados que se esperan de un ingeniero de software, pero debería poder escribir los tipos de programas sencillos que caben en un solo archivo. Probablemente también se espera que recoja un par de otras herramientas como R / Matlab y SQL también, pero espero que cualquiera que pueda manejar Python las recoja sobre la marcha.
La otra cosa que debes hacer es aprender a pensar sobre el producto. La habilidad más importante para los científicos de datos es saber cómo hacer las preguntas correctas. Es bastante fácil convertir una gran cantidad de datos en gráficos y estadísticas, pero ¿cuáles son los correctos para mirar y qué significan? Comience a buscar productos con los que esté familiarizado y pregúntese qué datos podría usar para evaluar su éxito y descubrir cómo deberían cambiar. Esta es una habilidad que crece mejor con experiencia práctica, pero al menos debería haber comenzado el proceso usted mismo.
Si puede convertir muchos números en consejos para un producto, está listo para ser un científico de datos.
- Cómo seleccionar núcleos SVM
- Después de tomar las estadísticas AP, descubrí que estaba realmente interesado en las estadísticas. ¿Qué me recomendarías para seguir aprendiendo más al respecto?
- ¿Cuál es el ciclo de vida de un proyecto de ciencia de datos o aprendizaje automático?
- ¿Cómo determina una empresa el ROI de un científico de datos o equipo de ciencia de datos?
- ¿Cuáles son las últimas tendencias en ciencia de datos?