¿Qué pasos se deben tomar para tener una comprensión rigurosa de la ciencia de datos (lado teórico, especialmente)?

Es admirable que esté buscando una base sólida en ciencia de datos cuando muchos buscan una solución rápida, o simplemente están poniendo ciencia de datos en sus hojas de vida sin antecedentes reales. De hecho, escribí en un blog sobre los antecedentes de los científicos de datos en The Data Doghouse, pero copiaré algo de esa publicación aquí:

Una de las razones por las que las carreras de economía están de moda nuevamente es gracias a los grandes datos. Las empresas se enfrentan a una avalancha de datos, lo que no les sirve de nada a menos que tengan personas que sepan cómo analizarlas. He escrito aquí anteriormente sobre el déficit de mano de obra de Big Data y el papel del científico de datos.

Las empresas deben tener personas con experiencia en economía, matemáticas y estadísticas para analizar sus datos, no solo profesionales de BI para recopilarlos.

Cuando profundiza en el mundo de los científicos de datos y desarrolla modelos analíticos predictivos, la experiencia principal que debe buscar en un currículum está en los campos de economía, negocios, matemáticas y estadísticas. Aunque estas personas necesitan tener algunas habilidades de programación, los profesionales de TI deben realizar la tarea de programación mediante la integración de datos.

Al mismo tiempo, me divierte y me frustra que tantos expertos de la industria y personas en la educación superior proclamen que el déficit de los científicos de datos se puede llenar al capacitar a estudiantes de informática en herramientas de programación de grandes datos. (Sin ofender a esas personas, ya que tienen un papel importante que desempeñar para obtener los datos, pero su papel generalmente no incluye realizar análisis y formular los modelos predictivos).

Como sabemos muy bien en el campo de la inteligencia empresarial, los datos incorrectos equivalen a una toma de decisiones mal informada. Por lo tanto, los expertos en economía también tienen que entender algo sobre la calidad de los datos y cómo lidiar con las deficiencias de los datos que utilizan para realizar análisis.

Las especialidades de economía toman nota: es posible que desee agregar más cursos de matemáticas de los que requiere su especialización, y también algo de informática. ¡Entonces no habrá duda de que eres sexy!

Al menos para el aprendizaje automático, si desea comprender el lado muy teórico, le recomiendo la minería de datos, la inferencia y la predicción de “Elementos de aprendizaje estadístico”. 2da edición. Es una gran cantidad de matemáticas, un poco difícil de leer, pero un gran texto para el aprendizaje estadístico con una base matemática rigurosa.