¿Debería un científico de datos novato centrarse en conceptos matemáticos o herramientas?

Gracias por A2A.
Trataré de ayudar aquí. Esto viene de mi experiencia de ayudar / asesorar a algunos científicos de datos en mi firma anterior.

  1. Comience con algunos conceptos básicos de datos de libros como Introducción al aprendizaje estadístico o Introducción de estadísticas abiertas. Repasando minuciosamente los primeros capítulos de cualquiera de estos libros. Esto hará que la pelota ruede para que puedas entender los conceptos básicos de lo que te estás metiendo.
  2. Una vez que haya terminado con los primeros capítulos de estos libros, intente aprender la manipulación de datos utilizando cualquier lenguaje de programación estadística como R, Python (NumPy o Scipy ayudaría) o SAS (en caso de que trabaje en una compañía que tienes). Aprende SQL de la mano. SQL es algo que necesitará durante toda su carrera.
  3. Intente realizar todo tipo de manipulación de datos utilizando conjuntos de datos de muestra utilizando el lenguaje de programación que elija. Si tiene acceso a un entorno hadoop, pruebe varias cosas en Hadoop.

** Fin de aprender algunas herramientas ** Comienzo de entrar en matemáticas **

  1. Complete el libro Introducción al aprendizaje estadístico o Introducción de estadísticas abiertas que había comenzado. Esta vez necesita profundizar en las matemáticas que se utilizan en estos libros.
  2. Lea algunos libros más como Elementos de aprendizaje estadístico, Reconocimiento de patrones y Aprendizaje automático (Bishop) y Aprendizaje automático de Tom Mitchell.
  3. Intente resolver todas las tareas de conferencias de aprendizaje automático de Andrew NG (Stanford) y Tom Mitchell (CMU)

A estas alturas, conocerá muchos más libros y podrá seguir aprendiendo por el resto de sus vidas. Puedes quedarte tan hambriento como quieras una vez que te sumerjas en Machine Learning.

¡Buena suerte!