Si está interesado en aprender más sobre la minería de datos, un nuevo MOOC acaba de comenzar y tiene una página web aquí: Minería de conjuntos de datos masivos.
Si desea una formación que le permita tener una sólida comprensión de la ciencia de datos, le recomendaría cursos sobre:
- Álgebra Lineal Avanzada
- Mejoramiento
- Estadísticas Bayesianas. Gran parte de la ciencia de datos se basa en la probabilidad, por lo que conocer los métodos estadísticos bayesianos puede ayudar con eso.
En ese punto, debe tener los conocimientos de matemáticas para comprender muchas de las técnicas de ciencia de datos. Para implementar esas técnicas, es posible que desee cursos sobre:
- ¿Qué es Big Data y cómo puede ser útil?
- ¿Por qué las empresas solicitan habilidades de ingeniería de datos cuando reclutan científicos de datos, es decir, matemáticos?
- ¿Qué grado es útil para la ciencia de datos?
- ¿Cuál es la diferencia entre el algoritmo K-Nearest Neighbours y el modelo de suavizado exponencial simple en un problema de serie temporal?
- ¿Cuáles son algunos algoritmos de aprendizaje automático que no pueden tolerar la falta de datos?
- Estructuras de datos
- Algoritmos
- Computación distribuída
Por último, querrás una experiencia real, así que:
- Juega con datos e intenta obtener información
- Compite en competiciones de Kaggle si te parecen interesantes
- Aprende Python y R
- Mantenga un sitio web y github que muestre algunas de las cosas que ha aprendido; esto puede ser muy útil para conseguir un trabajo
Probablemente me perdí alguna información que sea útil, pero esto debería darle una base sólida con la cual construir. ¡Buena suerte!