Soy un gran defensor de los cursos de Andrew Ng en Coursera. Tanto Machine Learning como la especialización de Deep Learning. Personalmente, tomé el curso de Machine Learning (gratis) y es muy perspicaz, y bueno, este tipo tiene un buen sentido de enseñar el material del curso al extraer ideas de las aburridas matemáticas y hacerte sentir empoderado y no estúpido. Él sabe cómo ir de lo básico a lo profundo.
Si un curso es demasiado difícil de seguir debido al tiempo, entonces podría optar por podcasts de aprendizaje automático o algún canal de YouTube sobre aprendizaje automático; hay muchos para construir su base.
Una vez que sepas lo básico, creo que serás lo suficientemente bueno como para construir sobre él. Después de eso, solo intenta hacer cosas, es decir
- ¿Qué temas aprendiste como parte de un curso de ciencias de datos durante tu maestría en los Estados Unidos? ¿Cuáles son algunas sugerencias que me ayudarían a convertirme en un científico de datos exitoso?
- ¿Cómo se determina el precio de los datos del cliente?
- ¿Cuáles son las diferencias entre las carreras universitarias de ingeniería industrial, investigación de operaciones, ciencias de gestión y ciencias de datos?
- Si mi interés principal son las series temporales, ¿debería enfocar mi energía en aprender Python o R?
- ¿Qué debo estudiar más si quiero ser un analista / científico de datos?
- Tome un conjunto de datos y
- Juega con ello.
Ahora, personalmente, no me gustan los conjuntos de datos de Kaggle por la simple razón de que no me dan una sensación de logro cuando hago algo con ellos. ¿Porque preguntas? Porque hay miles de personas más experimentadas que trabajan en el mismo conjunto de datos con las que no tengo la intención ni tengo tiempo para competir. En cambio, trato de obtener conjuntos de datos no convencionales relacionados principalmente con las redes sociales. Ejemplos:
- Datos de Google Trends (relacionados con las finanzas o la salud: qué buscan las personas y cómo se relaciona con el fenómeno real)
- Datos utilizando la API de anuncios de Facebook.
- Datos de Reddit
- Archivo de internet
- Youtube.
Nuevamente, esta es su preferencia personal. Pero solo obtenga algunos datos (big data si lo llama) y juegue con ellos. Aplicar regresión lineal … svm … bosques de decisión … etc.
Además, no soy un gran fanático de las especializaciones / certificados; Creo que es una pérdida de dinero. Sin ofender.