Quiero ser un científico de datos. Estoy cursando una licenciatura en informática. ¿Qué debo hacer después de mi graduación para convertirme en científico de datos y en qué tema me concentro?

Gracias por el A2A!

Como ya se señaló, sería una buena idea comenzar con estadísticas y probabilidad. Aquí hay una serie de conferencias que puede usar para eso:

También debe conocer los conceptos básicos de álgebra lineal para comprender los conceptos detrás de los algoritmos básicos de aprendizaje automático.

Álgebra Lineal | academia Khan

Una vez hecho esto, es posible que desee elegir el idioma en el que desea implementar los algoritmos. Yo personalmente recomendaría Python, ya que es fácil de usar y tiene una demanda muy creciente. En primer lugar, concéntrese en las bibliotecas numpy, pandas y matplotlib después de lo básico.

Con estos, habría establecido una base sólida para aprender ciencia de datos.

Luego puede concentrarse en aprender los diversos algoritmos y técnicas de modelado involucrados. Para comenzar, recomiendo el curso de Andrew Ng sobre Machine Learning.

Aprendizaje automático | Coursera

El único inconveniente es que implementará las tareas de este curso en Octaves.

Tendrá que aprender sobre la biblioteca scikit-learn (hay otras, pero esta es una buena para empezar) en python, lo que facilita mucho el modelado.

Hay conceptos como limpieza de datos, EDA, ingeniería de características, ajuste de hiperparámetros, etc. para los cuales deberá seguir blogs. http://analyicsvidhya.com es un excelente lugar para esto.

Centrarse en los temas en esta secuencia debería hacer que su viaje sea suave y productivo.

¡Buena suerte!

Estudie, estudie y estudie … ¡adquiera conocimientos prácticos!

Ese debería ser tu único objetivo

Realice proyectos en vivo desde kaggle tantos como pueda después de completar su aprendizaje de todos los temas a continuación.

Temas que debes cubrir

Estadísticas – regresión y otros temas básicos

Álgebra.- a fondo

Programación R

Análisis predictivo

Aprendizaje automático

Herramientas de visualización como tableau, etc.

Python con todas las bibliotecas

De la misma manera deben elegirse sus temas, progresivamente

En caso de que necesite más profundidad, avise a DM.

Saludos y feliz aprendizaje!

¡Antes de la graduación, debes tratar de aprender mucho sobre estadísticas! No suele ser una parte importante del plan de estudios estándar de informática.