Sí, lamentablemente, debo estar de acuerdo con las otras respuestas. En mi experiencia, convertirse en un Data Scientist es un camino mucho más largo que 4–5 meses. Y ni siquiera se trata simplemente de tener las habilidades necesarias.
Para tener éxito como científico de datos, necesitará comprender lo siguiente:
- Estadísticas (diseño experimental, fundamentos)
- Álgebra Lineal (útil para entender ML)
- Análisis de los datos
- Probabilidad (fundamentos)
- Bases de datos (cómo trabajar eficazmente con una variedad de bases de datos: NoSQL, SQL, Hadoop, etc.)
- Ingeniería de software (necesaria para construir productos respaldados por la ciencia de datos, o descubrir cómo implementar cosas en otro software)
- R
- Pitón
- Módulos / bibliotecas populares para hacer todo, desde datos hasta aprendizaje automático, ETL y … en Python y R
Básicamente, es una extraña combinación de habilidades, y generalmente los empleadores (participo en el proceso de contratación donde trabajo, así que veo mucho de esto) buscan personas que tengan:
- ¿Cómo puedo usar el aprendizaje automático en Python?
- Deep Learning se implementa principalmente en big data. ¿Qué piensa sobre usarlo en datos con muestras limitadas pero de altas dimensiones como fMRI?
- ¿Cuáles son algunos buenos libros de texto en selección / ingeniería de características al construir algoritmos de aprendizaje automático?
- Cómo probar A / B una nueva aplicación de mensajería sin restringir con qué miembros pueden hablar (es decir, los miembros en el grupo de "prueba" aún pueden enviar mensajes a los miembros en el grupo de "control")
- ¿Qué importancia tienen los datos en UPSC CSE? ¿Cómo memorizo un tramo tan enorme de fechas y datos?
- Ha sido un científico de datos anteriormente (sí, esto presenta un obstáculo-22)
- Una historia de aplicar todo lo anterior en la vida real (como un hobby está bien, profesionalmente es mucho mejor)
Probablemente podrías conseguir que alguien te dé una oportunidad como científico de datos “junior” si puedes demostrar que tienes habilidades relevantes y rasgos de personalidad que son comunes entre los científicos de datos (adoran los problemas difíciles, la creatividad, la adaptabilidad, la determinación, la curiosidad, los detalles orientado, flexible, ingenioso, amor por aprender y aplicar lo que acaba de aprender). Para persuadir a alguien para que te dé una oportunidad, deberás presentarte como “oye, aquí están todas las cosas que he estado haciendo y cómo las he estado haciendo … lo que básicamente indica que he sido un científico de datos en alguna capacidad u otra, aunque todavía no tenga el título “.
De lo contrario, tendrá que pasar años, comenzando en el camino como estadístico (lo que probablemente requeriría un título en Estadística) o un analista de datos, y luego, eventualmente, aún tendrá que hacer ese mismo lanzamiento. Es lo que todos tienen que hacer: 1) adquirir las habilidades y habilidades necesarias, y 2) desarrollar los rasgos de personalidad relevantes que apoyan el trabajo, hasta 3) pueden presentarse como esencialmente un “científico de datos” sin el título.
Aunque sea tan bueno como un EE, es probable que le lleve al menos un año llegar al punto en que un empleador lo apueste y lo incorpore como científico de datos junior.
En pocas palabras: los costos de cambio son altos, por lo que a menos que realmente no te guste ser un EE, sería mejor que te quedes con lo que eres bueno y maximices esa inversión. Sí, puedes ganar mucho dinero como científico de datos, y si tienes cierta personalidad, el trabajo puede ser muy gratificante, pero no es para todos. Ni por asomo. El trabajo puede ser extremadamente tedioso, agotador, y puede ser excepcionalmente frustrante trabajar con personas de negocios que asocian la ciencia de datos con la magia, y que no entienden que a menudo lleva mucho tiempo y mucho trabajo. Literalmente, los jefes pasados me preguntaron “¿por qué se necesita tanto código para hacer X” (jefes que no podían codificar para salir de una bolsa de papel, por cierto), o jefes que no tenían la capacitación y experiencia que yo me dice cómo hacer mi trabajo (“No, no puedes tener esa variable en el modelo. Porque yo lo dije”).