Yo era una escuela secundaria … espera … PROFESORA DE ARTE con una licenciatura en biología ambiental. Aprendí a codificar para enseñarles a mis hijos algunas cosas interesantes de STEAM, me enamoré, aprendí sobre el análisis de datos y me gustó aún más.
Pasé un año entero aprendiendo R a través de Coursera, hice una pasantía de investigación de verano.
Tuve la oportunidad de trabajar con un hidrólogo haciendo un análisis de datos que se transformó en un rollo de Ciencia de Datos de Salud Pública.
- ¿Cómo las herramientas de BI modernas como Good Data, RJMetrics, Chartio, Yellowfin, Tableau, etc. procesan una gran cantidad de datos sin usar un almacén de datos?
- ¿Dónde puedo encontrar preguntas y problemas sobre análisis de datos y ciencia de datos?
- ¿Cómo se debe enfocar el aprendizaje de big data?
- ¿La demanda de un analista de datos es mayor que la de un científico de datos?
- ¿Cuál es la mejor manera de elegir el número de componentes en PCA durante la reducción de dimensionalidad?
Toda la transición tomó 2 años, 10 meses mientras enseñaba a tiempo completo.
No había ningún punto en el que, después de dejar la enseñanza, no trabajaba con datos y ganara más de lo que enseñaba. Mis habilidades y comprensión crecieron mucho de mi trabajo y para mí, ha sido una gran decisión.
Debido a que mi trabajo actual es ligero en algunos de los conceptos más pesados de Data Science, dediqué mucho tiempo fuera de las horas de trabajo para desarrollar el aprendizaje automático y las habilidades avanzadas de programación.
Definitivamente es posible intentarlo en la ciencia de datos sin el pedigrí, requiere mucho trabajo, la voluntad de fallar a menudo y un sentido realista de lo que harás durante los primeros años. Y será difícil conseguir ese primer descanso.
Estoy en mi tercer año de construcción de esta carrera y mi tarjeta de presentación dice Científico de datos de salud pública.
Este es un resumen de dónde estoy ahora:
- habilidades sólidas de R
- habilidades de resolución de problemas superiores a la media
- Una buena base en las matemáticas que entra en los modelos más comunes
- habilidades de visualización de datos en múltiples áreas (rbokeh, highcharteR, ggplot, leafletR, tableau, matplotlib, seaborn)
- rMarkdown, tableros flexibles, tablas de datos interactivas
- HTML, CSS y una pequeña cantidad de JavaScript
- una idea de qué hacer con SQL cuando sea necesario
- la capacidad de trabajar en bases de datos no relacionales (mongoDB, Redis)
- secuencias de comandos de Python
- línea de comando
- una gran cantidad de algoritmos de modelado
- probabilidad – estimaciones prácticas y MCMC
- estadísticas, frquentista y baysiano, pruebas AB, pruebas de igualdad, confianza e incertidumbre, regresiones, encuestas y factores
- bosques de aprendizaje automático, SVM, regresiones de todo tipo, agrupación …
- PNL y análisis de redes sociales (gráficos)
- la capacidad de pensar creativamente sobre la consulta basada en datos
- la destreza verbal para explicar lo que descubrimos en inglés simple
En mi estimación, ese es un científico de datos junior …
Me siento cómodo con esa etiqueta y pensaría que uno podría recibir un puesto con ese título en un entorno corporativo en este punto de la carrera, siempre que haya espacio para crecer y apoyo para promover una educación formal en el camino (piense en estadísticas o ciencia de datos con ayuda financiera desde arriba).
En este punto, sé lo que no sé y cómo puedo adquirir ese conocimiento cuando lo necesito … ese es un buen lugar para estar en este punto.
Para darle una estimación de mi cronograma, estaba trabajando con datos al final del primer año, obtuve el título de Científico de datos al final del segundo año y probablemente me gané el derecho de llevarlo en los últimos meses …
Trabajé mucho más de lo que la mayoría de las personas se sentirían cómodas trabajando, más de 50 horas semanales en los primeros 18 meses además de mi trabajo para desarrollar las habilidades básicas, por lo que el millaje puede variar según su manejo y las responsabilidades familiares.