Construir estadísticas / fundamentos de aprendizaje automático
- Se espera que un aspirante a científico de datos esté familiarizado con varias estadísticas o metodologías de aprendizaje automático utilizadas en la industria.
- Uno puede comenzar desde lo básico, es decir, distribución normal, teorema del límite central, prueba de hipótesis y luego pasar a técnicas avanzadas, a saber. regresión lineal, regresión logística, árboles de decisión, análisis de conglomerados, modelos aditivos generalizados, etc.
- Un libro recomendado para esto sería Los elementos del aprendizaje estadístico (por Hastie, Tibshirani y Friedman).
- Además de los libros de texto estándar, una forma alternativa pero efectiva de aprendizaje sería utilizar los MOOC. Hay muchos cursos gratuitos de estadísticas / minería de datos disponibles a través de Coursera, edX, MIT open, Stanford en línea, NPTEL, etc.
Adquirir habilidades técnicas en análisis
- En lo que respecta a las herramientas en la industria analítica, SAS y SPSS solían ser populares antes de que la revolución del código abierto tomara a la industria por sorpresa. Las herramientas de código abierto como R y Python son la próxima gran novedad y tendría sentido invertir tiempo en ellas.
- Hay suficientes recursos disponibles gratuitamente en la web para aprender tanto R como Python. Para las personas con habilidades de codificación en lenguajes orientados a objetos como Java, Python encontrará intuitivo. Pero R es la mejor herramienta (opinión personal) cuando se trata de modelado estadístico y también es la herramienta preferida en la academia.
- Para un principiante absoluto, el curso introductorio en R en Learn R, Python & Data Science Online | DataCamp puede ser un punto de partida. Pero la mejor manera de aprender estos softwares es hacerlo. Por lo tanto, sugeriría que uno debe replicar los códigos disponibles y probarlo en algunos conjuntos de datos ficticios para comprender lo que está sucediendo.
- Además, un conocimiento práctico de SQL junto con habilidades avanzadas de MS Excel / VBA puede actuar como un diferenciador cuando aparece uno para su entrevista.
Lea sobre las aplicaciones comerciales de Data Science
- ¿Cuál es el mejor recurso en línea para aprender la programación de Python para la ciencia de datos?
- ¿Es bueno tener un doctorado en estadística después de completar mi doctorado en ciencia de datos o alguna otra buena idea?
- ¿Qué opinas de los programas de maestría ofrecidos por Data Science Tech Institute (París)?
- ¿Cuáles son las razones que explican que Random Forest funcione mejor que los métodos sin ensamblaje?
- ¿Es GDS (Global Distribution Systems, donde se almacenan los datos de la aerolínea) una base de datos o un tipo de big data?
- Dado que la ciencia de datos no se trata solo de mumbo jumbo técnico, sería realmente útil si uno comprende las aplicaciones comerciales de este y también conoce varios casos de uso exitosos.
- Esto lo ayudará a ver el panorama general y también a uno bien equipado para comprender qué tipo de metodología se ajusta a un problema comercial en particular.
- Por ejemplo, cómo los minoristas utilizan el análisis de la cesta de la compra para agrupar los productos, cómo se puede utilizar el análisis de conglomerados para la segmentación de clientes para el lanzamiento de un nuevo producto, cómo se puede utilizar la regresión logística para la detección de fraudes en el sector bancario / de seguros, etc.
Participa en varios concursos de ciencia de datos
Lo último pero no menos importante sería: práctica, práctica y práctica. Una forma de hacerlo sería participando en varios concursos de ciencia de datos alojados en sitios como kaggle.com.
En GreyAtom, con nuestro plan de estudios ágil, listo para la industria y monitoreo activo de carrera , estaremos allí en cada paso de su viaje para llegar al destino final de convertirse y trabajar como ingeniero de ciencia de datos de Full Stack.
Tendrá un historial de contribuciones de código abierto y ayudará a la comunidad más amplia de ingeniería de software (a través de Github, StackOverflow, un blog o similar).
Puede consultar los detalles del curso haciendo clic en este enlace Full Stack Data Science Engineering | Greyatom
Los datos realmente impulsan todo lo que hacemos. Si le apasiona la ciencia de datos y desea redefinir su carrera, visítenos en el programa en el sitio de GreyAtom: ciencia de datos, aprendizaje automático, Big Data
Creemos que “Aprender = hacer trabajo real”
Enfoque centrado en la práctica para el aprendizaje de la ciencia de datos. Dé el primer paso hacia su viaje en Data Science, programe una sesión de asesoramiento en persona o en video en su momento conveniente, haga clic aquí https://calendly.com/greyatom/co…
Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudar a las personas a encontrar carreras sostenibles en Data Science es mi pasión.