Nunca contraté específicamente para pasantías en ciencia de datos, pero las tuve para el análisis de datos. Mi respuesta es básicamente lo que busqué en el análisis de datos con un poco de reflexión sobre lo que tendría para la ciencia de datos.
- Estadísticas … quiero decir, esto es lo más básico … Espero que un interno tenga una buena comprensión de las estadísticas descriptivas, como mínimo.
- Programación. Aunque prefiero R dada la configuración de mi equipo, cualquier lenguaje en el campo de programación de estadísticas / matemáticas funcionaría y podríamos tomarlo desde allí. R, Python, Julia, Matlab, SAS, etc. Es posible que otras compañías tengan una especificación más amplia para la ciencia de datos. En esos casos, Python y Java son buenas opciones.
- SQL Aunque no es un requisito, es una adición muy valiosa.
- Munging de datos. Si se trata de ciencia de datos, es una mezcla de datos. Espero una comprensión básica de cómo limpiar y transformar un conjunto de datos.
- Aprendizaje automático. Comprender qué es, ajustar y evaluar modelos, pero lo más importante de todo es poder pensar en modelos de aprendizaje automático.
Los números 4 y 5 serían específicos para pasantías en ciencia de datos.
Espero que esto ayude.
- ¿Cuáles son algunos algoritmos de recuperación de información de los que siempre debe tener una sólida comprensión y por qué?
- Cómo avanzar mi habilidad R al siguiente nivel
- ¿Cuáles son las ventajas del procesamiento de datos?
- ¿Existe una definición de "Big" en el contexto de "Big Data"? ¿Cuál es exactamente el significado de "Big" desde el punto de vista de la ciencia de datos?
- ¿Cómo se pueden utilizar las tecnologías e iniciativas de Big Data dentro de las aplicaciones de Sistemas Inteligentes de Transporte (ITS)?