El rol del científico de datos es una mezcla de varios dominios como programación de computadoras, matemáticas, estadísticas y visualización … Sus actividades principales son
- Comprenda los negocios y verifique lo que está disponible en términos de información. La información puede ser archivos de datos, archivos de texto, imágenes, archivos de audio y video.
- Comprender la naturaleza del problema o negocio en cuestión (junto con la naturaleza de los datos)
- Si no hay datos disponibles, trabaje con las partes interesadas para planificar la fase de recopilación de datos.
- Si no se conoce el problema, explore los datos y saque resultados conocidos / desconocidos. Hacer visuales e informes de hechos
- Si el problema se define correctamente, busque una forma de resolverlo con ayuda de datos, que se denomina modelado de datos
- Validar la salida del modelo de datos. Precisión IE en términos generales
- Trabaje con los desarrolladores para implementar algoritmos estadísticos complejos en la aplicación para un mejor rendimiento (en términos de uso de memoria y tiempo para calcular)
Cada paso en sí es un tema. A veces se requieren diferentes equipos de científicos de datos para cada o grupo de estas actividades.
- ¿Cuál es la diferencia entre un actuario y un científico de datos?
- ¿Por qué hay muchos módulos en el ecosistema hadoop en lugar de un solo módulo?
- ¿Qué áreas de negocio impulsadas por los resultados del análisis de datos?
- Cómo aprender análisis de datos (en 10 meses)
- ¿Por qué tantos datos se vuelven 'oscuros'?