La ingeniería de datos suele estar más centrada en la solución de fondo. Desarrollan la arquitectura o el esquema de cómo todas las relaciones entre fuentes de datos dispares se integran para contar una historia. Su trabajo incluirá el modelado de datos (think ERD), las estructuras y el marco de ETL, y la integración de múltiples fuentes de datos en un solo modelo utilizable. Por lo general, no incluyen la selección de hardware, ya que generalmente se hace de antemano con un Arquitecto de soluciones, pero en algunos casos, podría.
“Minería” significa profundizar en algo con la esperanza de encontrar algo de valor. La minería de datos es la capacidad de desarrollar modelos para obtener información procesable de los datos una vez que está en un formato utilizable (del ingeniero de datos). Esto incluye, pero no se limita a, técnicas de aprendizaje automático, modelos estadísticos, regresión, técnicas de series de tiempo o incluso algo tan simple como la agrupación y los promedios. Para mí, cualquier tipo de valor que pueda obtener de un conjunto de datos abarca la minería de datos.
Espero que esto ayude…
- ¿Qué trabajo se da a los estudiantes de primer año en el análisis de datos?
- ¿Por qué los datos toman espacio? ¿Hay alguna forma de comprimir todos los datos del mundo en 1 megabyte de espacio?
- ¿Cuáles son las diferencias entre una maestría en MIS, aprendizaje automático y ciencia de datos?
- ¿Cuáles son algunas de las empresas de análisis de big data?
- ¿Cuáles son los campos de más rápido crecimiento que involucran estadísticas?