¿Cuál es la diferencia entre ingeniería de datos y minería de datos?

La ingeniería de datos suele estar más centrada en la solución de fondo. Desarrollan la arquitectura o el esquema de cómo todas las relaciones entre fuentes de datos dispares se integran para contar una historia. Su trabajo incluirá el modelado de datos (think ERD), las estructuras y el marco de ETL, y la integración de múltiples fuentes de datos en un solo modelo utilizable. Por lo general, no incluyen la selección de hardware, ya que generalmente se hace de antemano con un Arquitecto de soluciones, pero en algunos casos, podría.

“Minería” significa profundizar en algo con la esperanza de encontrar algo de valor. La minería de datos es la capacidad de desarrollar modelos para obtener información procesable de los datos una vez que está en un formato utilizable (del ingeniero de datos). Esto incluye, pero no se limita a, técnicas de aprendizaje automático, modelos estadísticos, regresión, técnicas de series de tiempo o incluso algo tan simple como la agrupación y los promedios. Para mí, cualquier tipo de valor que pueda obtener de un conjunto de datos abarca la minería de datos.

Espero que esto ayude…