¿Cuál es la diferencia entre ingeniería de datos y minería de datos?

La ingeniería de datos suele estar más centrada en la solución de fondo. Desarrollan la arquitectura o el esquema de cómo todas las relaciones entre fuentes de datos dispares se integran para contar una historia. Su trabajo incluirá el modelado de datos (think ERD), las estructuras y el marco de ETL, y la integración de múltiples fuentes de datos en un solo modelo utilizable. Por lo general, no incluyen la selección de hardware, ya que generalmente se hace de antemano con un Arquitecto de soluciones, pero en algunos casos, podría.

“Minería” significa profundizar en algo con la esperanza de encontrar algo de valor. La minería de datos es la capacidad de desarrollar modelos para obtener información procesable de los datos una vez que está en un formato utilizable (del ingeniero de datos). Esto incluye, pero no se limita a, técnicas de aprendizaje automático, modelos estadísticos, regresión, técnicas de series de tiempo o incluso algo tan simple como la agrupación y los promedios. Para mí, cualquier tipo de valor que pueda obtener de un conjunto de datos abarca la minería de datos.

Espero que esto ayude…

Related Content

¿Cómo explicaría al público la importancia de generar ideas a partir de los datos?

¿Cuál es el mejor instituto para la formación en ciencia de datos en Jaipur?

¿Qué piensa Ross Ledehrman sobre las aplicaciones de la ciencia de datos en las finanzas?

¿Es posible conseguir un trabajo en ciencia de datos o aprendizaje automático justo después de la graduación? ¿Si es así, cómo?

¿Por qué se usa la regresión logística con tanta frecuencia en la ciencia de datos?

¿Cómo se puede utilizar la ciencia de datos en economía?

¿Qué es la agregación y desagregación de datos en Tableau?

More Interesting

¿Cuáles son los mejores programas para la Investigación de operaciones en los Estados Unidos?

¿Cuál es la estructura de datos más eficiente para admitir agregar al final del conjunto, así como acceder o actualizar el i-ésimo valor?

¿Cuál es la diferencia entre minería de datos, ciencia de datos y bigdata?

¿Hay alguna manera de comprimir una gran cantidad de datos a un tamaño muy pequeño como en una bomba zip?

En AWS, ¿qué es mejor para el análisis y modelado de datos: instancias optimizadas para memoria o computación?

¿Cuáles son algunas de las mejores predicciones / pronósticos que se hayan hecho utilizando el aprendizaje automático y las estadísticas computacionales?

¿Qué son los modelos de aumento de gradiente y los bosques aleatorios usando términos simples?

¿Me puede dar algún ejemplo de proyectos de big data?

¿Cuál es el mejor instituto de ciencia de datos en la India?

Dada la opción de buscar SAP o Data Science, ¿cuál va bien y qué es probable que ayude a buscar trabajos para una actualización?

¿Cuál es la mejor opción para las ciencias de datos: IPython o R?

¿Los datos de centrado y escalado siempre dan mejores modelos lineales?

¿Cómo comenzó Big Data?

Acabo de regresar de Strata 2017 y todas las demás botas mostraban una plataforma de ciencia de datos (es decir, Domino). ¿Cuál es tu plataforma favorita y por qué?

¿Cuál es el significado de IBM Data Science Experience?

Web Analytics