La minería de datos implica encontrar patrones interesantes de conjuntos de datos. Big data implica almacenamiento y procesamiento a gran escala (a menudo a escala de centro de datos) de grandes conjuntos de datos. Por lo tanto, la minería de datos hecha de big data (por ejemplo, encontrar patrones de compra de registros de compras grandes) es muy interesante y está recibiendo mucha atención actualmente. Todas las tareas de Big Data no son de minería de datos (por ejemplo, indexación a gran escala). Todas las tareas de minería de datos no están en Big Data (por ejemplo, minería de datos en un archivo pequeño que se puede realizar en un solo nodo).
Sin embargo, tenga en cuenta que wikipedia (como el 10 de septiembre de 2012) define la minería de datos como “el proceso que intenta descubrir patrones en grandes conjuntos de datos”. Siento que los conjuntos de datos no necesitan ser siempre grandes.
- ¿Qué piensan los estadísticos de la ciencia de datos?
- ¿Cuál es la explicación intuitiva de la curva ROC en estadística?
- ¿El aprendizaje automático tiende a producir ganancias de rendimiento marginales o revolucionarias?
- ¿Cómo se usa Data Analytics en finanzas (específicamente Hedge Funds)?
- Si tuviera que configurar un programa de aprendizaje de ciencias de datos de 3 meses para principiantes, ¿cuál sería el mejor programa y la línea de tiempo?