A menudo, la minería de datos y el análisis predictivo se usan indistintamente. De hecho, los métodos y herramientas de minería de datos juegan un papel esencial en las soluciones de análisis predictivo; pero el análisis predictivo va más allá de la minería de datos. Por ejemplo, el análisis predictivo también utiliza la minería de texto, en el método de análisis basado en algoritmos para contenidos no estructurados, como artículos, blogs, tweets, contenidos de Facebook “.
La minería de datos es un nuevo enfoque de los datos:
- La minería de datos no es un simple uso de fórmulas estadísticas.
- La minería de datos es parte de un proceso clave para recopilar y usar datos.
- La minería de datos no es solo hojas de cálculo de Excel con campos simples
- Data Mining es una recuperación de datos por computadora y técnicas estadísticas.
¿Qué hay detrás de Predictive Analytics?
- ¿Cuáles son algunos buenos libros de texto en selección / ingeniería de características al construir algoritmos de aprendizaje automático?
- ¿Cuáles son las mejores revistas de estudios de datos críticos?
- ¿Existe una relación entre la compresión de datos y la optimización del código?
- ¿Cómo es Berkeley para la ciencia de datos?
- Si tengo datos en forma de curvas (y no puntos de datos), ¿puedo encontrar una curva que se ajuste a estos datos?
El requisito previo para Predictive Analytics es la recopilación de datos grandes, en parte no estructurados, de diferentes fuentes. La combinación de diferentes fuentes de datos, como el clima, el tráfico y las redes sociales, enriquecidas con datos internos, es particularmente importante.
El análisis predictivo procesa estos datos utilizando diferentes métodos estadísticos como la extrapolación, la regresión, las redes neuronales o el aprendizaje automático para detectar en los patrones de datos y derivar algoritmos. Estos algoritmos se revisan en función de los datos de prueba y se optimizan. También tenga en cuenta que cuantos más datos estén disponibles, más precisos serán los algoritmos desarrollados. Si el proceso de optimización finaliza, el algoritmo y el modelo se pueden aplicar a los datos cuya clasificación se desconoce.