La minería de datos es la práctica de buscar automáticamente grandes almacenes de datos para descubrir patrones y tendencias que van más allá del simple análisis.
La minería de datos utiliza algoritmos matemáticos sofisticados para segmentar los datos y evaluar la probabilidad de eventos futuros.
La minería de datos también se conoce como Knowledge Discovery in Data (KDD).
- Python o SAS? Soy nuevo en el campo de la ciencia de datos. Todavía atrapado entre muchas pistas / opciones, incapaz de decidir cuál seguir.
- Durante el análisis de datos con R, ¿qué debería importarnos primero: los valores atípicos o los valores faltantes?
- Cómo elegir un algoritmo de minería de datos al minar un conjunto de datos real
- ¿Cuáles son las aplicaciones de la ciencia de datos y el aprendizaje automático en las industrias de petróleo y gas?
- ¿Cuál es el mejor campo para aprender y ganar, base de SAP o ciencia de datos?
Los pasos son Comprensión de datos, Preparación de datos, Modelado, Evaluación e Implementación.
Comprensión de datos:
La fase de comprensión de datos comienza con la recopilación de datos inicial, que recopilamos de las fuentes de datos disponibles, para ayudarnos a familiarizarnos con los datos. Se deben realizar algunas actividades importantes, incluida la carga de datos y la integración de datos para que la recopilación de datos sea exitosa.
Preparación de datos:
La preparación de datos generalmente consume alrededor del 90% del tiempo del proyecto. El resultado de la fase de preparación de datos es el conjunto de datos final.
Modelado:
Las técnicas de modelado deben seleccionarse para ser utilizadas para el conjunto de datos preparado.
Evaluación:
En la fase de evaluación, los resultados del modelo deben evaluarse en el contexto de los objetivos comerciales en la primera fase
Despliegue:
El conocimiento o la información, que obtenemos a través del proceso de minería de datos, debe presentarse de tal manera que las partes interesadas puedan usarlo cuando lo deseen.