En palabras simples, la minería de datos es la extracción de información predictiva oculta de grandes bases de datos, es una nueva tecnología poderosa con un gran potencial para ayudar a las empresas a centrarse en la información más importante en sus almacenes de datos.
Tiene un alcance enorme, es pequeño y grandes organizaciones. La minería de datos se usa básicamente en dirección opuesta a la del almacenamiento de datos. Al igual que al analizar los datos de los clientes de una empresa, las herramientas de minería de datos pueden construir un modelo predictivo que puede decirle qué clientes están en riesgo o pérdida.
Las técnicas más utilizadas en la minería de datos son:
- ¿Cuál es el tema de ciencia de datos Preguntas frecuentes?
- ¿Qué tipo de datos se almacenan y qué tipo de análisis se realiza en datos de proyectos arqueológicos?
- ¿Cuál es la función de retraso y diferencia en SAS? ¿Cuál es la aplicación detrás de esas dos funciones?
- ¿Puedes compartir algunas fotos de tu lugar de trabajo?
- ¿Qué herramientas e idiomas necesito saber para convertirme en un científico de datos en el futuro?
- Redes neuronales artificiales: modelos predictivos no lineales que aprenden a través del entrenamiento y se asemejan a las redes neuronales biológicas en la estructura.
- Árboles de decisión: estructuras en forma de árbol que representan conjuntos de decisiones. Estas decisiones generan reglas para la clasificación de un conjunto de datos. Los métodos específicos del árbol de decisión incluyen los árboles de clasificación y regresión (CART) y la detección automática de interacción Chi Square (CHAID).
- Algoritmos genéticos: técnicas de optimización que utilizan procesos como la combinación genética, la mutación y la selección natural en un diseño basado en los conceptos de evolución.
- Método de vecino más cercano: una técnica que clasifica cada registro en un conjunto de datos basado en una combinación de las clases de los k registros más similares a él en un conjunto de datos histórico (donde k ³ 1). A veces se llama la técnica de vecino k-más cercano.
- Inducción de reglas: extracción de reglas útiles de si-entonces a partir de datos basados en significación estadística.
***Seguir aprendiendo***