¿Cuáles son las mejores técnicas de minería de datos?

¿Qué es la minería de datos?

La minería de datos es el proceso de extraer información útil y patrones de enormes datos. La minería de datos incluye la recopilación, extracción, análisis y estadísticas de datos. También se conoce como proceso de descubrimiento de conocimiento, minería de conocimiento a partir de datos o análisis de datos / patrones. La minería de datos es un proceso lógico de búsqueda de información útil para encontrar datos útiles. Una vez que se encuentran la información y los patrones, se puede utilizar para tomar decisiones para desarrollar el negocio. Las herramientas de minería de datos pueden dar respuestas a sus diversas preguntas relacionadas con su negocio que era demasiado difícil de resolver. También pronostican las tendencias futuras que permiten a los empresarios tomar decisiones proactivas.

Técnicas de minería de datos

Una de las tareas más importantes en Data Mining es seleccionar la técnica correcta de minería de datos. La técnica de minería de datos debe elegirse en función del tipo de negocio y el tipo de problema que enfrenta su negocio. Se debe utilizar un enfoque generalizado para mejorar la precisión y la rentabilidad del uso de técnicas de minería de datos. Básicamente, hay siete técnicas principales de minería de datos que se analizan en este artículo. También hay muchas otras técnicas de minería de datos, pero estas siete personas se consideran más utilizadas por los empresarios.

  • Estadística
  • Agrupamiento
  • Visualización
  • Árbol de decisión
  • Reglas de asociación
  • Redes neuronales
  • Clasificación

Gracias por el A2A.

No soy un gran admirador de usar la técnica de la palabra en discusiones relacionadas con datos. La mayoría de las personas lo usarán cuando quieran decir tareas o algoritmos cuando, como lo veo, significa definir bien el procedimiento. Lo que significa que no creo que la clasificación y la regresión sean técnicas, por ejemplo. Tampoco creo que los algoritmos sean técnicas. Son, simplemente, algoritmos. Creo que la imputación y la normalización son técnicas.

Sin embargo, me corregiré si tengo una mejor opinión.

Sin embargo, sea cual sea el punto de vista que adoptemos sobre la técnica, creo firmemente que no hay mejores técnicas.

Intentar distinguir cuál es mejor es como distinguir si una manzana es mejor que una naranja. En sí mismo, decir que la agrupación es mejor que la asociación no tiene sentido. Decir que SVM es mejor que Random Forests no tiene sentido. Decir que la imputación es mejor que la normalización no tiene sentido.

Incluso si algo que estamos comparando es comparable, digamos dos algoritmos para la misma tarea y el algoritmo A tiene un rendimiento más alto que el algoritmo B el 99% de las veces. Todavía hay 1% de las veces que el algoritmo B es mejor. Es posible que hoy no haya suficientes casos de uso para el algoritmo B.

No hay mejores, solo situaciones. No debemos clasificar nada como mejor o mejor en el vacío.

Las siguientes son las mejores técnicas en minería de datos:

  • Asociación
  • Clasificación
  • Agrupamiento
  • Árboles de decisión
  • Predicción
  • Análisis secuencial

Para obtener información detallada sobre las técnicas de minería de datos, visite este enlace: Técnicas de minería de datos