¿Cuáles son algunas de las aplicaciones más útiles para la minería de datos?

Aquí hay diez de los más famosos y su aplicación en diferentes campos:

Aquí una primera clasificación de la siguiente manera.

  1. Agrupación : es el problema de agrupar a los individuos de una población por su similitud de atributos. Un algoritmo de agrupamiento muy famoso es, por ejemplo, k-means
  2. Algoritmos de clasificación. La clasificación intenta predecir, para cada individuo en una población, a qué conjunto de clases pertenece este individuo. Una tarea de clasificación, dada una nueva persona, determina a qué clase pertenece esa persona. También puede asignar una probabilidad a esta asociación. Un ejemplo es KNN (o k neares vecino)
  3. Algoritmo de reducción de dimensiones para reducir las dimensiones de un conjunto de datos. Intenta tomar un gran conjunto de datos y reemplazarlo con un conjunto de datos más pequeño que contenga gran parte de la información importante en el conjunto más grande. Por ejemplo, puede usar el conjunto de datos reducido para entenderlo mejor y visualizarlo en dimensiones 2D.
  4. PCA o análisis de componentes principales para identificar las variables más importantes en su conjunto de datos. Existen muchos estudios que utilizan PCA para el análisis de datos, pero este es uno de los documentos que lo aplica de manera original: Comportamientos propios: identificación de la estructura en la rutina.
  5. Filtrado colaborativo para construir sistemas de recomendación. Es un problema de similitud coincidente. Por ejemplo, encontrar personas que son similares a usted en términos de los productos que les han gustado o que han comprado o encontrar productos que son similares con respecto al conjunto de atributos. En este último caso, se realiza un algoritmo de recomendación “basado en elementos”
  6. Reglas de asociación o agrupación conjunta para el análisis de la cesta de la compra. Una pregunta común en este caso es: ¿qué artículos se compran comúnmente juntos? Por ejemplo, analizar los registros de compra de un supermercado puede descubrir que la cerveza se compra junto con papas fritas con frecuencia.
  7. Método de regresión para predecir el valor de un cierto valor . Por ejemplo: ¿Cuánto usará un cliente determinado un determinado servicio? La cantidad que se va a predecir aquí es el uso del servicio, y se podría generar un modelo observando a otras personas similares de la población y su uso histórico.
  8. Algoritmo LDA para análisis de sentimientos y minería de texto, pero también para muchas otras aplicaciones. Aquí un artículo al respecto: Página en aaai.org
  9. El camino más corto de Dijkstra para encontrar el camino más corto de un nodo a otro en un gráfico. Probablemente el algoritmo más importante en la teoría de grafos.
  10. Predicción de enlaces para predecir conexiones entre elementos de datos, sugiriendo que debe existir un enlace y estimando la fuerza del enlace. Por ejemplo, en las redes sociales trata de adivinar si usted y John comparten 15 amigos, tal vez usted y John podrían ser amigos en la vida real.

10 de los algoritmos más famosos en minería de datos de Alket Cecaj sobre algoritmos y DataFusion

“Programming Collective Intelligence”, escrito por Toby Seagaran en O’Reilly, identifica estas 7 opciones (aunque no es exclusivo ni está clasificado por sí mismo, es solo una lista útil):

1) biotecnología
2) Detección de fraude financiero
3) Visión artificial (?)
4) Comercialización del producto (supongo que los datos del usuario antes y después de la venta, así como los datos psicográficos … y ahora los sentimientos en el espacio social)
5) optimización de la cadena de suministro
6) Análisis del mercado de valores
7) seguridad nacional

Por supuesto, esto puede suceder tanto a nivel de micro como de sistema.

Combinando, filtrando y analizando datos (y patrones de datos) para una toma de decisiones teóricamente mejor.

Los datos de atención médica son probablemente la omisión más grande de la lista de Toby. Aquí hay algunas otras ideas:
1) transparencia de datos y datos como un medio para la rendición de cuentas
2) datos como mecánica del juego (o dinámica del juego). Además, las representaciones visuales de los datos se utilizan cada vez más para dar sentido a los datos (piense en Gapminder). 3) los datos obviamente también se pueden utilizar para la evaluación comparativa de la industria, la organización o el negocio. (efectividad organizacional / éxito / ventas)
4) Comportamiento grupal en línea (lectura, compra, intercambio, etc.) e influencia (seguimiento y análisis de cómo funciona la influencia).
5) Otra aplicación podría ser la sabiduría del público y el abastecimiento público: sé que esto se usa para los mercados de predicción.

Supongo que cualquier cosa que pueda poner en una hoja de cálculo de Excel con relevancia para la vida o los negocios.

Por cierto, el libro está basado en Python, pero tiene una aplicación más amplia basada en la metodología y la teoría general sobre minería. Me saltaba constantemente la parte de Python.

Puede consultar el hilo de Quora en los blogs de datos más grandes para encontrar más

La minería de datos se usa ampliamente en muchas industrias. Algunas de las principales aplicaciones de la minería de datos incluyen la industria de las tiendas minoristas, la industria de las telecomunicaciones, el análisis de información económica, etc. Aquí encontramos algunas aplicaciones más de las aplicaciones de minería de datos.