¿Cuáles son algunas de las aplicaciones más útiles para la minería de datos?

Aquí hay diez de los más famosos y su aplicación en diferentes campos:

Aquí una primera clasificación de la siguiente manera.

Agrupación : es el problema de agrupar a los individuos de una población por su similitud de atributos. Un algoritmo de agrupamiento muy famoso es, por ejemplo, k-means
Algoritmos de clasificación. La clasificación intenta predecir, para cada individuo en una población, a qué conjunto de clases pertenece este individuo. Una tarea de clasificación, dada una nueva persona, determina a qué clase pertenece esa persona. También puede asignar una probabilidad a esta asociación. Un ejemplo es KNN (o k neares vecino)
Algoritmo de reducción de dimensiones para reducir las dimensiones de un conjunto de datos. Intenta tomar un gran conjunto de datos y reemplazarlo con un conjunto de datos más pequeño que contenga gran parte de la información importante en el conjunto más grande. Por ejemplo, puede usar el conjunto de datos reducido para entenderlo mejor y visualizarlo en dimensiones 2D.
PCA o análisis de componentes principales para identificar las variables más importantes en su conjunto de datos. Existen muchos estudios que utilizan PCA para el análisis de datos, pero este es uno de los documentos que lo aplica de manera original: Comportamientos propios: identificación de la estructura en la rutina.
Filtrado colaborativo para construir sistemas de recomendación. Es un problema de similitud coincidente. Por ejemplo, encontrar personas que son similares a usted en términos de los productos que les han gustado o que han comprado o encontrar productos que son similares con respecto al conjunto de atributos. En este último caso, se realiza un algoritmo de recomendación “basado en elementos”
Reglas de asociación o agrupación conjunta para el análisis de la cesta de la compra. Una pregunta común en este caso es: ¿qué artículos se compran comúnmente juntos? Por ejemplo, analizar los registros de compra de un supermercado puede descubrir que la cerveza se compra junto con papas fritas con frecuencia.
Método de regresión para predecir el valor de un cierto valor . Por ejemplo: ¿Cuánto usará un cliente determinado un determinado servicio? La cantidad que se va a predecir aquí es el uso del servicio, y se podría generar un modelo observando a otras personas similares de la población y su uso histórico.
Algoritmo LDA para análisis de sentimientos y minería de texto, pero también para muchas otras aplicaciones. Aquí un artículo al respecto: Página en aaai.org
El camino más corto de Dijkstra para encontrar el camino más corto de un nodo a otro en un gráfico. Probablemente el algoritmo más importante en la teoría de grafos.
Predicción de enlaces para predecir conexiones entre elementos de datos, sugiriendo que debe existir un enlace y estimando la fuerza del enlace. Por ejemplo, en las redes sociales trata de adivinar si usted y John comparten 15 amigos, tal vez usted y John podrían ser amigos en la vida real.

10 de los algoritmos más famosos en minería de datos de Alket Cecaj sobre algoritmos y DataFusion

¿Cuáles son algunas buenas técnicas o herramientas de visualización de datos además de Tableau que uno debe aprender para comenzar su carrera en el campo de la visualización?

¿Podría un estadístico, utilizando solo los datos de cualquier deporte importante, determinar quiénes eran los mejores jugadores?

Tengo una experiencia laboral de más de dos años en desarrollo, dispositivos móviles y web. Quiero hacer MS en DS. ¿Mi experiencia ayudaría en el proceso de selección?

¿Por qué MSFT necesita un jefe de ciencia de datos cuando tiene todos los investigadores de aprendizaje automático en el mundo?

¿Cuáles son algunos escenarios de “big data”?

¿Cuál es el número máximo de conexiones TCP simultáneas logradas a una dirección IP y puerto?

“Programming Collective Intelligence”, escrito por Toby Seagaran en O’Reilly, identifica estas 7 opciones (aunque no es exclusivo ni está clasificado por sí mismo, es solo una lista útil):

1) biotecnología
2) Detección de fraude financiero
3) Visión artificial (?)
4) Comercialización del producto (supongo que los datos del usuario antes y después de la venta, así como los datos psicográficos … y ahora los sentimientos en el espacio social)
5) optimización de la cadena de suministro
6) Análisis del mercado de valores
7) seguridad nacional

Por supuesto, esto puede suceder tanto a nivel de micro como de sistema.

Combinando, filtrando y analizando datos (y patrones de datos) para una toma de decisiones teóricamente mejor.

Los datos de atención médica son probablemente la omisión más grande de la lista de Toby. Aquí hay algunas otras ideas:
1) transparencia de datos y datos como un medio para la rendición de cuentas
2) datos como mecánica del juego (o dinámica del juego). Además, las representaciones visuales de los datos se utilizan cada vez más para dar sentido a los datos (piense en Gapminder). 3) los datos obviamente también se pueden utilizar para la evaluación comparativa de la industria, la organización o el negocio. (efectividad organizacional / éxito / ventas)
4) Comportamiento grupal en línea (lectura, compra, intercambio, etc.) e influencia (seguimiento y análisis de cómo funciona la influencia).
5) Otra aplicación podría ser la sabiduría del público y el abastecimiento público: sé que esto se usa para los mercados de predicción.

Supongo que cualquier cosa que pueda poner en una hoja de cálculo de Excel con relevancia para la vida o los negocios.

Por cierto, el libro está basado en Python, pero tiene una aplicación más amplia basada en la metodología y la teoría general sobre minería. Me saltaba constantemente la parte de Python.

Puede consultar el hilo de Quora en los blogs de datos más grandes para encontrar más

Ridhima Sane

La minería de datos se usa ampliamente en muchas industrias. Algunas de las principales aplicaciones de la minería de datos incluyen la industria de las tiendas minoristas, la industria de las telecomunicaciones, el análisis de información económica, etc. Aquí encontramos algunas aplicaciones más de las aplicaciones de minería de datos.

Alket Cecaj

More Interesting

¿Cuál es la mejor manera de aprender analítica de personas?

¿Quiénes son los principales expertos mundiales en ciudades inteligentes y planificación urbana basada en datos?

¿Cómo debe establecerse el propósito de un servidor de datos?

¿Cuáles son las características de big data?

¿Cuántos datos necesito para entrenar a un chatbot?

Al seguir una carrera en ciencia de datos, ¿un doctorado en economía sería más beneficioso que una maestría en ciencia de datos?

¿Cuáles son algunos de los problemas prácticos con Big Data?

Cómo construir un currículum sólido para trabajar en Big Data

¿Cuál es la diferencia entre MongoDB y big data?

¿Qué certificación de big data es mejor Hortonworks o Cloudera?