Aquí hay diez de los más famosos y su aplicación en diferentes campos:
Aquí una primera clasificación de la siguiente manera.
- Agrupación : es el problema de agrupar a los individuos de una población por su similitud de atributos. Un algoritmo de agrupamiento muy famoso es, por ejemplo, k-means
- Algoritmos de clasificación. La clasificación intenta predecir, para cada individuo en una población, a qué conjunto de clases pertenece este individuo. Una tarea de clasificación, dada una nueva persona, determina a qué clase pertenece esa persona. También puede asignar una probabilidad a esta asociación. Un ejemplo es KNN (o k neares vecino)
- Algoritmo de reducción de dimensiones para reducir las dimensiones de un conjunto de datos. Intenta tomar un gran conjunto de datos y reemplazarlo con un conjunto de datos más pequeño que contenga gran parte de la información importante en el conjunto más grande. Por ejemplo, puede usar el conjunto de datos reducido para entenderlo mejor y visualizarlo en dimensiones 2D.
- PCA o análisis de componentes principales para identificar las variables más importantes en su conjunto de datos. Existen muchos estudios que utilizan PCA para el análisis de datos, pero este es uno de los documentos que lo aplica de manera original: Comportamientos propios: identificación de la estructura en la rutina.
- Filtrado colaborativo para construir sistemas de recomendación. Es un problema de similitud coincidente. Por ejemplo, encontrar personas que son similares a usted en términos de los productos que les han gustado o que han comprado o encontrar productos que son similares con respecto al conjunto de atributos. En este último caso, se realiza un algoritmo de recomendación “basado en elementos”
- Reglas de asociación o agrupación conjunta para el análisis de la cesta de la compra. Una pregunta común en este caso es: ¿qué artículos se compran comúnmente juntos? Por ejemplo, analizar los registros de compra de un supermercado puede descubrir que la cerveza se compra junto con papas fritas con frecuencia.
- Método de regresión para predecir el valor de un cierto valor . Por ejemplo: ¿Cuánto usará un cliente determinado un determinado servicio? La cantidad que se va a predecir aquí es el uso del servicio, y se podría generar un modelo observando a otras personas similares de la población y su uso histórico.
- Algoritmo LDA para análisis de sentimientos y minería de texto, pero también para muchas otras aplicaciones. Aquí un artículo al respecto: Página en aaai.org
- El camino más corto de Dijkstra para encontrar el camino más corto de un nodo a otro en un gráfico. Probablemente el algoritmo más importante en la teoría de grafos.
- Predicción de enlaces para predecir conexiones entre elementos de datos, sugiriendo que debe existir un enlace y estimando la fuerza del enlace. Por ejemplo, en las redes sociales trata de adivinar si usted y John comparten 15 amigos, tal vez usted y John podrían ser amigos en la vida real.
10 de los algoritmos más famosos en minería de datos de Alket Cecaj sobre algoritmos y DataFusion
- ¿Cómo analizar los datos en R? ¿Cómo hago para el análisis? Tengo datos y quiero analizar, ¿qué debo hacer?
- ¿Debo ir para el desarrollo de Android o la ciencia de datos o la programación de Python o el aprendizaje automático?
- Quiere aprender Big data. ¿Cómo debo aprender desde una perspectiva de prueba, por favor responda?
- ¿Qué trabajo hacen los miembros de Big Data Lab AKG y cuál es el estado de la ubicación en 2017?
- Cómo aprender a recuperar, insertar, buscar datos en Big Data