La agrupación es un proceso de agrupar tipos similares de elementos de datos. Es muy útil en la agrupación natural de artículos. En el campo de la recuperación de información, hay varios algoritmos ya definidos e implementados a nivel abstracto.
Existen dos tipos de técnicas de agrupamiento:
- Agrupación basada en particiones
- Agrupación jerárquica
Bajo el tipo de Particionamiento, se definen los algoritmos K-means y K-medoids.
- ¿Por qué la búsqueda de imágenes de Google es tan rápida?
- ¿Qué pasaría si las máquinas escribieran algunas de las preguntas sobre Quora?
- Cómo usar un árbol de decisión para construir datos sintéticamente
- ¿Dónde puedo encontrar excelentes bibliotecas de aprendizaje automático para Java?
- ¿Cuál es el significado del espacio latente?
y para la agrupación jerárquica puede consultar la agrupación aglomerativa.
Ahora llegando al punto, la agrupación es un tipo de enfoque de aprendizaje automático sin supervisión. Para agrupar datos categóricos, puede llamar directamente a la biblioteca integrada de aprendizaje automático de Python y R. Si no, puede escribir el algoritmo por su cuenta.
La siguiente figura muestra la representación gráfica de la agrupación.
Para comprender en profundidad desde cero, siga el enlace:
Agrupación con K-medias en Python
Referencias
- El laboratorio de ciencia de datos
- Captura de pantalla de agrupamiento