¿Cómo decidimos la clase de clústeres generados a través del clúster k-means?

La agrupación de K-means en características especialmente de bajo nivel es bastante poco confiable cuando se trata de encontrar significado entre los clústeres. Por ejemplo, si obtiene un conjunto aleatorio de [math] n [/ math] parches de [math] k [/ math] -faces, donde [math] n> k [/ math] y ejecuta [math] k [/ matemática] significa que tendrá centroides [matemática] k [/ matemática] bien, pero cada uno no contendrá específicamente solo un tipo de parches faciales. La medida de distancia euclidiana no tiene una noción de clase, solo se basa en una medida de disimilitud de componentes vectoriales ingenua y, por lo tanto, los grupos formados solo están relacionados en el espacio euclidiano y no en el espacio de “clase”.

Para rectificar eso, podemos proyectar las caras a través de una red neuronal convolucional (convNet) y extraer las representaciones vectoriales de alto nivel de la última capa conv y agruparlas usando k-means. Dado que los vectores son de alto nivel, tienen una señal de ruido de alta calidad, lo que implica que la agrupación de medios k basada en la medida de distancia euclidiana básica puede encontrar grupos de alta calidad significativos.

Para encontrar la clase de dichos grupos, simplemente puede hacer lo siguiente:

Para cada vector en el conjunto fuente, encuentre el grupo más cercano entre los k-grupos. Luego acumule un voto a favor de la clase de ese vector fuente para ese grupo ganador particular. Dado que al final cada centroide obtendrá múltiples etiquetas de clase pero con diferentes recuentos de votos, podemos resolver eso simplemente asignando la etiqueta con la mayoría de los votos como la clase final de ese grupo.

Recuerde que la calidad de las clases de clúster resultantes dependerá de la calidad de los vectores de origen. Por lo tanto, aprovechar las funciones de alto nivel de convNet puede generar clústeres de mayor calidad.

Espero que esto ayude.

Si sus datos son visuales (por ejemplo, imágenes), entonces puede ser que pueda, de lo contrario no puede (o muy difícil). La razón es que los “grupos” no son “clases”. Cuando K-mean asigna un objeto de datos a un clúster, las etiquetas son arbitrarias, no significan nada. Sin embargo, juntos dentro de un grupo, significan algo, es por eso que se llama un “grupo”.

Es posible que desee leer más sobre esto aquí: la respuesta de Shehroz Khan a ¿Cuál es la diferencia entre los algoritmos de aprendizaje supervisados ​​y no supervisados?

More Interesting

¿Por qué no hay implementaciones de aprendizaje profundo (populares) escritas en Golang?

¿Cuál es el propósito de usar un parámetro de penalización [matemática] C [/ matemática] en SVM?

¿Cuáles son sus 5 mejores técnicas empíricas para detectar BS?

Con referencia a AdaBoost, ¿qué se entiende exactamente por 'ponderado' cuando se dice que entrena a un clasificador débil dada una distribución ponderada?

¿Dónde puedo encontrar corpus de texto médico en inglés para entrenar mis datos?

¿Cuáles son las mejores escuelas de posgrado canadienses para estudiar CS en Inteligencia Artificial, aprendizaje automático, procesamiento de lenguaje natural y minería de datos, especialmente para estudiantes internacionales?

¿Qué es una comprensión intuitiva del análisis factorial?

¿Cuáles son algunas razones por las que algunas personas prefieren R y Matlab a Python para el aprendizaje automático?

¿Por qué el aprendizaje por refuerzo no era popular antes de que el aprendizaje profundo apareciera en escena?

¿Cómo funciona un mecanismo de atención en el aprendizaje profundo?

¿Alguna vez ha utilizado el aprendizaje automático de alguna manera para ayudar en las pruebas de software y la automatización de pruebas?

Dado que existen marcos optimizados en línea, ¿vale la pena implementar manualmente implementaciones vectorizadas para redes neuronales complicadas?

¿Qué es el análisis de componentes principales y cuántas variables se pueden usar para PCA?

¿Cómo podría usar el aprendizaje automático para clasificar los datos 1D?

¿Qué herramientas estadísticas se necesitan para la extracción de características y el reconocimiento de patrones en el procesamiento de imágenes?