Cómo numerar los clústeres en la agrupación jerárquica de documentos en Python

Para obtener el número de muestras de datos (aquí el número de películas) para cada grupo en cualquier técnica de agrupamiento (no solo en jerárquico), desea crear una nueva columna que sea un número de grupo en sus datos. Entonces solo usted puede ver las muestras correspondientes para cada grupo.

Por ejemplo,

Consideremos a continuación su tabla de datos que utilizó para predecir el número de clúster utilizando su modelo de clúster.

Después de la declaración de predicción,

clf.predict (X)

cada modelo tendrá los números de clúster etiquetados en labels_.

Puede acceder a eso usando clf.labels_

Después de estos pasos, debe agregar estas etiquetas a su tabla de datos.

data_table = clf.labels_

Ahora, su tabla de datos se ve así,

Desde esta tabla, puede acceder al número de películas para cada grupo.

Análisis de conglomeradosAprendizaje automáticoPython

Related Content

¿Crees que la tecnología 'block chain' es la próxima gran novedad en informática?

¿Existe algún audiolibro 'técnico' realmente bueno para la investigación de operaciones o el aprendizaje automático, aparte del algoritmo maestro?

He implementado con éxito el Descenso de gradiente estocástico y el Descenso de gradiente más pronunciado en C ++. ¿Qué puedo hacer a continuación?

¿Qué es la traducción automática estadística?

Cómo entrenar Word2Vec en un conjunto de datos personalizado

¿Se debe usar un dominio .COM, .NET o .ORG?

¿Qué medidas de seguridad debo tomar después de ser pirateado?

No estoy realmente seguro de cuáles son los resultados de su salida final, pero sean cuales sean los tipos de datos, creo que podrían almacenarse como un encurtido.

Cualquier variable se puede volcar directamente en un archivo pickle y, cuando la vuelve a cargar en un código separado, puede usarla exactamente en el mismo estado en que la volcó.

Puede ver el siguiente enlace para referencia y comentarios si funcionó o si tuvo algún problema.

UsingPickle – Python Wiki

Bhuvanesh Waran

More Interesting

En términos simples, ¿cómo funciona Gibbs Sampling?

¿Cuáles son sus 5 mejores técnicas empíricas para detectar BS?

¿Cuál es su visión de cómo la clase media de los EE. UU. Puede hacer frente al auge de la robótica, la automatización, etc.?

¿Qué tan fácil es aprender una función booleana con Descenso de gradiente usando un aprendizaje profundo?

¿Cuáles son las habilidades requeridas para un ingeniero de aprendizaje automático / aprendizaje profundo de nivel básico?

¿Cuándo debo usar inferencia variacional versus maximización de expectativas para ajustar un modelo de mezcla gaussiana?

¿TF-IDF está categorizado como una selección de características o una extracción de características?

¿Qué tan popular y extendido es el aprendizaje automático en África?

¿Cómo se hacen análisis de datos, estadísticas y aprendizaje automático en big data?

¿Qué es el análisis de componentes principales y cuántas variables se pueden usar para PCA?

El reciclaje de residuos de construcción urbana necesita usar qué máquina.

Como ingeniero de ASIC, ¿cómo debo prepararme para la era del aprendizaje automático?

¿Cuál es el estado del arte en reconocimiento de voz en 2016?

Robótica: ¿Cuáles son algunos proyectos interesantes de aprendizaje automático relacionados con UAV / drones?

¿Qué criterios deberían ser apropiados para terminar el entrenamiento codicioso no supervisado de autoencoder por capas?

Web Analytics