Estoy escribiendo esta respuesta con respecto a la biblioteca gensim.
class gensim.models.ldamodel.LdaModel
Este modelo da una estimación de un corpus de capacitación e inferencia de la distribución de temas en documentos nuevos e invisibles. Ahora, dado que ha creado el modelo LDA basado en el corpus de su documento, puede aplicar diversas técnicas para visualizar la distribución del tema en un corpus entrenado.
- ¿Cómo se puede usar Machine Learning para resolver el siguiente problema?
- ¿Cuál es el mejor lenguaje para el procesamiento del lenguaje natural?
- ¿Cómo puedo aprender a realizar simulaciones de dinámica molecular? ¿Cuáles son algunas buenas fuentes para aprender sobre este campo?
- ¿El desarrollo teórico en el aprendizaje automático está llegando a un punto muerto (significa que no habrá necesidad de continuar)?
- ¿Cómo deberías comenzar una carrera en aprendizaje profundo?
La manera más simple de mostrar es imprimir k número de temas del modelo entrenado por:
lda_model.print_topics (num_topics = k)
Esto simplemente imprimirá temas con palabras y probabilidades asociadas.
PERO,
Según su consulta, deseaba una colección de palabras para describir la salida del modelo LDA; Esto contradice la definición del modelo mismo. Se basa en la distribución probabilística de dirichilet. Según la definición,
LDA es una generalización del modelo pLSA, que es equivalente a LDA bajo una distribución previa uniforme de Dirichlet.
Espero haberte ayudado con tu perspectiva.