¿Todavía es necesario aprender LDA (distribución de Dirichlet latente)?

¿Necesario?

Bueno, generalmente me gusta llamar a los modelos de tema de área general, que en sí mismo es una instancia del área general de factorización de matriz discreta (como los modelos gamma-Poisson, GaP). Entonces, en ese sentido, es mucho más amplio que el antiguo LDA simple.

Pero cuando enseño cosas como LDA y GaP, que deberían enseñarse juntas, lo que me gusta es el hecho de que puedes enseñar un montón de cosas de una vez:

  • métodos variacionales
  • Muestreo de Gibbs
  • muestreo de Gibbs colapsado
  • optimización de hiperparámetros
  • problemas con los métodos de máxima verosimilitud
  • regularización versus Bayesian MAP versus Bayesian MCMC
  • por qué queremos no paramétricos (solo el por qué … la enseñanza de NP viene después)

Es simplemente un problema fabuloso para explicar un montón de ideas. Por lo tanto, es posible que no necesite LDA, pero la factorización matricial y todas las cosas anteriores son bastante útiles para saber. Aprenderá LDA como un subproducto.