¿Existe alguna relación entre la asignación de Dirichlet latente y los procesos de dirichlet?

Bueno, el proceso de Dirichlet (DP) es una generalización del Dirichlet. Y el proceso Pitman-Yor (PEP) es a su vez una generalización del DP. Cuando se usa jerárquicamente, el DP es efectivamente equivalente a un Dirichlet.

Entonces, dado que LDA está construido a partir de dos Dirichlets, puede reemplazar cualquiera de los Dirichlet con DP o PYP para obtener algo más general y agregar estructuras jerárquicas en la parte superior.

La estructura jerárquica puede ser supervisada o no supervisada, y puede ser un árbol o, en general, un gráfico dirigido. Puede depender de la naturaleza secuencial del documento. Esto es muy general y no es demasiado difícil de implementar una vez que comprenda cómo construir DP y PYP jerárquicos eficientes en el tiempo.

  • Segmentación de temas con un modelo de tema estructurado, aprendizaje no supervisado de la estructura de documentos, el mejor sistema de segmentación de documentos
  • Procesos de Dirichlet jerárquicos anidados, aprendizaje no supervisado de la estructura jerárquica del tema, ¡demostrado en 3 niveles!
  • El modelado no paramétrico de temas bayesianos con los procesos jerárquicos de Pitman-Yor, la información jerárquica sobre el autor y los hashtags permiten un aprendizaje superior de los temas de Twitter

Aquí hay una gran cantidad de trabajo relacionado, y solo menciono, principalmente, mi propio trabajo arriba. El DP jerárquico puede implementarse alternativamente como un proceso Gamma jerárquico, y hay todo tipo de construcciones inteligentes distribuidas. Nadie ha realizado una revisión adecuada, y la mayoría de los autores, incluido yo mismo, apenas rascamos la superficie del trabajo relacionado en sus trabajos de investigación. Además, la comunidad de ML en sí misma tiene estándares bastante mixtos sobre validación experimental: ACM-KDD tiene estándares más altos, mientras que algunos lugares de ML a veces siguen el enfoque de “lo hicimos funcionar en conjuntos de datos 1–2 y superaron nuestra propia investigación previa” para el trabajo experimental . Esto hace que sea difícil evaluar la calidad real del trabajo publicado. Hacemos muchas comparaciones de trabajos publicados y siempre es esclarecedor y entretenido. … Pero yo divago.

More Interesting

Cómo gestionar y desarrollar un producto de big data

¿Cuál es el mejor método de selección de características cuando los datos del tren tienen más características que el número de puntos de datos? ¿Asumir que los datos son muy grandes?

¿Cómo se usa el aprendizaje automático en física?

¿Qué es la traducción automática estadística?

¿Se puede entrenar la imagen usando la función de activación?

Cómo elegir un optimizador para mi modelo de tensorflow

Diseño de vectores de características para algoritmos de aprendizaje automático. ¿Debo poner características de diferentes dominios en el mismo vector?

¿Cómo creo un conjunto de datos como MNIST para reconocer caracteres de otro idioma? Tengo un conjunto de datos como una carpeta de imágenes. ¿Cómo uso eso en Tensorflow?

Soy un ingeniero electrónico que conoce algoritmos de aprendizaje automático, big data, estadísticas, SQL, Matlab. ¿Puedo ser contratado como ingeniero de IA de nivel básico?

¿Es necesario aprender Python para seguir la especialización en cursos de Machine Learning, de Coursera?

¿Qué enfoque debo tomar para manejar los datos de desequilibrio para crear un modelo de aprendizaje automático?

¿Sería posible entrenar una computadora para reconocer con precisión a escritores individuales en Quora analizando muestras escritas?

En la regresión logística multinomial, ¿por qué el valor p en la prueba de razón de probabilidad es significativo pero en las estimaciones de parámetros no es significativo para cada dimensión?

¿Puede un ML / AI aprender a pasar captchas?

Como cuerpo técnico, ¿cómo se concilia el hecho de estar basado en datos, abrazar la diversidad de la fuerza laboral y contratar a los mejores?