Dadas las distribuciones de palabras producidas por un modelo de tema, podemos representar cada palabra mediante una incrustación de vectores distribuidos donde cada dimensión representa un tema y su valor correspondiente es la probabilidad de la palabra dado el tema. Por lo tanto, un modelo de tema también puede verse como un modelo de inclusión de palabras.
Sin embargo, la relación entre las incrustaciones de palabras y los modelos de temas aún se desconoce en gran medida porque provienen de dos comunidades de investigación diferentes y tienen objetivos diferentes. Las incrustaciones de palabras provienen de la tradición de investigación de redes neuronales y generalmente tienen aplicaciones de PNL, mientras que los modelos de temas provienen de la tradición de investigación de modelado bayesiano y generalmente tienen aplicaciones de recuperación de información.
Las incrustaciones de palabras en un modelo de inclusión de palabras distribuidas generalmente se evalúan mediante (i) si las palabras con vectores similares tienen significados similares, y (ii) si la “distancia” en el espacio de representación de palabras es significativa: v_ {king} – v_ {queen} ~ v_ {hombre} – v_ {mujer}. Pero las incrustaciones de palabras en un modelo de tema generalmente se evalúan por lo bien que asignan palabras a los temas, es decir, para medir qué tan coherente es la asignación de palabras a los temas.
- Me estoy graduando de un campo de entrenamiento de codificación, pero nunca he tomado una clase de CS. ¿Qué pasantías puedo solicitar este verano?
- Cómo recuperar o restaurar archivos cifrados
- ¿Son factibles las computadoras biológicas?
- ¿Qué universidades de EE. UU. Lideran en qué subcampos de investigación de Inteligencia Artificial?
- ¿Cómo se ven otros lenguajes humanos en la abstracción visual (en binario)?
Muchos trabajos han utilizado la inserción de palabras para mejorar los modelos de temas. Un trabajo típico es: “ Mejora de los modelos de temas con representaciones de palabras con funciones latentes . Transacciones de la ACL , 2015. ”[PAPEL] [CÓDIGO]