¿Qué significa el modelo semántico distribucional (DSM) en el procesamiento del lenguaje natural?

en.wikipedia.org/wiki/Distributional_semantics

La semántica distributiva es un área de investigación que desarrolla y estudia teorías y métodos para cuantificar y categorizar similitudes semánticas entre ítems lingüísticos en función de sus propiedades distributivas en grandes muestras de datos lingüísticos. La idea básica de la semántica distributiva puede resumirse en la llamada hipótesis distributiva: los ítems lingüísticos con distribuciones similares tienen significados similares .

En el contexto de los sistemas de diálogo, la semántica distributiva está relacionada con la lógica probabilística y los sistemas o motores de diálogo probabilístico, generalmente basados ​​en n-gramos, saltos, etc. Los lingüistas reales tienden a utilizar técnicas probabilísticas pooh-pooh. Sin embargo, a pesar de que quizás no sea adecuado para aplicaciones de misión crítica, creo que los sistemas de diálogo probabilístico son perfectamente adecuados para muchas, si no la mayoría, de las aplicaciones diarias en robótica e Internet de las cosas.

Vea también mis páginas web rápidas y sucias:

  • Semántica de distribución 2014 | Meta-Guide.com
  • PCE (motor de consistencia probabilística) | Meta-Guide.com
  • PCFG (Probabilistic Context Free Grammar) y sistemas de diálogo | Meta-Guide.com
  • PLSA (análisis semántico latente probabilístico) y sistemas de diálogo | Meta-Guide.com
  • PNN (red neuronal probabilística) y sistemas de diálogo | Meta-Guide.com
  • Modelos gráficos probabilísticos y sistemas de diálogo | Meta-Guide.com
  • Analizador probabilístico y sistemas de diálogo | Meta-Guide.com

Los DSM son modelos de aprendizaje automático (en su mayoría no supervisados) cuyo objetivo es aprender representaciones distribuidas de elementos lingüísticos bajo los supuestos de la hipótesis de distribución. La más popular es la red neuronal de Mikolov basada en SkipGram (2013), comúnmente conocida con el nombre de su biblioteca de implementación word2vec. Puede consultar el excelente documento de comparación de Baroni para obtener más detalles. http://anthology.aclweb.org/P/P1