Cómo encontrar el contexto de una conversación usando técnicas de aprendizaje automático / aprendizaje profundo / PNL

Esto tiene mucho que ver con el etiquetado de parte del discurso (POST) , y ha sido parte de la PNL canónica durante el tiempo que los humanos han estado pensando en digitalizar el lenguaje. Estos algoritmos generalmente se dividen en dos categorías: algorítmicos y lingüísticos.

POST lingüístico ha existido durante mucho tiempo. La precisión puede ser relativamente alta, pero el problema principal con esto es el hecho de que el lenguaje es tan complejo que puede ser difícil identificarlo adecuadamente con reglas estrictas. Una gran cantidad de lenguaje no se basa en reglas lineales. Antes de que la programación dinámica (DP) y los algoritmos POST del modelo oculto de Markov (HMM) se idearan alrededor de la década de 1980, el algoritmo lingüístico más preciso todavía era increíblemente inexacto. El primer intento de POST lingüístico tuvo solo un 70% de precisión.

Los enfoques algorítmicos a través de las redes neuronales y las estadísticas han demostrado ser mucho más precisos. El primer modelo HMM alcanzó alrededor del 94% de precisión, y los enfoques neuronales alcanzaron el 99%. Esencialmente, los modelos HMM usan la probabilidad para determinar cuál será la parte más probable del discurso dado lo que ya ha leído. Los enfoques neuronales son mucho más profundos y requieren un conocimiento más profundo de PNL.

Parece que estás preguntando cómo encontrar el objeto de una oración. Si está buscando encontrar el objeto de una oración, es importante considerar un enfoque supervisado o un enfoque no supervisado del que pueda extraer las clases de palabras. Sugeriría usar un enfoque HMM (supervisado) o un enfoque semi-supervisado similar a word2vec. Si está muy involucrado con el aprendizaje profundo, aprenda sobre GRU y LSTM y use un clasificador para clasificar POS. Sugeriría usar RNN bidireccionales si decide esta ruta.

¡Buena suerte! Si desea aclaraciones, hágamelo saber.