¿Los métodos de aprendizaje profundo conducen a avances en el procesamiento del lenguaje natural?

En primer lugar, ha habido bastante desarrollo en la intersección PNL / DL. [1], [2] para mencionar algunos: Word2Vec de Google es un muy buen ejemplo.

Lo que creo es que es más difícil avanzar en PNL / DL que en DL / clasificación de imágenes, análisis, …

El aprendizaje profundo es bueno para notar patrones en grandes cantidades de datos. Lo que funciona para las imágenes, si ves un gato, es un gato. Si ves un auto, es un auto. Sin embargo, si tiene un patrón lingüístico como casos (caso gramatical) o conjugaciones (conjugación gramatical), en la mayoría de los idiomas tiene excepciones a esos patrones. No todo es tan sencillo, y esas reglas que son altamente específicas para los idiomas o bien deben incorporarse en las redes, o de alguna manera aprender de los datos (lo cual es difícil, y los humanos ni siquiera lo hacen cuando aprenden un idioma). siempre están al tanto de todas las excepciones).

Sin embargo, se han realizado progresos, y estoy seguro de que cuando los métodos basados ​​en reglas comiencen a incorporarse a las redes, seguirán aún más. Es simplemente más difícil lograrlo.

[1] Socher, Richard y col. “Autoencoders recursivos semi-supervisados ​​para predecir distribuciones de sentimientos”. Actas de la Conferencia sobre métodos empíricos en el procesamiento del lenguaje natural . Asociación de Lingüística Computacional, 2011.

[2] Mikolov, Tomas, et al. “Representaciones distribuidas de palabras y frases y su composición”. Avances en sistemas de procesamiento de información neuronal . 2013