¿Los métodos de aprendizaje profundo conducen a avances en el procesamiento del lenguaje natural?

En primer lugar, ha habido bastante desarrollo en la intersección PNL / DL. [1], [2] para mencionar algunos: Word2Vec de Google es un muy buen ejemplo.

Lo que creo es que es más difícil avanzar en PNL / DL que en DL / clasificación de imágenes, análisis, …

El aprendizaje profundo es bueno para notar patrones en grandes cantidades de datos. Lo que funciona para las imágenes, si ves un gato, es un gato. Si ves un auto, es un auto. Sin embargo, si tiene un patrón lingüístico como casos (caso gramatical) o conjugaciones (conjugación gramatical), en la mayoría de los idiomas tiene excepciones a esos patrones. No todo es tan sencillo, y esas reglas que son altamente específicas para los idiomas o bien deben incorporarse en las redes, o de alguna manera aprender de los datos (lo cual es difícil, y los humanos ni siquiera lo hacen cuando aprenden un idioma). siempre están al tanto de todas las excepciones).

Sin embargo, se han realizado progresos, y estoy seguro de que cuando los métodos basados en reglas comiencen a incorporarse a las redes, seguirán aún más. Es simplemente más difícil lograrlo.

[1] Socher, Richard y col. “Autoencoders recursivos semi-supervisados para predecir distribuciones de sentimientos”. Actas de la Conferencia sobre métodos empíricos en el procesamiento del lenguaje natural . Asociación de Lingüística Computacional, 2011.

[2] Mikolov, Tomas, et al. “Representaciones distribuidas de palabras y frases y su composición”. Avances en sistemas de procesamiento de información neuronal . 2013

Related Content

¿Se reemplazará la programación de la computadora por aprendizaje automático?

Estoy usando Weka e implementé la ganancia de información forestal aleatoria usando Java. ¿Cuáles son algunos consejos sobre cómo imprimir cuántas funciones tiene después de aplicar la ganancia de información y cómo imprimir los nombres de las funciones y sus valores de ganancia de información en orden descendente (solo funciones de ganancia de información)?

¿Es cierto que una vez que tenemos grandes conjuntos de datos, la selección del clasificador ML no tiene mucho efecto? ¿Qué significa 'grande' aquí?

¿El antiguo guardia de IA ha frenado la investigación de aprendizaje automático en el MIT?

Cómo obtener todos los problemas de investigación en el aprendizaje por refuerzo

¿Qué es la programación probabilística?

¿Qué es mejor para teléfonos: IPS, LCD o TFT?

More Interesting

Cómo detectar y eliminar valores atípicos de ese conjunto de datos

¿Cuáles son las ventajas y desventajas de usar Statsmodels sobre Scikit-learn?

¿Existen por sí mismas redes neuronales que cambian automáticamente y que pueden cambiar su estructura interna (capas, nodos, hyerparameters)?

¿Qué se necesita para aprender a construir una aplicación de reconocimiento de imágenes?

¿Por qué la probabilidad condicional es más poderosa que la probabilidad conjunta en un nivel intuitivo?

¿Cuál es la diferencia entre D3M y el aprendizaje profundo?

¿Por qué se usan capas completamente conectadas en el "extremo" [lado de salida] de las NN convolucionales? ¿Por qué no antes?

En el aprendizaje por refuerzo, ¿cuál es la diferencia entre una función de valor de estado V (s) y una función de valor de acción de estado Q (s, a)?

¿Qué enfoques utilizaron los participantes en Quora ML CodeSprint 2013?

¿Los analistas de datos serán reemplazados por aprendizaje automático e inteligencia artificial pronto?

¿Debo aprender C ++, Python o Java para construir un sistema de aprendizaje automático de grado de producción?

¿Cuántos tipos de técnicas utilizan los limpiadores profesionales?

¿Cuál es un ejemplo ilustrativo donde LDA y SVM dan límites de decisión diferentes?

¿Cuál es el uso de una capa de disminución de resolución en una red neuronal convolucional (CNN)?

¿Qué es el aprendizaje automático?

Web Analytics