¿Cuánto mejorará el procesamiento del lenguaje natural para 2025?

A2A.

En 2012, el instituto de investigación Envisioning Technology de Michel Zappa realizó la enorme tarea de predecir qué tecnologías alcanzarán la madurez en el futuro cercano en Envisioning technology 2012 (enlace directo al PDF infográfico: http://static1.squarespace.com/s…). Si bien después de 4 años muchas predicciones son sorprendentemente correctas o incluso conservadoras, las predicciones del procesamiento del lenguaje natural parecen estar apagadas. Lo cual está bien, los esfuerzos por manejar el lenguaje natural se han subestimado desde los primeros intentos en la década de 1940.

Además de la falta de hardware, el problema general con el lenguaje natural ha sido históricamente una I + D costosa; hoy, el financiamiento de Silicon Valley es más generoso que nunca y creo que esto eventualmente nos llevará al punto de inflexión. Mi opinión sobre las predicciones en la infografía anterior:

  • Reconocimiento de voz : alta precisión del 90% o precisión humana para los principales idiomas. Ya está bastante cerca de la mayoría del hardware y, en mi opinión, solo tomará una toma de ingeniería más creativa (o la proliferación de hardware compatible con ASR) en lugar de una revisión general de la arquitectura. Creo que para ese momento, incluso los problemas más difíciles como el efecto Cóctel se resolverán.
  • Interpretación del lenguaje natural (o comprensión del lenguaje natural): ya existen soluciones existentes, pero la comprensión genérica y humana tomará algunos años. 2025 podría ver eso resuelto.
  • Traducción automática : ya está resuelto para contenido disponible públicamente en idiomas de nivel 1; Sin embargo, la traducción entre idiomas con estructura diferente, contenido que no está disponible públicamente e idiomas con poca cantidad de datos disponibles, será mucho más difícil de resolver. 2018 es demasiado optimista; No creo que se resuelva completamente en 2025.
  • Análisis de sentimientos . Mientras que el análisis de sentimiento “binario” (positivo / negativo) generalmente está en un nivel “suficientemente bueno”, tomará otra década llevarlo a un nivel humano; en lo que respecta al Análisis de Sentimiento Basado en Aspectos, tomará más tiempo y no estará disponible “de barril” en 2025 para otros idiomas que no sean los principales.

El mayor problema con la PNL es más o menos como con la distribución de la riqueza: lleva un tiempo “llegar” a los idiomas menos comercialmente interesantes. La investigación cuesta dinero y hasta ahora los costos de I + D no son triviales. Es por eso que habrá más herramientas y software de PNL disponibles para los idiomas más comunes, y 2025 todavía tendrá grandes agujeros en la cobertura de los idiomas hablados por una población más pequeña.

El lenguaje natural PNL, ha avanzado a pasos agigantados durante los más o menos 40 años que lo he presenciado. Sin embargo, queda mucho por hacer.

¡Siempre que juzguemos el progreso en cualquier área de la IA, uno debe comparar qué tan bien los humanos hacen la tarea y cuántos de ellos lo hacen! A juzgar por la calidad de los periódicos y blogs, los humanos no tienen tanta facilidad con la PNL como nos gustaría creer.

Una excelente técnica, por ejemplo, para la traducción automática es el uso “simple” de estadísticas y grandes corpus bilingües o multilingües que existen debido a Canadá y la UE.

Estos muestran que es posible aprender como un niño de una manera casi libre de gramática.

Suponiendo que no haya hipo y los continuos avances de la ley súper Moores en memoria, poder y almacenamiento para 2025, esperaría un nivel de competencia en PNL comparable con un adolescente occidental.

¡Por supuesto que predecir es un juego de tazas, ya que todo lo que necesita es un gurú del marketing para vender algo tangencial a nuestras necesidades que pueda acelerar o retrasar el progreso por factores de 4 o 5!

Procesamiento natural del lenguaje

El procesamiento del lenguaje natural se ve significativamente impulsado por el salto masivo en los datos digitales, el aumento de la utilidad de los dispositivos inteligentes y la creciente demanda de una mejor experiencia del cliente. Las tecnologías de reconocimiento son las tecnologías más utilizadas en PNL. Obtenga información más profunda: investigación de mercado de transparencia

La parte del lenguaje? Maldita sea casi perfecto. Pero luego alcanzas el nivel de comprensión, que es otro asunto.

Espero que la traducción esté completamente resuelta. Las máquinas alcanzarán o superarán el nivel humano para la traducción no creativa. Y probablemente haga progresos significativos en el lado “creativo”.

Prácticamente cualquier tarea de toma de decisiones sobre texto breve que pueda hacer una persona laica será realizada al menos tan bien por una máquina especialmente entrenada. El gran desafío consiste en definir el problema para una máquina de uso general. A los humanos se les pueden dar breves instrucciones y tal vez un puñado de ejemplos y luego realizar la tarea, las máquinas generalmente están capacitadas en miles de ejemplos. Espero que avancemos significativamente en este sentido, pero no a nivel humano.

En los últimos años, las computadoras se volvieron mucho más poderosas y desarrollamos algunas técnicas claras para PNL y ML, pero nuestra comprensión fundamental del aprendizaje no ha mejorado drásticamente. Espero más de lo mismo.

Algunas personas esperan IA general en ese período de tiempo y eso cambiaría todo. Yo no.

¿Cuánto mejor será el procesamiento del lenguaje natural para 2025? “, Que puede ser un problema de aprendizaje automático, específicamente un problema de regresión. Amigos, resolvamos esto.

Muy bien, no hay aprendizaje automático aquí. Sin entrar en las profundidades y usar términos profundos, responderé esto.

La PNL trata básicamente tres cosas:

  • Comprensión del lenguaje natural
  • Derivar el significado de la entrada del lenguaje natural
  • Generación del lenguaje natural.

¿Cuánto mejor puede mejorar la PNL en estos 9 años (2016 siendo el actual)?

  1. Mejor comprensión del lenguaje natural, de la misma manera, está mejorando en unas pocas décadas. Una máquina podría reconocer su entrada mucho mejor. Mejor enfoque, menor error.
  2. El análisis del contexto, el análisis semántico, el resumen ayudarían a nuestra computadora a comprender mejor la entrada humana, es decir, comprender fácilmente lo que el humano está tratando de transmitir.
  3. Mucho mejor generación de voz que presente. Esta parte ya ha mejorado mucho y mejorará aún más. Tal vez, la generación de voz en todos los idiomas, varios tipos de voz, suena real.

Con un mejor aprendizaje, mejores modelos, mejores enfoques, podría ser posible hablar con una computadora similar a la humana en 9 años.

La PNL ha mejorado mucho desde décadas con variedades de mejoras en la clasificación de texto. La gente se está dando cuenta de lo poderoso que puede ser el lenguaje, de muchas maneras. Si no ha leído acerca de LIWC, por favor hágalo a través de Consulta lingüística y Conteo de palabras. Es una herramienta de clasificación de texto brillante.

Para 2025, creo que todos los problemas que tenemos actualmente en el procesamiento del lenguaje se resolverán con una mejor tecnología y herramientas y software mucho más avanzados. Probablemente agregará más significado a cada palabra que decimos o escribimos. Añadiría más a mi respuesta si pudiera pensar en más avances.

Buena pregunta 🙂

Una rama de la PNL que florecerá para 2025 es el humor computacional.

Para que esto suceda, necesitaremos un buen marco de representación del conocimiento y una buena teoría del humor.

Funciona en ambos sentidos. El algoritmo podrá detectar chistes y sarcasmos tan buenos como los humanos, pero también podrá generar chistes.

Debido a las cosas limitadas que pueden hacer las computadoras, las hacen mejor que los humanos, el algoritmo creará bromas mejores y mejores hasta que lleguemos a una singularidad predicha por Monty Python:

Entonces así es como los alemanes conquistarán el mundo para 2025.

La mayor barrera para la PNL es que la mayoría de las personas no saben lo que están tratando de decir. Los humanos pueden saltar para inferir varias ideas del contexto. Cuando este contexto está incrustado en máquinas, cuando tienen “ojos, oídos, narices”, etc. La PNL puede superar fácilmente la capacidad humana.

Un desafío más interesante es leer. Leer el texto pone a los robots y a los humanos en términos similares. La pregunta aquí es diferente … ¿qué hago con la información leída? ¿Por qué una computadora leería una novela? ¿Qué objetivo trataría de lograr? ¿Queremos construir máquinas que busquen entretenimiento? Tal vez. Tal vez no.

Los programas de computadora suelen estar orientados a objetivos. Los humanos generalmente NO están orientados a objetivos. Divagamos y esperamos que actúen los estímulos. Las máquinas son relativamente malas para decidir qué es un estímulo. Solo pueden hacer evaluaciones discretas. No están interesados ​​en el libre albedrío o las preferencias basadas en historias y gustos personales. Podrían hacerse para imitarlos, pero ¿por qué?

No construimos máquinas para hacer cosas como nosotros. No hay razón para hacer una máquina que levante la carga de los músculos y los huesos. ¿Por qué construiría una “IA” para ser humano? ¿Cual es el punto? Los humanos han evolucionado. Los robots están hechos. Optimizaríamos las máquinas para ser mejores que nosotros en las tareas, como cocinar, hacer cirugía o arreglar autos, no ser nosotros.