¿Cuáles son los desafíos con el procesamiento del lenguaje natural en el contexto de la inteligencia artificial?

El éxito de IBM Watson no es representativo del progreso en PNL. Jeopardy incluía principalmente preguntas que incluían descripciones de una entidad en particular, y se esperaba que los concursantes respondieran con “¿Qué es ?” O “¿Quién es ?”, Etc. Así que solo tenía que adivinar una palabra no trivial para responder correctamente Esto se puede lograr, en gran medida, utilizando la coincidencia de patrones; por ejemplo, si se le da un párrafo que contiene los términos “Estados Unidos”, “presidente”, “Guerra Mundial”, “Tratado de Versalles”, existe una alta probabilidad que la respuesta es “¿Quién es Woodrow Wilson?” y una probabilidad muy baja de que la respuesta sea “Quién es Barack Obama”, aunque hemos ignorado la mayoría de la otra información en el párrafo. Con una coincidencia de patrones más sofisticada, podría hacerlo mucho mejor.

PNL es un desafío por muchas razones. Los desafíos básicos incluyen el manejo de sinonimia y polisemia . Algunos otros desafíos en PNL son los siguientes:

Frases – “Él miró hacia la calle” y “Él miró hacia la calle” tienen significados muy diferentes.
Modificador adjunto : “Parecía un hombre en el parque con un telescopio”. Esta oración tiene múltiples significados, según con quién se adjunta “con un telescopio”.
Discurso : considere: “Tomó el curso en la primavera. Obtuvo un buen trabajo en el verano “. Vs” Tomó curso en la primavera. Obtuvo un buen gato en el verano ”. El segundo parece extraño, porque sabemos que“ trabajo ”y“ curso ”son conceptos relacionados, pero“ gato ”y“ curso ”no lo son.
Generación de oraciones : es muy trivial crear modelos que siempre generen oraciones gramaticalmente correctas y significativas.
Resumen del texto : dado un artículo de 10 páginas, comprímalo en un resumen de una página. La variante de varios documentos implica generar un resumen de documento único a partir de un conjunto de documentos sobre el mismo tema.
Aprendizaje de guiones : Citando un ejemplo de un profesor, supongamos que le doy la siguiente narración de un evento: “Después del trabajo, fue al restaurante, donde pidió un sándwich. Se comió la comida, pagó la cuenta y se fue directamente a casa ”. Ahora te pregunto: “¿Qué comió él para la cena?”, E inmediatamente podrás decir que se comió un sándwich. Allí está sucediendo una gran cantidad de procesamiento: primero, nunca te dije lo que comió (utilizas el conocimiento previo de que el sándwich es un tipo de alimento, y sabes que la gente come lo que piden); en segundo lugar, si le preguntara “¿Qué comió en el desayuno?”, no estaría tan seguro, porque no espera que alguien salga de la oficina por la mañana. A medida que las narraciones se vuelven más complejas, puedes imaginar la complejidad que tiene que enfrentar la IA.

¿Cuál es la historia detrás del término 'Minería de datos'?

¿Las bases de datos noSQL o relacionales (SQL) son mejores para las startups de finTech?

Finalmente, ¿falló GNU?

Si tenemos un conjunto muy grande de objetos comparables, ¿qué implementación de la tabla de símbolos es empíricamente más rápida: una tabla hash o un árbol de búsqueda binario balanceado? ¿Por qué?

¿Cómo se fundó Computer Sciences Corporation?

¿Dónde descansan los servidores CS50?

Esa es una pregunta realmente interesante. Y voy a comenzar a señalar un desafío que a veces se descarta.

1) Arquitectura de hardware.
El nivel más alto de comprensión del lenguaje se basa en la capacidad del cerebro de procesar declaraciones complejas usando abstracción, intertextualidad y múltiples memorias sensoriales para asignar significado, terminando con un proceso de toma de decisiones que utiliza millones de variables (incluida la percepción en tiempo real) para proporcionar la retroalimentación. La estructura de hardware actual basada en microprocesadores, redes y nubes, simplemente no puede igualar incluso algunas tareas que son naturales para el cerebro humano.

2) Dinamismo del lenguaje.
A medida que el lenguaje evoluciona casi cada segundo, una verdadera inteligencia artificial para el procesamiento del lenguaje natural debe tener la capacidad de “aprender a aprender”, y no solo “aprender a granel” una serie de variables determinadas, que eventualmente serán insuficientes para soportar los nuevos usos. de lenguaje, estructuras, neologismos o nuevas referencias culturales.

3) Memoria direccionable por contenido.
En nuestras computadoras actuales, se accede a la información sondeando su dirección de memoria precisa (memoria direccionable en bytes). Nuestros cerebros utilizan memoria direccionable por contenido, información a la que se puede acceder a través de la “difusión de activación” desde conceptos estrechamente relacionados. Por ejemplo, pensar en la palabra “zorro” puede propagar automáticamente la activación a los recuerdos relacionados con otros animales inteligentes, cazar zorros o incluso personas atractivas.

Watson de IBM logró procesar con éxito preguntas de riesgo porque son declaraciones estructuradas, escritas correctamente que han determinado respuestas objetivas. Esto también se aplica a productos comerciales actuales como Lexalytics. Lexalytics es de alguna manera capaz de categorizar el “sentimiento” de texto (positivo o negativo) en textos objetivos estructurados (como noticias), pero su rendimiento varía enormemente al analizar muestras de lenguaje de la “vida real” (publicaciones espontáneas de usuarios de redes sociales, por ejemplo).

Prasoon Goyal

Mi centavo: la PNL es una rama en IA, trabaja en base al conjunto de datos de capacitación (más de aprendizaje supervisado). Por lo tanto, la base de conocimiento es la clave del resultado de PNL exitoso. La identificación del reconocimiento de la entidad puede no ser siempre precisa, por ejemplo, el texto dice “George Washington”, ¿qué esperaría que el sistema de PNL devuelva “Nombre” o “Ubicación” o ambos? Esto requiere que el sistema tenga que aprender el entrenamiento basado en NGram, que es un conjunto bastante grande que uno tiene que construir. El otro lado es que el reconocimiento sarcástico de oraciones podría inducir a error a suposiciones erróneas muchas veces, ¿estaría de acuerdo en que la PNL es quien toma las decisiones? Nada es imposible Tienes tiempo y dinero para descifrarlo con nuevas herramientas y técnicas.

David Krueger

El principal problema con los sistemas actuales es la incapacidad de modelar eficazmente las dependencias a largo plazo.

El estado del arte (SotA) en traducción automática funciona básicamente a nivel de oración y lucha con oraciones largas.

La comprensión humana puede incorporar dependencias en toda una novela, fácilmente.

Prasoon Goyal

More Interesting

¿Cuánto tiempo antes de que cada uno tenga un Watson en nuestra computadora de la misma manera que todos los dispositivos iOS tienen Siri?

¿Cuál es la diferencia entre las arquitecturas i386 y x86?

¿Cómo es el trabajo promedio en informática?

¿Cuáles son las posibilidades de ser admitido en el programa de posgrado de Berkeley CS?

¿Qué son los personajes de escape?

¿Mi licenciatura en ciencias de la computación de Carnegie Mellon Qatar será tratada al mismo nivel que la licenciatura en ciencias de la computación del campus de Pittsburgh?