¿Qué es el procesamiento del lenguaje natural en inteligencia artificial?

Si alguna vez se ha preguntado cómo Google traduce automáticamente el texto, eso es algo en el dominio del procesamiento del lenguaje natural. Desde un punto de vista puramente científico, el procesamiento del lenguaje natural implica la cuestión de cómo estructuramos los modelos formales del lenguaje natural y cómo diseñar algoritmos que implementen estos modelos.

Las aplicaciones dentro del procesamiento del lenguaje natural incluyen sistemas de diálogo, traducción automática, extracción de información cuyo objetivo es que el texto no estructurado pueda buscarse de manera estructurada.

Si está buscando entrar en él, debe comenzar con un conocimiento estable de probabilidad, algoritmos y cálculo multivariado. En resumen, el procesamiento del lenguaje natural es el estudio de los modelos matemáticos del lenguaje, permite a las computadoras comprender la forma en que los humanos aprenden y usan el lenguaje. PNL también se conoce como lingüística computacional .

No soy un experto en PNL, pero tenemos un artículo útil en el sitio web de reportbrain que lo explica con un poco más de detalle.

Para el artículo completo, haga clic aquí!

Procesamiento de lenguaje natural (PNL)

Después de que se compilan todas las fuentes de datos y datos, es necesaria la tarea de recuperar datos estructurados de datos no estructurados y especialmente texto. Aquí es donde entra el procesamiento del lenguaje natural.

El procesamiento del lenguaje natural brinda a las máquinas la capacidad de leer y comprender, así como derivar el significado de los idiomas que los humanos hablan, y es parte de la inteligencia artificial.

NLP está en el corazón del software moderno que procesa y comprende el lenguaje humano, aprovechando la gran cantidad de datos de lenguaje en la web y en las redes sociales. Uno de los ejemplos más conocidos de PNL es Watson de IBM, que pudo ganar el programa de televisión Jeopardy al vencer a dos de los mejores campeones de Jeopardy.

Como el fundador de Big Data Platform: Connecting Data and People, Mark van Rijmenam escribe “el obstáculo clave aquí es que las computadoras entienden el lenguaje de programación” inequívoco y altamente estructurado “, mientras que el lenguaje humano es un campo minado de matices, emociones e intenciones implícitas”.

Geoffrey Pullum, profesor de lingüística general en la Universidad de Edimburgo. Pullum describe tres requisitos previos para que las computadoras dominen el lenguaje humano: “Primero, suficiente sintaxis para identificar de manera única la oración; segundo, semántica suficiente para extraer su significado literal; y tercero, suficientes pragmáticas para inferir la intención detrás del enunciado, y así discernir lo que se debe hacer o asumir dado que se pronunció “.

Esta es una pregunta un poco difícil de responder, en parte porque hay varios campos que funcionan en problemas similares, cada uno de los cuales se marca de manera diferente. Por ejemplo, tres investigadores, uno en Text Data Mining, otro en Lingüística Computacional y el tercero en Procesamiento de Lenguaje Natural, pueden trabajar en el análisis de sentimientos y usar los mismos algoritmos, lenguaje de programación, etc., pero aún así se consideran trabajando en Diferentes campos.

Así que aquí hay un intento de definir el procesamiento del lenguaje natural: la PNL es el campo que estudia la interacción entre la computación y el lenguaje natural, utilizando conocimientos lingüísticos, modelos computacionales y herramientas estadísticas para construir soluciones a los problemas que encontramos en el mundo real.

Entonces, ¿cuál es la diferencia entre NLP, CL y TDM? Cuanto más aprendo sobre cada campo, más estoy convencido de que no hay mucha diferencia aparte del nombre. Dicho esto, sin embargo, aquí hay algunas diferencias notables al abordar problemas similares:

  • Traducción automática: CL pasa más tiempo construyendo nuevos modelos y teorías, la PNL en realidad trata de diseñar soluciones basadas en esos modelos / teorías, y TDM ignora en gran medida la traducción automática
  • Clasificación de documentos: CL se ocupa principalmente de cómo representamos la clasificación (agrupamos todas las palabras, si consideramos temas probabilísticos que pueden o no estar presentes en todos los documentos, etc.). NLP estaría más preocupado con qué herramientas disponibles realmente rinden mejor en datos de la vida real. TDM utiliza estos conocimientos para rastrear métricas e intentar encontrar patrones o pepitas previamente desconocidos en el texto.
  • Etiquetado de parte del discurso: CL está muy preocupado por la validez lingüística de los diferentes modelos computacionales. PNL se enfoca más en qué solución tiende a ser la correcta e intenta utilizar técnicas de aprendizaje automático para mejorarlas. TDM utiliza estas trampas para tratar de construir un método estadísticamente viable para obtener información de texto en relación con las etiquetas POS, reconociendo los errores inherentes en los modelos y herramientas.

Habiendo dado esta respuesta, también necesito calificar su validez. Por un lado, soy un estudiante con experiencia limitada y perspectiva histórica. No estaba cerca cuando comenzó la PNL, y las cosas han cambiado mucho. En segundo lugar, la PNL y sus campos relacionados cambian constantemente y cambian de marca. Cuando comenzó la informática, casi todos estos temas se agruparon en un campo deliciosamente caótico. Alan Turing escribió sobre el lenguaje y las computadoras antes de que la mayoría de la gente supiera qué era una computadora moderna. A medida que hemos tenido más tiempo para explorar el territorio académico, el cambio de nombre del campo y la revisión de los supuestos arraigados ha sucedido una y otra vez.

Entonces, por hoy, creo que esta explicación de PNL es funcional. ¿Pero será dentro de cinco años? De alguna manera lo dudo.

El procesamiento del lenguaje natural es un subcampo de la inteligencia artificial, cuyo objetivo es emular la inteligencia humana. La PNL, como su nombre indica, está procesando el lenguaje natural (lenguaje humano como inglés, francés, alemán, etc.). Implica el desarrollo de modelos estadísticos matemáticos en particular para el procesamiento de lenguajes humanos. Como cada idioma es diferente, un sistema que funciona bien para un idioma puede no funcionar para otro idioma. Por lo tanto, hay muchos temas de investigación intactos en la PNL.
Dos campos principales de PNL incluyen el procesamiento de lenguaje en forma de textos y el procesamiento de lenguaje en forma de discurso.
Algunas aplicaciones desafiantes de PNL incluyen

  • Sistema de preguntas y respuestas (al igual que el sistema de preguntas y respuestas de IBM Watson)
  • Sistema de diálogo (al igual que los humanos, el sistema tiene que responder a un humano)
  • Sistema de paráfrasis (para que el programa comprenda una gran parte del texto o un material de voz).

Algunas áreas un poco menos desafiantes pero altamente interesantes incluyen

  • Análisis sentimental (para saber si una retroalimentación tiene un sentimiento positivo, negativo o neutral), análisis emocional, etc.
  • Resumen de texto, modelado de temas, etc.
  • Sistema de recomendación (para recomendar productos, servicios, etc.)
  • Máquina traductora
  • Discurso a síntesis de texto y viceversa.
  • Extracción de relación, resolución de correferencia, etc.

Campos como la lingüística computacional, IA, aprendizaje automático, minería de datos, reconocimiento de patrones, aprendizaje estadístico, teoría de la información, etc. están estrechamente relacionados con la PNL.
—————————————————————————————-
Para su información, hay un campo muy avanzado llamado superinteligencia. A diferencia de la IA que emula la inteligencia humana a las máquinas (programas), el objetivo de la súper inteligencia es conferir inteligencia muy superior a la de los humanos. A partir de ahora, esta es un área hipotética solamente. Una personalidad eminente que trabaja en el área es [http://www.nickbostrom.com]

More Interesting

Para que la inteligencia artificial funcione, ¿necesitamos primero descubrir qué es la inteligencia humana?

¿Cómo impactará el aprendizaje automático en la economía?

¿Son los sistemas de IA de alguna manera estúpidos? ¿Cómo define la estupidez artificial?

¿Por qué Nederland no crea empleados con inteligencia artificial para reemplazar a los inmigrantes?

¿En qué orden debo aprender el aprendizaje automático, el aprendizaje profundo, el procesamiento del lenguaje natural y la inteligencia artificial?

¿Cuál es la relación entre inferencia y transmisión de mensajes en el contexto del aprendizaje automático?

¿La inteligencia artificial juega un papel importante para lograr energía sostenible? Si es así, ¿cómo contribuye la inteligencia artificial a este objetivo?

¿Cuáles son algunas instituciones / empresas de investigación que trabajan en inteligencia humana o fusionan la inteligencia humana con la inteligencia artificial?

¿Qué es más prometedor entre el aprendizaje automático y el aprendizaje profundo?

¿Cuál será el mejor algoritmo para encontrar el camino más corto para mover un robot de un punto a otro, cuando varios robots se mueven en un campo?

Cómo proceder para hacer una carrera en inteligencia artificial después de mi duodécimo estándar

Cómo pensar que la IA afectará a los gobiernos de diferentes países del mundo

¿Puedes hacer una IA en solo 10 líneas de código?

¿Las redes neuronales solo son buenas para la clasificación, les va bien en problemas de regresión / agrupamiento?

¿Por qué Google publica un tutorial y el código sobre cómo construir su propio sistema de traducción automática neuronal en su blog de investigación en GitHub?