¿Qué es el procesamiento del lenguaje natural?

¿Qué es el procesamiento del lenguaje natural?

El procesamiento del lenguaje natural (PNL) es un campo que ya comenzó en 1950 y el objetivo es hacer que las máquinas entiendan nuestro idioma. Los investigadores en ese momento realmente pensaban que tendremos máquinas para hablar en la década de 1960. Bueno, como pueden ver, estaban un poco fuera de lugar con su plan. Todavía no hemos llegado allí, pero hemos logrado un progreso tremendo en los últimos 10-15 años, principalmente a través de la ayuda de mejores computadoras y más datos disponibles.

Si uno tuviera que dividir la PNL en una ecuación, sería:

PNL = Informática + Inteligencia Artificial + Lingüística computacional.

¿Cuáles son los objetivos del procesamiento del lenguaje natural?

En realidad, hay dos tipos de lenguaje natural con los que los humanos y las computadoras tenemos que lidiar. Uno es el discurso que es mucho más antiguo que el texto. Ambos tienen diferentes dificultades. Especialmente el texto se volvió muy importante ya que tenemos todas estas redes sociales. Las tareas incluyen la comprensión del texto, el resumen del texto, la generación del lenguaje humano, la traducción, etc. Por otro lado, tenemos reconocimiento de voz y cosas como traducción de texto a voz, para que la computadora pueda leer por usted. Otra cosa es la desambiguación del hablante, como quién está hablando en qué punto. Nosotros, como humanos, somos bastante buenos para poder diferenciar diferentes voces mientras las computadoras tienen problemas.

¿Por qué queremos hacer procesamiento de lenguaje natural?
En mi opinión, se reduce a simplificar la vida y hacerla más eficiente. Vivimos en un mundo cada vez más conectado con la tecnología. Tenemos más y más interacción humana con la computadora. ¿Recuerdas cómo era la recopilación de información antes de Google? Tuviste que ir a bibliotecas o Lexicals para obtener tu información. Hoy en día, escribes cosas en Google y la mayoría de las veces obtienes resultados bastante decentes. En el futuro tendremos robots y, si queremos integrarlos en nuestra vida adecuadamente, deberían poder hablar.

Hasta ahora, la mayor parte de la interacción es que escribimos nuestras cosas en las máquinas. Eso es bastante tedioso y bastante lento. Usar tus manos para comunicarte con tu computadora es lento. Escribir esta respuesta me lleva mucho más tiempo que dictarla. Me encantaría dictarlo, pero la computadora no me entiende correctamente. El habla sería más rápido y permitiría un mayor rendimiento mientras habla más rápido de lo que escribe. Por lo tanto, queremos hacer PNL.

¿Cuáles son los desafíos en PNL?
Para alcanzar la comprensión adecuada de la máquina, hay varios desafíos principales involucrados, con los que nosotros, como humanos, no tenemos ningún problema. Sin embargo, esas tareas son bastante difíciles para las máquinas. Clasificar y clasificar texto es fácil para nosotros. Sabemos de inmediato si alguien habla o escribe sobre deportes en lugar de música. Además, descubrir los temas generales es difícil para las máquinas. Para nosotros también es fácil saber que Apple es una entidad nombrada de una empresa o París el nombre de la capital de Francia. Para la máquina esto es difícil si nunca lo vieron antes. También es complicado descubrir las relaciones entre esas entidades nombradas. Además de la desambiguación de una palabra en un contexto dado, como apple the fruit y Apple the company.

No es fácil para las máquinas descubrir las estructuras gramaticales, pero para ser justos, creo que la gramática es bastante artificial y hecha por el hombre, y para hablar un idioma no es necesario conocer la gramática correcta. Las máquinas lo suficientemente divertidas realmente no necesitan gramática.

Un punto más es el análisis de sentimientos. Nosotros, como humanos, usamos palabras para describir el sentimiento y tenemos algo de sentimiento y algo de significado detrás, algo de intuición que las máquinas aún no tienen.

Aprendizaje automáticoProcesamiento del lenguaje natural

¿Dónde puedo encontrar el código fuente para construir un árbol de decisión usando el algoritmo ID3 en C?

¿Cuáles son los mayores desafíos al hacer análisis de big data?

¿Qué tan difícil es aprender el aprendizaje automático y el aprendizaje profundo después de los 30 años?

¿Qué tan bueno es UMass Amherst para CS, especialmente para el aprendizaje automático y la minería de texto?

Cómo comprender mejor las funciones de activación en el aprendizaje automático, especialmente las matemáticas detrás de ellas

Cómo construir un sistema de aprendizaje automático para la revisión automática de código

El procesamiento del lenguaje natural (PNL) es la capacidad de un programa de computadora para comprender el habla humana tal como se habla. La PNL hace posible que un programa de inteligencia artificial (IA) reciba información conversacional, descomponga la sintaxis para comprender el significado de la información, determine la acción apropiada y responda de manera coloquial. PNL es la base de un área de estudio más amplia llamada lingüística computacional.

El desarrollo de aplicaciones de PNL es un desafío porque las computadoras tradicionalmente requieren que los humanos les “hablen” a través de un número limitado de comandos de voz claramente enunciados o mediante el uso de un lenguaje de programación que sea preciso, inequívoco y altamente estructurado. Sin embargo, el discurso humano no siempre es preciso: a menudo es ambiguo y la estructura lingüística puede depender de muchas variables complejas, que incluyen jerga, dialectos regionales y contexto social. El objetivo final de PNL es construir interfaces de conversación que manejen las interacciones entre máquinas y humanos en el lenguaje preferido de los humanos.

Los enfoques actuales de la PNL utilizan el aprendizaje automático para analizar patrones en los datos y mejorar continuamente la propia comprensión del programa. Gran parte de la investigación que se está realizando en el procesamiento del lenguaje natural hoy gira en torno a la búsqueda y chatbots, asistentes virtuales como Alexa de Amazon que usan PNL para recibir solicitudes de trabajo humano a través de voz o texto.

Las tareas comunes de PNL en los programas de software de IA hoy incluyen:

Reconocimiento automático de voz (ASR): convierte las señales de audio en texto
Etiquetado y análisis de parte del discurso: divide el texto escrito y las palabras habladas en unidades significativas
Traducción automática: traduce un lenguaje humano a otro
Comprensión del lenguaje natural (NLU): analiza el texto para extraer metadatos sobre el sentimiento y la intención del hablante
Resolución de referencia conjunta: identifica menciones que se refieren a la misma entidad
Análisis profundo: aplica técnicas sofisticadas de procesamiento de datos para recopilar información de datos no estructurados y semiestructurados
Extracción de entidad con nombre: busca y clasifica nombres de personas, empresas, países y otras categorías pre-clasificadas en el texto y la palabra hablada

Bijay Gurung

Los humanos nos comunicamos principalmente entre nosotros (hablar, escribir, leer) a través del lenguaje.

Y para nosotros, es natural . Pero para las computadoras … no tanto.

Entonces, PNL es un estudio para hacer que las computadoras entiendan y procesen la forma en que los humanos se comunican a través del lenguaje para que puedan interactuar mejor con nosotros de una manera natural .

(Por supuesto, esta es solo una definición entre muchos de este vasto campo).

Maximilian Unfried

More Interesting

¿Cómo se emplea una parada temprana en TensorFlow?

¿Qué son las redes neuronales progresivas?

¿Son las preguntas el verdadero punto de partida del análisis de Big Data?

¿Cuántas personas en el mundo son expertos en aprendizaje profundo para visión por computadora?

Cómo analizar páginas web a través de enlaces de Twitter

¿Cuáles son algunas aplicaciones de PageRank que no sean motores de búsqueda?

¿Por qué es difícil construir IA de autoaprendizaje?

¿Cómo deciden las personas en aprendizaje profundo qué artículos no leer?

¿Por qué los lars y glmnet dan diferentes soluciones? ¿Cuál es mejor?