¿Qué es el procesamiento del lenguaje natural?
El procesamiento del lenguaje natural (PNL) es un campo que ya comenzó en 1950 y el objetivo es hacer que las máquinas entiendan nuestro idioma. Los investigadores en ese momento realmente pensaban que tendremos máquinas para hablar en la década de 1960. Bueno, como pueden ver, estaban un poco fuera de lugar con su plan. Todavía no hemos llegado allí, pero hemos logrado un progreso tremendo en los últimos 10-15 años, principalmente a través de la ayuda de mejores computadoras y más datos disponibles.
Si uno tuviera que dividir la PNL en una ecuación, sería:
- ¿Cuáles son las diferencias entre los árboles de decisión, los métodos de agrupamiento y las redes neuronales?
- Si planeo obtener un doctorado en aprendizaje de refuerzo teórico, ¿qué profesores y universidades debería considerar?
- ¿Qué conocimientos de matemática / estadística y CS debo dominar (no matemático / stat / CS, pero graduado en ingeniería) para carrera / investigación en aprendizaje automático?
- ¿Puedo usar el aprendizaje por refuerzo para ayudar a las personas a elegir la ruta más barata cuando viajan en avión?
- Si ya hemos conocido una función, ¿podemos generar una red neuronal para la inferencia, sin pasar por el proceso de capacitación que consume tiempo y energía?
PNL = Informática + Inteligencia Artificial + Lingüística computacional.
¿Cuáles son los objetivos del procesamiento del lenguaje natural?
En realidad, hay dos tipos de lenguaje natural con los que los humanos y las computadoras tenemos que lidiar. Uno es el discurso que es mucho más antiguo que el texto. Ambos tienen diferentes dificultades. Especialmente el texto se volvió muy importante ya que tenemos todas estas redes sociales. Las tareas incluyen la comprensión del texto, el resumen del texto, la generación del lenguaje humano, la traducción, etc. Por otro lado, tenemos reconocimiento de voz y cosas como traducción de texto a voz, para que la computadora pueda leer por usted. Otra cosa es la desambiguación del hablante, como quién está hablando en qué punto. Nosotros, como humanos, somos bastante buenos para poder diferenciar diferentes voces mientras las computadoras tienen problemas.
¿Por qué queremos hacer procesamiento de lenguaje natural?
En mi opinión, se reduce a simplificar la vida y hacerla más eficiente. Vivimos en un mundo cada vez más conectado con la tecnología. Tenemos más y más interacción humana con la computadora. ¿Recuerdas cómo era la recopilación de información antes de Google? Tuviste que ir a bibliotecas o Lexicals para obtener tu información. Hoy en día, escribes cosas en Google y la mayoría de las veces obtienes resultados bastante decentes. En el futuro tendremos robots y, si queremos integrarlos en nuestra vida adecuadamente, deberían poder hablar.
Hasta ahora, la mayor parte de la interacción es que escribimos nuestras cosas en las máquinas. Eso es bastante tedioso y bastante lento. Usar tus manos para comunicarte con tu computadora es lento. Escribir esta respuesta me lleva mucho más tiempo que dictarla. Me encantaría dictarlo, pero la computadora no me entiende correctamente. El habla sería más rápido y permitiría un mayor rendimiento mientras habla más rápido de lo que escribe. Por lo tanto, queremos hacer PNL.
¿Cuáles son los desafíos en PNL?
Para alcanzar la comprensión adecuada de la máquina, hay varios desafíos principales involucrados, con los que nosotros, como humanos, no tenemos ningún problema. Sin embargo, esas tareas son bastante difíciles para las máquinas. Clasificar y clasificar texto es fácil para nosotros. Sabemos de inmediato si alguien habla o escribe sobre deportes en lugar de música. Además, descubrir los temas generales es difícil para las máquinas. Para nosotros también es fácil saber que Apple es una entidad nombrada de una empresa o París el nombre de la capital de Francia. Para la máquina esto es difícil si nunca lo vieron antes. También es complicado descubrir las relaciones entre esas entidades nombradas. Además de la desambiguación de una palabra en un contexto dado, como apple the fruit y Apple the company.
No es fácil para las máquinas descubrir las estructuras gramaticales, pero para ser justos, creo que la gramática es bastante artificial y hecha por el hombre, y para hablar un idioma no es necesario conocer la gramática correcta. Las máquinas lo suficientemente divertidas realmente no necesitan gramática.
Un punto más es el análisis de sentimientos. Nosotros, como humanos, usamos palabras para describir el sentimiento y tenemos algo de sentimiento y algo de significado detrás, algo de intuición que las máquinas aún no tienen.