Cómo hacer que las computadoras entiendan un párrafo de texto, usando Machine Learning

Es muy interesante que el objetivo se establezca como “comprensión informática”.

Si el objetivo hubiera sido “la comprensión humana, facilitada de alguna manera por la computadora”, tendríamos nuestro trabajo para nosotros.

Con el ser humano como parte del sistema, estaríamos bien aconsejados para comenzar nuestra exploración aclarando lo que un ser humano podría obtener de un párrafo de texto.

Usted puede discutir, ¿por qué el humano necesitaría la computadora? Yo respondería, porque hay mucha información potencial (datos), y me gustaría usar la incansable voluntad y capacidad de la computadora para ejecutar algoritmos relevantes que me pueden ahorrar algo de tiempo. Y qué pasa si, por ejemplo, no soy vidente o disléxico … eso podría muy bien ejemplificar el punto de una interacción inteligente hombre-máquina.

En este punto, probablemente debería admitir que puedo imaginar casos relevantes donde las computadoras no necesitan interactuar con las personas. Por ejemplo, un robot de manejo de materiales no necesita hablar con un humano para trabajar bien con otro robot.

Pero sigamos con nuestro ejemplo: una computadora que entiende un párrafo de texto. Pero, fíjate, la pregunta decía entender, no solo “saber” o “copiar” o “memorizar”. Comprende, ¡eso es mucho! Creo que debemos comenzar a enumerar lo que podría estar involucrado:

  1. Información de parte del discurso; también conocido como “clases de palabras”.
  2. Información gramatical para ese idioma.
  3. Estos dos combinados darán cierto grado de precisión en el reconocimiento de las partes atómicas del texto.
  4. Para obtener cierto grado de precisión en el reconocimiento de las oraciones completas, también necesitamos información de sintaxis y gramática de sintaxis, la lista continúa.
  5. De hecho, omitimos un área crítica de conocimiento: aunque podemos tener la información pos (1.) no sabemos nada sobre el significado real de las palabras (y expresiones compuestas). Para este fin, necesitamos una topología (algunos incluso llegarían a llamar a esto una ontología – “conocimiento sobre la naturaleza de las cosas) – pero ha sido mi experiencia que un recurso que ordena fichas en” nidos “bien organizados ( lugares, topoi) funcionará bien.
  6. Ahora nos estamos acercando a una solución de trabajo. Por supuesto, siempre habrá ejemplos cuando las computadoras fallan cuando intentan adivinar lo que los humanos realmente están haciendo cuando se expresan por escrito. Pero todos tenemos que aprender.
  7. Oh, aprende Ah, lo siento, eso es una especie de dolor de pie, diente, lo que sea. Lo sentimos, pero esta es la frontera actual: la limitación no es que las computadoras cometan errores, es que las computadoras no muestran ningún signo de trascender las fronteras de sus creencias. Si encuentra esto interesante, pruébelo con significados de primer, segundo y tal vez de orden superior.

También puede consultar cualquier avance conocido. Aquí hay un ejemplo:

Este gráfico circular muestra los encabezados que contienen información explorable sobre el discurso de inauguración del presidente Donald J. Trumps. Estos son los encabezados realmente no nos dan una buena idea, pero podríamos abrir uno de ellos. Veamos la geografía:

Como podríamos haber adivinado, realmente hay muy poco en el discurso que sale de los Estados Unidos de A.

Podríamos compararnos con otros presidentes. Por supuesto, abordan principalmente los asuntos estadounidenses, como deberían, pero sí tocan algo de geografía fuera de las fronteras:

Mi propio trabajo es especialmente en el área de topología. En este punto, mi equipo ha logrado mapear la aplicación 6.6 millones. fichas en la larga cola de significado. Una de nuestras decisiones estratégicas fue hacer de esta una tecnología en la nube para que muchos socios puedan contribuir con cualquier parte de la larga cola que consideren conveniente compartir.

Todo en beneficio de una mayor precisión cuando le pedimos a las computadoras que nos ayuden.

Este es un tema extremadamente amplio que cubre la mayor parte de nlp. No sé cómo responderlo dentro del contexto de una sola respuesta de quora. Tiene que analizar las oraciones individuales en su estructura de oración y parte del discurso, debe centrar conceptos entre oraciones, debe vincular esos conceptos a una base de conocimiento, identificar eventos y propiedades de esos eventos, descubrir relaciones establecidas entre entidades, y todas esas tareas son complejas por derecho propio. Una vez que tenga esa base para trabajar, el lugar al que vaya después dependerá de lo que esté tratando de hacer. ¿Quieres resumirlo? Ampliar una base de conocimiento? Interfaz a algún sistema más grande?