¿Por qué no podemos usar el lenguaje natural como nuestro lenguaje de representación en IA?

Supongo que se pregunta por qué necesitamos usar otros lenguajes como prolog o Java u otros lenguajes de programación al escribir algoritmos de inteligencia artificial o al hacer que los sistemas informáticos realicen tareas de inteligencia artificial (por ejemplo, interactuar con un sistema de inteligencia artificial existente).

La razón principal se debe a la complejidad y la ambigüedad del lenguaje natural: el lenguaje natural es lo suficientemente difícil para que los humanos comprendan exactamente lo que significa. Como puede imaginar, es aún más difícil para los sistemas informáticos. Para las computadoras “lenguaje natural” es fijo, instrucciones inequívocas. Para algunos detalles ver:
3.1 Problemas con los lenguajes naturales.
Sobre la necedad de la “programación del lenguaje natural”. (EWD 667)

Dicho esto, la comprensión y la programación del lenguaje natural son áreas activas de investigación y ha habido mucho progreso y sistemas que han dado pasos para poder comprender el lenguaje natural y llevar a cabo tareas de IA u otros programas a partir de las instrucciones del lenguaje natural. En particular, puede echar un vistazo a Watson y Wolfram-Alpha:

Watson (computadora)
¿Qué es IBM Watson?
Saluda a IBM Watson

La programación con lenguaje natural realmente va a funcionar
Programación en lenguaje natural

Muchos algoritmos y técnicas ayudan a comprender o traducir el lenguaje natural a algo con lo que una computadora podría trabajar, la mayoría requiere algún tipo de procesamiento previo de texto, por ejemplo, tokenizarlo y convertir tokens en números de índice (incluso los enfoques de “aprendizaje profundo” requieren pre -procesamiento, la mayoría incluso lo lleva más lejos y convierte los términos en vectores o la colección de términos en un vector de frecuencia de términos).

Algunos ejemplos de enfoques de modelado de lenguaje común:
Modelo de bolsa de palabras
n-gramo
Modelo de tema
Modelos de lenguaje de red neuronal (“aprendizaje profundo”)

Lo que está describiendo es el aprendizaje de características sin supervisión, que es una característica del aprendizaje profundo. El aprendizaje supervisado de características implica el aprendizaje de características de datos etiquetados. Los datos etiquetados se denominan metadatos o datos sobre datos. Mientras que el aprendizaje de características no supervisado implica aprender características de datos no etiquetados. Según Wikipedia, una de las promesas del aprendizaje profundo es reemplazar las características artesanales con algoritmos eficientes para el aprendizaje de características no supervisadas o semi-supervisadas y la extracción jerárquica de características .

Ver también mis respuestas recientes de Quora a:

  • ¿Cómo hago un programa que entienda lo que significan los datos dados?
  • ¿Es FOPC la mejor manera de representar el inglés para todas las operaciones de PNL?

Principalmente porque la ambigüedad y redundancia de los lenguajes naturales.
Cuando está programando, está haciendo algo parecido a hablar con la computadora. No puedes esperar que realmente ‘comprenda’ lo que estás diciendo. Solo está siguiendo un conjunto de órdenes. Deben ser claros para ello. Es como cuando quieres comunicarte con un imbécil, debes hacer la comunicación a SU manera, no a la tuya. Pero solo digo que ahora no hemos podido producir una máquina así. ¿Quién lo sabe en el futuro lejano? Tal vez algún gran algoritmo haga el trabajo.

More Interesting

¿Cuál es el almacenamiento primario de la computadora?

¿Qué debo tener en cuenta al construir una computadora?

¿Qué técnicas de software se utilizan para reducir la latencia y sus efectos, en juegos como shooters en primera persona y MMO?

¿Qué curso debería estudiar para piratería ética después del 10?

¿Qué es la estrategia de bandidos multibrazos en línea en el aprendizaje automático?

¿Cuáles son algunos tipos de 'características' para el aprendizaje automático?

¿Cuál es la diferencia entre la teoría de simulación por computadora del Universo y el diseño inteligente?

¿Qué piensan los investigadores del aprendizaje automático del enfoque de "un modelo para aprenderlos a todos"?

¿El daño de un asesino USB es ópticamente visible en la placa base?

¿El aprendizaje automático aplicado se convertirá en una víctima de su propio éxito?

¿Qué estructura de datos puedo usar para representar códigos QR?

Si los desarrolladores de back-end desprecian a los desarrolladores de front-end porque el front-end es más fácil, ¿qué piensan de los desarrolladores de dispositivos móviles y de juegos, ya que también son una especie de desarrolladores de front-end?

¿Cuáles son algunas aplicaciones del mundo real de la criptomoneda?

¿Qué opinas sobre TensorFlow o cualquier otra herramienta de aprendizaje profundo?

¿Cuáles son algunas aplicaciones interesantes del aprendizaje automático en la aplicación de la ley y la lucha contra el terrorismo?