¿Cuáles son algunos de los principales problemas no resueltos en el aprendizaje automático?

Lo primero que hay que tener en cuenta es que la noción de “no resuelto” es ambigua en sí misma en lo que respecta a los campos de informática suave como la IA. Entonces, si el reconocimiento de voz se puede resolver con un 95% de precisión, ¿considera que ese problema está resuelto o no resuelto? Depende de la aplicación: para comunicarse con asistentes personales como Google Now o Siri, puede ser aceptable, pero para escribir correos electrónicos, será inaceptable.

Dicho esto, aquí hay una lista de algunos problemas en IA que compilé recientemente (e incluí en varias otras respuestas) que no estamos cerca de lograr con AI:

  1. Comprensión de oraciones : Dadas dos oraciones, ¿dicen lo mismo? Para las oraciones que se parecen mucho o usan sinónimos, puede hacerlo razonablemente bien. Pero más allá de eso, hay mucho más por hacer. En particular, la detección de sarcasmo es difícil. Además, las expresiones idiomáticas y las metáforas son algo extremadamente difícil de entender para la IA en este momento.
  2. Generación de oraciones : si bien el aprendizaje profundo se ha utilizado últimamente para generar oraciones, están lejos de ser perfectas.
  3. Resumen del texto : dado un artículo de 10 páginas, comprímalo en un resumen de una página. La variante de varios documentos implica generar un resumen de documento único a partir de un conjunto de documentos sobre el mismo tema.
  4. Aprendiendo de algunos ejemplos : en un gran no. De problemas, los humanos aprenden de muy pocos ejemplos, como el reconocimiento de escritura a mano. Las máquinas requieren muchos más ejemplos.
  5. Comprensión de los videos : dada una película, identifica cómo se relacionan los personajes. Los humanos son sorprendentemente buenos en esto: las relaciones como amigos son muy difíciles de inferir, porque la mayoría de las veces, no se refieren explícitamente entre sí como amigos.
  6. Aprendizaje de guiones : Citando un ejemplo de un profesor, supongamos que le doy la siguiente narración de un evento: “Después del trabajo, fue al restaurante, donde pidió un sándwich. Se comió la comida, pagó la cuenta y se fue directamente a casa ”. Ahora te pregunto: “¿Qué comió él para la cena?”, E inmediatamente podrás decir que se comió un sándwich. Allí está sucediendo una gran cantidad de procesamiento: primero, nunca te dije lo que comió (utilizas el conocimiento previo de que el sándwich es un tipo de comida, y sabes que la gente come lo que piden); en segundo lugar, si le preguntara “¿Qué comió en el desayuno?”, no estaría tan seguro, porque no espera que alguien salga de la oficina por la mañana. A medida que las narraciones se vuelven más complejas, puedes imaginar la complejidad que tiene que enfrentar la IA.
  7. Robótica : todavía no tenemos sistemas que permitan a los robots agarrar objetos arbitrarios de manera confiable, mientras que los humanos recogemos objetos arbitrarios todo el tiempo con un 100% de precisión.

Puedo agregar muchos más ejemplos. Estos son algunos problemas que los humanos hacen sin mucho esfuerzo. Si comienza a buscar actividades que requieren capacitación, como probar teoremas matemáticos, desarrollar nuevos algoritmos, escribir código, etc., obtendrá otra clase de tareas.

Como alguien ya ha dicho en una pregunta similar, en realidad no existe una base teórica para el aprendizaje profundo.

Funciona (muy bien) nadie sabe por qué.

Hay muchos otros (es decir, toneladas de) problemas no resueltos en ML, enumero algunos de ellos:

  • Aprendizaje de refuerzo y tiempo estructurado: la propiedad de Markov es buena para problemas secuenciales complejos, pero el sistema del mundo real tiene “memoria”
  • Siempre relacionado con el aprendizaje profundo: carecemos de alguna técnica establecida para interpretar la red, es decir, ¿cuál es la representación interna que un NN convolucional profundo ha aprendido de los datos? ¿por qué?
  • ¿Qué pasa con la búsqueda de hiperparámetros en caso de que una búsqueda de cuadrícula no sea factible? -> Técnicas de optimización bayesiana para la búsqueda de hiperparámetros
  • Característica de aprendizaje de la distribución no estacionaria?
  • Y muchos otros…

Espero que esto sea útil!

¡Adiós!

Bueno, para crear un sistema verdaderamente inteligente (AGI) …