Cuando la gente dice que la teoría de la red neuronal artificial es incompleta, ¿qué quieren decir?

No conozco el contexto, así que no puedo estar seguro si estoy hablando de lo mismo que “ellos”. Sin embargo, básicamente las diversas técnicas utilizadas para el tipo de ANN más útil, que son las recientes profundas, son trucos sin mucha justificación matemática o incluso una metodología de diseño clara. La mayoría de los avances recientes son realmente solo avances tecnológicos en los que las personas han intentado hackear con cierta intuición y han logrado obtener resultados decentes en varios problemas empíricamente, sin una comprensión profunda de lo que está sucediendo.

Por ejemplo, los diversos trucos utilizados en la optimización del estilo de descenso de gradiente para entrenar NN no tienen mucha justificación. No se sabe mucho sobre la superficie de error que se está intentando optimizar. Lo mismo ocurre con la forma en que las arquitecturas de redes neuronales se eligen para diferentes aplicaciones: si bien se afirma que el marco es “de extremo a extremo” y hace todo el aprendizaje (de las características) por sí mismo, las características aprendidas son una función importante de la arquitectura de la red elegido manual y tediosamente para lo cual no existen pautas claras y completamente justificadas. Del mismo modo, varios problemas con NN profundos, como el problema de la clasificación errónea de ejemplos de prueba muy ligeramente diferentes (que se producen al agregar poco ruido), o el hecho de que las redes neuronales aprendidas siguen siendo en gran medida cajas negras que son difíciles de verificar (lo que realmente son mirando para la clasificación) todavía están abiertos.

Nunca he escuchado ese argumento. La palabra incompleta es una cualidad compartida de cualquier campo cuya investigación es un trabajo constante en progreso. Es bastante aceptado en todas partes, desde la ciencia hasta la tecnología. ¿Pero debo suponer que la palabra se está utilizando como una forma de crítica, posiblemente en el contexto de cómo las Redes Neurales pueden contribuir al Aprendizaje Automático y posiblemente incluso a la IA?

Si ese es el caso, el único problema que personalmente y humildemente veo con Neural Networks es que son excelentes herramientas para resolver problemas discretos en el reconocimiento de patrones y el aprendizaje automático, por ejemplo, pero se convierten en modelos extremadamente complejos para usar de manera práctica cuando Es necesario reunir estos problemas discretos en una sola máquina coherente. Lo que esto significa es que las redes neuronales por sí solas no pueden responder completamente el problema del aprendizaje automático desde el punto de vista de una IA.

Por ejemplo, podemos tener (ya lo hacemos hasta cierto punto) excelentes algoritmos para el reconocimiento de imágenes y reconocimiento de voz desarrollados gracias a los modelos de redes neuronales. Pero si bien una computadora puede “ver” una imagen de dos jugadores de hockey y etiquetarla correctamente, será una hazaña tremenda de la programación de computadoras tener esa máquina para reconocer también a uno de los jugadores como Corey Perry e incluirlo en la etiqueta de la imagen , y aún más complejo para que esa máquina hable con un humano cuyas preguntas sobre la imagen.

Bueno, cuando consideramos lo que pueden hacer los NN en humanos, está claro que no hay una buena teoría ANN que pueda igualar las capacidades. Y NO hay un buen funcionamiento arquitectónico de la mente. Aunque varias personas, incluido yo, estamos trabajando duro en eso.
Los ANN utilizan un enfoque centrado en tratar de optimizar la energía en un sistema, como si tuviera un gran conjunto de nodos conectados por resortes y desea encontrar posiciones estables de la red. Pero este enfoque es simplemente inadecuado para lograr las arquitecturas complicadas que producen la cognición humana. Se necesita mucho más y mejor.

More Interesting

Tengo una sólida formación matemática. ¿Qué cursos debo tomar para estudiar el aprendizaje automático?

¿Cuál es el chatbot más inteligente?

Si me importa cargar, en teoría, ¿mi 'yo' será transferido a un robot, o el robot será solo una copia exacta de mí?

¿Podría una red neuronal recursiva hacer hipercomputación?

¿Puede AI tocar el piano como un pianista?

En una red neuronal (sin saber si es específica para keras), ¿cuál es la diferencia entre el tamaño del lote y el entrenamiento del lote? ¿Cuándo necesitaría ambos?

¿Cuándo podrá Inteligencia Artificial leer mi correo electrónico y ofrecerme sugerencias sobre qué escribir?

Cómo obtener datos para mi chatbot

¿Por qué imaginamos (y creamos en algunos casos) robots con forma humana?

¿Cómo funciona la teoría de la información integrada y cuáles son las matemáticas detrás de ella?

¿Cuál es la inteligencia más común de las especialidades matemáticas aparte de la inteligencia lógico-matemática?

Si hay un algoritmo o teoría sobre cómo crear una IA fuerte, ¿se hará pública dicha información como otra investigación académica o se mantendrá en secreto para beneficiar a los involucrados?

¿Cuál es el papel de la función de activación no lineal (función sigmoidea) en las redes neuronales?

¿Cuáles son los beneficios de un lenguaje de programación funcional cuando se usa en inteligencia artificial?

¿Qué piensas sobre la creación de máquinas superinteligentes (IA)? Por favor lea los detalles antes de responder.