¿Qué tan similar es el concepto de aprendizaje automático para ganar ‘experiencia humana’?

En primer lugar, el cerebro viene precargado con instintos solo desde el nacimiento, por lo que hace algo así como tener un modelo del mundo en su sistema solo desde el nacimiento. Esto es diferente a la mayoría de los sistemas de aprendizaje automático (ML) que normalmente comienzan con estados muy pobres (valores de parámetros) y se ajustan gradualmente usando un algoritmo basado en gradiente decente para optimizarlos.

En segundo lugar, la mayoría de los sistemas de ML son diferenciables y el aprendizaje en ML se presenta como una optimización de los parámetros, dada una función objetivo diferenciable suave. Esto significa que ML se basa en localizar el punto más bajo en la superficie de error. Esto significa que el ML está muy supervisado, esto contrasta con el cerebro del niño, que puede aprender en gran medida de manera no supervisada con muy poca o ninguna orientación de los padres.

El aprendizaje de refuerzo (RL) es realmente utilizado por el cerebro del niño para aprender, si el niño comete un error al castigarlo, eventualmente significará que el niño comenzará a asociar el castigo con el mal comportamiento. RL ahora se está utilizando en sistemas de IA que aprenden a jugar. Deep RL se usó en AlphaGo de DeepMind donde el sistema jugó contra su anterior ser más débil millones de veces para mejorar.

Sin embargo, el sistema RL en el niño es más sofisticado en comparación con el RL profundo utilizado en AlphaGo o en cualquier otro sistema como el Universo y Gimnasio de OpenAI. El cerebro del niño humano es capaz de usar una forma compleja de RL que le permite encontrar las acciones correctas a tomar para maximizar la recompensa sobre el castigo.

El niño del cerebro humano puede aprender fácilmente con una supervisión mínima y con pocos datos de entrenamiento, un proceso llamado aprendizaje de una sola vez. Los padres no tienen que mostrarle al niño miles de ejemplos para una sola tarea. El niño puede usar el número limitado de ejemplos y poder generalizar bien desde allí. El niño también aprende gradualmente a un nivel consciente y subconsciente.

Los sistemas de ML, por otro lado, son malos con el aprendizaje de una sola vez, en parte debido a la gran cantidad de parámetros para ajustar. Sí, el cerebro tiene muchas conexiones, pero la forma en que aprenden estas conexiones cerebrales puede no basarse en el descenso de gradiente, sino en algunos métodos de aprendizaje más sofisticados. Y los sistemas de ML actuales no aprenden gradualmente, aprenden en una fase fuera de línea.

Espero que esto ayude.

Es similar en sentido muy limitado. Incluso el ANN no es exactamente similar a la neurona real. Es un modelo matemático. Además, cuando aprendemos, no solo usamos algunos sensores específicos, sino también imaginación, abstracción, recuerdos genéticos, sentido del arte, etc.