Inteligencia artificial de videojuegos: ¿Por qué es tan difícil usar la inteligencia artificial de agente de red Q profunda para jugar La venganza de Montezuma a un nivel similar al humano?

Esencialmente, el sistema depende de prueba y error cuando aprende a jugar, por lo que necesita algún tipo de retroalimentación desde el principio. Un humano miraría el primer nivel y se daría cuenta de que el objeto ‘clave’ es deseable, mientras que el cráneo rodante y la caída de la plataforma son probablemente peligrosos y planean en consecuencia. La IA no planifica una ruta a la clave de la manera en que lo haría un humano, por lo que está atascado cometiendo los mismos errores una y otra vez. Los objetivos del juego son mucho más abstractos que los invasores del espacio, por ejemplo, en los que el agente es sobrehumano. Los invasores espaciales pueden dividirse en colisiones entre ciertos sprites que son “buenos” y colisiones entre otros que son “malos”. Los invasores espaciales no requieren ninguna planificación a largo plazo y es fácil disparar al menos a un invasor mediante una combinación aleatoria de botones, por lo tanto, es fácil para el agente “aprender”.

Este video explica y demuestra el problema:

More Interesting

¿Cómo se deben seleccionar los parámetros al ajustar las redes neuronales?

¿Quién fue Alan Turing y cuál fue su contribución al campo de la Inteligencia Artificial?

¿Cómo podrían la IA y un reloj inteligente cambiar nuestra percepción del tiempo en el futuro?

¿Una combinación humano-computadora supera a una computadora en ajedrez?

¿Los robots alguna vez serán sensibles? Si es así, ¿cómo y cuándo?

Cómo crear una IA como Siri o JARVIS

¿Cuáles pueden ser las posibles áreas de aplicación del aprendizaje automático / inteligencia artificial en automóviles?

¿Es posible tener Inteligencia General Artificial (AGI) a nivel humano y, sin embargo, no tener conciencia?

¿Cuál es la revisión más reciente sobre redes neuronales recurrentes para la clasificación de series de tiempo?

Si la mayoría de los humanos quedarán desempleados debido a que los robots / ai se harán cargo de los trabajos, entonces, ¿cómo el poder adquisitivo reducido mantendrá el motor económico en funcionamiento?

¿Cuáles son las cinco (5) razones por las cuales una computadora no puede tomar decisiones como los humanos?

¿Cuál es la clave que el aprendizaje profundo contribuyó al aprendizaje de refuerzo (RL) que antes no era posible sin redes neuronales (ANN)?

¿Quora alguna vez se volverá consciente de sí mismo, dada su gran reserva de conocimiento?

¿Por qué Apple ha adoptado una estrategia de privacidad diferencial en torno a la IA y los datos del usuario, pero Google no?

¿La informática y la automatización son malas para la humanidad a medida que las máquinas se hacen cargo de más trabajos? O es bueno?