¿Cómo está diseñada la IA para un juego de computadora complicado como Civilization IV o Europa Universalis?

Suele ser bastante simple.

Cada entidad en el juego tiene su propio programa de control. Este programa tiene recompensas por lograr los objetivos y se ve a través de una serie de acciones simples que parecen lograr el objetivo.

Esto los hace trivialmente fáciles de fastidiar. Por ejemplo, si las aldeas obtienen una recompensa por llevar los recursos de vuelta a su aldea, entonces podría establecer algunos recursos y una trampa por la que las aldeas tienen que pasar para llegar a los recursos. Las aldeas verán los recursos, caerán en la trampa y morirán, y luego vendrá el próximo aldeano y hará lo mismo. Los objetivos se asignan al azar ligeramente, por lo que no todos terminan tratando de hacer lo mismo, y las acciones también se asignan al azar: si una acción parece un poco más prometedora que otra, entonces la acción más prometedora es más probable.

Se podría decir que la inteligencia es “emergente”. Los comportamientos se construyen en capas a partir de la búsqueda básica de rutas. Básicamente, no piense en ello como si tratara de programar la inteligencia de todo el juego, sino que haga que un solo aldeano se comporte con cierta sensatez suponiendo que todos los demás agentes se comporten con sensatez. Es inteligente de la misma manera que una colonia de hormigas es inteligente. No hay un programa de control maestro que distribuya cuidadosamente las instrucciones.

En general, los juegos deshabilitan el aprendizaje. La capacidad de aprender agrega muchas complicaciones y, con frecuencia, el comportamiento mientras se aprende es peor que el comportamiento en un máximo local. Además, el aprendizaje requiere más potencia de procesamiento y simplemente ejecutar docenas o cientos de agentes ya es bastante agotador.