¿Cómo funcionan los programas de IA que aprenden a jugar solos?

Supongo que está preguntando sobre el trabajo de Deepmind para jugar juegos de Atari y Maluuba para interpretar a la Sra. Pac-Man.

Los sistemas de inteligencia artificial actuales que juegan videojuegos utilizan el aprendizaje de refuerzo profundo. Lo que básicamente le permite a la IA realizar diferentes acciones (por ejemplo, moverse hacia arriba, abajo a la izquierda, derecha, saltar) y necesitamos asignar recompensas a estas acciones. La IA solo necesita encontrar la “mejor” política que tenga la mayor recompensa, es decir, para cada estado en el que se encuentre la IA, elegirá la acción que conducirá a la mayor recompensa a largo plazo.

Al igual que si la IA muere en el juego, entonces debemos asignar un conjunto negativo al conjunto de acciones que conducen a su muerte, y si la IA llega al final de un nivel, le daremos un valor positivo a esas acciones.

Para entrenar un sistema como este, generalmente solo dejamos que su computadora funcione durante unos días o semanas para que la IA experimente y aprenda diferentes conjuntos de acciones para encontrar la que conduce a la que lleva a la mejor acumulación de recompensas.

Si desea obtener más conocimientos técnicos, la mayoría de los sistemas RL utilizan redes Q profundas que utilizan una variante de la ecuación de Bellman o una forma de gradientes de políticas.

Inteligencia ArtificialJuegosProgramaciónvideojuegos

Related Content

¿Es realista escribir un programa de reconocimiento facial con aprendizaje profundo en 3 meses sin conocimiento previo sobre redes neuronales y demás?

Si muero mañana, ¿es posible crear una IA usando mi huella digital para seguir publicando en Facebook, Quora y Reddit?

Lo cual es más fácil de lograr; ¿Inteligencia artificial, acabar con el envejecimiento o las interfaces cerebro-computadora?

¿Cuál debería ser el tamaño apropiado de los datos de entrenamiento mientras se entrena una red neuronal?

¿Debería la gente volverse vegana para convencer a los robots de que no maten humanos?

¿Cómo comenzar con la IA y el aprendizaje automático? ¿Qué cursos debo tomar?

¿Cómo utilizarán los gobiernos la IA contra otros países?

More Interesting

¿Qué es el lenguaje de programación robótico?

Aprendizaje automático: ¿cómo funciona la búsqueda de cuadrícula?

¿Las inteligencias artificiales tendrán sentido del humor?

¿Podría un dispositivo de IA hacer preguntas realmente interesantes y significativas sobre Quora para aumentar el interés de las personas en un tema?

Cómo entrar en robótica y / o aprendizaje automático

¿Tendría una inteligencia artificial miedo a la muerte?

¿Leer e interpretar los contenidos del cerebro humano es potencialmente un problema de NP?

¿Por qué Facebook no compró DeepMind? ¿Cuánto habrían estado dispuestos a pagar? ¿Para qué habría usado Facebook DeepMind?

¿Puedo tener éxito en una maestría en IA / ML si no soy un gran programador?

¿Cuáles son los colegios y universidades más interesados en el campo de la inteligencia artificial?

¿Por qué la comunidad de IA, incluso las principales empresas líderes, cree en la inteligencia artificial por el cerebro / neurociencia?

¿Cómo elegir la red neuronal para proyectos? ¿Qué red neuronal debo usar para detectar el equipaje abandonado usando el aprendizaje autodidacta?

¿Hay alguna diferencia entre redes neuronales y redes neuronales convolucionales?

¿Los límites de tiempo más largos favorecen a los humanos o las computadoras en una partida Go?

¿Cuál es el estado del arte en la "audición" de robots?

Web Analytics