Los modelos de tipo IRL se utilizan en modelos dinámicos de elección discreta en econometría estructural y marketing cuantitativo. Asume que los agentes (consumidores, empresas, etc.) juegan racionalmente en un juego (infinitamente) repetido. Esto significa que la necesidad del agente de resolver la ecuación / programa dinámico de Bellman. Luego, observando las elecciones que hacen los agentes en el mundo real, puede deducir las recompensas que llevan a los agentes a jugar como lo hacen en cierto estado. Aquí, un estado puede ser el número de competidores, el tamaño del mercado o el número de ofertas de trabajo (en modelos de búsqueda de empleo).
Para juegos con interacción estratégica entre agentes, el concepto de solución correspondiente es el equilibrio perfecto de Markov. Esto se relaciona con RL multiagente (inverso).
El artículo fundamental para este capítulo de la literatura es Rust (1987).
- Astronomía: ¿Cómo se puede usar el aprendizaje automático para la clasificación de galaxias?
- ¿Qué es el algoritmo de agrupación de Markov?
- ¿Se están realizando estudios actuales que utilicen la minería de datos o el aprendizaje automático en campos científicos?
- ¿Qué tan similares son los problemas en los diversos campos del análisis de datos (aprendizaje automático, estadísticas, procesamiento de señales, optimización, teoría de la información, etc.)?
- ¿Se pueden mezclar variables categóricas y continuas en una red neuronal simple?