¿Cuáles son algunos avances recientes en la teoría de juegos?

De acuerdo con la respuesta de Alex Teytelboym de que el teorema popular de monitoreo privado de Takuo Sugaya es probablemente el desarrollo reciente más destacado.

Otro avance teórico reciente es la respuesta de Yehuda Levy a la cuestión de la existencia del equilibrio estacionario en los juegos estocásticos, algo que durante mucho tiempo se dio por sentado en las aplicaciones (por ejemplo, en economía). Considere un juego con un espacio de estado que es un conjunto Borel. Hay un número finito de jugadores y un número finito de acciones para cada jugador. Las funciones de pago por etapas y las probabilidades de transición a nuevos estados son funciones medibles del estado actual y el perfil de acción; las funciones de pago de la etapa están limitadas. Los jugadores maximizan la suma de descuento de los pagos de la etapa. Hay información perfecta. ¿Existe necesariamente un equilibrio en las estrategias (medibles), donde la acción de cada jugador depende solo del estado actual y no del historial anterior?

Sorprendentemente, la respuesta es no. El papel de Levy da dos contraejemplos elegantes. Este artículo fue publicado en Econometrica a principios de este año. Para una versión sin compilar, vea:

http://ratio.huji.ac.il/sites/de…

O para un breve resumen:

Un juego estocástico sin un equilibrio estacionario con descuento

EconomíaInvestigación en ciencias de la computaciónTeoría de juegos

¿Cuáles son los algoritmos de inferencia de tipos más comunes en uso hoy en día?

¿Cuáles son algunos de los documentos fundamentales en el diseño del lenguaje de programación?

¿Qué podría ser un posible Ph.D. tema de investigación en el campo de la compresión de video?

¿Cómo es la práctica en CERN Openlabs?

¿Se realiza más investigación de CS en la academia o la industria?

¿Cómo se maneja el equilibrio entre aplicabilidad e interés en la investigación de CS?

William Press y Freeman Dyson,
El dilema del prisionero iterado contiene estrategias que dominan a cualquier oponente evolutivo, Proceedings of the Nat’l Acad. Sci, 26 de junio de 2012

Aquí hay un breve resumen de los resultados (escritos por AJStuart y JBPlotkin), publicados justo antes del documento en sí
Extorsión y cooperación en el dilema del prisionero.

Para citar del esquema :
… Al exponer estos resultados, Press y Dyson han cambiado fundamentalmente el punto de vista sobre el Dilema del Prisionero, abriendo una gama de nuevas posibilidades para el estudio de la cooperación.

Primero, demuestran que cualquier estrategia de “memoria larga” es equivalente a alguna estrategia de “memoria corta”, desde la perspectiva de un jugador de memoria corta. Esto significa que un oponente que decide su próximo movimiento analizando una larga secuencia de encuentros pasados también podría jugar una estrategia mucho más simple que considera solo el encuentro inmediatamente anterior, cuando juega contra un jugador con poca memoria. Por lo tanto, los posibles resultados de la DPI pueden entenderse analizando estrategias que recuerden solo la ronda anterior.

(Y esto es solo el comienzo)

Andy Skrzypacz

Una contribución reciente sobresaliente fue hecha por Takuo Sugaya de Stanford.
Él demostró que el teorema del folk (teoría del juego) se mantiene en juegos repetidos con monitoreo privado . Los teóricos de los juegos han llamado a este problema “una de las preguntas abiertas más conocidas en teoría económica”.

Este resultado dice que cualquier pago individualmente racional y factible puede mantenerse en un equilibrio (secuencial) incluso si los agentes solo reciben señales privadas sobre las acciones de los demás. ¡Realmente no es obvio cómo los jugadores pueden castigar con éxito a los desviados en este caso!

Sabemos que el teorema popular se mantuvo bajo una supervisión pública perfecta e imperfecta durante más de veinte años y este resultado es un gran paso adelante.
El documento en sí [1] es muy técnico y utiliza varios métodos aparentemente no relacionados para demostrar su resultado principal.

Takuo recibió el Premio Aliprantis de la Sociedad para el Avance de la Teoría Económica por su trabajo y presentó el documento en la reunión de SAET en París este año.

PD: ¡descubrí este resultado mientras enseñaba un curso de teoría de juegos de pregrado el año académico pasado y en realidad tuve que cambiar mis notas! ..

[1] Papel en sí: Google Drive Viewer.

Andy Skrzypacz

More Interesting

¿Cómo puedo buscar solo documentos de transacciones IEEE?

¿Se necesita conocer la arquitectura de la computadora para comenzar a aprender los sistemas operativos?

¿Se puede resolver el problema de 3SUM en tiempo subcuadrático?

¿Qué universidades contienen los departamentos de informática más prácticos?

¿Qué campo de la informática se ocupa de los lenguajes humanos?

¿Qué tipo de servicio de limpieza necesitas?

Cómo encontrar un tema de investigación en informática adecuado para estudiantes universitarios

¿Va en contra de las leyes de copyright si leo un trabajo de investigación y yo mismo codifico el algoritmo propuesto en el trabajo?

Soy un estudiante de pregrado de CS de primer año que quiere entrar en investigación, ¿qué hago?