Si planeo obtener un doctorado en aprendizaje de refuerzo teórico, ¿qué profesores y universidades debería considerar?

Para doctorado específicamente en aprendizaje teórico de refuerzo:

Universidad de Alberta, Ciencias de la Computación :
– Richard S. Sutton (¿Necesito presentarlo?)
– Mike Bowling (Asegúrate de que esté disponible, ya está abrumado con demasiados maestros y doctores que ya están bajo él)
– Csaba Szepesvari (si trabajas en el aprendizaje en línea, sabrás quién es él) – cosas teóricas, no hay problema

Con la presencia de estas 3 grandes facultades allí, no creo que haya otro lugar para hacer el aprendizaje de refuerzo teórico. La última vez que asistí a la reunión, Rich estaba trabajando en un algoritmo RL muy crucial. También vea sus documentos recientes de GTD.

Otros lugares:
MIT CSAIL (Leslie Kaelbling):
Aunque la última vez que lo verifiqué, estaba más interesada en otras cosas (como la robótica) y no solo se centró en el RL teórico (aunque uno de los profesores más famosos en RL)

UMass Amherst (Sridhar Mahadevan y Andy (Andrew) Barto se retiraron):
Sridhar se enfoca en muchas áreas, incluidas múltiples, etc. Vea sus diapositivas más recientes sobre el aprendizaje basado en el equilibrio.

Actualización: ¿Cómo puedo ser tan descuidado que no mencioné a Ronald Parr?
Universidad de Duke, Informática:
Ronald Parr – No sé en qué está trabajando actualmente. Leí varios de sus trabajos durante mi licenciatura (eso es en 2010) y durante mi pasantía. Había escrito algunos documentos muy bonitos sobre aproximación de funciones de valor, en RL.

Estos son los que podría sacar de mi cabeza ahora mismo. Pero si RL es su enfoque clave, definitivamente debería considerar la Universidad de Alberta.

Además de la respuesta de Sanjeev, los siguientes profesores son de EE / OR y trabajan más en fundamentos teóricos en RL.

MIT: John Tsitsiklis, Dmitri Bertsekas

Stanford: Benjamin Van Roy

Berkeley: Pieter Abbeel

Estos profesores trabajan en aspectos extremadamente matemáticos de RL esenciales para extender la base de RL. También son extremadamente mayores y podrían tener bastantes estudiantes debajo de ellos.