Si planeo obtener un doctorado en aprendizaje de refuerzo teórico, ¿qué profesores y universidades debería considerar?

Para doctorado específicamente en aprendizaje teórico de refuerzo:

Universidad de Alberta, Ciencias de la Computación :
– Richard S. Sutton (¿Necesito presentarlo?)
– Mike Bowling (Asegúrate de que esté disponible, ya está abrumado con demasiados maestros y doctores que ya están bajo él)
– Csaba Szepesvari (si trabajas en el aprendizaje en línea, sabrás quién es él) – cosas teóricas, no hay problema

Con la presencia de estas 3 grandes facultades allí, no creo que haya otro lugar para hacer el aprendizaje de refuerzo teórico. La última vez que asistí a la reunión, Rich estaba trabajando en un algoritmo RL muy crucial. También vea sus documentos recientes de GTD.

Otros lugares:
MIT CSAIL (Leslie Kaelbling):
Aunque la última vez que lo verifiqué, estaba más interesada en otras cosas (como la robótica) y no solo se centró en el RL teórico (aunque uno de los profesores más famosos en RL)

UMass Amherst (Sridhar Mahadevan y Andy (Andrew) Barto se retiraron):
Sridhar se enfoca en muchas áreas, incluidas múltiples, etc. Vea sus diapositivas más recientes sobre el aprendizaje basado en el equilibrio.

Actualización: ¿Cómo puedo ser tan descuidado que no mencioné a Ronald Parr?
Universidad de Duke, Informática:
Ronald Parr – No sé en qué está trabajando actualmente. Leí varios de sus trabajos durante mi licenciatura (eso es en 2010) y durante mi pasantía. Había escrito algunos documentos muy bonitos sobre aproximación de funciones de valor, en RL.

Estos son los que podría sacar de mi cabeza ahora mismo. Pero si RL es su enfoque clave, definitivamente debería considerar la Universidad de Alberta.

Aprendizaje automáticoAprendizaje por refuerzoConsejo universitarioPregunta personal

Related Content

¿De qué maneras alguien puede obtener ingresos del aprendizaje automático (trabajo por cuenta propia)?

¿Quién es el mejor científico de aprendizaje automático del mundo?

¿Tiene sentido usar la selección de características antes de Random Forest?

¿Qué tan difícil es aprender TensorFlow?

Como estudiante que realiza un curso de algoritmos de aprendizaje automático, ¿en qué debe centrarse el objetivo principal para maximizar el conocimiento aplicable al final del semestre?

¿Cómo calcula Google los sinónimos de los términos en una consulta de búsqueda?

Cómo desarrollar una aplicación que reproduzca música de acuerdo a tu estado de ánimo

Además de la respuesta de Sanjeev, los siguientes profesores son de EE / OR y trabajan más en fundamentos teóricos en RL.

MIT: John Tsitsiklis, Dmitri Bertsekas

Stanford: Benjamin Van Roy

Berkeley: Pieter Abbeel

Estos profesores trabajan en aspectos extremadamente matemáticos de RL esenciales para extender la base de RL. También son extremadamente mayores y podrían tener bastantes estudiantes debajo de ellos.

Sanjeev Sharma

More Interesting

¿Cuántos idiomas hay para las redes neuronales?

Cómo optimizar una red neuronal convolucional para hacer una clasificación de imágenes

¿Cuáles son algunos ejemplos de aprendizaje automático en operaciones de computación en la nube?

¿Es posible cambiar a un doctorado en aprendizaje automático después de un MPhil en econometría?

¿Vale la pena dejar mi trabajo de desarrollador de software de USD $ 150K para estudiar el aprendizaje automático y el aprendizaje profundo?

¿La normalización por lotes ha vuelto obsoleta la inicialización de Xavier al entrenar redes neuronales?

Si el aprendizaje automático está de moda en este momento, ¿qué crees que seguirá?

Cómo optimizar las consultas SPARQL

¿Cuál debería ser el plan adecuado para aprender el aprendizaje automático desde cero para un estudiante del tercer semestre?

¿Cómo funciona el refuerzo con los algoritmos de clasificación del árbol de decisión?

En reconocimiento facial, ¿son las huellas faciales y los vectores de características lo mismo? Si no, ¿en qué se diferencian?

¿Crees que la tecnología 'block chain' es la próxima gran novedad en informática?

¿Cómo podría el posmodernismo cambiar el aprendizaje automático?

¿Debo ir por TensorFlow o PyTorch?

¿Cómo escribirías un programa de aprendizaje automático desde cero?

Web Analytics