¿Qué universidades de la India son buenas para realizar investigaciones en el aprendizaje por refuerzo?

No estoy seguro de si esto cambiará en el futuro, pero a partir de ahora, ¡realmente no hay ninguno! De hecho, hay muy pocos laboratorios en el mundo que están haciendo investigación de RL que realmente importa y está impulsando el campo hacia adelante. Creo que puedo decir esto con certeza: he estado interesado en RL desde mi 5to semestre de pregrado (enero de 2009 en adelante), hice mi pasante de pregrado en el Laboratorio de aprendizaje autónomo, mi tesis de pregrado B. Tech (en IIT Roorkee) estaba en RL, he realizado una investigación intensiva en RL + Convex Optimization for Motion Planning, he trabajado de forma remota con un profesor en EE. UU. Que trabaja en RL y Transfer Learning (2011 – 2013) y tengo un trabajo con él, y mi Supervisor de tesis de maestría fue El propio Richard S. Sutton y, además, soy indio (y de IIT si eso es importante). Conozco la situación en India. Realmente ninguno!

Si está interesado en la investigación de RL, ¡vaya al extranjero!

¡Buena suerte!

More Interesting

¿Cuáles son las suposiciones hechas por los modelos ocultos de Markov?

¿Cuáles son algunos de los desafíos y oportunidades sobresalientes en el análisis predictivo con respecto a la privacidad y la propiedad de los datos, el análisis de los datos del usuario, el escalado de algoritmos y los ecosistemas e intercambios de datos emergentes?

¿Qué son las redes amplias?

¿Cuál es el mejor artículo para entender cómo se mapea el vector de salida de RNN con un vocabulario para predecir la secuencia?

Dada una red de aprendizaje profundo, ¿se puede entrenar para enseñar (por ejemplo, resolviendo la secuencia óptima de ejemplos o lo que sea) otra red? Si es así, ¿se puede resolver este problema (enseñanza) utilizando técnicas de aprendizaje profundo?

¿Cómo se pueden engañar los modelos de clasificación existentes?

¿Debo usar bibliotecas de python como Scikit-learn para ML que tienen algoritmos estándar implementados (considerando que soy un novato en el aprendizaje automático)?

¿Puede el desarrollador de hadoop aprender el aprendizaje automático?

¿Por qué debería obtener el doble de RAM que la memoria total de mi GPU para construir una plataforma de aprendizaje profundo?

¿Cómo debo implementar la detección de fraude con tarjeta de crédito usando redes neuronales?

¿Por qué las celdas LSTM tienen dos puertas de escritura?

Cómo usar el método probabilístico para probar el problema de Ramsey multicolor

¿Cuáles son algunos problemas de aprendizaje automático que están más allá del poder de scikit-learn para resolver?

¿Cuáles son las ventajas de aprender el aprendizaje automático desde el punto de vista profesional?

¿Se pueden identificar las características que resultan del proceso de aprendizaje de CNN, o se puede diseñar e incrustar una cantidad de características bien definidas en una CNN?