Por favor, por favor, si quieres aprender sobre el aprendizaje por refuerzo, aprende directamente de la boca del caballo leyendo ” Aprendizaje por refuerzo: una introducción ” de Sutton & Barto. Tome el libro, léalo atentamente, haga los ejercicios lo mejor que pueda. Lave, enjuague, repita, hasta que se sienta cómodo y comprenda todo el concepto y sepa cómo aplicarlo. Tragar pedazos del tamaño de un bocado, alimentados con cuchara, de video-cursos o sitios en línea simplemente no lo hará.
El aprendizaje de refuerzo, ya sea “profundo” o “superficial”, o “amplio”, o “asíncrono” o lo que sea, es un concepto muy importante que no juega el (por ahora bastante popular y conocido) “descenso de gradiente” reglas (enseñadas en tantos cursos en línea y oh, tantos libros como el de Bengio y Courville) pero por las reglas menos conocidas de “Estadísticas Bayesianas”.
El libro de Sutton & Barto no le enseñará todo lo que necesita saber sobre los métodos bayesianos, pero le permitirá notar (e incluso decirle) cuando le faltan conocimientos. Entonces, cuando descubres que estás “perdido en el bosque”, por así decirlo, mientras sigues a Sutton & Barto, es hora de detenerte y aprender (o, al menos, repasar) la teoría y los métodos bayesianos. Hay varios libros e incluso cursos en línea para elegir, pero particularmente me gusta ” Un primer curso en métodos estadísticos bayesianos ” de Hoff.
- ¿Es posible que las máquinas de vectores de soporte sean el algoritmo más apto para problemas de clasificación binaria dada la forma en que puede ajustar curvas alrededor del conjunto de datos?
- ¿Sería útil para un estudiante de CS estudiar Señales y Sistemas, así como el Procesamiento de Señal Digital?
- ¿Qué parte común de un compilador se presta más para ser optimizado por un algoritmo de aprendizaje automático?
- ¿Cuál es el mejor enfoque para una tarea de aprendizaje automático?
- ¿Cuál es la mejor configuración de hardware para entrenar frameworks de aprendizaje profundo como Caffe, Theano y Tensorflow?
Entonces, y solo entonces, puedes abordar el resto de la investigación y los métodos de Deep Mind.