Cómo desarrollar suficiente conocimiento de aprendizaje automático para comprender a fondo los trabajos de investigación que se publican en DeepMind

Por favor, por favor, si quieres aprender sobre el aprendizaje por refuerzo, aprende directamente de la boca del caballo leyendo ” Aprendizaje por refuerzo: una introducción ” de Sutton & Barto. Tome el libro, léalo atentamente, haga los ejercicios lo mejor que pueda. Lave, enjuague, repita, hasta que se sienta cómodo y comprenda todo el concepto y sepa cómo aplicarlo. Tragar pedazos del tamaño de un bocado, alimentados con cuchara, de video-cursos o sitios en línea simplemente no lo hará.

El aprendizaje de refuerzo, ya sea “profundo” o “superficial”, o “amplio”, o “asíncrono” o lo que sea, es un concepto muy importante que no juega el (por ahora bastante popular y conocido) “descenso de gradiente” reglas (enseñadas en tantos cursos en línea y oh, tantos libros como el de Bengio y Courville) pero por las reglas menos conocidas de “Estadísticas Bayesianas”.

El libro de Sutton & Barto no le enseñará todo lo que necesita saber sobre los métodos bayesianos, pero le permitirá notar (e incluso decirle) cuando le faltan conocimientos. Entonces, cuando descubres que estás “perdido en el bosque”, por así decirlo, mientras sigues a Sutton & Barto, es hora de detenerte y aprender (o, al menos, repasar) la teoría y los métodos bayesianos. Hay varios libros e incluso cursos en línea para elegir, pero particularmente me gusta ” Un primer curso en métodos estadísticos bayesianos ” de Hoff.

Entonces, y solo entonces, puedes abordar el resto de la investigación y los métodos de Deep Mind.

Aprendizaje automáticoDocumentos académicosinformáticaInteligencia ArtificialInvestigaciónInvestigación académica

¿Cuál es la mejor técnica de aprendizaje automático para comprender las ganancias?

¿Qué universidades aceptarán un puntaje de 310 en ciencias de la computación?

¿Por qué los estudiantes de informática deben estudiar cursos como cálculo diferencial, único y multivariable en su primer año o más tarde?

Cómo aprender los comandos de Red Hat

¿Cuál es el futuro de la piratería en internet?

¿Cuál es la calidad de los juegos con un procesador de computadora a diferentes niveles de GHZ?

Le recomendaría que lea el Curso de David Silver sobre DRL, las diapositivas y conferencias de Pieter Abbeel y John Schulman sobre el aprendizaje de refuerzo profundo. CS294 en DRL de UC Berkeley (que está disponible en línea) también será útil. Además, asegúrese de leer sus referencias y hacer preguntas a la comunidad de ML sobre qué partes no comprende.

Además, podría ayudarlo aquí, ¿qué parte exactamente no comprende?

También recomendaría encarecidamente CS231n y The Deep Learning Book antes de acercarse a los cursos de Silver (o incluso CS294).

Leo Mauro

De la misma manera que comes un elefante. Un bocado a la vez. Empieza a leer el primer y más interesante documento de mente profunda para ti. Mientras lee si encuentra un término desconocido, por ejemplo, “redes neuronales”, busque ese término en Wikipedia y léalo para comprender lo que significa. Entonces tómate un pequeño descanso. Luego, reanude su lectura comenzando nuevamente desde el principio del documento de DeepMind y pasando el término que acaba de investigar. Repita el proceso para el próximo término desconocido, hasta llegar al final del artículo. Luego lee el siguiente artículo. Eso es practicamente todo.

La mejor de las suertes.

Threeof Us

More Interesting

Cómo mostrar el principio básico detrás de DMA (acceso directo a memoria)

¿Cuál era el tamaño de la memoria de la computadora básica?

¿Cuál es el mínimo local y el mínimo global en aprendizaje automático? ¿Por qué son importantes en el aprendizaje automático?

¿Por qué se invierten los controles y habilitaciones de algunos de los registros de microprocesadores (SAP-1)?

¿Cómo se raspan los datos de las redes WiFi?

¿Cuáles son los 20 mejores juegos de PC que todo jugador hardcore debería jugar?

¿Qué son los invariantes en informática?

¿Cuánto conocimiento de codificación se necesita para llevar a cabo y mejorar los cálculos de DFT (teoría funcional de densidad)?

¿Cómo es tomar COS 487 (Teoría de la Computación) en Princeton?