¿Por qué el aprendizaje por refuerzo no era popular antes de que el aprendizaje profundo apareciera en escena?

Esperar lo ? Eso no es correcto. El aprendizaje por refuerzo ha sido popular y en la cobertura de los medios, ya que ha estado resolviendo diferentes problemas. También el aprendizaje por refuerzo estaba usando redes neuronales poco profundas antes de que fueran geniales. Déjame darte unos ejemplos:

TD-Gammon – Wikipedia

Helicóptero autónomo: Laboratorio de IA de la Universidad de Stanford en el que Andrew Ng trabajó mientras estaba en Stanford.

Hecho psicológico:

Preferencia de tiempo: el descuento temporal de Wikipedia es la razón por la que vemos la hora actual como más especial. Eso es lo que está sucediendo aquí también (también que nada se ha comercializado tan bien como AlphaGo). Debe escuchar a un veterano que ha estado presente todo este tiempo (como Rich Sutton en este campo) para comprender que los logros se extienden a lo largo del tiempo.

Aprendizaje automáticoAprendizaje por refuerzoAprendizaje profundoInteligencia Artificial

Related Content

¿Cuáles son las principales diferencias entre econometría y aprendizaje automático?

¿Qué métricas debo usar en mi investigación de preprocesamiento de datos (no estructurada)?

¿Cuáles son algunos de los temas candentes que se están investigando actualmente en la escucha de máquinas / procesamiento de audio?

¿Cuáles son los prerrequisitos matemáticos para estudiar el aprendizaje automático?

¿Ha publicado Factual.com algún trabajo de investigación (o algún asunto técnico importante) sobre las técnicas de aprendizaje automático que utilizan para rastrear y extraer de la web?

¿Crees que los robots puedan convertirse en enemigos de la humanidad?

¿Por qué los tamaños de mini lotes grandes afectan negativamente la precisión de la validación?

Escribir algoritmos que se aproximen a políticas óptimas es bastante difícil. Sin embargo, tener una función que actúa como una política se aproxima a través de la retroalimentación entre entrada-salida a través de una simple diferenciación que le permite abordar una variedad de problemas con mucha más facilidad, que es lo que hace el aprendizaje profundo. Se ha vuelto más popular porque mucha más gente tiene las habilidades para hacerlo en primer lugar.

Muktabh Mayank

More Interesting

¿Existe algún hardware especializado para algoritmos de aprendizaje profundo?

¿Son las preguntas el verdadero punto de partida del análisis de Big Data?

¿Es C ++ un buen lenguaje para el aprendizaje automático?

¿Cuáles son algunas posibles aplicaciones interesantes del aprendizaje automático?

¿Cuál es la forma mejor y más simple de agrupar productos por sus nombres?

¿Por qué los LSTM generalmente se entrenan con backprop y no con EKF?

De estos cursos, ¿cuál debería tomar más si quiero investigar en reconocimiento de patrones o visión por computadora?

¿Por qué las tasas de aceptación de las conferencias de minería de datos son tan bajas y qué tipo de documentos se rechazan?

En Data Science, ¿cuáles son algunos proyectos específicos de la industria del juego?

¿Está bien usar kNN para este problema de clasificación de símbolos musicales?

¿Cuáles son las principales diferencias entre la regresión logística, la red neuronal y las SVM?

¿Cómo es trabajar en el equipo de Machine learning / Data Mining?

¿Qué algoritmos de optimización son buenos candidatos para la paralelización con MapReduce?

¿Cuál es el beneficio de usar la función softmax en la última capa de DNN? ¿Cuál es la relación entre la entropía cruzada y las funciones de pérdida?

¿Cómo es posible optimizar un sistema donde el entorno se modela a través de métodos de aprendizaje automático?

Web Analytics