Esperar lo ? Eso no es correcto. El aprendizaje por refuerzo ha sido popular y en la cobertura de los medios, ya que ha estado resolviendo diferentes problemas. También el aprendizaje por refuerzo estaba usando redes neuronales poco profundas antes de que fueran geniales. Déjame darte unos ejemplos:
TD-Gammon – Wikipedia
Helicóptero autónomo: Laboratorio de IA de la Universidad de Stanford en el que Andrew Ng trabajó mientras estaba en Stanford.
- ¿Por qué las arquitecturas profundas aprenden representaciones de características cada vez más altas?
- ¿Cómo se implementa una red neuronal convolucional (CNN) con la estructura de un árbol binario en TensorFlow?
- ¿Quién es la estrella en ascenso de la IA fuera del aprendizaje profundo?
- ¿Por qué la búsqueda de imágenes de Google es tan rápida?
- ¿Puedo usar el aprendizaje profundo o ANN para un problema de agrupación como KNN?
Hecho psicológico:
Preferencia de tiempo: el descuento temporal de Wikipedia es la razón por la que vemos la hora actual como más especial. Eso es lo que está sucediendo aquí también (también que nada se ha comercializado tan bien como AlphaGo). Debe escuchar a un veterano que ha estado presente todo este tiempo (como Rich Sutton en este campo) para comprender que los logros se extienden a lo largo del tiempo.