Existe una aparente aplicación de metaoptimización , en la que utiliza un proceso de optimización de bandidos para seleccionar parámetros.
Resulta que esta es una solución bastante elegante para el problema de meta-optimización cuando el costo de ajuste es alto (como lo es en el entrenamiento de una red neuronal), ya que el proceso de bandido requiere solo una observación parcial, lo que puede reducir la carga computacional considerablemente.
En la medida en que estos parámetros sean discretos (digamos, seleccionando entre diseños de la red), los algoritmos tradicionales de bandidos son fáciles de aplicar. Los bandidos armados infinitos o continuos son un poco más complicados, para parámetros que son continuos.
- ¿Vale la pena el curso sobre aprendizaje automático en Coursera por la Universidad de Stanford?
- ¿Por qué es difícil entrenar un modelo de aprendizaje automático de forma incremental, en tiempo real?
- ¿Cuándo debo coseno similitud? ¿Se puede usar para la agrupación?
- ¿Existe algún programa que pueda ajustar computacionalmente funciones armónicas esféricas en un conjunto de datos?
- Cómo detectar logotipos si están distorsionados
Además, es casi seguro lo contrario de su pregunta: aplicaciones de aprendizaje profundo en el campo de los bandidos . Me gusta pensar que el modelado y el muestreo son procesos en gran medida distintos en el trabajo de bandidos; específicamente, tiene un desafío de modelado para representar el mundo y sus incertidumbres como las conoce actualmente, y luego un desafío de muestreo para decidir qué observar a continuación para explotar mejor y aumentar su comprensión del mundo. Se puede usar una red neuronal para abordar la tarea mod.
Como ejemplo de punto de partida, hay un pequeño hilo de investigación en redes neuronales (p. Ej., [1]) aplicado para tratar el lado de modelado de este desafío en aplicaciones de bandidos y mucho espacio, creo, para extender esto para usar redes profundas y algunas de las herramientas geniales que salen de Google y Facebook hasta la fecha. Aplicaciones específicas dejadas como ejercicio para el lector, por supuesto. 😉
[1] https://scholar.google.ca/schola…