¿Existen aplicaciones para bandidos multi armados en el campo de aprendizaje profundo?

Existe una aparente aplicación de metaoptimización , en la que utiliza un proceso de optimización de bandidos para seleccionar parámetros.

Resulta que esta es una solución bastante elegante para el problema de meta-optimización cuando el costo de ajuste es alto (como lo es en el entrenamiento de una red neuronal), ya que el proceso de bandido requiere solo una observación parcial, lo que puede reducir la carga computacional considerablemente.

En la medida en que estos parámetros sean discretos (digamos, seleccionando entre diseños de la red), los algoritmos tradicionales de bandidos son fáciles de aplicar. Los bandidos armados infinitos o continuos son un poco más complicados, para parámetros que son continuos.

Además, es casi seguro lo contrario de su pregunta: aplicaciones de aprendizaje profundo en el campo de los bandidos . Me gusta pensar que el modelado y el muestreo son procesos en gran medida distintos en el trabajo de bandidos; específicamente, tiene un desafío de modelado para representar el mundo y sus incertidumbres como las conoce actualmente, y luego un desafío de muestreo para decidir qué observar a continuación para explotar mejor y aumentar su comprensión del mundo. Se puede usar una red neuronal para abordar la tarea mod.

Como ejemplo de punto de partida, hay un pequeño hilo de investigación en redes neuronales (p. Ej., [1]) aplicado para tratar el lado de modelado de este desafío en aplicaciones de bandidos y mucho espacio, creo, para extender esto para usar redes profundas y algunas de las herramientas geniales que salen de Google y Facebook hasta la fecha. Aplicaciones específicas dejadas como ejercicio para el lector, por supuesto. 😉

[1] https://scholar.google.ca/schola…

More Interesting

¿Existe alguna medida estadística que demuestre que un clasificador Neural Net con una precisión del 96% en un conjunto de datos de N ejemplos proporcionará una precisión similar en el mundo real?

¿Cuántas imágenes de entrenamiento deberían usarse para una buena tarea de reconocimiento de género en OpenCV? ¿Hay algún conjunto de datos disponible para esta tarea?

¿Puedo usar word2vec para hacer el análisis de co-palabras?

¿Cuáles son las distribuciones bayesianas anteriores y posteriores? ¿Cuáles son sus roles en las redes neuronales?

¿Funciona el aprendizaje profundo si las entradas están en un espacio dimensional relativamente bajo?

¿Es posible determinar cuánto 'aprende' una red neuronal desde un punto de datos dado en el conjunto de entrenamiento?

¿Qué puedo hacer con una base de datos de 800 GB de un sitio de reserva de boletos en línea? (Películas, obras de teatro, algunos eventos deportivos)?

¿Cuáles son algunos de los usos del aprendizaje automático en los motores de búsqueda?

Como todos están aprendiendo el aprendizaje automático y el aprendizaje profundo ahora, ¿debería adoptar un enfoque diferente para centrarme en un área específica, como la programación de gráficos o una más general, como el desarrollo de backend?

¿Debería haber una relación específica entre el número de características y el número de clases? Si tengo 15 funciones pero 50 clases con 1000 datos de entrenamiento, ¿tendré un problema de sobreajuste? ¿Y cuál es la mejor técnica de clasificación para esta relación?

¿Qué opinas sobre la inteligencia artificial? ¿Vale la pena desarrollarla?

¿Existe algún audiolibro 'técnico' realmente bueno para la investigación de operaciones o el aprendizaje automático, aparte del algoritmo maestro?

¿Es obligatoria la experiencia de aprendizaje automático para conseguir un trabajo con Google? ¿Es realmente un tema importante en las universidades?

¿Cuáles son algunos proyectos que puedo hacer mientras aprendo aprendizaje automático?

¿Cuándo debo aprender tensorflow?