¿Cuáles son algunas aplicaciones del aprendizaje por refuerzo (o aprendizaje por refuerzo profundo) en finanzas y economía?

El aprendizaje por refuerzo (RL) es un algoritmo de aprendizaje basado en objetivos donde uno tiene que encontrar la acción correcta para cada nuevo estado del entorno. Obtiene una recompensa por cada acción correcta, pero su objetivo es maximizar la recompensa total (lograr el objetivo).

En finanzas, RL se puede utilizar para maximizar los rendimientos de su cartera. Puede considerar el espacio de acción comprar / vender / retener para cada observación del mercado (que es el entorno en este caso). Su recompensa es el dinero ganado en cada tic. Su objetivo final es maximizar el valor total de su cartera.

En economía, una organización gubernamental puede utilizar RL para maximizar el PIB de un país. Su vector de acción puede ser [tasas de interés, tasa de recompra, tasa GST, beneficios otorgados, aranceles, gastos de infraestructura, etc.] Su espacio de acción es aumentar / disminuir / mantener para cada parámetro. El medio ambiente es el estado económico del país y la recompensa es el aumento / disminución del PIB.

Los dos casos de uso mencionados anteriormente son muy difíciles de simular, ya que hay una gran cantidad de parámetros que afectan el PIB y el precio de las acciones. Además, al predecir el precio de las acciones, sus acciones apenas afectan a los mercados (a menos que negocie en grandes cantidades), por lo que es más un problema de bandidos con múltiples brazos que RL.

Patrones de predicción iterativa de las fluctuaciones del mercado de valores.

More Interesting

¿Cómo funcionan las redes de propuestas regionales (RPN)?

¿Cuál es un buen sitio de contestación de preguntas sobre IA y aprendizaje automático aparte de Quora? Los relacionados con Stack Exchange son bastante malos. Las personas están más centradas en los puntos y formatos en lugar de dar una respuesta adecuada.

¿Qué significa el aprendizaje automático?

¿Aprendizaje automático sin historia matemática?

¿Alguien puede responder a estas preguntas relacionadas con la competencia de kaggle?

¿Cuáles son los algoritmos de agrupamiento más populares?

¿Cómo funcionan los vectores de párrafo frente a codificadores automáticos variacionales?

¿Cómo se usa Machine Learning en las diferentes etapas de los sitios web de comercio electrónico (compras en línea)?

¿Es Theano (biblioteca de Python ML) una buena biblioteca si quiero crear una aplicación comercial?

¿Qué valor cree que tiene la selección de funciones en el aprendizaje automático? ¿Cuál crees que mejora más la precisión, la selección de características o la ingeniería de características?

Todos estos algoritmos de aprendizaje automático, ¿cuál es el punto? Parece que la elección del algoritmo de aprendizaje automático, el árbol de decisión, la red neuronal, svm, no es tan importante como la selección de características y el proceso de extracción de características que determina lo que entra, basura en basura, ese tipo de cosas.

¿Qué te emociona del futuro del aprendizaje automático?

¿Cómo podría el aprendizaje automático mejorar la nariz electrónica?

¿Cuáles son las ventajas de usar una representación escasa en el aprendizaje automático, especialmente en los modelos de aprendizaje profundo?

¿El aprendizaje supervisado se usa más?