¿Puedo usar el aprendizaje por refuerzo para ayudar a las personas a elegir la ruta más barata cuando viajan en avión?

El tipo de algoritmo de ML que debe usar no depende tanto de su problema como de su conjunto de datos.

El aprendizaje de refuerzo es principalmente útil cuando no tiene un conjunto de aprendizaje supervisado pero tiene una señal de refuerzo. Es decir, cuando no tiene un conjunto de entrenamiento con las “respuestas correctas” (“cuando los datos son X, el sistema debe responder Y”), sino que tiene una retroalimentación (eventualmente retrasada) sobre la calidad de algunas respuestas (” los datos eran X, el sistema respondió Y, y eso era malo (pero no te diré cuál habría sido la buena respuesta) “). No sé cómo se puede aplicar eso a la elección de rutas aéreas, pero si de alguna manera su conjunto de datos es así, es posible que desee considerar RL, sí. De lo contrario, como señala el comentarista, algunos algoritmos clásicos de aprendizaje supervisado probablemente funcionen mejor.

Related Content

¿Cuál es la diferencia entre minería de datos, aprendizaje automático y reconocimiento de patrones?

¿Cómo se puede utilizar el aprendizaje automático para construir un sistema de predicción del comportamiento del cliente?

¿Cuáles son algunos paquetes de software populares para modelos gráficos?

Cómo lidiar con un trabajo de investigación cuando contiene muchos materiales de fondo que no has estudiado

¿Qué motor de recomendación / personalización estándar ofrece recomendaciones utilizando tanto el aprendizaje automático como la entrada manual?

¿Dónde está el límite de radios que se pueden colocar / integrar en un teléfono inteligente?

¿Es Cortana de Microsoft una copia flagrante de Siri de Apple?

RL es útil cuando tiene acceso a un simulador del problema. Lo que en su caso significa que puede simular múltiples viajes con diferentes rutas.

Por ejemplo, podría ejecutar un bot eligiendo diferentes alternativas de ruta. La señal de recompensa sería el precio. De esta forma, por prueba y error, su agente podría predecir la ruta más barata.

Si solo considera aeropuertos y saltos, y el gráfico no es demasiado grande, entonces podría abordar el problema como un agente que opera en un estado discreto y en un mundo de acciones discretas.

Sin embargo, es posible que también desee utilizar otra información disponible, como fechas de temporada (como verano, Acción de Gracias o vacaciones de Navidad), compañía aérea, etc. En este caso, es posible que desee utilizar funciones (en lugar de estados) y estimar su función de valor como una aproximación (paramétrica) de las características.

Alexandre Coninx

More Interesting

¿Qué es más beneficioso para la comprensión general de la informática, el procesamiento del lenguaje natural o la teoría de la computación?

¿Cuáles son las revistas científicas mejor calificadas para Machine Learning / Data Science?

¿Cuál es la mejor tarjeta gráfica para tareas de aprendizaje automático / Big Data?

Cómo saber si estoy hecho para el aprendizaje automático y las estadísticas

En el aprendizaje automático, ¿son siempre más datos mejores que mejores algoritmos?

¿Cómo calcula el tema antes en el análisis latente probabilístico?

Necesito trabajar en un pequeño proyecto de análisis de sentimientos. ¿Qué herramienta debo usar para aprender e implementar fácilmente como Python, TensorFlow?

¿Se utilizan algoritmos básicos de CS en el aprendizaje automático?

Conciencia del contexto: ¿Qué es el descubrimiento de noticias anticipatorio?

¿Qué es una explicación intuitiva de lo que significa que un espacio de hipótesis rompa un conjunto de puntos?

¿Cómo se usa el aprendizaje automático en DevOps?

¿Qué significan las redes bayesianas en Machine Learning?

¿Cuál es una forma útil de clasificar los usos de las tecnologías de inteligencia artificial?

¿Qué teoría debería aprender a crear un algoritmo para clasificar los textos automáticamente?

¿Es mejor hacer una competencia de ciencia de datos en Kaggle o crear un algoritmo comercial en Quantopian para encontrar un trabajo en finanzas cuantitativas?

Web Analytics