Bueno, sí, pero no son directamente comparables.
El aprendizaje por refuerzo (RL) es una familia de problemas en el aprendizaje automático (ML).
Algoritmos genéticos (GA) es una clase de metaheurística.
- ¿Alguien puede aprender programación, algoritmos y estructuras de datos en tres meses y obtener el bronce en la Olimpiada Británica de Informática?
- ¿Qué es mejor: una lista enlazada de codificación o el uso de libs de plantillas estándar?
- ¿Qué algoritmo es usado por la función Java () de la búsqueda de subcadenas?
- ¿Cuáles son algunas implementaciones reales de algoritmos altamente utilizados o patrones de diseño que ha utilizado en el desarrollo web front-end?
- ¿Cuál es el peor tipo de error que enfrenta un programador?
Las metaheurísticas son algoritmos de optimización que se pueden usar para resolver diferentes tipos de problemas, incluidos los problemas en el aprendizaje por refuerzo.
Entonces, ¿por qué RL está recibiendo más atención que los GA?
Debido a la increíble exageración que rodea a ML, y especialmente al aprendizaje profundo, en años posteriores, todos han centrado su energía en técnicas relativamente nuevas, como el aprendizaje profundo de Q.
Muchas personas parecen haber olvidado que los algoritmos de autoaprendizaje han existido durante bastante tiempo. No es que las metaheurísticas no sean relevantes para los problemas actuales. Simplemente no están de moda en este momento.
De hecho, utilicé GA para resolver un problema de RL en mi tesis de maestría y demostré que podían lograr un rendimiento de vanguardia en un dominio de problemas complicado en la era de los grandes datos.