¿El aprendizaje por refuerzo está recibiendo actualmente más atención que los algoritmos genéticos?

Bueno, sí, pero no son directamente comparables.

El aprendizaje por refuerzo (RL) es una familia de problemas en el aprendizaje automático (ML).

Algoritmos genéticos (GA) es una clase de metaheurística.

Las metaheurísticas son algoritmos de optimización que se pueden usar para resolver diferentes tipos de problemas, incluidos los problemas en el aprendizaje por refuerzo.

Entonces, ¿por qué RL está recibiendo más atención que los GA?

Debido a la increíble exageración que rodea a ML, y especialmente al aprendizaje profundo, en años posteriores, todos han centrado su energía en técnicas relativamente nuevas, como el aprendizaje profundo de Q.

Muchas personas parecen haber olvidado que los algoritmos de autoaprendizaje han existido durante bastante tiempo. No es que las metaheurísticas no sean relevantes para los problemas actuales. Simplemente no están de moda en este momento.

De hecho, utilicé GA para resolver un problema de RL en mi tesis de maestría y demostré que podían lograr un rendimiento de vanguardia en un dominio de problemas complicado en la era de los grandes datos.

Sí lo es.

Los algoritmos genéticos tienen ventajas. Pero lo que es más importante es que tienden a converger en óptimas locales, no en óptimas globales . Una de las razones es que este método optimiza la función de política directamente; eso no siempre es bueno (es una propiedad específica de la tarea).

Una solución más general puede proponer un método RL llamado Q-Learning (y hay muchos otros métodos basados ​​en RL).

Fuente de la imagen -> Lec1-intro-mdps-exacto-métodos.pdf

Otra razón es, por supuesto, la posibilidad de utilizar redes neuronales en algoritmos de aprendizaje por refuerzo.

Más información puede encontrar aquí -> Deep RL Bootcamp, Deep RL Berkley

¿Mas atencion? Si. Pero cada uno tiene un hogar en los casos de uso del planeta. ML ha seguido el camino del aprendizaje profundo, pero para mí todo es solo matemática inspirada en la biología.

Me gustan los GA, son realmente geniales. Definitivamente puedes usarlos para muchas cosas heurísticas. Además, no tiene el misticismo que tienen los NNets.

Depende del campo. El aprendizaje profundo recibe mucha prensa como resultado de que las compañías tecnológicas hagan su propia publicidad. Los algoritmos genéticos se usan con bastante frecuencia en la investigación de optimización, que no es un enfoque de las compañías tecnológicas (pero sí para la NASA y otras organizaciones de ingeniería).