¿El aprendizaje por refuerzo está recibiendo actualmente más atención que los algoritmos genéticos?

Bueno, sí, pero no son directamente comparables.

El aprendizaje por refuerzo (RL) es una familia de problemas en el aprendizaje automático (ML).

Algoritmos genéticos (GA) es una clase de metaheurística.

¿Alguien puede aprender programación, algoritmos y estructuras de datos en tres meses y obtener el bronce en la Olimpiada Británica de Informática?
¿Qué es mejor: una lista enlazada de codificación o el uso de libs de plantillas estándar?
¿Qué algoritmo es usado por la función Java () de la búsqueda de subcadenas?
¿Cuáles son algunas implementaciones reales de algoritmos altamente utilizados o patrones de diseño que ha utilizado en el desarrollo web front-end?
¿Cuál es el peor tipo de error que enfrenta un programador?

Las metaheurísticas son algoritmos de optimización que se pueden usar para resolver diferentes tipos de problemas, incluidos los problemas en el aprendizaje por refuerzo.

Entonces, ¿por qué RL está recibiendo más atención que los GA?

Debido a la increíble exageración que rodea a ML, y especialmente al aprendizaje profundo, en años posteriores, todos han centrado su energía en técnicas relativamente nuevas, como el aprendizaje profundo de Q.

Muchas personas parecen haber olvidado que los algoritmos de autoaprendizaje han existido durante bastante tiempo. No es que las metaheurísticas no sean relevantes para los problemas actuales. Simplemente no están de moda en este momento.

De hecho, utilicé GA para resolver un problema de RL en mi tesis de maestría y demostré que podían lograr un rendimiento de vanguardia en un dominio de problemas complicado en la era de los grandes datos.

AlgoritmosAlgoritmos genéticosAprendizaje automáticoAprendizaje por refuerzoInteligencia Artificial

¿Cuáles son las desventajas del algoritmo genético?

¿Qué vas a aprender y en qué proyecto vas a trabajar este verano como principiante en programación?

Para una computadora, ¿qué tan aleatorio es ser aleatorio?

¿Alguien puede enviar el código para la búsqueda binaria en cadenas con clasificación en C ++?

¿Cómo y dónde recopilar datos estadísticos sobre el comercio algorítmico?

¿Los expertos de ML de primer nivel crean su propio algoritmo de ML o utilizan bibliotecas de Python o módulos R?

Sí lo es.

Los algoritmos genéticos tienen ventajas. Pero lo que es más importante es que tienden a converger en óptimas locales, no en óptimas globales . Una de las razones es que este método optimiza la función de política directamente; eso no siempre es bueno (es una propiedad específica de la tarea).

Una solución más general puede proponer un método RL llamado Q-Learning (y hay muchos otros métodos basados en RL).

Fuente de la imagen -> Lec1-intro-mdps-exacto-métodos.pdf

Otra razón es, por supuesto, la posibilidad de utilizar redes neuronales en algoritmos de aprendizaje por refuerzo.

Más información puede encontrar aquí -> Deep RL Bootcamp, Deep RL Berkley

Håkon Hapnes Strand

¿Mas atencion? Si. Pero cada uno tiene un hogar en los casos de uso del planeta. ML ha seguido el camino del aprendizaje profundo, pero para mí todo es solo matemática inspirada en la biología.

Me gustan los GA, son realmente geniales. Definitivamente puedes usarlos para muchas cosas heurísticas. Además, no tiene el misticismo que tienen los NNets.

Håkon Hapnes Strand

Depende del campo. El aprendizaje profundo recibe mucha prensa como resultado de que las compañías tecnológicas hagan su propia publicidad. Los algoritmos genéticos se usan con bastante frecuencia en la investigación de optimización, que no es un enfoque de las compañías tecnológicas (pero sí para la NASA y otras organizaciones de ingeniería).

Colleen Farrelly

More Interesting

¿Cuáles son las aplicaciones prácticas de los diversos algoritmos que estudian los estudiantes de CS en Data Structures?

¿Hay un árbol que pueda agregar y eliminar nodos más rápido que AVL?

¿Por qué la notación O grande es más común si la notación theta grande nos da más información?

Quiero aprender más sobre algoritmos, pero no sé por dónde empezar. ¿Me puede dar algunas instrucciones o consejos? Gracias.

¿Cuáles son algunas aplicaciones prácticas de la teoría de la complejidad y la teoría del caos?

¿Cuáles son algunos algoritmos informáticos inspirados en la naturaleza?

¿Cómo se ve el algoritmo del juego Plague?

¿Cómo podemos generar k enteros aleatorios únicos en el rango [1 ... n] con igual probabilidad?

Cómo elegir un elemento único de una lista dentro de un bucle en R

¿Cuál es el mejor algoritmo para encontrar una ruta más corta a través de todos los puntos de control dados?