¿Cómo se compara la neuroevolución con el aprendizaje por refuerzo? ¿Hay algún problema en el que la neuroevolución resulte en una mejor solución?

Si habla de neuroevolución como en NEAT / HyperNEAT, entonces se ha probado y DRL gana, aunque antes de DQN tenía el récord de Atari. La razón de esto es bastante simple, SGD supera los algoritmos evolutivos en muchos problemas de parámetros donde hay gradientes disponibles (advertencia a continuación).

Sin embargo, si está hablando de la forma moderna de neuroevolución en la que SGD entrena los pesos mientras los algoritmos genéticos ajustan la arquitectura y los hiperparámetros, entonces sí, la neuroevolución ha funcionado muy bien y puede superar muchos modelos hechos a mano (ver documentos recientes).

Ahora, una nota sobre el uso de algoritmos genéticos para entrenar pesas: OpenAI demostró que el uso de algoritmos genéticos como técnica para el cálculo aproximado del gradiente permite el entrenamiento hiperparalelo y, aunque es ~ 10 veces más lento que SGD, la posibilidad paralela puede reducir el tiempo del reloj de pared.

Aprendizaje automáticoAprendizaje por refuerzoInteligencia Artificial

Related Content

¿Cuál es la diferencia entre AI e IoT?

Cómo crear una IA en Python

¿En qué se diferencia un ingeniero de software de aprendizaje automático con más de 3 años de experiencia de un doctorado sin experiencia en ML para resolver problemas a escala de Google? ¿Qué ventajas tiene la persona con experiencia? ¿Qué diferencias en el resultado podemos esperar?

¿Cómo puedo escribir un programa simple de IA en Java?

Cómo crear un bot para escribir noticias automáticamente

Con nuestra tecnología, población y cerebro, ¿por qué no hemos creado algo que combine todo esto para mejorar el mundo o la comprensión?

¿Por qué los diseñadores, desarrolladores y gerentes de Quora otorgaron acceso y poder a los robots de IA?

More Interesting

¿Cómo se usa el aprendizaje automático en las finanzas?

¿Cuál fue la verdadera razón por la que Facebook cerró su IA, que inventó su propio idioma?

¿Cómo se comparan las arquitecturas de aprendizaje profundo?

¿Cómo se puede utilizar el aprendizaje por refuerzo en robótica donde el caso de falla es la destrucción física?

¿Cómo elegir la red neuronal para proyectos? ¿Qué red neuronal debo usar para detectar el equipaje abandonado usando el aprendizaje autodidacta?

¿Cuáles son los factores que limitan la inteligencia artificial en las máquinas?

¿Qué sigue después de IBM Watson?

¿Cómo encontrarán significado los humanos si eventualmente los robots harán casi todo lo que los humanos pueden hacer?

¿Un doctorado en ciencia de datos aumentará mis habilidades de aprendizaje automático?

¿Terminará este 'boom' de programación algún día? ¿La programación algún día será automática?

¿Cuál es la aplicación del aprendizaje automático en contabilidad / auditoría / impuestos y finanzas corporativas?

¿Qué soluciones de monitoreo de redes sociales están utilizando inteligencia artificial? ¿Cuál es el uso futuro de la IA para aumentar el poder de las tecnologías de escucha social?

¿Dónde se empieza a aprender a construir un chatbot / asistente de IA?

¿Qué tan avanzada es la tecnología chatbot de Microsoft?

Quiero aprender IA desde lo básico, ¿qué requisitos previos necesito en términos de lenguajes de programación?

Web Analytics