Yo diría que la mejor intersección de las dos disciplinas es el aprendizaje óptimo de control / refuerzo … en muchos sentidos, estos son muy similares. El control óptimo se aborda desde el lado de la teoría del control y el aprendizaje por refuerzo del aprendizaje automático / IA. La idea es que defina alguna métrica de rendimiento (función de costo para OC o señal de recompensa para RL) … luego actualice gradualmente sus controles para minimizar el costo total / maximizar la recompensa total.
Hace un par de años comencé a interesarme por lo mismo y me llevó un tiempo encontrar los mejores recursos (en curso) … pero al final volví a la escuela …
Aquí hay algunos recursos … Comenzaría con el aprendizaje por refuerzo
- ¿Qué pueden hacer los profesionales y los dueños de negocios ahora para prepararse para los avances tecnológicos disruptivos de la inteligencia artificial?
- ¿Es técnicamente posible que me siente en un sofá fijo (sofá) durante tres días y tenga unas buenas vacaciones viajando a Francia y solo pague $ 99.99?
- ¿Dónde puedo leer estudios y documentos sobre inteligencia artificial?
- ¿Qué aspectos del aprendizaje automático son en realidad desarrollos recientes?
- ¿Cuáles son los límites computacionales de una computadora?
- Aprendizaje de refuerzo – Sutton, Barto
- bueno para entender lo básico
- descubrirá rápidamente que el enfoque CS para RL no siempre se extiende a los controles
- Encuesta de aprendizaje por refuerzo para robótica (buena descripción general)
- RL basado en trayectoria (mejor para robótica)
- Gradientes de políticas
- Mejora de políticas con integrales de ruta
- Curso de robótica no entretenida sobre EdX / MIT OCW
- Aprendizaje profundo + control óptimo: Sergey Levine y laboratorio de aprendizaje de robótica en Berkeley
O … también puede mirar NeuroEvolution / Neuro control.