[Esta es una vista del problema de un nivel mucho más alto que la otra respuesta. Me refiero específicamente a “modelos de aprendizaje para cualquier tarea”]
La forma en que lo ha enmarcado (demostraciones de cosas) hace que parezca que está tratando de hacer un aprendizaje de refuerzo o imitación (tratando de imitar un camino o una función de costo desconocida). Eche un vistazo a cosas como el aprendizaje de políticas si eso es lo que realmente está tratando de hacer. Para un documento inicial sobre este campo ENORME, vea aquí, que describe cómo obtener brazos de robot para aprender a hacer cosas:
http://wwwiaim.ira.uka.de/users/…
Debo señalar que aprender de la demostración es muy diferente a la planificación de rutas, ya que generalmente [agitando las manos] intenta construir una función (generalmente no lineal) para minimizar el costo entre su propio resultado y una demostración dada. Así es como los robots “aprenden” a hacer cosas como jugar ping-pong o voltear panqueques. Por lo general, esto no implica obstáculos por decir, como lo has enmarcado. Aquí hay otro ejemplo de imitación de aprendizaje para aprender a conducir automóviles de manera autónoma:
- ¿Qué conocimiento básico se debe tener antes de aprender el aprendizaje automático en India?
- Si creamos un robot que solo puede ver átomos individuales, ¿qué vería un robot así si mirara a una habitación llena de gente?
- ¿Cuáles son las mejores formas de comenzar a implementar una red neuronal?
- Cómo aprender IA en India después del 12
- ¿La red de Google realmente se enseñó a reconocer gatos en un mar de imágenes aleatorias?
https://www.ri.cmu.edu/pub_files…
Además, para una sugerencia súper exagerada, podría hacer algo como LEARCH (http://www.ri.cmu.edu/pub_files/…) para aprender a construir mapas de costos para problemas cambiantes. Esto realmente se ajusta mejor a su ejemplo dado.