Cómo crear e implementar un modelo de aprendizaje en un robot

[Esta es una vista del problema de un nivel mucho más alto que la otra respuesta. Me refiero específicamente a “modelos de aprendizaje para cualquier tarea”]

La forma en que lo ha enmarcado (demostraciones de cosas) hace que parezca que está tratando de hacer un aprendizaje de refuerzo o imitación (tratando de imitar un camino o una función de costo desconocida). Eche un vistazo a cosas como el aprendizaje de políticas si eso es lo que realmente está tratando de hacer. Para un documento inicial sobre este campo ENORME, vea aquí, que describe cómo obtener brazos de robot para aprender a hacer cosas:
http://wwwiaim.ira.uka.de/users/…

Debo señalar que aprender de la demostración es muy diferente a la planificación de rutas, ya que generalmente [agitando las manos] intenta construir una función (generalmente no lineal) para minimizar el costo entre su propio resultado y una demostración dada. Así es como los robots “aprenden” a hacer cosas como jugar ping-pong o voltear panqueques. Por lo general, esto no implica obstáculos por decir, como lo has enmarcado. Aquí hay otro ejemplo de imitación de aprendizaje para aprender a conducir automóviles de manera autónoma:

https://www.ri.cmu.edu/pub_files…

Además, para una sugerencia súper exagerada, podría hacer algo como LEARCH (http://www.ri.cmu.edu/pub_files/…) para aprender a construir mapas de costos para problemas cambiantes. Esto realmente se ajusta mejor a su ejemplo dado.

Comience con entradas y salidas, teniendo en cuenta los objetivos; tus objetivos, no los de un robot.

Entonces, en el ejemplo, desea una búsqueda de ruta autónoma.
Obviamente, necesita un sensor de obstáculos y motores: entradas y salidas básicas.
Un sensor de ubicación puede ser útil, pero innecesario: con el motor paso a paso, puede contar los pasos y determinar la ubicación actual / final en relación con el arranque.

Luego, identifique los subsistemas: el subsistema de salida contiene motores. Su robot no necesita saber acerca de cada paso del motor, puede generar coordenadas o dirección / velocidad, mientras que el subsistema de salida los convierte en pasos del motor.

Hasta ahora todo bien, en su pregunta ya ha comenzado con abstracciones de coordenadas de robot y obstáculos.
Pero el punto es: no comience con abstracciones asumidas.
Las abstracciones que surgen de nuestras suposiciones son malas: es decir, puede encontrar un subsistema para convertir las coordenadas en impulsos paso a paso casi imposibles de encontrar o demasiado costosos de implementar.

Luego, piense en los objetivos del robot: su robot necesita ‘querer’ para llegar al objetivo, necesita ‘querer’ para evitar obstáculos.
La forma en que lo expreso, apunta al comportamiento dirigido a objetivos y a la estimulación positiva y negativa de inmediato.
Ahora tenemos suficientes palabras clave para googlear bastantes métodos de aprendizaje, estadísticas o redes neuronales.
Estudie la literatura, descubra lo que puede usar.
(Tener publicaciones electrónicas de ML / AI cookboks también es útil, como Data Mining: Practical Machine Learning Tools and Techniques o Neural Networks: A Comprehensive Foundation, para que pueda CTRL + F sus palabras clave)

Eventualmente, se te ocurrirá una combinación de métodos, es decir, la búsqueda directa de caminos, y una serie de métodos para aprender la forma óptima de evitar obstáculos.
En este punto, verifique qué existe, como software y hardware listos para usar. Luego, filtre los métodos que no puede usar.
Cuando vi su pregunta, pensé en las redes neuronales celulares de inmediato, porque sobresalen en la búsqueda dinámica de rutas. Pero eso probablemente requeriría un procesador NN celular para el bot, y nadie produce estos 🙂

Todo este proceso es iterativo; en este punto, es posible que tenga un software listo para usar para un sensor que no planeó construir en primer lugar, y cambia su diseño general.

Pero cuando todo sale, tienes tu modelo, listo para implementar.

More Interesting

¿Por qué Apple ha adoptado una estrategia de privacidad diferencial en torno a la IA y los datos del usuario, pero Google no?

¿Por qué hay tantas preocupaciones sobre la inteligencia artificial? Si somos los creadores de estas supermáquinas, ¿no tenemos el control total de ellas?

¿Hay investigadores tratando de entender cómo el cerebro humano construye la realidad visual en 3D y tratando de construir un sistema artificial inspirado en él?

¿Por qué ha tardado tanto el uso de redes neuronales y el aprendizaje automático para crecer?

¿Cómo sería el futuro para los graduados de IA?

¿Amazon Echo es el producto de inteligencia artificial para consumidores con mayor éxito comercial desde mayo de 2016?

Con el desarrollo acelerado de la IA, ¿creemos que es necesario, en algún momento, enseñar moral a los robots también?

¿Cuáles son las ventajas y desventajas cuando comparamos la red neuronal convolucional y la red neuronal recursiva para el procesamiento del lenguaje natural?

¿Es posible un pequeño reactor nuclear que pueda alimentar organismos cibernéticos como el Terminator?

¿Cuáles son las diferencias entre la 'respuesta a preguntas' al estilo AI, el 'debate' automatizado al estilo AI y lo que hacen los humanos?

¿Es la aplicación de aprendizaje profundo para las tareas de aprendizaje de redes neuronales artificiales con más de una capa oculta?

¿A dónde voy para aprender más sobre la naturaleza de la humanidad a través de nuestra comprensión de la inteligencia artificial?

¿Cuál es el trabajo de la red neuronal en el procesamiento de imágenes?

¿Qué es la regularización en el aprendizaje automático?

¿Serán AI los únicos que escribirán novelas en el futuro o habrá un mercado para los escritores humanos?