Una idea que no ha tenido mucho interés hasta ahora es aprender las señales de control directamente del flujo visual de manera integral utilizando NN profundos. Un artículo sobre esto salió del laboratorio de Yann LeCun hace unos años. Aunque estaban conduciendo en una jungla y otros automóviles o señales de tráfico no estaban presentes allí, porque es muy difícil obtener suficientes datos de entrenamiento (videos de decenas de miles de millas con señales de control). Vi la conversación y el video relacionados también en Youtube hace un tiempo. Aquí está el documento relevante:
http://www.cs.nyu.edu/~sermanet/…
Justo en el reciente ICCV, el grupo de Princeton CV presentó un documento que hace algo similar, excepto que en lugar de obtener las señales de control directamente, regresan un vector de estado que describe el estado de la carretera. Su sistema está entrenado en un simulador con un humano conduciendo el automóvil por alrededor de 10 horas. Tienen un sistema basado en reglas para derivar señales de control del vector de estado. El sistema solo funciona con carreteras, es decir, sin señales de tráfico o intersecciones. Supongo que debería ser posible utilizar el aprendizaje profundo de Q de estilo DeepMind para evitar el esfuerzo de conducción humana. Lo que me gustó de esta tubería fue que estaba comenzando a aprender características que pueden generalizarse a las escenas viales del mundo real en el KITTI. Nuevamente mira el video.
- ¿Cuánta informática necesitas para la investigación astrofísica? ¿Cómo haces para aprenderlo?
- ¿Qué tipo de trabajo de investigación se realiza en informática en la Universidad Nacional de Singapur (NUS)?
- ¿Qué ha sucedido en el aprendizaje automático teórico en los últimos 5 años (2009-2014)?
- En el campo de la visión por computadora, ¿a qué se refiere el término 'segmentación'?
- Cómo convertirse en un buen investigador en informática
http: //deepdriving.cs.princeton….
De hecho, Amnon Shashua, el fundador de la empresa líder de percepción automotriz, anunció recientemente que recién estaban comenzando a utilizar este tipo de técnicas. Específicamente, el uso de Q-learning profundo para modelar el comportamiento de los conductores humanos en una ronda para que el vehículo autónomo no esté esperando para siempre.