Cómo configurar datos de entrenamiento para una red neuronal para generar valores de joystick basados ​​en una entrada de imagen

Simplemente comenzaría con un marco de clasificación por cuadro. Simplemente elija una pérdida de softmax al final de su CNN profunda favorita (quizás AlexNet pre-entrenado); los valores de la clase de entrenamiento pueden ser valores de joystick discretizados. Si esta configuración más simple no funciona, incluso después de adquirir muchas decenas de horas de datos, es posible que desee aumentar el conjunto de entrenamiento.

El problema es que en su mayoría conducirá “correctamente”, y esto no dejaría suficientes datos de entrenamiento para que el modelo aprenda a corregir los errores de manejo. El documento Dave2 de Nvidia, aunque no es muy impresionante per se (solo puede seguir el carril, solo se proporciona una evaluación anecdótica / incompleta), propone algunas ideas para generar datos de entrenamiento aumentados para posiciones de conducción incorrectas. Podrías echar un vistazo a esos.

http://arxiv.org/pdf/1604.07316v…

En la práctica, sé que la memoria es muy útil para la conducción humana, pero por alguna razón, creo que para una máquina lo suficientemente buena, un sistema sin memoria (por lo tanto, una CNN por cuadro) podría ser suficiente [más probable es que no lo he pensado bien]. Una vez que tenga algo que se ejecute, puede intentar extender la arquitectura para incluir un LSTM / GRU vinculado a su CNN de alguna manera.

Otro papel por fotograma (de nuevo solo para conducir en carretera, a partir de una simulación) es el siguiente. Aquí solo estiman una serie de variables de estado, sobre la posición del automóvil en relación con la carretera y sobre qué automóviles están inmediatamente delante de nuestro automóvil. Y luego use un enfoque codificado / basado en reglas para diseñar instrucciones de control. En esta configuración, no podrá explotar las señales del joystick, pero la formulación de CNN podría valer la pena.

DeepDriving

More Interesting

¿Qué tan popular y extendido es el aprendizaje automático en África?

¿Alguien ha intentado combinar las redes neuronales con un aprendizaje profundo?

En un juego de billar, ¿puede el mejor robot (diseñado específicamente para esta tarea) derrotar al campeón mundial humano?

Cómo expresar un modelo de árbol de decisión en modelos gráficos

¿Cuál es el uso de una capa de disminución de resolución en una red neuronal convolucional (CNN)?

¿Qué cursos deben tomar los antecedentes de EE para el aprendizaje profundo?

¿Cuáles son algunos documentos de investigación de inicio sobre búsqueda, aprendizaje automático y recuperación de información?

¿La regresión logística tiene en cuenta el desequilibrio de datos?

¿Qué significa realmente el aprendizaje automático en términos reales?

¿La programación de Python es suficiente para el aprendizaje automático o deberíamos aprender R también?

En un problema de optimización no convexo, ¿es posible determinar si dos puntos pertenecen al mismo valle o no?

¿Cuáles son las mejores conferencias sobre aprendizaje automático para el procesamiento de imágenes médicas en 2016?

¿Cómo reconocemos a un usuario en particular en un registro de chat de Internet multiusuario largo?

¿Cuál sería la arquitectura más apropiada para entrenar una red neuronal basada en dos imágenes de entrada?

¿Puedo tomar el curso de aprendizaje automático de Andrew Ng siendo un estudiante de secundaria con algo de experiencia en programación y sin conocimientos avanzados de matemáticas?