¿Existe alguna comparación entre las técnicas SLAM monoculares recientes, especialmente aquellas basadas en un aprendizaje profundo?

ORB-SLAM y la última encarnación de LSD-SLAM (ahora solo haciendo VO, no SLAM, sino lo mejor) son prácticamente las tuberías SLAM monoculares de última generación. Las tablas en sus respectivas secciones de resultados dan una exposición decente a las diferencias de calidad.

http://webdiis.unizar.es/~raulmu…
[1607.02565] Odometría dispersa directa

Si bien las técnicas de aprendizaje profundo se han aplicado a la localización basada en imágenes como se muestra a continuación, que yo sepa, no hay una tubería de SLAM o VO completa que utilice DL de manera significativa.

http://mi.eng.cam.ac.uk/~agk34/r…

Estoy seguro de que comenzaremos a ver sistemas SLAM que emplean DL para su front-end en algún momento, es decir, para obtener coincidencias entre imágenes, ya sea directamente (deformaciones de imagen a fotograma clave) o indirectamente (usando características CNN para descriptores de puntos clave) – y, naturalmente, también para la relocalización y los cierres de bucles, pero no veo ninguna propuesta para reemplazar el backend (ya sea el filtro probabilístico o la parte de Ajuste de paquete, o la representación del mapa, o elegir qué marcos hacer BA local frente a BA global) .

Debe tener en cuenta que los sistemas SLAM monoculares de última generación incluso evitan las características de ingeniería manual más costosas como SIFT, a pesar de su precisión superior a las más baratas, y a menudo incluso recurren al NCC básico en parches de imagen – para permitir la operación en tiempo real! Por lo tanto, dudo que vea personas usando CNN para módulos SLAM en un futuro muy cercano. Por otro lado, tal vez alguien pueda descubrir cómo aprender todo el proceso de SLAM en una arquitectura CNN basada en comentarios, o evitar el SLAM explícito por completo, pero como dije, hasta ahora no he visto una propuesta de este tipo.

Echa un vistazo a los documentos de Magic Leap sobre este tema, han publicado muchas cosas interesantes.

More Interesting

¿Qué es diferenciar los bosques aleatorios de otros métodos de conjunto en Data Science y por qué?

¿Qué son las redes adversas generativas (GAN)?

¿Qué sistemas IDS, IPS en Network Security hoy en día son los más adaptables para aprender nuevas amenazas? ¿Hay algún tipo de punto de referencia estándar para medir esto?

Cómo encontrar el contexto de una conversación usando técnicas de aprendizaje automático / aprendizaje profundo / PNL

Cómo ingresar a un programa de doctorado en la mejor escuela de EE. UU. En inteligencia artificial, visión artificial y aprendizaje automático

¿Se pueden anotar videos usando el aprendizaje automático?

¿Qué son las características y clases en ingeniería de características?

¿Cuál es el asistente virtual personal más avanzado?

Estoy creando un plan de enrutamiento de vehículos con la ruta y el costo más bajos. ¿Sería más significativo el agrupamiento k-k o los vecinos k-más cercanos?

¿Qué tan importante fue el Premio Netflix para el área de Sistemas de recomendación?

¿Cómo se puede interpretar el teorema de Bayes en términos de inferir relaciones causales en los datos?

¿Se pueden mapear los datos de entrada circulares (como la fase de una sinusoide) en un espacio de características lineales usando un núcleo lineal usando SVM? Si no, ¿qué núcleo es óptimo para datos de entrada circulares?

En el autoencoder variacional, ¿por qué solo tomamos muestras de variables latentes de un gaussiano estándar y aplicamos el decodificador para generar nuevos datos en las pruebas?

Cómo agregar una razón de probabilidad para una característica en mi conjunto de datos

¿Podemos construir una máquina de visualización de sueños usando el procesamiento de señales?