A partir de (CVPR 2017) – Estimación de profundidad monocular no supervisada
con consistencia izquierda-derecha [1] es el SOTA en la estimación de profundidad monocular.
Tenga en cuenta que durante el entrenamiento todavía usan imágenes estéreo, ya que la estimación de profundidad de las cámaras monoculares es un problema mal planteado.
Ideas principales de su papel
- ¿Es la instalación de cámaras de vigilancia la mejor manera de proporcionar seguridad, o es una violación de la privacidad que no cumpliría lo que promete?
- ¿Una lente FX de 20 mm mostrará el mismo tamaño de pantalla que una lente de kit de 20 mm en mi cámara DX?
- ¿Cómo funciona una pantalla de resolución de 1080p para reproducir videos o imágenes desde una cámara de 3 megapíxeles o más?
- ¿Cuáles son las ventajas de las cámaras de puente?
- ¿Cuál es la mejor cámara DSLR para comprar después de usar CHDK en una Canon PowerShot?
- Resolver la estimación de profundidad como problema de reconstrucción de imagen
- Imagen única en el momento de la prueba, predice la profundidad de píxeles. Pero mientras entrenas necesitas imágenes estéreo.
- Idea principal: aprender a producir una imagen derecha desde la izquierda. Si está hecho, significa que has aprendido algo sobre la forma 3D de la escena.
- Imponer consistencia de LR: calcule la profundidad al inferir las disparidades que deforman la imagen izquierda para que coincida con la derecha y viceversa (la alimentación de la imagen izquierda y la derecha se usa solo para supervisión)
- Inferencia: 28 fotogramas por segundo
- Resultados cualitativos de su trabajo:
Otros trabajos similares con buenas actuaciones
- Aprendizaje no supervisado de profundidad y Ego-Motion del video [2]
- Aprendizaje profundo semi-supervisado para la predicción del mapa de profundidad monocular [3]
Nota: Las imágenes utilizadas para ilustración se acreditan a los documentos proporcionados en las notas al pie.
Notas al pie
[1] Estimación de profundidad monocular no supervisada
[2] Aprendizaje no supervisado de profundidad y Ego-Motion del video
[3] Aprendizaje profundo semi-supervisado para la predicción del mapa de profundidad monocular – Semantic Scholar