¿Cuál es la mejor manera de comenzar con la visión por computadora como individuo?

¡Hola! Yo también estoy haciendo mi licenciatura en EEE. Recientemente comencé con Computer Vision. Aquí está mi consejo:

  1. Conozca los conceptos básicos del procesamiento de imágenes. Conozca la diferencia entre el procesamiento de imágenes y la visión por computadora. Siga 1 o 2 buenos libros; Recomendaría ‘Procesamiento de imagen digital’ de RC. González Aclarará los conceptos básicos del procesamiento de imágenes.
  2. Aplique lo que aprenda de los libros anteriores en Matlab. No recomendaría ir primero a OpenCV, ya que el uso de las bibliotecas de OpenCV también implica la depuración de algunos problemas relacionados con la codificación. Quédate con Matlab primero. Comience a codificar, sin utilizar demasiadas funciones de la caja de herramientas de procesamiento de imágenes, para que los conceptos sean claros. Luego comience a usar funciones incorporadas. Utilice las cámaras web integradas para capturar imágenes del mundo real para procesar. Luego comience a implementar las mismas cosas en OpenCV.
  3. Haga un curso en línea o compre un libro de Álgebra lineal . La visión por computadora utiliza en gran medida las técnicas de álgebra lineal. Las operaciones matriciales, ‘subespacios’, ‘núcleos’, ‘valores propios’, ‘componentes principales’ son las palabras clave.
  4. Comience a aprender Machine Learning al mismo tiempo. También se usa mucho en visión artificial inteligente y adaptativa.
  5. El procesamiento digital de señales , cubierto en la mayoría de los planes de estudio EEE, es útil. Repasalo.
  6. Aprenda algunos algoritmos básicos y estructuras de datos . La programación también es muy útil en OpenCV, pero no tanto como las habilidades matemáticas, supongo. Pero supongo que está familiarizado con C / C ++ al menos. Programar los conceptos de las matemáticas es un gran desafío, pero Matlab y OpenCV están equipados con excelentes bibliotecas que harán su trabajo. También están altamente optimizados.
  7. Participa en concursos basados ​​en robótica de procesamiento de imágenes.
  8. ¡Emprende un proyecto ! La mejor manera de aprenderlo a pensar sobre un proyecto / problema relevante del mundo real y resolverlo.

Dos cosas principales: aprender y hacer

1. Tómese el tiempo para aprender algunos conceptos de los cursos en línea disponibles gratuitamente.
Como estudiante del MIT, puedo recomendar 6.801 (Visión artificial) y 6.869 (Avances en visión artificial) como buenos puntos de partida.

La página OCW para 6.801: Visión artificial
La página web para 6.869: 6.869 Avances en visión artificial, otoño de 2012

Busque más recursos en línea también.

2. Lea este libro de Szeliski
Visión por computadora: algoritmos y aplicaciones

3. Busque más a fondo en Quora 😉
Cómo comenzar en Computer Vision (Una guía para estudiantes universitarios de CS) por Arturo Deza en publicaciones

4. ¡Haz algunos experimentos! Use MATLAB o OpenCV o cualquier otro idioma, obtenga una cámara web y pruebe algunos experimentos simples.

Pruebe cosas como rastrear una pelota de ping-pong en tiempo real, o una simple realidad aumentada. O replicar los conjuntos de problemas en las clases MIT.

O simplemente busque en las páginas web y Youtube para ver demostraciones de proyectos de visión por computadora / visión artificial.

5. Finalmente, inspírate. Además de ver videos de demos de Youtube, intente también ver cosas como Nova’s Documentary en el DARPA Grand Challenge, que tiene algunas cosas increíbles de visión artificial.

Si desea comenzar con una introducción de alto nivel a Computer Vision usando la programación Python, eche un vistazo a SimpleCV:

http://www.simplecv.org/

Mira estas series de videos de un profesor de la Universidad de Florida Central