¿Cuáles son los principales algoritmos en visión artificial?

  • SIFT y SURF para extracción de puntos característicos . Utilizado para el reconocimiento de objetos, registro de imágenes.
  • Algoritmo de Viola-Jones, para la detección de objetos (especialmente caras) en tiempo real . Uno de los algoritmos más elegantes, uno de mis favoritos.
  • Enfoque ‘Eigenfaces’, utilizando PCA para la reducción de dimensiones. Utilizado en reconocimiento facial. Tiene un enfoque muy intuitivo y, sin embargo, es matemáticamente fuerte.
  • Algoritmo de Lucas-Kanade para el cálculo del flujo óptico. Utilizado para el seguimiento, registro estéreo. También el algoritmo Horn-Schunk.
  • Algoritmo de cambio medio para el seguimiento rápido de objetos. No es muy robusto, pero fácil de usar y muy útil en aplicaciones específicas.
  • Filtro de Kalman, nuevamente para el seguimiento de objetos, utilizando características de puntos para el seguimiento. Gran uso en muchos campos como visión artificial, sistemas de control, etc.
  • Umbral adaptativo (y otras técnicas de umbral), ‘el umbral de coz es mucho más importante de lo que se piensa.
  • Los algoritmos de aprendizaje automático como SVM, KNN, Naive Bayes, etc. también son muy importantes en el campo de la visión por computadora.

Además de la respuesta de Omkar Lad, otros grandes algoritmos, especialmente para aplicaciones 3D, son:

  • Punto más cercano iterativo ( ICP ) para registrar conjuntamente dos o más nubes de puntos 3D juntas
  • Semi Global Matching ( SGM ) y Semi Global Block Matching ( SGBM ) algoritmos que generan una imagen de profundidad de imágenes estéreo
  • Histogramas de puntos de características para detectar características en el espacio 3D

El cambio más importante en CV en los últimos 5 años es el dominio casi completo de los sistemas construidos sobre redes neuronales convolucionales.

Este es un tipo de red neuronal donde la operación de la unidad, en lugar de ser una simple multiplicación como en un perceptrón de múltiples capas, es una convolución discreta.

Mi otro algoritmo favorito es Graph Cut. Esto se usa a menudo en la teoría de gráficos para encontrar la forma más eficiente de dividir un gráfico en dos sub-gráficos, dado que un nodo en cada lado está etiquetado como en cualquiera de los sub-gráficos. Esto se usa para hacer una segmentación muy rápida de primer plano y de fondo, y aparte de CNNS es lo que uso más a menudo para problemas simples de CV.

Detección de bordes, detección de puntos de interés, HOG, SIFT, flujo óptico, pirámides, modelos de movimiento, movimiento global, desplazamiento medio, modelo de cámara, matriz fundamental, reconocimiento de rostros, estructura de movimiento, estéreo, bolsa de características, transformación de Hough

UCF Computer Vision Video Lectures 2012 – YouTube