En pocas palabras, ¿cómo se hace el aprendizaje automático con imágenes?

Al igual que con cualquier tarea de aprendizaje automático, las personas usan el flujo de trabajo clásico de aprendizaje automático: extrae características de sus datos, las usa para entrenar cualquier algoritmo de aprendizaje automático y luego para predecir lo que quiera predecir.

En el caso de las imágenes, los datos de entrada tienen muchas dimensiones de entrada muy redundantes (los píxeles individuales). Puede usar los valores de píxeles directamente como características, pero dará como resultado un problema de aprendizaje automático innecesariamente complejo.

Una mejor manera es extraer características usando descomposiciones de imagen conocidas: series de Fourier, wavelets, filtros de gabor, etc. Incluso puede combinar múltiples bases, ya que su conjunto no necesita ser ortogonal.

Finalmente, cuando tiene un gran conjunto de datos de entrenamiento, puede usar el aprendizaje automático para construir características específicas de la aplicación. SIFT y sus amigos trabajan bien en ese entorno. Eso es también lo que hacen las nuevas y elegantes redes neuronales de “aprendizaje profundo”.