Al igual que con cualquier tarea de aprendizaje automático, las personas usan el flujo de trabajo clásico de aprendizaje automático: extrae características de sus datos, las usa para entrenar cualquier algoritmo de aprendizaje automático y luego para predecir lo que quiera predecir.
En el caso de las imágenes, los datos de entrada tienen muchas dimensiones de entrada muy redundantes (los píxeles individuales). Puede usar los valores de píxeles directamente como características, pero dará como resultado un problema de aprendizaje automático innecesariamente complejo.
Una mejor manera es extraer características usando descomposiciones de imagen conocidas: series de Fourier, wavelets, filtros de gabor, etc. Incluso puede combinar múltiples bases, ya que su conjunto no necesita ser ortogonal.
- ¿Qué piensan los investigadores de IA del artículo 'Microsoft Research ve una reducción de la brecha de innovación en el aprendizaje profundo'?
- Cómo determinar un desarrollador falso de IA
- ¿Se pueden usar redes neuronales convolucionales para predecir datos de series de tiempo?
- ¿Qué es un modelo de red neuronal?
- ¿Existe un modelo de juguete para el aprendizaje automático?
Finalmente, cuando tiene un gran conjunto de datos de entrenamiento, puede usar el aprendizaje automático para construir características específicas de la aplicación. SIFT y sus amigos trabajan bien en ese entorno. Eso es también lo que hacen las nuevas y elegantes redes neuronales de “aprendizaje profundo”.