¿Qué herramientas estadísticas se necesitan para la extracción de características y el reconocimiento de patrones en el procesamiento de imágenes?

Principalmente, hay tres enfoques para el reconocimiento de patrones:

  1. Trucos de visión por computadora: transformación de Hough, detección de bordes de Canny, SIFT, AAM, etc., son algunos modelos matemáticos para trabajar con imágenes.
  2. Redes neuronales: puede usar redes neuronales tradicionales para la coincidencia de patrones. El desafío es que no escalan bien con grandes conjuntos de datos.
  3. Redes profundas / CNN: las redes neuronales convolucionales parecen ser las mejores en tareas de reconocimiento de imágenes. Puede usar CNN multicapa apilados unos sobre otros. LeNet, GoogLeNet, AlexNet, etc. son algunas arquitecturas de referencia que puede ver.

Curiosamente, el libro de Goodfellow que estoy leyendo tiene un cuadro como este:

Como puede ver, Deep Learning ha demostrado ser un enfoque innovador para el problema de identificación de imágenes. Una ventaja importante de usar DL es que la parte de extracción de características está incorporada. No necesita realizar la extracción y selección de funciones, ya que la red aprende las funciones simplemente procesando datos.

More Interesting

¿Cómo combinaría Apache Spark y CUDA para implementar un marco de aprendizaje profundo?

¿Cuál es la razón para mapear datos de dos idiomas diferentes en un espacio de incrustación de palabras común y no usar dictonarios y asignarle el idioma b a los vectores del idioma a para entrenar un modelo de manera multilingüe?

¿Cuál es la explicación de la fórmula de compensación de Bias Variance?

¿Cuál es la diferencia entre minería de datos, aprendizaje automático y reconocimiento de patrones?

En el muestreo de importancia, ¿cuál es la diferencia entre [matemáticas] p (x) [/ matemáticas] y [matemáticas] q (x) [/ matemáticas]?

¿Qué le gustaría en una aplicación de aprendizaje de idiomas?

¿Será el futuro cercano de la visión por computadora el aprendizaje profundo pesado?

¿En qué se diferencia la investigación de Machine Learning en la academia de la investigación en la industria?

Cómo diferenciar entre características globales y características locales en una imagen

¿Cuál es el mejor clasificador que puedo usar en 'Reconocimiento facial en tiempo real' después de extraer funciones usando 'Alexnet'?

¿Existen por sí mismas redes neuronales que cambian automáticamente y que pueden cambiar su estructura interna (capas, nodos, hyerparameters)?

¿Por qué usar Kohonen SOMs sobre K-means, o viceversa?

¿A qué tipo de personalización en Machine Learning se refería Andrew Ng en su artículo de Harvard Business Review sobre las capacidades de IA?

Si quiero desarrollar una carrera en aprendizaje automático e inteligencia artificial, ¿debería comenzar con chatbots?

¿Cómo deciden los científicos computacionales qué estrategia usar para la validación cruzada?