¿Son 6 meses suficientes para aprender el reconocimiento de imágenes de aprendizaje automático?

Depende de tus habilidades matemáticas y estadísticas avanzadas. Necesita hacerse algunas preguntas:

  1. sabes como resolver ecuaciones diferenciales
  2. ¿Entiendes la diferencia de diferentes distribuciones?
  3. ¿Qué es la transformada de Fourier?

Si tiene una comprensión profunda de las preguntas anteriores, puede aprender el reconocimiento de imágenes ML en 6 meses.

Usemos el aprendizaje profundo para reconocer la imagen como ejemplo:

Aquí está la estructura de alexnet. Consiste en capas convolucionales, capas de agrupación, capa totalmente conectada y abandono.

La capa convolucional es básicamente un grupo de ecuaciones diferenciales.

La capa de agrupación en este caso es la agrupación máxima, básicamente es simple tomar el número más grande en el parche 2 × 2.

La capa totalmente conectada es una red neuronal antigua

Lo cual puedes entender como un montón de ecuaciones diferenciales

La capa de abandono simplemente cierra al azar algunas neuronas para introducir algunas variaciones en la red.

Durante el entrenamiento, la información se pasa de la última capa a la primera por retropropagación, que nuevamente son algunas ecuaciones diferenciales.

No hay magia negra aquí. Todo lo que necesitas es una base sólida de matemáticas.

La forma ideal de aprender análisis de imágenes y visión por computadora en 6 meses es a través de los siguientes libros:

  1. Aprendizaje profundo para visión artificial
  2. Visión por computadora: enfoque moderno
  3. Visión por computadora con OpenCV