No soy un experto en aprendizaje automático, pero en base a la pequeña experiencia de ML, esto es lo que tengo que decir:
Las imágenes generalmente tienen una estructura jerárquica . Por ejemplo, en los niveles más bajos, hay píxeles. Los píxeles forman líneas y curvas. Las curvas forman formas. Las formas forman la imagen completa.
Las CNN explotan eficientemente esta jerarquía de las imágenes . Por ejemplo, la primera capa conv (junto con la capa de agrupación) interactúa directamente con los píxeles de la imagen y devuelve una salida. Esta salida en cierto sentido representa líneas y curvas. Estas líneas y curvas se alimentan a otra capa conv + pooling para generar formas. De esta forma, las redes pueden funcionar bastante bien en las imágenes.
- ¿Cuál es el algoritmo de inteligencia artificial detrás de la sugerencia de la sección de cada sitio web?
- He oído que hay muchas aplicaciones (CV, PNL, etc.) de aprendizaje automático. ¿Cuál elegiste y cuál fue la razón para elegirlo?
- ¿Cuál es la plataforma o herramienta más simple para practicar el aprendizaje automático (para principiantes)?
- Si estoy interesado en el aprendizaje automático y la inteligencia artificial, ¿es mejor postularse a puestos de ingeniero de software o de ciencia de datos?
- ¿Qué piensa la comunidad de desarrollo web sobre TheGrid.io?
Dicho esto, diría que fue una explicación de alto nivel y para una mejor explicación, debería echar un vistazo a esta excelente guía sobre Conv-nets: CS231n Redes neuronales convolucionales para el reconocimiento visual