¿Cómo se aplica el aprendizaje profundo en el reconocimiento de imágenes?

Las redes neuronales de convolución son una clase de redes neuronales comúnmente utilizadas en el aprendizaje profundo. Una característica típica de los CNN es que casi siempre tienen imágenes como entradas, esto permite una implementación más eficiente y una reducción en el número de parámetros requeridos.

Hay dos principios básicos que definen las redes neuronales de convolución: filtros y mapas característicos.

El objetivo principal de una capa convolucional es detectar características o características visuales en las imágenes, como bordes, líneas, colores, etc. Esto se realiza mediante una capa oculta conectada a la capa de entrada.

Este paso, llamado paso de convolución, se puede mostrar aquí. En las CNN, la matriz 3 × 3 se denomina ‘filtro’ o ‘núcleo’ y la matriz formada al deslizar el filtro sobre la imagen y calcular el producto de punto se denomina ‘Función enrevesada’ o ‘Mapa de activación’ o ‘Función’ Mapa’. Es importante tener en cuenta que los filtros actúan como detectores de características de la imagen de entrada original.

Si está buscando casos de uso específicos en la industria, piense en el reconocimiento facial, la búsqueda de imágenes de Google y Clarifai.

¡Espero que esto ayude!