Su pregunta ya está respondida aquí.
¿Qué es una red neuronal convolucional?
Trataré de responder de manera simple.
- ¿Cuáles serían los proyectos / servicios más interesantes en el cuidado de la salud que involucren alta tecnología como dispositivos móviles, big data y data science? Por ejemplo, Ginger.io.
- ¿Cuáles son las suposiciones hechas por los modelos ocultos de Markov?
- ¿Cuál es el potencial empresarial del aprendizaje automático / inteligencia artificial?
- ¿Qué piensa sobre los procesos gaussianos profundos?
- ¿Debo eliminar las URL cuando hago el preprocesamiento para un análisis de sentimientos de Twitter?
Siempre que decimos red neuronal artificial, generalmente nos referimos a una red neuronal completamente conectada. Por completamente conectado, queremos decir que todos los nodos de entrada están conectados a todos los nodos de la primera capa. Todos los nodos de la primera capa están conectados a todos los nodos de la segunda capa y así sucesivamente.
Para las imágenes, si desea utilizar una red neuronal completamente conectada, puede considerar cada píxel de una imagen como un nodo de entrada. Entonces, el número de nodos en la entrada es igual a no. de píxeles en la imagen (x_dim * y_dim). Puede lograr entrenar la red para imágenes más pequeñas, pero para todos los tamaños de imagen prácticos, el número de nodos de una red totalmente conectada se vuelve demasiado grande y, por lo tanto, el no. de parámetros (los pesos y los sesgos se vuelven enormes), y se vuelve prácticamente imposible entrenar esas redes para una buena precisión en un tiempo razonable.
Entonces, ¿cómo resolvemos este problema?
Recuerde que en una red totalmente conectada no importa el orden de los nodos de entrada. Quiero decir, puede obtener el mismo resultado si solo cambia el orden de todas las entradas y también los pesos correspondientes. Por lo tanto, para una red neuronal totalmente conectada, los valores de las entradas son todos independientes.
Pero, para las imágenes, todos sabemos que existe mucha correlación entre los píxeles de entrada. Los píxeles cercanos entre sí están altamente correlacionados y los píxeles más lejanos están menos correlacionados. Podemos usar esta propiedad de imágenes para reducir el no. de conexiones entre capas.
Además, si usa pesos particulares (filtros) en una parte de la imagen e intenta encontrar una propiedad particular en una imagen, podemos usar el mismo filtro para encontrar la misma propiedad en todas las partes de la imagen. Por lo tanto, puede reducir el número de pesos / parámetros de una capa en una red neuronal.
Entonces, básicamente al usar las propiedades básicas de una imagen, redujimos el no. de conexiones entre capas y también no. de parámetros entre capas. Por lo tanto, podemos entrenar una red en un tiempo razonable con buena precisión.
Esta red en la que redujimos las conexiones y los parámetros en comparación con la red neuronal completamente conectada se denomina Red neuronal convolucional.
Podemos hacer todo esto en 2D solo en lugar de 1D para imágenes para hacerlo más intuitivo.
Vea este video para entender lo que estoy diciendo.