¿Qué son las redes neuronales convolucionales?

Su pregunta ya está respondida aquí.

¿Qué es una red neuronal convolucional?

Trataré de responder de manera simple.

Siempre que decimos red neuronal artificial, generalmente nos referimos a una red neuronal completamente conectada. Por completamente conectado, queremos decir que todos los nodos de entrada están conectados a todos los nodos de la primera capa. Todos los nodos de la primera capa están conectados a todos los nodos de la segunda capa y así sucesivamente.

Para las imágenes, si desea utilizar una red neuronal completamente conectada, puede considerar cada píxel de una imagen como un nodo de entrada. Entonces, el número de nodos en la entrada es igual a no. de píxeles en la imagen (x_dim * y_dim). Puede lograr entrenar la red para imágenes más pequeñas, pero para todos los tamaños de imagen prácticos, el número de nodos de una red totalmente conectada se vuelve demasiado grande y, por lo tanto, el no. de parámetros (los pesos y los sesgos se vuelven enormes), y se vuelve prácticamente imposible entrenar esas redes para una buena precisión en un tiempo razonable.

Entonces, ¿cómo resolvemos este problema?

Recuerde que en una red totalmente conectada no importa el orden de los nodos de entrada. Quiero decir, puede obtener el mismo resultado si solo cambia el orden de todas las entradas y también los pesos correspondientes. Por lo tanto, para una red neuronal totalmente conectada, los valores de las entradas son todos independientes.

Pero, para las imágenes, todos sabemos que existe mucha correlación entre los píxeles de entrada. Los píxeles cercanos entre sí están altamente correlacionados y los píxeles más lejanos están menos correlacionados. Podemos usar esta propiedad de imágenes para reducir el no. de conexiones entre capas.

Además, si usa pesos particulares (filtros) en una parte de la imagen e intenta encontrar una propiedad particular en una imagen, podemos usar el mismo filtro para encontrar la misma propiedad en todas las partes de la imagen. Por lo tanto, puede reducir el número de pesos / parámetros de una capa en una red neuronal.

Entonces, básicamente al usar las propiedades básicas de una imagen, redujimos el no. de conexiones entre capas y también no. de parámetros entre capas. Por lo tanto, podemos entrenar una red en un tiempo razonable con buena precisión.

Esta red en la que redujimos las conexiones y los parámetros en comparación con la red neuronal completamente conectada se denomina Red neuronal convolucional.

Podemos hacer todo esto en 2D solo en lugar de 1D para imágenes para hacerlo más intuitivo.

Vea este video para entender lo que estoy diciendo.

Una red neuronal artificial que intenta confiar principalmente en operaciones de convolución (como en el filtrado de imágenes) para evitar el alto costo de hacer multiplicaciones de matriz completa.

More Interesting

¿La red neuronal convolucional es básicamente un procesamiento previo de datos a través del núcleo más las redes neuronales? ¿Acaso Deep Learning no es solo redes neuronales con preprocesamiento para las selecciones de funciones automatizadas?

¿Dónde puedo obtener más información sobre la persona en el MIT Media Lab que está trabajando para eliminar el sesgo en el aprendizaje automático?

Cómo implementar el descenso de gradiente de mini lotes en una red neuronal

¿Cuál es el básico antes de aprender el aprendizaje automático?

¿Cambridge o Stanford / Berkeley son mejores en aprendizaje automático?

En una explicación intuitiva, ¿cómo puedo calcular formas primarias y duales en SVM?

¿Cómo debe un principiante en Machine Learning enfocar una declaración de problema?

¿Por qué hay una disminución en el rendimiento de los modelos pre-entrenados?

Cómo implementar el análisis de sentimientos en proyectos de retroalimentación de clientes

¿El descenso de gradiente de lote completo, con potencia de computadora ilimitada, es siempre mejor que el descenso de gradiente de mini lote?

¿Keras admitirá PyTorch como backend en el futuro?

¿Cómo decidimos la clase de clústeres generados a través del clúster k-means?

¿Qué es una regresión logística condicional?

Cómo decidir el tema de mi interés de investigación para obtener un doctorado en visión artificial y aprendizaje automático

Soy un graduado en ingeniería eléctrica. Quiero seguir estudios superiores en aprendizaje automático o inteligencia artificial en EE. UU. ¿Qué tengo que hacer?