ANNs: ¿Cómo usan las redes convolucionales el ‘compartir peso’?

En sus primeras capas, las redes neuronales convolucionales tienen ‘filtros’. La entrada es una imagen de cuadrícula de tamaño ansnx 3 (profundidad tres para RGB) (al menos en el caso de clasificación de imagen). Entonces, la red convolucional tiene un filtro que podría ser, digamos 5 x 5 x 3. Este filtro es multiplicado por elementos por una pieza de 5 x 5 x 3 de la entrada, luego se suman los resultados. Esto crea un elemento de salida.

Luego, el filtro se desliza (o convoluciona), por lo que ahora se multiplica por una sección diferente de la entrada, pero el filtro todavía tiene los mismos pesos. Esto crea otro elemento de salida.

De ahí los pesos compartidos. Cada filtro se desliza a lo largo de la imagen y se aplica a diferentes partes de la imagen. Los valores de la imagen cambian de una ubicación a otra, pero los pesos del filtro (es decir, los números por los que se multiplica la pieza de la imagen) permanecen iguales. Por lo tanto, muchos de los elementos de salida son producidos por los mismos pesos de filtro, de ahí el término ‘pesos compartidos’.

Aprendizaje automáticoRedes neuronales artificialesRedes neuronales convolucionales

Related Content

¿Tiene sentido usar redes neuronales convolucionales en la identificación biométrica humana basada en ECG?

¿Qué idioma debo usar para tensorflow?

¿Hay alguna empresa india que trabaje con IA y aprendizaje automático? En caso afirmativo, ¿en qué campo y en qué se diferencia de otros en ese campo?

¿En qué se diferencia el estado oculto (h) de la memoria (c) en una celda LSTM?

Como científico de datos, ¿qué te inspiró a seguir una carrera en ciencia de datos?

En el aprendizaje profundo, ¿cómo clasifica una imagen como desconocida?

Aprendizaje automático: ¿cuándo debo aplicar la normalización / estandarización de datos?

More Interesting

¿Cómo se usa el aprendizaje automático en FinTech (P2P, pagos), particularmente fuera de algo trading? ¿Alguien tiene ejemplos específicos en punto a punto, verificación de crédito, pagos, etc.?

¿Qué opinas de Keras?

¿Cuál es la forma completa de AUC en el estado de AUC de los resultados del examen AKTU?

Si pudiera construir una plataforma de contenido (piense en la entrega de noticias) desde cero con el objetivo de escalar a millones de usuarios, ¿qué infraestructura utilizaría?

¿Cómo se recupera la información de las cajas negras?

Cómo comenzar a implementar un sistema de recomendación para juegos

Cómo utilizar una GPU en mis algoritmos de aprendizaje automático de R

¿Cómo se puede utilizar el aprendizaje automático para la clasificación de exoplanetas?

¿Cuál es el mejor algoritmo para descubrir todos los nodos de la red y mantener esa red en tiempo real?

¿Cuáles son algunas iniciativas de aprendizaje automático sobre datos sociales?

¿Se podría denominar al PageRank como un algoritmo de aprendizaje automático?

Redes neuronales convolucionales: ¿Qué están haciendo los regresores de cuadro delimitador en Fast-RCNN?

¿Cuál es una buena distribución para usar para simular un conjunto de entrenamiento para la clasificación supervisada?

¿Cuál es un buen conjunto de datos para probar mi clasificador vecino más cercano K?

He asignado mis pesos (w) a un múltiple multinomial (o k-simplex), dividiendo cada componente de w por la suma de todos los componentes. ¿Cómo realizo la regularización (equivalente a l1 o l2) en el nuevo espacio multinomial múltiple (k-simplex)?

Web Analytics