¿Puede una red neuronal convolucional tener pesos negativos?

Los pesos pueden ser lo que sea que el algoritmo de entrenamiento determine los pesos.

Si tomas el caso simple de una sola neurona artificial, que forma el bloque de construcción de la CNN, los pesos son la contribución de la pendiente de una entrada particular, y podrían ser positivos o negativos.

Intuitivamente, si se utiliza CNN para la clasificación de imágenes, las capas iniciales aprenden características de nivel inferior como la detección de bordes. Los pesos ideales (escalados) de una detección de borde de 3 × 3 serían todos negativos, excepto el del medio.

p.ej

Vea la publicación del blog para comprender la convolución en el aprendizaje profundo – Tim Dettmers

Sí, CNN puede tener pesos negativos, y normalmente la salida de un bloque CNN es un mapa de características de imagen, por lo que se utiliza una ReLU que hace que todos los valores negativos que puedan resultar de pesos negativos a cero resulten en un mapa de características que se convierta nuevamente en una estructura similar a la imagen.

More Interesting

¿Es justo evaluar una red neuronal profunda solo de acuerdo con su rendimiento en algunos conjuntos de datos específicos?

¿Cuál es la mejor biblioteca de aprendizaje profundo en la etapa actual para trabajar en grandes datos? ¿Cuáles son algunas alternativas para las bibliotecas a gran escala?

¿Cuáles son las formas de ingresar a Stanford para obtener una maestría en informática o una maestría en aprendizaje automático e inteligencia artificial?

¿Qué es la regularización neta elástica en el aprendizaje automático?

¿Por qué el clasificador Bayes Network funciona tan bien como SVM con menos funciones que las que se usan con SVM?

¿Cuáles son las 8 principales cosas para las que las startups utilizan el aprendizaje automático?

En reconocimiento facial, ¿son las huellas faciales y los vectores de características lo mismo? Si no, ¿en qué se diferencian?

¿Debería considerarse un experto en aprendizaje automático después de completar la clase de ML del profesor Andrew en Coursera?

¿Es Bayes jerárquico básicamente una introducción de hiperparámetros en el modelo?

¿Puede el aprendizaje automático ayudar con la ciencia del clima?

¿Cómo se encuentran los trabajos de consultoría en machine learning + PNL?

¿En qué problemas sería buena / mala una máquina neural de Turing?

¿Cómo funciona la regresión lineal múltiple en variables categóricas?

¿Cuál es la ventaja de combinar la red neuronal convolucional (CNN) y la red neuronal recurrente (RNN)?

¿Por qué los clasificadores Naive Bayes se consideran relativamente inmunes al sobreajuste?