¿Qué significa decir que las redes neuronales convolucionales comparten cálculos comunes a las regiones superpuestas?

Para resumir, en una capa CNN, el truco principal es que, en lugar de aprender parámetros para la convolución en cada posición, los parámetros se comparten en todas las posiciones. Esta es una acción muy intuitiva para tomar.

Por ejemplo, cuando mira una imagen e intenta aprender diferentes convoluciones que detectan diferentes propiedades de la imagen (estructura de bordes, formas, etc.) en áreas pequeñas de la imagen, tiene mucho sentido tratar de aprenderla de todas las áreas pequeñas en el imagen en lugar de para cada posición específica. Esto reduce sustancialmente el número de pesos, permite obtener más datos para aprender (ya que hay muchas áreas pequeñas para aprender en cada imagen) y hace que las funciones que se aprenden sean independientes de la posición en la imagen. Eso es mucho que ganar con un truco.

Entonces, si entiendo su pregunta correctamente, diría que significa compartir los pesos sobre todas las posiciones (por supuesto, normalmente aprenderán muchas de esas neuronas juntas, pero esa es otra historia).

More Interesting

¿Cuáles son algunas habilidades matemáticas altamente relevantes que se requieren si quiero comenzar a investigar en algoritmos de Machine Learning?

¿Por qué alguien usaría un modelo de regresión basado en un árbol de decisión?

¿Cómo puede ayudar el conocimiento de un proceso estocástico, el movimiento browniano y un proceso de martingala con el aprendizaje profundo y la investigación del aprendizaje automático?

¿Hacia dónde se dirige la investigación de aprendizaje profundo?

Cómo implementar un algoritmo de fijación de precios dinámico en Hadoop

¿Se puede desarrollar un bot de chat usando Tensorflow? En caso afirmativo, ¿cómo empiezo a codificar en el mismo?

¿Debo ir por TensorFlow o PyTorch?

Cómo entrenar a una CNN con datos insuficientes y no tan buenos

¿Cuáles son algunos proyectos de investigación interesantes relacionados con el aprendizaje automático?

¿Cómo compararías hacer un doctorado en ML (principalmente aprendizaje profundo) en Duke, UC Irvine y Georgia Tech?

¿Cuáles son las mejores medidas al validar de forma cruzada un modelo para determinar qué tan bueno es el modelo y cómo funcionará en situaciones reales?

¿Cuáles son algunas ideas importantes / brillantes en el aprendizaje automático?

¿Por qué el error cuadrático medio es equivalente a minimizar la entropía cruzada entre la distribución empírica y un modelo gaussiano?

¿Cuál es la diferencia entre ajuste de curva y regresión?

¿Cuál es la mejor herramienta para ejecutar un código de aprendizaje automático?