¿Qué significa decir que las redes neuronales convolucionales comparten cálculos comunes a las regiones superpuestas?

Para resumir, en una capa CNN, el truco principal es que, en lugar de aprender parámetros para la convolución en cada posición, los parámetros se comparten en todas las posiciones. Esta es una acción muy intuitiva para tomar.

Por ejemplo, cuando mira una imagen e intenta aprender diferentes convoluciones que detectan diferentes propiedades de la imagen (estructura de bordes, formas, etc.) en áreas pequeñas de la imagen, tiene mucho sentido tratar de aprenderla de todas las áreas pequeñas en el imagen en lugar de para cada posición específica. Esto reduce sustancialmente el número de pesos, permite obtener más datos para aprender (ya que hay muchas áreas pequeñas para aprender en cada imagen) y hace que las funciones que se aprenden sean independientes de la posición en la imagen. Eso es mucho que ganar con un truco.

Entonces, si entiendo su pregunta correctamente, diría que significa compartir los pesos sobre todas las posiciones (por supuesto, normalmente aprenderán muchas de esas neuronas juntas, pero esa es otra historia).

Related Content

¿Cómo podría una máquina / sistema de IA identificar una oración sarcástica?

¿Cuáles son los pasos básicos del procesamiento de texto en el procesamiento del lenguaje natural para la similitud de texto?

¿Por qué parece que hay capas y capas de significado más profundo ocultas bajo la simple forma de escritura de Ernest Hemingway?

¿Por qué la pérdida logística es una mejor métrica para la clasificación probabilística que RMSD?

¿Cuál es la diferencia entre el aprendizaje por refuerzo y la optimización de caja negra?

¿Cuáles son algunos proyectos paralelos de Machine Learning que puedo implementar en mi tiempo libre?

¿Qué tipo de algoritmos utilizamos para el análisis de sentimientos? ¿Hay alguna lista para los algoritmos y sobre su estructura?

More Interesting

¿Cuáles son algunas habilidades matemáticas altamente relevantes que se requieren si quiero comenzar a investigar en algoritmos de Machine Learning?

¿Por qué alguien usaría un modelo de regresión basado en un árbol de decisión?

¿Cómo puede ayudar el conocimiento de un proceso estocástico, el movimiento browniano y un proceso de martingala con el aprendizaje profundo y la investigación del aprendizaje automático?

¿Hacia dónde se dirige la investigación de aprendizaje profundo?

Cómo implementar un algoritmo de fijación de precios dinámico en Hadoop

¿Se puede desarrollar un bot de chat usando Tensorflow? En caso afirmativo, ¿cómo empiezo a codificar en el mismo?

¿Debo ir por TensorFlow o PyTorch?

Cómo entrenar a una CNN con datos insuficientes y no tan buenos

¿Cuáles son algunos proyectos de investigación interesantes relacionados con el aprendizaje automático?

¿Cómo compararías hacer un doctorado en ML (principalmente aprendizaje profundo) en Duke, UC Irvine y Georgia Tech?

¿Cuáles son las mejores medidas al validar de forma cruzada un modelo para determinar qué tan bueno es el modelo y cómo funcionará en situaciones reales?

¿Cuáles son algunas ideas importantes / brillantes en el aprendizaje automático?

¿Por qué el error cuadrático medio es equivalente a minimizar la entropía cruzada entre la distribución empírica y un modelo gaussiano?

¿Cuál es la diferencia entre ajuste de curva y regresión?

¿Cuál es la mejor herramienta para ejecutar un código de aprendizaje automático?

Web Analytics