¿Qué son las redes amplias?

tl; dr: Básicamente es una rediseño normal con más mapas de características y algunos otros ajustes

La “profundidad” de una red neuronal es el número de capas, pero el “ancho” generalmente se refiere al número de neuronas por capa, o para las capas convolucionales, el número de mapas de características por capa. – Una capa convolucional con 64 mapas de características tendrá 64 tensores de parámetros diferentes alrededor de su volumen de entrada, por lo que su volumen de salida será de 64 neuronas de profundidad. Si esto suena confuso, consulte esta página de Redes neuronales convolucionales CS231n.

Una capa más amplia puede aprender más características diferentes, pero tendrá más parámetros que deben optimizarse y será más vulnerable al sobreajuste.

Por lo tanto, una red ancha es solo una red con más mapas de características en sus capas convolucionales. Los resnets pueden hacerse extremadamente profundos sin perder precisión, pero en https://arxiv.org/pdf/1605.07146… intentan aumentar el ancho de los resnets por factores de 2–12 y obtienen buenos resultados. También experimentan cambiando el número de capas en cada bloque residual, agregando abandono dentro de los bloques res y agregando convoluciones 1 × 1 en algunos bloques.

More Interesting

¿Apache Spark es un buen marco para implementar Reinforcement Learning?

¿Cómo funcionan los algoritmos súper recursivos en CUDA?

¿Cuáles son los principales puntos de regresión?

¿Cuáles son algunos métodos de aprendizaje automático supervisados ​​y no supervisados ​​para trabajar con conjuntos de datos que tienen características muy grandes y un bajo número de muestras?

¿Cuáles son algunos buenos indicadores para ideas de proyectos en biología computacional?

¿Cuáles son los mejores libros de aprendizaje automático para principiantes?

¿Es el "grado de libertad" en el aprendizaje automático igual al número de variables independientes o el número de parámetros?

¿Cuál es la diferencia entre el filtrado basado en contenido y el filtrado colaborativo?

¿Qué es el aprendizaje activo?

Cómo medir qué tan bueno es un modelo generativo

¿Es útil R para aprender a investigar en planificación urbana, economía y diseño?

¿Qué formación matemática se necesita para aprender Deep Learning?

¿Soy un desarrollador de dinosaurios si no uso Github, no conozco CI / CD y docker y solo conozco el aprendizaje profundo de la palabra de moda?

¿Por qué una gran proporción de los nuevos estudiantes de CS optan por especializarse en áreas más nuevas como el aprendizaje automático, la informática social y la informática móvil en lugar de las más antiguas como los sistemas, la arquitectura y las redes?

¿Por qué los diseñadores o los PM deben aprender sobre el aprendizaje automático?