Hay un documento sobre Redes residuales profundas llamado: Las redes residuales son conjuntos exponenciales de redes relativamente superficiales que puede encontrar aquí:
[1605.06431] Las redes residuales son conjuntos exponenciales de redes relativamente poco profundas
Y aquí está el resumen:
- Cómo multiplicar elementos de matriz sin usar bucle
- ¿Aproximadamente cuánto más rápido es el GCD binario que el algoritmo euclidiano para la aritmética de precisión fija en las computadoras actuales?
- Además del algoritmo de tallado de costura, ¿qué otros algoritmos se pueden usar para Image Resizer?
- Cómo eliminar duplicados en un vector C ++ y también si solo quiero elementos duplicados
- Cómo construir robots enjambre
En este trabajo, presentamos una interpretación novedosa de redes residuales que muestran que son conjuntos exponenciales. Esta observación está respaldada por un estudio de lesiones a gran escala que demuestra que se comportan como conjuntos en el momento de la prueba. Posteriormente, realizamos un análisis que muestra que estos conjuntos consisten principalmente en redes que son relativamente poco profundas. Por ejemplo, contrariamente a nuestras expectativas, la mayor parte del gradiente en una red residual con 110 capas proviene de un conjunto de redes muy cortas, es decir, solo 10-34 capas de profundidad. Esto sugiere que, además de describir las redes neuronales en términos de ancho y profundidad, hay una tercera dimensión: la multiplicidad, el tamaño del conjunto implícito. En última instancia, las redes residuales no resuelven el problema del gradiente que desaparece al preservar el flujo del gradiente en toda la profundidad de la red, sino que evitan el problema simplemente al unir muchas redes cortas. Esta idea revela que la profundidad sigue siendo una pregunta de investigación abierta e invita a explorar la noción relacionada de multiplicidad.
Compruébelo y tal vez le dará más información sobre su pregunta.