¿Qué modelos CNN necesitan una norma de lote pero son lo suficientemente pequeños como para hacer una prueba muy rápida?

Los beneficios de la normalización por lotes en el entrenamiento de una red neuronal convolucional (CNN) aumentan cuanto más profunda es la red. Esto se debe a que reduce el ‘cambio covariable interno’, el cambio natural en los datos a medida que pasa a través de la CNN. Este problema empeora cuanto más profunda es la red, porque cada capa cambiará ligeramente la media y la varianza de sus entradas. Sin embargo, eso no significa que la norma de lotes aún no pueda mejorar el entrenamiento para una red más superficial, solo será una diferencia menos notable.

Puede intentar crear su propio modelo con una sola capa convolucional de entrada y aplicar la norma de lote a sus entradas. La siguiente capa puede ser su capa de salida lineal a softmax. Intente entrenar con y sin la norma del lote y observe lo que sucede. La precisión no será muy alta en ninguno de los casos, pero debería notar una diferencia.

Deep LearningMachine Learning

Related Content

¿Qué es la optimización de colonias de hormigas y cómo funciona en términos simples?

¿Alguien ha usado ML para hacer un diseño * no trivial * de algoritmos CS de bajo nivel (ver comentarios)?

En la optimización matemática, ¿por qué alguien usaría el descenso de gradiente para una función convexa? ¿Por qué no encontrarían simplemente la derivada de esta función y buscarían el mínimo de la manera tradicional?

¿Cuál es la diferencia entre una curva ROC y una curva de recuperación de precisión? ¿Cuándo debo usar cada uno?

¿Cómo funcionan las redes de propuestas regionales (RPN)?

¿Cómo rebobinar la película en mi cámara si el extremo ya no está pegado al recipiente? Qué tengo que hacer

¿Qué significan las hipótesis finita e infinita en el aprendizaje automático? Cuáles son las diferencias entre ellos?

More Interesting

¿Es demasiado tarde para sumergirme en Data Science, ya que se están desarrollando poderosas herramientas de aprendizaje automático y ya hay muchos científicos de datos hábiles?

¿Alguien usa alguna vez una red neuronal media de capa softmax en lugar de al final?

¿Dónde puedo encontrar cursos de aprendizaje automático y redes neuronales en la web?

Cómo saber si estoy hecho para el aprendizaje automático y las estadísticas

¿Por qué es tan importante aprender las redes neuronales convolucionales?

¿Cómo califica Kaggle los envíos?

¿Qué es más beneficioso para la comprensión general de la informática, el procesamiento del lenguaje natural o la teoría de la computación?

Cómo obtener todos los problemas de investigación en el aprendizaje por refuerzo

¿Cuáles son los mejores libros de aprendizaje automático para principiantes?

Cómo interpretar la salida de una red neuronal

Quiero aprender el procesamiento del lenguaje natural en CMU. ¿Es mejor tomarlo como un estudiante de CS o tomarlo como un estudiante de lingüística (como una electiva)?

La temperatura de la GPU lee 88 C cuando se entrena un LSTM en TensorFlow. ¿Es esto normal (y seguro)?

¿Es posible agregar una nueva entrada a la capa totalmente conectada justo antes del softmax en la CNN?

¿Cómo funcionan los bots de chat desde una perspectiva de Machine Learning?

Cómo explicar intuitivamente los tensores

Web Analytics