¿La normalización de datos tiene otros beneficios además de acelerar el descenso del gradiente? Después de calcular los parámetros (pesos), ¿es necesario normalizar los casos de prueba proporcionados por el usuario para la predicción?

Q1:
Sí, la normalización de datos tiene otros beneficios además de acelerar el descenso del gradiente. De hecho, la razón más importante para la normalización de datos no es la aceleración, sino el hecho de que todas las características (columnas) en los datos deberían ser capaces de afectar el modelo que estamos entrenando.

Supongamos que tenemos 3 características, X1, X2, X3 y el valor Y que tenemos que predecir (problema de regresión lineal clásico).

Si todos los valores para X1 y X2 están en el rango de 0 a 0.5, y los valores de X3 están en el rango de 1000 a 10,000. Luego, mientras tratamos de minimizar el error de entrenamiento, X1 y X2 casi serán ignorados (aunque puedan ser muy importantes).

Es como dar a todas las funciones la misma posibilidad de efectuar la salida.

Q2: ¡Sí! Si entrenó al modelo en características normalizadas, debe hacer una predicción solo después de normalizar los casos de prueba.

More Interesting

¿Cuál es la diferencia entre la regularización y el sesgo inductivo en el aprendizaje automático?

¿Por qué es importante la ciencia de datos?

¿Cuáles son las implicaciones epistemológicas del hecho de que no podríamos haber programado conscientemente una red neuronal para hacer lo que hace?

¿Usaría WEKA o MATLAB para la clasificación binaria?

¿Qué algoritmo funciona mejor para bandidos adversarios?

¿El uso de memoria aumenta a medida que aumentan los datos de entrenamiento en redes neuronales profundas?

¿Cuál es la diferencia entre análisis de datos, ciencia de datos, big data y aprendizaje automático?

¿Qué es una explicación intuitiva de la convolución 1 × 1 en ConvNets?

¿Existe una definición matemática para una máquina de vectores de soporte?

¿Está bien usar kNN para este problema de clasificación de símbolos musicales?

¿Cuáles son algunos chatbots de IA de código abierto que usan aprendizaje automático?

¿Cómo puede ayudar una formación en procesamiento de señales en una carrera en ciencia de datos?

¿Cómo aprendió Ajit Rajasekharan tanta PNL?

Todos estos algoritmos de aprendizaje automático, ¿cuál es el punto? Parece que la elección del algoritmo de aprendizaje automático, el árbol de decisión, la red neuronal, svm, no es tan importante como la selección de características y el proceso de extracción de características que determina lo que entra, basura en basura, ese tipo de cosas.

¿Cuáles son los mejores software de aprendizaje automático de código abierto para reconocimiento facial?