¿La normalización de datos tiene otros beneficios además de acelerar el descenso del gradiente? Después de calcular los parámetros (pesos), ¿es necesario normalizar los casos de prueba proporcionados por el usuario para la predicción?

Q1:
Sí, la normalización de datos tiene otros beneficios además de acelerar el descenso del gradiente. De hecho, la razón más importante para la normalización de datos no es la aceleración, sino el hecho de que todas las características (columnas) en los datos deberían ser capaces de afectar el modelo que estamos entrenando.

Supongamos que tenemos 3 características, X1, X2, X3 y el valor Y que tenemos que predecir (problema de regresión lineal clásico).

Si todos los valores para X1 y X2 están en el rango de 0 a 0.5, y los valores de X3 están en el rango de 1000 a 10,000. Luego, mientras tratamos de minimizar el error de entrenamiento, X1 y X2 casi serán ignorados (aunque puedan ser muy importantes).

Es como dar a todas las funciones la misma posibilidad de efectuar la salida.

Q2: ¡Sí! Si entrenó al modelo en características normalizadas, debe hacer una predicción solo después de normalizar los casos de prueba.

Related Content

Suponga que la máquina es multinúcleo, el tiempo de ejecución de un programa en una máquina que ejecuta solo ese proceso es igual al tiempo de ejecución en una máquina en la que hay otros procesos ejecutados junto con él, ¿no es así?

Quiero aprender el procesamiento del lenguaje natural en CMU. ¿Es mejor tomarlo como un estudiante de CS o tomarlo como un estudiante de lingüística (como una electiva)?

¿La agrupación es indispensable en el aprendizaje profundo?

¿Habrá una demanda de aceleradores de hardware para algoritmos de aprendizaje automático en el futuro cercano?

¿Cuáles son las mejores conferencias y revistas sobre aprendizaje automático?

Cómo hackear el wifi de mi universidad y obtener información de lo que mis amigos están buscando en la web

¿Qué parámetros en los datos de entrenamiento / prueba deben considerarse para decidir la elección de un método de clasificación de aprendizaje automático (fuera de SVM, red neuronal, regresión logística, etc.)?

More Interesting

¿Cuál es la diferencia entre la regularización y el sesgo inductivo en el aprendizaje automático?

¿Por qué es importante la ciencia de datos?

¿Cuáles son las implicaciones epistemológicas del hecho de que no podríamos haber programado conscientemente una red neuronal para hacer lo que hace?

¿Usaría WEKA o MATLAB para la clasificación binaria?

¿Qué algoritmo funciona mejor para bandidos adversarios?

¿El uso de memoria aumenta a medida que aumentan los datos de entrenamiento en redes neuronales profundas?

¿Cuál es la diferencia entre análisis de datos, ciencia de datos, big data y aprendizaje automático?

¿Qué es una explicación intuitiva de la convolución 1 × 1 en ConvNets?

¿Existe una definición matemática para una máquina de vectores de soporte?

¿Está bien usar kNN para este problema de clasificación de símbolos musicales?

¿Cuáles son algunos chatbots de IA de código abierto que usan aprendizaje automático?

¿Cómo puede ayudar una formación en procesamiento de señales en una carrera en ciencia de datos?

¿Cómo aprendió Ajit Rajasekharan tanta PNL?

Todos estos algoritmos de aprendizaje automático, ¿cuál es el punto? Parece que la elección del algoritmo de aprendizaje automático, el árbol de decisión, la red neuronal, svm, no es tan importante como la selección de características y el proceso de extracción de características que determina lo que entra, basura en basura, ese tipo de cosas.

¿Cuáles son los mejores software de aprendizaje automático de código abierto para reconocimiento facial?

Web Analytics