El RMSE mide la desviación estándar de las predicciones de la verdad del terreno. Esta es la relación entre RMSE y clasificación.
¿El RMSE es apropiado para la clasificación? El RMSE es una forma de medir el rendimiento de un clasificador. La tasa de error (o número de clasificación errónea) es otra. Si nuestro objetivo es un clasificador con baja tasa de error, RMSE es inapropiado y viceversa.
Para ver esto, consideramos un problema de clasificación de dos clases con etiquetas de clase [math] y = {0, 1}. [/ Math] Supongamos que tenemos un clasificador [math] f (x) [/ math] que toma valores de intervalo [matemática] [0, 1] [/ matemática]. Decidimos para la clase [matemáticas] y = 1 [/ matemáticas] si [matemáticas] f (x)> 0.5 [/ matemáticas] y la clase [matemáticas] y = 0 [/ matemáticas] de lo contrario.
- ¿Cuál es el mejor marco de minería de datos?
- He asignado mis pesos (w) a un múltiple multinomial (o k-simplex), dividiendo cada componente de w por la suma de todos los componentes. ¿Cómo realizo la regularización (equivalente a l1 o l2) en el nuevo espacio multinomial múltiple (k-simplex)?
- ¿Qué tipo de modelos o técnicas de aprendizaje automático deberían usarse en los datos de la marca de tiempo del lote (por ejemplo, temperatura durante 2 horas)?
- ¿Cómo funciona la detección de rostros?
- ¿Cómo se pueden engañar los modelos de clasificación existentes?
Supongamos que tenemos dos ejemplos de prueba [matemática] (x_1, y_1) [/ matemática] y [matemática] (x_2, y_2) [/ matemática] con etiquetas de clase conocidas. Asumimos que
- [matemáticas] y_1 = 1 [/ matemáticas]
- [matemáticas] y_2 = 0 [/ matemáticas]
Nuestro clasificador predice [matemáticas] f (x_1) = z_1 [/ matemáticas] y [matemáticas] f (x_2) = z_2 [/ matemáticas]. Las predicciones [math] z = ([/ math] [math] z_1, z_2) [/ math] del clasificador [math] f [/ math] forman un punto en un cuadrado unitario:
Los vértices del cuadrado muestran todas las etiquetas posibles de [matemáticas] x_1 [/ matemáticas] y [matemáticas] x_2 [/ matemáticas]. El vértice [matemática] (1, 0) [/ matemática] resaltado por la bola negra muestra las etiquetas de verdad básica de [matemática] x_1 [/ matemática] y [matemática] x_2 [/ matemática]. Si el punto [matemáticas] z = (z_1, z_2) [/ matemáticas] se encuentra en el …
- … cuadrado verde, entonces el clasificador clasifica correctamente ambos ejemplos
- … cuadrado amarillo, entonces el clasificador clasifica erróneamente un ejemplo
- … cuadrado rojo, entonces el clasificador clasifica erróneamente ambos ejemplos
Como [math] z [/ math] se encuentra en el cuadrado verde, el clasificador [math] f [/ math] clasifica correctamente ambos ejemplos.
Los círculos azules muestran puntos de RMSE constante. Vemos que el punto [math] u [/ math] tiene un RMSE más bajo que el punto [math] v [/ math], pero [math] u [/ math] clasifica erróneamente ambos ejemplos y [math] v [/ math] solo un ejemplo .
Este ejemplo indica por qué RMSE no es útil cuando realmente estamos interesados en la tasa de error. Un RMSE más bajo (más alto) no implica una tasa de error más baja (más alta).