¿Cómo se relaciona el error cuadrático medio (RMSE) y la clasificación?

El RMSE mide la desviación estándar de las predicciones de la verdad del terreno. Esta es la relación entre RMSE y clasificación.

¿El RMSE es apropiado para la clasificación? El RMSE es una forma de medir el rendimiento de un clasificador. La tasa de error (o número de clasificación errónea) es otra. Si nuestro objetivo es un clasificador con baja tasa de error, RMSE es inapropiado y viceversa.

Para ver esto, consideramos un problema de clasificación de dos clases con etiquetas de clase [math] y = {0, 1}. [/ Math] Supongamos que tenemos un clasificador [math] f (x) [/ math] que toma valores de intervalo [matemática] [0, 1] [/ matemática]. Decidimos para la clase [matemáticas] y = 1 [/ matemáticas] si [matemáticas] f (x)> 0.5 [/ matemáticas] y la clase [matemáticas] y = 0 [/ matemáticas] de lo contrario.

Supongamos que tenemos dos ejemplos de prueba [matemática] (x_1, y_1) [/ matemática] y [matemática] (x_2, y_2) [/ matemática] con etiquetas de clase conocidas. Asumimos que

[matemáticas] y_1 = 1 [/ matemáticas]
[matemáticas] y_2 = 0 [/ matemáticas]

Nuestro clasificador predice [matemáticas] f (x_1) = z_1 [/ matemáticas] y [matemáticas] f (x_2) = z_2 [/ matemáticas]. Las predicciones [math] z = ([/ math] [math] z_1, z_2) [/ math] del clasificador [math] f [/ math] forman un punto en un cuadrado unitario:

Los vértices del cuadrado muestran todas las etiquetas posibles de [matemáticas] x_1 [/ matemáticas] y [matemáticas] x_2 [/ matemáticas]. El vértice [matemática] (1, 0) [/ matemática] resaltado por la bola negra muestra las etiquetas de verdad básica de [matemática] x_1 [/ matemática] y [matemática] x_2 [/ matemática]. Si el punto [matemáticas] z = (z_1, z_2) [/ matemáticas] se encuentra en el …

… cuadrado verde, entonces el clasificador clasifica correctamente ambos ejemplos
… cuadrado amarillo, entonces el clasificador clasifica erróneamente un ejemplo
… cuadrado rojo, entonces el clasificador clasifica erróneamente ambos ejemplos

Como [math] z [/ math] se encuentra en el cuadrado verde, el clasificador [math] f [/ math] clasifica correctamente ambos ejemplos.

Los círculos azules muestran puntos de RMSE constante. Vemos que el punto [math] u [/ math] tiene un RMSE más bajo que el punto [math] v [/ math], pero [math] u [/ math] clasifica erróneamente ambos ejemplos y [math] v [/ math] solo un ejemplo .

Este ejemplo indica por qué RMSE no es útil cuando realmente estamos interesados en la tasa de error. Un RMSE más bajo (más alto) no implica una tasa de error más baja (más alta).

¿Cómo combinaría Apache Spark y CUDA para implementar un marco de aprendizaje profundo?

¿Qué es el reconocimiento óptico de caracteres (OCR)?

Cómo aplicar ConvNet en el análisis de sentimientos

Después de lograr una precisión de aproximadamente el 82% en los datos de prueba mediante regresión logística, ¿cómo puedo estar seguro / seguro de que mi algoritmo se generalizará bien para toda la población?

En el aprendizaje automático, ¿por qué las submuestras de un conjunto de muestra general se llaman pliegues?

Si no tengo experiencia en aprendizaje automático o investigación computacional, pero tengo antecedentes estadísticos, ¿es posible hacer investigación en esta área en la escuela de posgrado o hacer una pasantía?

¡Tanto Shehroz Khan como Prashanth Ravindran dieron una buena respuesta! De hecho, RMSE es una métrica de error comúnmente utilizada para medir el rendimiento de los modelos de regresión.

Un ejemplo viene a la mente donde los dos conceptos, RMSE y clasificación, están (muy) distantemente relacionados: el clasificador Adaline (Adaptive Linear Neuron). De manera similar a la regresión lineal de OLS, utiliza una función de costo de “suma de errores al cuadrado” o “error al cuadrado medio” que el algoritmo intenta minimizar para aprender los pesos óptimos. Pero tenga en cuenta que esto se usa para la parte de optimización (convexa) y no para medir el “rendimiento del clasificador”. Para este último, estaría interesado en la precisión (o error), recuperación, precisión, área ROC debajo de la curva, etc.

Shehroz Khan

No están relacionados
Además de la respuesta de Prashanth Ravindran, RMSE se usa en regresión. En la regresión, la variable predictora es un número real, por lo tanto, para medir la calidad del valor pronosticado de algún algoritmo X, necesita encontrar algún tipo de diferencia entre ellos. Para ello, calcula el cuadrado del error, toma la media de todos los objetos de prueba y toma la raíz cuadrada; esto te dará una ‘puntuación’ real que indica cierta confianza en lo bueno o malo que estás haciendo. Un RMSE pequeño significa una buena predicción y grande significa un mal modelo.

En la clasificación, tiene etiquetas de clase (finitas y contables), que no corresponden a números. Por lo tanto, no puede usar RMSE porque es difícil encontrar la diferencia entre, por ejemplo, la etiqueta ‘a’ y ‘b’. Por lo tanto, prueba otras medidas como precisión, media geométrica, precisión, recuperación, ROC, etc.

Shehroz Khan

Mi opinión sobre esto es que definitivamente depende del tipo de clasificador. Si estamos tomando un clasificador binario, entonces RMSE parece tener sentido. No recomendaría usar RMSE como el único medio para comprender qué tan bien está clasificando su clasificador. Pero puede arrojar algo de luz.

RMSE generalmente le indica qué tan distante está su modelo de dar la respuesta correcta.

Entonces, en un clasificador binario, la raíz cuadrada de la media de la suma de todas las instancias (cada instancia será 1 / -1) donde su clasificador binario ha salido mal será un número en la escala de 0 a 1, que muestra qué tan bueno (más cerca de 1) o qué tan mal (más cerca de 0) está haciendo su clasificador.

Agregue comentarios sobre dónde podría estar equivocado / correcto.

Beyash Jaya

El error cuadrático medio o RMSE es una medida de rendimiento. Se utiliza principalmente para problemas de regresión. Para la clasificación, la precisión de la clasificación es una medida más apropiada.

Beyash Jaya

More Interesting

¿Qué tipo de aumento de datos se puede usar para imágenes médicas?

¿Para qué tipo de problemas de aprendizaje automático no sería adecuado el aprendizaje profundo?

¿Cómo y dónde podemos comenzar a implementar proyectos basados en el aprendizaje automático y qué idioma es preferible para el mismo?

¿Cómo se pueden adaptar los sistemas de recomendación para recomendar elementos que atraigan a todos en un grupo, en lugar de a un solo individuo?

Cómo calcular la retropropagación en una capa de agrupación promedio global

En la clasificación SVM, ¿es posible encontrar la muestra de entrenamiento más cercana a la muestra de prueba dada?

¿El aprendizaje automático está reemplazando la teoría de control tradicional?

Cómo encontrar un patrón repetido en una imagen

Cómo extraer términos importantes de datos de texto no estructurados

¿Se puede trabajar en Machine Learning con un doctorado en estadísticas?