Tengo una respuesta en otro foro. Pensé que sería útil para otros:
“El valor RMSE depende del rango de valores, ya que es una medida de error.
Por ejemplo, si está tratando de predecir la cantidad de tiempo que un proceso de computadora tomará su error, es probable que sea en minutos o segundos (o menos). Alternativamente, si está intentando predecir la cantidad de tiempo que llevará construir una casa, puede llevar días o semanas.
Ser incorrecto por una hora es un gran error en el primer ejemplo, pero es casi insignificante en el segundo ejemplo. Entonces, un RMSE de treinta segundos para un proceso de computadora podría significar lo mismo que un RMSE de 12 horas para construir una casa. Por lo tanto, realmente no se puede usar para comparar modelos que predicen valores diferentes, solo modelos que predicen lo mismo.
- ¿Cómo cambiará Google Brain el futuro de la búsqueda?
- ¿Qué universidades de la India son buenas para realizar investigaciones en el aprendizaje por refuerzo?
- ¿Qué tan exitoso ha sido el modelo tópico LDA en la categorización de imágenes?
- ¿Todavía es necesario aprender LDA (distribución de Dirichlet latente)?
- En Data Science, ¿cuáles son algunos proyectos específicos de la industria del juego?
En cuanto a su otra pregunta, cuando RMSE está disminuyendo, significa que algún error en la predicción del modelo está disminuyendo. Este es un problema menor de correlación, ya que se trata de precisión. En otras palabras, cuando dices que la casa X tomará Y días para construir, ¿qué tan cerca de los días Y tarda en promedio?
Por supuesto, es un poco diferente al simple error absoluto, ya que el acto de cuadrar los errores antes de promediarlos puede amplificar el impacto de errores más grandes (el error de 4 se convierte en 16). Si su problema es puramente de correlación, se puede calcular el cálculo de Pearson entre las predicciones del modelo y los valores reales, si lo desea ”