Dado que la pregunta no se hace correctamente; aún así intentaré responderlo según mi entendimiento. La regresión en teoría es fácil de entender pero muy compleja de interpretar. Los principales puntos de regresión para mí son:
- Métricas de precisión: según el modelo, las métricas de precisión difieren como R cuadrado en lineal, AIC / BIC en logística, etc.
- Varianza y sesgo: debe haber un equilibrio entre la varianza y el sesgo de su modelo. Podría haber un caso en el que su modelo sea 100% preciso con datos de prueba, pero eso no significa que su modelo sea correcto. Significa claramente que el modelo está demasiado ajustado. (¡Espero que sepas lo que significa un ajuste excesivo!)
- Importancia de las variables: si su modelo tiene muchas variables y las métricas de precisión son excelentes. Yo recomendaría verificar las variables importantes de su modelo ya que algunas de las variables pueden tener un impacto insignificante en su variable dependiente. Por lo tanto, filtrar esas variables es imprescindible
- Exploración de datos: el 80% del tiempo en el modelo de construcción se debe / debe dedicar solo a la exploración de datos. Sin explorar sus datos (variables dependientes / independientes) no puede distinguir qué modelo se utilizará. O como tratar las variables
Estos son algunos consejos o “puntos importantes” en la regresión que podría pensar en este momento. Espero haber respondido tu pregunta. ¡Salud!
- ¿Por qué las redes neuronales artificiales son "cajas negras"?
- ¿Puede la coincidencia de patrones funcionar en la clasificación de imágenes en color con SVM?
- En la curva ROC, cualquier punto es resultado del modelo en un parámetro particular. No estoy claro por qué el adivinador aleatorio está en x = y y no siempre (0.5, 0.5). ¿También cómo interpretar el área bajo la curva?
- Cómo decidir si usar modelos de aprendizaje automático supervisados o de refuerzo
- ¿Cómo se determina el tamaño del paso de actualización para el algoritmo de retropropagación ADADELTA?