No he hecho ninguna regresión polinómica fraccional antes y, por lo tanto, tengo cero experiencia “real” o conocimientos sobre cómo completar los datos faltantes.
Dicho esto, si tuviera que trabajar en este problema, realizaré el siguiente método (es un enfoque genérico de ML que uso a menudo):
- Investigue [matemática] N [/ matemática] (cuanta más potencia de cálculo tenga, mayor será) formas plausibles de completar los datos faltantes en este escenario. Podría ser con la mediana, la media, una media local (dada una ventana deslizante), el valor más común y muchas otras opciones.
- Elija un método, complete los datos faltantes y realice la regresión
- Calcule la métrica de evaluación para su problema (en un conjunto de prueba)
- Repita los dos pasos anteriores para cubrir los métodos [matemáticos] N [/ matemáticos]
- Elija el que tenga el mejor rendimiento (estadístico). Si este método es el mejor pero es computacionalmente muy costoso, elija la segunda mejor opción (y así sucesivamente).
Espero que esto haya sido útil a pesar de la falta de precisión.
- ¿Es cierto que la mayoría de los científicos de datos tienen al menos un título de maestría o doctorado?
- ¿Cuál es una excelente manera de aprender a usar las funciones en paquetes como Ggplot2 y Pandas en R y Python?
- ¿Por qué el Titanic de Kaggle: Machine Learning del desastre es un problema de aprendizaje supervisado?
- ¿Es legal enviar datos de Kaggle a GitHub?
- ¿Es Ruby un buen lenguaje para la ciencia de datos?