Pruebe con un árbol de decisión: toman los valores faltantes como una categoría separada y los usan efectivamente como predictores.
Para otros modelos, asigne un valor especial a sus valores faltantes. Es posible que desee incluir tanta información como sea posible sobre el tipo de valor perdido que es (por ejemplo: “-1” para un tipo de falta que no se observa, y “-2” para un tipo de falta que surgió de una selección que hiciste).
Es posible que pueda deducir que el valor es realmente “0”, por ejemplo, porque falta significa que la persona no completó el cuestionario.
- ¿Cuál es el mejor instituto de capacitación en análisis de datos en Delhi?
- ¿Cuánto tiempo se necesita para invertir en competencias de kaggle?
- Filosofía de la ciencia: ¿La investigación basada en simulación es experimental o teórica?
- ¿Qué clases debo tomar en Oxford para convertirme en científico de datos?
- ¿Cuáles son los mejores libros sobre ciencia de datos?
Una última opción es imputar el valor al observar observaciones similares que tienen un valor para la variable que falta.
El mensaje principal aquí es: ser concienzudo, tomar una decisión, registrar su decisión y seguir adelante (teniendo en cuenta lo que hizo para no tener accidentes en la interpretación más adelante).