Hay dos escenarios cuando necesita imputar los valores faltantes.
- Imputar valor de variable única
- Imputar valores de variables múltiples
- Imputar valores de variables de caracteres
- Imputar valores de variables numéricas
- Imputar ambos tipos de valores de variables
Ahora déjame decirte cómo puedes reemplazar los valores faltantes.
Primero debemos tener en cuenta algunos puntos de las variables SAS, como los valores perdidos están representados por un punto (.) En SAS, mientras que los valores de caracteres están representados por un espacio en blanco en SAS, por lo tanto, podemos usar esta lógica para reemplazar los valores faltantes.
- ¿Qué tan difícil es el aprendizaje automático?
- ¿Qué arquitectura / herramientas usan los gigantes tecnológicos como Facebook / Amazon / Apple / Microsoft para el análisis de big data / ML?
- ¿Dónde puedo obtener un conjunto de datos de notas de suicidio para fines de aprendizaje automático?
- ¿Cómo explicaría el concepto de una capa convolucional en una red profunda a una persona no técnica?
- En una red neuronal recurrente, ¿por qué proporcionamos una secuencia de observaciones como entrada (longitud fija) en lugar de alimentar una observación tras otra con respecto al tiempo?
A continuación se muestra el ejemplo para reemplazar los valores faltantes de las variables individuales utilizando el código SAS de Data Step.
Variables individuales de imputación de valores.
Datos new_dataset;
establecer old_dataset_with_missing_values;
si falta (var1), entonces var1 = 0;
correr;
podemos usar si var1 =. entonces var1 = 0; también, mientras que la función que falta es inteligente para deducir la falta en función de cualquier tipo de variables que se le pasen.
Imputación de valores de variables múltiples
Debemos tener conocimiento de la matriz y los bucles SAS para imputar los valores de múltiples variables.
Datos new_dataset (drop = i);
establecer old_dataset_with_missing_values;
array var (*) _numeric_;
do i = 1 a dim (var);
si falta (var [i]), entonces var [i] = 0;
fin;
correr;
El programa anterior reemplazará los valores de todas las variables numéricas en el conjunto de datos. puede usar _CHARACTER_ en lugar de _NUMERIC_ para reemplazar los valores de todas las variables de caracteres. Puede usar la lógica de matriz y bucle dos veces para reemplazar todas las variables numéricas y de caracteres porque la matriz SAS no puede mantener las variables numéricas y de caracteres juntas usando _ALL_ en lugar de usar _NUMERIC_ y _CHARACTER_ .
Deseo que mi respuesta ayude.
Remita amablemente nuestro sitio web a aquellos que desea aprender SAS como nivel experto con escenarios reales en vivo.