Las entradas que faltan en R se representan como NA. NA no es una cadena. Para identificar las filas con valor perdido (NA) en una columna en particular, utilizamos la siguiente función.
is.na (vector). Devolverá VERDADERO o FALSO.
v1 <- c (1, 2, 3, NA, 5) # is.na (v1) dará como resultado: FALSO, FALSO, FALSO, VERDADERO, FALSO
- ¿Cómo puede un estudiante de primer año en la universidad comenzar su viaje para una carrera en ML e IA?
- Cómo calcular la precisión y recordar para la clasificación, donde ambas clases son igualmente importantes
- ¿Cómo se emplea una parada temprana en TensorFlow?
- Cómo aprender los conceptos básicos del aprendizaje automático dentro de una semana para una entrevista de trabajo
- ¿De qué sirve el aprendizaje automático en la predicción de resultados de cricket?
v2 <- c ("A", "NA", NA, "D") # is.na (v1) dará como resultado: FALSO, FALSO, VERDADERO, FALSO
Si desea eliminar todas las filas que contienen NA en cualquier columna, simplemente use na.omit. También existe la opción na.exclude .
Si desea eliminar filas que contienen NA en una columna en particular, busque el subconjunto.
is.na (dataframeName $ columnName) .
Si también está considerando “” (en blanco) como valores faltantes, se puede utilizar el siguiente código.
filterdf <- dataframeName [! (is.na (dataframeName $ columnName) | dataframeName $ columnName == “”),]
Puede implementar la solución usando con la declaración.
También en R hay múltiples formas de hacer lo mismo. Podemos configurar todo “” (en blanco) en NA y luego usar complete.cases (df). Devuelve un vector lógico que indica qué casos están completos, es decir, no tienen valores faltantes.
dataframeName [dataframeName == “”] <- NA
dataframeName <-dataframeName [complete.cases (dataframeName),]