Cómo eliminar una fila completa de un conjunto de datos si encuentro entradas faltantes en R

Las entradas que faltan en R se representan como NA. NA no es una cadena. Para identificar las filas con valor perdido (NA) en una columna en particular, utilizamos la siguiente función.

is.na (vector). Devolverá VERDADERO o FALSO.

v1 <- c (1, 2, 3, NA, 5) # is.na (v1) dará como resultado: FALSO, FALSO, FALSO, VERDADERO, FALSO

v2 <- c ("A", "NA", NA, "D") # is.na (v1) dará como resultado: FALSO, FALSO, VERDADERO, FALSO

Si desea eliminar todas las filas que contienen NA en cualquier columna, simplemente use na.omit. También existe la opción na.exclude .

Si desea eliminar filas que contienen NA en una columna en particular, busque el subconjunto.

is.na (dataframeName $ columnName) .

Si también está considerando “” (en blanco) como valores faltantes, se puede utilizar el siguiente código.

filterdf <- dataframeName [! (is.na (dataframeName $ columnName) | dataframeName $ columnName == “”),]

Puede implementar la solución usando con la declaración.

También en R hay múltiples formas de hacer lo mismo. Podemos configurar todo “” (en blanco) en NA y luego usar complete.cases (df). Devuelve un vector lógico que indica qué casos están completos, es decir, no tienen valores faltantes.

dataframeName [dataframeName == “”] <- NA

dataframeName <-dataframeName [complete.cases (dataframeName),]

Si está buscando eliminar los valores de NA de un marco de datos, puede usar:

na.omit (myDataset)

Si desea eliminarlos de un vector o lista, puede usar:

myDataset <- myDataset [! is.na (myDataset)]

Espero que esto haya ayudado 🙂

More Interesting

¿Cuál es una buena manera de elegir los puntos iniciales de los grupos de k en el grupo de medios k?

En la capacitación de CNN, ¿también se actualizan los pesos correspondientes al mapa de características?

¿Puedo confiar en un modelo de clasificación con validación cruzada y precisión de prueba decentes incluso si el número de observaciones es menor que el de las características?

¿En qué año la publicidad de AI / Machine Learning se pondrá al día con la realidad?

¿Qué es mejor para una implementación de juego de 20 preguntas, redes neuronales o árboles de decisión?

¿R necesita una herramienta de flujo de trabajo visual como RapidMiner y Knime?

¿Los analistas de datos serán reemplazados por aprendizaje automático e inteligencia artificial pronto?

¿Qué tema es adecuado para un taller de aprendizaje automático para estudiantes de secundaria típicos?

¿Qué modelo / algoritmo de ML utilizo?

¿Cuáles son algunos desarrollos interesantes pero pasados ​​por alto en la investigación de ML?

¿Cómo se ve afectada la propagación hacia atrás en NN recurrentes?

¿Qué es una explicación intuitiva de la convolución 1 × 1 en ConvNets?

¿Cuáles son algunos ejemplos de empresas no tecnológicas que crean valor a través del uso de Big Data y qué tecnologías específicas están utilizando, por ejemplo, Hadoop, sistemas dedicados, SAP en formas novedosas, piratas informáticos, etc.

¿Cómo puede beneficiarse el sector financiero con el uso de LD y AI?

Aprendizaje automático: al construir un modelo de regresión lineal, ¿cómo decido entre variar el grado del polinomio y variar el parámetro de regularización?