Cómo eliminar una fila completa de un conjunto de datos si encuentro entradas faltantes en R

Las entradas que faltan en R se representan como NA. NA no es una cadena. Para identificar las filas con valor perdido (NA) en una columna en particular, utilizamos la siguiente función.

is.na (vector). Devolverá VERDADERO o FALSO.

v1 <- c (1, 2, 3, NA, 5) # is.na (v1) dará como resultado: FALSO, FALSO, FALSO, VERDADERO, FALSO

¿Cómo puede un estudiante de primer año en la universidad comenzar su viaje para una carrera en ML e IA?
Cómo calcular la precisión y recordar para la clasificación, donde ambas clases son igualmente importantes
¿Cómo se emplea una parada temprana en TensorFlow?
Cómo aprender los conceptos básicos del aprendizaje automático dentro de una semana para una entrevista de trabajo
¿De qué sirve el aprendizaje automático en la predicción de resultados de cricket?

v2 <- c ("A", "NA", NA, "D") # is.na (v1) dará como resultado: FALSO, FALSO, VERDADERO, FALSO

Si desea eliminar todas las filas que contienen NA en cualquier columna, simplemente use na.omit. También existe la opción na.exclude .

Si desea eliminar filas que contienen NA en una columna en particular, busque el subconjunto.

is.na (dataframeName $ columnName) .

Si también está considerando “” (en blanco) como valores faltantes, se puede utilizar el siguiente código.

filterdf <- dataframeName [! (is.na (dataframeName $ columnName) | dataframeName $ columnName == “”),]

Puede implementar la solución usando con la declaración.

También en R hay múltiples formas de hacer lo mismo. Podemos configurar todo “” (en blanco) en NA y luego usar complete.cases (df). Devuelve un vector lógico que indica qué casos están completos, es decir, no tienen valores faltantes.

dataframeName [dataframeName == “”] <- NA

dataframeName <-dataframeName [complete.cases (dataframeName),]

Aprendizaje automáticoConjuntos de datosR

Related Content

¿Cómo se puede modelar la interacción Radar y Jammer a través del aprendizaje automático?

Cómo encontrar grupos en estos datos

¿Cuál es la mejor manera de predecir una clase +/- en un escenario de aprendizaje automático donde tengo k características trinarias y un conjunto de datos del orden de cientos o miles?

Quiero cambiar mi flujo de .NET a Big Data o Machine Learning. ¿Como empiezo?

¿Qué consejo le darías a los estudiantes de doctorado que comienzan su doctorado en aprendizaje automático?

Me apasionan tanto la seguridad de la red o la piratería como también la inteligencia artificial y el aprendizaje automático. ¿Por cuál debo ir?

¿Quién se beneficia de un ataque masivo de DDoS en Dyn?

Si está buscando eliminar los valores de NA de un marco de datos, puede usar:

na.omit (myDataset)

Si desea eliminarlos de un vector o lista, puede usar:

myDataset <- myDataset [! is.na (myDataset)]

Espero que esto haya ayudado 🙂

Amit Singh Rathore

More Interesting

¿Cuál es una buena manera de elegir los puntos iniciales de los grupos de k en el grupo de medios k?

En la capacitación de CNN, ¿también se actualizan los pesos correspondientes al mapa de características?

¿Puedo confiar en un modelo de clasificación con validación cruzada y precisión de prueba decentes incluso si el número de observaciones es menor que el de las características?

¿En qué año la publicidad de AI / Machine Learning se pondrá al día con la realidad?

¿Qué es mejor para una implementación de juego de 20 preguntas, redes neuronales o árboles de decisión?

¿R necesita una herramienta de flujo de trabajo visual como RapidMiner y Knime?

¿Los analistas de datos serán reemplazados por aprendizaje automático e inteligencia artificial pronto?

¿Qué tema es adecuado para un taller de aprendizaje automático para estudiantes de secundaria típicos?

¿Qué modelo / algoritmo de ML utilizo?

¿Cuáles son algunos desarrollos interesantes pero pasados por alto en la investigación de ML?

¿Cómo se ve afectada la propagación hacia atrás en NN recurrentes?

¿Qué es una explicación intuitiva de la convolución 1 × 1 en ConvNets?

¿Cuáles son algunos ejemplos de empresas no tecnológicas que crean valor a través del uso de Big Data y qué tecnologías específicas están utilizando, por ejemplo, Hadoop, sistemas dedicados, SAP en formas novedosas, piratas informáticos, etc.

¿Cómo puede beneficiarse el sector financiero con el uso de LD y AI?

Aprendizaje automático: al construir un modelo de regresión lineal, ¿cómo decido entre variar el grado del polinomio y variar el parámetro de regularización?

Web Analytics