save()
y load()
serán familiares para muchos usuarios de R. Le permiten guardar un objeto R con nombre en un archivo u otra conexión y restaurar ese objeto nuevamente. Cuando se carga, el objeto nombrado se restaura al entorno actual (en general, este es el entorno global, el espacio de trabajo) con el mismo nombre que tenía cuando se guardó.
Guardar en formato de datos R
write.csv()
y write.table()
son mejores para la interoperabilidad con otros programas de análisis de datos. Sin embargo, no conservarán atributos especiales de las estructuras de datos, como si una columna es un tipo de carácter o factor, o el orden de los niveles en los factores. Para hacer eso, debe escribirse en un formato especial para R.
- ¿Cuál es el mejor campo para aprender y ganar, base de SAP o ciencia de datos?
- ¿Cuál es la progresión profesional típica de un científico de datos, gerente financiero o gerente de programa?
- ¿Puedo trabajar como contratista / consultor independiente en el campo de la ciencia de datos?
- ¿Cuáles son las herramientas de minería / raspado web más comunes utilizadas actualmente?
- ¿Hay alguna similitud entre el desarrollo front-end y la ciencia de datos?
A continuación hay tres formas principales de hacer esto:
El primer método es generar el código fuente R que, cuando se ejecuta, volverá a crear el objeto. Esto debería funcionar para la mayoría de los objetos de datos, pero es posible que no pueda recrear fielmente algunos objetos de datos más complicados.
# Guardar en un formato de texto que se puede cargar fácilmente en R
dump (“datos”, “datos.Rdmpd”)
# Puede guardar múltiples objetos:
dump (c (“datos”, “datos1”), “datos.Rdmpd”)
# Para cargar los datos nuevamente:
fuente (“data.Rdmpd”)
# Cuando se carga, los nombres de datos originales se utilizarán automáticamente.
El siguiente método es escribir objetos de datos individuales en formato RDS. Este formato puede ser binario o ASCII. Binary es más compacto, mientras que ASCII será más eficiente con sistemas de control de versiones como Git.
# Guardar un solo objeto en formato binario RDS
saveRDS (datos, “datos.rds”)
# O, usando el formato ASCII
saveRDS (data, “data.rds”, ascii = TRUE)
# Para cargar los datos nuevamente:
data <- readRDS ("data.rds")
También es posible guardar múltiples objetos en un solo archivo, utilizando el formato RData.
# Guardar múltiples objetos en formato binario RData
save (data, file = “data.RData”)
# O, usando el formato ASCII
guardar (datos, archivo = “datos.RData”, ascii = VERDADERO)
# Puede guardar múltiples objetos
save (data, data1, file = “data.RData”)
# Para cargar los datos nuevamente:
carga (“data.RData”)
Una diferencia importante entre saveRDS()
y save()
es que, con el primero, cuando readRDS()
los datos de readRDS()
, especifica el nombre del objeto, y con el segundo, cuando load()
los datos, el objeto original los nombres se usan automáticamente. El uso automático de los nombres de objetos originales a veces puede simplificar un flujo de trabajo, pero también puede ser un inconveniente si el objeto de datos está destinado a ser distribuido a otros para su uso en un entorno diferente.
Referencia: escribir datos en un archivo