Documentos de Académico
Documentos de Profesional
Documentos de Cultura
=! agregar) write_file ("a, b, c \ n1,2,3 \ n4,5, NA", "archivo.csv") read_csv (f, saltar = 1) • col_integer ()
1,2,3 4 5 NA
f <- "archivo.csv" • col_logical ()
Archivo con delimitador arbitrario 4,5, NA
write_delim ( x, ruta, delim = "", na = "NA", append = • col_number (), col_numeric ()
FALSE, col_names =! append) AB C Sin encabezado Leer en un subconjunto • col_skip ()
ABC
1 2 3
read_csv (f, col_names = FALSE) 1 2 3 read_csv (f, n_max = 1) x <- read_csv ("archivo.csv", col_types = cols (A =
CSV para Excel
4 5 NA col_double (),
write_excel_csv ( x, ruta, na = "NA", agregar = FALSO,
X y z Proporcionar encabezado B = col_logical (),
col_names =! agregar)
AB C Valores faltantes
C = factor_col ()))
read_csv (f, col_names = c ("x", "y", "z")) ABC
Cadena para archivar
1 2 3 NA 2 3 read_csv (f, na = c ("1", "."))
write_file ( x, ruta, agregar = FALSO)
4 5 NA 4 5 NA 3. De lo contrario, lea como vectores de caracteres y luego analice con una
Vector de cadena a archivo, un elemento por línea Objeto a función parse_.
RStudio® es una marca comercial de RStudio, Inc. • CC BY SA RStudio • info@rstudio.com • 844-448-1212 • rstudio.com • Obtenga más información en tidyverse.org • readr 1.1.0 • tibble 1.2.12 • tidyr 0.6 .0 • Actualizado: 2019–08
Tibbles - un marco de datos mejorado Tidy Data con tidyr Células partidas
Datos ordenados es una forma de organizar datos tabulares. Proporciona una estructura de datos coherente en todos los paquetes. Una mesa está
los tibble El paquete proporciona una nueva clase S3 Utilice estas funciones para dividir
ordenada si: Datos ordenados:
para almacenar datos tabulares, tibble. Tibbles hereda A * B -> C o combinar celdas en individuales,
la clase de marco de datos, pero mejora tres ABCYABC ABC UNA * segundo C aisladas
comportamientos: valores.
ww
8 audi a4 quattro 1.8
9 audi a4 quattro 1.8 reunir () mueve los nombres de las columnas a un llave spread () mueve los valores únicos de un llave C 1999 212K / 1T C 1999 212K 1T
10 audi a4 quattro 2.0
#. . . con 224 filas más, y 3
# más variables: año <int>, columna, reuniendo los valores de la columna en una columna en los nombres de las columnas, extendiendo el C 2000 213K / 1T C 2000 213K 1T
# cyl <int>, trans <chr>
opciones ( tibble.print_max = n, C 2000 casos 213K UNA 2000 2K / 20M UNA 1999 19M
tibble.print_min = m, tibble.width = Inf) C 2000 popular 1T segundo 1999 37K / 172M UNA 2000 2K
segundo 2000 80K / 174M UNA 2000 20M
reunir (table4a, `1999`,` 2000`, llave valor
• Ver el conjunto de datos completo con Ver() o vislumbrar() C 1999 212K / 1T segundo 1999 37K
clave = "año", valor = "casos") spread (tabla2, tipo, recuento) C 2000 213K / 1T segundo 1999 172M
• Volver al marco de datos con as.data.frame () segundo 2000 80K
segundo 2000 174M
CONSTRUYE UN TIBBLE EN DOS DÍAS
Manejar valores perdidos C
C
1999
1999
212K
1T
tibble …)
Ambos drop_na ( datos, ...) llenar( data, ..., .direction = c ("abajo", "arriba")) reemplazar_na ( datos, C 2000 213K
Construya por columnas. C 2000 1T
hacer esto Suelta filas que contienen Complete las columnas NA en ... con los valores no reemplazar = lista (), ...)
tibble x = 1: 3, y = c ("a", "b", "c")) tibble NA está en… columnas. NA más recientes. Reemplace NA por columna. filas_separadas (tabla3, tasa, sep = "/")
X X X
tribble …)
x1 x2 x1 x2 x1 x2 x1 x2 x1 x2 x1 x2
Una tibble: 3 × 2
Construye por filas. X y UNA 1 UNA 1 UNA 1 UNA 1 UNA 1 UNA 1 unir( data, col, ..., sep = "_", remove = TRUE)
tribble (~ x, ~ y, <int> <chr> segundoN / A re 3 segundo
N/A segundo 1 segundo
N/A segundo 2
1 1 una C N/A CN/A C 1 CN/A C 2 Contraiga celdas en varias columnas para hacer una
1, "a", 2 2 segundo re 3 re 3 re 3 re 3 re 3
sola columna.
2, "b", 3 3 C mi N/A mi N/A mi 3 mi N/A mi 2
table5
3, "c")
drop_na (x, x2) llenar (x, x2) reemplazar_na (x, lista (x2 = 2)) año del siglo país país año