Documentos de Académico
Documentos de Profesional
Documentos de Cultura
REDONDEAR
round(resultado,2)
Instalación de paquetes
install.packages('dplyr')
install.packages('tidyverse')
install.packages('readr')
Instalamos librerías:
library(readr)
library(plyr)
library(dplyr)
library(tidyverse)
Dimensiones de DF
1º Caso: Dimensiones (número de filas y columnas)
dim(DF)
Casos completos
1º Caso: cantidad de casos u observaciones completos(Sin NA)
sum(complete.cases(DF) )
Tamaño efectivo
1º Caso: De toda la muestra
sum(complete.cases(DF) )
summary
1º Caso: Resumen de toda la base de datos
summary(DF)
Moda
participaciones<- table (anchov$Barco)
moda <-participaciones[which.max(participaciones)]
moda
Coeficiente de variación(cv)
cv<-round(sd(DF$columna, na.rm = TRUE)/mean(DF$columna, na.rm = TRUE),2)
Rango (range)
range(DF$columna, na.rm = TRUE)
rango<- max - min #otra forma: revisando summary (max y min)
Rango Intercuartil
IQR(DF$columna) # si no funciona : na.rm = TRUE
RI<- q3 - q1 #otra forma: revisando summary (q1 y q3)
Varianza
round(var(DF$columna, na.rm = TRUE),2)
var<-sd(DF$columna, na.rm = TRUE)^2
Filter
edad_mayor20<-filter(DF,DF$Edad>20) #condición: DF$Edad>20
DF %>% filter(Edad > 20)
D_UK<- filter(DC, Pais=="United Kingdom") #crea una tabla con todas las columnas de DC
y además todos los países deben ser igual a United Kingdom
Select
1º Caso: seleccionar una o más variables
select(DF,variable2, variable3)
Otros:
● cbin: agregar o concatenar una nueva columna o variable “venta_mensual” (lo
agrega al final).
Gráficos
boxplot
boxplot(DF$Estatura,na.rm = TRUE, horizontal = TRUE, main="Titulo",xlab="eje x" ,
ylab="eje y")
Plot
plot(x = banco$education, main = "Gráfica de Educación",
xlab = "Nivel educativo", ylab = "Frecuencia",
col = c("royalblue", "seagreen", "purple", "grey"))
hist()
x<- DFU$ContDia[DD1]
hist(x, prob=TRUE, breaks=seq(0,10000, by=1000))
abline(v=c(mean(x),median(x),col=c(“red”,”blue”)
—-----------------------------------------------------------------------------------
hist(distancia, freq = FALSE, main = "Curva densidad", ylab =
"Densidad")
lines(density(distancia), lwd = 2, col = 'red')
—----------------------------------------------------------------
-hist(distancia, prob = TRUE, main = "Histograma con curva
normal", ylab = "Densidad")
Preguntas teóricas
● Sesgada a la derecha: si la media es mayor que la mediana
● Sesgada a la izquierda: si la media es menor que la mediana
● Los datos están concentrados: si la diferencia entre rango (max-min) y rango
intercuartil IQR(DF$variable) o Q3-Q1 es grande
NOTAS
DFU$TMA<- DFU$Muertos /DFU$Contagiados*100
plot(DFU$Fecha, DFU$TMA)
—---------------------------------------------------
3)v 4)v