Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Medidas de Posición Relativa en R
Medidas de Posición Relativa en R
length(peso_nacer)
[1] 30
/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+
b. Creando una función para calcular el puntaje Z de cada valor en un conjunto de datos
El puntaje z
x− x
Puntaje z=
s
# Usando función
puntaje_z <- function(x) round(((x-mean(x))/sd(x)),2)
/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+
Este comando nos sirve para presentar variables agrupadas y en forma de columna. Por ejemplo,
vamos a presentar cada edad con su respectivo puntaje z a su lado.
Z_pesos_nacer <-c(puntaje_z(peso_nacer)
cbind(peso_nacer,Z_pesos_nacer)
peso_nacer Z_pesos_nacer
[1,] 7.2 -0.39
[2,] 7.8 0.24
[3,] 6.8 -0.82
[4,] 6.2 -1.45
[5,] 8.2 0.66
[6,] 8.0 0.45
[7,] 8.2 0.66
[8,] 5.6 -2.08
[9,] 8.6 1.08
[10,] 7.1 -0.50
[11,] 8.2 0.66
[12,] 7.7 0.13
[13,] 7.5 -0.08
[14,] 7.2 -0.39
[15,] 7.7 0.13
[16,] 5.8 -1.87
[17,] 6.8 -0.82
[18,] 6.8 -0.82
[19,] 8.5 0.98
[20,] 7.5 -0.08
[21,] 6.1 -1.56
[22,] 7.9 0.35
[23,] 9.4 1.93
[24,] 9.0 1.51
[25,] 7.8 0.24
[26,] 8.5 0.98
[27,] 9.0 1.51
[28,] 7.7 0.13
[29,] 6.7 -0.92
[30,] 7.7 0.13
*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*
2. Cuantiles y Percentiles.
a. Todos Cuartiles
quantile(peso_nacer)
25%
6.875
/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+
# Calculando los percentiles 10, 20, 30, 40, …, 80, 90, 100
quantile(peso_nacer, c(0:10/10))
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
5.60 6.19 6.80 7.17 7.50 7.70 7.80 8.06 8.26 8.64 9.40
*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*
3. Rango Intercuartil
a. De manera directa
IQR(peso_nacer)
[1] 1.325
*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*
4. El resumen de los 5 números en R
a. Primera forma
summary(peso_nacer)
*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*
5. Detección de resultados atípicos.
a. Mediante el puntaje Z
Trabajaremos con la variable ingresos que creamos la clase pasada.
# Determinando el puntaje Z de cada valor de la variable.
z_ingreso <- c(puntaje_z(ingresos))
lim_sup <-c(quantile(peso_nacer,0.25)+1.5*IQR(peso_nacer))
peso_nacer[peso_nacer<lim_inf | peso_nacer>lim_sup]
numeric(0)
*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*
cov(cbind(tama_resid,Precio_resid))
tama_resid Precio_resid
tama_resid 79233.33 15545.197
Precio_resid 15545.20 3571.157
[1] 0.92414
O también
cor(cbind(tama_resid,Precio_resid))
tama_resid Precio_resid
tama_resid 1.00000 0.92414
Precio_resid 0.92414 1.00000
c. Gráfico de Correlación
Instalando la librería necesaria
install.packages("corrplot")
library(corrplot)
Creando el gráfico.
corrplot(cor(cbind(tama_resid,Precio_resid)),
method="circle",type="upper")