Está en la página 1de 7

*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*

1. Medidas de Posición Relativa en R.

a. Creando la variable para trabajar.


peso_nacer <- c(7.2,
7.8,6.8,6.2,8.2,8.0,8.2,5.6,8.6,7.1,8.2,7.7,7.5,7.2,7.7,5.8,6.8,6.8,
8.5,7.5,6.1,7.9,9.4,9.0,7.8,8.5,9.0,7.7,6.7,7.7)

length(peso_nacer)
[1] 30
/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+

b. Creando una función para calcular el puntaje Z de cada valor en un conjunto de datos

El puntaje z

x− x
Puntaje z=
s
# Usando función
puntaje_z <- function(x) round(((x-mean(x))/sd(x)),2)

# Calculando el puntaje Z para cada peso de nacimiento.


puntaje_z(peso_nacer)
[1] -0.39 0.24 -0.82 -1.45 0.66 0.45 0.66 -2.08 1.08 -0.50 0.66 0.13 -0.08
[14] -0.39 0.13 -1.87 -0.82 -0.82 0.98 -0.08 -1.56 0.35 1.93 1.51 0.24 0.98
[27] 1.51 0.13 -0.92 0.13

/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+

c. Usando el comando cbind

Este comando nos sirve para presentar variables agrupadas y en forma de columna. Por ejemplo,
vamos a presentar cada edad con su respectivo puntaje z a su lado.

Z_pesos_nacer <-c(puntaje_z(peso_nacer)

cbind(peso_nacer,Z_pesos_nacer)

peso_nacer Z_pesos_nacer
[1,] 7.2 -0.39
[2,] 7.8 0.24
[3,] 6.8 -0.82
[4,] 6.2 -1.45
[5,] 8.2 0.66
[6,] 8.0 0.45
[7,] 8.2 0.66
[8,] 5.6 -2.08
[9,] 8.6 1.08
[10,] 7.1 -0.50
[11,] 8.2 0.66
[12,] 7.7 0.13
[13,] 7.5 -0.08
[14,] 7.2 -0.39
[15,] 7.7 0.13
[16,] 5.8 -1.87
[17,] 6.8 -0.82
[18,] 6.8 -0.82
[19,] 8.5 0.98
[20,] 7.5 -0.08
[21,] 6.1 -1.56
[22,] 7.9 0.35
[23,] 9.4 1.93
[24,] 9.0 1.51
[25,] 7.8 0.24
[26,] 8.5 0.98
[27,] 9.0 1.51
[28,] 7.7 0.13
[29,] 6.7 -0.92
[30,] 7.7 0.13

*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*
2. Cuantiles y Percentiles.

a. Todos Cuartiles
quantile(peso_nacer)

0% 25% 50% 75% 100%


5.600 6.875 7.700 8.200 9.400

b. Sólo el primer cuartil.


quantile(peso_nacer,0.25)

25%
6.875

c. Sólo los primeros tres cuartiles


.
quantile(peso_nacer,c(0.25,0.5,0.75))
25% 50% 75%
6.875 7.700 8.200

/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+

d. Como calcular los percentiles


# Calculando los percentiles 10, 40,60 y 80
quantile(peso_nacer,c(0.10,0.40,0.60,0.80))

10% 40% 60% 80%


6.19 7.50 7.80 8.26

# Calculando los percentiles 10, 20, 30, 40, …, 80, 90, 100
quantile(peso_nacer, c(0:10/10))

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
5.60 6.19 6.80 7.17 7.50 7.70 7.80 8.06 8.26 8.64 9.40

*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*
3. Rango Intercuartil

a. De manera directa
IQR(peso_nacer)
[1] 1.325

b. Con la función cat


cat("El rango intercualtil de los pesos al nacer es:",
round(IQR(peso_nacer),2),"libras.\n")

El rango intercualtil de los pesos al nacer es: 1.32 libras.

*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*
4. El resumen de los 5 números en R

a. Primera forma

# Usando el comando summary para obtenerlos directamente

summary(peso_nacer)

Min. 1st Qu. Median Mean 3rd Qu. Max.


5.600 6.875 7.700 7.573 8.200 9.400
b. Segunda forma

# Usando el comando cincoGN

incoGN <- c(fivenum(peso_nacer))


cincoGN
[1] 5.6 6.8 7.7 8.2 9.4

names(cincoGN) <- c("Mínimo","1er Cuartil","Mediana","3er


Cuartil","Máximo")
cincoGN
Mínimo 1er Cuartil Mediana 3er Cuartil Máximo
5.6 6.8 7.7 8.2 9.4

*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*
5. Detección de resultados atípicos.

a. Mediante el puntaje Z
Trabajaremos con la variable ingresos que creamos la clase pasada.
# Determinando el puntaje Z de cada valor de la variable.
z_ingreso <- c(puntaje_z(ingresos))

# Creando una tabla, con cada valor y su puntaje Z.

tabla_ingreso_z <- data.frame(ingresos, z_ingreso)


tabla_ingreso_z
ingresos z....c.puntaje_z.ingresos..
1 60 0.63
2 49 -0.69
3 40 -1.76
4 61 0.75
5 64 1.11
6 60 0.63
7 59 0.51
8 54 -0.09
9 62 0.87
10 69 1.71
11 70 1.83
12 42 -1.52
13 56 0.15
14 61 0.75
15 61 0.75
16 61 0.75
17 58 0.39
18 51 -0.45
19 48 -0.81
20 65 1.23
21 49 -0.69
22 49 -0.69
23 41 -1.64
24 48 -0.81
25 52 -0.33
26 46 -1.05
27 59 0.51
28 46 -1.05
29 58 0.39
30 43 -1.41

# mostrando los valores atípicos.


tabla_ingreso_z[tabla_ingreso_z$z_ingreso > abs(2.99),]

[1] ingresos z_ingreso


<0 rows> (or 0-length row.names)

No muestra valores atípicos


b. Mediante el rango intercuartil
# Creando los extremos o límites del intervalo
lim_inf <-c(quantile(peso_nacer,0.25)-1.5*IQR(peso_nacer))

lim_sup <-c(quantile(peso_nacer,0.25)+1.5*IQR(peso_nacer))

# mostrando los valores atípicos. Usando el operador o = |

peso_nacer[peso_nacer<lim_inf | peso_nacer>lim_sup]

numeric(0)

No muestra valores atípicos


*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*

6. Gráfica para variables de dispersión para variables cuantitativas.


Gráfica de dispersión.
tama_resid <-
c(1360,1940,1750,1550,1790,1750,2230,1600,1450,1870,2210,1480)

Precio_resid <- c(278.50, 375.70, 339.50,


329.80,295.60,310.30 ,460.50,305.20, 288.60,365.70,425.30,268.80)
plot(tama_resid,Precio_resid,xlab = "Tamaño Residencia", ylab = "Precio
Residencia", main = "Gráfico de dispersión: Tamaño- Precio")

*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*-*

7. Covarianza y coeficiente de correlación.

a. Calculando la covarianza con el comando cov

cov(cbind(tama_resid,Precio_resid))

tama_resid Precio_resid
tama_resid 79233.33 15545.197
Precio_resid 15545.20 3571.157

b. Calculando la correlación con el comando cor


cor(tama_resid,Precio_resid)

[1] 0.92414

O también
cor(cbind(tama_resid,Precio_resid))

tama_resid Precio_resid
tama_resid 1.00000 0.92414
Precio_resid 0.92414 1.00000

c. Gráfico de Correlación
Instalando la librería necesaria
install.packages("corrplot")
library(corrplot)

Creando el gráfico.
corrplot(cor(cbind(tama_resid,Precio_resid)),
method="circle",type="upper")

También podría gustarte