Está en la página 1de 22

Análisis descriptivo de los datos “Boston”

 Primero se deben instalar y activar los paquetes “MASS” e “ISLR” como


a continuación se demuestra con las líneas de código
> library(MASS)
> library(ISLR)
> data("Boston")
> str(Boston)
'data.frame': 506 obs. of 14 variables:
$ crim : num 0.00632 0.02731 0.02729 0.03237 0.06905 ...
$ zn : num 18 0 0 0 0 0 12.5 12.5 12.5 12.5 ...
$ indus : num 2.31 7.07 7.07 2.18 2.18 2.18 7.87 7.87 7.87 7.87 ...
$ chas : int 0 0 0 0 0 0 0 0 0 0 ...
$ nox : num 0.538 0.469 0.469 0.458 0.458 0.458 0.524 0.524 0.524
0.524 ...
$ rm : num 6.58 6.42 7.18 7 7.15 ...
$ age : num 65.2 78.9 61.1 45.8 54.2 58.7 66.6 96.1 100 85.9 ...
$ dis : num 4.09 4.97 4.97 6.06 6.06 ...
$ rad : int 1 2 2 3 3 3 5 5 5 5 ...
$ tax : num 296 242 242 222 222 222 311 311 311 311 ...
$ ptratio: num 15.3 17.8 17.8 18.7 18.7 18.7 15.2 15.2 15.2 15.2 ...
$ black : num 397 397 393 395 397 ...
$ lstat : num 4.98 9.14 4.03 2.94 5.33 ...
$ medv : num 24 21.6 34.7 33.4 36.2 28.7 22.9 27.1 16.5 18.9 ...

 a) Luego se procede a obtener para cada variable los valores de:


Mínimo, Máximo, Media, Mediana, Percentiles 25 y 75, Desviación
Estándar.
 b) Para cada variable se deben hacer el gráfico que corresponda:
diagrama de barras o histograma y adicional hacer el diagrama de caja y
bigotes en cada variable. Debajo de cada “DIAGRAMA DE CAJA Y
BIGOTES” debe redactar el análisis correspondiente.
 A continuación, se inicia con la variable “$crim”
Parte a)
> min(Boston$crim);max(Boston$crim)
[1] 0.00632
[1] 88.9762
> mean(Boston$crim)
[1] 3.613524
> median(Boston$crim)
[1] 0.25651
> quantile(Boston$crim,c(0.25,0.75))
25% 75%
0.082045 3.677083
> sd(Boston$crim)
[1] 8.601545

Parte b)
> hist(Boston$crim)
> boxplot(Boston$crim)

SE DEBE REALIZAR EL ANALISIS DE GRAFICO

 A continuación, se inicia con la variable “$zn”


Parte a)
> min(Boston$crim);max(Boston$crim)
[1] 0.00632
[1] 88.9762
> mean(Boston$zn)
[1] 11.36364
> median(Boston$zn)
[1] 0
> quantile(Boston$zn,c(0.25,0.75))
25% 75%
0.0 12.5
> sd(Boston$zn)
[1] 23.32245
Parte b)
> hist(Boston$zn)

> boxplot(Boston$zn)

SE DEBE REALIZAR EL ANALISIS DE GRAFICO


 A continuación, se inicia con la variable “$indus”
Parte a)
> min(Boston$indus);max(Boston$indus)
[1] 0.46
[1] 27.74
> mean(Boston$indus)
[1] 11.13678
> median(Boston$indus)
[1] 9.69
> quantile(Boston$indus,c(0.25,0.75))
25% 75%
5.19 18.10
> sd(Boston$indus)
[1] 6.860353
Parte b)
> hist(Boston$indus)

> boxplot(Boston$indus)
SE DEBE REALIZAR EL ANALISIS DE GRAFICO
 A continuación, se inicia con la variable “$chas”
Parte a)
> min(Boston$chas);max(Boston$chas)
[1] 0
[1] 1
> mean(Boston$chas)
[1] 0.06916996
> median(Boston$chas)
[1] 0
> quantile(Boston$chas,c(0.25,0.75))
25% 75%
0 0
> sd(Boston$chas)
[1] 0.253994
Parte b)
> hist(Boston$chas)
> boxplot(Boston$chas)

SE DEBE REALIZAR EL ANALISIS DE GRAFICO


SE DEBE REALIZAR EL ANALISIS DE GRAFICO
 A continuación, se inicia con la variable “$nox”
Parte a)
> min(Boston$nox);max(Boston$nox)
[1] 0.385
[1] 0.871
> mean(Boston$nox)
[1] 0.5546951
> median(Boston$nox)
[1] 0.538
> quantile(Boston$nox,c(0.25,0.75))
25% 75%
0.449 0.624
> sd(Boston$nox)
[1] 0.1158777
Parte b)
> hist(Boston$nox)

> boxplot(Boston$nox)
SE DEBE REALIZAR EL ANALISIS DE GRAFICO
 A continuación, se inicia con la variable “$nox”
Parte a)
> min(Boston$rm);max(Boston$rm)
[1] 3.561
[1] 8.78
> mean(Boston$rm)
[1] 6.284634
> median(Boston$rm)
[1] 6.2085
> quantile(Boston$rm,c(0.25,0.75))
25% 75%
5.8855 6.6235
> sd(Boston$rm)
[1] 0.7026171
Parte b)
> hist(Boston$rm)
> boxplot(Boston$rm)

SE DEBE REALIZAR EL ANALISIS DE GRAFICO


 A continuación, se inicia con la variable “$age”
Parte a)
> min(Boston$age);max(Boston$age)
[1] 2.9
[1] 100
> mean(Boston$age)
[1] 68.5749
> median(Boston$age)
[1] 77.5
> quantile(Boston$age,c(0.25,0.75))
25% 75%
45.025 94.075
> sd(Boston$rm)
[1] 0.7026171
Parte b)
> hist(Boston$age)

> boxplot(Boston$age)
SE DEBE REALIZAR EL ANALISIS DE GRAFICO
 A continuación, se inicia con la variable “$dis”
Parte a)
> min(Boston$dis);max(Boston$dis)
[1] 1.1296
[1] 12.1265
> mean(Boston$dis)
[1] 3.795043
> median(Boston$dis)
[1] 3.20745
> quantile(Boston$dis,c(0.25,0.75))
25% 75%
2.100175 5.188425
> sd(Boston$dis)
[1] 2.10571
Parte b)
> hist(Boston$dis)
> boxplot(Boston$dis)

SE DEBE REALIZAR EL ANALISIS DE GRAFICO


 A continuación, se inicia con la variable “$rad”
Parte a)
> min(Boston$rad);max(Boston$rad)
[1] 1
[1] 24
> mean(Boston$rad)
[1] 9.549407
> median(Boston$rad)
[1] 5
> quantile(Boston$rad,c(0.25,0.75))
25% 75%
4 24
> sd(Boston$rad)
[1] 8.707259
Parte b)
> hist(Boston$rad)

> boxplot(Boston$rad)
SE DEBE REALIZAR EL ANALISIS DE GRAFICO
 A continuación, se inicia con la variable “$tax”
Parte a)
> min(Boston$tax);max(Boston$tax)
[1] 187
[1] 711
> mean(Boston$tax)
[1] 408.2372
> median(Boston$tax)
[1] 330
> quantile(Boston$tax,c(0.25,0.75))
25% 75%
279 666
> sd(Boston$tax)
[1] 168.5371
Parte b)
> hist(Boston$tax)
> boxplot(Boston$tax)

SE DEBE REALIZAR EL ANALISIS DE GRAFICO


 A continuación, se inicia con la variable “$ptratio”
Parte a)
> min(Boston$ptratio);max(Boston$ptratio)
[1] 12.6
[1] 22
> mean(Boston$ptratio)
[1] 18.45553
> median(Boston$ptratio)
[1] 19.05
> quantile(Boston$ptratio,c(0.25,0.75))
25% 75%
17.4 20.2
> sd(Boston$ptratio)
[1] 2.164946
Parte b)
> hist(Boston$ptratio)

> boxplot(Boston$ptratio)
SE DEBE REALIZAR EL ANALISIS DE GRAFICO
 A continuación, se inicia con la variable “$black”
Parte a)
> min(Boston$black);max(Boston$black)
[1] 0.32
[1] 396.9
> mean(Boston$black)
[1] 356.674
> median(Boston$black)
[1] 391.44
> quantile(Boston$black,c(0.25,0.75))
25% 75%
375.3775 396.2250
> sd(Boston$black)
[1] 91.29486
Parte b)
> hist(Boston$black)
> boxplot(Boston$black)

SE DEBE REALIZAR EL ANALISIS DE GRAFICO


 A continuación, se inicia con la variable “$lstat”
Parte a)
> min(Boston$lstat);max(Boston$lstat)
[1] 1.73
[1] 37.97
> mean(Boston$lstat)
[1] 12.65306
> median(Boston$lstat)
[1] 11.36
> quantile(Boston$lstat,c(0.25,0.75))
25% 75%
6.950 16.955
> sd(Boston$lstat)
[1] 7.141062
Parte b)
> hist(Boston$lstat)

> boxplot(Boston$lstat)
SE DEBE REALIZAR EL ANALISIS DE GRAFICO
 A continuación, se inicia con la variable “$medv”
Parte a)
> min(Boston$medv);max(Boston$medv)
[1] 5
[1] 50
> mean(Boston$medv)
[1] 22.53281
> median(Boston$medv)
[1] 21.2
> quantile(Boston$medv,c(0.25,0.75))
25% 75%
17.025 25.000
> sd(Boston$medv)
[1] 9.197104
Parte b)
> hist(Boston$medv)
> boxplot(Boston$medv)

SE DEBE REALIZAR EL ANALISIS DE GRAFICO

También podría gustarte