Está en la página 1de 20

“Año del Fortalecimiento de la Soberanía Nacional”

UNIVERSIDAD NACIONAL DE TRUJILLO

FACULTAD DE CIENCIAS FÍSICA Y MATEMÁTICAS


ESCUELA DE ESTADÍSTICA

INTEGRANTES:

 DIAZ BRICEÑO LEANDRO MISAEL

 MALDONADO RUIZ, MATHIUS

 TACANGA RUBIO ALEJANDRO SERGIO

 VARGAS LAZARO ALEJANDRO SAMUEL

DOCENTE:

MsC. Aurora Rosa Neciosup Obando

CURSO:

ESTADISTICA MULTIDIMENCIONAL

TRUJILLO-PERÚ
2022
TAREA 02
ESTADÍSTICA MULTIDIMENSIONAL

Semana 2. Análisis exploratorio de datos

Instrucción: Resuelve los ejercicios que se dan a continuación, y presenta el informe


de resultados en la fecha prevista, toma en cuenta la rúbrica que será utilizada para su
evaluación.
1. La tabla siguiente contiene el Coeficiente intelectual (CI) de niños a los cuales
se les registro el peso al nacer y la edad de la madre.

Niño CI Peso Edad Niño CI Peso Edad

1 125 2536 28 14 75 2350 23

2 86 2505 31 15 90 2536 24

3 119 2652 32 16 109 2577 22

4 113 2573 20 17 104 2464 35

5 101 2382 30 18 110 2571 24

6 143 2443 30 19 96 2550 24

7 132 2617 27 20 101 2437 23

8 106 2556 36 21 95 2472 36

9 121 2489 34 22 117 2580 21

10 109 2415 29 23 115 2436 39

11 88 2434 27 24 138 2200 41

12 116 2491 24 25 85 2851 17

13 102 2345 26

a. Calcula e interpreta los índices de dispersión: Rango intercuartílico IQR,


Mediana de las desviaciones absolutas MAD y Coeficiente de variación
intercuartílica CVc para cada una de las variables.

Índices de dispersión

PARA CI:

Rango intercuartílico (IQR)


IQR=C 75 – C 25=21

Mediana de las desviaciones absolutas (MAD)

MA D=M d∨X i−M d∨¿ 10

109 0
109 0
110 1
106 3
113 4
104 5
115 6
102 7
116 7
101 8
101 8
117 8
119 10
121 12
96 13
95 14
125 16
90 19
88 21
86 23
132 23
85 24
138 29
75 34
143 34

Coeficiente de variación intercuartílico (CVc)

C 75−C 25 117−96
CVc= = =0.09859
C 75+ C 25 117+ 96

Interpretación: La distancia que hay en el centro es 21 y las diferencias entre los


datos y su mediana es 10, y en el caso de las dispersiones entre distribuciones son
de 0.099 aproximado.
PARA PESO:

Rango intercuartílico (IQR)

IQ R=C 75 – C 25=137

Mediana de las desviaciones absolutas (MAD)

MAD=Md ∨Xi−Md ∨¿ 65
2491 0
2489 2
2505 14
2472 19
2464 27
2536 45
2536 45
2443 48
2437 54
2436 55
2434 57
2550 59
2556 65
2489 45
2415 76
2571 80
2573 82
2577 86
2580 89
2382 109
2617 126
2350 141
2345 146
2652 161
2200 291
2851 360

Coeficiente de variación intercuartílico (CVc)

C 75−C 25 2571−2436
CVc= = =0,02696225
C 75+ C 25 2571+2436

Interpretación: La distancia que hay en el centro es 135, las diferencias entre los datos y
su mediana es 65 y, por último, las dispersiones entre distribuciones son de 0.0269
aproximado.
PARA EDAD:

Rango intercuartílico (IQR)

IQ R=C 75 – C 25=8

Mediana de las desviaciones absolutas (MAD)

MAD=Md ∨Xi−M d∨¿ 4

Edad
27 0
27 0
26 1
28 1
29 2
24 3
24 3
24 3
24 3
30 3
30 3
23 4
23 4
31 4
22 5
32 5
21 6
20 7
34 7
35 8
36 9
36 9
17 10
39 12
41 14

Coeficiente de variación intercuartílico (CVc)

C 75−C 25
CVc= =0,142857143
C 75+ C 25

Interpretación: La distancia que hay en el centro es 8, además las diferencias


entre los datos y su mediana es 4 y, por último, las dispersiones entre
distribuciones son de 0.142

b. Calcula e interpreta los índices de forma: Simetría de Yule, Simetría de


Kelly, Coeficiente de curtosis.

Índice de forma:

PARA CI

Simetría de Yule:
(C ¿ ¿ 25+C 75−2 Md ) 96+117−2(109)
H 1= → =−0.0229¿
2 Md 2(109)
Simetría de Kelly:
(C ¿ ¿10+C 95 ) 86+132
H 2=Md − =109− =0 ¿
2 2

Coeficiente de curtosis:

(C 87.5−C 12.5) (125−88) 37


K 1= = = =1.03641
1.7(C 75−C 25 ) 1.7 (21) 35.7

(C 90−C 10) (129.2−86.8)


K 2= = =1.06265
1.9(C 75−C 25) 1.7 (21)

Interpretación: En la simetría de Yule, H1 es menor a cero, por lo tanto, decimos


que la distribución es asimétrica negativa; lo mismo podríamos deducir con la
simetría de Kelly, porque H2 es igual uno y este es mayor a cero. Finalmente, el
coeficiente de curtosis, comparamos k1 con el número 1, se nota que dicho valor
es ligeramente mayor a 1, entonces concluyo que la distribución de datos en caso
del coeficiente intelectual de los niños es ligeramente leptocúrtica

PARA PESO

Simetría de Yule:

(C ¿ ¿ 25+C 75−2 Md ) 2571+2434−2(2491)


H 1= → =0.00461 ¿
2 Md 2(2491)

Simetría de Kelly:
(C ¿ ¿10+C 90 ) 2350.8+ 2617.2
H 2=Md − =2491− =7 ¿
2 2

Coeficiente de curtosis:

(C 87.5−C 12.5) (2580−2382)


K 1= = =0.85015027
1.7(C 75−C 25) 1.7 (137)

(C 90−C 10) (2617−2382)


K 2= = =0.9028445
1.9(C 75−C 25) 1.9(137)

Interpretación: En la simetría de Yule, H1 es ligeramente mayor a cero, por lo


tanto, decimos que la distribución es asimétrica positiva; en este caso la simetría
de Kelly, H2 es mayor a cero, entonces será asimétrica negativa. Finalmente, el
coeficiente de curtosis, en k1 se nota que dicho valor es menor a 1, entonces
concluyo que la distribución de datos en caso del peso de los niños es
ligeramente platicúrtica.
PARA EDAD

Simetría de Yule:

(C ¿ ¿ 25+C 75−2 Md ) 24 +32−2(27)


H 1= → =0.037037. . ¿
2 Md 2(27)

Simetría de Kelly:
(C ¿ ¿10+C 90 ) 21.8+36.2
H 2=Md − =27− =−2 ¿
2 2

Coeficiente de curtosis:

(C 87.5−C 12.5) (36−22)


K 1= = =1029411
1.7(C 75−C 25 ) 1.7 (8)

(C 90−C 10) (36.2−21.8)


K 2= = =0.94736842
1.9(C 75−C 25) 1.9(8)

2. La siguiente base de datos corresponde a los departamentos del Perú, año 2012.

Departamento % de % de % de % de % de
familias familias familias familias niños
computador Auto Televisor Radio huérfanos

Amazonas 8.6 3.9 51.9 74.3 3.5

Ancash 21.6 8.3 77.6 79.5 3

Apurímac 9.2 3.9 59.6 82.4 3.7

Arequipa 32.9 16.3 96.6 97.7 2.3

Ayacucho 7 2.9 61.6 78.3 3.8

Cajamarca 10 3.6 52.3 88.3 3.4

Cuzco 15.6 8.2 69 90 3.6

Huancavelica 5.8 3.5 58.5 74.7 3.8

Huánuco 12.9 4.5 58.7 77.2 2.9

Ica 23.7 12.7 91.6 79.4 2.5


Junín 17.5 9.6 83 84.8 2.9

La Libertad 19.7 7.5 79.1 87.8 3.8

Lambayeque 22.9 5.6 86.3 82.8 1.9

Lima 44.9 17.2 96.8 87.1 2.3

Loreto 16 1.2 62.5 58 2.7

Madre de Dios 24 9 87 73.9 3.5

Moquegua 31.4 20.1 87.3 91.4 1.2

Pasco 20.3 10.4 76 83.2 3.7

Piura 18.2 5.9 77.5 77 2.3

Puno 9.4 8.9 59.1 88.9 4.8

San Martin 17.1 4.6 71.4 75.9 2.9

Tacna 30 17.1 90.9 88.9 2.7

Tumbes 24.4 10.9 92.5 75.9 2.5

Ucayali 17.8 3.9 79.1 67.2 3.5

a. Calcula e interpreta los índices de dispersión: Rango intercuartílico IQR,


Mediana de las desviaciones absolutas MAD y Coeficiente de variación
intercuartílica CVc para cada una de las variables.

b. Calcula e interpreta los índices de forma: Simetría de Yule, Simetría de


Kelly, Coeficiente de curtosis.

% de familias Auto:

Departamento % de familias Auto

Loreto 1,20

Ayacucho 2,90

Huancavelica 3,50

Cajamarca 3,60

Amazonas 3,90

Apurímac 3,90
Ucayali 3,90

Huánuco 4,50

San Martin 4,60

Lambayeque 5,60

Piura 5,90

La Libertad 7,50

Cuzco 8,20

Ancash 8,30

Puno 8,90

Madre de Dios 9,00

Junín 9,60

Pasco 10,40

Tumbes 10,90

Ica 12,70

Arequipa 16,30

Tacna 17,10

Lima 17,20

Moquegua 20,10

C 10=3.53

C 12.5=3.5875

C 25=3.9

C 50=7.85

C 75 =10.525

C 87.5=16.4

C 90=16.86

Rango intercuartílico IQR:


IQR=C 75 −C 25=10.525−3.9=6.625
La dispersión media entre los elementos del 50% central del porcentaje de
personas con autos es de 6.625%.
Mediana de las desviaciones absolutas MAD:
MAD=Md ∨X i−Md ∨¿

Xi Xi-Md ->
1,20 6,65 0,35
2,90 4,95 0,35
3,50 4,35 0,45
3,60 4,25 1,05
3,90 3,95 1,15
3,90 3,95 1,75
3,90 3,95 1,95
4,50 3,35 2,25
4,60 3,25 2,55
5,60 2,25 3,05
5,90 1,95 3,25
7,50 0,35 3,35
8,20 0,35 3,95
8,30 0,45 3,95
8,90 1,05 3,95
9,00 1,15 4,25
9,60 1,75 4,35
10,40 2,55 4,85
10,90 3,05 4,95
12,70 4,85 6,65
16,30 8,45 8,45
17,10 9,25 9,25
17,20 9,35 9,35
20,10 12,25 12,25

3.35+3.95
MAD= =3.65
2
La dispersión media entre los elementos del 50% central del porcentaje de
personas con autos con respecto a la mediana es de 3.65%.
Coeficiente de variación intercuartílica CVc:
IQR
2 C −C25 10.525−3.9 6.625
CVc= = 75 = = =0,45927
Q C 75+C 25 10.525+ 3.9 14.425
La variación entre las dispersiones entre las distribuciones del 50% central
del porcentaje de personas con autos es del 45.93%, siendo esta cercana al límite
para ser considerada muy dispersa.
Simetría de Yule:

(C ¿ ¿ 25+C 75−2 Md ) 3.9+10.525−2(7.85) −1.275


H 1= → = =−0,08121¿
2 Md 2(7.85) 15.7
La distribución de los datos es asimétrica negativa, tendiendo los datos a
ser muy bajos según Yule.
Simetría de Kelly:

(C ¿ ¿10+C 90 ) 3.53+16.86
H 2=Md − =7.85− =7.85−10.195=−2,345 ¿
2 2
La distribución de los datos es muy asimétrica positiva, tendiendo los
datos a ser más altos según Kelly..
−H 2 −2.345
H 3= = =−0,29873
Md 7.85
Nuevamente, la distribución de los datos es un poquito asimétrica
negativa, tendiendo los datos a ser más bajos según Kelly..
Coeficiente de Curtosis:

(C 90 −C 10) (16.86−3.53) 13.33


K 2= = = =1,05898
1.9(C 75−C 25 ) 1.9( 6.625) 12,5875
La dispersión entre el 50% y el 80% de elementos centrales es casi
mesocúrtica pero un poco platicúrtica, teniendo tanto valores altos como bajos en
los elementos.
Octales:
(C 87.5−C 12.5) (16.4−3.5875) 12,8125
K 1= = = =1,13762
1.7(C 75−C 25 ) 1.7 (6.625) 1.7( 6.625)
La dispersión entre la frecuencia de valores con el punto medio es casi
mesocúrtica con algo de platicúrtica, teniendo tanto valores altos como bajos en
los elementos.

% de familias Televisor:
% de familias
Departamento Televisor
Amazonas 51.9
Cajamarca 52.3
Huancavelica 58.5
Huánuco 58.7
Puno 59.1
Apurímac 59,60
Ayacucho 61,60
Loreto 62,50
Cuzco 69,00
San Martin 71,40
Pasco 76,00
Piura 77,50
Ancash 77,60
La Libertad 79,10
Ucayali 79,10
Junín 83,00
Lambayeque 86,30
Madre de Dios 87,00

Moquegua 87.3
Tacna 90.9
Ica 91.6
Tumbes 92.5
Arequipa 96.6
Lima 96.8
C 10=58.56

C 12.5=58.675

C 25=61.1

C 50=77.55

C 75 =87.075

C 87.5=91.7125

C 90=92.23

Rango intercuartílico IQR:


IQR=C 75−C 25=87.075−61.1=25,975

La dispersión media entre los elementos del 50% central del porcentaje de
personas con televisores es de 25.975.
Mediana de las desviaciones absolutas MAD:
MAD=Md ∨X i−Md ∨¿

Xi Xi-Md ->
51,90 25,65 0,05
52,30 25,25 0,05
58,50 19,05 1,55
58,70 18,85 1,55
59,10 18,45 1,55
59,60 17,95 5,45
61,60 15,95 6,15
62,50 15,05 8,55
69,00 8,55 8,75
71,40 6,15 9,45
76,00 1,55 9,75
77,50 0,05 13,35
77,60 0,05 14,05
79,10 1,55 14,95
79,10 1,55 15,05
83,00 5,45 15,95
86,30 8,75 17,95
87,00 9,45 18,45
87,30 9,75 18,85
90,90 13,35 19,05
91,60 14,05 19,05
92,50 14,95 19,25
96,60 19,05 25,25
96,80 19,25 25,65
5.7+ 6
MAD= =13.7
2
La dispersión media entre los elementos del 50% central del porcentaje de
personas con televisores con respecto a la mediana es de 13.7%.
Coeficiente de variación intercuartílica CVc:
IQR
2 C −C25 87.075−61.1 25,975
CVc= = 75 = = =0,17530
Q C 75+C 25 87.075+61.1 148.175
La variación entre las dispersiones entre las distribuciones del 50% central
del porcentaje de personas con televisores es del 17.53%, siendo que representa
que se encuentran poco dispersas.
Simetría de Yule:

(C ¿ ¿ 25+C 75−2 Md ) 61.1+ 87.075−2(77.55) −6,925


H 1= = = =−0,04465¿
2 Md 2(77.55) 2(77.55)
La distribución de los datos es asimétrica negativa, tendiendo los datos a
ser solo más bajos según Yule.
Simetría de Kelly:

(C ¿ ¿10+C 90 ) 58.56+92.23
H 2=Md − =77.55− =77.55−75.395=2.155 ¿
2 2
La distribución de los datos es muy asimétrica negativa, tendiendo los
datos a ser más bajos según Kelly..
C 10+C 90−2 Md 150,79−155.1 −4.31
H 3= = = =−2.155
2 2 2
Nuevamente, la distribución de los datos es muy asimétrica negativa,
tendiendo los datos a ser más bajos según Kelly..

Coeficiente de Curtosis:

(C 90−C 10) (92.23−58.56) 33.67


K 2= = = =0,68223
1.9(C 75−C 25) 1.9 (25,975) 49,3525
La dispersión entre el 50% y el 80% de elementos centrales tendiendo a
ser algo platicúrtica, teniendo tanto valores altos como bajos en los elementos.

Octales:
La dispersión entre la frecuencia de valores con el punto medio tiende a ser un
poco platicúrtica, teniendo tanto valores altos
como bajos en los % de elementos.
Departamento familias
Radio
% de familias radio:
Loreto 58
Ucayali 67,2
Madre de Dios 73,9
Amazonas 74,3
Huancavelica 74,7
San Martin 75,9
Tumbes 75,9
Piura 77
Huánuco 77,2
Ayacucho 78,3
Ica 79,4
Ancash 79,5
Apurímac 82,4
Lambayeque 82,8
Pasco 83,2
Junín 84,8
Lima 87,1
La Libertad 87,8
Cajamarca 88,3
Puno 88,9
Tacna 88,9
Cuzco 90
Moquegua 91,4
Arequipa 97,7
C 10=2.5
C 25=75.9
C 50=80.95
C 75=88.05
C 90=21.7
Rango intercuartílico IQR:
IQR=C 75−C 25=88.05−75.9=12.15
La dispersión media entre los elementos del 50% de personas con radio es de
12.15%.
Mediana de las desviaciones absolutas MAD:
Xi |Xi-Md| MAD
58 22,95 1,45
67,2 13,75 1,45
73,9 7,05 1,55
74,3 6,65 1,85
74,7 6,25 2,25
75,9 5,05 2,65
75,9 5,05 3,75
77 3,95 3,85
77,2 3,75 3,95
78,3 2,65 5,05
79,4 1,55 5,05
79,5 1,45 6,15
82,4 1,45 6,25
82,8 1,85 6,65
83,2 2,25 6,85
84,8 3,85 7,05
87,1 6,15 7,35
87,8 6,85 7,95
88,3 7,35 7,95
88,9 7,95 9,05
88,9 7,95 10,45
90 9,05 13,75
91,4 10,45 16,75
97,7 16,75 22,95

Según el cuadro:
6.15+6.25
MAD= =6.2
2
La dispersión media entre los elementos del 50% de personas con radio con
respecto a la mediana es de 6.2%.
Coeficiente de variación intercuartílica CVc:
IQR
2 C −C25 88.05−75.9 12.15
CVc= = 75 = = =0,07
Q C 75+C 25 88.05+75.9 163.95
La variación entre las dispersiones entre las distribuciones del 50% de personas
con radio es del 0.07%, siendo esta muy cercana al límite para ser considerada
muy dispersa.
Simetría de Yule:
(C ¿ ¿ 25+C 75−2 Md ) 75.9+ 88.05−2(80.95) 2.05
H 1= → = =0.01¿
2 Md 2(80.95) 161.9
La distribución de los datos es asimétrica positiva, ya que los datos a ser muy
altos.

Simetría de Kelly:
(C ¿ ¿10+C 90 ) 2.5+21.7
H 2=Md − =80.95− =80.95−12.1=68.85 ¿
2 2
La distribución de los datos es muy asimétrica positiva, ya que los datos a ser
más altos.
−H 2 −68.85
H 3= = =−0.85
Md 80.95
Nuevamente, la distribución de los datos es un poco asimétrica negativa,
tendiendo los datos a ser más bajos.
Coeficiente de Curtosis:
C 90−C 10 21.7−2.5 19.2
K 2= = = =0.83
1.9(C 75−C 25) 1.9 (12.15) 23.085
La dispersión entre el 50% y el 80% de elementos centrales es leptocúrtica.
 % de familias niños huérfanos:

% de
Departamento familias
Radio
Puno 1,2
La Libertad 1,9
Ayacucho 2,3
Huancavelica 2,3
Pasco 2,3
Apurímac 2,5
Cuzco 2,5
Amazonas 2,7
Madre de Dios 2,7
Ucayali 2,9
Cajamarca 2,9
Ancash 2,9
Junín 3
Huánuco 3,4
San Martin 3,5
Tacna 3,5
Loreto 3,5
Ica 3,6
Tumbes 3,7
Arequipa 3,7
Lima 3,8
Piura 3,8
Lambayeque 3,8
Moquegua 4,8

C 10=2.4
C 25=2.5
C 50=2.95
C 75=3.65
C 90=21.6
Rango intercuartílico IQR:
IQR=C 75−C 25 =3.65−2.5=1.15
La dispersión media entre los elementos del 50% de personas con radio es de
1.15%.
Mediana de las desviaciones absolutas MAD:
Xi |Xi-Md| MAD
1,2 1,75 0,05
1,9 1,05 0,05
2,3 0,65 0,05
2,3 0,65 0,05
2,3 0,65 0,25
2,5 0,45 0,25
2,5 0,45 0,45
2,7 0,25 0,45
2,7 0,25 0,45
2,9 0,05 0,55
2,9 0,05 0,55
2,9 0,05 0,55
3 0,05 0,65
3,4 0,45 0,65
3,5 0,55 0,65
3,5 0,55 0,65
3,5 0,55 0,75
3,6 0,65 0,75
3,7 0,75 0,85
3,7 0,75 0,85
3,8 0,85 0,85
3,8 0,85 1,05
3,8 0,85 1,75
4,8 1,85 1,85
Según el cuadro:
0.55+ 0.65
MAD= =0.6
2
La dispersión media entre los elementos del 50% de personas con radio con
respecto a la mediana es de 0.6%.
Coeficiente de variación intercuartílica CVc:
IQR
2 C −C25 3.65−2.5 1.15
CVc= = 75 = = =0.18
Q C 75+C 25 3.65+2.5 6.15
La variación entre las dispersiones entre las distribuciones del 50% de personas
con radio es del 0.18%, siendo esta muy cercana al límite para ser considerada
muy dispersa.
Simetría de Yule:
(C ¿ ¿ 25+C 75−2 Md ) 2.5+ 3.65−2(2.95) 0.25
H 1= → = =0.04 ¿
2 Md 2(2.95) 5.9
La distribución de los datos es asimétrica positiva, ya que los datos a ser muy
altos.
Simetría de Kelly:
(C ¿ ¿10+C 90 ) 2.4+21.6
H 2=Md − =2.95− =2.95−12=−9.05 ¿
2 2
La distribución de los datos es asimétrica negativa, ya que los datos a ser más
bajos.
−H 2 9.05
H 3= = =3.06
Md 2.95
Nuevamente, la distribución de los datos es asimétrica positiva, tendiendo los
datos a ser más altos.
Coeficiente de Curtosis:
C 90−C 10 21.6−2.4 19.2
K 2= = = =8.78
1.9(C 75−C 25) 1.9 (12.15) 2.185
La dispersión entre el 50% y el 80% de elementos centrales es leptocúrtica.

También podría gustarte