Está en la página 1de 22

ANALISIS EXPLORATORIO

DE DATOS
DIAGRAMA DE CAJA
DIAGRAMA DE TALLO Y HOJA

24/05/2012

Ing. SEMS

DIAGRAMA DE CAJA
La representacin de una variable numrica en una caja, tiras
que salen de ellas y limites. Sus caractersticas son :
Se sealan con signos ( *,O ) los casos muy alejados.
La altura de la caja representa la amplitud intercuartil (IQR) en
ella esta representado el 50% de la muestra.
El borde superior de la caja es el P75 .
El borde inferior de la caja es el P25 .
La lnea central de la caja es la mediana.
El limite despus de la tira es la puntuacin entre el extremo de
la caja y como mximo 1.5 IQRs.
Con una O se marcan los casos ( o datos ) entre 1.5 y 3 IQRs del
extremo de la caja.
Con un asterisco se marcan los casos que estn a mas de 3 IQRs
del extremo de la caja. Son datos extremos.
24/05/2012

Ing. SEMS

Construccin Diagrama de Caja

24/05/2012

Ing. SEMS

Forma Diagrama de Caja

24/05/2012

Ing. SEMS

GRAFICO DE TALLO Y HOJA

Al igual que la distribucin de frecuencia se divide la muestra


en intervalos( columna del tallo ) y se obtiene el numero de
casos ( datos ) comprendidos en cada intervalo ( hojas )
Es una frecuencia directamente con los datos, esta es la
diferencia con la distribucin de frecuencia dadas en clases o
categoras

24/05/2012

Ing. SEMS

GRAFICA DE TALLO Y HOJA

24/05/2012

Ing. SEMS

24/05/2012

Ing. SEMS

24/05/2012

Ing. SEMS

A continuacin se presenta los resultados de una muestra de 30


estudiantes que ingresaron a la UNMSM en el proceso ltimo.
DATOS MUESTRA No 2

E
j
e
m
p
l
o
24/05/2012

idem

edad

ingresof

idem

edad

ingresof

20

1322,2

16

19

1474,3

19

1832,0

17

17

1759,9

20

1534,0

18

19

1930,9

21

1542,4

19

21

1799,7

20

1612,8

20

25

1494,7

18

1456,0

21

17

1674,6

15

1610,8

22

20

1484,0

20

2030,8

23

17

1381,6

20

1367,7

24

23

1328,0

10

17

1608,4

25

20

1607,6

11

18

1653,5

26

24

1256,4

12

21

1153,1

27

22

1487,2

13

20

1698,9

28

20

1747,3

14

23

1475,1

29

18

1719,0

15

19

1847,7

30

20

1444,6

Ing. SEMS

M
U
E
S
T
R
A
#
2

A.- Hallar el grafico de tallo y hojas y el diagrama de caja de la


variable edad
26

EDAD Stem-and-Leaf Plot


Frequency Stem & Leaf
1,00
4,00
7,00
13,00
3,00
2,00

1.
1.
1.
2.
2.
2.

5
7777
8889999
0000000000111
233
45

Stem width:
10
Each leaf:
1 case(s)

24

22

20

18

16

14
N=

30

EDAD

24/05/2012

Ing. SEMS

10

B.- Hallar el grafico de tallo y hojas y el diagrama de caja de la


variable ingreso familiar
INGRESOF Stem-and-Leaf Plot
Frequency Stem & Leaf
1,00
11 . 5
1,00
12 . 5
4,00
13 . 2268
7,00
14 . 4577889
2,00
15 . 34
7,00
16 . 0011579
4,00
17 . 1459
2,00
18 . 34
1,00
19 . 3
1,00
20 . 3
Stem width:
100
Each leaf:
1 case(s)

2200

2000

1800

1600

1400

1200

1000
N=

30

INGRESOF

24/05/2012

Ing. SEMS

11

A continuacin se presenta los resultados de una muestra de 30


estudiantes que ingresaron a la UNMSM en el proceso ltimo.
DATOS MUESTRA No 1

E
j
e
m
p
l
o
24/05/2012

idem

edad

ingresof

idem

edad

ingresof

20

1665,8

16

17

1421,4

21

1517,7

17

22

1472,5

19

1455,3

18

19

1074,1

21

1404,4

19

19

1412,5

26

1524,8

20

21

1703,0

21

1713,0

21

19

1474,3

23

1605,4

22

21

1910,0

17

1537,4

23

20

1446,5

21

1618,6

24

20

1431,8

10

21

1882,2

25

20

1218,6

11

20

2030,8

26

19

1677,2

12

24

1524,4

27

21

1649,0

13

21

1810,9

28

20

1277,3

14

21

1677,6

29

21

1809,9

15

18

1838,4

30

21

1887,3

Ing. SEMS

M
U
E
S
T
R
A
#
1

12

A.- Hallar el grafico de tallo y hojas y el diagrama de caja de la


variable edad

EDAD Stem-and-Leaf Plot


Frequency Stem & Leaf
2,00
1,00
5,00
6,00
12,00
1,00
1,00
2,00

17 . 00
18 . 0
19 . 00000
20 . 000000
21 . 000000000000
22 . 0
23 . 0
Extremes (>=24,0)

Stem width:
1
Each leaf:
1 case(s)

28

26

24

12

22

20

18

16
N=

30

EDAD

24/05/2012

Ing. SEMS

13

B.- Hallar el grafico de tallo y hojas y el diagrama de caja de la


variable ingreso familiar
INGRESOF Stem-and-Leaf Plot
Frecuencia Tallo & Hojas
1,00
10 . 7
,00
11 .
2,00
12 . 17
,00
13 .
8,00
14 . 01234577
4,00
15 . 1223
6,00
16 . 014677
2,00
17 . 01
5,00
18 . 01388
1,00
19 . 1
1,00
20 . 3
Stem width: 100,0
Each leaf:
1 case(s)
24/05/2012

2200

2000

1800

1600

1400

1200

1000
N=

30

INGRESOF

Ing. SEMS

14

Ejemplo : Se tiene los gastos en S/. que realizaron 50


clientes sucesivos en un almacn de Lima

24/05/2012

7.36

43.20

58.56

86.72

116.80

21.28

41.60

59.84

90.24

125.44

22.08

46.40

62.40

93.28

130.56

26.24

47.68

62.40

97.60

140.48

30.40

47.36

65.60

102.08

145.60

32.64

48.32

66.88

104.96

167.68

36.32

49.12

66.88

106.88

196.80

37.12

53.12

67.68

108.16

204.16

40.32

54.88

76.48

111.36

205.76

41.28

58.24

83.52

115.84

222.40

Ing. SEMS

15

Histograma de Gastos en Soles en un Almacen


de Lima
20

Frecuencia

10

Desv. tp. = 51.61


Media = 82.6
N = 50.00

0
7.1

41.4

75.7

110.0

144.3

178.6

212.9

GA STO

24/05/2012

Ing. SEMS

16

GASTO Stem-and-Leaf Plot


Frequency Stem & Leaf
1.00
0. 0
7.00
0 . 2223333
14.00
0 . 44444444455555
7.00
0 . 6666667
5.00
0 . 88999
7.00
1 . 0000111
2.00
1 . 23
2.00
1 . 44
1.00
1. 6
1.00
1. 9
3.00 Extremes (>=204)
Stem width: 100.00
Each leaf:
1 case(s)
24/05/2012

Ing. SEMS

17

Diagrama de Caja
Gasto en Soles en un almacen
300

200

50
49
48

100

-100
N=

50

GASTO

24/05/2012

Ing. SEMS

18

24/05/2012

Ing. SEMS

19

48
49

50

Cons umo de clientes

-20

24/05/2012

20

40

60

Ing. SEMS

80

20

Ejercicio : En el ejercicio anterior convertir a $ (3.2) y


hacer un anlisis exploratorio del mismo.

24/05/2012

Histograma
20

10

Frecuencia

G Stem-and-Leaf Plot
Frequency Stem & Leaf
1.00
0. 2
4.00
0 . 6689
10.00
1 . 0112233444
9.00
1 . 556788899
5.00
2 . 00013
4.00
2 . 6789
6.00
3 . 012334
3.00
3 . 669
2.00
4 . 03
1.00
4. 5
1.00
5. 2
.00
5.
1.00
6. 1
3.00 Extremes (>=64)
Stem width: 10.00
Each leaf:
1 case(s)

Desv. tp. = 16.13


Media = 25.8
N = 50.00

0
2.9

13.6

24.3

35.0

45.7

56.4

67.1

Ing. SEMS

21

80
50
49
48

60

40

20

-20
N=

50

24/05/2012

Ing. SEMS

22