Está en la página 1de 19

1.

Estadstica descriptiva
Curso 2011-2012
Estadstica
2 Estadstica Descriptiva
Datos
Nmero Consumo Cilindrada Potencia Peso Aceleracin Ao Pas N Cilindros
l/100Km cc CV kg segundos
1 15 4982 150 1144 12 70 EEUU 8
2 16 6391 190 1283 9 70 EEUU 8
3 24 5031 200 1458 15 70 EEUU 8
4 9 1491 70 651 21 71 EEUU 4
5 11 2294 72 802 19 71 EEUU 4
6 17 5752 153 1384 14 71 EEUU 8
7 12 2294 90 802 20 72 EEUU 4
8 17 6555 175 1461 12 72 EEUU 8
9 18 6555 190 1474 13 72 EEUU 8
10 12 1147 97 776 14 72 Japn 3
11 16 5735 145 1360 13 73 EEUU 8
12 12 1868 91 860 14 73 Europa 4
13 9 2294 75 847 17 74 EEUU 4
14 8 1295 67 666 16 74 Europa 4
15 7 1163 65 612 21 74 Japn 4
16 7 1360 61 667 19 74 Japn 4
17 12 3802 90 1070 17 75 EEUU 6
18 13 3687 95 1261 19 75 EEUU 6
19 9 1475 71 741 17 75 Europa 4
20 9 1983 115 890 14 75 Europa 4
... ... ... ... ... ... ... ... ...
391 7 1753 75 735 15 82 Japn 4
3 Estadstica Descriptiva
Tipos de datos
Cuantitativos
z Continuos: consumo,
potencia,aceleracin, peso
z Discretos: n de cilindros
Cualitativos
z Ordinales: categora
z No ordinales: pas, gasolina/gasoil
4 Estadstica Descriptiva
Distribucin de frecuencias:
consumo l/100 km
-------------------------------------------------------------
Limite Limite Punto Frecuencia Frecuencia
Clase Inferior Superior Medio Absoluta Relativa
-------------------------------------------------------------
1 0,0 2,5 1,25 0 0,0000
2 2,5 5,0 3,75 6 0,0153
3 5,0 7,5 6,25 65 0,1662
4 7,5 10,0 8,75 126 0,3223
5 10,0 12,5 11,25 64 0,1637
6 12,5 15,0 13,75 62 0,1586
7 15,0 17,5 16,25 36 0,0921
8 17,5 20,0 18,75 26 0,0665
9 20,0 22,5 21,25 4 0,0102
10 22,5 25,0 23,75 2 0,0051
-------------------------------------------------------------
Total 391 1,0000
5 Estadstica Descriptiva
Histograma
0 5 10 15 20 25
consumo
0
30
60
90
120
150
6 Estadstica Descriptiva
Histogramas para coches
0 2 4 6 8
(X 1000)
cilindrada
0
20
40
60
80
100
120
potencia
0 40 80 120 160 200 240
0
30
60
90
120
150
peso
0 0,4 0,8 1,2 1,6 2
(X 1000)
0
20
40
60
80
aceleracion
7 11 15 19 23 27
0
20
40
60
80
7 Estadstica Descriptiva
Medidas de centro
n
x x x
x
x x x
n
n
+ + +
=
"
2 1
2 1
aritmtica Media
,..., ,
x x x
x x x
n
x x x x x
i x i x
G H
n
H
n
n G
i i

+ + +
= =
> >
1 1 1
) todo para 0 (si
armonica Media
) todo para 0 (si
geomtrica Media
2 1
2 1
"
"
8 Estadstica Descriptiva
Medidas de dispersin
2
n
1
2
2 1
: Varianza
) (
Tipica Desviacion
,..., ,
s
n
x x
s
x x x
i
i
n

=

=
90 95 100 105 110
90 95 100 105 110
s 2
s 5.4
Media 100
9 Estadstica Descriptiva
Densidad de la tierra (Cavendish, 1798)
5,5 5,47 5,55 5,75 5,29 5,27
5,57 4,88 5,34 5,29 5,34 5,85
5,42 5,62 5,3 5,1 5,26 5,65
5,61 5,63 5,36 5,86 5,44 5,39
5,53 4,07 5,79 5,58 5,46
densidad
Meaia 5.42 Desv. Tip. 0.338
4 4,4 4,8 5,2 5,6 6
10 Estadstica Descriptiva
Desigualdad de Chebychev
2
1
1 ) , (,
k
ks x x fr
i
>
235 240 245 250 255
x
s k x
s k x +
2 2
2 2
2 2 2
2
2 2
1
2
2
1
1 ) , (,
1
) , (,
) , (,
) (
) ( ) (
) (
k
ks x x fr
k
ks x x fr
s k ks x x fr
n
s k
n
x x
s
n
x x
n
x x
n
x x
s
i i
i
ks x x ks x x
i
ks x x
i
ks x x
i
n
i
i
i i
i i
> >
> = >

> >
>
=
11 Estadstica Descriptiva
Mediana y Cuartiles
1
2
1
Q Q
Cuartiles
par :
2 2
impar :
2
1
Mediana
ordenados Datos
,..., ,
) ( 3 ) ( 1
) 1 ( ) (
) (
) ( ) 2 ( ) 1 (
2 1
+ =

+
=
= =

=
+
+
=

+
r n s
p
r
x x
n
n
p
x x
n
n
p x
x x x
x x x
s r
p p
p
n
n
"
12 Estadstica Descriptiva
Mediana y Cuartiles
75 0 25 0
Q Q
Cuartiles
50 0
) ( : Mediana
,..., ,
3 1
3 1
2 1
. ) Q fr(x . ) Q fr(x
. Mea) fr(x
Mea
x x x
i i
i
n
= =
=
235 240 245 250 255
25
25
50
Q
1
Med Q
3
13 Estadstica Descriptiva
Medidas caractersticas
Consumo Cilindrada Potencia Peso Aceleracin
Media 11.2 3181.2 104.2 990.7 15.7
Desv. Tpica 3.9 1714.6 38.3 281.9 2.8
Primer Cuartil 8 1721 75 741.5 14
Mediana 10 2474 93 933 16
Tercer Cuartil 13.5 4334 125 1203.5 17
Rango Intercuartlico 5.5 2613 50 462 3
14 Estadstica Descriptiva
Diagrama de caja
0 4 8 12 16 20 24
consumo
Q
1
Q
2
Q
3
LI Q
1
-1.5 RI LS Q
3
1.5 RI
RI Q
3
- Q
1
Min x
i
. x
i
LI}
Max x
i
. x
i
LS}
atipicos
15 Estadstica Descriptiva
Densidad de la tierra (Cavendish, 1798)
5,5 5,47 5,55 5,75 5,29 5,27
5,57 4,88 5,34 5,29 5,34 5,85
5,42 5,62 5,3 5,1 5,26 5,65
5,61 5,63 5,36 5,86 5,44 5,39
5,53 4,07 5,79 5,58 5,46
4 4,4 4,8 5,2 5,6 6
densidad
Meaia 5.42 Desv. Tip. 0.338
16 Estadstica Descriptiva
Diagrama de caja mltiple
0 4 8 12 16 20 24
consumo
EEUU
Europa
Japon
17 Estadstica Descriptiva
Diagrama de caja mltiple
EEUU
Europa
Japon
500 800 1100 1400 1700 2000
peso
18 Estadstica Descriptiva
Consumo segn ao de fabricacin
70
71
72
73
74
75
76
77
78
79
80
81
82
0 4 8 12 16 20 24
consumo
19 Estadstica Descriptiva
Diagrama de Caja Mltiple
0 4 8 12 16 20 24
OCDE
Europa Oriental
Asia/PaciIico
AIrica
Oriente Medio
America Latina
EEUU
Japon
Grecia
Barbados
Gabon
Producto interior bruto per capita
X1000
20 Estadstica Descriptiva
Diagrama de tallos y hojas
LO|4,07
1 4|
1 4|
1 4|
1 4|
2 4|8
3 5|1
12 5|222233333
(9) 5|444455555
8 5|666677
2 5|88
Media 5,419
Des. Tipica 0,339
Minimo 4,07
Maximo 5,86
Cuartil 1 5.3
Mediana 5.46
Cuartil 3 5.61
21 Estadstica Descriptiva
Medidas caractersticas de
forma: asimetra y curtosis)
n
x x
m
n
x
a
n
i
k
i
k
n
i
k
i
k

= =

= =
1 1
) (
media la a respecto
Momentos
origen al respecto
Momento
4
4
4
4
3
3
3
3
) ( ) (
to apuntamien
o curtosis de e CoeIicient
asimetria de
e CoeIicient
ns
x x
s
m
C
ns
x x
s
m
C
i
AP
i
AS


=
=

=
=
22 Estadstica Descriptiva
Modelo ideal
0 100 Z00 300 400 00 00 700
0
b
I0
Ib
Z0
Zb
30
f
r
e
c
u
e
n
c
i
o
ZZ0 Z30 Z40 Z0 Z0 Z70 Z0
0
b
I0
Ib
Z0
Zb
30
C
AS
~ 0 C
AP
3
f
r
e
c
u
e
n
c
i
o
Z30 Z3 Z40 Z4 Z0 Z Z0
0
Z00
400
o00
800
I000
C
AS
0 C
AP
3
23 Estadstica Descriptiva
Transformaciones de datos
cambia) no curtosis y (Asimetria
cambia no on distribuci la de " " La forma
s b s
x b a y
bx a y
x y
i i
=
+ =
+ =
TransIormaciones Lineales
TransIormaciones no-lineales
cambian) curtosis y asimetria de tes (coeIicien
on distribuci la de " " la Cambia
) (
) (
forma
x h y
x h y
i i

=
24 Estadstica Descriptiva
X
-10 10 30 50 70
0
40
80
120
160
200
240
Y
0 1 2 3 4 5 6
0
30
60
90
120
150
i i
x y log =
EIecto de la transIormacion de datos
25 Estadstica Descriptiva
Transformaciones Box-Cox
-1,5
-1
-0,5
0
0,5
1
1,5
i i
p
i
i
x y p
p
x
y
log 0
1
= =

=
26 Estadstica Descriptiva
Datos
kn k n
k
k
k
x x x n
x x x
x x x
Y Y Y
"
# % # # #
"
"
"
2 1
2 22 12
1 21 11
2 1
2
1
Variables
O
b
s
e
r
v
a
c
i
o
n
e
s
x
1
x
2
x
n
#
27 Estadstica Descriptiva
Vector de Medias

= =

=

=
n
n
i
ki
i
i
x
x
x
n
x
x
x
# #
2
1
1
2
1
;
i
i
x
x x
28 Estadstica Descriptiva
Covarianza
500 800 1100 1400 1700 2000
peso
0
4
8
12
16
20
24
c
o
n
s
u
m
o
n n
y
y
x
x
n
y x
Consumo Peso Coche
# # #
2 2
1 1
2
1
n
y y x x
s
n
i
i i
xy

=

=
1
) )( (
29 Estadstica Descriptiva
Matriz de Varianzas
( )

=
=
2
2 1
2
2
2 12
1 12
2
1
1
2
2 2 1 1
2 2
2
2 2 2 2 1 1
1 1 2 2 1 1
2
1 1
2 2 1 1
1
2 2
1 1
2
) ( ) )( ( ) )( (
) )( ( ) ( ) )( (
) )( ( ) )( ( ) (
1
1
k k k
k
k
n
i
k ki k ki i k ki i
k ki i i i i
k ki i i i i
k ki i i
n
i
k ki
i
i
s s s
s s s
s s s
x x x x x x x x x x
x x x x x x x x x x
x x x x x x x x x x
n
x x x x x x
x x
x x
x x
n
"
# % # #
"
"
"
# % # #
"
"
"
#
S
30 Estadstica Descriptiva
GraIicos de dispersion: ejemplo coches
consumo
cilindrada
potencia
peso
aceleracion
31 Estadstica Descriptiva
Matriz de varianzas: ejemplo coches

=
6 , 7 0 , 328 5 , 73 4 , 597 . 2 0 , 5
0 , 328 5 , 949 . 7 8 , 312 . 9 0 , 461 . 451 5 , 971
5 , 73 8 , 312 . 9 2 , 465 . 1 4 , 965 . 58 3 , 127
4 , 597 . 2 0 , 461 . 451 4 , 965 . 58 6 94 , 2 4 , 824 . 5
0 , 5 5 , 971 3 , 127 4 , 824 . 5 2 , 15
E
S
consumo c.c. pot. peso
acel.
32 Estadstica Descriptiva
Propiedades de S
2
0
1
~
~ ~
1
)
~ ~
1
(
0 ,
: es
~ ~
1
~
1
2
2 2 1 1
2 2 22 1 12
1 2 21 1 11
= = =
= =

=

=
n
v
n
n n
positiva aa semiaefini
n
x x x x x x
x x x x x x
x x x x x x
n
i
i
k
k kn n n
k k
k k
v v w S w w, X v
w) X ( w) X ( w X X w w S w
w S w w
S
X X S
X
T 2 T
T T T 2 T
2 T
2
T 2
"
# % # #
"
"
Cuadrada k x k
Simtrica
SemideI. positiva
33 Estadstica Descriptiva
Correlacin
500 800 1100 1400 1700 2000
peso
0
4
8
12
16
20
24
c
o
n
s
u
m
o

= =
=


= =
n
i
i
n
i
i
n
i
i i
y x
xy
xy
y y x x
y y x x
s s
s
r
1
2
1
2
1
) ( ) (
) )( (
Adimensional
-1 r
xy
1
,r
xy
, 1 y
i
a b x
i
n n
y
y
x
x
n
y x
Jar Jar Obs
# # #
2 2
1 1
2
1
2 1 .
34 Estadstica Descriptiva
Matriz de correlaciones
ejemplo coches

=
1 422 , 0 696 , 0 549 , 0 466 , 0
422 , 0 1 863 , 0 934 , 0 885 , 0
696 , 0 863 , 0 1 898 , 0 854 , 0
549 , 0 934 , 0 898 , 0 1 873 , 0
466 , 0 885 , 0 854 , 0 873 , 0 1
R
consumo c.c. pot. peso
Acel.
Las variables estan muy correlacionadas
35 Estadstica Descriptiva
Transformaciones Lineales
a S a a
) x )(x x (x
a
a) x a )(x x a x (a
x a
x ( a x a
x a
2 T
T
i i
T
T T
i
T
i
T
T
i
T
i
T
i
T
=


=

=

=

=
= = = =
=

= + + + =



=
= = =
= = =
n
n n
y y y y
n
y y
s
n
)
n n
y
y
x
x
x
a a a x a x a x a y
n
i
n
i
n
i
i i
n
i
i
y
n
i
n
i
n
i
i
ki
i
i
k ki k i i i
1
1 1 1
2
2
1 1 1
2
1
2 1 2 2 1 1
) )( ( ) (
) (
#
" "
36 Estadstica Descriptiva
Transformaciones lineales II
T 2
X
T
i i
T T T T
i i
i i
2
Y
i i i
i i
A AS
A
x x x x
A
A x A x x A Ax
y y y y
S
x A
x A Ax y
y
Ax y
=


=

=

=
= = = =
=
+ + + =
+ + + =
+ + + =


= =
=
= = =
n n
n
n n n
x a x a x a y
x a x a x a y
x a x a x a y
n
i
T
n
i
n
i
T
n
i
n
i
n
i
ki mk i m i m mi
ki mk i i i
ki k i i i
1 1
1
1 1 1
2 2 1 1
2 22 1 21 2
1 2 12 1 11 1
) )( ( ) )( (
) )( (
) (
"
#
"
"

ki
i
i
mk m m
k
k
mi
i
i
x
x
x
a a a
a a a
a a a
y
y
y
#
"
# % # #
"
"
#
2
1
2 1
2 22 21
1 12 11
2
1
S
X
2
37 Estadstica Descriptiva
Coef. correlacin
1
2
= r
80 . 0
2
= r
50 . 0
2
= r 0
2
= r
38 Estadstica Descriptiva
Log(10) de PIB_CAP
4.5 4.0 3.5 3.0 2.5 2.0
200
100
0
-100
Regin econmica
Regin econmica
Amrica Latina
Oriente Medio
f rica
Asia / Pacf ico
Europa Oriental
OCDE
Producto interior bruto per-capita
30000 20000 10000 0 -10000
M
o
r
t
a
l
i
d
a
d

i
n
f
a
n
t
i
l

(
m
u
e
r
t
e
s

p
o
r

1
0
0
0

n
a
c
i
m
i
e
n
t
o
s

v
i
v
o
s
)
200
100
0
-100
Regin econmica
Falta de linealidad

También podría gustarte