Está en la página 1de 11

Estadstica Descriptiva. Diplomatura en Estadstica.

Formulario. Version 2004-2005


1 Observaciones univariantes
En este formulario, las observaciones originales se denotan por X
1
, . . . , X
n
. Una vez clasi-
cadas obtendremos las modalidades x
1
, . . . , x
k
siendo obviamente k n. Utilizaremos la
siguiente notacion,
n
i
: frecuencia absoluta de la modalidad x
i
.
f
i
: frecuencia relativa de la modalidad x
i
.
N
i
: frecuencia absoluta acumulada de la modalidad x
i
.
F
i
: frecuencia relativa acumulada de la modalidad x
i
.
(e
i1
, e
i
]: intervalo i-esimo para datos agrupados.
x
i
: usualmente es la modalidad i-esima, pero para datos agrupados en intervalos,
denota la marca de clase o punto medio, es decir a
i
= (e
i1
+ e
i
)/2.
a
i
: para datos agrupados en intervalos, denota la amplitud del intervalo i-esimo, es
decir, a
i
= e
i
e
i1
.
1.1 Media aritmetica
X =
1
n
n

i=1
X
i
=
1
n
k

i=1
n
i
x
i
=
k

i=1
f
i
x
i
1.2 Media geometrica
X
G
= (
n

i=1
X
i
)
1/n
= (
k

i=1
x
n
i
i
)
1/n
1.3 Media armonica
X
H
=
n
n

i=1
1/X
i
=
n
k

i=1
n
i
/x
i
=
1
k

i=1
f
i
/x
i
1
Diplomatura en Estadstica. Formulario de Estadstica Descriptiva. 2004-2005. [J.A.Mayor]. 2
1.4 Media cuadratica
X
C
=

_
1
n
n

i=1
X
2
i
=

_
1
n
k

i=1
n
i
x
2
i
=

_
k

i=1
f
i
x
2
i
NOTA: Se verica X
H
X
G
X X
C
.
1.5 Mediana. Datos agrupados en intervalos
Me = e
i1
+ a
i
n/2 N
i1
n
i
siendo,
e
i
es el extremo inferior de la clase mediana.
a
i
es la amplitud de la clase mediana.
N
i1
es la frecuencia acumulada de la clase anterior o previa a la clase mediana.
n
i
es el n umero de observaciones en la clase mediana.
1.6 Cuartiles. Datos agrupados en intervalos
Q
1
= e
i1
+ a
i
n/4 N
i1
n
i
siendo,
e
i1
es el extremo inferior de la clase en la que se superan el 25% de las observaciones.
a
i
es la amplitud de dicha clase.
n
i
es el n umero de observaciones en dicha clase.
N
i1
es la frecuencia acumulada de la clase anterior o previa a la considerada en los
apartados anteriores.
Q
3
= e
i1
+ a
i
3n/4 N
i1
n
i
siendo,
e
i1
es el extremo inferior de la clase en la que se superan el 75% de las observaciones .
a
i
es la amplitud de dicha clase.
n
i
es el n umero de observaciones en dicha clase.
N
i1
es la frecuencia acumulada de la clase anterior o previa a la considerada en los
apartados anteriores.
NOTA: Q
2
es la mediana.
Jose A. Mayor Gallego. Universidad de Sevilla
Diplomatura en Estadstica. Formulario de Estadstica Descriptiva. 2004-2005. [J.A.Mayor]. 3
1.7 Percentiles. Datos agrupados en intervalos
P

= e
i1
+ a
i
n/100 N
i1
n
i
= 1, 2, 3, . . . , 99, 100
siendo,
e
i1
es el extremo inferior de la clase en la que se superan el % de las observaciones.
a
i
es la amplitud de dicha clase.
n
i
es el n umero de observaciones en dicha clase.
N
i1
es la frecuencia acumulada de la clase previa o anterior a la considerada en los
apartados anteriores.
NOTA: P
25
= Q
1
, P
50
= Q
2
= Me y P
75
= Q
3
.
1.8 Moda
La moda es la observacion mas frecuente, esto es, la mas observada. Al contrario de las
medidas estudiadas hasta ahora, puede ser hallada tanto para datos cualitativos como cuan-
titativos. Se denota por Mo. Para datos cuantitativos agrupados en intervalos, se aplica la
expresion,
Mo = e
i1
+

1

1
+
2
a
i
siendo,
e
i1
es el extremo inferior de la clase o intervalo modal. Esta clase o intervalo se
dene como el que tiene mayor frecuencia, en el caso de que todos los intervalos tengan
igual amplitud. Si los intervalos tienen diferentes amplitudes, el intervalo modal es el
que lleva asociada la altura maxima en el correspondiente histograma, es decir, el
maximo valor de la cantidad h
i
= n
i
/a
i
.

1
= h
i
h
i1

2
= h
i
h
i+1
h
i
= n
i
/a
i
, h
i1
= n
i1
/a
i1
, h
i+1
= n
i+1
/a
i+1
n
i
es la frecuencia de la clase modal, n
i1
es la frecuencia de la clase previa a la modal
y n
i+1
es la frecuencia de la clase posterior a la modal.
a
i
es la amplitud de la clase modal, a
i1
es la amplitud de la clase previa a la modal
y a
i+1
es la amplitud de la clase posterior a la modal.
NOTA: Para el caso de datos cuantitativos se verica la siguiente relacion aproximada entre
media, mediana y moda,
X Mo 3(X Me)
Jose A. Mayor Gallego. Universidad de Sevilla
Diplomatura en Estadstica. Formulario de Estadstica Descriptiva. 2004-2005. [J.A.Mayor]. 4
1.9 Varianza
S
2
x
=
2
x
= S
2
=
2
=
1
n
n

i=1
(X
i
X)
2
=
1
n
k

i=1
n
i
(x
i
X)
2
=
k

i=1
f
i
(x
i
X)
2
y tambien,
S
2
x
=
2
x
= S
2
=
1
n
n

i=1
X
2
i
X
2
=
1
n
k

i=1
n
i
x
2
i
X
2
=
k

i=1
f
i
x
2
i
X
2
= X
2
X
2
1.10 Desviacion tpica
S
x
=
x
= +
_
S
2
x
1.11 Coeciente de variacion de Pearson
Cv(X) =
S
x
|X|
1.12 Recorrido intercuartlico
IQR = Q
3
Q
1
1.13 Recorrido o rango
R = X
MAX
X
MIN
1.14 Momentos de orden r
m
r
=
1
n
n

i=1
X
r
i
r > 0, entero
1.15 Momentos centrales de orden r

r
=
1
n
n

i=1
(X
i
X)
r
r > 0, entero
1.16 Coeciente de asimetra de Pearson
A
s
=
X Mo
S
A
s
= 0, distribucion simetrica.
A
s
< 0, distribucion asimetrica o sesgada a la izquierda.
A
s
> 0, distribucion asimetrica o sesgada a la derecha.
Jose A. Mayor Gallego. Universidad de Sevilla
Diplomatura en Estadstica. Formulario de Estadstica Descriptiva. 2004-2005. [J.A.Mayor]. 5
1.17 Coeciente de asimetra de Fisher

1
=

3
S
3

1
= 0, distribucion simetrica.

1
< 0, distribucion asimetrica o sesgada a la izquierda.

1
> 0, distribucion asimetrica o sesgada a la derecha.
1.18 Coeciente de curtosis o aplastamiento

2
=

4
S
4
3

2
= 0, distribucion mesoc urtica.

2
> 0, distribucion leptoc urtica.

2
< 0, distribucion platic urtica.
1.19

Indice de diversidad de Shanon
J =

k
i=1
f
i
ln f
i
ln n
1.20

Indice de concentracion de Gini. Datos originales
I
G
=
1
2n
2
X
n

i=1
n

j=1
|X
i
X
j
|
1.21

Indice de concentracion de Gini. Datos resumidos
I
G
=
1
2n
2
X
k

i=1
k

j=1
n
i
n
j
|x
i
x
j
|
1.22

Indice de concentracion de Gini. Datos agrupados en inter-
valos
I
G
=
1
100
2
k

i=2
(p
i1
q
i
q
i1
p
i
)
siendo,
s
i
: suma de las observaciones en cada intervalo. Usualmente no se dispone de estas
observaciones, empleandose entonces como aproximacion la suma de las marcas de
clase, es decir, s
i
= n
i
x
i
.
Jose A. Mayor Gallego. Universidad de Sevilla
Diplomatura en Estadstica. Formulario de Estadstica Descriptiva. 2004-2005. [J.A.Mayor]. 6
S
i
: cantidad anterior, acumulada, es decir, S
i
= s
1
+ s
2
+ + s
i
.
p
i
: porcentaje de observaciones menores o iguales que X
i
, es decir, p
i
= 100 F
i
.
q
i
: porcentaje que representa S
i
con respecto a la suma total S
k
, o sea, q
i
= 100 S
i
/S
k
.
1.23 Mediala. Datos agrupados en intervalos
M
l
= e
i1
+
50 q
i1
q
i
q
i1
a
i
e
i1
: extremo inferior de la clase medial.
q
i
: cantidad q para la clase o intervalo medial.
q
i1
: cantidad q para la clase previa a la medial.
a
i
: amplitud o longitud del intervalo medial.
siendo la clase o intervalo medial aquel en el cual q
i
supera el 50%.
2 Observaciones bivariantes
Supondremos dos variables, X e Y . Tenemos un colectivo de n elementos, y sobre el ele-
mento i se han observado los valores (X
i
, Y
i
), i = 1, . . . , n. Supongamos que X presenta
k modalidades, x
1
, x
2
, . . . , x
k
e Y presenta p modalidades, y
1
, y
2
, . . . , y
p
. Emplearemos la
siguiente notacion,
n
ij
: frecuencia absoluta conjunta de las modalidades x
i
e y
j
.
f
ij
: frecuencia relativa conjunta de las modalidades x
i
e y
j
.
n
i.
: frecuencia absoluta marginal de la modalidad x
i
.
n
i.
=
p

j=1
n
ij
i = 1, . . . , k
f
i.
: frecuencia relativa marginal de la modalidad x
i
.
n
.j
: frecuencia absoluta marginal de la modalidad y
j
.
n
.j
=
k

i=1
n
ij
j = 1, . . . , p
f
.j
: frecuencia relativa marginal de la modalidad y
j
.
Jose A. Mayor Gallego. Universidad de Sevilla
Diplomatura en Estadstica. Formulario de Estadstica Descriptiva. 2004-2005. [J.A.Mayor]. 7
Usualmente, las frecuencias conjuntas y marginales se disponen en forma de tabla de
doble entrada como se indica a continuacion,
X\Y y
1
y
2
y
p
n
i.
x
1
n
11
n
12
n
1p
n
1.
x
2
n
21
n
22
n
2p
n
2.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
x
k
n
k1
n
k2
n
kp
n
k.
n
.j
n
.1
n
.2
n
.p
n
2.1 Medias aritmeticas de X e Y
X =
1
n
n

i=1
X
i
=
1
n
k

i=1
n
i.
x
i
=
k

i=1
f
i.
x
i
Y =
1
n
n

j=1
Y
j
=
1
n
p

j=1
n
.j
y
j
=
p

j=1
f
.j
y
j
2.2 Varianzas de X e Y
S
2
x
=
k

i=1
f
i.
(x
i
X)
2
S
2
y
=
p

j=1
f
.j
(y
j
Y )
2
2.3 Covarianza entre X e Y
S
xy
=
1
n
n

i=1
n

j=1
(X
i
X)(Y
j
Y ) =
1
n
k

i=1
p

j=1
n
ij
(x
i
X)(y
j
Y ) =
k

i=1
p

j=1
f
ij
(x
i
X)(y
j
Y )
y tambien,
S
xy
=
1
n
n

i=1
n

j=1
X
i
Y
j
X Y =
1
n
k

i=1
p

j=1
n
ij
x
i
y
j
X Y =
k

i=1
p

j=1
f
ij
x
i
y
j
X Y = X Y X Y
2.4 Frecuencias condicionadas
Frecuencias de X condicionadas a Y .
f
x
[i/Y =y
j
]
=
n
ij
n
.j
i = 1, 2, . . . , k
Frecuencias de Y condicionadas a X.
f
y
[j/X=x
i
]
=
n
ij
n
i.
j = 1, 2, . . . , p
Jose A. Mayor Gallego. Universidad de Sevilla
Diplomatura en Estadstica. Formulario de Estadstica Descriptiva. 2004-2005. [J.A.Mayor]. 8
2.5 Medias aritmeticas condicionadas
Medias de X condicionadas a Y .
X
/Y =y
j
=
k

i=1
f
x
[i/Y =y
j
]
x
i
j = 1, . . . , p
Medias de Y condicionadas a X.
Y
/X=x
i
=
p

j=1
f
y
[j/X=x
i
]
y
j
i = 1, . . . , k
2.6 Varianzas condicionadas
Varianzas de X condicionadas a Y .
S
2
x/Y =y
j
=
k

i=1
f
x
[i/Y =y
j
]
(x
i
X
/Y =y
j
)
2
j = 1, . . . , p
Varianzas de Y condicionadas a X.
S
2
y/X=x
i
=
p

j=1
f
y
[j/X=x
i
]
(y
j
Y
/X=x
i
)
2
i = 1, . . . , k
2.7 Curvas de regresion
Curva de regresion de Y sobre X.
{(x
i
, Y
/X=x
i
) | i = 1, . . . , k}
Curva de regresion de X sobre Y .
{(X
/Y =y
j
, y
j
) | j = 1, . . . , p}
2.8 Razones de correlacion
Razon de correlacion de Y sobre X.

2
Y/X
=
k

i=1
f
i.
(Y
/X=x
i
Y )
2
S
2
y
= 1
k

i=1
f
i.
S
2
y/X=x
i
S
2
y
Razon de correlacion de X sobre Y .

2
X/Y
=
p

j=1
f
.j
(X
/Y =y
j
X)
2
S
2
x
= 1
p

j=1
f
.j
S
2
x/Y =y
j
S
2
x
Jose A. Mayor Gallego. Universidad de Sevilla
Diplomatura en Estadstica. Formulario de Estadstica Descriptiva. 2004-2005. [J.A.Mayor]. 9
2.9 Rectas de regresion
Recta de regresion de Y sobre X.
y = Y +
S
xy
S
2
x
(x X)
Recta de regresion de X sobre Y .
x = X +
S
xy
S
2
y
(y Y )
2.10 Coeciente de correlacion
r =
S
xy
S
x
S
y
3 N umeros

Indices
Consideremos una magnitud X, que toma los valores X
0
, X
1
,. . .,X
t
, en los instantes sucesivos
0, 1, . . . , t.
3.1

Indice simple
I
t/0
= I
t
0
=
X
t
X
0
Es usual multiplicar los ndices por 100 para obtener su valor en %, es decir, en tantos
por ciento. Los ndices simples mas comunes son,
(1) Precio relativo
p
t
0
= p
t/0
=
p
t
p
0
(2) Cantidad relativa
q
t
0
= q
t/0
=
q
t
q
0
(1) Valor relativo
V
t/0
=
p
t
q
t
p
0
q
0
= p
t/0
q
t/0
3.2

Indices complejos no ponderados
Supongamos que varias magnitudes tienen asociados los ndices simples I
1
t/0
, I
2
t/0
, . . . , I
N
t/0
.
Jose A. Mayor Gallego. Universidad de Sevilla
Diplomatura en Estadstica. Formulario de Estadstica Descriptiva. 2004-2005. [J.A.Mayor]. 10
(1) Media aritmetica
I
t/0
=
1
N
N

i=1
I
i
t/0
(2) Media geometrica
I
G
t/0
=
_
N

i=1
I
i
t/0
_
1/N
(3) Media armonica
I
H
t/0
=
N
N

i=1
1
I
i
t/0
(4) Media agregativa
I
A
t/0
=

N
i=1
X
it

N
i=1
X
i0
siendo X
i0
, X
i1
,. . .,X
it
, i = 1, . . . , N los valores correspondientes a las distintas canti-
dades.
3.3

Indices complejos ponderados
Introducen pesos o ponderaciones para tener en cuenta la importancia relativa que presenta
cada magnitud. Denotemos dichos pesos como w
1
, . . . , w
N
.
(1) Media aritmetica ponderada
I
t/0
=
N

i=1
w
i
I
i
t/0
N

i=1
w
i
(2) Media geometrica ponderada
I
G
t/0
=
_
N

i=1
(I
i
t/0
)
w
i
_
1/

N
i=1
w
i
(3) Media armonica ponderada
I
H
t/0
=
N

i=1
w
i
N

i=1
w
i
I
i
t/0
(4) Media agregativa ponderada
I
A
t/0
=

N
i=1
w
i
X
it

N
i=1
w
i
X
i0
siendo X
i0
, X
i1
,. . .,X
it
, i = 1, . . . , N los valores correspondientes a las distintas canti-
dades.
Jose A. Mayor Gallego. Universidad de Sevilla
Diplomatura en Estadstica. Formulario de Estadstica Descriptiva. 2004-2005. [J.A.Mayor]. 11
3.4 Tipos de ndices complejos ponderados
(1)

INDICE DE LASPEYRES
(a) Precios:
L
P
t/0
=
N

i=1
p
it
q
i0
N

i=1
p
i0
q
i0
(b) Cantidades:
L
Q
t/0
=
N

i=1
q
it
p
i0
N

i=1
p
i0
q
i0
(2)

INDICE DE PAASCHE
(a) Precios:
P
P
t/0
=
N

i=1
p
it
q
it
N

i=1
p
i0
q
it
(b) Cantidades:
P
Q
t/0
=
N

i=1
p
it
q
it
N

i=1
q
i0
p
it
(3)

INDICE IDEAL DE FISHER
(a) Precios:
F
P
t/0
=
_
L
P
t/0
P
P
t/0
(b) Cantidades:
F
Q
t/0
=
_
L
Q
t/0
P
Q
t/0
Jose A. Mayor Gallego. Universidad de Sevilla

También podría gustarte