Está en la página 1de 11

Estadı́stica Descriptiva. Diplomatura en Estadı́stica.

Formulario. Versión 2004-2005

1 Observaciones univariantes
En este formulario, las observaciones originales se denotan por X1 , . . . , Xn . Una vez clasi-
ficadas obtendremos las modalidades x1 , . . . , xk siendo obviamente k ≤ n. Utilizaremos la
siguiente notación,

• ni : frecuencia absoluta de la modalidad xi .


• fi : frecuencia relativa de la modalidad xi .
• Ni : frecuencia absoluta acumulada de la modalidad xi .
• Fi : frecuencia relativa acumulada de la modalidad xi .
• (ei−1 , ei ]: intervalo i-ésimo para datos agrupados.
• xi : usualmente es la modalidad i-ésima, pero para datos agrupados en intervalos,
denota la marca de clase o punto medio, es decir ai = (ei−1 + ei )/2.
• ai : para datos agrupados en intervalos, denota la amplitud del intervalo i-ésimo, es
decir, ai = ei − ei−1 .

1.1 Media aritmética


n k k
1X 1X X
X= Xi = ni xi = fi xi
n i=1 n i=1 i=1

1.2 Media geométrica


n k
Xi )1/n = ( xni i )1/n
Y Y
XG = (
i=1 i=1

1.3 Media armónica


n n 1
XH = X
n = k
= k
1/Xi
X X
ni /xi fi /xi
i=1 i=1 i=1

1
Diplomatura en Estadı́stica. Formulario de Estadı́stica Descriptiva. 2004-2005. [J.A.Mayor]. 2

1.4 Media cuadrática


v v v
n
u1 X
u u k
u1 X
u k
uX
XC =t Xi2 = t ni x2i = t fi x2i
n i=1 n i=1 i=1

NOTA: Se verifica X H ≤ X G ≤ X ≤ X C .

1.5 Mediana. Datos agrupados en intervalos


n/2 − Ni−1
M e = ei−1 + ai
ni
siendo,

• ei es el extremo inferior de la clase mediana.


• ai es la amplitud de la clase mediana.
• Ni−1 es la frecuencia acumulada de la clase anterior o previa a la clase mediana.
• ni es el número de observaciones en la clase mediana.

1.6 Cuartiles. Datos agrupados en intervalos


n/4 − Ni−1
Q1 = ei−1 + ai
ni
siendo,

• ei−1 es el extremo inferior de la clase en la que se superan el 25% de las observaciones.


• ai es la amplitud de dicha clase.
• ni es el número de observaciones en dicha clase.
• Ni−1 es la frecuencia acumulada de la clase anterior o previa a la considerada en los
apartados anteriores.

3n/4 − Ni−1
Q3 = ei−1 + ai
ni
siendo,

• ei−1 es el extremo inferior de la clase en la que se superan el 75% de las observaciones .


• ai es la amplitud de dicha clase.
• ni es el número de observaciones en dicha clase.
• Ni−1 es la frecuencia acumulada de la clase anterior o previa a la considerada en los
apartados anteriores.

NOTA: Q2 es la mediana.

José A. Mayor Gallego. Universidad de Sevilla


Diplomatura en Estadı́stica. Formulario de Estadı́stica Descriptiva. 2004-2005. [J.A.Mayor]. 3

1.7 Percentiles. Datos agrupados en intervalos


α n/100 − Ni−1
Pα = ei−1 + ai α = 1, 2, 3, . . . , 99, 100
ni
siendo,

• ei−1 es el extremo inferior de la clase en la que se superan el α% de las observaciones.

• ai es la amplitud de dicha clase.

• ni es el número de observaciones en dicha clase.

• Ni−1 es la frecuencia acumulada de la clase previa o anterior a la considerada en los


apartados anteriores.

NOTA: P25 = Q1 , P50 = Q2 = M e y P75 = Q3 .

1.8 Moda
La moda es la observación más frecuente, esto es, la más observada. Al contrario de las
medidas estudiadas hasta ahora, puede ser hallada tanto para datos cualitativos como cuan-
titativos. Se denota por M o. Para datos cuantitativos agrupados en intervalos, se aplica la
expresión,
δ1
M o = ei−1 + ai
δ1 + δ2
siendo,

• ei−1 es el extremo inferior de la clase o intervalo modal. Esta clase o intervalo se


define como el que tiene mayor frecuencia, en el caso de que todos los intervalos tengan
igual amplitud. Si los intervalos tienen diferentes amplitudes, el intervalo modal es el
que lleva asociada la altura máxima en el correspondiente histograma, es decir, el
máximo valor de la cantidad hi = ni /ai .

• δ1 = hi − hi−1

• δ2 = hi − hi+1

• hi = ni /ai , hi−1 = ni−1 /ai−1 , hi+1 = ni+1 /ai+1

• ni es la frecuencia de la clase modal, ni−1 es la frecuencia de la clase previa a la modal


y ni+1 es la frecuencia de la clase posterior a la modal.

• ai es la amplitud de la clase modal, ai−1 es la amplitud de la clase previa a la modal


y ai+1 es la amplitud de la clase posterior a la modal.

NOTA: Para el caso de datos cuantitativos se verifica la siguiente relación aproximada entre
media, mediana y moda,
X − M o ≈ 3(X − M e)

José A. Mayor Gallego. Universidad de Sevilla


Diplomatura en Estadı́stica. Formulario de Estadı́stica Descriptiva. 2004-2005. [J.A.Mayor]. 4

1.9 Varianza
n k k
1X 1X
Sx2 σx2 2 2 2 2
fi (xi − X)2
X
= =S =σ = (Xi − X) = ni (xi − X) =
n i=1 n i=1 i=1
y también,
n k k
1X 2 1X 2 2 2
Sx2 = σx2 = S 2 = Xi2 − X = ni x2i − X = fi x2i − X = X 2 − X
X
n i=1 n i=1 i=1

1.10 Desviación tı́pica


q
Sx = σx = + Sx2

1.11 Coeficiente de variación de Pearson


Sx
Cv(X) =
|X|

1.12 Recorrido intercuartı́lico


IQR = Q3 − Q1

1.13 Recorrido o rango


R = XMAX − XMIN

1.14 Momentos de orden r


n
1X
mr = Xr r > 0, entero
n i=1 i

1.15 Momentos centrales de orden r


n
1X
µr = (Xi − X)r r > 0, entero
n i=1

1.16 Coeficiente de asimetrı́a de Pearson


X − Mo
As =
S
• As = 0, distribución simétrica.
• As < 0, distribución asimétrica o sesgada a la izquierda.
• As > 0, distribución asimétrica o sesgada a la derecha.

José A. Mayor Gallego. Universidad de Sevilla


Diplomatura en Estadı́stica. Formulario de Estadı́stica Descriptiva. 2004-2005. [J.A.Mayor]. 5

1.17 Coeficiente de asimetrı́a de Fisher


µ3
γ1 =
S3
• γ1 = 0, distribución simétrica.
• γ1 < 0, distribución asimétrica o sesgada a la izquierda.
• γ1 > 0, distribución asimétrica o sesgada a la derecha.

1.18 Coeficiente de curtosis o aplastamiento


µ4
γ2 = −3
S4
• γ2 = 0, distribución mesocúrtica.
• γ2 > 0, distribución leptocúrtica.
• γ2 < 0, distribución platicúrtica.

1.19 Índice de diversidad de Shanon


Pk
− i=1 fi ln fi
J=
ln n

1.20 Índice de concentración de Gini. Datos originales


n X n
1 X
IG = |Xi − Xj |
2n2 X i=1 j=1

1.21 Índice de concentración de Gini. Datos resumidos


k X k
1 X
IG = ni nj |xi − xj |
2n2 X i=1 j=1

1.22 Índice de concentración de Gini. Datos agrupados en inter-


valos
k
1 X
IG = (pi−1 qi − qi−1 pi )
1002 i=2
siendo,

• si : suma de las observaciones en cada intervalo. Usualmente no se dispone de estas


observaciones, empleándose entonces como aproximación la suma de las marcas de
clase, es decir, si = ni xi .

José A. Mayor Gallego. Universidad de Sevilla


Diplomatura en Estadı́stica. Formulario de Estadı́stica Descriptiva. 2004-2005. [J.A.Mayor]. 6

• Si : cantidad anterior, acumulada, es decir, Si = s1 + s2 + · · · + si .

• pi : porcentaje de observaciones menores o iguales que Xi , es decir, pi = 100 Fi .

• qi : porcentaje que representa Si con respecto a la suma total Sk , o sea, qi = 100 Si /Sk .

1.23 Mediala. Datos agrupados en intervalos


50 − qi−1
Ml = ei−1 + ai
qi − qi−1

• ei−1 : extremo inferior de la clase medial.

• qi : cantidad q para la clase o intervalo medial.

• qi−1 : cantidad q para la clase previa a la medial.

• ai : amplitud o longitud del intervalo medial.

siendo la clase o intervalo medial aquel en el cual qi supera el 50%.

2 Observaciones bivariantes
Supondremos dos variables, X é Y . Tenemos un colectivo de n elementos, y sobre el ele-
mento i se han observado los valores (Xi , Yi ), i = 1, . . . , n. Supongamos que X presenta
k modalidades, x1 , x2 , . . . , xk é Y presenta p modalidades, y1 , y2 , . . . , yp . Emplearemos la
siguiente notación,

• nij : frecuencia absoluta conjunta de las modalidades xi é yj .

• fij : frecuencia relativa conjunta de las modalidades xi é yj .

• ni. : frecuencia absoluta marginal de la modalidad xi .


p
X
ni. = nij i = 1, . . . , k
j=1

• fi. : frecuencia relativa marginal de la modalidad xi .

• n.j : frecuencia absoluta marginal de la modalidad yj .


k
X
n.j = nij j = 1, . . . , p
i=1

• f.j : frecuencia relativa marginal de la modalidad yj .

José A. Mayor Gallego. Universidad de Sevilla


Diplomatura en Estadı́stica. Formulario de Estadı́stica Descriptiva. 2004-2005. [J.A.Mayor]. 7

Usualmente, las frecuencias conjuntas y marginales se disponen en forma de tabla de


doble entrada como se indica a continuación,

X\Y y1 y2 · · · yp ni.
x1 n11 n12 · · · n1p n1.
x2 n21 n22 · · · n2p n2.
.. .. .. .. .. ..
. . . . . .
xk nk1 nk2 · · · nkp nk.
n.j n.1 n.2 · · · n.p n

2.1 Medias aritméticas de X é Y


n k k
1X 1X X
X= Xi = ni. xi = fi. xi
n i=1 n i=1 i=1
n p p
1X 1X X
Y = Yj = n.j yj = f.j yj
n j=1 n j=1 j=1

2.2 Varianzas de X é Y
k
Sx2 = fi. (xi − X)2
X

i=1
p
Sy2 = f.j (yj − Y )2
X

j=1

2.3 Covarianza entre X é Y


n X n k X p k X p
1X 1X X
Sxy = (Xi − X)(Yj − Y ) = nij (xi − X)(yj − Y ) = fij (xi − X)(yj − Y )
n i=1 j=1 n i=1 j=1 i=1 j=1

y también,
n X n k X p k X p
1X 1X X
Sxy = Xi Yj − X Y = nij xi yj − X Y = fij xi yj − X Y = X Y − X Y
n i=1 j=1 n i=1 j=1 i=1 j=1

2.4 Frecuencias condicionadas


• Frecuencias de X condicionadas a Y .
x nij
f[i/Y =yj ] = i = 1, 2, . . . , k
n.j

• Frecuencias de Y condicionadas a X.
y nij
f[j/X=x i]
= j = 1, 2, . . . , p
ni.

José A. Mayor Gallego. Universidad de Sevilla


Diplomatura en Estadı́stica. Formulario de Estadı́stica Descriptiva. 2004-2005. [J.A.Mayor]. 8

2.5 Medias aritméticas condicionadas


• Medias de X condicionadas a Y .
k
x
X
X /Y =yj = f[i/Y =yj ] xi j = 1, . . . , p
i=1

• Medias de Y condicionadas a X.
p
y
X
Y /X=xi = f[j/X=x y
i] j
i = 1, . . . , k
j=1

2.6 Varianzas condicionadas


• Varianzas de X condicionadas a Y .
k
2 x 2
X
Sx/Y =yj = f[i/Y =yj ] (xi − X /Y =yj ) j = 1, . . . , p
i=1

• Varianzas de Y condicionadas a X.
p
2 y
(yj − Y /X=xi )2
X
Sy/X=x i
= f[j/X=x i]
i = 1, . . . , k
j=1

2.7 Curvas de regresión


• Curva de regresión de Y sobre X.

{(xi , Y /X=xi ) | i = 1, . . . , k}

• Curva de regresión de X sobre Y .

{(X /Y =yj , yj ) | j = 1, . . . , p}

2.8 Razones de correlación


• Razón de correlación de Y sobre X.
k k
fi. (Y /X=xi − Y )2 2
X X
fi. Sy/X=xi
i=1 i=1
ηY2 /X = =1−
Sy2 Sy2

• Razón de correlación de X sobre Y .


p p
2 2
X X
f.j (X /Y =yj − X) f.j Sx/Y =yj
2 j=1 j=1
ηX/Y = =1−
Sx2 Sx2

José A. Mayor Gallego. Universidad de Sevilla


Diplomatura en Estadı́stica. Formulario de Estadı́stica Descriptiva. 2004-2005. [J.A.Mayor]. 9

2.9 Rectas de regresión


• Recta de regresión de Y sobre X.
Sxy
y=Y + (x − X)
Sx2

• Recta de regresión de X sobre Y .


Sxy
x=X+ (y − Y )
Sy2

2.10 Coeficiente de correlación


Sxy
r=
Sx S y

3 Números Índices
Consideremos una magnitud X, que toma los valores X0 , X1 ,. . .,Xt , en los instantes sucesivos
0, 1, . . . , t.

3.1 Índice simple


Xt
It/0 = I0t =
X0
Es usual multiplicar los ı́ndices por 100 para obtener su valor en %, es decir, en tantos
por ciento. Los ı́ndices simples más comunes son,

(1) Precio relativo


pt
pt0 = pt/0 =
p0
(2) Cantidad relativa
qt
q0t = qt/0 =
q0
(1) Valor relativo
p t qt
Vt/0 = = pt/0 qt/0
p 0 q0

3.2 Índices complejos no ponderados


1 2 N
Supongamos que varias magnitudes tienen asociados los ı́ndices simples It/0 , It/0 , . . . , It/0 .

José A. Mayor Gallego. Universidad de Sevilla


Diplomatura en Estadı́stica. Formulario de Estadı́stica Descriptiva. 2004-2005. [J.A.Mayor]. 10

(1) Media aritmética


N
1 X
I t/0 = Ii
N i=1 t/0
(2) Media geométrica
N
!1/N
G i
Y
It/0 = It/0
i=1

(3) Media armónica


H N
It/0 = N
X 1
i
i=1 It/0

(4) Media agregativa


PN
A i=1 Xit
It/0 = PN
i=1 Xi0
siendo Xi0 , Xi1 ,. . .,Xit , i = 1, . . . , N los valores correspondientes a las distintas canti-
dades.

3.3 Índices complejos ponderados


Introducen pesos o ponderaciones para tener en cuenta la importancia relativa que presenta
cada magnitud. Denotemos dichos pesos como w1 , . . . , wN .

(1) Media aritmética ponderada


N
i
X
wi It/0
i=1
I t/0 = N
X
wi
i=1

(2) Media geométrica ponderada


PN
N
!1/ i=1
wi
G i
)wi
Y
It/0 = (It/0
i=1

(3) Media armónica ponderada


N
X
wi
H i=1
It/0 = N
X wi
i
i=1 It/0

(4) Media agregativa ponderada


PN
A i=1 wi Xit
It/0 = PN
i=1 wi Xi0
siendo Xi0 , Xi1 ,. . .,Xit , i = 1, . . . , N los valores correspondientes a las distintas canti-
dades.

José A. Mayor Gallego. Universidad de Sevilla


Diplomatura en Estadı́stica. Formulario de Estadı́stica Descriptiva. 2004-2005. [J.A.Mayor]. 11

3.4 Tipos de ı́ndices complejos ponderados


(1) ÍNDICE DE LASPEYRES

(a) Precios:
N
X
pit qi0
i=1
LPt/0 = N
X
pi0 qi0
i=1

(b) Cantidades:
N
X
qit pi0
LQ
t/0 = i=1
N
X
pi0 qi0
i=1

(2) ÍNDICE DE PAASCHE

(a) Precios:
N
X
pit qit
P i=1
Pt/0 = N
X
pi0 qit
i=1

(b) Cantidades:
N
X
pit qit
Q i=1
Pt/0 = N
X
qi0 pit
i=1

(3) ÍNDICE IDEAL DE FISHER

(a) Precios: q
P
Ft/0 = LPt/0 Pt/0
P

(b) Cantidades: r
Q
Ft/0 = LQ Q
t/0 Pt/0

José A. Mayor Gallego. Universidad de Sevilla

También podría gustarte