Estadistica Descriptiva-Formulas (11 P) PDF

Estadı́stica Descriptiva. Diplomatura en Estadı́stica.
Formulario. Versión 2004-2005
1 Observaciones univariantes
En este formulario, las observaciones originales se denotan por X1 , . . . , Xn . Una vez clasi-
ficadas obtendremos las modalidades x1 , . . . , xk siendo obviamente k ≤ n. Utilizaremos la
siguiente notación,
• ni : frecuencia absoluta de la modalidad xi .

• fi : frecuencia relativa de la modalidad xi .
• Ni : frecuencia absoluta acumulada de la modalidad xi .
• Fi : frecuencia relativa acumulada de la modalidad xi .
• (ei−1 , ei ]: intervalo i-ésimo para datos agrupados.
• xi : usualmente es la modalidad i-ésima, pero para datos agrupados en intervalos,
denota la marca de clase o punto medio, es decir ai = (ei−1 + ei )/2.
• ai : para datos agrupados en intervalos, denota la amplitud del intervalo i-ésimo, es
decir, ai = ei − ei−1 .
1.1 Media aritmética

n k k
1X 1X X
X= Xi = ni xi = fi xi
n i=1 n i=1 i=1
1.2 Media geométrica

n k
Xi )1/n = ( xni i )1/n
Y Y
XG = (
i=1 i=1
1.3 Media armónica

n n 1
XH = X
n = k
= k
1/Xi
X X
ni /xi fi /xi
i=1 i=1 i=1
1
Diplomatura en Estadı́stica. Formulario de Estadı́stica Descriptiva. 2004-2005. [J.A.Mayor]. 2
1.4 Media cuadrática

v v v
n
u1 X
u u k
u1 X
u k
uX
XC =t Xi2 = t ni x2i = t fi x2i
n i=1 n i=1 i=1
NOTA: Se verifica X H ≤ X G ≤ X ≤ X C .
1.5 Mediana. Datos agrupados en intervalos

n/2 − Ni−1
M e = ei−1 + ai
ni
siendo,
• ei es el extremo inferior de la clase mediana.

• ai es la amplitud de la clase mediana.
• Ni−1 es la frecuencia acumulada de la clase anterior o previa a la clase mediana.
• ni es el número de observaciones en la clase mediana.
1.6 Cuartiles. Datos agrupados en intervalos

n/4 − Ni−1
Q1 = ei−1 + ai
ni
siendo,
• ei−1 es el extremo inferior de la clase en la que se superan el 25% de las observaciones.

• ai es la amplitud de dicha clase.
• ni es el número de observaciones en dicha clase.
• Ni−1 es la frecuencia acumulada de la clase anterior o previa a la considerada en los
apartados anteriores.
3n/4 − Ni−1
Q3 = ei−1 + ai
ni
siendo,
• ei−1 es el extremo inferior de la clase en la que se superan el 75% de las observaciones .

• Ni−1 es la frecuencia acumulada de la clase anterior o previa a la considerada en los
NOTA: Q2 es la mediana.
José A. Mayor Gallego. Universidad de Sevilla

1.7 Percentiles. Datos agrupados en intervalos

α n/100 − Ni−1
Pα = ei−1 + ai α = 1, 2, 3, . . . , 99, 100
ni
siendo,
• ei−1 es el extremo inferior de la clase en la que se superan el α% de las observaciones.
• Ni−1 es la frecuencia acumulada de la clase previa o anterior a la considerada en los

NOTA: P25 = Q1 , P50 = Q2 = M e y P75 = Q3 .
1.8 Moda
La moda es la observación más frecuente, esto es, la más observada. Al contrario de las
medidas estudiadas hasta ahora, puede ser hallada tanto para datos cualitativos como cuan-
titativos. Se denota por M o. Para datos cuantitativos agrupados en intervalos, se aplica la
expresión,
δ1
M o = ei−1 + ai
δ1 + δ2
siendo,
• ei−1 es el extremo inferior de la clase o intervalo modal. Esta clase o intervalo se

define como el que tiene mayor frecuencia, en el caso de que todos los intervalos tengan
igual amplitud. Si los intervalos tienen diferentes amplitudes, el intervalo modal es el
que lleva asociada la altura máxima en el correspondiente histograma, es decir, el
máximo valor de la cantidad hi = ni /ai .
• δ1 = hi − hi−1
• δ2 = hi − hi+1
• hi = ni /ai , hi−1 = ni−1 /ai−1 , hi+1 = ni+1 /ai+1
• ni es la frecuencia de la clase modal, ni−1 es la frecuencia de la clase previa a la modal

y ni+1 es la frecuencia de la clase posterior a la modal.
• ai es la amplitud de la clase modal, ai−1 es la amplitud de la clase previa a la modal

y ai+1 es la amplitud de la clase posterior a la modal.
NOTA: Para el caso de datos cuantitativos se verifica la siguiente relación aproximada entre
media, mediana y moda,
X − M o ≈ 3(X − M e)

1.9 Varianza
n k k
1X 1X
Sx2 σx2 2 2 2 2
fi (xi − X)2
X
= =S =σ = (Xi − X) = ni (xi − X) =
n i=1 n i=1 i=1
y también,
n k k
1X 2 1X 2 2 2
Sx2 = σx2 = S 2 = Xi2 − X = ni x2i − X = fi x2i − X = X 2 − X
X
n i=1 n i=1 i=1
1.10 Desviación tı́pica

q
Sx = σx = + Sx2
1.11 Coeficiente de variación de Pearson

Sx
Cv(X) =
|X|
1.12 Recorrido intercuartı́lico

IQR = Q3 − Q1
1.13 Recorrido o rango

R = XMAX − XMIN
1.14 Momentos de orden r

n
1X
mr = Xr r > 0, entero
n i=1 i
1.15 Momentos centrales de orden r

n
1X
µr = (Xi − X)r r > 0, entero
n i=1
1.16 Coeficiente de asimetrı́a de Pearson

X − Mo
As =
S
• As = 0, distribución simétrica.
• As < 0, distribución asimétrica o sesgada a la izquierda.
• As > 0, distribución asimétrica o sesgada a la derecha.

1.17 Coeficiente de asimetrı́a de Fisher

µ3
γ1 =
S3
• γ1 = 0, distribución simétrica.
• γ1 < 0, distribución asimétrica o sesgada a la izquierda.
• γ1 > 0, distribución asimétrica o sesgada a la derecha.
1.18 Coeficiente de curtosis o aplastamiento

µ4
γ2 = −3
S4
• γ2 = 0, distribución mesocúrtica.
• γ2 > 0, distribución leptocúrtica.
• γ2 < 0, distribución platicúrtica.
1.19 Índice de diversidad de Shanon

Pk
− i=1 fi ln fi
J=
ln n
1.20 Índice de concentración de Gini. Datos originales

n X n
1 X
IG = |Xi − Xj |
2n2 X i=1 j=1
1.21 Índice de concentración de Gini. Datos resumidos

k X k
1 X
IG = ni nj |xi − xj |
2n2 X i=1 j=1
1.22 Índice de concentración de Gini. Datos agrupados en inter-

valos
k
1 X
IG = (pi−1 qi − qi−1 pi )
1002 i=2
siendo,
• si : suma de las observaciones en cada intervalo. Usualmente no se dispone de estas

observaciones, empleándose entonces como aproximación la suma de las marcas de
clase, es decir, si = ni xi .

• Si : cantidad anterior, acumulada, es decir, Si = s1 + s2 + · · · + si .
• pi : porcentaje de observaciones menores o iguales que Xi , es decir, pi = 100 Fi .
• qi : porcentaje que representa Si con respecto a la suma total Sk , o sea, qi = 100 Si /Sk .
1.23 Mediala. Datos agrupados en intervalos

50 − qi−1
Ml = ei−1 + ai
qi − qi−1
• ei−1 : extremo inferior de la clase medial.
• qi : cantidad q para la clase o intervalo medial.
• qi−1 : cantidad q para la clase previa a la medial.
• ai : amplitud o longitud del intervalo medial.
siendo la clase o intervalo medial aquel en el cual qi supera el 50%.
2 Observaciones bivariantes
Supondremos dos variables, X é Y . Tenemos un colectivo de n elementos, y sobre el ele-
mento i se han observado los valores (Xi , Yi ), i = 1, . . . , n. Supongamos que X presenta
k modalidades, x1 , x2 , . . . , xk é Y presenta p modalidades, y1 , y2 , . . . , yp . Emplearemos la
siguiente notación,
• nij : frecuencia absoluta conjunta de las modalidades xi é yj .
• fij : frecuencia relativa conjunta de las modalidades xi é yj .
• ni. : frecuencia absoluta marginal de la modalidad xi .

p
X
ni. = nij i = 1, . . . , k
j=1
• fi. : frecuencia relativa marginal de la modalidad xi .
• n.j : frecuencia absoluta marginal de la modalidad yj .

k
X
n.j = nij j = 1, . . . , p
i=1
• f.j : frecuencia relativa marginal de la modalidad yj .

Usualmente, las frecuencias conjuntas y marginales se disponen en forma de tabla de

doble entrada como se indica a continuación,
X\Y y1 y2 · · · yp ni.
x1 n11 n12 · · · n1p n1.
x2 n21 n22 · · · n2p n2.
.. .. .. .. .. ..
. . . . . .
xk nk1 nk2 · · · nkp nk.
n.j n.1 n.2 · · · n.p n
2.1 Medias aritméticas de X é Y

n k k
1X 1X X
X= Xi = ni. xi = fi. xi
n i=1 n i=1 i=1
n p p
1X 1X X
Y = Yj = n.j yj = f.j yj
n j=1 n j=1 j=1
2.2 Varianzas de X é Y
k
Sx2 = fi. (xi − X)2
X
i=1
p
Sy2 = f.j (yj − Y )2
X
j=1
2.3 Covarianza entre X é Y

n X n k X p k X p
1X 1X X
Sxy = (Xi − X)(Yj − Y ) = nij (xi − X)(yj − Y ) = fij (xi − X)(yj − Y )
n i=1 j=1 n i=1 j=1 i=1 j=1
y también,
n X n k X p k X p
1X 1X X
Sxy = Xi Yj − X Y = nij xi yj − X Y = fij xi yj − X Y = X Y − X Y
n i=1 j=1 n i=1 j=1 i=1 j=1
2.4 Frecuencias condicionadas

• Frecuencias de X condicionadas a Y .
x nij
f[i/Y =yj ] = i = 1, 2, . . . , k
n.j
• Frecuencias de Y condicionadas a X.
y nij
f[j/X=x i]
= j = 1, 2, . . . , p
ni.

2.5 Medias aritméticas condicionadas

• Medias de X condicionadas a Y .
k
x
X
X /Y =yj = f[i/Y =yj ] xi j = 1, . . . , p
i=1
• Medias de Y condicionadas a X.
p
y
X
Y /X=xi = f[j/X=x y
i] j
i = 1, . . . , k
j=1
2.6 Varianzas condicionadas

• Varianzas de X condicionadas a Y .
k
2 x 2
X
Sx/Y =yj = f[i/Y =yj ] (xi − X /Y =yj ) j = 1, . . . , p
i=1
• Varianzas de Y condicionadas a X.
p
2 y
(yj − Y /X=xi )2
X
Sy/X=x i
= f[j/X=x i]
i = 1, . . . , k
j=1
2.7 Curvas de regresión

• Curva de regresión de Y sobre X.
{(xi , Y /X=xi ) | i = 1, . . . , k}
• Curva de regresión de X sobre Y .
{(X /Y =yj , yj ) | j = 1, . . . , p}
2.8 Razones de correlación

• Razón de correlación de Y sobre X.
k k
fi. (Y /X=xi − Y )2 2
X X
fi. Sy/X=xi
i=1 i=1
ηY2 /X = =1−
Sy2 Sy2
• Razón de correlación de X sobre Y .

p p
2 2
X X
f.j (X /Y =yj − X) f.j Sx/Y =yj
2 j=1 j=1
ηX/Y = =1−
Sx2 Sx2

2.9 Rectas de regresión

• Recta de regresión de Y sobre X.
Sxy
y=Y + (x − X)
Sx2
• Recta de regresión de X sobre Y .

Sxy
x=X+ (y − Y )
Sy2
2.10 Coeficiente de correlación

Sxy
r=
Sx S y
3 Números Índices
Consideremos una magnitud X, que toma los valores X0 , X1 ,. . .,Xt , en los instantes sucesivos
0, 1, . . . , t.
3.1 Índice simple

Xt
It/0 = I0t =
X0
Es usual multiplicar los ı́ndices por 100 para obtener su valor en %, es decir, en tantos
por ciento. Los ı́ndices simples más comunes son,
(1) Precio relativo

pt
pt0 = pt/0 =
p0
(2) Cantidad relativa
qt
q0t = qt/0 =
q0
(1) Valor relativo
p t qt
Vt/0 = = pt/0 qt/0
p 0 q0
3.2 Índices complejos no ponderados

1 2 N
Supongamos que varias magnitudes tienen asociados los ı́ndices simples It/0 , It/0 , . . . , It/0 .

(1) Media aritmética

N
1 X
I t/0 = Ii
N i=1 t/0
(2) Media geométrica
N
!1/N
G i
Y
It/0 = It/0
i=1
(3) Media armónica

H N
It/0 = N
X 1
i
i=1 It/0
(4) Media agregativa

PN
A i=1 Xit
It/0 = PN
i=1 Xi0
siendo Xi0 , Xi1 ,. . .,Xit , i = 1, . . . , N los valores correspondientes a las distintas canti-
dades.
3.3 Índices complejos ponderados

Introducen pesos o ponderaciones para tener en cuenta la importancia relativa que presenta
cada magnitud. Denotemos dichos pesos como w1 , . . . , wN .
(1) Media aritmética ponderada

N
i
X
wi It/0
i=1
I t/0 = N
X
wi
i=1
(2) Media geométrica ponderada

PN
N
!1/ i=1
wi
G i
)wi
Y
It/0 = (It/0
i=1
(3) Media armónica ponderada

N
X
wi
H i=1
It/0 = N
X wi
i
i=1 It/0
(4) Media agregativa ponderada

PN
A i=1 wi Xit
It/0 = PN
i=1 wi Xi0
siendo Xi0 , Xi1 ,. . .,Xit , i = 1, . . . , N los valores correspondientes a las distintas canti-
dades.

3.4 Tipos de ı́ndices complejos ponderados

(1) ÍNDICE DE LASPEYRES
(a) Precios:
N
X
pit qi0
i=1
LPt/0 = N
X
pi0 qi0
i=1
(b) Cantidades:
N
X
qit pi0
LQ
t/0 = i=1
N
X
pi0 qi0
i=1
(2) ÍNDICE DE PAASCHE
(a) Precios:
N
X
pit qit
P i=1
Pt/0 = N
X
pi0 qit
i=1
(b) Cantidades:
N
X
pit qit
Q i=1
Pt/0 = N
X
qi0 pit
i=1
(3) ÍNDICE IDEAL DE FISHER
(a) Precios: q
P
Ft/0 = LPt/0 Pt/0
P
(b) Cantidades: r
Q
Ft/0 = LQ Q
t/0 Pt/0

Estadistica Descriptiva-Formulas (11 P) PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica Descriptiva-Formulas (11 P) PDF

Cargado por

Copyright:

Formatos disponibles

Estadı́stica Descriptiva. Diplomatura en Estadı́stica.

Formulario. Versión 2004-2005

• ni : frecuencia absoluta de la modalidad xi .

1.1 Media aritmética

1.2 Media geométrica

1.3 Media armónica

1.4 Media cuadrática

1.5 Mediana. Datos agrupados en intervalos

• ei es el extremo inferior de la clase mediana.

1.6 Cuartiles. Datos agrupados en intervalos

• ei−1 es el extremo inferior de la clase en la que se superan el 25% de las observaciones.

• ei−1 es el extremo inferior de la clase en la que se superan el 75% de las observaciones .

José A. Mayor Gallego. Universidad de Sevilla

1.7 Percentiles. Datos agrupados en intervalos

• ei−1 es el extremo inferior de la clase en la que se superan el α% de las observaciones.

• ai es la amplitud de dicha clase.

• ni es el número de observaciones en dicha clase.

• Ni−1 es la frecuencia acumulada de la clase previa o anterior a la considerada en los

NOTA: P25 = Q1 , P50 = Q2 = M e y P75 = Q3 .

• ei−1 es el extremo inferior de la clase o intervalo modal. Esta clase o intervalo se

• hi = ni /ai , hi−1 = ni−1 /ai−1 , hi+1 = ni+1 /ai+1

• ni es la frecuencia de la clase modal, ni−1 es la frecuencia de la clase previa a la modal

• ai es la amplitud de la clase modal, ai−1 es la amplitud de la clase previa a la modal

José A. Mayor Gallego. Universidad de Sevilla

1.10 Desviación tı́pica

1.11 Coeficiente de variación de Pearson

1.12 Recorrido intercuartı́lico

1.13 Recorrido o rango

1.14 Momentos de orden r

1.15 Momentos centrales de orden r

1.16 Coeficiente de asimetrı́a de Pearson

José A. Mayor Gallego. Universidad de Sevilla

1.17 Coeficiente de asimetrı́a de Fisher

1.18 Coeficiente de curtosis o aplastamiento

1.19 Índice de diversidad de Shanon

1.20 Índice de concentración de Gini. Datos originales

1.21 Índice de concentración de Gini. Datos resumidos

1.22 Índice de concentración de Gini. Datos agrupados en inter-

• si : suma de las observaciones en cada intervalo. Usualmente no se dispone de estas

José A. Mayor Gallego. Universidad de Sevilla

• Si : cantidad anterior, acumulada, es decir, Si = s1 + s2 + · · · + si .

• pi : porcentaje de observaciones menores o iguales que Xi , es decir, pi = 100 Fi .

1.23 Mediala. Datos agrupados en intervalos

• ei−1 : extremo inferior de la clase medial.

• qi : cantidad q para la clase o intervalo medial.

• qi−1 : cantidad q para la clase previa a la medial.

• ai : amplitud o longitud del intervalo medial.

siendo la clase o intervalo medial aquel en el cual qi supera el 50%.

• nij : frecuencia absoluta conjunta de las modalidades xi é yj .

• fij : frecuencia relativa conjunta de las modalidades xi é yj .

• ni. : frecuencia absoluta marginal de la modalidad xi .

• fi. : frecuencia relativa marginal de la modalidad xi .

• n.j : frecuencia absoluta marginal de la modalidad yj .

• f.j : frecuencia relativa marginal de la modalidad yj .

José A. Mayor Gallego. Universidad de Sevilla

Usualmente, las frecuencias conjuntas y marginales se disponen en forma de tabla de

2.1 Medias aritméticas de X é Y

2.3 Covarianza entre X é Y

2.4 Frecuencias condicionadas

José A. Mayor Gallego. Universidad de Sevilla

2.5 Medias aritméticas condicionadas

2.6 Varianzas condicionadas

2.7 Curvas de regresión