Documentos de Académico
Documentos de Profesional
Documentos de Cultura
3 Representaciones gráficas.
Estos datos proceden de las estadı́sticas oficiales del Banco Mundial para el año 2011 y
están referidos a 86 paı́ses. Por lo tanto, el tamaño de la muestra, que denotamos por
N, es N 86.
3 Representaciones gráficas.
A los posibles valores que puede tomar una variable se les suele denominar
“categorı́as” o “clases”.
Frecuencia absoluta.
Frecuencia relativa.
Frecuencia Absoluta.
Es el número de veces que se repite xk , un determinado valor de la variable.
Se denota por nk .
Ej: Si denotamos por X a la variable capacidad estadı́stica, entonces K 3 y sus
frecuencias absolutas son:
°
N 2) 0 ¤ nk ¤N
K
Propiedades: 1) nk
k 1
¿Qué es un sumatorio?
Un sumatorio es una suma de términos y se denota por el sı́mbolo matemá-
°
K
indican los elementos que han de sumarse
K
tico , donde los lı́mites
k 1
1 hasta K ”).
k 1
(“desde k
En general
¸
K
nk n1 n2 ... nK
k 1
En el ejemplo anterior
¸
4
nk n1 n2 n3 n4
k 1
10 44 32 86 N
k 1
°
a ° xk
K K
axk
k 1
k 1
° ° °
pxk yk q
K K K
xk yk
k 1
k 1
k 1
¡Cuidado!
°K x
ñ ° ° yx
k K
k 1 k
k 1
K k
y
1
k
k
° ° °
ñ
K K K
xk yk xk yk
k 1
k 1
k 1
2
° °
ñ
K K
xk2 xk
k 1
k 1
Frecuencia Relativa.
Es la frecuencia absoluta dividida entre el número total de observaciones
o individuos.
fk nNk
- fk es el tanto por 1 de observaciones que toman el valor xk .
-100 fk es el porcentaje de observaciones que toman el valor xk .
Valor de CAPACIDAD EST Valor X, xk Frecuencia Relativa, fk
Capacidad suficiente 1 n1
N
1086 0.116
Capacidad notable 2 n2
N
4486 0.512
Capacidad excelente 3 n3
N
2886 0.372
°
1 2) 0 ¤ fk ¤1
K
Propiedades: 1) fk
k 1
Capacidad notable 2
°2 n n n N 10 44 54
1
j 1 2 2
°3 n n
j
Cpacidad excelente 3 n2 n3 N2 n3 10 44 32 86
1
j 1
j
Propiedad: NK
N
Tema 2: Análisis descriptivo de los datos Estadı́stica I C
Frecuencia Relativa Acumulada
N N
j 1
j 1
Como en el caso anterior, la tabla con estas frecuencias sólo tiene sentido
cuando los posibles valores de la variable, xk , se pueden ordenar.
Valor de CAPACIDAD EST Valor X, xk Frecuencia Relativa Acumulada, Fk
Capacidad suficiente 1
°1 f f F 0.116
1
j 1 1
°2 f f f N2 54 0.628
j
Capacidad notable 2
1
j 1 2 N N
° f f
j
8686 1
3
N3
Capacidad excelente 3 f2 f3
1
j 1 N
j
Propiedad: FK
1
3 Representaciones gráficas.
En el ejemplo anterior los datos eran cualitativos ordinales, con tres posi-
bles valores para 86 observaciones. Esto permite la elaboración de la tabla
de frecuencias para datos no agrupados (es decir, con los valores originales
de la variable).
Solución
Una forma de presentar los datos de una forma clara y resumida es agrupar
los posibles valores de la variable en intervalos.
Los intervalos han de ser mutuamente excluyentes, esto es, cada posible
valor de la variable, xk , solo puede pertenecer a un intervalo.
Por lo tanto, siempre que sea posible el resto de medidas (estadı́sticos) deberı́an calcu-
larse con datos no agrupados.
Obsérvese que, por convención, se considera que los intervalos son abiertos
por la izquierda. Esto quiere decir que si para algún individuo i, xi Lk 1 ,
este individuo no pertenecerı́a al intervalo k esimo, sino al anterior:
"
xk R pLk 1 , Lk s
xk Lk 1 ñ xk P pLk 2 , Lk 1 s
Obsérvese también que hay casos (por ejemplo, la variable RIQUEZA de nuestra
base de datos) en los que sólo dispondremos de los datos agrupados.
3 Representaciones gráficas.
IMPORTANTE: Los gráficos han de poder leerse, esto es, han de disponer
de toda la información necesaria para poder interpretarlos correctamente.
Pictograma
Se trata de dibujos proporcionales a la frecuencia (absoluta o relativa) de
la categorı́a representada.
Pictograma
Ciudad A Ciudad B
Diagrama de barras
En el diagrama de barras representamos las distintas categorı́as de la va-
riable en el eje de abscisas (horizontal), mientras que en el de ordenadas
(vertical) lo hacemos con la frecuencia (absoluta, relativa o acumulada si
los datos se puede ordenar), de forma que las barras tengan una altura
proporcional a la frecuencia.
Diagrama de barras
Histograma
En el caso de frecuencias para datos agrupados (caso habitual de las varia-
bles cuantitativas continuas), estas se representan a través del histograma.
Polı́gono de Frecuencias
La idea es construir un diagrama análogo al de barras o histograma, pero
empleando, en vez de rectángulos, lı́neas rectas que unan los puntos me-
dios de las bases superiores de dichos rectángulos.
Ojiva
Cuando el polı́gono de frecuencias se aplica sobre frecuencias acumuladas
se le denomina Ojiva.
Dado que usan frecuencias acumuladas, este gráfico sólo se empleará con variables
que se puedan ordenar.
3 Representaciones gráficas.
Medidas de posición
Medidas de dispersión
Otras medidas.
Estas funciones de los datos emplean habitualmente las sumas y los productos. El
operador suma ya lo hemos repasado, por lo que a continuación revisaremos bremente
el operador producto.
Operador Producto
Supongamos que tenemos una serie de n números reales, denotados por
x1 , x2 , ..., xn1 , xn . Supongamos que queremos hacer el producto de todos
ellos:
x1 x2 . . . xn1 xn
±
Esta operación se puede escribir usando el operador producto :
¹
n
xi x1 x2 . . . xn1 xn
i 1
Algunas propiedades:
±
a an
n
i)
i 1
±
an ± xi
n n
ii) axi
i 1
i 1
Tema 2: Análisis descriptivo de los datos Estadı́stica I C
Tema 2: Análisis descriptivo de los datos
3 Representaciones gráficas.
Dada una serie de observaciones sobre una variable de interés, lo que vamos
a ver a continuación es cómo sintetizar todo este conjunto de valores en
un único valor.
Mediana
Moda
La diferencia básica entre estas medidas es lo que entiende cada una por
“centro” de la distribución.
Media Aritmética
Es la suma de los valores de todas las observaciones dividido por el número
total de observaciones.
¡Cuidado!
¸
86
EDAD INIC x N1 xi 861 532 6.19
i 1
EDAD INIC nk fk nk xk fk xk
5 3 0.03 15 0.17
6 64 0.74 384 4.47
7 19 0.22 133 1.55
°
3
SUMAS ( ) 86 1 532 6.19
k 1
¸
K ¸
K
EDAD INIC N1 nk xk 861 532 6.19 fk xk
k 1
k 1
p
Intervalo, Lk 1 , Lk s Mck nk nk Mck fk fk Mck
p
0, 1000 s 500 26 13000 0, 30 151, 16
p
1000, 2000 s 1500 15 22500 0, 17 261, 63
p
2000, 3000 s 2500 14 35000 0, 16 406, 98
p
3000, 4000 s 3500 7 24500 0, 08 284, 88
p
4000, 5000 s 4500 8 36000 0, 09 418, 60
p
5000, 6000 s 5500 5 27500 0, 06 319, 77
p
6000, 7000 s 6500 3 19500 0, 03 226, 74
p
7000, 8000 s 7500 4 30000 0, 05 348, 84
p
8000, 9000 s 8500 3 25500 0, 03 296, 51
p
9000, 10000 s 9500 1 9500 0.01 110, 47
SUMAS (
°10 ) 86 243000 1 2825,58
k 1
Ķ Ķ
CONSUMO PC N1 nk Mck 861 243000 2825, 58 fk Mck
k 1 k 1
Tema 2: Análisis descriptivo de los datos Estadı́stica I C
Medidas de tendencia central: Media Aritmética Ponderada
°N x °N x
1 para todo i 1, 2, ..., N, entonces x w i 1 i i 1 i
Obsérvese que si wi
°N 1 N
i 1
x.
xp p2xAp2 xB
1
xC xD q
1 1q
¸
N
pxi x q 0
i 1
° °
pxi x q ° x N N1 °
Nx Nx Nx 0
N N N N
Prueba: xi xi
i 1 i 1 i 1 i 1
2.- La suma de los cuadrados de las desviaciones respecto a una constante
b se minimiza cuando esta constante es igual a la media aritmética
(Teorema de König):
¸
N
arg min pxi bq2 x
b
i 1
°
BS pbq B i 1pxi bq Ņ Bpxi bq2 Ņ 2px bq
N
2
Bb Bb i 1
Bb i 1
i
Ņ Ņ Ņ
p bq 0 ñ 2
2 xi xi 2 b 0 ñ Nx Nb 0 ñ x b
i 1 i 1 i 1
°
B2 S pbq B i 1 2pxi bq Ņ B2pxi bq Ņ 2 2N ¡ 0
N
Bb2 Bb i 1
Bb i 1
x NNA x A NB
N
xB
NC
N
xC
Media Geométrica
Se suele denotar con la letra mayúscula G y con la variable como subı́ndice,
Gx .
i 1
En el caso de que se disponga de las frecuencias:
d
±
K
Gx N
xknk
k 1
b
±10
Ej 4: Media Geométrica de la altura de los 10 alumnos, 1a muestra: GAlt
?
10
1 xi
?
i
10
a
164, 920415 1, 6662. Con la 2 muestra, GAlt 10
222, 8654257 1, 717.
d
± ±
6, 169.
3 3 nk
86 n
Ej 1: Media Geométrica de EDAD INIC, GCAPITAS xk k xk86
k 1 k 1
Inconvenientes:
No siempre está determinada. Si alguno de los valores se anula (xi 0
para algún i), Gx será 0. Asimismo, la existencia de valores negativos
puede generar la indeterminación de Gx .
P2009 P2008
15
100
P2008 1
15
100
P2008
P2010 P2009
10
100
P2009 1
10
100
P2009 1
10
100
1
15
100
P2008
P2011 P2010
5
100
P2010 1
5
100
P2010
1
5
100
1
10
100
1
15
100
P2008
π 3
1
100
P2008 1
5
100
1
10
100
1
15
100
P2008
π 3
1
100
1
5
100
1
10
100
1
15
100
d
π
1
100
3
1
5
100
1
10
100
1
15
100
d
π 100 3
1
5
100
1
10
100
1
15
100
1 9.92 %
π 100 pGx 1q
i 1 xi
k 1 xk
Tema 2: Análisis descriptivo de los datos Estadı́stica I C
Medidas de tendencia central: Media Armónica
Inconvenientes:
No siempre está determinada. Si alguno de los valores se anula (xi 0
para algún i), Hx no estará determinada.
V D
2D
D
1
2
1
,
V1 V2 V1 V2
HV 1
2
1
0.01 2
0.0125
88.88 Km/h
100 80
Mediana
La mediana de una muestra, que suponemos ordenada de menor a ma-
yor, es aquel valor que deja a la izquierda (por debajo) el mismo número
de observaciones que a la derecha (por encima). Es decir, la mediana es
cualquier valor tal que, como mucho, la mitad de la muestra es menor que
dicho valor y, como mucho, la mitad de la muestra es mayor que dicho
valor (han de cumplirse ambas condiciones).
Datos no Agrupados:
Caso II. Cuando no existe ningún k tal que Nk N2, entonces consideramos
Nk N2 Nk 1 y calculamos la mediana como Mex xpk 1q
pLk 1 , Lk s nk Nk N
14
7, luego el intervalo mediano
(0,2] 2 2 2 2
es el tercero (k 3), 4, 6 .p s
Ej 3: (2,4] 2 4
(4,6] 6 10 Por lo tanto, la mediana será: Mex
N {2Nk 1
(6,8] 4 14 Lk 1 n
ak 4 7
6
4
2 5.
k
Histograma y Ojiva
16
14
10 B*
8
B
6
4 C*
A C
2
0
0 1 2 3 4 5 6 7 8 9
X
Nk 1 c N2 ñ c N2 Nk 1 .
Por lo tanto, el valor de x que buscamos es
Lk 1 p Nk 1 q .
N ak
2 nk
Tema 2: Análisis descriptivo de los datos Estadı́stica I C
Medidas de tendencia central: Mediana
Caracterı́sticas de la Mediana
- Se basa en el orden que toman los valores de la variable.
- No se ve afectada por valores extremos.
Inconvenientes:
Según la definición original puede no existir un único valor.
Moda
La moda es el valor (o valores) de la variable más frecuente (el más repe-
tido).
Si hay más de un valor con frecuencia máxima, habrá más de una moda.
Se dice entonces que la distribución es bimodal (2 modas), trimodal (3
modas), etc.
xk nk Mox 7
1 10
3 8
Ej 1:
5 7
7 15
11 13
La formula sitúa la moda más cerca del intervalo adyacente que tiene una mayor
densidad de frecuencia (dk 1 ó dk 1 ).
Puede haber más de una moda, puesto que puede haber más de un intervalo
modal.
pLk 1 , Lk s nk ak dk pLk 1 , Lk s nk ak dk
(45,55] 5 10 0.5 (40,60] 12 20 0.6
Ej 2:
Ej 1: (55,75] 36 20 1.8 (60,80] 68 20 3.4
(75,80] 39 5 7.8 (80,100] 6 20 0.3
(80,85] 6 5 1.2
Mo 75 1.2
1.8 1.2
5 77 Mo 60 0.3
0.3 0.6
20 66, 67
Caracterı́sticas de la Moda
Se puede emplear para todo tipo de variables, particularmente las categó-
ricas que no se pueden ordenar.
Inconvenientes:
Puede no ser única.
Medidas de Posición no Central
Los cuantiles dan información de la posición de la distribución, aunque
diferente de la central.
Cuartiles.
Deciles.
Percentiles.
Cuartiles
C1 C2 C3
D1 D2 D3 D4 D5 D6 D7 D8 D9
De esta manera nos bastará con explicar una vez el cáculo para cubrir todos
los casos posibles.
Qr {M Lk 1
rN
M Nk 1 a
k
nk
xk nk Nk 1
4 20 5 ñ Q1{4 2 2 3 2.5
1 2 2 2
4 20 10 ñ Q2{4 4
Ej 1:
2 3 5 3
4 20 15 ñ Q3{4 5
3 4 9
4 5 14
5 6 20
pLk 1 , Lk s nk Nk
(0,2] 5 5
(2,4] 3 8
Ej 2:
(4,6] 1 9
(6,8] 3 12
(8,10] 3 15
1
4 15 3.75 ñ p0, 2s ñ Q1{4 0 3.7550 2 1.5
7.55
4 15 7.5 ñ p2, 4s ñ Q2{4 2 3 2 3.6
2
11.259
4 15 11.25 ñ p6, 8s ñ Q3{4 6 2 7.5
3
3
Inconvenientes:
Como la mediana, según la definición general pueden no ser únicos.
Son útiles en muestras grandes.
3 Representaciones gráficas.
Histograma 1 Histograma 2
Media Media
Recorrido o Rango.
Es la diferencia entre el valor máximo y el valor mı́nimo de una muestra.
Lo denotaremos por Rx :
Rx xpN q xp1q xmax xmin
Ej 1:
xk
nk
3
4
8
1
12
3
20
5
Rx xpN q xk
nk
3
1
8
6
12
5
20
1
Rx xpN q
xp1q 20 3 17 xp1q 20 3 17
Caracterı́sticas:
Se puede aplicar sobre variables cuantitativas.
Inconvenientes:
Es muy sensible a observaciones extremas.
No aporta información sobre la distribución de los datos dentro del
rango.
Recorrido intercuartı́lico.
Es la diferencia entre el tercer y el primer cuartil. Lo denotaremos por
RI px q.
RI px q Q3{4 Q1{4
Ej 2:
xk nk Nk
4
5
7
2
7
9
Q1{4 4 ð 14 20 5 ñ N1 7
7 4 13
12 4 17 Q3{4 12 ð 34 20 15 ñ N3 17
RI px q Q3{4 Q1{4 12 4 8
25 3 20
Caracterı́sticas:
Se puede aplicar sobre variables cuantitativas.
En general, dado que las medidas de dispersión suelen usarse para ver la
representatividad de las medidas de posición central, ese punto puede ser
cualquiera de los estadı́sticos de posición central: la mediana, la moda y,
particularmente, la media.
x 0
126 2
0 1
6
1 5 5
DM px q
|0 2| | 2| |1 2| |1 2| |5 2| |5 2|
0
6
2 2 1
6
1 3 3
2
x
0 4
1 6 6
0.6
10 10
xk 0 1 pq
DM x
| | | |
4 0 0.6 6 1 0.6
Ej 2: 10
nk 4 6
2.4 2.4
10
0.48
Interpretación:
Cuanto mayor/menor es la desviación absoluta media, mayor/menor
es la dispersión.
Caracterı́sticas:
Se aplica sobre variables cuantitativas.
Varianza
Media aritmética de los cuadrados de las desviaciones entre el valor de
cada observación y la media aritmética de la muestra. La denotaremos por
S 2 px q.
°
pxi x q
N
1 2
Datos no Agrupados:
N
i 1
°
nk pxk x q2
K
1
Tabla de Frecuencias:
N
k 1
Ej 1: Muestra: 0,0,1,1,5,5.
x 0 0 1
6
1 5 5
126 2
p q p0 2q p0 2q p1 2q2 p1 2q2 p5 2q2 p5 2q2
2 2
S2 x
6
4 4 1
6
1 9 9
4.6
x
0 4 6 0.6
1 6
10 10
xk 0 1 pq
S2 x
p q 6 p1 0.6q2
4 0 0.6 2
Ej 2: 10
nk 4 6
1.44
10
0.96
0.24
Interpretación:
Cuanto mayor/menor es la varianza, mayor/menor es la dispersión.
Caracterı́sticas:
Se aplica sobre variables cuantitativas.
N i 1
pxi x q2 N1 pxi k q2
i 1
para k x.
°
S 2 px q N1 xi2 x 2 x 2 x 2 . La varianza es la diferencia entre
N
3.-
i 1
la media aritmética del cuadrado de la variable y la media aritmética
al cuadrado.
Prueba:
Ņ Ņ
S2 x pq 1
pxi x q2 N1 xi2 x2 2xi x
N i 1 i 1
Ņ Ņ Ņ Ņ Ņ
1
xi2
1
x2 N1 2xi x N1 xi2 x2 2x N1 xi
N i 1 N i 1 i 1 i 1 i 1
Ņ Ņ
1
xi2 x2 2x 2 N1 xi2 x2
N i 1 i 1
Tema 2: Análisis descriptivo de los datos Estadı́stica I
Medidas de dispersión absoluta
° °
6.- S 2 px q px l x q2 , con Nl , x l , Sl2 el tamaño, la media
L L
Nl Nl
Sl2
l 1 N
l 1
N
xk 3 8 9 11 12
Ej 3:
nk 5 4 5 4 2
x 1
20
p
5 3 4 8 5 9 4 11 2 12 q8
1
pq
S2 x
20
p q
5 3 8 2 4 8 8 2 5 9 8 2 p q p q p 8q2
4 11 p 8q2 9.9
2 12
y 1
20
p p q
5 50 4 0 5 10
4 30 q 0 10x 80 y
2 40
1
pq
S2 x
20
p q p q
5 50 0 2 4 0 0 2 p 0q2
5 10 p 0q2
4 30 2 40p 0q2 990
102 S 2 xp q p q
S2 y
xA 4 8
2 12
9.33
6
xB 5 3 5 9 4 11
7.42
6
ñx NA x A NB x B
N
6 9.33 2014 7.42 8
pq
SA2 x
p 9.33q2
4 8p 9.33q2 3.55 2 12
6
5p3 7.42q2 5p9 7.42q2 4p11 7.42q2
SB px q
2
11.53
14
pq
S2 x
NA S 2 x p qA
NB S 2 x p qB p x q2
NA x A p q
NB x B x 2
N N
6 3.55 14 11.53 p
6 9.33 8q2 p q
14 7.42 8 2
9.14 0.76 9.9
20 20
Interpretación:
Como en el caso de la varianza, a mayor/menor valor mayor/menor
dispersión.
Caracterı́sticas:
Se aplica sobre variables cuantitativas.
y bx ñ S py q |b| S px q
Medidas de dispersión relativas
Estas medidas se utilizarán:
1) cuando se quieran comparar muestras que no están expresadas en la
mismas unidades;
2) cuando expresadas en la misma unidad de medida, sus medias son muy
diferentes.
El coeficiente de Apertura.
El Recorrido Relativo.
Coeficiente de apertura
Es el cociente entre los dos valores extremos de una muestra. Lo denota-
remos por Ap px q.
Ap px q xppN1qq xxmax
x
min
Interpretación:
Cuantas veces es más grande la observación más elevada respecto de
la más pequeña.
Caracterı́sticas:
Se aplica sobre variables cuantitativas, normalmente positivas.
de la muestra entre esos dos valores (la misma crı́tica que se puede
hacer al Recorrido y Recorrido intercuartilico).
Ej: Muestra alturas: 1.55, 1.60, 1.70, 1.85, 1.71, 1.65, 1.60, 1.68, 1.64 y
1.70. Ap 1.85
1.55 1.19.
Tema 2: Análisis descriptivo de los datos Estadı́stica I C
Medidas de dispersión relativa
Recorrido relativo
Es el recorrido (rango) de la muestra dividido entre su media aritmética.
Lo denotaremos por Rr px q.
Rr px q Rx
Interpretación:
Cuantas veces“cabe”la media aritmética en el recorrido de la muestra.
Caracterı́sticas:
Se aplica sobre variables cuantitativas.
Caracterı́sticas:
Se aplica sobre variables cuantitativas.
xk 4 5 7 12 25
Q1{4 4, Q2{4 7 y Q3{4 12
Ej: nk 7 2 4 4 3 ñ p q
RI x 8
RI px q
Nk 7 9 13 17 20
{
RIr Q
2 4
8
7
1.14
Caracterı́sticas:
Se aplica sobre variables cuantitativas.
Inconvenientes:
Si x está cercano a 0, entonces CVx es poco fiable.
y x a
CVy |Syy| |x Sx a| CVx
y bx
CVy |Syy| ||bb|| |Sxx| CVx
3 Representaciones gráficas.
B
-3 3 7
Mo=Me=
-2 4 6
Frecuencia Absoluta
-1 5 5
4
0 6 3
1 5 2
2 4 1
3 3 0
-6 -4 -2 0 2 4 6
4 2 Y
5 1
Tema 2: Análisis descriptivo de los datos Estadı́stica I C
Medidas de Asimetrı́a
Tipos de Asimetrı́a
Asimetrı́a a la derecha o positiva
La cola de la derecha de la distribución es más alargada.
Ej 2:
yk nk
-5 2
Histograma
-4 4 8
Mo=Me
B
-3 6 7
-2 7 6
Frecuencia Absoluta
-1 5 5
4
0 3 3
1 2 2
2 2 1
3 2 0
-6 -4 -2 0 2 4 6
4 1 Y
5 1
6 1
y 1, Moy Mey 2
Tipos de Asimetrı́a
Asimetrı́a a la izquierda o negativa
La cola de la izquierda de la distribución es más alargada.
Ej 3:
yk nk
-6 1
Histograma
-5 1 8
B Mo=Me
-4 1 7
-3 2 6
Frecuencia Absoluta
-2 2 5
4
-1 2 3
0 3 2
1 5 1
2 7 0
-7 -5 -3 -1 1 3 5
3 6 Y
4 4
5 2
y 1, Moy Mey 2
Medidas de Asimetrı́a
Se utiliza en distribuciones unimodales.
Si Asb
0 la distribución es Simétrica.
Si Asb ¡
0 la distribución es Asimétrica positiva.
Si Asb
0 la distribución es Asimétrica negativa.
Medidas de Asimetrı́a
pS px qq3
Se utiliza en distribuciones unimodales.
Si g 1 0 la distribución es Simétrica.
¡
Si g 1 0 la distribución es Asimétrica positiva ô x ¡ Mex
Si g 1 0 la distribución es Asimétrica negativa ô x Mex .
° °1 °
p xq 0 ô p xq p x q, donde xk ¤ x
K K K
Sabemos que nk xk nk xk nk xk
k 1 k 1 k K1 1
si k ¤ K1 . Por lo tanto,
¸
K1 Ķ
g1 ñ p x q2 pxk x q ¾
nk xk nk xkp x q2 pxk x q
k 1 K1 1
Tipos de apuntamiento
Distribución Mesocúrtica: hace referencia a la curtosis de la distribución
normal o gausiana.
Distribucion Normal
0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
-4 -3 -2 -1 0 1 2 3 4
Tipos de apuntamiento
Distribución Leptocúrtica: cuando el apuntamiento es superior a la nor-
mal y se aprecia una mayor concentración en torno a x.
Distribución leptocúrtica
0,8
Normal
0,7
leptocúrtica
0,6
0,5
0,4
0,3
0,2
0,1
0
-4 -3 -2 -1 0 1 2 3 4
Tipos de apuntamiento
Distribución Platicúrtica: cuando el apuntamiento es inferior a la normal
y se aprecia una menor concentración en torno a x.
Distribución Platicúrtica
0,45
0,4 Normal
platicúrtica
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
-4 -3 -2 -1 0 1 2 3 4
Coeficiente de curtosis de Fisher
Lo denotaremos por g2 y se calcula como
1
°K n px x q4
g2 1 3
N k k
pS px qq4
k
1 °K n px x q4
N
1 k k
pS px qq
k
La razón por la que al cociente 4 se le resta 3 es que, para el caso de la
1 °K n px x q4
k 1
3.
N k k
normal, pS px qq
4
De esta forma:
Si g2 0 la distribución es mesocúrtica.
Si g2 ¡ 0 la distribución es leptocúrtica.
Si g2 0 la distribución es platicúrtica.
3 Representaciones gráficas.
Las distintas medidas o estadı́sticos utilizados para ver las diferentes ca-
racterı́sticas de una distribución que incluı́an a todas las observaciones de
la muestra pueden agruparse en lo que se denotan como momentos de
orden r respecto de κ.
Estos momentos los denotaremos por Mr ,pκq px q y se calculan de la siguente
manera:
°K n px κqr
Datos agrupados: Mr ,κ px q 1
k k
k
N
°N px κqr
Datos no agrupados: Mr ,κ px q 1
i
i
N
Todos se pueden interpretar como medias aritméticas de una transforma-
ción de la variable original.
Estos momentos caracterizan una distribución. Esto es, dos distribuciones
sólo serán iguales si tienen todos sus momentos iguales.
N
k 1
Propiedades
1. m1 0
2. Todos los momentos centrados pueden escribirse como una función
de los momentos respecto del origen.
m2 a2 a1
m3 a3 3a2 a1 2a13
m4 a4 6a2 a12 4a3 a1 3a14
Igualdades
1. x a1
2. S px q m2 a2 a1
2
3. g 1 m{ 3
3 2
m
g2 m 3
2
m
4. 4
2
2