Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Medidas Forma
Medidas Forma
MEDIDAS DE FORMA
Las representaciones graficas, nos muestran la variedad de formas que pueden tomar
las distribuciones de frecuencias. Algunas de ellas son simétricas; aquellas que al
doblarlas por el centro crean dos mitades idénticas, lo que nos indica que tales
distribuciones tienen la misma cantidad de valores extremos en ambas direcciones,
alta y baja. Algunas otras tienen más valores extremos en una dirección que en otra,
por lo que se dice que son asimétricas (faltas de simetría) o que están sesgadas.
En las distribuciones que no toman la forma de una curva simétrica, tiene mucha
importancia obtener dos medidas adicionales, las de asimetría y curtosis.
DISTRIBUCIÓN NORMAL
De Moivre en 1773 realizo un trabajo sobre la curva normal. Carl Friedrich Gauss y
Laplace, contemporáneos de De Moivre, la dedujeron de forma independiente.
En sus inicios, la curva normal se aplicó para estudiar la distribución de los errores
(desviación) respecto al promedio aritmético, de aquí que también se le conoce con el
nombre de curva normal de error.
DISTRIBUCION NORMAL
SESGO
Cuando una curva está equilibrada, con relación a su eje vertical, se dice que es
simétrica, cuando esto no ocurre, se dice que es asimétrica. Por lo que el grado de
asimetría se le conoce como sesgo:
Cuando existe sesgo los valores observados se concentran en una sola dirección,
con respecto a un eje que pase por su centro, por lo que la distribución tendrá una
“cola” pronunciada. La posición de esta cola indica en donde están localizados los
relativamente pocos valores extremos y determina la dirección del sesgo.
a) Simétrica: Cuando existe un valor central alrededor del cual son igualmente
probables valores mayores o valores menores. En una distribución simétrica y
unimodal, la media, la moda y la mediana coinciden.
x = xˆ = x
b) Asimétrica positiva: Una distribución unimodal con una larga cola a la derecha,
indica que los valores extremos se encuentran a la derecha de distribución de
frecuencias. En una distribución unimodal con una larga cola a la derecha, se cumple
que la moda es menor que la mediana y ésta a su vez es menor que la media.
x̂ < x < x
c) Asimétrica negativa: Una distribución unimodal con una larga cola a la izquierda,
dejar ver que los valores extremos se encuentran a la izquierda de la distribución de
frecuencias. En una distribución unimodal con una larga cola a la izquierda, se
cumple que: la media es menor que la mediana y la mediana su vez es menor que la
moda.
x < x < xˆ
COEFICIENTES DE PEARSON
media − moda ( x − xˆ )
sesgo = sk = =
s s
Si por alguna razón la moda no se encuentra bien definida, ésta se puede sustituir por
la mediana, y el sesgo se puede determinar mediante la expresión:
3( x − x)
sesgo = sk =
s
f m f ⋅m m−x (m − x )2 f ⋅ (m − x ) 2
Intervalo
10 - 13 4 11.5 46 -6 36 144
13 - 16 6 14.5 87 -3 9 54
16 - 19 10 17.5 175 0 0 0
19 - 22 6 20.5 123 3 9 54
22 - 25 4 23.5 94 6 36 144
30 525 396
Tenemos que:
525
x= = 17.5
30
⎛ d1 ⎞ ⎛ 4 ⎞
xˆ = Lxˆ + ⎜ ⎟ ⋅ c = 16 + ⎜ ⎟ 3 = 17.5
⎝ d1 + d 2 ⎠ ⎝ 4+4⎠
396
s2 = = 13.2
30
s = 13.2 = 3.63
Por lo que el sesgo es:
17.5 − 17.5
sesgo = =0
3.63
12
10
8
6
4
2
0
8.5
11.5
14.5
17.5
20.5
23.5
26.5
f m f ⋅m m−x (m − x ) 2 f ⋅ (m − x ) 2
Intervalo
445
x= = 15.8929
28
⎛ d1 ⎞ ⎛ 5 ⎞
xˆ = Lxˆ + ⎜ ⎟ ⋅ c = 13 + ⎜ ⎟ 3 = 15.5
⎝ d1 + d 2 ⎠ ⎝ 5 +1 ⎠
260.6786
s2 = = 9.3039
28
s = 9.3039 = 3.0512
Por lo que el sesgo es:
15.8929 − 15.5
sesgo = = 0.1287
3.0512
f m f ⋅m m−x (m − x ) 2 f ⋅ (m − x ) 2
Intervalo
969
x= = 21.5333
45
⎛ d1 ⎞ ⎛ 4 ⎞
xˆ = Lxˆ + ⎜ ⎟ ⋅ c = 23 + ⎜ ⎟ 4 = 25.6666
⎝ d1 + d 2 ⎠ ⎝ 2+4⎠
1683.2000
s2 = = 37.40
45
s = 37.40 = 6.1155
Por lo que el sesgo es:
21.5333 − 25.6666
sesgo = = −0.6758
6.1155
14
12
10
8
6
4
2
0
5 9 13 17 21 25 29 33
2.- Los siguientes datos recogen el número de unidades vendidas del producto
“Econopack” durante un mes en tiendas de cierta franquicia diseminadas por la
Republica Mexicana
3.- Las edades de los componentes de 100 matrimonios elegidos al azar en cierta
ciudad son las siguientes:
Para cada sexo:
a) Construya su histograma y su polígono de
frecuencias. edades hombres mujeres
b) Describa las representaciones graficas 15-25 5 8
construidas. 25-35 20 23
c) Determine el coeficiente de sesgo, 35-45 27 34
utilizando los dos coeficiente se Pearson. 45-55 22 18
d) ¿La información proporcionada por los 55-65 18 9
coeficientes coincide con la descripción 65-75 8 8
de la distribución de frecuencias?
¿Qué sexo presenta una edad media mayor? ¿Cuál presenta mayor dispersión?
MEDIDAS DE ORDEN
En tema anterior, se mostró que la mediana, además de ser una medida de tendencia
central, expresa una posición ordenada, la cual se obtiene al dividir el conjunto de
datos ordenados en dos partes iguales.
Por último, también se acostumbra dividir al conjunto ordenado en cien partes iguales,
dando lugar a los percentiles; que desde el primero hasta el 99, dejan desde el 1%
hasta el 99% de observaciones con valores menores a ellos.
Cuartiles
⎛ i⋅n ⎞
⎜ 4 − faa ⎟
Qi = LQi + ⎜ ⎟⋅c
⎜ fQi ⎟
⎝ ⎠
Donde:
i = 1, 2,3 : número del cuartil que deseamos determinar
LQi : Límite real inferior del intervalo que contiene al cuartil de interés.
f aa : Frecuencia acumulada del intervalo anterior al que contiene al i-ésimo
cuartil
fQi : Frecuencia del intervalo que contiene al i-ésimo cuartil.
c: amplitud o ancho de intervalo.
DECILES
A los valores que dividen a los datos en diez partes iguales se les llama Deciles y se
representan por
D1 , D2 , D3 , , D9
La localización de los deciles la podemos determinar mediante la expresión:
i⋅n
P( Di ) =
10
Donde
i = 1, 2,3, … 9
Y una vez identificada su posición dentro de una clasificación por intervalos podemos
determinar su valor mediante la expresión:
⎛ i⋅n ⎞
⎜ 10 − faa ⎟
Di = LDi + ⎜ ⎟⋅c
⎜ f Di ⎟
⎝ ⎠
Donde:
i = 1, 2,3, … ,9 : número del decil que deseamos determinar
LDi : Límite real inferior del intervalo que contiene al i-ésimo decil.
f aa : Frecuencia acumulada del intervalo anterior al que contiene al i-ésimo
decil
PERCENTILES
A los valores que dividen al conjunto de datos en 100 partes iguales se les llaman
percentiles y se representan por: P1 , P2 , P3 , , P99
i = 1, 2,3,…,99
Y una vez identificada su posición dentro de una clasificación por intervalos podemos
determinar su valor mediante la expresión:
⎛ i⋅n ⎞
⎜ 100 − faa ⎟
Pi = LPi + ⎜ ⎟⋅c
⎜ f Pi ⎟
⎝ ⎠
Donde:
i = 1, 2,3, … ,99 : número del percentil que deseamos determinar
LPi : Límite real inferior del intervalo que contiene al i-ésimo percentil.
f aa : Frecuencia acumulada del intervalo anterior al que contiene al i-ésimo
percentil
f Pi : Frecuencia del intervalo que contiene al i-ésimo percentil.
c: amplitud o ancho de intervalo.
OBSERVACIÓN: x = D5 = Q2 = P50
MEDIDAS DE DISPERSIÓN
(Mediante cuartiles, deciles y percentiles)
Rango intercuartílico = Q = Q3 − Q1
b) Rango Percentil 10 – 90. Mide la dispersión del 80% de los datos centrales y se
obtiene de la diferencia entre el Percentil 90 y el Percentil 10 (o entre el decil 9 y el
Elaborado por ELEAZAR GÓMEZ LARA
Sep-07
Medidas de forma 12
decil 1), evitando así los puntos extremos. Incluye solo el 80% de los datos
distribuidos alrededor de la mediana, por lo que un 10% de las observaciones del
extremo inferior y otro 10% de las observaciones en el extremo superior son
excluidos.
COEFICIENTE DE VARIACIÓN
Ejemplo: El veterinario de un zoológico obtuvo los siguientes datos con respecto a los
pesos de los elefantes y las ratas de la pradera.
Elefantes Ratas
Media 10886 Kg. 476 g
Desviación estándar 582.8 Kg. 72.5 g
Por lo que se concluye que el peso de los elefantes tiene una menor variación que el
peso de las ratas de pradera.
MEDIDAS DE SESGO
(Utilizando cuartiles y percentiles)
Q3 − 2Q2 + Q1
skQ =
Q3 − Q1
CURTOSIS:
Haciendo uso de estas medidas, el coeficiente de curtosis percentílico, está dada por:
Q3 − Q1
κ=
2 ⋅ ( P90 − P10 )
a) los cuartiles
b) los deciles 3, 6, 7 y 9
c) los percentiles 10, 28, 50, 80 y 90
d) Rango intercuartílico
e) Rango percentílico
f) Coeficiente de sesgo cuartílico.
g) Coeficiente de sesgo percentílico 10-90
h) Coeficiente de curtosis.
Elaborado por ELEAZAR GÓMEZ LARA
Sep-07
Medidas de forma 15
N° Intervalo f fa
1 124.5 - 136.5 7 7
2 136.5 - 148.5 13 20
3 148.5 - 160.5 24 44
4 160.5 - 172.5 42 86
5 172.5 - 184.5 33 119
6 184.5 - 196.5 23 142
7 196.5 - 208.5 19 161
8 208.5 - 220.5 15 176
9 220.5 - 232.5 9 185
10 232.5 - 242.5 5 190
a) Cuartiles
i⋅n
Su posición se determina mediante la expresión: P (Qi ) =
4
1 ⋅ (190)
Cuartil uno; La posición de este cuartil se obtiene haciendo i= 1; P (Q1 ) = = 47.5
4
que se localiza dentro del intervalo numero 4.
⎛n ⎞
⎜ 4 − faa ⎟
El valor se establece mediante la expresión: Q1 = LQ1 + ⎜ ⎟⋅c
⎜ fQ1 ⎟
⎝ ⎠
Ahora identificando cada uno de los elementos necesarios para su cálculo
LQ1 = 160.5
f aa = 44 ⎛ 47.5 − 44 ⎞ ⎛ 3.5 ⎞
Q1 = 160.5 + ⎜ ⎟12 = 160.5 + ⎜ ⎟12 = 161.5
f Q1 = 42 ⎝ 42 ⎠ ⎝ 42 ⎠
c = 12
2 ⋅ (190)
Cuartil dos; La posición se obtiene haciendo i= 2; P (Q2 ) = = 95 que se
4
encuentra ubicada dentro del intervalo numero 5.
⎛ 2⋅n ⎞
⎜ 4 − faa ⎟
El valor se determina mediante la expresión: Q2 = LQ2 + ⎜ ⎟⋅c
⎜ f Q2 ⎟
⎝ ⎠
Nuevamente identificando cada uno de los elementos necesarios para su cálculo
LQ2 = 172.5
f aa = 86 ⎛ 95 − 86 ⎞ ⎛ 9 ⎞
Q2 = 172.5 + ⎜ ⎟12 = 172.5 + ⎜ ⎟12 = 175.77
f Q2 = 33 ⎝ 33 ⎠ ⎝ 33 ⎠
c = 12
3 ⋅ (190)
Cuartil tres; Posición hacemos i= 3, P (Q3 ) = = 142.5 hallada en el intervalo
4
número 7
⎛ 3⋅ n ⎞
⎜ 4 − faa ⎟
El valor se determina mediante la expresión: Q3 = LQ3 + ⎜ ⎟⋅c
⎜ fQ3 ⎟
⎝ ⎠
Identificando cada uno de los elementos necesarios para su cálculo
LQ3 = 196.5
f aa = 142 ⎛ 142.5 − 142 ⎞ ⎛ 0.5 ⎞
Q3 = 196.5 + ⎜ ⎟12 = 196.5 + ⎜ ⎟12 = 196.81
f Q3 = 19 ⎝ 19 ⎠ ⎝ 19 ⎠
c = 12
b) Deciles 3, 6, 7, 9
i⋅n
La posición de los deciles se determina mediante la expresión: P( Di ) =
10
3 ⋅ (190)
Decil 3; Su posición se obtiene haciendo i= 3; P( D3 ) = = 57 la cual está situada
10
dentro del intervalo numero 4.
⎛ 3⋅ n ⎞
⎜ 4 − faa ⎟
Se determina mediante la expresión: D3 = LD3 + ⎜ ⎟⋅c
⎜ f D3 ⎟
⎝ ⎠
Ahora conociendo cada uno de los elementos necesarios para su cálculo
LD3 = 160.5
f aa = 44 ⎛ 57 − 44 ⎞ ⎛ 7 ⎞
D3 = 160.5 + ⎜ ⎟12 = 160.5 + ⎜ ⎟12 = 162.5
f D3 = 42 ⎝ 42 ⎠ ⎝ 42 ⎠
c = 12
6 ⋅ (190)
Decil 6; La posición se obtiene haciendo i= 6; P ( D6 ) = = 114 que se sitúa
10
dentro del intervalo numero 5.
⎛ 6⋅n ⎞
⎜ 4 − faa ⎟
El valor se determina mediante el término: D6 = LD6 + ⎜ ⎟⋅c
⎜ f D6 ⎟
⎝ ⎠
Los elementos necesarios para su cálculo
LD6 = 172.5
f aa = 86 ⎛ 114 − 86 ⎞ ⎛ 28 ⎞
D6 = 172.5 + ⎜ ⎟12 = 172.5 + ⎜ ⎟12 = 182.68
f D6 = 33 ⎝ 33 ⎠ ⎝ 33 ⎠
c = 12
7 ⋅ (190)
Decil 7; Posición con i= 7; P( D7 ) = = 133 situada dentro del intervalo 6.
10
LD7 = 184.5
f aa = 119 ⎛ 133 − 119 ⎞ ⎛ 14 ⎞
D7 = 184.5 + ⎜ ⎟12 = 184.5 + ⎜ ⎟12 = 191.87
f D7 = 23 ⎝ 23 ⎠ ⎝ 23 ⎠
c = 12
9 ⋅ (190)
Decil 9; Posición con i= 9; P ( D9 ) = = 171 situada dentro del intervalo 8.
10
LD9 = 208.5
f aa = 161 ⎛ 171 − 161 ⎞ ⎛ 10 ⎞
D9 = 208.5 + ⎜ ⎟12 = 208.5 + ⎜ ⎟12 = 216.5
f D9 = 15 ⎝ 15 ⎠ ⎝ 15 ⎠
c = 12
Percentil 28, su posición se obtiene haciendo i=28, por lo que la posición que ocupa
28 ⋅ (190)
es: P ( P28 ) = = 53.2 la cual se localiza en el intervalo 4.
100
50 ⋅ (190)
Percentil 50, para su posición hacemos i=50, por lo que P ( P50 ) = = 95
100
pertenece al intervalo 5
80 ⋅ (190)
Percentil 80, su posición cuando i=80, P ( P80 ) = = 152 que pertenece al
100
intervalo 7
LP80 = 196.5
f aa = 142 ⎛ 152 − 142 ⎞ ⎛ 10 ⎞
P80 = 196.5 + ⎜ ⎟12 = 196.5 + ⎜ ⎟12 = 202.81
f P80 = 19 ⎝ 19 ⎠ ⎝ 19 ⎠
c = 12
90 ⋅ (190)
Percentil 90, P ( P90 ) = = 171 que pertenece al intervalo 8
100
LP90 = 208.5
f aa = 161 ⎛ 171 − 161 ⎞ ⎛ 10 ⎞
P90 = 208.5 + ⎜ ⎟12 = 208.5 + ⎜ ⎟12 = 216.5
f P80 = 15 ⎝ 15 ⎠ ⎝ 15 ⎠
c = 12
d) Rango intercuartílico
e) Rango percentílico
f) Sesgo Cuartílico
h) Coeficiente de curtosis
45
40
35
30
25
20
15
10
0
119
131
143
155
167
179
191
203
215
227
239
251
Ejercicios
1.- Para tener mejor conocimiento de la altura de los estudiantes de una Preparatoria
publica del Estado de México con 800 alumnos, se eligieron a algunos de ellos y
obtuvo la siguiente distribución de datos:
Estaturas a) Construya su histograma y su polígono de
Intervalos f frecuencias.
1,50 - 1,55 13 b) Describa las representaciones graficas construidas.
1,55 - 1,60 23 c) Determine el coeficiente de sesgo, utilizando los dos
1,60 - 1,65 35 coeficiente se Pearson.
d) Determine el coeficiente de curtosis
1,65 - 1,70 41
e) ¿La información proporcionada por los coeficientes
1,70 - 1,75 30
coincide con la descripción de la distribución de
1,75 - 1,80 25
frecuencias?
1,80 - 1,85 13
f) ¿Qué se podría concluir acerca de la estatura de los
alumnos de este colegio?
Elaborado por ELEAZAR GÓMEZ LARA
Sep-07
Medidas de forma 20
3.- La siguiente tabla representa la edad de los empleados que trabajan en cierta
empresa:
Edad Nº de Empleados
Calcular: 22-26 12
a) Edad más frecuente 26-30 29
b) La edad que se encuentra justo en el 50% de la 30-34 27
distribución. 34-38 19
c) La edad mínima del 40% entre los mayores 38-42 16
d) Porcentaje entre 28 y 40 años 42-46 10
e) Porcentaje entre x ± s 46-50 7
f) Porcentaje entre x ± 2 s
f) Calcule la curtosis e interprete
g) Calcule el coeficiente de asimetría e interprete.
Calcular::
a). Porcentaje de calificaciones entre x ± 2s .
b).El intervalo donde cae el 60% central.
c). Porcentaje de los que obtuvieron más de 15 puntos.
d).La mayor nota del 25% que obtuvo la más baja.
e). La menor nota del 25% que obtuvo la nota más alta.
f) Coeficiente de asimetría e intérprete.
g).Calcule la curtosis, e intérprete.