Está en la página 1de 20

Medidas de forma 1

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO


COLEGIO DE CIENCIAS Y HUMANIDADES
PLANTEL VALLEJO
ÁREA DE MATEMÁTICAS
ESTADÍSTICA Y PROBABILIDAD I

MEDIDAS DE FORMA

Las representaciones graficas, nos muestran la variedad de formas que pueden tomar
las distribuciones de frecuencias. Algunas de ellas son simétricas; aquellas que al
doblarlas por el centro crean dos mitades idénticas, lo que nos indica que tales
distribuciones tienen la misma cantidad de valores extremos en ambas direcciones,
alta y baja. Algunas otras tienen más valores extremos en una dirección que en otra,
por lo que se dice que son asimétricas (faltas de simetría) o que están sesgadas.

En las distribuciones que no toman la forma de una curva simétrica, tiene mucha
importancia obtener dos medidas adicionales, las de asimetría y curtosis.

Las medidas de asimetría revelan si en la distribución hay una concentración de datos


en alguno de sus extremos, el superior o el inferior, con respecto a un eje que pasa
por su centro.

Las medidas de curtosis establecen la diferencia de las distribuciones en términos de


“puntiagudez”, algunas de ellas son bastante picudas, otras son bastante planas y
otras no son ni muy planas ni muy puntiagudas.

Para establecer patrones de comportamiento en las distribuciones de frecuencias, de


una población o muestra, éstas se comparan con distribuciones teóricas que se
toman como modelos o patrones, y que nos permiten comparar, describir y
caracterizar a una distribución de frecuencias.

Una de las distribuciones teóricas de mayor uso en la investigación es la distribución


normal, la cual se toma como modelo para poder establecer las medidas de forma y
de curtosis.

DISTRIBUCIÓN NORMAL

Una de las más importantes distribuciones teóricas es la distribución normal,


conocida también con los nombres de curva normal o campana de Gauss.

De Moivre en 1773 realizo un trabajo sobre la curva normal. Carl Friedrich Gauss y
Laplace, contemporáneos de De Moivre, la dedujeron de forma independiente.

En sus inicios, la curva normal se aplicó para estudiar la distribución de los errores
(desviación) respecto al promedio aritmético, de aquí que también se le conoce con el
nombre de curva normal de error.

La curva normal, es un modelo teórico o ideal que se logró a partir de un análisis


matemático más que de una investigación y recolección de datos real.
Elaborado por ELEAZAR GÓMEZ LARA
Sep-07
Medidas de forma 2

La aplicación de la curva normal es muy amplia en situaciones reales de


investigación, ya que puede utilizarse para describir distribuciones de datos, para
interpretar la desviación estándar y para el cálculo de probabilidades.

La distribución normal es esencial para la toma de decisiones en estadística, ya que


basada en ella se puede generalizar los resultados de muestras a poblaciones.

La grafica de una distribución normal tiene la forma de una campana en la que la


mayor frecuencia se localiza en el centro y sus extremos se acercan al eje horizontal
sin que lleguen a tocarlo. Es simétrica con respecto a la media, por lo que hay la
misma cantidad de datos menores a la media y mayores que ésta. Como la máxima
frecuencia coincide con la media aritmética por esta razón en la distribución normal
son iguales la media, la moda y la mediana.

DISTRIBUCION NORMAL

SESGO

Cuando una curva está equilibrada, con relación a su eje vertical, se dice que es
simétrica, cuando esto no ocurre, se dice que es asimétrica. Por lo que el grado de
asimetría se le conoce como sesgo:

Sesgo: es el grado de asimetría, o falta de simetría de una distribución.

Cuando existe sesgo los valores observados se concentran en una sola dirección,
con respecto a un eje que pase por su centro, por lo que la distribución tendrá una
“cola” pronunciada. La posición de esta cola indica en donde están localizados los
relativamente pocos valores extremos y determina la dirección del sesgo.

La asimetría puede ser de dos tipos; negativa o positiva.

La asimetría se identifica por la dirección de la cola de la curva, cuando se encuentra


a la derecha; la asimetría es positiva, cuando está a la izquierda la asimetría es
negativa. Es decir, si la curva de frecuencias (polígono de frecuencias suavizado) de
una distribución tiene una cola mas larga a la derecha del máximo central que a la
izquierda, entonces se dice que esta sesgada a la derecha o que tiene un sesgo
positivo. Si es al contrario se dice que está sesgada a la izquierda o que tiene sesgo
negativo.
En las distribuciones unimodales sesgadas, la media tiende a situarse con respecto a
la moda al mismo lado que la cola más larga.

La grafica o curva de una distribución de frecuencias unimodal, moderadamente


sesgada, presenta tres situaciones:
Elaborado por ELEAZAR GÓMEZ LARA
Sep-07
Medidas de forma 3

a) Simétrica: Cuando existe un valor central alrededor del cual son igualmente
probables valores mayores o valores menores. En una distribución simétrica y
unimodal, la media, la moda y la mediana coinciden.

x = xˆ = x

b) Asimétrica positiva: Una distribución unimodal con una larga cola a la derecha,
indica que los valores extremos se encuentran a la derecha de distribución de
frecuencias. En una distribución unimodal con una larga cola a la derecha, se cumple
que la moda es menor que la mediana y ésta a su vez es menor que la media.

x̂ < x < x

c) Asimétrica negativa: Una distribución unimodal con una larga cola a la izquierda,
dejar ver que los valores extremos se encuentran a la izquierda de la distribución de
frecuencias. En una distribución unimodal con una larga cola a la izquierda, se
cumple que: la media es menor que la mediana y la mediana su vez es menor que la
moda.
x < x < xˆ

Elaborado por ELEAZAR GÓMEZ LARA


Sep-07
Medidas de forma 4

COEFICIENTES DE PEARSON

En las distribuciones simétricas, la media, la mediana y la moda coinciden y a medida


que la distribución se aparta de la simetría estos valores se alejan entre sí, por lo que
la moda, la mediana y la media no coinciden en las distribuciones asimétricas,
alejándose de la cima y acercándose a la cola.
La moda está mas cerca del punto más alto, que es donde se encuentran los valores
con mayor frecuencia, por el contrario la media se encuentra mas cerca de la cola,
donde están localizados los relativamente pocos datos con valores extremos, por esta
situación la más común de las medidas de asimetría es la diferencia entre la moda y
la media que es la más sensible a los valores extremos

Una medida relativa de asimetría se expresa simbólicamente como:

media − moda ( x − xˆ )
sesgo = sk = =
s s

Si por alguna razón la moda no se encuentra bien definida, ésta se puede sustituir por
la mediana, y el sesgo se puede determinar mediante la expresión:

3( x − x)
sesgo = sk =
s

Estas medidas se conocen como el primero y segundo coeficiente de Pearson y


varían entre el intervalo + 3, es cero para la distribución normal o la curva que es
simétrica. .

En resumen: El coeficiente de sesgo se puede determinar mediante el primer


coeficiente de Person:

⎧< 0 asimetríca negativa (cola izquierda )


x − xˆ ⎪
sesgo = ⎨= 0 la distribución es simetríca
s ⎪> 0 asimetríca positiva (cola derecha )

y si no es posible determinar el valor de la moda, es posible calcular el sesgo


mediante el segundo coeficiente de Pearson.

⎧< 0 asimetríca negativa (cola izquierda )


3( x − x) ⎪
sesgo = ⎨= 0 la distribución es simetríca
s ⎪> 0 asimetríca positiva (cola derecha)

Elaborado por ELEAZAR GÓMEZ LARA


Sep-07
Medidas de forma 5

Ejemplo 1: Calcular el sesgo para la siguiente distribución de frecuencias:

f m f ⋅m m−x (m − x )2 f ⋅ (m − x ) 2
Intervalo

10 - 13 4 11.5 46 -6 36 144
13 - 16 6 14.5 87 -3 9 54
16 - 19 10 17.5 175 0 0 0
19 - 22 6 20.5 123 3 9 54
22 - 25 4 23.5 94 6 36 144
30 525 396

Tenemos que:
525
x= = 17.5
30
⎛ d1 ⎞ ⎛ 4 ⎞
xˆ = Lxˆ + ⎜ ⎟ ⋅ c = 16 + ⎜ ⎟ 3 = 17.5
⎝ d1 + d 2 ⎠ ⎝ 4+4⎠
396
s2 = = 13.2
30
s = 13.2 = 3.63
Por lo que el sesgo es:
17.5 − 17.5
sesgo = =0
3.63

Por lo que la distribución de frecuencias es: simétrica.

Para comprobarlo construyamos el histograma y el polígono de frecuencias


correspondiente.

12
10
8

6
4

2
0
8.5

11.5

14.5

17.5

20.5

23.5

26.5

Histograma Poligono suavizado

Al revisar el histograma y el polígono, se puede observar que efectivamente la grafica


es simétrica, con respecto al eje que pasa por la media (17.5).

Elaborado por ELEAZAR GÓMEZ LARA


Sep-07
Medidas de forma 6

Ejemplo 2: Calcular el sesgo de la siguiente distribución de frecuencias:

f m f ⋅m m−x (m − x ) 2 f ⋅ (m − x ) 2
Intervalo

10 - 13 5 11.5 57.5 ‐4.39 19.2972 96.4860 


13 - 16 10 14.5  145.0  ‐1.39  1.9401  19.4005 
16 - 19 9 17.5  157.5  1.61  2.5829  23.2462 
19 - 22 3 20.5  61.5  4.61  21.2258  63.6773 
22 - 25 1 23.5  23.5  7.61  57.8686  57.8686 
28 445.0  260.6786 

445
x= = 15.8929
28
⎛ d1 ⎞ ⎛ 5 ⎞
xˆ = Lxˆ + ⎜ ⎟ ⋅ c = 13 + ⎜ ⎟ 3 = 15.5
⎝ d1 + d 2 ⎠ ⎝ 5 +1 ⎠
260.6786
s2 = = 9.3039
28
s = 9.3039 = 3.0512
Por lo que el sesgo es:
15.8929 − 15.5
sesgo = = 0.1287
3.0512

Puesto que el sesgo es positivo podemos afirmar que la distribución es asimétrica en


forma positiva, por lo que tiene una cola derecha.

Al trazar en forma conjunto su histograma y polígono de frecuencias podemos


detectar que la distribución de datos tiene una moderada cola derecha, es decir se
tienen pocos valores extremos al lado derecho por lo que el polígono de frecuencias
decrece lentamente conforme el valor de la variable aumenta.

Con lo que podemos concluir que la distribución de frecuencias es: asimétrica


positiva.
Elaborado por ELEAZAR GÓMEZ LARA
Sep-07
Medidas de forma 7

Ejemplo 3 Calcular el sesgo para la siguiente distribución de frecuencias:

f m f ⋅m m−x (m − x ) 2 f ⋅ (m − x ) 2
Intervalo

7 - 11 3 9 27 -12.5333 157.0844 471.2533


11 - 15 5 13 65 -8.5333 72.8178 364.0889
15 - 19 7 17 119 -4.5333 20.5511 143.8578
19 - 23 8 21 168 -0.5333 0.2844 2.2756
23 - 27 12 25 300 3.4667 12.0178 144.2133
27- 31 10 29 290 7.4667 55.7511 557.5111
45 969 1 683.2000

969
x= = 21.5333
45
⎛ d1 ⎞ ⎛ 4 ⎞
xˆ = Lxˆ + ⎜ ⎟ ⋅ c = 23 + ⎜ ⎟ 4 = 25.6666
⎝ d1 + d 2 ⎠ ⎝ 2+4⎠
1683.2000
s2 = = 37.40
45
s = 37.40 = 6.1155
Por lo que el sesgo es:
21.5333 − 25.6666
sesgo = = −0.6758
6.1155

Con un sesgo es negativo podemos aseverar que la distribución es asimétrica en


forma negativa, por lo que tiene una cola izquierda

Al construir en forma conjunta el histograma y polígono de frecuencias podemos


apreciar que la distribución de datos tiene una moderada cola izquierda, es decir se
tienen algunos valores extremos al lado izquierdo por lo que el polígono de
frecuencias decrece lentamente conforme el valor de la variable disminuye.

14
12
10
8
6
4
2
0
5 9 13 17 21 25 29 33

Histograma Poligono suavizado

Por lo que la distribución de frecuencias es: asimétrica negativa.

Elaborado por ELEAZAR GÓMEZ LARA


Sep-07
Medidas de forma 8

1.- Para la distribución de frecuencias proporcionado: Intervalos f


101,4 – 119,4 13
a) Construya su histograma y su polígono de frecuencias. 119,4 – 137,4 17
b) Describa las representaciones graficas construidas. 137,4 – 155,4 21
c) Determine el coeficiente de sesgo, utilizando los dos 155,4 – 173,4 30
coeficiente se Pearson. 173,4 - 191,4 21
d) ¿La información proporcionada por los coeficientes 191,4 - 209,4 16
coincide con la descripción de la distribución de 209,4 - 227,4 12
frecuencias? 227,4 - 245,4 10

2.- Los siguientes datos recogen el número de unidades vendidas del producto
“Econopack” durante un mes en tiendas de cierta franquicia diseminadas por la
Republica Mexicana

Intervalo f a) Construya su histograma y su polígono de frecuencias.


45 - 65 52 b) Describa las representaciones graficas construidas.
c) Determine el coeficiente de sesgo, utilizando los dos
65 - 85 87
coeficiente se Pearson.
85 - 105 62
d) ¿La información proporcionada por los coeficientes coincide
105 - 125 47
con la descripción de la distribución de frecuencias?
125 - 145 35
145 - 165 21
165 - 185 17
185 - 205 12

3.- Las edades de los componentes de 100 matrimonios elegidos al azar en cierta
ciudad son las siguientes:
Para cada sexo:
a) Construya su histograma y su polígono de
frecuencias. edades hombres mujeres
b) Describa las representaciones graficas 15-25 5 8
construidas. 25-35 20 23
c) Determine el coeficiente de sesgo, 35-45 27 34
utilizando los dos coeficiente se Pearson. 45-55 22 18
d) ¿La información proporcionada por los 55-65 18 9
coeficientes coincide con la descripción 65-75 8 8
de la distribución de frecuencias?

¿Qué sexo presenta una edad media mayor? ¿Cuál presenta mayor dispersión?

Elaborado por ELEAZAR GÓMEZ LARA


Sep-07
Medidas de forma 9

MEDIDAS DE ORDEN

En tema anterior, se mostró que la mediana, además de ser una medida de tendencia
central, expresa una posición ordenada, la cual se obtiene al dividir el conjunto de
datos ordenados en dos partes iguales.

De la abstracción de dividir la serie ordenada de las observaciones en partes iguales


pueden surgir la necesidad de dividir dicho conjunto ordenado en cuatro partes
iguales, con lo cual se obtendrían tres valores llamados cuartiles: primero, segundo y
tercero, y cada uno de ellos representa al valor que deja el 25%, el 50% y el 75% de
las observaciones con valores menores a ellos, respectivamente.

Al dividir al conjunto de datos ordenados en 10 partes iguales, obtenemos los valores


conocidos como deciles; que desde el primero hasta el noveno, dejan desde el 10%
hasta el 90% de observaciones con valores menores a ellos, respectivamente.

Por último, también se acostumbra dividir al conjunto ordenado en cien partes iguales,
dando lugar a los percentiles; que desde el primero hasta el 99, dejan desde el 1%
hasta el 99% de observaciones con valores menores a ellos.

El cálculo de estas medidas de orden sigue un procedimiento exactamente igual al


que se sigue para calcular la mediana, siendo la única diferencia el cálculo del orden
o posición correspondiente a la medida deseada.

CUARTILES, DECILES Y PERCENTILES

Los cuantiles son valores de la distribución de frecuencias que dividen a ésta en


partes iguales, es decir, en intervalos, que contienen el mismo número o porcentaje
de valores. Los más usados son los cuartiles, los deciles y los percentiles.

Cuando se divide a la distribución en cuatro partes obtenemos los Cuartiles,:


Q1 , Q2 , Q3 , si la división es en 10 intervalos iguales se generan los Deciles:
D1 , D2 , D3 , , D9 , y por último si la dividimos en 100 parte obtenemos los Percentiles
o centiles: P1 , P2 , P3 , , P99

Los cuantiles permiten hacer un análisis minucioso de una distribución de


frecuencias, se utilizan habitualmente cuando se quiere ubicar un dato dentro del
conjunto. Por ejemplo, ¿pertenece el dato x al 50% superior?, ¿al 10% inferior?, ¿al
50 % central?, etc.

Cuartiles

Si una serie de datos se coloca en orden creciente de magnitud el valor de posición


media, que divide al conjunto de datos en dos partes iguales es la mediana. Por
extensión de esta idea se puede pensar en aquellos valores que dividen al conjunto
en cuatro partes iguales.

Estos valores representados por Q1 , Q2 , Q3 a los cuales se les llaman cuartiles,


primero, segundo y tercero respectivamente.
Elaborado por ELEAZAR GÓMEZ LARA
Sep-07
Medidas de forma 10

La localización de los cuartiles la podemos determinar mediante la expresión:


i⋅n
P (Qi ) =
4
Donde
i = 1, 2,3
Una vez identificada su posición dentro de una clasificación por intervalos podemos
determinar su valor mediante la expresión:

⎛ i⋅n ⎞
⎜ 4 − faa ⎟
Qi = LQi + ⎜ ⎟⋅c
⎜ fQi ⎟
⎝ ⎠

Donde:
i = 1, 2,3 : número del cuartil que deseamos determinar
LQi : Límite real inferior del intervalo que contiene al cuartil de interés.
f aa : Frecuencia acumulada del intervalo anterior al que contiene al i-ésimo
cuartil
fQi : Frecuencia del intervalo que contiene al i-ésimo cuartil.
c: amplitud o ancho de intervalo.

DECILES

A los valores que dividen a los datos en diez partes iguales se les llama Deciles y se
representan por
D1 , D2 , D3 , , D9
La localización de los deciles la podemos determinar mediante la expresión:

i⋅n
P( Di ) =
10
Donde
i = 1, 2,3, … 9
Y una vez identificada su posición dentro de una clasificación por intervalos podemos
determinar su valor mediante la expresión:

⎛ i⋅n ⎞
⎜ 10 − faa ⎟
Di = LDi + ⎜ ⎟⋅c
⎜ f Di ⎟
⎝ ⎠

Donde:
i = 1, 2,3, … ,9 : número del decil que deseamos determinar
LDi : Límite real inferior del intervalo que contiene al i-ésimo decil.
f aa : Frecuencia acumulada del intervalo anterior al que contiene al i-ésimo
decil

Elaborado por ELEAZAR GÓMEZ LARA


Sep-07
Medidas de forma 11

f Di : Frecuencia del intervalo que contiene al i-ésimo decil.


c: amplitud o ancho de intervalo.

PERCENTILES

A los valores que dividen al conjunto de datos en 100 partes iguales se les llaman
percentiles y se representan por: P1 , P2 , P3 , , P99

La localización de los percentiles la podemos determinar mediante la expresión:


i⋅n
P( Pi ) =
100

i = 1, 2,3,…,99
Y una vez identificada su posición dentro de una clasificación por intervalos podemos
determinar su valor mediante la expresión:

⎛ i⋅n ⎞
⎜ 100 − faa ⎟
Pi = LPi + ⎜ ⎟⋅c
⎜ f Pi ⎟
⎝ ⎠

Donde:
i = 1, 2,3, … ,99 : número del percentil que deseamos determinar
LPi : Límite real inferior del intervalo que contiene al i-ésimo percentil.
f aa : Frecuencia acumulada del intervalo anterior al que contiene al i-ésimo
percentil
f Pi : Frecuencia del intervalo que contiene al i-ésimo percentil.
c: amplitud o ancho de intervalo.

OBSERVACIÓN: x = D5 = Q2 = P50

MEDIDAS DE DISPERSIÓN
(Mediante cuartiles, deciles y percentiles)

a) Rango intercuartílico.- Cuando aumenta la dispersión de una distribución de


frecuencias, aumenta la distancia entre los cuartiles, por lo que esta distancia puede
usarse como base de una medida de variabilidad

El intervalo intercuartil, es el rango entre el cuartil 3 y el cuartil 1. Es el intervalo que


incluye sólo el 50% de los datos distribuidos alrededor de la mediana. Para construirlo
se desechan el 25% de las observaciones del extremo derecho y el 25% de las
observaciones en el extremo superior.

Rango intercuartílico = Q = Q3 − Q1

b) Rango Percentil 10 – 90. Mide la dispersión del 80% de los datos centrales y se
obtiene de la diferencia entre el Percentil 90 y el Percentil 10 (o entre el decil 9 y el
Elaborado por ELEAZAR GÓMEZ LARA
Sep-07
Medidas de forma 12

decil 1), evitando así los puntos extremos. Incluye solo el 80% de los datos
distribuidos alrededor de la mediana, por lo que un 10% de las observaciones del
extremo inferior y otro 10% de las observaciones en el extremo superior son
excluidos.

Rango percentil 10 - 90 = P90 − P10

MEDIDAS DE DISPERSIÓN RELATIVAS

Cuando se necesita comparar dos o más series de datos a veces no es posible


hacerlo con las medidas absolutas, ya sea porque las unidades son diferentes o
porque tienen diferente media, en éstos casos deben utilizarse cantidades relativas
definida generalmente como:
Dispersión absoluta
Dispersión relativa =
media

COEFICIENTE DE VARIACIÓN

Es la medida de dispersión relativa más usada y se define como el cociente de la


desviación estándar entre la media aritmética, expresado en porcentaje y es
adimensional
s
Coeficiente de variación: V=
x

OBSERVACIÓN: El coeficiente de variación no es conveniente cuando la media es


muy cercana a cero.

Ejemplo: El veterinario de un zoológico obtuvo los siguientes datos con respecto a los
pesos de los elefantes y las ratas de la pradera.

Elefantes Ratas
Media 10886 Kg. 476 g
Desviación estándar 582.8 Kg. 72.5 g

Con lo cual el coeficiente de cada una de estas especies es:


582.8
V(elefantes) = = 0.05350
108.86
Por lo que el peso de los elefantes tiene una variación del 5.35%. Mientras que para
las ratas de campo se tiene que:
72.5
V(ratas) = = 0.1523
476
la variación es del 15.23% para el peso de las ratas de la pradera.

Por lo que se concluye que el peso de los elefantes tiene una menor variación que el
peso de las ratas de pradera.

Elaborado por ELEAZAR GÓMEZ LARA


Sep-07
Medidas de forma 13

MEDIDAS DE SESGO
(Utilizando cuartiles y percentiles)

Las medidas de sesgo en función de cuartiles y percentiles son las siguientes:

Coeficiente de sesgo cuartílico

En una distribución simétrica los cuartiles quedan simétricamente colocados respecto


a la mediana, pero si es asimétrica un cuartil se separa más que otro. El coeficiente
de sesgo cuartílico mide esta diferencia:

Q3 − 2Q2 + Q1
skQ =
Q3 − Q1

Si la asimetría es a la derecha Q3 estará más lejos de la mediana que Q1 ; si la


asimetría es a la izquierda Q1 está más alejada de la mediana que Q3 .
Esta medida varía siempre entre + 1, si es cero la distribución es normal.

Coeficiente de sesgo percentílico

En una distribución simétrica los percentiles quedan simétricamente colocados


respecto a la mediana, pero si la distribución es asimétrica un percentil se separa más
que otro. Por lo que con el coeficiente de sesgo percentílico mide estas diferencias:

P90 − 2 P50 + P10


sk p =
P90 − P10

Su interpretación y aplicación es similar a la del sesgo cuartílico.

CURTOSIS:

La curtosis es el grado de apuntamiento de una distribución de frecuencias, que se


mide con relación a la distribución normal, es decir, el coeficiente de curtosis analiza
el grado de concentración que presentan los valores alrededor de la zona central de
una distribución de frecuencias.
Al comparar cuán aguda, concentrada, o “puntiaguda” es la distribución de interés con
respecto a la Distribución Normal, se pueden presentar tres diferentes grados de
apuntalamiento.

Elaborado por ELEAZAR GÓMEZ LARA


Sep-07
Medidas de forma 14

Distribución leptocúrtica: es aquella que presenta un elevado grado de concentración


de datos alrededor de los valores centrales de la variable, es decir, es aquella
distribución que presenta apuntamiento relativo alto y su polígono de frecuencias es
algo puntiagudo.

Distribución mesocúrtica: cuando la distribución de frecuencias presenta un grado de


concentración medio alrededor de los valores centrales de la variable (que es igual a
la que presenta una distribución normal), es decir el polígono de frecuencias no es ni
puntiagudo ni achatado.

Distribución platicúrtica: la que presenta un reducido grado de concentración


alrededor de los valores centrales de la variable, es decir, el polígono de frecuencias
es plano o achatado.

Coeficiente de curtosis percentílico

Para medir el grado de apuntamiento o curtosis de una distribución, tomaremos como


referencia la posición que guardan los cuartiles y percentiles dentro de una
distribución.

Haciendo uso de estas medidas, el coeficiente de curtosis percentílico, está dada por:
Q3 − Q1
κ=
2 ⋅ ( P90 − P10 )

El que toma el valor de 0.263 cuando la distribución es normal y al comparar los


coeficientes de curtosis con este valor nos señala que una distribución es

Leptocúrtica si κ es menor que 0.263


Mesocúrtica si κ es igual a 0.263
Platicúrtica si κ es mayor que 0.263
Po lo que al calcular el coeficiente de curtosis podemos determinar el grado de
apuntamiento de la distribución y el tipo al cual pertenece la distribución.

⎧κ < 0.263 distribución leptocúrtica


Q3 − Q1 ⎪⎪
κ= ⎨κ = 0.263 distribución mesoúrtica
2 ⋅ ( P90 − P10 ) ⎪
⎪⎩κ > 0.263 distribución platicúrtica
Ejercicio: Dada la siguiente distribución de frecuencias determine:

a) los cuartiles
b) los deciles 3, 6, 7 y 9
c) los percentiles 10, 28, 50, 80 y 90
d) Rango intercuartílico
e) Rango percentílico
f) Coeficiente de sesgo cuartílico.
g) Coeficiente de sesgo percentílico 10-90
h) Coeficiente de curtosis.
Elaborado por ELEAZAR GÓMEZ LARA
Sep-07
Medidas de forma 15

N° Intervalo f fa
1 124.5 - 136.5 7 7
2 136.5 - 148.5 13 20
3 148.5 - 160.5 24 44
4 160.5 - 172.5 42 86
5 172.5 - 184.5 33 119
6 184.5 - 196.5 23 142
7 196.5 - 208.5 19 161
8 208.5 - 220.5 15 176
9 220.5 - 232.5 9 185
10 232.5 - 242.5 5 190

La estrategia para determinar cuartiles, deciles y percentiles, es la misma, primero se


establece su posición, a continuación se determina el intervalo que contiene a la
medida de interés y posteriormente se evalúa la expresión correspondiente para
obtener su valor. Con el fin de facilitar el procedimiento se determinó la frecuencia
acumulada de cada intervalo.

a) Cuartiles
i⋅n
Su posición se determina mediante la expresión: P (Qi ) =
4
1 ⋅ (190)
Cuartil uno; La posición de este cuartil se obtiene haciendo i= 1; P (Q1 ) = = 47.5
4
que se localiza dentro del intervalo numero 4.
⎛n ⎞
⎜ 4 − faa ⎟
El valor se establece mediante la expresión: Q1 = LQ1 + ⎜ ⎟⋅c
⎜ fQ1 ⎟
⎝ ⎠
Ahora identificando cada uno de los elementos necesarios para su cálculo
LQ1 = 160.5
f aa = 44 ⎛ 47.5 − 44 ⎞ ⎛ 3.5 ⎞
Q1 = 160.5 + ⎜ ⎟12 = 160.5 + ⎜ ⎟12 = 161.5
f Q1 = 42 ⎝ 42 ⎠ ⎝ 42 ⎠
c = 12

2 ⋅ (190)
Cuartil dos; La posición se obtiene haciendo i= 2; P (Q2 ) = = 95 que se
4
encuentra ubicada dentro del intervalo numero 5.
⎛ 2⋅n ⎞
⎜ 4 − faa ⎟
El valor se determina mediante la expresión: Q2 = LQ2 + ⎜ ⎟⋅c
⎜ f Q2 ⎟
⎝ ⎠
Nuevamente identificando cada uno de los elementos necesarios para su cálculo

Elaborado por ELEAZAR GÓMEZ LARA


Sep-07
Medidas de forma 16

LQ2 = 172.5
f aa = 86 ⎛ 95 − 86 ⎞ ⎛ 9 ⎞
Q2 = 172.5 + ⎜ ⎟12 = 172.5 + ⎜ ⎟12 = 175.77
f Q2 = 33 ⎝ 33 ⎠ ⎝ 33 ⎠
c = 12

3 ⋅ (190)
Cuartil tres; Posición hacemos i= 3, P (Q3 ) = = 142.5 hallada en el intervalo
4
número 7
⎛ 3⋅ n ⎞
⎜ 4 − faa ⎟
El valor se determina mediante la expresión: Q3 = LQ3 + ⎜ ⎟⋅c
⎜ fQ3 ⎟
⎝ ⎠
Identificando cada uno de los elementos necesarios para su cálculo
LQ3 = 196.5
f aa = 142 ⎛ 142.5 − 142 ⎞ ⎛ 0.5 ⎞
Q3 = 196.5 + ⎜ ⎟12 = 196.5 + ⎜ ⎟12 = 196.81
f Q3 = 19 ⎝ 19 ⎠ ⎝ 19 ⎠
c = 12

b) Deciles 3, 6, 7, 9
i⋅n
La posición de los deciles se determina mediante la expresión: P( Di ) =
10
3 ⋅ (190)
Decil 3; Su posición se obtiene haciendo i= 3; P( D3 ) = = 57 la cual está situada
10
dentro del intervalo numero 4.
⎛ 3⋅ n ⎞
⎜ 4 − faa ⎟
Se determina mediante la expresión: D3 = LD3 + ⎜ ⎟⋅c
⎜ f D3 ⎟
⎝ ⎠
Ahora conociendo cada uno de los elementos necesarios para su cálculo
LD3 = 160.5
f aa = 44 ⎛ 57 − 44 ⎞ ⎛ 7 ⎞
D3 = 160.5 + ⎜ ⎟12 = 160.5 + ⎜ ⎟12 = 162.5
f D3 = 42 ⎝ 42 ⎠ ⎝ 42 ⎠
c = 12
6 ⋅ (190)
Decil 6; La posición se obtiene haciendo i= 6; P ( D6 ) = = 114 que se sitúa
10
dentro del intervalo numero 5.
⎛ 6⋅n ⎞
⎜ 4 − faa ⎟
El valor se determina mediante el término: D6 = LD6 + ⎜ ⎟⋅c
⎜ f D6 ⎟
⎝ ⎠
Los elementos necesarios para su cálculo

Elaborado por ELEAZAR GÓMEZ LARA


Sep-07
Medidas de forma 17

LD6 = 172.5
f aa = 86 ⎛ 114 − 86 ⎞ ⎛ 28 ⎞
D6 = 172.5 + ⎜ ⎟12 = 172.5 + ⎜ ⎟12 = 182.68
f D6 = 33 ⎝ 33 ⎠ ⎝ 33 ⎠
c = 12
7 ⋅ (190)
Decil 7; Posición con i= 7; P( D7 ) = = 133 situada dentro del intervalo 6.
10
LD7 = 184.5
f aa = 119 ⎛ 133 − 119 ⎞ ⎛ 14 ⎞
D7 = 184.5 + ⎜ ⎟12 = 184.5 + ⎜ ⎟12 = 191.87
f D7 = 23 ⎝ 23 ⎠ ⎝ 23 ⎠
c = 12
9 ⋅ (190)
Decil 9; Posición con i= 9; P ( D9 ) = = 171 situada dentro del intervalo 8.
10
LD9 = 208.5
f aa = 161 ⎛ 171 − 161 ⎞ ⎛ 10 ⎞
D9 = 208.5 + ⎜ ⎟12 = 208.5 + ⎜ ⎟12 = 216.5
f D9 = 15 ⎝ 15 ⎠ ⎝ 15 ⎠
c = 12

c) Percentiles 10, 28, 50, 80, 90


i⋅n
Su posición se determina mediante la expresión: P( Pi ) = con i = 1, 2,…,99.
100
Percentil 10, La posición se determina haciendo i=10, por lo que su posición es:
10 ⋅ (190)
P( P10 ) = = 19 que está situada en el intervalo 2.
100
Identificando cada uno de los elementos necesarios para su cálculo
LP10 = 136.5
f aa = 7 ⎛ 19 − 7 ⎞ ⎛ 12 ⎞
P10 = 136.5 + ⎜ ⎟12 = 148.5 + ⎜ ⎟12 = 159.57
f P10 = 13 ⎝ 13 ⎠ ⎝ 13 ⎠
c = 12

Percentil 28, su posición se obtiene haciendo i=28, por lo que la posición que ocupa
28 ⋅ (190)
es: P ( P28 ) = = 53.2 la cual se localiza en el intervalo 4.
100

Determinando cada uno de los elementos necesarios para su cálculo


LP28 = 160.5
f aa = 44 ⎛ 53.2 − 44 ⎞ ⎛ 9.2 ⎞
P28 = 160.5 + ⎜ ⎟12 = 160.5 + ⎜ ⎟12 = 163.12
f P28 = 42 ⎝ 42 ⎠ ⎝ 42 ⎠
c = 12

50 ⋅ (190)
Percentil 50, para su posición hacemos i=50, por lo que P ( P50 ) = = 95
100
pertenece al intervalo 5

Elaborado por ELEAZAR GÓMEZ LARA


Sep-07
Medidas de forma 18

Para este percentil se tiene que:


LP50 = 172.5
f aa = 86 ⎛ 95 − 86 ⎞ ⎛ 9 ⎞
P28 = 172.5 + ⎜ ⎟12 = 172.5 + ⎜ ⎟12 = 175.77
f P50 = 33 ⎝ 33 ⎠ ⎝ 33 ⎠
c = 12

80 ⋅ (190)
Percentil 80, su posición cuando i=80, P ( P80 ) = = 152 que pertenece al
100
intervalo 7
LP80 = 196.5
f aa = 142 ⎛ 152 − 142 ⎞ ⎛ 10 ⎞
P80 = 196.5 + ⎜ ⎟12 = 196.5 + ⎜ ⎟12 = 202.81
f P80 = 19 ⎝ 19 ⎠ ⎝ 19 ⎠
c = 12

90 ⋅ (190)
Percentil 90, P ( P90 ) = = 171 que pertenece al intervalo 8
100
LP90 = 208.5
f aa = 161 ⎛ 171 − 161 ⎞ ⎛ 10 ⎞
P90 = 208.5 + ⎜ ⎟12 = 208.5 + ⎜ ⎟12 = 216.5
f P80 = 15 ⎝ 15 ⎠ ⎝ 15 ⎠
c = 12

d) Rango intercuartílico

Rango intercuartílico= Q3 − Q1 = 196.81 − 161.50 = 35.31

e) Rango percentílico

Rango percentílico= P90 − P10 = 216.5 − 159.57 = 56.93

f) Sesgo Cuartílico

Q3 − 2Q2 + Q1 196.81 − 2(175.77) + 161.50 6.77


Sesgo cuartílico = = = = 0.19
Q3 − Q1 196.81 − 161.50 35.31

Por lo que la distribución es asimétrica positiva (cola derecha).

g) Sesgo Percentílico 10-90

P90 − 2 P50 + P10 216.5 − 2(175.77) + 159.57 24.53


Sesgo percentílico = = = = 0.4308
P90 − P10 216.5 − 159.57 56.93

Corroborando que distribución es asimétrica positiva (cola derecha).

Elaborado por ELEAZAR GÓMEZ LARA


Sep-07
Medidas de forma 19

h) Coeficiente de curtosis

Q3 − Q1 196.81 − 161.5 35.31


κ= = = = 0.3101
2 ⋅ ( P90 − P10 ) 2(216.5 − 159.57) 113.86

Como el coeficiente de curtosis es mayor que 0.26, podemos deducir que la


distribución tiene una forma platicúrtica.

Para concluir observemos que el polígono suavizado está descrito de la siguiente


forma: Es un distribución unimodal, la cual esta sesgada a la derecha, teniéndose una
cola derecha, además la curtosis nos indica que en general la distribución es
platicúrtica, ya que decrece a ambos lados, del punto más alto, de forma suave, es
decir es algo plana.

45

40

35

30

25

20

15

10

0
119

131

143

155

167

179

191

203

215

227

239

251

histograma poligono suavizado

Ejercicios

1.- Para tener mejor conocimiento de la altura de los estudiantes de una Preparatoria
publica del Estado de México con 800 alumnos, se eligieron a algunos de ellos y
obtuvo la siguiente distribución de datos:
Estaturas a) Construya su histograma y su polígono de
Intervalos f frecuencias.
1,50 - 1,55 13 b) Describa las representaciones graficas construidas.
1,55 - 1,60 23 c) Determine el coeficiente de sesgo, utilizando los dos
1,60 - 1,65 35 coeficiente se Pearson.
d) Determine el coeficiente de curtosis
1,65 - 1,70 41
e) ¿La información proporcionada por los coeficientes
1,70 - 1,75 30
coincide con la descripción de la distribución de
1,75 - 1,80 25
frecuencias?
1,80 - 1,85 13
f) ¿Qué se podría concluir acerca de la estatura de los
alumnos de este colegio?
Elaborado por ELEAZAR GÓMEZ LARA
Sep-07
Medidas de forma 20

2. La distribución de acciones de una sociedad es:


a) Determinar el número medio de acciones que acciones accionistas
posee un accionista. 0-50 23
b) Número de acciones que más frecuentemente 50-100 72
posee un accionista. 100-150 62
c) Número de acciones que debe poseer un 150-200 48
accionista para que la mitad de los restantes 200-250 19
accionistas tengan menos acciones que él. 250-300 8
d) Construya su histograma y su polígono de
300-350 14
frecuencias.
350-400 7
e) Describa las representaciones graficas
400-500 7
construidas.
f) Determine el coeficiente de sesgo, utilizando los dos coeficiente se Pearson.
g) Determine el coeficiente de curtosis.
h) ¿Que conclusiones se pueden obtener con estos resultados?

3.- La siguiente tabla representa la edad de los empleados que trabajan en cierta
empresa:
Edad Nº de Empleados
Calcular: 22-26 12
a) Edad más frecuente 26-30 29
b) La edad que se encuentra justo en el 50% de la 30-34 27
distribución. 34-38 19
c) La edad mínima del 40% entre los mayores 38-42 16
d) Porcentaje entre 28 y 40 años 42-46 10
e) Porcentaje entre x ± s 46-50 7
f) Porcentaje entre x ± 2 s
f) Calcule la curtosis e interprete
g) Calcule el coeficiente de asimetría e interprete.

4.- De la siguiente distribución de calificaciones en cierto examen de lectura:

Intervalo 6–8 8 –10 10 – 12 12 – 14 14 – 16 16 – 18


f 3 10 25 38 42 45

Calcular::
a). Porcentaje de calificaciones entre x ± 2s .
b).El intervalo donde cae el 60% central.
c). Porcentaje de los que obtuvieron más de 15 puntos.
d).La mayor nota del 25% que obtuvo la más baja.
e). La menor nota del 25% que obtuvo la nota más alta.
f) Coeficiente de asimetría e intérprete.
g).Calcule la curtosis, e intérprete.

Elaborado por ELEAZAR GÓMEZ LARA


Sep-07

También podría gustarte