Está en la página 1de 8

ESTADÍSTICA GENERAL

CAPITULO V : MEDIDAS DE ASIMETRIA y CURTOSIS

Las medidas de Asimetría y Curtosis permiten determinar la forma de una distribución para un
conjunto de datos en lo que se refiere a su simetría o asimetría asi como también a su grado de
apuntamiento con respecto a una curva estándar denominada “normal”, que corresponde a una
curva de gran importancia estadística

5.1. DEFORMACIONES DE LA CURVA ESTADÍSTICA


En la representación y análisis de las curvas estadísticas se presentan dos fenómenos:

ASIMETRIA (deformaciones Horizontales)

KURTOSIS (deformaciones verticales)

5.2. ASIMETRÍA (As)


Se conoce como asimetría a la deformación horizontal de las curvas de frecuencia,
distinguiéndose 2 clases de asimetría:

a. Asimetría Positiva o Asimetría a la Derecha


Se le conoce también como sesgada a la derecha o sesgo positivo. se llama así cuando la
curva está inclinada o alargada hacia la derecha. Su valor máximo es +1 y en el gráfico se
puede observar que la media aritmética queda hacia el lado mas largo (el derecho) y se
presenta la siguiente relación:

100
90
80
70 Sesgada hacia la
60 derecha
50
40
30
20
10
0
Mo < Me < M(x)

b. Asimetría Negativa O Asimetría A La Izquierda

Se le llama también sesgado a la izquierda o sesgo negativo. En este caso la curva


esta alargada o inclinada al lado izquierdo.

Su valor máximo es -1. Aquí la media está del lado más largo (el izquierdo) y se da
la siguiente relación:

119
M.Sc. Wilder Alvarado Castillo

100
90
Sesgada hacia la
80
izquierda
70
60
50
40
30
20
10
0
M(x) < Me < Mo
c. Asimetría Nula o Simétrica

Cuando la curva está igualmente inclinada a los dos lados recibe el nombre de CURVA
NORMAL o SIMETRICA. También se le conoce como CAMPANA DE GAUSS. Su valor
es cero (0), y las medidas de tendencia central coinciden en un mismo punto, dándose
la relación:

X = Me = Mo

Me = Mo =

5.3. Coeficientes De Asimetría De Pearson


Para calcular el valor de la Asimetría aplicamos las fórmulas:

Poblacional: Muestral :

Obviamente, existen otras fórmulas para obtener la asimetría, sin embargo las formulas
citadas son las más utilizadas.

Al aplicar la fórmula, el valor obtenido puede ser comparado con la escala siguiente:

120
ESTADÍSTICA GENERAL

VALORES INTERPRETACION

0 Simetría o Asimetría Nula

± 0,1 Asimetría Moderada Positiva o Negativa

± 0,5 Asimetría muy marcada positiva o negativa

±3 Asimetría Máxima positiva o negativa

Ejemplo
- Tomando los datos siguientes datos:

PUNTAJES Frecuencias
15 2
14 4
13 2
12 8
11 6
10 4
09 3
08 1
TOTAL 30
Se obtiene que : x = 11,6 ; Mo = 12 ; Me = 12 ; S = 1,79

3( x  Me) 3(11,6  12)


Aplicando la fórmula: As  ; As  ;
S 1.79
As = - 0,67

El valor de la Asimetría es -0,67. Si comparamos con los valores de la escala, se dirá


que la distribución muestra una asimetría negativa muy marcada.

Ejemplo

Las duraciones de estancia en el piso de cancerología de un hospital, se organizaron en una


distribución de frecuencias. La duración media fue 28 días, la mediana 25 días y la duración
modal 23 días. Se calculó una desviación estándar 4,2 días

a) ¿Es la distribución simétrica, o asimétrica con sesgo positivo o sesgo negativo?


b) ¿Cuál es el coeficiente de asimetría?. Interprételo.
Solución:

a) es asimétrica con sesgo positivo porque la media es la mayor de los tres


promedios.
b) El coeficiente se obtiene con la fórmula:

3( x  Me) 3(28  25) 9


As  ; As    2,14
S 4,2 4,2

121
M.Sc. Wilder Alvarado Castillo

El coeficiente de asimetría por lo general se encuentra entre –3 y +3. en tal caso +2,14
indica un grado importante de asimetría con sesgo positivo. Esto quiere decir que
unos cuantos pacientes cancerosos permanecen en el hospital durante largo tiempo,
provocando que la mediana sea mayor que la mediana o la moda.

5.4. Curtosis
Es la deformación vertical de una curva de frecuencias, determina el grado de concentración
que presentan los valores en la región central de la distribución. Se le reconoce por el grado
de apuntamiento de la curva, esto es por su altura. Pueden ser:

a. Leptocúrtica ( Lk)
Cuando la curva presenta un apuntamiento muy pronunciado, o superior a la curva
normal. Se presenta en aquellas agrupaciones cuya DESVIACIÓN ESTÁNDAR es
mínima.
Se le llama también picuda o puntiaguda.

b. Mesocúrtica ( Mk )
Cuando la elevación coincide con la curva normal. es la curva que muestra una situación
intermedia entre la Leptocúrtica y la Platicúrtica.

c. Platicúrtica
En esta deformación la curva es achatada o muy poco puntiaguda.

5.5. COEFICIENTE DE KURTOSIS PERCENTÍLICO


Para obtener el valor de la kurtosis hay que basarse en los cuartiles y percentiles. Se utiliza
la fórmula:

Donde: K : Valor de la kurtosis


Q : Desviación Cuartil
P90 : Percentil 90
P10 : Percentil 10
Hallando el valor de la Kurtosis (K) el valor obtenido se compara con el siguiente criterio:
1) Si K = 1/2, se dice que la distribución es LEPTOCURTICA
2) Si K = 1/4, se dice que la distribución es MESOCURTICA
3) Si K = 0 , se dice que la distribución es PLATICURTICA

122
ESTADÍSTICA GENERAL

En la práctica es útil observar el siguiente esquema:

0 0,125 0,25 0,375 0,5

Platicurtica Mesocurtica Leptocurtica


Hay que dejar sentado, asimismo que para la curva Normal K = 0,263 representa una
distribución Mesocúrtica.
Ejemplo
Tomando como datos el ejemplo de los puntajes de matemáticas :
Q=8; P90= 75 ; P10 = 105
Q 8 8
K    0, 26
P90  P90 105  75 30
El valor de K corresponde al valor de una distribución Mesocúrtica.

5.6. REPRESENTACIÓN DE CAJA Y BIGOTES (Box Plot)


Para describir un conjunto de datos es muy eficaz un resumen de cinco puntos, la cual es
información que se obtiene fácilmente y es muy ilustrativa para el lector:

El resumen de cinco puntos está integrado por:


1.- Mín: es el mínimo valor del conjunto de datos
2.- Q1 : el primer cuartil
3.- Me : la mediana
4.- Q3 : el tercer cuartil
5.- Máx : es el máximo valor del conjunto de datos

Los cinco valores se localizan sobre una escala, ya sea vertical u horizontal. La caja se usa
para mostrar la mitad central de los datos que están entre los dos cuartiles. Los bigotes son
segmentos de rectas que se usan para representar la otra mitad de los datos: un segmento de
recta representa la cuarta parte de los datos cuyos valores son más pequeños que el primer
cuartil, y el otro segmento de recta al otro lado de la caja representa el cuarto de datos cuyos
valores son mayores que el tercer cuartil.

Gráfico de Cajas y Bigotes, para el ejemplo del peso de la producción de lúpulos

2,00 3,00 4,00 5,00 6,00 7,00

Primer Tercer
cuartil Q1 cuartil Q1

peso

Valor Valor
mínimo máximo
Mediana

2,00 3,00 4,00 5,00 6,00 7,00

123
M.Sc. Wilder Alvarado Castillo

Datos incongruentes o atípicos (outliers): son aquellos valores que superan en más de 1,5
veces el valor de la amplitud intercuartílica mayor que Q 3 o menor que Q1 , y en los gráficos de
cajas y bigotes se representan como puntos o asteriscos aislados del gráfico central.
En el ejemplo de los lúpulos, un valor incongruente podrían ser:

Rango Intercuartil : RIC = Q3 – Q1

Dato incongruente = Q3 + 1,5 (Q3 – Q1) = 5,6 + 1,5 (5,6 – 3,8) = 8,3
todos los valores mayores que 8,3 serían datos incongruentes

Dato incongruente = Q1 - 1,5 (Q3 – Q1) = 3,8 - 1,5 (5,6 – 3,8) = 1,1
todos los valores menores que 1,1 también serían datos incongruentes.

Se le agregaron los datos incongruentes 8,5 y 0,8, los cuales reflejaron el grafico siguiente en
el programa SPSS:

Dato nº 21 es
incongruente

Lúpulos
22 21

Dato nº 22 es
incongruente

0,0 2,0 4,0 6,0 8,0

EJERCICIOS PROPUESTOS
1. Se desea realizar un estudio sobre la utilización del agua en tres zonas rurales (A,B y
C). Con esta finalidad se ha seleccionado al zar 8 casa de la zona A, 6 de la zona B y
10 de la zona C. luego se registró el número de litros de agua consumidos por un día,
los cuales se presenta en el siguiente cuadro:
Zonas Número de litros de agua consumidos por día
A 150 135 120 110 160 180 155 165
B 135 110 105 125 750 140
C 100 110 115 280 130 140 175 120 130 145
2. Calcule e interprete el coeficiente de Asimetría de Pearson y el coeficiente de curtosis
para el número de litros de agua consumida para cada zona.

124
ESTADÍSTICA GENERAL

3. La gráfica de caja comparativa adjunta de coeficientes de vapor de gasolina de vehículos en


Lima apareció en un artículo periodístico. Discuta las características interesantes.

4. Una compañía utiliza dos máquinas diferentes para fabricar piezas de cierto tipo. Durante un
solo turno, se obtuvo una muestra de n = 20 piezas producidas por cada máquina y se determinó
el valor de una dimensión crítica particular de cada pieza. La gráfica de caja comparativa que
aparece en la parte superior de la página 41 se construyó con los datos resultantes. Compare
y contraste las dos muestras.

5. Los datos adjuntos sobre cantidad de lluvia (acres-pies) producida por 26 nubes
bombardeadas. Construya la gráfica y comente sobre el grado de asimetría.

4.1 7.7 17.5 31.4 32.7 40.6 92.4


115.3 118.3 119.0 129.6 198.6 200.7 242.5
255.0 274.7 274.7 302.8 334.1 430.0 489.1
703.4 978.0 1656.0 1697.8 2745.6

6. Remítase a la representación visual de las tres gráficas de cajas que representan la medida de
longevidad (en meses) de muestras de tres distintas baterías para automóvil. Si usted es el
encargado de una flotilla de automóviles y debe seleccionar una de las tres marcas, ¿cuál
gráfica de cuadro representa la marca que debería elegir? ¿Por qué?

125
M.Sc. Wilder Alvarado Castillo

7. La siguiente es una descripción dada por Excel de los datos de resistencia dados en las
propiedades mecánicas permisibles para el diseño estructural de vehículos aeroespaciales
metálicos requieren un método aprobado para analizar estadísticamente se utilizó los
datos anexos sobre resistencia a la tensión última (lb/pulg2) como base para abordar las
dificultades que se presentan en el desarrollo de dicho método.

Medidas n Media Mediana Mínima Máxima Q1 Q3


Resistencia 153 135.39 135.40 122.20 147.70 132.95 138.25
a) Comente sobre las características interesantes de las medidas resumen.
b) Construya una gráfica de caja de los datos basada en los cuartiles y comente sobre
lo que ve.

8. He aquí una gráfica de tallo y hojas de los datos de una muestra de 26 trabajadores de
plataforma petrolera marina tomaron parte en un ejercicio de escape y se obtuvieron los
datos adjuntos de tiempo (s) para completar el escape

32 55 a. Determine el valor de la dispersión de los cuartiles


33 49 b. ¿Hay algunos valores apartados en la muestra?
34 c. ¿Algunos valores apartados extremos?
35 6699 d. Construya una gráfica de caja y comente sobre sus
36 34469 características.
37 03345 e. ¿En cuánto se podría disminuir la observación más grande,
38 9 actualmente de 424, sin afectar el valor de la dispersión de
39 2347 los cuartiles?
40 23
41
42 4
.

9. Se determinó la cantidad de contaminación por aluminio (ppm) en plástico de cierto tipo


con una muestra de 26 probetas de plástico y se obtuvieron los siguientes datos:

30 30 60 63 70 79 87 90 101
102 115 118 119 119 120 125 140 145
172 182 183 191 222 244 291 511

Construya una gráfica de caja que muestre valores incongruentes o alejados y comente
sobre sus características.

126

También podría gustarte