Está en la página 1de 35

Medidas de Dispersión

y Asimetría
Medidas de variabilidad o de dispersión

ABSOLUTAS
1. Rango, Amplitud o Recorrido
2. Rango intercuartílico
3. Varianza.
4. Desviación estándar

RELATIVAS
Coeficiente de Variación
Rango, Amplitud o Recorrido
Diferencia entre la observación de mayor valor y la
observación de menor valor.
Características del rango
1. Se puede calcular en variables medidas en escala de
intervalo y de razón
2. Se utiliza para tener una idea rápida del grado de
dispersión de un conjunto de datos.
3. Es poco confiable. Solo depende del valor máximo y
mínimo de los datos e ignora cómo están distribuidos los
demás.
4. Se ve afectada por valores extremos.
Características del rango
5. El rango es la longitud del intervalo de variación de los
datos.
6. El valor del rango no varía cuando se suma una
constante “K” a cada observación de un conjunto de
datos.
7. El valor del rango si varía cuando se multiplica por
constante “K” a cada observación de un conjunto de
datos
Cálculo de rango o amplitud
R = X(n) – X(1)

Datos  12, 13, 15, 20,....., 55, 65, 68, 74,......,93

Identificar: X(n) X(1)

R = X(n) – X(1) = 93 – 12 = 81
Rango Intercuartílico
Es la distancia entre el primer y tercer cuartil

RIC =Q3- Q1

• Entre el primer y tercer cuantil están contenidas el 50% de


las observaciones
Características del rango
intercuartílico
1. Se puede calcular en variables medidas en escala de
intervalo y de razón
2. No se ve afectada por valores extremos.
Varianza
La varianza de un conjunto de observaciones se define:
N
 Xi   X 2

POBLACIÓN   2 i 1
N
n
  Xi  X 
2

i 1
 S 
2
n 1
MUESTRA
Características de la varianza
1. Se calcula para datos medidos en escala de intervalo o
razón.
2. Su valor numérico está expresada en unidades al cuadrado.
3. Son sensibles a la existencia de valores atípicos.

4. Si cada uno de los n valores xi es transformado en


yi = a+b xi siendo a y b constantes, entonces, la varianza
de los n valores yi es

S =b S
2
y
2 2
x
Cálculo de la varianza

POBLACIÓN
N N

 i
X   2
 i
X 2
 N 2
 1
2


N
1 N

2  i 1
 i 1
  X i    X i  
2
N N N  i1 N  i1  
MUESTRA

n n
  Xi  X   i
2 2
 2
  
X nX 2
1
n n
1
S2  i 1
 i 1
  Xi  n   Xi  
2
n 1 n 1 n  1  i1  i1  

Cálculo de la varianza

Las edades de los alumnos inscritos en un curso de idiomas


son: 14, 21, 16, 17, 25, 32, 18 N 2

   Xi    Xi  
21 2 1 N

N  i1 N  i1  
N
 X i  14  21  16  17  25  32  18  143
1
iN

 i
X 2
 14 2
 212
 16 2
 17 2
 252
 32 2
 182
 3155
i 1

1 2
  3155  143   33.387755
2 1
(años) 2
7 7 
Desviación Estándar
Es la raíz cuadrada positiva de la varianza

 X i   
N 2

POBLACIÓN   i 1

n
  Xi  X 
2
MUESTRA 
i 1
S
n 1
Características de la desviación estándar
1. Se calcula para datos medidos en escala de intervalo o
razón.
2. Tienen la misma unidad de medida que los datos originales
3. Son sensibles a la existencia de valores atípicos..

4. Si cada uno de los n valores xi es transformado en


yi = a+b xi siendo a y b constantes, entonces, la
desviación estándar de los n valores yi es

Sy = b S x
Coeficiente de variabilidad
Medida de variabilidad relativa que indica que proporción de la
media es la desviación estándar.

 
 CV  CV  100
 
POBLACIÓN

S S
MUESTRA  cv  cv  100
X X
Características del coeficiente de variabilidad

1. No tiene unidad de medida.

2. No aplicable cuando la distribución tiene media cero.

3. Se afecta su valor cuando se suma una constante “a” a


cada observación de un conjunto de datos.

4. No cambia de valor cuando se multiplica por una


constante “b” a cada una de las observaciones.
Comparación de la dispersión de dos o
más conjuntos de datos
Los conjuntos de datos tienen
Iguales unidades de medida y Utilizar las variancias o
Medias aritméticas iguales o  las desviaciones estándar
similares

Los conjuntos de datos tienen


diferentes unidades de medida  Utilizar los Coeficientes
y/o Medias aritméticas de Variabilidad
diferentes
Medidas de asimetría
Medidas estadísticas que tienen como objetivo evaluar la
presencia de valores extremos dentro de una distribución
de datos.
COEFICIENTE DE ASIMETRÍA DE PEARSON

 x  Q2 
Skp  3 
 Sx 
• Si el coeficiente de asimetría (Skp) es igual a cero, la
distribución es simétrica alrededor de la media.
• positivo, indica sesgo a la derecha (cola derecha).
• negativo, indica sesgo a la izquierda (cola izquierda).
Interpretación del Coeficiente de Asimetría de
Pearson

Distribución simétrica

Skp = 0

  Me  Mo
Interpretación del Coeficiente de Asimetría de
Pearson

Distribución asimétrica positiva,


dist. con asimetría a la derecha,
dist. con sesgo a la derecha.

Skp > 0

Mo Me 
Interpretación del Coeficiente de Asimetría de
Pearson

Distribución asimétrica negativa,


dist. con asimetría a la izquierda,
dist. con sesgo a la izquierda.

Skp < 0

 Me M
o
Medidas de curtosis
Medidas estadísticas que tienen como objetivo evaluar el
grado de concentración de los datos alrededor de las
medidas de tendencia.
COEFICIENTE DE CURTOSIS

1  Q3  Q1 
POBLACIÓN Ku   
2  D9  D1 

1  Q3  Q1 
MUESTRA K̂ u   
2  D9  D1 
Características del Coeficiente de Curtosis
1. No tiene unidad de medida.

2. Se aplica a distribuciones unimodales, que sean


simétricas o ligeramente asimétricas.

3. Su valor debe encontrarse en el intervalo 0 á 0.5.


Ku <0.235 PLATICÚRTICA
0.235  Ku  0.265 MESOCÚRTICA
Ku > 0.265 LEPTOCÚRTICA
Interpretación del Coeficiente de curtosis

Distribución platicúrtica

ku < 0.25

  Me  Mo
Interpretación del Coeficiente de curtosis

Distribución mesocúrtica

ku = 0.25

  Me  Mo
Interpretación del Coeficiente de curtosis

Distribución leptocúrtica

ku > 0.25

  Me  Mo
Uso del Coeficiente de curtosis
Gráficos de cajas
• Otra manera diferente de representar gráficamente una
distribución, aparte del histograma y polígono, es
utilizando un gráfico de cajas o boxplot. Este gráfico
resulta muy útil sobre todo cuando se van a comparar dos
o más distribuciones.
• Un gráfico de este tipo consta de una cajita rectangular
vertical dividida por la mediana y límites iguales a los
percentiles 25 y 75. De esta caja salen dos bigotes.
• Para dibujar los bigotes, hay que primero identificar a los
datos atípicos. Un dato se considera atípico cuando su
valor es inferior a P25 -1.5 RI o superior a P75+1.5 RI,
siendo RI el rango intercuartil.
• Una vez definidos los datos atípicos, se buscan los últimos
valores que NO son atípicos. Estos serán los extremos de
los bigotes.
Diagrama de caja (Boxplot)
Presión sistólica Valores atípicos
superiores (más de 1.5
15.5 RI sobre P75)

Valor superior que no


llega a ser atípico
14.5 (adyacente superior) 1.5 RI

P75
Caja que contiene
13.5 al 50 % casos de Mediana RI = P75-P25
los datos centrales
P25
12.5 Valor inferior que no 1.5 RI
llega a ser atípico
(adyacente inferior)
Valores atípicos
11.5 inferiores (más de 1.5
RI bajo P25)
¿ Qué nos dicen las cajas la
compararlas ?
• Para una interpretación de las cajas en dos o
más distribuciones uno debe ver primero la
tendencia que se refleja en la mediana;
mientras más alta sea ella su tendencia en esa
distribución será mayor. Luego hay que ver el
largo de las cajas. La caja más larga (de mayor
RI) es la que tiene más dispersión. Es
importante ver también los datos atípicos
ubicados fuera de los bigotes y finalmente la
asimetría.
Puntuación estandarizada Z
Dados los valores x1, x2, … , xn de una variable x y
dada la media x y desviación estándar S de estos
datos, se denomina una puntuación estandarizada
zi, de una observación xi de x, a:
xi  x
zi 
S
Estas puntuaciones o también llamados puntajes z son
adimensionales y resultan útiles para comparar dos o
más valores bajo distribuciones distintas ya que
independientemente de la distribución considerada
ellas siempre tendrán media de 0 y desviación estándar
1.
Ejemplo
• Supongamos que tenemos dos grupos de 20 y
30 sujetos a los cuales se les ha tomado una
prueba de inteligencia obteniendose en el
primer grupo un CI medio de 95 con una
desviación estándar de 4; mientras que en el
segundo grupo un CI medio de 105 con una
desviación estándar de 5. Si un sujeto del
primer grupo tiene un CI de 99 y otro del
segundo grupo de 106, entonces ¿ se puede
decir que el segundo está mejor posicionado
en su grupo que el primero en cuanto a su
medida de inteligencia ?.
Ejemplo:
Se quiere dar una beca a uno de dos estudiantes de sistemas educativos diferentes y
se asignará al que tenga mejor expediente académico:
– El estudiante A tiene una calificación de 8 en un sistema donde la calificación
de los alumnos tiene una media de 6 y una desviación estándar de un punto.
– El estudiante B tiene una calificación de 80 en un sistema donde la calificación
de los alumnos tiene una media de 70 con una desviación estándar de 10.

–No podemos comparar


directamente los 8 puntos de A
frente a los 80 de B, pero si con
una distribución de referencia de
media 0 y varianza 1.

–Como zA > zB, A está mejor


posicionado en su grupo que B y
por tanto A es mejor candidato xA  x A 8  6
zA   2
para la beca. SA 1
xB  x B 80  70
zB   1
SB 10

También podría gustarte