Está en la página 1de 7

DESCRIPCIN DE LOS DATOS:

MEDIDAS DE DISPERSIN
OBJETIVOS
Al terminar esta unidad el estudiante podr:
Calcular e interpretar la amplitud de variacin, la desviacin media, la variancia, y la
desviacin estndar de los datos originales.
Calcular e interpretar la amplitud de variacin, la variancia y la desviacin estndar de
datos agrupados.
Explicar las caractersticas, usos, ventajas y desventajas de cada medida de dispersin.
Entender el Teorema de Chebyshev y la regla normal o emprica, y su relacin con un
conjunto de observaciones.
Calcular y explicar los cuartiles y la amplitud de variacin intercuartlica.
Elaborar e interpretar los diagramas de caja.
Calcular y entender el coeficiente de variacin y el coeficiente de asimetra.
Amplitud
La amplitud es la diferencia entre los valores mayor y menor en un conjunto de datos.
AMPLITUD = valor mayor - valor menor
Ejemplo 1
Una muestra de cinco recin graduados indic los siguientes salarios iniciales: $22000,
$28000, $31000, $23000, $24 000.
La amplitud es $31000 - $22000 = $9000.

Desviacin media:

La desviacin media es la media aritmtica de los valores absolutos de las desviaciones


respecto a la media aritmtica.

DM =

Xi X
n

Ejemplo
Los pesos de una muestra de 5 canecas de pintura son (en lb) 103, 97, 101, 106 y 103.

X=

X
n

= 510/5 = 102 lb. X =

X = 1 + 5 + 1 + 4 + 1 = 12

DM = 12/5 = 2.4
Por lo comn los pesos de las canecas estn a 2.4 lb del peso medio de 102 lb.
Varianza de la poblacin
La varianza de la poblacin para datos no agrupados es la media aritmtica de las
desviaciones cuadrticas respecto a la media de la poblacin.

2 =

( X i ) 2
N

Ejemplo 1
Las edades de la familia Prez son 2, 18, 34, y 42 aos. Cul es la varianza de la
poblacin?

=
X i / N ==
96 / 4 24

2 =
( X i ) 2 / N =
944 / 4 =
236

Una frmula alternativa para la variancia poblacional es:


X i 2 X i 2
X i2 2

2
) =
=
(
N
N
N
Desviacin estndar poblacional
La desviacin estndar poblacional () es la raz cuadrada de la varianza de la poblacin.
Para el ejemplo 1, la desviacin estndar poblacional es 15.36 (raz cuadrada de 236).
Varianza muestral

( X i X ) 2
Frmula conceptual =S =
n 1
2

Ejemplo 2
Una muestra de cinco salarios por hora para varios trabajadores en el rea es: $7, $5,
$11, $8, $6. Encuentre la varianza.

X=

( X i X ) 2
Frmula conceptual =S 2 =
n 1

= 37/5 = 7.40

= 21.2/(5-1) = 5.3

Desviacin estndar muestral


La desviacin estndar muestral es la raz cuadrada de la variancia muestral.
En el ejemplo 2, la desviacin estndar de la muestra es = 2.30 = S.
Varianza muestral para datos agrupados
La frmula de la variancia muestral para datos agrupados usada como estimador de la
varianza poblacional es:

(X X ) f

=
2

=
S2

n 1

( X i f i ) 2
n
n 1

X i2 fi

donde fi es la frecuencia de clase y Xi es el punto medio de la clase.


Propiedades de la varianza
La varianza siempre es positiva, es el promedio de las desviaciones al cuadrado con
respecto a la media, se promedian cuadrados y los cuadrados son positivos.
La varianza de una constante es igual a cero. Una constante no tiene dispersin.
La varianza de una constante ms una variable es igual a la varianza de la variable.
La varianza de una constante por una variable es igual a la constante al cuadrado
por la varianza de la variable.
La desviacin estndar como es la raz cuadrada de la varianza, cumple con estas
mismas propiedades, pero sacndole la raz cuadrada a los resultados de la varianza.

Interpretacin y usos de la desviacin estndar


Teorema de Chebyshev: para cualquier conjunto de observaciones, la proporcin
mnima de valores que est dentro de k desviaciones estndar desde la media es al
menos 1 - 1/k2 , donde k es una constante mayor que 1.
Regla emprica: para una distribucin de frecuencias simtrica de forma acampana,
cerca de 68 % de las observaciones estar dentro de 1 de la media (); cerca de 95
% de las observaciones estar dentro de 2 de la media (); alrededor de 99 % estar
dentro de 3 de la media ().
Dispersin relativa
El coeficiente de variacin es la razn de la desviacin estndar a la media aritmtica,
expresada como porcentaje:

CV =

s
(100%)
X

Mide la homogeneidad de la distribucin en trminos absolutos y por este motivo se


pueden comparar dos o ms distribuciones con esta medida para determinar cul es la
ms homognea es decir la de menor dispersin, entre ms pequeo sea el coeficiente
de variacin, menor es la dispersin y por tanto se dice que la distribucin es ms
homognea.
Asimetra
Asimetra (sesgo) es la medida de la falta de simetra en una distribucin.
El coeficiente de asimetra se calcula mediante la siguiente frmula:
Sk = 3(media - mediana)/desviacin estndar
Si el coeficiente de asimetra es igual a cero se dice que la distribucin es simtrica, si es
positivo tiene asimetra positiva (la cola de la distribucin se alarga a la derecha), si es
negativo, la asimetra es negativa (la cola de la distribucin se alarga ala izquierda).

Amplitud intercuartlica
La amplitud intercuartlica es la distancia entre el tercer cuartil Q3 y el primer.
cuartil Q1.
Amplitud intercuartlica = tercer cuartil - primer cuartel = Q3 Q1
Primer cuartil (datos agrupados)
El primer cuartil es el valor correspondiente al punto debajo del cual se encuentra el 25
% de las observaciones en un conjunto ordenado de datos.
n
F j 1
Q1 = Y j 1 + C j 4
fj
Donde Yj-1 = lmite de la clase se que contienen Q1, Fj-1 = frecuencia acumulada que
precede a la clase que contiene a Q1, fj = frecuencia de la clase que contiene Q1, Cj=
tamao de la clase que contiene Q1.

Tercer cuartil (datos agrupados)


El tercer cuartil es el valor correspondiente al punto debajo del cual se encuentra 75 %
de las observaciones en un conjunto ordenado de datos:

3n
F j 1
4
Q1 = Y j 1 + C j
fj
donde Yj-1 = lmite inferior de la clase que contiene a Q3, Fj-1 = frecuencia acumulada
precedente a la clase que contiene a Q3, fj = frecuencia de la clase que contiene a Q3,
Cj = tamao de la clase que contiene a Q3.
Desviacin cuartlica
La desviacin cuartlica es la mitad de la distancia entre el tercer cuartil, Q3, y el primero,

Q1.
DQ = [Q3 - Q1 ]/2

EJEMPLO 4
Si el tercer cuartil, Q3 = 24 y el primer cuartil, Q1 = 10, cul es la desviacin cuartlica? La
amplitud intercuartlica es 24 - 10 = 14; por lo tanto, la desviacin cuartlica es 14/2 = 7.

Frmula para calcular percentiles en datos sin agrupar

Cada conjunto de datos tiene 99 porcentiles, que dividen el conjunto en 100 partes iguales.

El percentil de orden k, Pk, es el valor de la variable debajo del cual est el k por ciento de las
observaciones.

Para calcular el percentil de orden k, Pk, en datos sin agrupar, se realizan los siguientes
pasos: primero, se ordenan los datos de menor a mayor; luego se calcula el factor de
localizacin mediante la frmula:
k
100
El factor de localizacin FL, corresponde al orden de la observacin que corresponde al

FL = (n + 1)

percentil ksimo, aplicando la siguiente frmula para determinar el Pk.


Pk= A la observacin que corresponde a la parte entera del FL, ms la diferencia
entre la observacin siguiente al FL y la observacin del FL, multiplicada dicha diferencia
por la parte decimal del FL.
Ejemplo 5
Los siguientes datos corresponde a la edad, en aos cumplidos de 15 estudiantes de una
universidad: 18, 16, 20, 22, 19, 24, 17, 17, 23, 20, 19, 25, 30, 27, 24. Se desea
conocer cul es la edad mxima del 30 % de los estudiantes muestreado.
La pregunta anterior en forma explicita, est solicitando calcular el percentil de orden 30, P30.
Para obtener este percentil, lo primero es ordenar los datos en forma ascendente, de menor a
mayor: 16, 17, 17, 18, 19, 19, 20, 20, 22, 23, 24, 24, 25, 27, 30. Luego de
ordenarlos se calcula el factor de localizacin, FL = (15+1)*30/100 = 4.8 = FL. La parte entera
de FL es 4, por tanto la cuarta observacin es 18 y el P30 = 18+ (19-18)*0.8 = 18.8. El 30% de
los estudiantes encuestados tiene una edad mxima de 18.8 aos
Los percentiles dividen en 100 partes iguales la distribucin, por tanto, se tiene
equivalencia entre los percentiles , los cuartiles y la mediana:

P25 = Q1;

P50 = Q2 = Me;

P75 = Q3. Las anteriores relaciones se cumplen tanto

para datos agrupados como para datos sin agrupar.


Diagramas de caja
Un diagrama de caja es una ilustracin grfica, basada en cuartiles, que ayuda a
visualizar un conjunto de datos.
Se requieren cinco tipos de datos para construir un diagrama de caja: el valor mnimo, el
primer cuartil, la mediana, el tercer cuartil, y el valor mximo.
Ejemplo
Con base en una muestra de 20 entregas, una tienda de entregas a domicilio determin la
siguiente informacin: tiempo mnimo de entrega = 13 minutos, Q1 = 15 minutos, mediana =
18 minutos, Q3 = 22 minutos, tiempo

mximo de entrega = 30 minutos. Desarrolle un

diagrama de caja para los tiempos de entrega.

Grfico de Caja y Bigotes

13

16

19

22

25

Tiempo de entrega

28

31

También podría gustarte