Está en la página 1de 27

Medidas de dispersin

Dispersin: indican la mayor o menor


concentracin de los datos con respecto a las
medidas de centralizacin. Rango, Desviacin
tpica, coeficiente de variacin, varianza

4-12

Para datos no agrupados, la amplitud es la


diferencia entre los valores mayor y menor en
un conjunto de datos.
AMPLITUD = valor mayor - valor menor
EJEMPLO 4: una muestra de cinco
graduados de contadura indic los
siguientes salarios iniciales: $22 000, $28
000, $31 000, 23 000, $24 000.
La amplitud es $31 000 - $22 000 = $9 000.

4-3

Desviacin media
Desviacin media: es el promedio
aritmtico de los valores absolutos de las
desviaciones con respecto a la media
aritmtica.

XX
MD
n

4-4

EJEMPLO

Los pesos de una muestra de cajas con


libros en una librera son (en lb) 103, 97,
101, 106 y 103.

X = 510/5 = 102 lb
= 1 + 5 + 1 + 4 + 1 = 12
MD = 12/5 = 2.4
Por lo comn los pesos de las cajas estn
a 2.4 lb del peso medio de 102 lb.

4-5

Variancia de la poblacin
La varianza de la poblacin para datos
no agrupados es la media aritmtica de
las desviaciones cuadrticas respecto a
la media de la poblacin.

( X )

N
2

4-6

EJEMPLO 2
Las edades de la familia Dunn son 2, 18,
34, y 42 aos. Cul es la variancia de la
poblacin?
X / N 96 / 4 24
( X ) / N 944 / 4 236
2

4-7

Variancia poblacional
Una frmula alternativa para la variancia
poblacional es:

X 2
X 2

(
)
N
N

4-8

Desviacin estndar
poblacional
La desviacin estndar poblacional () es
la raz cuadrada de la variancia de la
poblacin.
Para el EJEMPLO 2, la desviacin
estndar poblacional es 15.19 (raz
cuadrada de 230.81).

4-9

Variancia muestral
La variancia muestral estima la variancia
de la poblacin.
2

(
Xi

X
)
Frmula conceptual = S 2 =
n -1
2
(

X
)
X 2
n
Frmula operativa = S 2 =
n -1

Nota: el n -1 se trabaja para estadstica inferencial.

4-10

EJEMPLO 3
Una muestra de cinco salarios por hora
para varios trabajos en el rea es: $7,
$5, $11, $8, $6. Encuentre la variancia.
X = 37/5 = 7.40
s 2 = 21.2/(5-1) = 5.3

4-11

Desviacin estndar muestral


La desviacin estndar muestral es la raz
cuadrada de la variancia muestral.
En el EJEMPLO 3, la desviacin estndar
de la muestra es = 2.30

4-13

Variancia muestral para datos


agrupados
La frmula de la variancia para datos
agrupados usada como estimador de la
variancia poblacional es:

S2

2
(

niX
)
2
niX
n

n 1

donde f es la frecuencia de clase y X es el


punto medio de la clase.

4-14

Interpretacin y usos de la
desviacin estndar
Teorema de Chebyshev: para cualquier
conjunto de observaciones, la
proporcin mnima de valores que est
dentro de k desviaciones estndar
desde la media es al menos 1 - 1/k ,
donde k2 es una constante mayor que 1.

4-15

Interpretacin y usos de la
deviacin estndar
Regla emprica: para una distribucin de
frecuencias simtrica de campana, cerca
de 68% de las observaciones estar
dentro de 1 de la media (); cerca de
95% de las observaciones estar dentro
de 2 de la media (); alrededor de
99.7% estar dentro de 3 de la media
().

Curva en forma de campana que muestra la relacin entre y

2001 Alfaomega

4-17

Dispersin relativa
El coeficiente de variacin es la razn de
la desviacin estndar a la media
aritmtica, expresada como porcentaje:
s
CV
(100%)
X

4-18

Asimetra
Asimetra (sesgo) es la medida de la
falta de simetra en una distribucin.
El coeficiente de asimetra se calcula
mediante la siguiente frmula:

Sk = 3(media - mediana)
desviacin estndar

4-19

Amplitud intercuartlica
La amplitud intercuartlica es la distancia
entre el tercer cuartil Q3 y el primer
cuartil Q1.
Amplitud intercuartlica
= tercer cuartil - primer cuartil
= Q 3 - Q1

4-20

Primer cuartil
El primer cuartil es el valor correspondiente al
punto debajo del cual se encuentra el 25% de las
observaciones en un conjunto ordenado de datos.

n
Fa
Q1 L 4
(i )
donde L = lmite de las clases
nique contienen Q1,
CF = frecuencia acumulda que precede a la clase
que contiene a Q1, f = frecuencia de la clase que
contiene Q1, i= tamao de la clase que contiene
Q1.

4-21

Tercer cuartil
El tercer cuartil es el valor correspondiente al punto
debajo del cual se encuentra 75% de las
observaciones en un conjunto ordenado de datos:
3n
CF
Q3 = L + 4
(i )
f
donde L = lmite inferior de la clase que contiene a
Q3, CF = frecuencia acumulada precedente a la
clase que contiene a Q3, f = frequencia de la clase
que contiene a Q3, i = tamao de la clase que
contiene a Q3.

4-22

Desviacin cuartlica
La desviacin cuartlica es la mitad de la
distancia entre el tercer cuartil, Q3, y el
primero, Q1.
QD = [Q3 - Q1]/2

4-23

EJEMPLO 5
Si el tercer cuartil = 24 y el primer cuartil =
10, cul es la desviacin cuartlica? La
amplitud intercuartlica es 24 - 10 = 14;
por lo tanto, la desviacin cuartlica es
14/2 = 7.

4-24

Amplitud cuartlica
Cada conjunto de datos tiene 99
porcentiles, que dividen el conjunto en
100 partes iguales.
La amplitud cuartlica es la distancia entre
dos porcentiles establecidos. La amplitud
cuartlica 10 a 90 es la distancia entre el
10 y 90 porcentiles.

4-25

Frmula para porcentiles

P
Lp = ( n + 1)
100

4-26

Diagramas de caja
Un diagrama de caja es una ilustracin
grfica, basada en cuartiles, que ayuda a
visualizar un conjunto de datos.
Se requieren cinco tipos de datos para
construir un diagrama de caja: el valor
mnimo, el primer cuartil, la mediana, el
tercer cuartil, y el valor mximo.

4-27

EJEMPLO 6
Con base en una muestra de 20 entregas,
Marcos Pizza determin la siguiente
informacin: valor mnimo = 13 minutos,
Q1 = 15 minutos, mediana = 18 minutos,
Q3 = 22 minutos, valor mximo = 30
minutos. Desarrolle un diagrama de caja
para los tiempos de entrega.

4-28

EJEMPLO 6

continuacin

mediana

32

mn

Q1

12

14

Q3

16

18

20

22

mx

24

26

28

30