Está en la página 1de 16

Medidas de Dispersión 2

Varianza de una muestra


Desviación estándar de una muestra
Teorema de Chebyshev
Coeficiente de variación
Coeficiente asimetría de Pearson
Varianza de la Muestra
• Desviación cuadrática promedio (n-1) con
relación a la media de la Muestra

(x  x) 2
s 2

n 1
2
x 2
nx
s 2
 
n 1 n 1
Diapositiva 2
Desviación Estándar
de la Muestra

• Raíz Cuadrada de la Varianza de la Muestra

(x  x) 2
s  s 2

n 1
2
x2
nx
s  s 2
 
n 1 n 1
Diapositiva 3
Ejercicio
• 3.21 Muestra del consumo de combustible de
10 modelos vehículos compactos en mpg
A B C D E F G H I J
40 33 32 30 27 29 27 23 21 10

• Media,
a. Media = 27.2mediana, rango= y28rango
mpg, mediana medio= 30 mpg,
mpg, rango
• DMA
rango medio = 25 mpg
b. DMA = 5.6 mpg estándar y varianza
• Desviación
c. Dev Std = 8.052 mpg, Var = 64.84 mpg2
Notas acerca de la Var y Desv Est
• Si todos los integrantes de una población o
una muestra son idénticos, entonces su
varianza y/o desviación estándar serán cero.
• Ejemplo : 23,23,23,23,23,23,23,23,23,23
• Si se suma o se resta el mismo número a todos
los valores de una población o muestra, la
varianza y la desviación estándar no variarán.
• Ejemplo : 23,36,54 y 223,236,254.
Diagrama de Caja
• Es una representación gráfica que muestra al
mismo tiempo varias medidas de tendencia
central y dispersión. El 1er y 3er cuartil,
mediana y valores extremos de los datos, se
observa también la asimetría de la distribución.

1er cuartil 3er cuartil

Menor dato Mayor dato


Mediana

Atípicos/Outliers
Ejemplo : Instalar Data Analysis Plus (DAPv9_VBA)
(Copiar Stats_2007-2010_v9b.xls en
C:\Program Files\Microsoft Office\Office14\XLSTART\Stats_2007-2010_v9b.xls
Copiar Stats_2007-2010_v9b.chm en
C:\Program Files\Microsoft Office\Office14\Stats_2007-2010_v9b.chm)
Aplicar Boxplot con datos del archivo CX03HOUSE.xls
Ejercicio
• Con los datos del archivo Asimetria.xls construya un gráfico
de líneas para cada hoja (Normal, Positiva, Negativa)
• Compárela con los gráficos siguientes : (del archivo
Relaciones entre Media, Md, Mo.xls – semana 5)
Teorema de Chebyshev
• En una población o muestra con Desv Est pequeña,
las observaciones se encuentran cerca de la media.
Con Desv Est más grandes, las observaciones
estarán más dispersas en relación con la media.
• Chebyshev comprobó que existe un porcentaje
mínimo de observaciones que se encuentran
dentro de un determinado número de Desv Est a
partir de la media, independientemente de la
forma de la distribución.
Teorema de Chebyshev
• Para una muestra o una población, el porcentaje
de observaciones que caen dentro de k Desv Est
de la media (sólo k>1), será cuando menos :
1
%Observ  (1  2 ) *100
k
• Ejemplo : Si μ=34.6 y σ=49.3 miles de casas construidas. Para
k=2 aplicamos Chebyshev y obtenemos que al menos el 75%
de los datos de dicha población se encuentran en el intervalo
descrito como 34.6 ±(2*49.3)
Regla empírica
(sólo para Distribuciones simétricas con forma de campana)
• Alrededor del 68.269% de las observaciones caerán dentro de
la distancia de 1 Desv Est de la media.
• Alrededor del 95.45% de las observaciones caerán dentro de la
distancia de 2 Desv Est de la media.
• Alrededor del 99.73% de las observaciones caerán dentro de la
distancia de 3 Desv Est de la media.

Función de
Distribución
Normal
Coeficiente de Variación
• Es la expresión porcentual que indica la
cantidad relativa de dispersión de los datos en
referencia a la media.
Para una  Para una s
CV  *100% CV  *100%
población
 muestra
x

• Ejemplo : Comparando la variabilidad de los precios del oro y del


zinc, la Desv Est indica que el precio del oro varía MUCHO mas
que el del zinc. Sin embargo, como el valor de una onza de oro es
mucho mayor que el de una libra de zinc, la variabilidad del
precio del oro se ve exagerada. Cuando se aplica el CV, se aprecia
más claramente cuánto varía el precio de cada artículo en
relación con su propio precio promedio.
Ejercicio
MES ORO ($/oz) ZINC ($/lb)
Hallar Media y Desv Est
Febrero 93 329.39 0.5090
Oro
Marzo 329.01 0.4726 Media $364.42
Abril 341.91 0.4811 DesvEst $21.50
Mayo 366.72 0.4722
Junio 371.89 0.4481 Zinc
Julio 392.40 0.4508 Media $0.4592
Agosto 378.46 0.4287 DesvEst $0.0247
Setiembre 354.85 0.4242
Octubre 364.18 0.4388
Noviembre 373.49 0.4430 Hallar Coef. de Variación
Diciembre 383.69 0.4644 CV oro 5.90%
Enero 387.02 0.4776 CV zinc 5.38%
Coeficiente de asimetría de Pearson
• Sólo se puede utilizar en distribuciones uniformes,
unimodales y moderadamente asimétricas. Se basa en
que en distribuciones simétricas la media de la
distribución es igual a la moda.

  mod a x  mod a
Ap  
 s
• Si media=moda, la distribución es simétrica y Ap=0.
• Si media>moda, la distribución es asimétrica positiva y Ap>0
• Si media<moda, la distribución es asimétrica negativa y Ap<0
Ejercicio
• Con los datos del archivo Asimetria.xls
• Determinar Ap para cada caso.
CONTROLCITO 2

También podría gustarte