Está en la página 1de 8

CAPTULO 6 DISTRIBUCIONES MUESTRALES

Uno de los objetivos de la estadstica es conocer acerca del comportamiento de parmetros poblacionales tales como: la media ( ), la varianza ( 2 ) o la proporcin ( p ). Para ello se extrae una muestra aleatoria de la poblacin y se calcula el valor de un estadstico correspondiente, por ejemplo, la media muestral ( X ), la varianza muestral ). El valor del estadstico es aleatorio porque depende de ( s 2 ) o la proporcin muestral ( p los elementos elegidos en la muestra seleccionada y, por lo tanto, el estadstico tiene una distribucin de probabilidad la cual es llamada la Distribucin Muestral del estadstico. El estudio de estas distribuciones es necesario para entender el proceso de inferencia estadstica que ser discutido en el prximo capitulo.
En este capitulo se considerar la distribucin muestral de dos estadsticos muy usados, la media muestral y proporcin muestral.

6.1 Distribucin de la Media Muestral cuando la poblacin es normal


Si se extraen muestras aleatorias de tamao n de una poblacin infinita que tiene media poblacional y varianza 2 , entonces se tiene que: i) ii) La media de las medias muestrales es igual a la media poblacional. Es decir, x = . La varianza de las medias muestrales es igual a la varianza poblacional dividida por n . En consecuencia la desviacin estndar de las medias muestrales (llamada tambin el error estndar de la media muestral), es igual a la deviacin estndar poblacional dividida por la raz cuadrada de n . Es decir x =

Si la poblacin fuera finita de tamao N , entonces se aplica el factor de correcin


N n N 1

al error estndar de la media muestral. Pero en la prctica este factor es omitido a

menos que la muestra sea lo suficientemente grande comparada con la poblacin. Si adems la poblacin se distribuye normalmente, entonces la media muestral tambin tiene una distribucin normal con la media y varianza anteriormente indicadas. Pero si la poblacin no es normal solamente se cumple i) y ii). Cuando la muestra es grande se aplica el teorema de lmite central para la distribucin de la media muestral, este tema es tratado en la siguiente seccin.

Edgar Acua

Captulo 6 Distribuciones Muestrales

151

6.2 El Teorema del Lmite Central


Un importante resultado en Probabilidades y Estadstica es el llamado Teorema del Lmite Central que dice que si de una poblacin infinita con media y varianza 2 se extraen muestras aleatorias de tamao n , entonces la media muestral se comporta aproximadamente como una variable aleatoria normal con media igual a la media poblacional y con varianza igual a la varianza poblacional dividida por el tamao de la muestra, siempre que n sea grande. Lo importante de este resultado es que es independiente de la forma de la distribucin de la poblacin. Es decir,

X ~ N ( ,

2
n

Cuando n es grande. Estandarizando, esto es equivalente a:


Z= X

~ N (0,1)

Si la poblacin es bastante simtrica entonces, un tamao de muestra n de aproximadamente 30 es suficiente para una buena aproximacin a la normal. Si la poblacin es bastante asimtrica, entonces el tamao de muestra debe ser mucho ms grande. En MINITAB se puede tratar de corroborar el Teorema del Lmite Central a travs de un proceso de simulacin.

Ejemplo 6.1 Considerar una poblacin que consiste de 3, 4, 6, 8, 10, 11, 12, 15, 20. Primero calculamos la media y desviacin estndar de dicha poblacin. Descriptive Statistics
Variable C1 Variable C1 N 9 Min 3.00 Mean 9.89 Max 20.00 Median 10.00 Q1 5.00 Tr Mean 9.89 Q3 13.50 StDev 5.42 SE Mean 1.81

Notar que = 9.89 y = 5.42 . Segundo, extraemos 30 muestras de tamao 4 de dicha poblacin, ejecutando 4 veces la siguiente secuencia Calc4Random Data4Sample from columns. Guardar cada una de las 4 observaciones de las muestras en 4 columnas distintas: Obs1, Obs2, Obs3, y Obs4.

Edgar Acua

Captulo 6 Distribuciones Muestrales

152

Tercero, calculamos las medias de todas esas muestras usando la opcin Row Statistics del men Calc y tratamos de ver grficamente al menos si hay acercamiento a Normalidad. Asimismo se debe observar que la media de todas estas medias debera estar cerca de y su varianza cerca de 2/n. Las 30 muestras elegidas y sus respectivas medias son:
Muestra 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 obs1 6 11 3 10 15 4 12 12 8 8 20 11 11 3 20 20 12 3 20 11 6 11 10 6 15 11 11 10 4 11 obs2 4 8 3 8 12 12 11 8 10 20 10 10 3 10 12 3 20 3 11 3 8 3 8 20 6 10 11 10 20 6 obs3 3 4 15 10 11 6 20 20 12 11 6 12 8 11 20 15 20 11 10 11 6 12 3 12 4 3 11 6 20 6 obs4 8 3 3 6 8 6 10 12 11 20 8 12 11 4 3 11 15 20 15 15 15 6 20 6 12 4 11 10 3 8 media 5.25 6.50 6.00 8.50 11.50 7.00 13.25 13.00 10.25 14.75 11.00 11.25 8.25 7.00 13.75 12.25 16.75 9.25 14.00 10.00 8.75 8.00 10.25 11.00 9.25 7.00 11.00 9.00 11.75 7.75

Las medidas estadsticas de la media muestral son:


Variable media Variable media N 30 Min 5.250 Mean 10.108 Max 16.750 Median 10.125 Q1 7.938 Tr Mean 10.019 Q3 11.875 StDev 2.806 SE Mean 0.512

En la Figura 6.1 se muestra el histograma de la distribucin de las medias muestrales y la curva normal que ms se aproxima al histograma.

Edgar Acua

Captulo 6 Distribuciones Muestrales

153

Interpretacin: Notar que la media de las medias muestrales es x = 10.108 que est bien cerca de la media poblacional = 9.89 . Adems la desviacin estndar de la media muestral es 2.806 mientras que n es igual a 5.42/2=2.71 ambos valores tambin estn relativamente cerca. El histograma si est un poco alejado de la normalidad. Si se incrementa el tamao de las muestras se puede notar una mejor aproximacin a la Normal.

Figura 6.1 Histograma de la distibucin de las medias maestrales del Ejemplo 6.1

Luego de aplicar estandarizacin, las siguientes frmulas se cumplen, aproximadamente si la poblacin no es normal y exactamente si lo es.

i)

P( X < a) = P( Z <

a
n

ii)

P ( a < X < b) = P (

n b

<Z<

iii)

P ( X > b) = P ( Z >

Edgar Acua

Captulo 6 Distribuciones Muestrales

154

Las probabilidades pueden ser calculadas usando la tabla de la normal estndar que aparece en al apndice del texto. Sin embargo, stas pueden ser halladas directamente en MINITAB sin necesidad de estandarizacin.
Ejemplo 6.2. El tiempo de atencin por cliente de un cajero de un Banco es normal con media 6 minutos y desviacin estndar 2.5 minutos.

a) Cul es la probabilidad de que el tiempo promedio de atencin para una muestra de 15 clientes sea menor de 7 minutos? b) Cul es la probabilidad de que el tiempo de atencin a un grupo de 15 clientes sea ms de una hora y 15 minutos? c) Si el tiempo en que el cajero atiende a un grupo de 15 clientes excede las dos horas entonces ste es despedido. Cul es la probabilidad de que esto ocurra?
Solucin: Usando el hecho que el tiempo promedio de atencin para una muestra de tamao 15 es 2.5 normal con media 6 y desviacin estndar = 0.645 , con la ayuda de MINITAB se 15 obtiene:

a) P ( X < 7) = 0.9395 b) Un tiempo de atencin de 75 minutos a 15 clientes equivale a un tiempo promedio de atencin de 75/15 = 5 minutos. Luego, hay que hallar P( X > 5) = 1 0.0605 = 0.9395 c) Un tiempo de atencin de 120 minutos a 15 clientes equivale a un tiempo promedio de atencin de 120/15 = 8 minutos por cliente. Luego, hay que hallar P( X > 8) = 1 0.9990 = .001.
Ejemplo 6.3. Los pesos de las personas que suben a un ascensor se distribuyen normalmente con media igual a 125 libras y desviacin estndar de 30 libras. Un grupo de 9 personas sube al ascensor: a) Cul es la probabilidad de que el peso promedio del grupo sea menor de 100 libras? b) El ascensor tiene una capacidad mxima de 1400 libras. Cul es la probabilidad de que se exceda esta capacidad con un grupo de 9 personas? Solucin: a) El peso promedio de un grupo de 9 personas se distribuye normalmente con media 125 30 y desviacin estndar igual a = 10 . Luego usando la secuencia Calc4Probability 9 Distributions4 Normal en MINITAB se obtiene que P ( X < 100) = 0.0062 . b) Decir que la suma de los pesos del grupo sea mayor que 1400, equivale a que el peso promedio del grupo de 9 personas sea mayor que 1400/9 = 166.66 libras. Luego, la probabilidad pedida ser P ( X > 166.66) = 1 P( X < 166.66) = 1 .9989 = 0.0011 .

Edgar Acua

Captulo 6 Distribuciones Muestrales

155

6.3 Distribucin de la Proporcin Muestral


Si de una poblacin distribuida Binomialmente con probabilidad de xito p , se extrae una muestra aleatoria de tamao n , entonces se puede mostrar que la media de X: nmero de xitos en la muestra, es = np y que su varianza es 2 = npq . En X pq = . As, por el consecuencia la proporcin muestral p tiene media p , y varianza n n Teorema del Limite Central, cuando el tamao de muestra es grande, entonces:

z=

X np npq

p p pq n

Se distribuye aproximadamente como una normal estndar. La aproximacin es como nq son mayores que 5. Cuando p es cercano a 0 1 bastante confiable si tanto np se debe tomar un tamao de muestra ms grande para mejorar la aproximacin. Asmismo, como se estn aproximando probabilidades de una distribucin discreta por probabilidades de una distribucin contnua, se debe aplicar un Factor de Correccin por Continuidad de 1/2, antes de calcular las probabilidades. Este 1/2 se explica porque un valor entero k de la variable discreta representa a todos los valores de la variable continua que caen en el intervalo (k 1 2 , k + 1 2 ) . Cuando el tamao de muestra es bien grande entonces el efecto de considerar el factor de correccin por continuidad es insignificante.

Frmulas de aproximacin Normal a la Binomial.


Si X es una Binomial con parmetros n y p, entonces i)

P ( X = k ) P (k .5 < X < k + .5) = P (

k .5 np npq

<Z<

k + .5 np npq

ii)

P (a < X < b ) = P (a + .5 < X < b .5) = P (

a + .5 np npq a .5 np npq

<Z< <Z<

b .5 np npq b + .5 np npq

) )

iii) P (a X b ) = P (a .5 < X < b + .5) = P (

Similarmente se pueden definir frmulas para aproximar probabilidades para proporciones muestrales.

Edgar Acua

Captulo 6 Distribuciones Muestrales

156

Ejemplo 6.4. Segn reportes del centro nacional para estadsticas de salud, alrededor del 20 % de la poblacin masculina adulta de los Estados Unidos es obesa. Se elige al azar una muestra de 150 hombres adultos en los Estados Unidos. Cul es la probabilidad de que:
a) Haya a lo ms 25 personas obesas? b) Haya ms de 22 pero menos de 35 obesos? c) Haya por lo menos un 25% de obesos en la muestra?

Solucin: Sea X el nmero de personas obesas en la muestra. Usando aproximacin normal a la Binomial se tiene que: 25.5 30 a) P ( X 25) P( X < 25.5) = P Z < = P(Z < 0.91) = 0.1814 24 34.5 30 22.5 30 b) P (22 < X < 35) P(22.5 < x < 34.5) = P <Z< = 24 24 P ( 1.53 < Z < 0.91) = 0.8186 0.0063 = 0.8123 . 37.5 30 .25) = P ( X 37.5) = P ( Z > c) P( p ) = P(Z>1.53) = 1-P(Z<1.53) = 24 1-.9730 = .0630.
La distribucin de la proporcin muestral ser usado cuando se haga inferencia acerca de la proporcin poblacional a ser discutida en el prximo capitulo.

Edgar Acua

Captulo 6 Distribuciones Muestrales

157

EJERCICIOS
1. Los tiempos de espera en la fila de un proceso de matrcula de una universidad se distribuyen normalmente con media 45 minutos y desviacin estndar de 20 minutos. Se elige al azar una muestra de 16 estudiantes que se van a matricular. a) Cul es la probabilidad de que el tiempo de espera promedio de la muestra sea mayor de 60 minutos? b) Cul es la probabilidad de que el tiempo de espera promedio de la muestra sea mayor de 35 minutos pero menor de 55 minutos? 2. Los tiempos que se demoran los empleados de una fbrica en realizar una tarea de ensamblaje se distribuyen normalmente con media de 12 minutos y desviacin estndar de 6. Se toma una muestra de 10 empleados. a) Cul es la probabilidad de que el tiempo promedio que usan los empleados para terminar la tarea de ensamblaje sea mayor de 15, pero menor de 17 minutos? b) Si los 10 empleados tardan menos de hora y media en terminar la tarea de ensamblaje entonces la fbrica recibe un premio. Cul es la probabilidad de que esto ocurra? 3. El contenido promedio de cereal en un paquete es de 450 gramos con una desviacin estndar de 13 gramos. Si se tom una muestra de 35 paquetes a) Cul es la probabilidad de que el promedio de esta muestra sea mayor a 455 gramos? b) Cul es la probabilidad de que el promedio de sta muestra se encuentre entre 445 y 458 gramos? 4. Haga uso del programa MINITAB para: a) Generar 60 muestras aleatorias de tamao 25 de una poblacin normal con media 60 y deviacin estandar 13. b) Calcule la media para cada muestra generada en la parte a). c) Calcule la desviacin estndar de los promedios calculados en la parte a) d) Compare los resultados obtenidos en la parte b) y c) , con lo propuesto en la parte a) 5. Un restaurant determin que en 1 de cada 5 almuerzos vendidos el cliente pide un postre. Si en un da el restaurant realiza 600 ventas: a) Calcular la probabilidad de ms de 150 clientes acompae su almuerzo con un postre. b) Calcular la probabilidad de que a lo ms 450 clientes acompaen su almuerzo con un postre. 6. En la poca de invierno en los Estados Unidos se estima que el 90% de la poblacin contrae enfermedades respiratorias. Para una muestra de 350 Cul es la probabilidad de que ms de 315 podrian eventualmente sufrir algn tipo de enfermedades respiratorias?.