Está en la página 1de 8

CAPTULO 6

DISTRIBUCIONES MUESTRALES
Uno de los objetivos de la estadstica es conocer acerca del comportamiento de
parmetros poblacionales tales como: la media ( ), la varianza ( 2 ) o la proporcin ( p ).
Para ello se extrae una muestra aleatoria de la poblacin y se calcula el valor de un
estadstico correspondiente, por ejemplo, la media muestral ( X ), la varianza muestral
( s 2 ) o la proporcin muestral ( p ). El valor del estadstico es aleatorio porque depende de
los elementos elegidos en la muestra seleccionada y, por lo tanto, el estadstico tiene una
distribucin de probabilidad la cual es llamada la Distribucin Muestral del estadstico. El
estudio de estas distribuciones es necesario para entender el proceso de inferencia
estadstica que ser discutido en el prximo capitulo.
En este capitulo se considerar la distribucin muestral de dos estadsticos muy
usados, la media muestral y proporcin muestral.

6.1 Distribucin de la Media Muestral cuando la poblacin es normal


Si se extraen muestras aleatorias de tamao n de una poblacin infinita que tiene
media poblacional y varianza 2 , entonces se tiene que:
i)
ii)

La media de las medias muestrales es igual a la media poblacional. Es decir,


x = .
La varianza de las medias muestrales es igual a la varianza poblacional dividida por
n . En consecuencia la desviacin estndar de las medias muestrales (llamada
tambin el error estndar de la media muestral), es igual a la deviacin estndar
poblacional dividida por la raz cuadrada de n . Es decir x =

Si la poblacin fuera finita de tamao N , entonces se aplica el factor de correcin


N n
N 1

al error estndar de la media muestral. Pero en la prctica este factor es omitido a

menos que la muestra sea lo suficientemente grande comparada con la poblacin.


Si adems la poblacin se distribuye normalmente, entonces la media muestral
tambin tiene una distribucin normal con la media y varianza anteriormente indicadas.
Pero si la poblacin no es normal solamente se cumple i) y ii). Cuando la muestra es
grande se aplica el teorema de lmite central para la distribucin de la media muestral, este
tema es tratado en la siguiente seccin.

Edgar Acua

Captulo 6 Distribuciones Muestrales

151

6.2 El Teorema del Lmite Central


Un importante resultado en Probabilidades y Estadstica es el llamado Teorema del
Lmite Central que dice que si de una poblacin infinita con media y varianza 2 se
extraen muestras aleatorias de tamao n , entonces la media muestral se comporta
aproximadamente como una variable aleatoria normal con media igual a la media
poblacional y con varianza igual a la varianza poblacional dividida por el tamao de la
muestra, siempre que n sea grande. Lo importante de este resultado es que es
independiente de la forma de la distribucin de la poblacin. Es decir,

X ~ N ( ,

2
n

Cuando n es grande. Estandarizando, esto es equivalente a:


Z=

~ N (0,1)

n
Si la poblacin es bastante simtrica entonces, un tamao de muestra n de
aproximadamente 30 es suficiente para una buena aproximacin a la normal. Si la
poblacin es bastante asimtrica, entonces el tamao de muestra debe ser mucho ms
grande.
En MINITAB se puede tratar de corroborar el Teorema del Lmite Central a travs
de un proceso de simulacin.

Ejemplo 6.1 Considerar una poblacin que consiste de 3, 4, 6, 8, 10, 11, 12, 15, 20.
Primero calculamos la media y desviacin estndar de dicha poblacin.
Descriptive Statistics
Variable
C1
Variable
C1

N
9
Min
3.00

Mean
9.89
Max
20.00

Median
10.00
Q1
5.00

Tr Mean
9.89

StDev
5.42

SE Mean
1.81

Q3
13.50

Notar que = 9.89 y = 5.42 .


Segundo, extraemos 30 muestras de tamao 4 de dicha poblacin, ejecutando 4 veces la
siguiente secuencia Calc4Random Data4Sample from columns. Guardar cada una de
las 4 observaciones de las muestras en 4 columnas distintas: Obs1, Obs2, Obs3, y Obs4.

Edgar Acua

Captulo 6 Distribuciones Muestrales

152

Tercero, calculamos las medias de todas esas muestras usando la opcin Row Statistics
del men Calc y tratamos de ver grficamente al menos si hay acercamiento a
Normalidad. Asimismo se debe observar que la media de todas estas medias debera estar
cerca de y su varianza cerca de 2/n.
Las 30 muestras elegidas y sus respectivas medias son:
Muestra
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

obs1
6
11
3
10
15
4
12
12
8
8
20
11
11
3
20
20
12
3
20
11
6
11
10
6
15
11
11
10
4
11

obs2
4
8
3
8
12
12
11
8
10
20
10
10
3
10
12
3
20
3
11
3
8
3
8
20
6
10
11
10
20
6

obs3
3
4
15
10
11
6
20
20
12
11
6
12
8
11
20
15
20
11
10
11
6
12
3
12
4
3
11
6
20
6

obs4
8
3
3
6
8
6
10
12
11
20
8
12
11
4
3
11
15
20
15
15
15
6
20
6
12
4
11
10
3
8

media
5.25
6.50
6.00
8.50
11.50
7.00
13.25
13.00
10.25
14.75
11.00
11.25
8.25
7.00
13.75
12.25
16.75
9.25
14.00
10.00
8.75
8.00
10.25
11.00
9.25
7.00
11.00
9.00
11.75
7.75

Las medidas estadsticas de la media muestral son:


Variable
media

N
30

Mean
10.108

Median
10.125

Tr Mean
10.019

Variable
media

Min
5.250

Max
16.750

Q1
7.938

Q3
11.875

StDev
2.806

SE Mean
0.512

En la Figura 6.1 se muestra el histograma de la distribucin de las medias muestrales y la


curva normal que ms se aproxima al histograma.

Edgar Acua

Captulo 6 Distribuciones Muestrales

153

Interpretacin: Notar que la media de las medias muestrales es x = 10.108 que est
bien cerca de la media poblacional = 9.89 . Adems la desviacin estndar de la media
muestral es 2.806 mientras que n es igual a 5.42/2=2.71 ambos valores tambin
estn relativamente cerca. El histograma si est un poco alejado de la normalidad.
Si se incrementa el tamao de las muestras se puede notar una mejor aproximacin a la
Normal.

Figura 6.1 Histograma de la distibucin de las medias maestrales del Ejemplo 6.1

Luego de aplicar estandarizacin, las siguientes frmulas se cumplen, aproximadamente si


la poblacin no es normal y exactamente si lo es.

i)

P( X < a) = P( Z <

ii)

iii)

P ( a < X < b) = P (

P ( X > b) = P ( Z >

n
b

<Z<

Edgar Acua

Captulo 6 Distribuciones Muestrales

154

Las probabilidades pueden ser calculadas usando la tabla de la normal estndar que
aparece en al apndice del texto. Sin embargo, stas pueden ser halladas directamente en
MINITAB sin necesidad de estandarizacin.
Ejemplo 6.2. El tiempo de atencin por cliente de un cajero de un Banco es normal con
media 6 minutos y desviacin estndar 2.5 minutos.

a) Cul es la probabilidad de que el tiempo promedio de atencin para una muestra de


15 clientes sea menor de 7 minutos?
b) Cul es la probabilidad de que el tiempo de atencin a un grupo de 15 clientes sea
ms de una hora y 15 minutos?
c) Si el tiempo en que el cajero atiende a un grupo de 15 clientes excede las dos horas
entonces ste es despedido. Cul es la probabilidad de que esto ocurra?
Solucin:
Usando el hecho que el tiempo promedio de atencin para una muestra de tamao 15 es
2.5
normal con media 6 y desviacin estndar
= 0.645 , con la ayuda de MINITAB se
15
obtiene:

a) P ( X < 7) = 0.9395
b) Un tiempo de atencin de 75 minutos a 15 clientes equivale a un tiempo promedio de
atencin de 75/15 = 5 minutos. Luego, hay que hallar P( X > 5) = 1 0.0605 = 0.9395
c) Un tiempo de atencin de 120 minutos a 15 clientes equivale a un tiempo promedio de
atencin de 120/15 = 8 minutos por cliente. Luego, hay que hallar P( X > 8) = 1 0.9990 = .001.
Ejemplo 6.3. Los pesos de las personas que suben a un ascensor se distribuyen
normalmente con media igual a 125 libras y desviacin estndar de 30 libras. Un grupo de
9 personas sube al ascensor:
a) Cul es la probabilidad de que el peso promedio del grupo sea menor de 100 libras?
b) El ascensor tiene una capacidad mxima de 1400 libras. Cul es la probabilidad de
que se exceda esta capacidad con un grupo de 9 personas?
Solucin:
a) El peso promedio de un grupo de 9 personas se distribuye normalmente con media 125
30
y desviacin estndar igual a
= 10 . Luego usando la secuencia Calc4Probability
9
Distributions4 Normal en MINITAB se obtiene que P ( X < 100) = 0.0062 .
b) Decir que la suma de los pesos del grupo sea mayor que 1400, equivale a que el peso
promedio del grupo de 9 personas sea mayor que 1400/9 = 166.66 libras. Luego, la
probabilidad pedida ser P ( X > 166.66) = 1 P( X < 166.66) = 1 .9989 = 0.0011 .

Edgar Acua

Captulo 6 Distribuciones Muestrales

155

6.3 Distribucin de la Proporcin Muestral


Si de una poblacin distribuida Binomialmente con probabilidad de xito p , se
extrae una muestra aleatoria de tamao n , entonces se puede mostrar que la media de X:
nmero de xitos en la muestra, es = np y que su varianza es 2 = npq . En
X
pq
. As, por el
consecuencia la proporcin muestral p =
tiene media p , y varianza
n
n
Teorema del Limite Central, cuando el tamao de muestra es grande, entonces:

z=

X np
npq

p p
pq
n

Se distribuye aproximadamente como una normal estndar. La aproximacin es


bastante confiable si tanto np como nq son mayores que 5. Cuando p es cercano a 0 1
se debe tomar un tamao de muestra ms grande para mejorar la aproximacin.
Asmismo, como se estn aproximando probabilidades de una distribucin discreta
por probabilidades de una distribucin contnua, se debe aplicar un Factor de Correccin
por Continuidad de 1/2, antes de calcular las probabilidades. Este 1/2 se explica porque
un valor entero k de la variable discreta representa a todos los valores de la variable
continua que caen en el intervalo (k 1 2 , k + 1 2 ) . Cuando el tamao de muestra es bien
grande entonces el efecto de considerar el factor de correccin por continuidad es
insignificante.

Frmulas de aproximacin Normal a la Binomial.


Si X es una Binomial con parmetros n y p, entonces

k .5 np

i)

P ( X = k ) P (k .5 < X < k + .5) = P (

ii)

P (a < X < b ) = P (a + .5 < X < b .5) = P (

iii) P (a X b ) = P (a .5 < X < b + .5) = P (

npq

<Z<

a + .5 np
npq
a .5 np
npq

k + .5 np

<Z<
<Z<

npq

b .5 np
npq
b + .5 np
npq

)
)

Similarmente se pueden definir frmulas para aproximar probabilidades para proporciones


muestrales.

Edgar Acua

Captulo 6 Distribuciones Muestrales

156

Ejemplo 6.4. Segn reportes del centro nacional para estadsticas de salud, alrededor del
20 % de la poblacin masculina adulta de los Estados Unidos es obesa. Se elige al azar
una muestra de 150 hombres adultos en los Estados Unidos. Cul es la probabilidad de
que:
a) Haya a lo ms 25 personas obesas?
b) Haya ms de 22 pero menos de 35 obesos?
c) Haya por lo menos un 25% de obesos en la muestra?

Solucin: Sea X el nmero de personas obesas en la muestra.


Usando aproximacin normal a la Binomial se tiene que:
25.5 30

a) P ( X 25) P( X < 25.5) = P Z <


= P(Z < 0.91) = 0.1814
24

34.5 30
22.5 30
b) P (22 < X < 35) P(22.5 < x < 34.5) = P
<Z<
=
24
24

P ( 1.53 < Z < 0.91) = 0.8186 0.0063 = 0.8123 .


37.5 30
c) P( p .25) = P ( X 37.5) = P ( Z >
) = P(Z>1.53) = 1-P(Z<1.53) =
24
1-.9730 = .0630.
La distribucin de la proporcin muestral ser usado cuando se haga inferencia
acerca de la proporcin poblacional a ser discutida en el prximo capitulo.

Edgar Acua

Captulo 6 Distribuciones Muestrales

157

EJERCICIOS
1. Los tiempos de espera en la fila de un proceso de matrcula de una universidad se
distribuyen normalmente con media 45 minutos y desviacin estndar de 20 minutos.
Se elige al azar una muestra de 16 estudiantes que se van a matricular.
a) Cul es la probabilidad de que el tiempo de espera promedio de la muestra sea
mayor de 60 minutos?
b) Cul es la probabilidad de que el tiempo de espera promedio de la muestra sea
mayor de 35 minutos pero menor de 55 minutos?
2. Los tiempos que se demoran los empleados de una fbrica en realizar una tarea de
ensamblaje se distribuyen normalmente con media de 12 minutos y desviacin
estndar de 6. Se toma una muestra de 10 empleados.
a) Cul es la probabilidad de que el tiempo promedio que usan los empleados para
terminar la tarea de ensamblaje sea mayor de 15, pero menor de 17 minutos?
b) Si los 10 empleados tardan menos de hora y media en terminar la tarea de
ensamblaje entonces la fbrica recibe un premio. Cul es la probabilidad de que
esto ocurra?
3. El contenido promedio de cereal en un paquete es de 450 gramos con una desviacin
estndar de 13 gramos. Si se tom una muestra de 35 paquetes
a) Cul es la probabilidad de que el promedio de esta muestra sea mayor a 455
gramos?
b) Cul es la probabilidad de que el promedio de sta muestra se encuentre entre 445
y 458 gramos?
4. Haga uso del programa MINITAB para:
a) Generar 60 muestras aleatorias de tamao 25 de una poblacin normal con media
60 y deviacin estandar 13.
b) Calcule la media para cada muestra generada en la parte a).
c) Calcule la desviacin estndar de los promedios calculados en la parte a)
d) Compare los resultados obtenidos en la parte b) y c) , con lo propuesto en la parte
a)
5. Un restaurant determin que en 1 de cada 5 almuerzos vendidos el cliente pide un
postre. Si en un da el restaurant realiza 600 ventas:
a) Calcular la probabilidad de ms de 150 clientes acompae su almuerzo con un
postre.
b) Calcular la probabilidad de que a lo ms 450 clientes acompaen su almuerzo con
un postre.
6. En la poca de invierno en los Estados Unidos se estima que el 90% de la poblacin
contrae enfermedades respiratorias. Para una muestra de 350 Cul es la probabilidad
de que ms de 315 podrian eventualmente sufrir algn tipo de enfermedades
respiratorias?.

También podría gustarte