Está en la página 1de 32

DISTRIBUCIONES MUESTRALES

Teora del Muestreo:


Uno de los propsitos de la inferencia estadstica es estimar las caractersticas poblacionales
desconocidas, examinando la informacin obtenida de una muestra, de una poblacin. El
punto de inters es la muestra, la cual debe ser representativa de la poblacin objeto de
estudio.
Hay que seguir ciertos procedimientos de seleccin para asegurar de que las muestras
reflejen fielmente a la poblacin de la que proceden, ya que solo se pueden hacer
afirmaciones probabilsticas sobre una poblacin cuando se usan muestras representativas
de la misma.
Poblacin: es el conjunto de todos los posibles individuos, objetos o medidas de inters para
un estadstico en una investigacin particular.
Muestra: es una porcin, o parte, de una poblacin de inters.
Parmetro: es cualquier caracterstica numrica de una poblacin. (N, , , 2 , etc.)
Estadstico: es cualquier caracterstica numrica de una muestra. (n, x , s, s 2 , etc.)
En muchos casos, la muestra es la nica forma de inferir algo acerca de una poblacin.

Muestras Aleatorias:
Algunas de las principales razones por las que el muestreo es necesario son:
1.

La naturaleza destructiva ciertas pruebas.

2.

La imposibilidad fsica de revisar todos los integrantes de la poblacin.

3.

El costo de estudiar a todos los integrantes de una poblacin, frecuentemente es


prohibitivo.

4.

En ocasiones se necesitara mucho tiempo para entrevistar a toda la poblacin.

A continuacin veremos los usos del muestreo en diversos campos:

Poltica: las muestras de las opiniones de los votantes se usan para que los
candidatos midan la opinin pblica y el apoyo en las elecciones.

Educacin: las muestras de las calificaciones de los exmenes de estudiantes se


usan para determinar la eficiencia de una tcnica o programa de enseanza.

Industria: muestras de los productos de una lnea de ensamblaje sirve al propsito


de controlar la calidad.

Medicina: muestras de medidas de azcar en la sangre de pacientes diabticos


prueban la eficacia de una tcnica o de un nuevo frmaco.

Agricultura: las muestras del maz cosechado en una parcela proyectan en la


produccin los efectos de un fertilizante nuevo.

Gobierno: una muestra de opiniones de los votantes se usara para determinar los
criterios del pblico sobre cuestiones relacionadas con el bienestar y la seguridad
nacional.

Errores en el Muestreo:
Cuando se utilizan valores muestrales, o estadsticos para estimar valores poblacionales, o
parmetros, pueden ocurrir dos tipos de errores:
1.

Error muestral: se refiere a la variacin natural existente entre muestras tomadas


de la misma poblacin.

Cuando una muestra no es una copia exacta de una poblacin, incluso si se ha tenido mucho
cuidado para asegurar que dos muestras del mismo tamao sean representativas de una
cierta poblacin, no se puede esperar que las dos sean idnticas en todos sus detalles. El
error muestral es un concepto muy importante que nos ayudar a entender mejor la
naturaleza de la inferencia estadstica.
2.

Errores no muestrales: son los errores que surgen al tomar las muestras

El sesgo muestral es un tipo de error no muestral. El sesgo muestral se refiere a una


tendencia sistemtica inherente a un mtodo de muestreo que da estimaciones de un
parmetro que son, en promedio, menores (sesgo negativo), o mayores (sesgo positivo) que
el parmetro real.
El sesgo muestral puede eliminarse, o minimizarse, usando la aleatoriedad.
La aleatoriedad se refiere a cualquier proceso de seleccin de una muestra de una
poblacin en el que la seleccin es imparcial o no est sesgada. Una muestra elegida con
procedimientos aleatorios se llama muestra aleatoria.
Los mtodos ms comunes para muestreos aleatorios son:
1.

Muestreo aleatorio simple: todos los miembros de la poblacin tienen la misma


probabilidad de ser seleccionados.

Ejemplo:
Un mtodo para lograrlo es asignarle a cada uno un nmero, escribir cada nmero en un
papel, y realizar en una urna un sorteo justo con ellas. Un mtodo alternativo consiste en
recurrir a una tabla de nmeros aleatorios que viene en todos los libros de estadstica
especialmente construida para tal efecto. Como su nombre lo indica, estos nmeros han
sido generados por un proceso aleatorio (en este caso, por una computadora). Para cada
dgito de un nmero, la probabilidad de 0, 1, 2, ., 9 es la misma. As, la probabilidad de

que una persona con nmero 011 sea elegido, es la misma que la de otra persona con el
nmero 722, o el 356. Por lo tanto, quedan eliminados as los sesgos en el proceso de
seleccin.
En este procedimiento de muestreo, y en los restantes que veremos, se supone que el
muestreo se realiza sin reemplazo. Esto es, un elemento que se selecciona para la muestra
no se devuelve a la poblacin para ser, quizs, seleccionado de nuevo. Existen otros casos
en los que el muestreo se realiza con reemplazo, donde cada elemento elegido se devuelve
a la poblacin antes de hacer la siguiente seleccin.
Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco prctico,
imposible o no deseado. Aunque sera deseable usar muestras aleatorias simples para las
encuestas nacionales de opinin sobre productos o sobre elecciones presidenciales, sera
muy caro y demoroso.
2.

Muestreo estratificado: requiere de separar a la poblacin en subgrupos,


denominados estratos, y de elegir despus una muestra aleatoria simple en cada
estrato.

Ejemplo:
Suponga que nos interesa obtener una muestra de los docentes de Inacap. Puede ser
difcil obtener una muestra con todos los docentes, as que supongamos que elegimos
una muestra aleatoria de cada sede, entonces los estratos vendran a ser las sedes.
3.

Muestreo por conglomerados: requiere de elegir una muestra aleatoria simple de


unidades heterogneas entre s de la poblacin llamadas conglomerados. Cada
elemento de la poblacin pertenece exactamente a un conglomerado, y los
elementos dentro de cada conglomerado son usualmente heterogneos o
dismiles.

Ejemplo:
Supngase que Metrpolis, una compaa de servicio de televisin por cable est
pensando en abrir una sucursal en una ciudad grande. La compaa planea realizar un
estudio para determinar el porcentaje de familias que utilizaran sus servicios, como no es
prctico preguntar en cada casa, la empresa decide seleccionar una parte de la ciudad al
azar, la cual forma un conglomerado.
En el muestreo por conglomerado, stos se forman para representar, tan fielmente como
sea posible, a toda la poblacin, por lo que se usa una muestra aleatoria simple de
conglomerados para estudiarla. Este tipo de muestreo se usa frecuentemente para
reducir el costo de muestrear una poblacin dispersa en un rea geogrfica grande y son
utilizados especialmente por instituciones sociales como iglesias, hospitales, escuelas y
prisiones.
4.

Muestreo sistemtico: es una tcnica de muestreo que requiere de una seleccin


aleatoria inicial de observaciones seguida de otra seleccin de observaciones
obtenida usando algn sistema o regla.

Ejemplo:

Para obtener una muestra de suscriptores telefnicos en una ciudad grande, puede
obtenerse primero una muestra aleatoria de los nmeros de las pginas de la gua
telefnica. Al elegir dcimo nombre de cada pgina obtendramos un muestreo
sistemtico. Tambin podemos escoger un nombre de la primera pgina de la gua
telefnica y despus escoger cada nombre del lugar nmero cien a partir del ya escogido.
Por ejemplo, podramos seleccionar un nmero al azar de entre los primeros cien.
Supongamos que el elegido es el 40, entonces escogimos los nombres de la gua
telefnica que corresponden a los nmeros 40, 140, 240, 340, 440 y as sucesivamente.

Error Muestral:
Cualquier medida conlleva algn error. Si se usa la media para medir, estimar, la media
poblacional , entonces la media muestral, como medida, conlleva algn error. Por ejemplo,
supongamos que se ha obtenido una muestra aleatoria de tamao 22 en una poblacin con
media 13 ; si la media de la muestra es x 10 , entonces a la diferencia observada
x 3 se le denomina error muestral. Una media muestral x puede pensarse como la
suma de dos cantidades, la media poblacional y el error muestral. Si e denota el error
muestral, entonces:
xe
Ejemplo:
Se toman muestras de tamao 2 de una poblacin consistente en tres valores, 2, 4 y 6, para
simular una poblacin grande de manera que el muestreo pueda realizarse un gran nmero
de veces, supondremos que este se hace con reemplazo, es decir, el nmero elegido se
reemplaza antes de seleccionar el siguiente, adems, se seleccionan muestras ordenadas.
En una muestra ordenada, el orden en que se seleccionan las observaciones (datos) es
importante, por tanto, la muestra ordenada (2,6) es distinta de la muestra ordenada (6,2). En
la muestra (6,2), primero se seleccion el 4 y despus el 3. A continuacin mostraremos una
tabla que contiene una lista de todas las muestras ordenadas de tamao 2 que es posible
seleccionar con reemplazo y tambin contiene las medias muestrales y los correspondientes
errores muestrales. Observemos que la media poblacional es igual a 2 4 6 3 4 .
Muestras ordenadas
(2,2)
(2,4)
(2,6)
(4,2)
(4,4)
(4,6)
(6,2)
(6,4)
(6,6)

x
2
3
4
3
4
5
4
5
6

Error muestral e x
2 4 = -2
3 4 = -1
44=0
3 4 = -1
44=0
54=1
44=0
54=1
64=2

Hay 3(3) = 9 muestras de tamao 2 que se pueden tomar con reemplazo de la poblacin (por
que cualquiera de los tres nmeros de la primera extraccin puede asociarse con uno
cualquiera de la segunda).
Ntese de las interesantes relaciones contenidas en la tabla:
X 2 3 4 3 4 5 4 5 6 9 4

La media del conjunto de medias muestrales X


poblacin de la que se extraen las muestras.

es 4, lo mismo que la media de la

e1 e 2 e3 ....... e9 2 1 0 1 0 1 0 1 2 0
La suma de los errores muestrales es cero.
En consecuencia, si x se usa para medir, estimar, la media poblacional , el promedio de
todos los errores muestrales es cero.
Consideremos todas las posibles muestras de tamao n en una poblacin dada (con o sin
reposicin). Para cada muestra, podemos calcular un estadstico (tal como la media o la
desviacin estndar) que variar de muestra a muestra. De esta manera obtenemos una
distribucin del estadstico que se llama muestral.
Dependiendo del estadstico, es como se llamar la distribucin muestral. Para cada
distribucin muestral podemos calcular la media y la desviacin estndar, etc. As pues,
podremos hablar de la media y la desviacin estndar de la distribucin muestral que
corresponda.

Distribuciones Muestrales:
Las muestras aleatorias obtenidas de una poblacin son por naturaleza propia,
impredecibles. No se esperara que dos muestras aleatorias del mismo tamao y tomadas de
la misma poblacin tengan la misma media muestral o que sean completamente parecidas.
Puede esperarse que cualquier estadstico, como la media muestral, calculado a partir de las
medias en una muestra aleatoria, cambie su valor de una muestra a otra, por ello se quiere
estudiar la distribucin de todos los valores posibles de un estadstico. Tales distribuciones
sern muy importantes en el estudio de la inferencia estadstica, porque las inferencias sobre
las poblaciones se harn usando estadsticas muestrales. Con el anlisis de las
distribuciones asociadas con los estadsticos muestrales, podremos juzgar la confiabilidad de
un estadstico muestral como un instrumento para hacer inferencias sobre un parmetro
poblacional desconocido.
En otras palabras, analizaremos la exactitud de este proceso de inferencia. Una vez que se
infiere que la poblacin posee las mismas caractersticas de la muestra, el analista debe
determinar la magnitud de los errores posibles inherentes a este proceso. Como el muestreo
es algo comn en la mayora de las reas u organizaciones, es vital para todos ustedes
conocer como medir y entender este error inherente. Evaluar un posible error supone la
comprensin cabal del concepto ms importante de la estadstica: la distribucin muestral.
Como los valores de un estadstico, tal como x , varan de una muestra aleatoria a otra, se le
puede considerar como una variable aleatoria con su correspondiente distribucin de
frecuencias.
La distribucin de frecuencia de un estadstico muestral se denomina distribucin muestral.
En general, la distribucin muestral de un estadstico es la de todos sus valores posibles
calculados a partir de muestras del mismo tamao.
Ejemplo:

Supongamos que se han seleccionado muestras aleatorias de tamao 30 en una poblacin


grande. Se calcula la media muestral x para cada muestra. El conjunto de todas estas
medias muestrales recibe el nombre de distribucin muestral de medias, lo que se puede
ilustrar en la siguiente figura:

X1
Muestra 1
Muestra 2

X2

X2

Muestra 3
Muestra K

X1

X3

X3
XK

..
.

Poblacin

XK

Distribucin muestral
de medias

Supongamos que se han seleccionado muestras aleatorias de tamao 30 en una poblacin


grande y se calcula la desviacin estndar muestral s para cada una. El conjunto de todas
estas medias muestrales recibe el nombre de distribucin muestral de la desviacin
estndar, y lo podemos ver en la siguiente figura:

S1
Muestra 1

S2

Muestra 2
Muestra 3

S3

Muestra K

..
.

Poblacin

SK

Distribucin muestral de
desviacin estndar

Ejemplo:
Se eligen muestras ordenadas de tamao 2, con reemplazo, de la poblacin de valores 0. 2,
4 y 6. Encuentre:
a) , la media poblacional.
b) , la desviacin estndar poblacional.
c) X , la media de la distribucin muestral de medias.
d) X , la desviacin estndar de la distribucin muestral de la media.
Adems, grafique las frecuencias para la poblacin y para la distribucin muestral de medias
Respuesta:
a) la media poblacional es:

X 0 2 4 6 4 3

Grfica de frecuencias para la poblacin

Distribucin poblacional
b) la desviacin estndar de la poblacin es:

0 3 2 2 3 2 4 3 2 6 3 2
4

2,236

c) A continuacin mostramos en una tabla los elementos de la distribucin muestral de la


media y la correspondiente distribucin de frecuencias.
Muestra
(0,0)
(0,2)
(0,4)
(0,6)
(2,0)
(2,2)
(2,4)
(2,6)

x
0
1
2
3
1
2
3
4

Muestra
(4,0)
(4,2)
(4,4)
(4,6)
(6,0)
(6,2)
(6,4)
(6,6)

x
2
3
4
5
3
4
5
6

Distribucin de frecuencias de x
x
f
0
1
1
2
2
3
3
4
4
3
5
2
6
1
Grfica de frecuencias para las medias de las muestras x

Distribucin muestral
La media de la distribucin muestral de medias es:
X

f x 01 1 2 2 3 3 4 4 3 5 2 61 48 3
16
16
f

d) la desviacin estndar de la distribucin muestral de medias es:

f X X
f

1 0 3 21 3 3 2 3 4 3 3 3 4 3 2 5 3 1 6 3
1,58
16
2

De aqu que podamos deducir que la desviacin estndar de la distribucin muestral es:

n
2,236

1,58
2

X
X

Como para cualquier variable aleatoria, la distribucin muestral de medias tiene una media o
valor esperado, una varianza y una desviacin estndar, se puede demostrar que la
distribucin muestral de medias tiene una media igual a la media poblacional. Esto es:
X E x 3

Conclusin:
Despus de haber realizado el ejercicio anterior se puede ver que una distribucin
muestral se genera extrayendo todas las posibles muestras del mismo tamao de la
poblacin y calculndoles a stas su estadstico.
Si la poblacin de la que se extraen las muestras es normal, la distribucin muestral de
medias ser normal sin importar el tamao de la muestra.

Poblacin
Distribucin muestral de medias
generada con muestras de
tamao
Si la poblacin de donde se extraen las muestras no es normal, entonces el tamao de la
muestra debe ser a 30, para que la distribucin muestral tenga forma de campana.
Mientras mayor sea el tamao de la muestra, ms cerca estar la distribucin de ser normal.
Para muchos propsitos, la aproximacin normal se considera buena si se cumple n = 30. La
forma de la distribucin muestral de medias sea aproximadamente normal, inclusive en casos
donde la poblacin original es bimodal, es realmente notable.

Poblacin
Exponencial

Distribucin muestral de medias


generada con muestras de
tamao.

Teorema central del lmite:


Otro enfoque de este teorema dice que si seleccionan muestras aleatorias de n
observaciones de una poblacin con media y desviacin estndar , entonces cuando
n es grande, la distribucin muestral de medias tendr aproximadamente una distribucin
normal con una media igual a y una desviacin estndar de

cada vez ms exacta a medida de que

. La aproximacin ser

sea cada vez ms grande.

Ejemplo:
Para la distribucin muestral de medias del ejercicio pasado, encuentre:
a) El error muestral de cada media.
b) La media de los errores muestrales.
c) La desviacin estndar de los errores muestrales.
Respuesta:
a) En la siguiente tabla se ven las muestras, las medias de las muestras y los errores
muestrales:
Muestra
(0,0)
(0,2)
(0,4)
(0,6)
(2,0)
(2,2)
(2,4)

x
0
1
2
3
1
2
3

Error muestral ( e x )
0 3 = -3
1 3 = -2
2 3 = -1
33= 0
1 3 = -2
2 3 = -1
33= 0

(2,6)
(4,0)
(4,2)
(4,4)
(4,6)
(6,0)
(6,2)
(6,4)
(6,6)

4
2
3
4
5
3
4
5
6

43= 1
2 3 = -1
33= 0
43= 1
53= 2
33= 0
43= 1
53= 2
63= 3

b) la media de los errores muestrales ( e ) es:


e

3 2 1 0 2 1 0 1 1 0 1 2 0 1 2 3 0
16

c) la desviacin estndar de la distribucin de los errores muestrales ( e ) es:


e

f e e 2
N

1 3 0 2 2 0 3 1 0 4 0 0 31 0 2 2 0 1 3 0
16
e 1,58

La desviacin estndar de la distribucin muestral de un estadstico se conoce como error


estndar del estadstico. En nuestro ejercicio anterior, el error estndar de la media ( X )
es 1,58. Con esto se demuestra que si de una poblacin se eligen muestras de tamao n
con reemplazo, entonces el error estndar de la media es igual a la desviacin estndar de
la distribucin de los errores muestrales.
X e

Por lo tanto,

Cuando las muestras se toman de una poblacin pequea y sin reemplazo, se puede usar
la siguiente frmula para encontrar X :
X

N n
N 1

donde

: es la desviacin estndar poblacional de donde se toman las muestras.


n : es el tamao de la muestra.
N: es el tamao de la poblacin.
N n
: factor de correccin para una poblacin finita que se aplica si n N es mayor que
N 1

0,05. De lo contrario se omite.


Ejemplos:

1. El despacho de abogados Gonzlez & Asociados tiene cinco socios. En su junta de socios
semanal cada uno informa el nmero de horas que cobraron a los clientes por sus servicios
la semana anterior.
Socios
1. Castro
2. Donoso
3. Figueroa
4. Gonzlez
5. Molina

Horas
22
26
30
26
22

a) Si se seleccionan al azar dos socios, cuntas muestras diferentes son posibles sin
reemplazo? Adems calcule las horas media de cobro para cada muestra.
b) Calcule la media de la distribucin muestral y comprela con la media poblacional.
c) Calcule el error estndar, o la desviacin estndar de la distribucin muestral y comprela
con la poblacional.
Respuesta:
a) Para determinar la distribucin de muestreo de las medias muestrales, se seleccionan
todas las muestras posibles de tamao 2 sin reemplazo en la poblacin, de la siguiente
manera:
N

Cn

N!
5! 10

n! N n ! 2! 3!

Las 10 medias de todas las muestras posibles de tamao 2 que pueden tomarse a partir de
la poblacin son:
Socios
1,2
1,3
1,4
1,5
2,3
2,4
2,5
3,4
3,5
4,5

Total
22+26 = 48
22+30 = 52
22+26 = 48
22+22 = 44
26+30 = 56
26+26 = 52
26+22 = 48
30+26 = 56
30+22 = 52
26+22 = 48

Media muestral
24
26
24
22
28
26
24
28
26
24

Distribucin de muestreo de las medias para n = 2


Media muestral
Frecuencia
Frecuencia relativa
22
1
1/10
24
4
4/10
26
3
3/10
28
2
2/10
b)

La media poblacional es:

22 26 30 26 22
25,2
5

La media de la distribucin muestral es:


Suma de todas las medias muestrales
Nmero total de medias muestrales
22 1 24 4 26 3 28 2 252
x

25,2
10
10

Fijmonos que X .
c)
La desviacin estndar poblacional es:

22 25,2 2 26 25,2 2 30 25,2 2 26 25,2 2 22 25,2 2


5

2,99

El error estndar o la desviacin estndar de la distribucin muestral es:


X

22 25,2 2 24 25,2 2 24 25,2 2 ...... 28 25,2 2


10

1,83

Si utilizamos la frmula del error estndar sin el factor de correccin tendramos que:
X

2,99

2,114
n
2

Por lo que observamos que este valor no es el verdadero. Pero agregando el factor de
correccin obtendremos el valor correcto

n
antes.
X

N n 2,99

N 1
2

5 2
5 1

1,83 que es exactamente lo mismo que habamos obtenido

El diagrama de flujo resume las decisiones que deben tomarse cuando se calcula el valor del
error estndar:

Inicio
Si
Es la poblacin
infinita?

No
Si

Se muestrea
con reemplazo?

No

Si

Es n/N>0,05?

N n
N 1

Distribucin muestral de media:


Como recordarn la distribucin normal es una distribucin continua, en forma de campana y
tanto la media, la mediana y la moda tienen un mismo valor y es simtrica.
Con esta distribucin podamos calcular la probabilidad de algn evento relacionado con la
variable aleatoria, mediante la siguiente frmula:
Z

En donde Z es una variable estandarizada con media igual a cero y desviacin estndar
igual a uno. Con esta frmula se pueden hacer los clculos de probabilidad para cualquier
ejercicio, usando la tabla de reas bajo la curva normal.
Sabemos que cuando se extraen muestras de tamao grande ( n 30 ) o bien de cualquier
tamao de una poblacin normal, la distribucin muestral de medias tiene un comportamiento
aproximadamente normal, por lo que se puede utilizar la frmula de la distribucin normal
estndar con X y X , entonces la frmula para calcular la probabilidad del
comportamiento del estadstico, en este caso la media de la muestra, quedara de la
siguiente forma:

y para poblaciones finitas y muestreo sin reemplazo:


Z

N n
N 1

Ejemplos:
1.
Una empresa fabrica pilas alcalinas tipo D que tienen una duracin que se distribuye
aproximadamente en forma normal, con media de 19 horas y desviacin estndar de 1,2
horas. Encuentre la probabilidad de que una muestra aleatoria de 9 pilas tenga una vida til
promedio de menos de 18 horas.
Respuesta:

18 19
2,5
1,2
9

0,0062

18
19
Este valor se busca en la tabla de reas bajo la curva normal
P x 18 P Z 2,5 0,0062
2. Las estaturas de 1000 estudiantes de Inacap estn distribuidas aproximadamente en
forma normal con una media de 1,745 metros y una desviacin estndar de 0,069 metros. Si
se extraen 200 muestras aleatorias de tamao 25 sin reemplazo de esta poblacin,
determine:
a)

El nmero de las medias muestrales que caen entre 1,725 y 1,758 metros.

b)

El nmero de medias muestrales que caen por debajo de 1,72 metros.

Respuesta:
En este ejercicio se cuenta con una poblacin finita y un muestreo sin reemplazo, por lo que
se tendr que agregar el factor de correccin.

a)

0,7607

N n
n N 1
1,725 1,745
1000 25
25 1000 1
1,758 1,745

0,069

0,069

1000 25
25 1000 1

1,47

0,96

P1,725 x 1,725
1,758 1,745
0,7607
1,758

Por lo tanto,

(0,7607)(200) = 152 medias muestrales

b)
Z

0,0336

x
N n
n N 1

1,72 1,745
1,83
1000 25
0,069
25 1000 1

P x 1,72 0,0336

Por lo tanto, (0,0336)(200) = 7 medias muestrales.


1,72
1,745

Distribucin muestral de proporciones:


Existen ocasiones en que no estamos interesados en la media de la muestra, sino que
queremos investigar la proporcin de artculos defectuosos o la proporcin reprobados en la
muestra. La distribucin muestral de proporciones es la adecuada para dar respuesta a estas
situaciones. Esta distribucin se genera de igual manera que la distribucin muestral de
medias, a excepcin de que al extraer las muestras de la poblacin se calcula el estadstico
proporcin en lugar del estadstico media. Es decir:

px
donde
p: estadstico proporcin
x: es el nmero de xitos en la muestra
n : es el nmero total muestreado

p1
Muestra 1

p2

Muestra 2
Muestra 3

p3

Muestra K

..
.

Poblacin

pK

Distribucin muestral de
Proporciones

Una poblacin binomial est estrechamente relacionada con la distribucin muestral de


proporciones, ya que una poblacin binomial es una coleccin de xitos y fracasos, mientras
que una distribucin muestral de proporciones contiene las posibilidades o proporciones de
todos los nmeros posibles de xitos en un experimento binomial, y como consecuencia de
esta relacin, las afirmaciones probabilsticas referentes a la proporcin muestral pueden
evaluarse usando la aproximacin normal a la binomial, siempre que n y n1 sean
ambos mayores que 5 (en la Unidad II hablbamos de como la probabilidad de xito, pero
en estos casos la denotaremos como P ya que hablamos de la proporcin de xito).
Cualquier evento se puede convertir en una proporcin si se divide el nmero obtenido entre
el nmero de intentos.
Generacin de la Distribucin muestral de Proporciones:
Supongamos que se cuenta con un lote de 12 termostatos, el cual tiene 4 unidades
defectuosas. Se van a seleccionar 5 termostatos al azar de ese lote sin reemplazo. Genere la
distribucin muestral de proporciones para el nmero de termostatos defectuosas.
Como se puede observar en este ejemplo, la proporcin de termostatos defectuosos de esta
poblacin es 5 9 . Por lo que podemos decir que el 33% de los termostatos de este lote
estn defectuosos.
El nmero posible de muestras de tamao 5 a extraer de una poblacin de 12 elementos es
12 C 5 792 , las cuales se pueden desglosar de la siguiente forma:
Termostatos
buenos

Termostatos malos

Proporcin de
termostatos
defectuosos
4/5 = 0,8

Nmero de manera
en las que se puede
obtener la muestra
8 C1 4 C 4 8

2
3
4
5

3
2
1
0

8 C 2 4 C3

112
8 C 3 4 C 2 336
8 C 4 4 C1 280
8 C 5 4 C 0 56
Total:
792

3/5 = 0,6
2/5 = 0,4
1/5 = 0,2
0/5 = 0

Para calcular la media de la distribucin muestral de proporciones tendramos que hacer la


sumatoria de la frecuencia por el valor de la proporcin muestral y dividirla entre el nmero
total de muestras. Es decir:
p

8 0,8 112 0,6 336 0,4 280 0,2 56 0 1


0,33
792
3

Por lo que podemos decir que la media de la distribucin muestral de proporciones es igual a
la proporcin de poblacin, o sea p P
Tambin podemos calcular la desviacin estndar de la distribucin muestral de
proporciones:
8 0,8 1 / 3 112 0,6 1 / 3 336 0,4 1 / 3 280 0,2 1 / 3 56 0 1 / 3
792
0,1681
2

p
p

La varianza de la distribucin binomial es 2 nP1 P , por lo que la varianza de la


P 1 P
2
distribucin muestral de proporciones es p
. Si sustituimos los valores en esta
n
frmula tendramos que:
p

P 1 P

1 / 3 2 / 3
5

0,2108 pero este valor no coincide con el de 0,1681, ya que nos

falta agregar el factor de correccin para una poblacin finita y un muestreo sin reemplazo:
p

1 / 3 2 / 3
5

12 5
0,1681
12 1

Por lo tanto,
p

P 1 P
n

N n
N 1

La frmula que se utilizar para el clculo de probabilidad en una distribucin muestral de


proporciones est basada en la aproximacin de la distribucin normal a la binomial. Esta
formula nos servir para calcular la probabilidad del comportamiento de la proporcin en la
muestra.
Z

pP

P 1 P
n

A esta frmula se le puede agregar el factor de correccin de

N n
si se cumple con las
N 1

condiciones necesarias.
Ejemplo:
Se ha determinado que el 60% de los alumnos de Inacap fuman cigarrillos. Se toma una
muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporcin de la
muestra de los alumnos que fuman cigarrillos sea menor que 0,55.
Respuesta:
Hay dos mtodos para resolver este ejercicio:
1 Utilizando la aproximacin de la distribucin normal a la binomial. (visto en la
Unidad II)
P: 0,60
x : 0,55 800 400 alumnos
n : 800
p x 440 ?

Media =

P = 800 (0,60) = 480


Z

x nP

nP1 P

p x 440 0,0017.

0,0017

439,5

480

439,5 480
2,92
4801 0,40

440-0,5=439,5

donde 0,5 es el factor de correccin por continuidad.

0,0017 significa que existe una probabilidad del 0,17% de que al extraer una muestra de 800
alumnos, menos de 440 fuman cigarrillos.
2 Usando la Distribucin Muestral de Proporciones
n = 800 alumnos
P = 0,60
p = 0,55
p p 0,55 ?

0,0017
Z

pP

P1 P
n

0,549375 0,60

0,60 0,40

2,92

800

0,55-(0,5/800) = 0,549375
0,549375 0,60
Como podemos darnos cuenta este valor es idntico al obtenido en el mtodo anterior, por lo
que si buscamos en la tabla de reas bajo la curva normal nos da la misma probabilidad de
0,0017. Tambin se debe tomar en cuenta que el factor de correccin de 0,5 se est
dividiendo entre el tamao de la muestra, ya que estamos hablando de una proporcin.
Por lo tanto, al interpretacin en esta solucin, estara enfocada a la proporcin de la
muestra, por lo que diramos que la probabilidad de que al extraer una muestra de 800
alumnos de Inacap, la proporcin de alumnos que fuman cigarrillos sea menor al 55% es
0,17%.

Distribucin muestral de diferencia de medias :


Suponga que se tienen dos poblaciones distintas, la primera con media 1 y desviacin
estndar 1 , y la segunda con media 2 y desviacin estndar 2 . Ms an, se elige una
muestra aleatoria de tamao n1 de la primera poblacin y una muestra independiente
aleatoria de tamao n 2 de la segunda poblacin. Luego se calcula la media muestral para
cada muestra y la diferencia entre dichas medias. El conjunto de todas esas diferencias se
llama distribucin muestral de las diferencias entre medias o la distribucin muestral
del estadstico x1 x 2 .

x11

x12

Muestra 1
Muestra 2

x11 x 21
x12 x 22

Muestra 3
Muestra K

x 21

x13

x13 x 23
x1K x 2 K

x1K
Poblacin 1

x 22

Muestra 1
Muestra 2
Muestra 3
MuestraK

x 23
x2K

Distribucin muestral de
diferencia de medias

Poblacin 2

La distribucin es aproximadamente normal para n1 30 y n 2 30 . Si las poblaciones son


normales, entonces la distribucin muestral de medias es normal sin importar los tamaos de
las muestras.
En ejemplos anteriores se haba demostrado que X y que X

, por lo que no es

12 22

.
n1 n 2
La formula que utilizaremos para el clculo de probabilidad del estadstico de diferencia de
medias es:
difcil deducir que X 1 X 2 1 2 y que X 1 X 2

x1 x 2 1 2
12 22

n1 n 2

Ejemplo:
Uno de los principales fabricantes de televisores compra los tubos de rayos catdicos a dos
compaas. Los tubos de la compaa A tienen una vida media de 7,2 aos con una
desviacin estndar de 0,8 aos, mientras que los de la compaa B tienen una vida media
de 6,7 aos con una desviacin estndar de 0,7 aos. Determine la probabilidad de que una
muestra aleatoria de 34 tubos de la compaa A tenga una vida promedio de al menos un ao
ms que la de una muestra aleatoria de 40 tubos de la compaa B.
Respuesta:

A 7,2 aos
B 6,7 aos
A 0,8 aos

B 0,7 aos
n A 34 tubos
n B 40 tubos
p( x A x B >1) = ?

x A xB A B
A2 B2

n A nB

1 7,2 6,7

0,8 2 0,7 2
34

2,84

40

0,0023

A B 0,5 x A x B 1

Distribucin muestral de diferencia de proporciones :


Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse
utilizando proporciones o porcentajes.
Ejemplos:

Educacin: Es mayor la proporcin de los estudiantes que aprueban matemticas


que la de los que aprueban ingls?
Medicina: Es menor el porcentaje de los usuarios del medicamento A que presentan
una reaccin alrgica que el de los usuarios del frmaco B que tambin presentan una
reaccin del mismo tipo?
Administracin: Hay diferencia entre los porcentajes de hombres y mujeres en
posiciones gerenciales?
Ingeniera: Existe diferencia entre la proporcin de artculos defectuosos que genera
la mquina A a los que genera la mquina B?

Cuando el muestreo procede de dos poblaciones binomiales y


proporciones muestrales, la distribucin muestral de diferencia
aproximadamente
normal
para
tamaos
de
n1 p1 5, n1 1 p1 5, n 2 p 2 5, n2 1 p 2 5 . Entonces p1 y p 2
muestrales aproximadamente normales, as que su diferencia p1
distribucin muestral aproximadamente normal .

se trabaja con dos


de proporciones es
muestra
grande
tienen distribuciones
p 2 tambin tiene una

p 21

p11
p12

Muestra 1

p11 p 21

Muestra 2

p 22

p12 p 22

Muestra 3

p 23

p1K p 2 K

p1K
Poblacin 1

Muestra 2
Muestra 3

p13 p 23

p13

Muestra K

Muestra 1

MuestraK

p2K
Distribucin muestral de
diferencia de proporciones

Poblacin 2

Cuando estudiamos a la distribucin muestral de proporciones se comprob que P p y


que p

p1 p 2

P 1 P
, por lo que no es difcil deducir que p1 p 2 P1 P2
n

y que

P1 1 P1 P2 1 P2

.
n1
n2

La frmula que utilizaremos para el clculo de probabilidad del estadstico de diferencia de


proporciones es:

p1 p 2 P1 P2
P1 1 P1 P2 1 P2
n1

n2

Ejemplo:
Los hombres y mujeres adultos radicados en Iquique difieren en sus opiniones sobre la
promulgacin de la pena de muerte para personas culpables de asesinato. Se cree que el
15% de los hombres adultos estn a favor de la pena de muerte, mientras que solo el 12%
de las mujeres adultas lo estn. Si se pregunta a dos muestras aleatorias de 100 hombres y
100 mujeres su opinin sobre la promulgacin de la pena de muerte, determine la
probabilidad de que el porcentaje de hombres a favor sea al menos 4% mayor que el de las
mujeres
Respuesta:
PH 0,15
PM 0,12

n H 100

n M 100

p p H p M 0,04 ?
Recordemos que debemos incluir el factor de correccin de 0,5 por ser una distribucin
binomial y se est utilizando la distribucin normal

p H p M PH PM
PH 1 PH PM 1 PM
nH

0,035 0,15 0,12

0,15 0,85 0,12 0,88

nM

100

0,10

100

0,4602

PH PM 0,03 0,035

0,04 (0,5/100) = 0,035


Por lo tanto, se concluye que la probabilidad de que el porcentaje de hombres a favor de la
pena de muerte, al menos 4% mayor que el de mujeres es de 0,4602.

Teora de Pequeas Muestras o Teora exacta del Muestreo :


Anteriormente manejamos el uso de la distribucin normal estndar (Z), la cual se poda
utilizar siempre y cuando los tamaos de las muestras fueran mayores o iguales a 30 en
muestras ms pequeas si la distribucin o las distribuciones de donde proviene la muestra o
las muestras son normales.
Ahora utilizaremos muestras pequeas siempre y cuando la distribucin de donde proviene la
muestra tenga un comportamiento normal. Esta es una condicin para utilizar las
distribuciones que veremos a continuacin.
A la teora de pequeas muestras tambin se le llama teora exacta del muestreo, ya que
tambin la podemos utilizar con muestras aleatorias de tamao grande.

Ahora se ver un nuevo concepto necesario para poder utilizar las distribuciones que
veremos. Este concepto es grados de libertad.
Para definir grados de libertad haremos referencia a la varianza muestral:
s2

x x 2
n 1

Fjense que esta frmula est basada en n-1 grados de libertad. Esta terminologa resulta
del hecho de que si bien s 2 est basada en n cantidades x1 x , x 2 x ,......, x n x , stas
suman cero, as que especificar los valores de cualquier n 1 de las cantidades determina el
valor restante.
Por ejemplo, si n = 4 y x1 x 8; x 2 x 6 y x 4 x 4 , entonces automticamente
obtenemos x 3 x 2 , as que slo tres de los cuatro valores de x x est libremente
determinados. Es decir, n 1 4 1 3 por lo tanto hay 3 grados de libertad.
Entonces, aqu la frmula de grados de libertad ser n 1 y su simbologa es (se lee nu).

Distribucin t de Student:
Supongamos que se toma una muestra de una poblacin con media y varianza 2 . Si x
es el promedio de las n observaciones que contiene la muestra aleatoria, entonces la
x
Z
distribucin
es una distribucin normal estndar. Supongamos que la varianza de

n
2
la poblacin es desconocida. Qu sucede con la distribucin de esta estadstica si se
reemplaza por s ? La distribucin t proporciona la respuesta a esta pregunta.
La media y la varianza de la distribucin t son 0

2 2

para 2 ,

respectivamente.
El siguiente diagrama nos presenta dos distribuciones t. La apariencia general de la
distribucin t es similar a la de la distribucin normal estndar, ya que ambas son simtricas y
unimodales, y el valor mximo de la ordenada se alcanza en la media 0 . Sin embargo, la
distribucin t tiene colas ms amplias que la normal, es decir, la probabilidad de las colas es
mayor que en la distribucin normal. A medida que el nmero de grados de libertad tiende a
infinito, la forma del lmite de la distribucin t es la distribucin normal estndar.

Distribucin Z

15 Distribucin
t

Propiedades de las distribuciones t:


1.
2.
3.
4.

Cada curva t tiene forma de campana con centro en 0.


Cada curva t est ms dispersa que la curva normal estndar Z.
A medida que aumenta, la dispersin de la curva t correspondiente disminuye.
A medida que , la secuencia de curvas t se aproxima a la curva normal
estndar, por lo que la curva z recibe a veces el nombre de curva t con gl
Sean x1 , x 2 ,......., x n variables aleatorias independientes que son todas normales con media
x
y desviacin estndar . Entonces la variable t s
tiene una distribucin t con
n
n 1 grados de libertad.
La distribucin t difiere de la de la Z en que la varianza de t depende del tamao de la
muestra y siempre es mayor a uno. nicamente cuando el tamao de la muestra tiende a
infinito las dos distribuciones sern las mismas.
Se acostumbra representar con t el valor t por arriba del cual se encuentra un rea igual a
. Como la distribucin t es simtrica alrededor de una media de cero, tenemos t1 t ,
es decir, el valor t que deja un rea de 1 a la derecha y por tanto un rea de a la
izquierda, es igual al valor t negativo que deja un rea de en la cola derecha de la
distribucin. Esto es, t 0,95 t 0,5 ; t 0,99 t 0,01 , etc.
Para encontrar los valores de t utilizaremos la tabla de valores crticos de la distribucin t de
cualquier libro de Estadstica.
Ejemplo:
1.
El valor t con 14 grados de libertad que deja un rea de 0,025 a la izquierda, y por
lo tanto un rea de 0,975 a la derecha, es t 0,975 t 0, 025 2,145

0,025

t 0,975 t 0,0025 2,145

Si observan la tabla, el rea sombreada de la curva es de la cola derecha, es por esto que se
tiene que hacer la resta de 1 . La manera de encontrar el valor t es buscar el valor de
en la primera fila de la tabla y luego buscar los grados de libertad en la primera columna y
donde se intercepten y ( gl.) se obtendr el valor de t.

rea
de una cola

t gl ,
0
Porcin de la tabla de distribucin t
gl
Cantidad de en una cola

..
0,025
..
:
:
:
14
2,145

2.

Encuentre la probabilidad de t 0,025 t t 0,05 .

Respuesta:
Como t 0,05 deja un rea de 0,05 a la derecha, y t 0, 025 deja un rea de 0,025 a la
izquierda, encontramos un rea total de 1 0,05 0,025 0,925

0,025

Por lo tanto,

0,05

P t 0, 025 t t 0,05 0,925 .

3.
Suponga que de una poblacin normal con una media de 14 se toma una muestra de
tamao 11. Si la media muestral es 18 y la desviacin estndar muestral 14,3, calcule el valor
del estadstico t.
Respuesta:
El valor t es:

Distribucin ji-cuadrada

x 18 14

0,93
s
14,3
n
11

X :
2

En realidad la distribucin ji-cuadrada es la distribucin muestral de s 2 . O sea que si se


extraen todas las muestras posibles de una poblacin normal y a cada muestra se le calcula
su varianza, se obtendr la distribucin muestral de varianzas.
Para estimar la varianza poblacional o la desviacin estndar, se necesita conocer el
estadstico X 2 . Si se elige una muestra de tamao n de una poblacin normal con varianza
2 , el estadstico:

n 1 s 2
2

tiene una distribucin muestral que es una distribucin ji-cuadrada con gl n 1 grados de
libertad y se denota X 2 ( X es la minscula de la letra griega ji). El estadstico ji-cuadrada
esta dado por:
X2

n 1 s 2
2

donde

n:

es el tamao de la muestra
s : es la varianza muestral
2 : es la varianza de la poblacin de donde se extrajo la muestra.
2

El estadstico ji-cuadrada tambin se puede dar con la siguiente expresin:


X

x x 2

Propiedades de las distribuciones ji-cuadrada:


1. Los valores de X 2 son mayores o iguales que 0.
2. La forma de la distribucin X 2 depende del gl n 1 . En consecuencia, hay un
nmero infinito de distribuciones X 2 .
3. El rea bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones X 2 no son simtricas. Tienen colas estrechas que se extienden a
la derecha, esto es, estn sesgadas a la derecha.
5. Cuando n 2 , la media de una distribucin X 2 es n 1 y la varianza es 2 n 1 .
6. La moda de una distribucin X 2 se da en el valor n 3 .

gl 3
gl 5

gl 10

X2

Ntese que la moda aparece en el valor n 3 gl 2 .


La tabla que ocuparemos contiene los valores de X 2 gl , que corresponden a un rea
especfica de la extremidad de la derecha y a un nmero determinado de de grados de
libertad. Recuerde que en la mayora de los libros de estadstica se encuentra la tabla de
valores crticos de ji cuadrada.
Por ejemplo para encontrar X 2 6, 0,05 en la tabla se localiza 6 gl en el lado izquierdo y
0,05 a lo largo del lado superior de la misma tabla.
0,05

gl 6

12,592

0,05

X2

El clculo de probabilidad en una distribucin muestral de varianzas nos sirve para saber
como se va a comportar la varianza o desviacin estndar en una muestra que proviene de
una distribucin normal.
Ejemplo:
Supongamos que los tiempos requeridos por una cierta micro para alcanzar uno de sus
destinos en Santiago forman una distribucin normal con una desviacin estndar 1
minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la
varianza muestral sea mayor que 2.

Respuesta:
Primero encontraremos el valor de ji- cuadrada correspondiente a s 2 2 de la siguiente
manera:
X2

n 1 s 2

17 1 2
32
1 2

El valor de 32 se busca adentro de la tabla en la fila de 16 grados de libertad y se encuentra


que a este valor le corresponde un rea a la derecha de 0,01. Por lo tanto, el valor de la
probabilidad es P s 2 2 0,01

0,01

X 2 =32

Distribucin F de Fisher:
La necesidad de disponer de mtodos estadsticos para comparar las varianzas de dos
poblaciones es evidente a partir del anlisis de una sola poblacin. Frecuentemente se desea
comparar la precisin de un instrumento de medicin con la de otro, la estabilidad de un
proceso de manufactura con la de otro o hasta la forma en que vara el procedimiento para
calificar de un profesor universitario de otro.
Intuitivamente, podramos comparar las varianzas de dos poblaciones, 12 y 22 , utilizando la
razn de de las varianzas muestrales

s12

s 22

. Pero si

s12

s 22

es casi igual a 1, se tendr poca

evidencia para indicar que 12 y 22 no son iguales. Por otra parte, un valor muy grande o
muy pequeo para

s12

s 22

, proporcionar evidencia de una diferencia en las varianzas de las

poblaciones.
La variable aleatoria F se define como el cuociente de dos variables aleatorias ji, cuadrada
independientes, cada una dividida entre sus respectivos grados de libertad. Esto es:

U
F

1
2

Donde U y V son variables aleatorias Ji-cuadrada independientes con grados de libertad 1


y2.
La variable aleatoria F no puede ser negativa, y la distribucin tiene un sesgo a la derecha
(positivo). La distribucin F tiene una apariencia muy parecida a la distribucin ji- cuadrada,
sin embargo, se encuentra centrada respecto a 1, y los dos parmetros 1 y v 2 (o gl1 y
gl 2 ) proporcionan una flexibilidad adicional con respecto a la forma de la distribucin.
Si s12 y s 22 son las varianzas muestrales independientes de tamao n1 y n 2 tomadas de
poblaciones normales con varianzas 12 y 22 , respectivamente, entonces:

s12
F

s 22

12

22

s
F 1
s2

s12 12
s 22 22

2

1

Tambin se puede trabajar con tablas de Distribucin F que aparecen en los libros de
Estadstica.
Como podemos imaginar existen varias curvas Fisher, ya que ahora su forma depende de
dos variables que son los grados de libertad ( gl )
Ejemplos:
1. Encontrar el valor de F, en cada uno de los casos:
a) El rea a la derecha de F, es de 0,10 con 1 4 y 2 9
b) El rea a la izquierda de F, es de 0,95 con 1 15 y 2 10
Respuesta:
a) Como el rea de la tabla es de cero a F, se tiene que localizar primero el rea F0,90 , es
decir, 0,10 y luego la interseccin de los grados de libertad del denominador ( gl 2 9 )
con los grados de libertad del numerador ( gl1 4 ), lo que nos da un valor de F = 2,69
0,10

F=2,69

b) En este caso, tenemos que localizar primero el rea F0,95 , es decir, 0,05 y luego la
interseccin de los grados de libertad del denominador ( gl 2 10 ) con los grados de libertad
del numerador ( gl1 15 ), lo que nos da un valor de F = 2,85

0,05

F=2,85

2. En una prueba sobre la efectividad de dos tipos distintos de pldoras para dormir, A y B, se
utilizarn dos grupos independientes de personas con insomnio. A un grupo de tamao 41 se
le administrar la pldora A y al otro grupo, de tamao 121, se le administrar la B,
registrndose el nmero de horas de sueo de cada individuo participante en el estudio. Si
se supone que el nmero de horas de sueo de quienes usan cada tipo de pldora se
distribuye normalmente y que A2 B2 . Calcule el valor estadstico F y determine gl A y gl B
si

s 2A

9 y

s B2

s A2

6 y encuentre P
2 1,5 .
sB

Respuesta:
El valor estadstico F es:
s
F A
sB

9
B

= 1 1,50
6
A

luego establecemos los grados de libertad. Como en el numerador est la poblacin A y en el


denominador est la poblacin B, entonces los grados de libertad A equivalen a 41 1 40 y
los grados de libertad B a 121 1 120 .
Luego vamos a la tabla de distribucin F a buscar la interseccin de los grados de libertad de
A y B donde aparezca 1,50, lo que da por resultado:

s A2

P
2 1,5 0,95
sB

P=0,95

0,05

F=1,5