Muestreo Aleatorio Simple

Captulo 1
Muestreo Aleatorio Simple

Este metodo de muestreo proporciona un punto de partida para una exposici
on de los metodos de muestreo probabilstico no porque sea uno de los
metodos de muestreo m
as utilizados sino porque constituyen la base de metodos de muestreo m
as complejos. Dependiendo si el muestreo es con reposicion
o sin reposici
on, podemos hablar de muestreo aleatorio simple con reposicion o
sin reposici
on respectivamente.
De manera formal, este dise
no basico o tecnica de muestreo se define de la
siguiente manera
Definici
on 1.1 Si se selecciona un tama
no de muestra n de una poblaci
on de
tama
no N de tal manera que cada muestra posible de tama
no n tenga la misma probabilidad de ser seleccionada, el procedimiento de muestreo se denomina
muestreo aleatorio simple. A la muestra as obtenida se le denomina muestra
aleatoria simple.
Considerando muestreo aleatorio sin reposicion, se obtiene la muestra unidad a unidad de forma aleatoria sin reposicion a la poblacion de las unidades
previamente seleccionadas, teniendo presente ademas que el orden de colocacion
de los elementos en las muestras no interviene, es decir, muestras con los mismos
elementos colocados en orden distinto se consideran iguales. De esta forma, las
muestras con elementos repetidos son imposibles. Bajo muestreo aleatorio con
reposici
on, las unidades seleccionadas son devueltas de nuevo a la poblacion.
Expondremos una manera de seleccionar una muestra aleatoria simple utilizando un ejemplo concreto. Se pretende realizar un estudio sobre los habitos
de lectura en los estudiantes de Politecnica. Las alumnos que actualmente estudian en Politecnica son un total de 544 alumnos y se quiere extraer una muestra
aleatoria simple de 65 alumnos. Una manera de extraer una muestra aleatoria
simple consiste en asignar a cada alumnos un n
umero del 1 al 544 asociando
cada n
umero a un u
nico individuo. Una vez realizado esa asignacion, se introducen 544 bolas numeradas en una urna (cada una con un n
umero del 1 al 544),
se mezclan cuidadosamente y de manera adecuada y entonces se seleccionan 65
bolas al azar. Si todo el proceso se realiza de manera adecuada, las bolas seleccionadas constituiran una muestra aleatoria simple de 65 estudiantes. Aunque
es conceptualmente simple, este metodo es un poco trabajoso de ejecutar y depende de que las bolas se hayan mezclado de manera adecuada y que todas las
bolas tengan el mismo peso y rozamiento.
Otra manera de seleccionar esta muestra aleatoria simple consistira en utilizar una tabla de n
umeros aleatorios. Una tabla de n
umeros aleatorios es un
conjunto de dgitos generado de modo que, normalmente, la tabla contendra a
cada uno de los diez dgitos (0, 1, . . . , 9), en proporciones aproximadamente iguales, sin mostrar tendencias en el patron que se generan los dgitos. Por lo tanto, si
se selecciona un n
umero en un lugar aleatorio de la tabla, es igualmente probable
que sea cualquiera de los dgitos entre el 0 y el 9. Estas tablas se construyen para
asegurar que cada dgito, cada par de dgitos, cada tres dgitos, ... aparecen con
la misma frecuencia. En el caso de extraer una muestra aleatoria simple, se elige
un lugar para empezar a leer dichos n
umeros aleatorios. Despues se selecciona
una direcci
on (arriba, abajo, derecha e izquierda) y se van recogiendo dgitos
de dos en dos hasta que se consiga el tama
no muestral adecuado. Utilizando
este metodo, un elemento puede aparecer mas de una vez. Si queremos extraer
una muestra aleatoria simple sin reposicion, la solucion es ignorar los elementos
repetidos.
Las ventajas que tiene este procedimiento de muestreo son las siguientes:
Sencillo y de f
acil comprension.
C
alculo r
apido de medias y varianzas.
Existen paquetes informaticos para analizar los datos
Por otra parte, las desventajas de este procedimiento de muestreo son:
Requiere que se posea de antemano un listado completo de toda la poblaci
on.
Si trabajamos con muestras peque
nas, es posible que no representen a la
poblaci
on adecuadamente.
A continuaci
on pasamos a describir este procedimiento de muestreo considerando muestreo sin reposicion.
1.1.
Dise
no muestral
Vamos a analizar el dise

no de este procedimiento de muestreo. Supongamos
en todo momento que el tama
no de la poblacion es N y el tama
no de la muestra
es n.
1.1.1.
Probabilidad de una muestra cualquiera
Dada la forma de definirse el procedimiento de seleccion de la muestra, el

conjunto formado por todas las muestras S tiene un total de

N
CN,n =
,
n
muestras posibles, ya que estamos considerando muestras no ordenadas. Luego
si todas las muestras son equiprobables, la probabilidad de cada muestra viene
dada por
1
P (s) = , s S
N
n
1.1.2.
Probabilidad de primera inclusi

on
Calculemos la probabilidad que tiene cualquier unidad de la poblacion de

pertenecer a la muestra, o lo que es lo mismo, calcularemos i for i = 1, 2, . . . , N .
Por ello, consideramos el n
umero de muestras posibles que se pueden formar con
los elementos de la poblaci
on y que contengan al elemento ui . En este caso, el
total de muestras que contienen a dicho elemento viene dado por

N 1
,
CN 1,n1 =
n1
ya que en este caso se fija el elemento ui y las muestras posibles resultan de
las formas posibles de seleccionar de entre los N 1 elementos de la poblacion
restantes n1 de ellos para la muestra (el elemento ui ya pertenece a la muestra).
Para i = 1, 2, . . . , N , se tiene que
i
= P (ui s) =

=
1.1.3.
Total de muestras que contienen a ui

=
Total de muestras

N 1
n
n1
=
N
N
n
Probabilidad de segunda inclusi

on
Vamos a calcular la probabilidad que tiene cualquier par de unidades de la

poblaci
on de pertenecer a una muestra determinada. Para ello, notemos que
el n
umero de muestras posibles que pueden formarse con los elementos de la
poblaci
on y que contengan al par (ui , uj ) con ui 6= uj es igual a

N 2
CN 2,n2 =
,
n2
ya que en este caso se fija el par de elementos (ui , uj ) y las muestras posibles
resultan de las formas posibles de seleccionar de entre los N -2 elementos de la
poblaci
on restantes n2 de ellos para la muestra (los elementos ui y uj ya estan
fijos en la muestra). Tenemos entonces que
ij
1.2.
Casos favorables
Casos posibles
Total de muestras que contienen a (ui , uj )
n(n 1)
=
Total de muestras
N (N 1)
= P ((ui , uj ) s) =
Estimadores lineales insesgados en muestreo aleatorio simple
Tal y como se
nal
abamos en el captulo anterior, si el parametro poblacional
tiene una expresi
on lineal del tipo
=
N
X
Yi ,
i=1
entonces el estimador de Horvitz-Thompson para dicho parametro poblacional

viene dado por
n
X
Yi
,
bHT =
i=1 i
de modo que E[bHT ] = siendo i la probabilidad de que la unidad ui pertenezca a una muestra determinada o probabilidad de primera inclusion. Partimos
como es usual de una poblacion formada por N elementos
= {u1 , u2 , u3 , . . . , uN },
en los que se estudiar una variable de interes X que toma los valores
X() = {X1 , X2 , X3 , . . . , XN },
sobre cada elemento de la poblacion. Para ello, se selecciona una muestra de
tama
no n dada por
s = {u1 , u2 , u3 , . . . , un },
en los que la variable X toma los valores
X(s) = {X1 , X2 , X3 , . . . , Xn },
sobre cada uno de los elementos de la muestra.
Como en muestreo aleatorio simple sin reposicion la probabilidad de primera
inclusi
on i viene dado por i = n/N , ya podemos especificar los estimadores
lineales insesgados para los parametros poblacionales mas comunes a estimar.
Tendremos que
Total
=X=
N
X
b=
Xi = Yi = Xi = X
i=1
n
X
Xi
i=1
n
n
X
NX
Xi
b
=
Xi = N X
n/N
n i=1
i=1
Media
=
=X
N
X
b =
Xi /N = Yi = Xi /N = X
i=1
n
X
Xi
N
n/N
i=1
Total de clase
=A=
N
X
b=
Ai = Yi = Ai = A
i=1
n
n
X
1X
Ai
=N
Ai
n/N
n i=1
i=1
Proporci
on
=P =
N
X
Ai /N = Yi = Ai /N = Pb =
i=1
n
X
Ai /N
i=1
n/N
1X
Ai
n i=1
Evidentemente cualquier de estos estimadores nos indican muy poco acerca del
par
ametro poblacional a estimar a menos que sea posible evaluar la bondad
del estimador. Por lo tanto, ademas de estimar los parametros poblacionales, se
deseara fijar un lmite sobre el error de estimacion. Mediante ciertos calculos,
es posible calcular la varianza del estimador de Horvitz-Thompson para cada
uno de los estimadores. Las varianzas de los estimadores anteriores nos van a
proporcionar los errores est
andar de estimacion y vienen dado por:
b
V ar(X)
= N 2 (1 f )
b
V ar(X)
V ar(Pb)
b
V ar(A)
S2
n
S2
n
N 1
(1 f )P Q
N 1n
N3 1
(1 f )P Q
N 1n
(1 f )
Vamos a analizar las varianzas de los estimadores. En el caso del estimador

del total y de la media poblacional dependen de S 2 que es la cuasi-varianza
poblacional. Esta cuasi-varianza poblacional S 2 tiene la siguiente expresion
N
1 X
2,
(Xi X)
S =
N 1 i=1
2
6
representa la media poblacional. Esta cuasi-varianza poblacional puede
donde X
expresarse tambien de la siguiente manera.
"N
#
X
1
2 2Xi X
S2 =
(X 2 + (X))
N 1 i=1 i
"N
#
X
1
2
2
2
2(X)
N
=
X + N (X)
N 1 i=1 i
"N
#
X
1
2
2
=
X N (X) .
N 1 i=1 i
En el caso de la proporci
on y el total de clase, la varianza de dichos estimadores
dependen de P y de Q. El parametro P corresponde a la proporcion de clase
dentro de la poblaci
on, es decir,
N
P =
1X
Ai ,
N i=1
y Q = 1 P . Al par
ametro f se le denomina fracci
on de muestreo y viene dado
por
f = n/N,
y representa la fracci
on de la poblacion N contenida en la muestra o la relacion
existente entre el tama
no de la muestra y el tama
no de la poblacion. Siempre
n N ; si n = N entonces f = 1 y 1 f = 0. Por otra parte, si n << N ,
entonces n/N
= 0 y por lo tanto 1 f 1 y las varianzas de los estimadores
ser
an mayores. A la diferencia 1 f se le denomina factor de correcci
on de
poblaci
on finita y tiene en cuenta el hecho de que una estimacion basada en una
muestra de tama
no n = 10 de una poblacion de N = 20 elementos, contiene mas
informaci
on acerca de la poblacion que una muestra de n = 10 de una poblacion
de N = 20000 elementos.
Ejemplo 1 Consideramos una poblaci
on de 4 elementos dada por
= {u1 , u2 , u3 , u4 },
sobre los que medimos una variable X obteniendo como resultados {8, 3, 4, 6} en
cada uno de los elementos de la poblaci
on. Mediante muestreo aleatorio simple
sin reposici
on, se extraen muestras de tama
no 2. Se pide:
N
umero de elementos del espacio muestral.
Especificar dicho espacio muestral y determinar las probabilidades asociadas a las muestras.
Hallar las distribuciones en el muestreo de los estimadores de la media
y del total de X as como la varianza de los estimadores. Calcular la
cuasivarianza de cada muestra.
Comprobar la insesgadez de los estimadores y que se cumple

2
b = (1 f ) S ,
V ar(X)
n
b = N 2 (1 f ) S ,
V ar(X)
n
y adem
as
E[Sb2 ] = S 2 .
Como vemos, la varianza de estos estimadores depende de una serie de
par
ametros poblaciones por lo que, en la mayora de los casos practicos, estos datos no estar
an disponibles. En el caso en el que no dispongamos de estos
valores poblacionales, utilizaremos estimaciones para estas varianzas. Las estimaciones son las siguientes:
b
Vb (X)
= N 2 (1 f )
Sb2
n
Sb2
n
1 bb
b
b
V (P ) = (1 f )
PQ
n1
b = N 2 (1 f ) 1 PbQ
b
Vb (A)
n1
b
Vb (X)
(1 f )
donde la cantidad Sb2 representa la cuasi-varianza muestral y que viene dada

por
n
1 X
b 2 ,
Sb2 =
(Xi X)
(1.1)
n 1 i=1
siendo
X
b = 1
Xi ,
X
n i=1
and Pb representa la probabilidad muestral, o lo que es lo mismo,
n
1X
Pb =
Ai ,
n i=1
b = 1 Pb.
luego Q
Notar que Sb2 dada en (1.1) puede expresarse como
Sb2
n
1 X
b 2
(Xi X)
n 1 i=1
1
n1
n
X
i=1
Xi2
b 2
nX
!
.
Ejemplo 2 Una empresa industrial est

a interesada en el tiempo por semana
que los cientficos emplean para ciertas tareas triviales. Las hojas de control del
tiempo de una muestra aleatoria simple de n = 50 empleados muestran que la
cantidad promedio de tiempo empleado en esas tareas es de 10.31 horas, con una
cuasi-varianza muestral S 2 = 2,25. La compa
na emplea N = 750 cientficos.
Estimar el n
umero total de horas por trabajador que se pierden por semana en
tareas triviales y establecer el error de estimaci
on asociada a dicha estimaci
on.
Soluci
on. La poblaci
on se compone de N = 750 empleados, de los cuales
se selecciona una muestra aleatoria de n = 50 hojas de control del tiempo. La
cantidad promedio de tiempo que se pierde por los 50 empleados fue de 10,31
horas por semana. Luego la estimaci
on del total de horas de trabajador que se
pierden por semanas en tareas triviales X viene dada por
b = 750(10,31) = 7732,5 horas.
b = NX
X
El error asociado a dicha estimaci
on viene dada por
r
q
b = (750)2 2,25 750 50 = 153,7 horas.
(Vb (X))
50
750
Ejemplo 3 Se seleccion
o una muestra aleatoria simple de n = 100 estudiantes
de u
ltimo a
no de un IES con N = 300 estudiantes para estimar
la fracci
on de estudiantes que han tenido trabajos a tiempo parcial durante
su estancia en el instituto,
la fracci
on de estudiantes del u
ltimo a
no que asistir
an a la universidad.
Sean Xi e Yi (i = 1, 2, . . . , 100) las respuestas del i-esimo estudiante seleccionado. Se establecer
a que Xi = 0 si el i-esimo estudiante no ha tenido un trabajo
a tiempo parcial durante su estancia en el colegio y Xi = 1 si lo ha tenido. Por
otra parte, Yi = 0 si el i-esimo estudiante no piensa ir a la universidad y si
Yi = 1 si si piensa ir. Estimar P2 la proporci
on de estudiantes de u
ltimo a
no
que piensa asistir a la universidad y P1 la proporci
on de estudiantes de u
ltimo
a
no que ha tenido un trabajo a tiempo parcial considerando que
100
X
i=1
Xi = 15,
100
X
Yi = 65,
i=1
y determina adem
as sus errores de muestreo
Ejemplo 4 Una gran empresa constructora tiene 120 casas en diversas etapas
de construcci
on. Para estimar la cantidad total (en miles de euros) que ser
a registrada en el inventario de la construcci
on en proceso, se seleccion
o una muestra
aleatoria simple de 12 casas y se determinaron los costes acumulados en cada
una de ellas. Los costos obtenidos para las 12 casas fueron los siguientes:
35,5, 30,2, 28,9, 36,4, 29,8, 34,1, 32,6, 26,4, 38, 38,2, 32,2, 27,5.
Estimar los costes totales acumulados para las 120 casas y dar una estimaci
on del error de muestreo. Dar un intervalo de confianza al 95 % para
el coste total.
Estimar la proporci
on de casas cuyos costes de construcci
on superan los
32.000 euros. Dar una estimaci
on del error.
Para estimar los costes totales acumulados para las 120 casas tenemos en
cuenta que el estimador lineal insesgado del total de una caracterstica X sobre
una poblaci
on viene dado por:
b
b = N X,
X
en este caso se tiene que N = 120 y la media muestral ser
a
12
X
b = 1
X
Xi = 32,4833,
12 i=1
y por lo tanto
b = 12032,4833 = 3897,996
b = NX
X
= 3898,
es decir, el coste total acumulado estimado para las 120 casas ser
a de 3898 miles
de euros.
Vamos a dar una estimaci
on de la varianza de dicho estimador. Utilizando
las f
ormulas anteriores, se tiene que:
b2
b = N 2 (1 f ) S .
Vb (X)
n
Calculamos la cuasivarianza muestral de los costes acumulados
P12
12
b 2
X 2 n(X)
1 X
12839,36 1232,48332
2
2
b
b
(Xi X) = i=1 i
S =
=
= 160 1233,
11 i=1
n1
11
entonces
b = 17410,
Vb (X)
y la correspondiente estimaci
on para el error de muestreo ser
a
b = 1310 958948
(X)
El intervalo de confianza al 95 % viene dado por
b z1/2
b + z1/2
(X
bXb , X
bXb ) = (36390 4, 41560 6).
De la muestra formada por 12 casas, u
nicamente los costes de construcci
on
de 7 casas sobrepasan los 32000 euros, por lo tanto, la estimaci
on de la proporci
on de casas que superan los 32000 euros es de
n
7
1X
Ai =
= 00 5833,
Pb =
n i=1
12
10
o lo que es lo mismo el 58,33 % de las casas sobrepasan los 32000 euros. Una
estimaci
on de la varianza del estimador Pb viene dado por
Vb (Pb) = (1 f )
1 bb
P Q = 00 0199
n1
de manera que el error asociado para dicha varianza es de

eb(Pb) = 00 1411.
1.3.
Tama
no de muestra fijado el error de estimaci
on
Una cuesti
on muy importante en muestreo consiste en conocer el tama
no de
muestra adecuado para cometer un determinado error de muestreo. En alguna
etapa del dise
no del procedimiento de muestreo, alguien debe tomar una decision
acerca del tama
no de la muestra que se seleccionara de la poblacion. Como
es natural, al aproximar las caractersticas poblacionales mediante estimadores
basados en la muestra se comete un error, error que mide la representatividad de
dicha muestra. Dependiendo del coste del muestreo, del presupuesto disponible
y de otros muchos factores fijaremos un error de muestreo que en todo caso debe
ser el mnimo posible. Dicho error de muestreo puede venir dado en terminos
absolutos, en terminos relativos o sujeto adicionalmente a un coeficiente de
confianza dado (sujeto a unos lmites de tolerancia).
A continuaci
on, calcularemos los tama
nos de muestra necesarios para cometer un error de muestreo dado al estimar las caractersticas poblacionales mas
comunes mediante muestreo aleatorio simple sin reposicion. Inicialmente disb dado por la desviacion
tinguiremos entre el error com
un de muestreo = ()
tpica del estimador y el error relativo de muestreo dado por el coeficiente de
varianza del estimador,
b
b = CV ()
b = () .
er ()
b
E()
1.3.1.
Tama
no de la muestra para un error de muestreo
dado
El n
umero de observaciones necesarias para estimar un parametro poblacional a partir de un estimador b con un error de estimacion se encuentra
resolviendo la siguiente expresion para n
q
b = .
V ar()
Analizaremos esta expresi
on para cada uno de los estimadores propuestos.
11
Estimador de la media
r
2

2
2
2
b
= (1 f ) S = 2 = 1 n S = S S
= (X)
n
N n
n
N
=
N S2
S2
S2
S2
= 2 +
= n =
2 =
S
n
N
N 2 + S 2
2 + N
Se observa que cuando N (fraccion de muestreo n/N tendiendo a

cero) el tama
no muestral n S 2 /2 = n0 (n es inversamente proporcional al error de muestreo). En una situacion practica, la solucion para
n presenta un problema debido a que en la mayora de las ocasiones, la
cuasi-varianza poblacional S 2 es desconocida. Puesto que la cuasi-varianza
muestral Sb2 suele estar disponible de alg
un experimento anterior, es posible obtener un tama
no de muestra aproximado al reemplazar S 2 por Sb2
en la expresi
on anterior.
Estimador del total
r

S2
n S2
S2
S2
b
= 2 = N 2 1
= N2
N2
= (X) = N 2 (1 f )
n
N n
n
N
= N 2
N 2S2
N 2S2
N 2S2
S2
N 3S2
= 2 +
= n =
= 2
.
2S2 =
2
2
2
N
2
n
N
N + N S
e + N S2
+ N
An
alogamente al caso anterior, en la mayora de las situaciones practicas, la cuasi-varianza poblacional S 2 es desconocida. Si se tiene la cuasivarianza muestral Sb2 de alg
un experimento anterior, se reemplaza S 2 por
Sb2 en la expresi
on anterior.
Estimador de la proporcion
r
PQ
N
n PQ
N
b
= (P ) =
(1 f )
= 2 =
1
N 1
n
N 1
N
n
=
NPQ
NPQ
PQ
N P Q/(N 1)
= 2 +
= n =
=
.
P
Q
2
(N 1)n
N 1
(N 1)2 + P Q
+ N 1
Se observa que cuando N (fraccion de muestreo n/N tendiendo

a cero) el tama
no muestral n P Q/2 = n0 (n es inversamente proporcional al cuadrado del error de muestreo y directamente proporcional
a la proporci
on poblacional P ). Para la estimacion de la proporcion es
muy interesante tener en cuenta que para poblaciones grandes o fracciones de muestreo peque
nas (N ), el valor maximo de n se obtiene
para P = Q = 1/2. Para constatar este resultado sabemos que si N
el tama
no muestral n tiende al valor n0 = P Q/e2 = f (P ), expresion que
tenemos que maximizar en P . En este caso, el valor maximo de n para
poblaciones grandes o fracciones de muestreo peque
nas se obtiene para
12
P = Q = 1/2. Por lo tanto, para un error prefijado se necesitaran tama

nos de muestra m
as peque
nos cuanto mas proximo este P a cero o a
uno. Este resultado es muy importante en la practica, ya que cuando se
estiman proporciones y no se conoce el valor de la proporci
on
poblacional P ni se tiene una aproximaci
on suya (proporcionada
por una encuesta similar, por una encuesta piloto, por la misma
encuesta realizada anteriormente o por cualquier otro m
etodo)
entonces se toma P = 1/2, con lo que estamos situandonos en el caso
de m
aximo tama
no muestral para el error fijado, lo cual siempre es aceptable estadsticamente. La dificultad practica puede ser que se obtenga
un tama
no muestral n demasiado grande para el presupuesto de que se
dispone.
Estimador del total de clase
r
n PQ
PQ
N3
N3
b
1
= (A) =
(1 f )
= 2 =
N 1
n
N 1
N
n
e2 =
N 3P Q
N 2P Q
N 3P Q
n=
.
(N 1)n
N 1
(N 1)e2 + N 2 P Q
Dado que, en general, la varianza de los estimadores depende de parametros

poblacionales desconocidos, usaremos una estimacion de la misma para determinar el tama
no muestral para un determinado. Estas varianzas estimadas las
podemos obtener de estudios anteriores o encuestas piloto.
Ejemplo 5 En el ejemplo 4, cu
al debera de ser el tama
no de muestra
optimo
para estimar dicho coste total reduciendo el error de muestreo del primer apartado en un 10 %?
Si deseamos reducir el error de muestreo del primer apartado en un 10 % el
m
aximo error que estamos dispuestos a admitir, considerando el anterior cob = 132, es un error de muestreo de (X)
b = 118,8. Impongamos esta
mo (X)
condici
on para determinar el tama
no de muestra
optimo necesario para estimar el costo total con dicho error de muestreo, teniendo en cuenta que el la
cuasivarianza muestral es de 16.1233. Sustituyendo
n=
1.3.2.
N 2S2
1202 16,1233
=
= 14,4674
= 15 casas
2 + N S 2
118,82 + 120 16,1233
Tama
no de muestra fijado el error relativo de muestreo
An
alogamente, fijado el error relativo r , el tama
no de muestra optimo necesario se despeja de la ecuacion siguiente:
b =
r = CV ()
b
()
.
b
E()
Vamos a ver cu
al es el tama
no de la muestra a seleccionar para cometer
dicho error seg
un las caractersticas poblacionales a estimar.
13
b
b = (X) =
er = CV (X)
b
E(X)
q
2
(1 f ) Sn
.
Elevando ambos miembros al cuadrado y despejando el valor de n, se tiene

que
S2
n= 2 2
.
(1.2)
er (X) + S 2 /N
Para poblaciones grandes (N ), se tiene que
S2
n n0 = 2 2 .
X er
Es decir, a medida que el valor de er aumenta, el valor de la muestra
disminuye. Como en el caso del error absoluto, la solucion para n presenta
un problema debido a que en la mayora de las ocasiones, la cuasi-varianza
poblacional S 2 es desconocida. Puesto que la cuasivarianza muestral Sb2
suele estar disponible de alg
un experimento aleatorio anterior, es posible
obtener un tama
no de muestra aproximado al reemplazar S 2 por Sb2 .
Estimador del total
q
b
b = (X) =
er = CV (X)
b
E(X)
N 2 (1 f ) Sn
X

que
N 2S2
S2
(1.3)
n= 2 2 2
=
2 e2r + S 2 /N .
X
er (X) N + S 2 N
Observamos que el tama
no de muestra necesario para cometer un error
relativo de muestreo dado coincide para el estimador de la media (1.2) y
del total (1.5).
Estimador de la proporcion
r
(Pb)
er = CV (Pb) =
=
E(Pb)
N 1
(1 f )P Q
N 1n
.
P

que
NQ
n=
(1.4)
(N 1)P e2r + Q
Como antes, si N , entonces el valor de la muestra tiende a Q/(P e2r ).
En la pr
actica, cuando se estiman proporciones y no se conoce el valor de
14
la proporci
on poblacional P ni se tiene una aproximacion suya (proporcionada por una encuesta similar, por una encuesta piloto, por la misma
encuesta realizada anteriormente, ni por ning
un otro metodo) entonces se
llama P = 1/2. Este caso P = 1/2 proporciona el caso de maximo tama
no
muestral para el error fijado, lo cual es siempre aceptable estadsticamente. La dificultad pr
actica puede ser que se obtenga un tama
no muestral n
demasiado grande para el presupuesto de que se dispone.
r
b
b = (A) =
er = CV (A)
b
E(A)
N3 1
(1 f )P Q
N 1n
.
A

que
NQ
n=
(1.5)
(N 1)P e2r + Q
Observamos que el tama
no de muestra necesario para cometer un error
relativo de muestreo dado coincide para el estimador de la proporcion (1.4)
y del total (1.5).
Ejemplo 6 Volvamos al ejemplo 4. Una gran empresa constructora tiene 120
casas en diversas etapas de construcci
on. Para estimar la cantidad total (en
miles de euros) que ser
a registrada en el inventario de la construcci
on en proceso,
se seleccion
o una muestra aleatoria simple de 12 casas y se determinaron los
costes acumulados en cada una de ellas. Los costos obtenidos para las 12 casas
fueron los siguientes:
35,5, 30,2, 28,9, 36,4, 29,8, 34,1, 32,6, 26,4, 38, 38,2, 32,2, 27,5.
Estimar los costes totales acumulados para las 120 casas y dar una estimaci
on del error relativo de muestreo. Cu
al debera ser el tama
no muestral
optimo para reducir dicho error relativo en un 10 %?
Estimar la proporci
on de casas cuyos costes de construcci
on superan los
32 mil euros. Dar una estimaci
on del error relativo de muestreo. Cu
al
debera ser el tama
no muestral
optimo para reducir dicho error relativo en
un 10 %?
Ejemplo 7 Mediante muestreo aleatorio simple se trata de estimar la proporci
on de piezas correctas producidas en un proceso industrial en el que se fabrican
un total de 8000 unidades. Una muestra piloto ha suministrado 1/5 de piezas
defectuosas. Obtener el tama
no de muestra necesario para que el error de muestreo sea de 0.08 al estimar la proporci
on de piezas correctas producidas en el
proceso de producci
on industrial. Hallar el tama
no de muestra necesario para
15
que el error relativo de muestreo sea del 1,2 % en la misma estimaci

on.
En el caso de que el error de muestreo sea de 0.08, se tiene que
n=
NPQ
80004/51/5
=
= 24,98
= 25 piezas
(N 1)2 + P Q
79990,082 + 1/54/5
Por otra parte, en el caso de que el error relativo de muestreo sea del 2 % se
tiene que
n=
1.3.3.
NQ
80001/5
=
= 579,7774
= 580 piezas
(N 1)P e2r + Q
79990,22 4/5 + 1/5
Tama
no de muestra para un error de muestreo y un
coeficiente de confianza dados
En determinadas ocasiones, aparte de calcular el tama

no muestral para un
error de muestreo dado, prefijamos un nivel de confianza adicional para el calculo
de dicho tama
no, con la finalidad de relajar en cierta forma el calculo de n.
De esta forma se halla n con un grado de tolerancia definido por el nivel de
confianza.
Supongamos que estimamos el parametro mediante el estimador insesgado
b cometiendo el error absoluto maximo admisible e para un coeficiente de
confianza 1 . Suponemos que el estimador b sigue una distribucion normal
b = y varianza 2 ().
b En este caso, se tiene que
de media E()

P |b | e = 1 = P (e b e ) = 1
Por lo tanto,
P
b
e
e
b
b
b
()
()
()
de manera que
z1/2 =
e
b
()
!
= 1 ,
b
= e = z1/2 ().
De esta forma vemos que la identidad fundamental para obtener n seg

un un
error de muestreo dado cuando existe un coeficiente de confianza adicional dado
es la siguiente
b
e = z1/2 ().
Ejemplo 8 Obtener los valores de n para un error de muestro e con coeficiente
de confianza adicional 1 para los diferentes estimadores.
n=
2
z1/2
N S2
2
N e2 + z1/2
S2
16
Estimador del total

n=
2
z1/2
N 2S2
2
S2N
e2 + z1/2
Estimador de la proporci
on
n=
2
z1/2
NPQ
2
PQ
(N 1)e2 + z1/2

n=
1.3.4.
2
z1/2
N 3P Q
2
N 2P Q
(N 1)e2 + z1/2
Tama
no de muestra para un error relativo de muestreo y un coeficiente de confianza dados
En determinadas ocasiones, aparte de calcular el tama

no muestral para un
error relativo de muestreo dado, prefijamos un nivel de confianza adicional para
el c
alculo de dicho tama
no, con la finalidad de relajar en cierta forma el calculo
de n. De esta forma se halla n con un grado de tolerancia definido por el nivel
de confianza.
Supongamos que estimamos el parametro mediante el estimador insesgado
b cometiendo un error relativo er, . Analogamente al caso anterior, consideramos
b = y varianza
que el estimador b sigue una distribucion normal de media E()
2 b
(). Se tiene que

!
b

er, = 1 = P (er, b er, ) = 1

Por lo tanto,
P
er,
b
er,
b
b
b
()
()
()
!
= 1 ,
de donde se deduce que

er,
b
= z1/2 , = er, = z1/2 Cv().
b
()
De esta forma vemos que la identidad fundamental para obtener n seg
un un
error relativo de muestreo dado dado cuando existe un coeficiente de confianza
adicional viene dado por
b
er, = z1/2 Cv().
Ejemplo 9 Obtener los valores de n para un error de muestro er, con coeficiente de confianza adicional 1 para los diferentes estimadores.
17
n=
2
2
z1/2
C1,x
e2r,
2
2 /N
z1/2
C1,x
S
C1,x =
X
Estimador del total

n=
2
2
N z1/2
C1,x
2
2
N e2r, + z1/2
C1,x
S
C1,x =
X
Estimador de la proporci
on
n=
2
N Qz1/2
2
P (N 1)e2r, + z1/2
Q

n=
2
N Qz1/2
2
P (N 1)e2r, + z1/2
Q

Muestreo Aleatorio Simple

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Muestreo Aleatorio Simple

Cargado por

Copyright:

Formatos disponibles

Captulo 1

Muestreo Aleatorio Simple

Vamos a analizar el dise

Probabilidad de una muestra cualquiera

Dada la forma de definirse el procedimiento de seleccion de la muestra, el

Probabilidad de primera inclusi

Calculemos la probabilidad que tiene cualquier unidad de la poblacion de

Total de muestras que contienen a ui

Probabilidad de segunda inclusi

Vamos a calcular la probabilidad que tiene cualquier par de unidades de la

Estimadores lineales insesgados en muestreo aleatorio simple

entonces el estimador de Horvitz-Thompson para dicho parametro poblacional

Vamos a analizar las varianzas de los estimadores. En el caso del estimador

Comprobar la insesgadez de los estimadores y que se cumple

donde la cantidad Sb2 representa la cuasi-varianza muestral y que viene dada

Ejemplo 2 Una empresa industrial est

de manera que el error asociado para dicha varianza es de

Se observa que cuando N (fraccion de muestreo n/N tendiendo a

Se observa que cuando N (fraccion de muestreo n/N tendiendo

P = Q = 1/2. Por lo tanto, para un error prefijado se necesitaran tama

Dado que, en general, la varianza de los estimadores depende de parametros

Elevando ambos miembros al cuadrado y despejando el valor de n, se tiene

Elevando ambos miembros al cuadrado y despejando el valor de n, se tiene

Elevando ambos miembros al cuadrado y despejando el valor de n, se tiene

Elevando ambos miembros al cuadrado y despejando el valor de n, se tiene

que el error relativo de muestreo sea del 1,2 % en la misma estimaci

En determinadas ocasiones, aparte de calcular el tama

De esta forma vemos que la identidad fundamental para obtener n seg

Estimador del total

Estimador del total de clase

En determinadas ocasiones, aparte de calcular el tama

de donde se deduce que

Estimador del total

Estimador del total de clase

También podría gustarte