Está en la página 1de 8

MUESTREO ALEATORIO SIMPLE

4. Muestreo aleatorio simple sin reemplazo (mas)


4.1 Introducción
Este esquema de muestreo es el más usado cuando se tiene un marco de muestreo
. ~¡
que especifique directamente la manera de identificar cada unidad en la población. 1 ¡
Además no se tiene conocimiento a priori sobre los posibles valores de Y1 ni otras ¡ l
mediciones asociadas a Y1. En este caso cada unidad se extrae con igual 1'
probabilidad, por etapas, y sin reemplazo, hasta tener las n unidades de la muestra. •.¡j'
.,
~
:
1

En la primera extracción, la probabilidad de que se seleccione específicamente una !1 1


de las unidades de la población es _1 . En la segunda extracción la probabilidad de
N
¡

que se seleccione una de las restantes N-1 unidades es: _1_, y asi de manera i 1
N-1 1 :l
j
sucesiva: en la selección k, la probabilidad de una unidad de las N-k+ 1 restantes es
1
N--k+l
N
Para estimar Y = ¿Y¡ 1N se obtiene el promedio de la muestra:
i=l
" 11
y= Y= l:Y;In (4.1)

Este es un estimador insesgado (E (.Y)= Y, el promedio de los posibles

valores y al tomar muchas muestras es Y), además su varianza es:

que V(y)"" E (y-Y-)2 == (1- N-;; n) s;


;; la
N
!nte 2 1 - 2
donde S,. - ¿(Y¡ - Y) .
N -1 i=l

Nótese que si N es infinito, V(y) = s~ , es


el resultado que se obtiene para
n
poblaciones infinitas . .!!. es la fracción de muestreo o proporción de la población que
N
se muestrea, y ¡ _.!!. es el factor de corrección por finitud (fcf¡.
N

43
MUESTREO ALEATORIO SIMPLE

Se puede demostrar que con este proceso de selección, la probabilidad de


que cualquier unidad U; esté en la muestra en cualquier orden de selección es
71" =!!:..., la de que ambas una u, y una U¡ estén en la muestra es 71" = n(n -l) .
' N . !/ N(N-1)
Para estimar el total t lí = NY = y tenemos:

'
Y=NY=Ny (4.2)
además, en general, si e~N[B,V(O)], entonces:

r[é- L96Jvce) ses é+L96Jvcé)] = o.9s


Si no conocemos v(e) tenemos que estimarla:

P[é -1.96JV(Ó) s Bsé !.96JV(Ó)]..:.. 0.95


En el caso particular del mas se tiene:

B=Y, B=y y v(e)=V(y)=(l- ;r!


s; -
n J-;-:::;r:::;y+L96
P "Y-1.96 ( 1-N" (1-N"-;-
n J s; =ü.9s
6
:;. P[i"Y -fl <o]= o.95
8 = error absoluto.
Despejando n de la expresión 6 =1.96~V(y) se tiene:
" (1.96)
11 = - - - ; e - - - - -
[;2 t - 62
2
s: (4.2a)

-...:....,,..--:-+-
(1.96 ) •' Sv2 N

Se usa s; por ser más sencilla la expresión (4.2). Sin embargo, recordemos que:

44
MUESTREO ALEATORIO SIMPLE

de
es

.2)

4.2 Tamaño de la muestra


El valor de S~ ó u; se estima con experiencias previas, una prueba piloto o bien se
obtiene una primera aproximación sobre su valor, usando tablas (ver Tabla 3.1 ), y el
conocimiento previo sobre la población.
Si se considera que y
no se ajusta a la distribución normal, se usa el criterio
de fijar la magnitud de la varianza o del coeficiente de variación de y . Se determina n
para que produzca un coeficiente de variación dado (CV0 ) usando estimaciones
"gruesas" de y y de s 2 '
)'

Así, CV, =
[ v(-)]~
y
o E(y) y

Despejando n, se obtiene:
a)

n= 2. (4.3)
8
(CVc ) 2
o
Y + Nv_

Si n es "grande" se espera que el Teorema central del límite dé una buena


aproximación de la distribución de y. Así:

45
MUESTREO ALEATORIO SIMPLE

si 1 a =.95

n)
P· y-1.96 (1- N-; s; -
:::;Y<y+l.9 6
(l- _n) S~
N n =0.95,

entonces Ji- Y se distribuye aproximadamente como una normal estandarizada


¡1
[vCvl]' 2
(media cero yvarianza uno), donde v(y)=(I-_~;_Js;
N n
Si se desea un tamaño de muestra tal que el error de estimación sea inferior
a o con una probabilidad de 1-a, esto es: P [i.Y-YI<6]=1-a, 6=zy;_~V(y)

dividiendo entre [v (.Y)]h


P J~-v¡ 1/
< o ¡/ = 1- (\!

[V(y)Y2 [V(ji)f2

De las tablas de la normal estándar, Z-N(O, 1), se obtiene un valor zu~2 tal
que P[JZJ < z" 12 ] = 1-o: (zu~2 es el valor de Z obtenido en las tablas que deja un área

de a/2 a la derecha de él). Como Jy- ~~ -N(O, l), entonces:


[v(.Y)]~

de aquí se despeja n:

46

') ''.
MUESTREO ALEATORIO SIMPLE

1
n=----- (4.4)
62 1
2 2
zcd2sy
+-
N
Si a= 0.05 entonces:

n=
. (1.96i s;.
f/
Se puede usar como una primera aproximación y luego

corregir usando n = _n'_.


n'
:a da 1+-
N
Si no se puede suponer normalidad de la distribución del estimador, se
recurre a la desigualdad de Tchebycheff.

4.2.1 Desigualdad de Tchebycheff


(y)
Sea u una variable aleatoria con cualquier distribución y E(U) = J..iu, V(U) =~Y¿

'* P[IU-¡.¡vi:C::>.au]s ~z
=>- P[iu ~t11 l5>-0'11 ] 1- ~2
tal
=>- P[U -J\a11 < llv <U+ J\a 11 ] > 1 ;,2
3rea

[
=>- Py >-~V(y)<Y<y >..~V(y)>l-;, 2 l
1

1
>-=2 1--2 =.75
>..
1
>-=3 1--2 = .889
J\
1
J\ =4.4 1--? =.95
_A-

15 =4.4~VCJ)

47
MUESTREO ALEATORIO SIMPLE

(4.4a)

En la expresión anterior (4.4) si tanto 8 como S se expresan como porcentaje

de la media, 6'=~100. CV=~JOO y suponiendo normalidad, la expresión se


y y
transforma en:

n=

Si no se supone normalidad para la distribución de y


y con confianza del
95%, por la desigualdad de Tchebycheff, entonces (4.4a) se transforma en:

(4.4)(CV) 2
l
(o'i f
'
f'
1

4.3 Estimación de proporciones

Todos los desarrollos de la sección anterior son aplicables al caso en que Y(U) es
una medida o indicador de la presencia o ausencia de una caracterfstica en la unidad '
U; con valor 1 si la caracterfstica está presente y O si no es así. En este caso Y= P =
proporción de unidades en la población que tienen la caracterfstica:

N
¿r,
V=-'-=P
N

p= y es la proporción de unidades en la muestra con la caracterfstica. El valor de


s.1'2 en términos de P resulta:

48

'-' ,. ,,
MUESTREO ALEATORIO SIMPLE

N
) I:(r; -f)2
1 N
"2 = - ' - ' - - -
l)}' NP(l-P)-=~P(l-P), a 2 =P(!-P)
N-1 N-1 N-1

con estimador:

nP (1-fi).
n-1

Con este nuevo valor, la expresión (4.3) resulta:

N
-N_-/1-P) 1-P
n = _ __:..:_--''---:--__. (4.5)
(cvS P+( 1-P)
N-!
P(cvS ·
Para usar esta expresión, se estima a priori o con una prueba piloto el valor
de P y se fija el CV" que se desea.

Si utilizamos la desigualdad de Tchebycheff tenemos:

2 N
(4.4) ··-P(l- P)
1 N-1
n = ----;;------
62 1
. +-
(4.4)2_!{_P(1-P) N
N-1

. 5
62"
Nótese que sí P está cercano a cero, el valor de n aumenta. Esto indica que
para estimar la proporción de unidades con una característica rara se requieren
muchas unidades en la muestra. Esto es lo contrario de lo que sucede si se usa la
aproximación a la normal, en cuyo caso se usa la expresión (4.4) con
S2 = NP (1- P) quedando:
y N -1

49
MUESTREO ALEATORIO SIMPLE ¡
t 5.
t,. El
'
1 est
¡:' ind
Si se quiere conocer P, las Y, son Oó 1, entonces: 1·

S 2 =-N__ P(l- P) _:_ P(l P)


t
1
est
¡ N-!
f hel
n = -12
. z,~ P(l-P) 1 ho1
--
62
.
¡ su!
Si (1' = .05 =:> z,Y:. 1.96 =2, además como la varianza de P es máxima cuando P= f
hel
los
0.5, se usa PO-P) = (.5)(5) = 0.25 como margen de seguridad SUJ
ve1
' 22 (.25) 1 re~
=} n= =-.·
{;2 82 est
Entonces se debe dar que nP>5 y n(J-P)>5 para que se tenga buena cercanía prc
a la normalidad. Al variar ose tienen los siguientes tamaños de muestra:

6 n
.001 1,000,000 !:
.01 10,000
l'
(
.02 2,500
t>
.025 1,600
.03 1'111 t.
t
.035 816 '
¡'
.04 625 r1
además, si P~N(P,V(fi)) entonces se debe reportar el resultado de la estimación 1
de P con un intervalo de confianza aproximado dado por:

P[ f> 1.96~VCP) < P < f> 1.96~vch j ~·· .95,


donde: V(P) = (r- ~J NP(l É')
N (N-l)n

T:r(')~(
P- 1--n)f>(1-P)·.
- N n

1,,

50

También podría gustarte