Está en la página 1de 8

MUESTREO IRRESTRICTO ALEATORIO

El objetivo de una encuesta por muestreo es hacer una inferencia acerca de una población
con base en la información contenida en una muestra. Dos factores que afectan la cantidad
de información contenida en la muestra, y, por lo tanto, afectan la precisión del
procedimiento de hacer inferencias. El primero es el tamaño de la muestra seleccionada de
la población. El segundo es la cantidad de variación en los datos; la variación
frecuentemente puede ser controlada por el método de selección de la muestra. El
procedimiento para seleccionar la muestra se denomina diseño de la “encuesta por
muestreo”. Para un tamaño de muestra fijo, n, se considera diversos diseños, o
procedimientos de muestreo, para obtener las n observaciones en la muestra. Puesto que
las observaciones cuestan dinero, un diseño que proporciona un estimador preciso del
parámetro para un tamaño de muestra fijo produce un ahorro en el costo para los
experimentadores. Este diseño o técnica de muestreo básico se llama muestreo irrestricto
aleatorio cuya definición es:

“Si un tamaño de muestra n es seleccionado de una población de tamaño N de tal manera


que cada muestra posible de tamaño n tiene la misma probabilidad de ser seleccionada, el
procedimiento de muestreo se denomina muestreo irrestricto aleatorio. A la muestra
obtenida se le llama nuestra irrestricta aleatoria.

Se usará este muestreo para obtener estimadores de las medias, totales y proporciones
poblacionales.

Considérese el siguiente ejemplo. Un auditor federal va a examinar los registros contables


del hospital de una ciudad. Los registros del hospital, obtenidos de un computador,
muestran un determinado total de las cuentas por cobrar, y el auditor debe verificar este
total. Si existen 28.000 cuentas abiertas en el hospital, el auditor no tiene el tiempo
suficiente para examinar el registro de cada paciente, ni para obtener una cifra total de las
cuentas por cobrar, esto lo obliga a que tenga que escoger un esquema de muestreo que le
permita obtener una muestra representativa de los registros de los pacientes. Después de
examinar las cuentas de los pacientes en la muestra, el auditor puede estimar el total de
cuentas por cobrar en todo el hospital. Si la cifra del computador cae dentro de un valor
estimado por el auditor, se acepta dicha muestra de lo contrario se debe tomar mas
elementos de la población por posible diferencia entre el computador y los datos de la
muestra.

Supóngase que del total de los 28.000 registros de los pacientes en el computador se
escoge una muestra de 100 pacientes. La muestra se llamará irrestricta aleatoria si cada
uno de los 100 registros tiene la misma probabilidad de ser seleccionados.

El experimentador ahora se enfrenta ahora a dos problemas: (1) ¿Cómo seleccionar la


muestra irrestricta aleatoria y (2) ¿como estimar los diferentes parámetros poblacionales de
interés?

COMO SE SELACCIONA UNA NUESTRA IRRESTRICTA ALEATORIA

Seleccionar una muestra irrestricta aleatoria de la población de interés no es tan fácil como
parece al principio. ¿Cómo se puede seleccionar una muestra de una población, de tal
manera que cada muestra posible de tamaño n tenga la misma probabilidad de ser
escogida?. Se puede usar nuestro criterio para seleccionar “aleatoriamente” la muestra. A
esta técnica se le denomina Muestreo casual. Otro método consiste en seleccionar una
muestra representativa, que consiste en seleccionar los datos típicos o representativos de la
población. Estos métodos producen sesgos por parte del investigador axial como a la
adquisición de estimadores cuyas propiedades no pueden ser evaluadas.

Las muestras irrestrictas aleatorias se seleccionan utilizando tablas de números aleatorios.


Estas tablas son un conjunto de números enteros generados de modo que, comúnmente, la
tabla contendrá todos los diez enteros (0, 1, …..,9), en proporciones aproximadamente
iguales, sin tendencias en el patrón en que se generaron los dígitos. Por lo tanto si un
número es seleccionado de un punto aleatorio en la tabla, es igualmente probable que sea
cualquiera de los dígitos entre el 0 y el 9.

Seleccionar números de la tabla es análogo a extraer números de un sombrero que


contiene a estos números en papeletas perfectamente marcados. Análogamente,
podríamos apuntar con un lápiz sobre un punto aleatorio inicial en la tabla No. 1.
Supóngase que la punta señala la línea 15 de la columna 9 y decidimos utilizar el último
digito de la derecha. Ahora se puede continuar en cualquier dirección para obtener los
números restantes de la muestra. Si al ir en cualquier dirección se encuentra con un
número ya seleccionado, se salta este y se sigue en el proceso hasta completar la muestra.
Nótese que cualquier punto de inicio puede ser usado y se puede mover en cualquier
dirección predeterminada. Si se va a utilizar más de una muestra en cualquier problema
cada una debe tener un punto de inicio diferente.

Ejemplo 1.

Supóngase que existen N= 1000 registros de pacientes de los cuales será seleccionada una
muestra de n= 20. Se sabe que una muestra irrestricta aleatoria se obtiene si cada una de
las muestras posibles n= 20 registros tienen la misma probabilidad de ser escogidos. Los
dígitos de la tabla No 1 son generados para satisfacer las condiciones del muestreo
irrestricto aleatorio. Determinar cuales registros van a ser incluidos en la muestra n= 20.

Solución:
Se considera que las cuentas son los números 001, 002, ….., 999, 000. Lo cual conforma
los 1000 registros de números de tres dígitos donde 001 es el primer registro, 999 el
registro del 999 paciente y 000 es el milésimo.
Se recurre al uso de la tabla No1 y se utiliza la primera columna; si no se toma en cuenta
los dos dígitos últimos de cada numero, se ve que el primer numero formado de tres dígitos
es el 104, el segundo es el 223, el tercero es el 241, y axial sucesivamente. Hasta
completar los 20 registros. Observa la tabla 2.

104 779 289 510


223 995 635 023
241 963 094 010
421 893 103 521
375 854 071 070

Tabla No.2

Si los registros estan enumerados se toma estos con sus números correspondientes de n=
20 muestras de una población de N= 1000.

Cada elemento de la población tiene la misma probabilidad de ser elegido.


ESTIMACION DE UNA MEDIA Y UN TOTAL DE POBLACIONES

Como el objetivo de la encuesta por muestreo es hacer inferencias de una población a partir
de la información contenida en la muestra, una manera de obtener esta estimación, es
estimas ciertos parámetros de la población, utilizando la información de la muestra.
Frecuentemente las estimaciones hechas son: estimar una media poblacional, denotada por
μ, o un total poblacional, denotado por τ. Por lo tanto el auditor del ejemplo anterior podría
estar interesado en el valor medio en dólares de las cuentas por cobrar o en la cantidad de
dólares de las cuentas.

Supóngase que una muestra irrestricato de n elementos es seleccionada, y que se va a


estimar el valor medio por cuentas para la población total de los registros de un hospital,
intuitivamente se utiliza el promedio muestral n

∑ yi
i=1
ȳ =c n
Para estimar μ.
Por supuesto, un valor de ȳ revela muy poco acerca de la media poblacional μ. Al menos
que podamos evaluar la bondad de nuestro estimador. Por lo tanto, adema de estimar μ ,

nos gustaría fijar un límite sobre el error de estimación. Puede demostrarse que ȳ posee

muchas propiedades deseables para estimar μ. En particular, ȳ es un estimador isesgado


de μ, y tiene una varianza que decrece a medida que el tamaño de la muestrea n se
incrementa. Mas precisamente para una muestra irrestricta aleatoria, seleccionada sin
reemplazo de una población de tamaño N.

n n
1 1
∑ E ( y i )= ∑ μ=μ
E( ȳ ) =
n i=1 n i=1

σ 2 N−n
Y V( ȳ ) = n N−1 ( )
2
Donde σ es la varianza poblacional.

Suponga que se tiene por ejemplo una población N = 4 mediciones dadas por {1, 2, 3,
4}. Si una sola observación y es seleccionada al azar de esta población, entonces y
1
puede tomar cualquiera de los cuatro valores posibles, cada uno con probabilidad 4 .

Por lo tanto,

μ=E ( y ) =∑ yp ( y )=1 (14 )+2(14 )+3( 14 )+ 4 (14 )


= (14 )( 1+2+3+ 4 )=104 =2. 50
σ 2 =V ( y )=E( y−μ )2 =∑ ( y−μ )2 p ( y )
1 1 1 1
()
¿ ( 1−2 . 5 )2
4 () ()
+ ( 2−2 .5 )2 + ( 3−2. 5 )2 + ( 4−2. 5 )2
4 4 4 ()
5
¿
y 4

Ahora supóngase que se selecciona una muestra aleatoria de tamaño n=2 (sin
reemplazo) de esta población de cuatro mediciones. Existen seis muestras posibles,
listadas de la siguiente manera:

{1,2}, {1 , 3 }, {1,4}, {2,3}, {2,4}, {3,4}

Todas estas muestras serán igualmente probables, y en consecuencia una probabilidad

1
de 6 será asignada a la ocurrencia de cualquier muestra. Las seis medias muestrales,
ȳ , son, respectivamente,
1.5, 2.0, 2.5, 2.5, 3.0, 3.5
Puesto que cada una de estas medias muestrales puede ocurrir con una probabilidad de

1
6 , conocemos la distribución de muestreo de ȳ y podemos calcular E ( y ) y V ( y) .
De la definición de valor esperado,
E ( y )= ∑ y p ( y )
¿ ( 1 .5 ) (16 )+( 2. 0 )( 1.6 )+( 2 .5)( 16 )+( 2. 5)(16 )+ (3 . 0) (16 )+ (3. 5) (16 )
¿2 .50=μ

Tambien V ( y )=E ( y−μ )2=∑ ( y−u )2 p( y )


1 1 1 1 1 1
() () () ()
¿ ( 1 .5−2 .5 )2 + ( 2 .0−2 .5 )2 + ( 2 .5−2 .5 )2 + ( 2 .5−2 .5 )2 + ( 3 . 0−2 . 5 )2 + ( 3. 5−2. 5 )2
6 6 6 6 6 ()
6 ()
1 5
¿ ( 2 .5 ) =
6 12 ()
5
2
Recordando que para este ejemplo σ = 4 , N = 4 y n = 2, se tiene que

5
σ 2 N −n 4 ( ) 4−2
n N −1 2
= ( ) (4−1 )
5 2 5
V( ȳ ) =
¿ =
8 3 12 ()
Por lo tanto se ha demostrado que

n n
1 1
∑ E ( y i )= ∑ μ=μ
E( ȳ ) =
n i=1 n i=1

σ 2 N−n
y V( ȳ ) =
( )
n N−1

también se demuestra que


N 2
E( s2 )= σ
N−1

axial que la V( ȳ ) puede ser estimada isesgadamente de la muestra por

s 2 N −n
V( ȳ ) =
( )
n N −1
n
21
s= ∑ ( y i− y ) 2
Donde
n−1 i=1
Estimador de la media poblacional

n
∑ yi
μ= y =i=1
n
.

Varianza estimada
y de

¿
s 2 N−n
V ( y )=
n N ( )
n n
∑ ( y i− y ) 2
∑ y i2 −n ( y )2
s 2 = i=1 = i=1
donde n−1 n−1

límite para el error de estimación

s 2 N −n

¿

2 V ( y )=2
n N ( )
 N  n
la cantidad  N  se denomina corrección por población finita y difiere del valor encontrado
en la varianza verdadera
y de Cuando n es relativamente pequeña con respecto al tamaño
de la población N esta estará cerca de la unidad. lo cual hace despreciarla y yentonces s 2 la
varianza estimada de es n

Ejemplo

vuelva a l caso del auditor del hospital y suponga que una muestra aleatoria de n= 200 cuentas
y fue
es seleccionada del total de N= 1000. la media muestral de las cuentas = $ 94.22, y la
varianza muestral
s2 es 
= 445.21. Estime , el promedio de la deuda para las 1000 cuentas
del hospital y establezca un límite para el error de estimación

solución
Utilizando y 
= $ 94.22, para estimar . Un limite para el error de estimación puede ser
encontrado mediante
2
s N −n 445. 21 1000−200
√ √
¿

2 V ( y )=2
n N ( )
=2
200 1000 ( )
¿ 2 √1 .7808=2. 67


por lo tanto se estima que el valor medio por cuenta , yserá = $ 94.22. puesto que n es
grande, la media muestral tendrá una distribución aproximadamente normal, axial que

$ 94 . 22±$
es 2.
un67intervalo de confianza para la media poblacional de
aproximadamente 95%

También podría gustarte