Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El objetivo de una encuesta por muestreo es hacer una inferencia acerca de una población
con base en la información contenida en una muestra. Dos factores que afectan la cantidad
de información contenida en la muestra, y, por lo tanto, afectan la precisión del
procedimiento de hacer inferencias. El primero es el tamaño de la muestra seleccionada de
la población. El segundo es la cantidad de variación en los datos; la variación
frecuentemente puede ser controlada por el método de selección de la muestra. El
procedimiento para seleccionar la muestra se denomina diseño de la “encuesta por
muestreo”. Para un tamaño de muestra fijo, n, se considera diversos diseños, o
procedimientos de muestreo, para obtener las n observaciones en la muestra. Puesto que
las observaciones cuestan dinero, un diseño que proporciona un estimador preciso del
parámetro para un tamaño de muestra fijo produce un ahorro en el costo para los
experimentadores. Este diseño o técnica de muestreo básico se llama muestreo irrestricto
aleatorio cuya definición es:
Se usará este muestreo para obtener estimadores de las medias, totales y proporciones
poblacionales.
Supóngase que del total de los 28.000 registros de los pacientes en el computador se
escoge una muestra de 100 pacientes. La muestra se llamará irrestricta aleatoria si cada
uno de los 100 registros tiene la misma probabilidad de ser seleccionados.
Seleccionar una muestra irrestricta aleatoria de la población de interés no es tan fácil como
parece al principio. ¿Cómo se puede seleccionar una muestra de una población, de tal
manera que cada muestra posible de tamaño n tenga la misma probabilidad de ser
escogida?. Se puede usar nuestro criterio para seleccionar “aleatoriamente” la muestra. A
esta técnica se le denomina Muestreo casual. Otro método consiste en seleccionar una
muestra representativa, que consiste en seleccionar los datos típicos o representativos de la
población. Estos métodos producen sesgos por parte del investigador axial como a la
adquisición de estimadores cuyas propiedades no pueden ser evaluadas.
Ejemplo 1.
Supóngase que existen N= 1000 registros de pacientes de los cuales será seleccionada una
muestra de n= 20. Se sabe que una muestra irrestricta aleatoria se obtiene si cada una de
las muestras posibles n= 20 registros tienen la misma probabilidad de ser escogidos. Los
dígitos de la tabla No 1 son generados para satisfacer las condiciones del muestreo
irrestricto aleatorio. Determinar cuales registros van a ser incluidos en la muestra n= 20.
Solución:
Se considera que las cuentas son los números 001, 002, ….., 999, 000. Lo cual conforma
los 1000 registros de números de tres dígitos donde 001 es el primer registro, 999 el
registro del 999 paciente y 000 es el milésimo.
Se recurre al uso de la tabla No1 y se utiliza la primera columna; si no se toma en cuenta
los dos dígitos últimos de cada numero, se ve que el primer numero formado de tres dígitos
es el 104, el segundo es el 223, el tercero es el 241, y axial sucesivamente. Hasta
completar los 20 registros. Observa la tabla 2.
Tabla No.2
Si los registros estan enumerados se toma estos con sus números correspondientes de n=
20 muestras de una población de N= 1000.
Como el objetivo de la encuesta por muestreo es hacer inferencias de una población a partir
de la información contenida en la muestra, una manera de obtener esta estimación, es
estimas ciertos parámetros de la población, utilizando la información de la muestra.
Frecuentemente las estimaciones hechas son: estimar una media poblacional, denotada por
μ, o un total poblacional, denotado por τ. Por lo tanto el auditor del ejemplo anterior podría
estar interesado en el valor medio en dólares de las cuentas por cobrar o en la cantidad de
dólares de las cuentas.
∑ yi
i=1
ȳ =c n
Para estimar μ.
Por supuesto, un valor de ȳ revela muy poco acerca de la media poblacional μ. Al menos
que podamos evaluar la bondad de nuestro estimador. Por lo tanto, adema de estimar μ ,
nos gustaría fijar un límite sobre el error de estimación. Puede demostrarse que ȳ posee
n n
1 1
∑ E ( y i )= ∑ μ=μ
E( ȳ ) =
n i=1 n i=1
σ 2 N−n
Y V( ȳ ) = n N−1 ( )
2
Donde σ es la varianza poblacional.
Suponga que se tiene por ejemplo una población N = 4 mediciones dadas por {1, 2, 3,
4}. Si una sola observación y es seleccionada al azar de esta población, entonces y
1
puede tomar cualquiera de los cuatro valores posibles, cada uno con probabilidad 4 .
Por lo tanto,
Ahora supóngase que se selecciona una muestra aleatoria de tamaño n=2 (sin
reemplazo) de esta población de cuatro mediciones. Existen seis muestras posibles,
listadas de la siguiente manera:
1
de 6 será asignada a la ocurrencia de cualquier muestra. Las seis medias muestrales,
ȳ , son, respectivamente,
1.5, 2.0, 2.5, 2.5, 3.0, 3.5
Puesto que cada una de estas medias muestrales puede ocurrir con una probabilidad de
1
6 , conocemos la distribución de muestreo de ȳ y podemos calcular E ( y ) y V ( y) .
De la definición de valor esperado,
E ( y )= ∑ y p ( y )
¿ ( 1 .5 ) (16 )+( 2. 0 )( 1.6 )+( 2 .5)( 16 )+( 2. 5)(16 )+ (3 . 0) (16 )+ (3. 5) (16 )
¿2 .50=μ
5
σ 2 N −n 4 ( ) 4−2
n N −1 2
= ( ) (4−1 )
5 2 5
V( ȳ ) =
¿ =
8 3 12 ()
Por lo tanto se ha demostrado que
n n
1 1
∑ E ( y i )= ∑ μ=μ
E( ȳ ) =
n i=1 n i=1
σ 2 N−n
y V( ȳ ) =
( )
n N−1
s 2 N −n
V( ȳ ) =
( )
n N −1
n
21
s= ∑ ( y i− y ) 2
Donde
n−1 i=1
Estimador de la media poblacional
n
∑ yi
μ= y =i=1
n
.
Varianza estimada
y de
¿
s 2 N−n
V ( y )=
n N ( )
n n
∑ ( y i− y ) 2
∑ y i2 −n ( y )2
s 2 = i=1 = i=1
donde n−1 n−1
s 2 N −n
√
¿
√
2 V ( y )=2
n N ( )
N n
la cantidad N se denomina corrección por población finita y difiere del valor encontrado
en la varianza verdadera
y de Cuando n es relativamente pequeña con respecto al tamaño
de la población N esta estará cerca de la unidad. lo cual hace despreciarla y yentonces s 2 la
varianza estimada de es n
Ejemplo
vuelva a l caso del auditor del hospital y suponga que una muestra aleatoria de n= 200 cuentas
y fue
es seleccionada del total de N= 1000. la media muestral de las cuentas = $ 94.22, y la
varianza muestral
s2 es
= 445.21. Estime , el promedio de la deuda para las 1000 cuentas
del hospital y establezca un límite para el error de estimación
solución
Utilizando y
= $ 94.22, para estimar . Un limite para el error de estimación puede ser
encontrado mediante
2
s N −n 445. 21 1000−200
√ √
¿
√
2 V ( y )=2
n N ( )
=2
200 1000 ( )
¿ 2 √1 .7808=2. 67
por lo tanto se estima que el valor medio por cuenta , yserá = $ 94.22. puesto que n es
grande, la media muestral tendrá una distribución aproximadamente normal, axial que
$ 94 . 22±$
es 2.
un67intervalo de confianza para la media poblacional de
aproximadamente 95%