Está en la página 1de 23

Captulo 16

16.

Estudios de muestreo1
16.1. Por qu tomar slo una muestra cuando la poblacin es finita?

Los estudios de muestreo son empleados por el eclogo que desea obtener informacin para construir mapas
de comunidades de plantas, por el silvicultor que desea conocer el rendimiento de madera de un bosque, y
por el gerente de un servicio de evaluacin (Rating) que desea determinar la popularidad de programas de TV
entre los televidentes. Los estudios tambin se usan para pronosticar la recoleccin de la cosecha, identificar
las condiciones sociales y econmicas prevalecientes, como desempleo, cuidado de la salud, e inflacin, y
para examinar las actitudes de personas hacia la legislacin propuesta. Un barmetro de opiniones pblicas,
tan importante para una democracia, se proporciona prontamente por los estimativos basados en una
muestra de la reaccin pblica a los efectos de tales eventos como una nueva regulacin salarial, un cambio
mayor en polticas de comercio, o las acciones de lderes mundiales.
Cuando cualquier caracterstica de la poblacin es de inters, un censo o una evaluacin completa de todos
los miembros de la poblacin puede proporcionar razonablemente toda la informacin deseada. Sin embargo,
las circunstancias a menudo no hacen posible una evaluacin tan extensa. Tanto consideraciones de costo
como la falta de personal calificado y, si se requiere, los equipos altamente especializados pueden limitar
severamente el tamao de un estudio propuesto. Por estas razones y/o cuando se desea obtener
rpidamente informacin bastante exacta, es prudente renunciar a un censo y estudiar una muestra
"representativa" de la poblacin en cuestin.
El propsito principal de este captulo es presentar al lector los procedimientos para recoger tal muestra y los
mtodos para analizar los datos muestreados. Cuando se planea y se ejecuta adecuadamente el estudio,
muestras consistentes de unos pocos centenares de unidades pueden proporcionar informacin exacta
acerca de una poblacin de centenares de miles.
Las tcnicas de la inferencia examinadas en este captulo no son diferentes de los procedimientos discutidos
anteriormente, excepto que los ltimos han estado basados principalmente en el supuesto de una poblacin
infinita donde una muestra aleatoria est conformada de variables aleatorias distribuidas independiente e
idnticamente. Los problemas del estudio de muestras tratados aqu involucran poblaciones finitas (aunque a
menudo bastante grandes) y con la excepcin del caso de muestreo simple con reemplazamiento, las
observaciones en estudios de encuestas no pueden, estrictamente hablando, ser consideradas
independientes.
Para facilitar una comprensin de la naturaleza del estudio muestral, que es comn a muchos campos de
aplicacin, empezamos con unas pocas definiciones y luego discutimos la idea de sesgo y el mtodo de
seleccin de muestras aleatorias. Seguidamente introducimos el concepto de estratificacin, que nos lleva a
un mtodo ligeramente ms complejo pero muy til de obtener una muestra representativa de una poblacin.
16.2. La especificacin de la poblacin y la caracterstica de inters
Una vez que se ha tomado la decisin de obtener informacin por medio de un estudio muestral, nos
enfrentamos inmediatamente con dos tareas: definir cuidadosamente la poblacin que deseamos estudiar, y
seleccionar la caracterstica o caractersticas para ser tomadas en cuenta.
La poblacin objetivo es la poblacin sobre la que nosotros deseamos hacer inferencias con base en una
muestra.

Traduccin del captulo 16 Sample Surveys del libro Statistical Concepts And Methods, Gouri K.
Bhattacharyya and Richard A. Jhonson. John Wiley and Sons, Inc. 1977. Traduccin por parte de
estudiantes del curso de Estadstica Matemtica I (semestre 02 de 2000) del Departamento de Ingeniera
Industrial de la Facultad de Ingeniera de la Universidad de Antioquia, con la recopilacin, correccin y
adaptacin del profesor Bernardo A. Caldern C.

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

Aunque especificar una poblacin puede parecer procedimiento sencillo, algunos casos dudosos pueden
presentar dificultades en estudios incluso muy simples. Para dirigir un estudio de las actividades de ocio de
estudiantes de la universidad, por ejemplo, tendramos que decidir si incluir o no los estudiantes de tiempo
parcial y estudiantes que estn tomando menos del nmero mnimo especificado de crditos porque
cancelaron cursos durante el semestre.
La poblacin a ser muestreada debe coincidir con la poblacin objetivo. Cuando la poblacin muestreada
difiere substancialmente siendo ms restrictiva, debe tenerse en cuenta que cualquier conclusin alcanzada
slo podra aplicarse a la poblacin muestreada. Una dificultad prctica mayor encontrada en esta fase puede
ser la construccin de una lista de todos los miembros de la poblacin a ser muestreada. Los miembros
individuales de la poblacin son llamados unidades de muestreo o unidades, y una lista de todos los
miembros de la poblacin se llama una estructura (o marco). Construir una estructura es una parte bsica de
cualquier proceso objetivo de seleccin de la muestra. Puede Usted imaginar las dificultades de construir
una estructura (marco) para gatos que viven en una ciudad o para las personas que beben excesivamente?,
Sin embargo normalmente es posible desarrollar una estructura razonablemente buena dedicndole algn
tiempo e imaginacin al problema de la estructura de la poblacin objetivo.
La caracterstica es la informacin bsica de inters acerca de las unidades de muestreo.
La caracterstica puede ser la opinin de una persona sobre los programas de bienestar o la cantidad de
dlares gastados en obras de caridad. Nuestra discusin en Seccin 16.3 ilustra los conceptos subyacentes
de estudio muestral (muestreo de encuestas) en trminos de una sola caracterstica, aunque varias
caractersticas se estudien simultneamente en la mayora de estudios a gran escala.
16.3. Muestreo Probabilstico
Una vez se han especificado la poblacin objetivo y las caractersticas, se enfoca la atencin en escoger un
mtodo para obtener una muestra que ser representativa de toda la poblacin en cuanto concierne a la
caracterstica particular de inters. Para ser capaces de emplear correctamente los mtodos estadsticos para
deducir inferencias sobre una poblacin a partir de una muestra, es esencial que la aleatoriedad entre en el
proceso de seleccin de una manera explcita. Especficamente, antes de que se haga la eleccin a partir de
la estructura, el mtodo de seleccin debera especificar la probabilidad de que cualquier miembro particular o
grupo de miembros sea incluido en la muestra. Todos los mtodos de muestreo que satisfacen este criterio
son llamados muestreos probabilsticos. Las probabilidades conocidas de las unidades de ser incluidas en la
muestra permiten determinar estimativos puntuales y de intervalos de confianza para el valor de una cantidad
(parmetro) de la poblacin. Las dos formas ms bsicas de muestreo probabilstico denominadas Muestreo
Aleatorio Simple y Muestreo Estratificado son examinados en este captulo.
Una muestra que no es al menos aproximadamente una muestra probabilstica se llama muestra no
probabilstica (no aleatoria). Los mtodos de muestreo no probabilsticos tienen el serio inconveniente de que
no puede darse ninguna valoracin de la varianza o de la incertidumbre del estimativo. Siempre que sea
posible, deben evitarse los mtodos de seleccin no probabilsticos.
16.4.

Sesgo y sus fuentes

En el muestreo probabilstico, se define el sesgo como la diferencia entre el valor esperado del estimador y la
cantidad de poblacin que est siendo estimada.
Sesgo = E ( estimador) (valor de la poblacin objetivo)
Cuando esta diferencia es cero, se dice que el estimador es insesgado. Cuando se escoge un estimador hay
que tener cuidado para estar seguro de que no est subestimando o sobrestimando sistemticamente la
cantidad poblacional. El criterio de no sesgo se usa para salvaguardar contra este problema indeseable.
En la literatura de estudios muestrales, la palabra sesgo tiene implicaciones ms amplias que las
incorporadas en las propiedades de la distribucin de un estimador. Cualquier fuente o causa que tienda a
hacer que el estimativo de la muestra difiera sistemticamente de la cantidad de la poblacin objetivo se llama
una fuente de sesgo. Escoger, por ejemplo, una frmula equivocada para un estimador puede ser una fuente
de sesgo, pero esto est lejos de ser la fuente ms importante de sesgo. Debido a un dispositivo de medida

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

defectuoso, las observaciones mismas de la muestra pueden diferir de lo que se intenta medir. Aunque se use
la frmula adecuada para un estimador insesgado, la muestra puede producir estimativos sesgados. Al
estimar el peso medio de una poblacin de nios, puede demostrarse que el peso medio muestral es un
estimador insesgado bajo el muestreo aleatorio simple. Pero si el nivel cero de la balanza del peso est en
error, cada medida ser afectada por este error constante y el estimativo ser sesgado. Los cuestionarios
pobremente redactados tambin pueden ser fuente de observaciones distorsionadas, debido a que los
encuestados pueden contestar frecuentemente las preguntas incorrectamente. Preguntas que son demasiado
tcnicas pueden generar muchas respuestas que son puras adivinanzas.
Aparte del sesgo introducido por un dispositivo de medida defectuoso, una fuente mayor de sesgo es a
menudo la existencia de una diferencia sustancial entre la poblacin muestreada y la poblacin objetivo. Una
de las situaciones ms dramticas en que se present este problema fue el fracaso de la encuesta de Literary
Digest para predecir un ganador en la eleccin en Estados Unidos 1936 entre los candidatos presidenciales F.
D. Roosevelt y A. Landon. Aunque se realiz una encuesta a gran escala, estos encuestadores sacaron su
muestra de fuentes tales como directorios telefnicos y listados de dueos de automvil. En esos das, tales
lujos eran mucho ms comunes entre los grupos de ingresos altos, y la muestra por consiguiente fall al no
representar adecuadamente los grupos de ingresos bajos. Dado que el apoyo para el candidato Republicano
era ms fuerte en clases de ingresos altos, la encuesta predijo errneamente la derrota para Roosevelt.
Adems, el muestreo fue no probabilstico; y no se poda establecer ningn lmite de error en el porcentaje
estimado de votos, incluso para la poblacin muestreada. La metida de pata fue realzada an mas por ignorar
el 75% de quienes no respondieron.
Otra fuente primaria de sesgo surge cuando hay un nmero grande de personas que no contestan la
encuesta. Quienes no contestan difieren tpicamente de los que responden con respecto a la caracterstica
estudiada, haciendo que la poblacin realmente muestreada sea bastante diferente de la poblacin objetivo. A
menudo se realiza un estudio de seguimiento de quienes no contestan para rectificar esta posible fuente de
sesgo. Adems, el sustituir unidades que estn convenientemente disponibles por unidades que no responden
puede introducir sesgo. Un entrevistador que no encuentra nadie en casa en la residencia designada puede
decidir entrevistar los vecinos, quines pueden tener un estilo de vida completamente diferente de los sujetos
designados inicialmente.
16.5.

Usando una tabla de nmeros aleatorios

Estamos ahora listos para examinar los aspectos tcnicos de la extraccin de una muestra aleatoria. Dada
una lista de miembros de la poblacin, podemos numerarIos de 1 a N y tambin podemos numerar un juego
de bolas pequeas de 1 a N. Estas balotas pueden ponerse entonces en una urna, mezcladas, y sacadas una
a la vez hasta que hayamos seleccionado n balotas donde n es el tamao deseado de la muestra. Los
miembros de la poblacin que correspondan a los nmeros de las bolas muestreadas pueden entonces ser
incluidos en la muestra, y las caractersticas de estas unidades pueden ser medidas.
Como se ilustra en la Seccin 16.6, se prefiere usar muestreo sin reemplazar una bola sacada antes de sacar
la prxima. Sin embargo, recordemos por el momento, los dos tipos principales de muestreo originalmente
examinados en el Captulo 5:
Muestreo aleatorio con reemplazamiento: Las balotas se reemplazan despus de cada extraccin individual
Muestreo aleatorio sin reemplazamiento: Las balotas no se reemplazan despus de cada extraccin individual
Si la poblacin es bastante grande, este mtodo mecnico de seleccin aleatoria puede ser difcil o
prcticamente imposible de implementar. Esto nos lleva a la consideracin de la tabla de nmeros aleatorios.
La Tabla 14 del apndice contiene 5000 dgitos. Idealmente, estos nmeros son generados por un mecanismo
tal que cada dgito es el resultado de un ensayo que consiste en una extraccin de un nmero de 0,1... ,9 con
una probabilidad igual a 1/10; los dgitos en posiciones diferentes son los resultados de repeticiones
independientes de tales ensayos. Como un primer procedimiento conceptual simple, suponga que las 10
balotas idnticas numeradas de 0, 1,...,9 son colocadas en una urna. Despus de mezclar las balotas, se saca
una a ciegas y su dgito es registrado. La pelota se devuelve a la urna, y el procedimiento se repite. Debido a
consideraciones prcticas, las tablas de nmeros aleatorios son generadas mediante un computador que
simula aproximadamente este procedimiento, y el conjunto resultante de nmeros son chequeados
cuidadosamente para verificar la conformidad con los requerimientos de independencia y de igual
probabilidad.

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

El modelo en que est basada la tabla de nmeros aleatorios asegura que todos los dgitos simples tienen la
misma probabilidad de ocurrencia de 1/10, que todos los pares de dgitos 00, 01, ...,99 tienen una probabilidad
de ocurrencia igual a 1/100, y as sucesivamente. Cmo puede ayudarnos tal tabla a escoger una muestra
aleatoria de una poblacin finita especfica? Para ilustrar el uso de la tabla de nmeros aleatorios, suponga
que tenemos 40 latas de sopas deshidratadas para acampar, y que deseamos tomar una muestra de tamao
n = 4 para estudiar su condicin. Nuestro primer paso es numerar las cajas de 1 a 40 o
apilarlas en algn orden de tal forma que puedan ser identificadas. En la tabla 14 del apndice, los dgitos
deben escogerse de a dos a la vez porque la poblacin de tamao N =40 es un nmero de dos dgitos.
Empezamos seleccionando arbitrariamente una pgina, una fila, y una columna de la tabla. Suponga que
nuestra seleccin es fila 60, y la columna 4. Leemos los pares de dgitos en las columnas 4 y 5,
13

02

18

74

39

13

74

33

Ignoramos los nmeros mayores que 40 y tambin cualquier nmero repetido cuando aparezca una segunda
vez, como el 13. Se contina leyendo pares de dgitos hasta que cuatro unidades diferentes hayan sido
seleccionadas.
13

18

33

Entonces se examinan los contenidos de las latas seleccionadas2.


Para muestreos a gran escala o las aplicaciones frecuentes, se recomienda usar la tabla Un milln de
nmeros aleatorios, publicada por la Rand Corporation, o un generador de nmero aleatorios de un
computador, adecuadamente probado.
16.6.

Muestreo aleatorio simple

Segn la terminologa establecida para muestreo de encuestas, el muestreo sin reemplazamiento es conocido
como muestreo aleatorio simple. Para ver por qu este mtodo siempre es preferido al muestreo con
reemplazamiento, suponga que tenemos N = 4 unidades1, 2, 3, y 4 en la poblacin, y que las
correspondientes medidas de las caractersticas son:
*

x1 = 5

x2 = 3

x3 = 1

x4 = 2

Para los propsitos de esta discusin, los valores podran ser el nmero de las personas que viven en cada
una de cuatro unidades habitacionales que constituyen una poblacin. Se realizar una comparacin entre el
muestreo aleatorio con y sin reemplazamiento para una muestra de tamao n = 2. Primero se listan todas las
posibles muestras no ordenadas de tamao n = 2, de acuerdo a los valores que pueden tomar las variables:
CON REEMPLAZAMIENTO
(5, 5) (3, 3) (1, 1)
(2, 2)
(5, 3) (3, 1) (1, 2)
(5, 1) (3, 2)
(5, 2)

SIN REEMPLAZAMIENTO
(3, 1) (1, 2)
(5, 1) (3, 2)
(5, 2)

En esta tabla, podemos observar que cualquier muestra que se pueda obtener en muestreo sin
reemplazamiento, tambin es posible obtenerla con reemplazamiento. Sin embargo, las muestras que
contienen valores repetidos no se pueden obtener al realizar el muestreo sin reemplazamiento. Dado que al
medir una unidad ms de una vez no se est obteniendo informacin adicional, es de esperase que con un
2

Se define un nmero aleatorio R como una variable aleatoria distribuida uniformemente entre cero y uno (0r<1), es decir,
cualquier valor en este rango tiene igual probabilidad de ocurrencia. Se denomina generador de nmeros aleatorios a
cualquier procedimiento que produzca nmeros entre cero y uno. Los nmeros generados, adems de distribuirse
uniformemente, deben ser independientes, de tal forma que los fenmenos que reproduzcan no estn correlacionados entre
s. Los nmeros aleatorios se usan en estudios de simulacin para reproducir otra serie de fenmenos o variables
aleatorias. Para el caso especfico de seleccionar aleatoriamente un miembro de una lista de N personas, se genera o
escoge un nmero aleatorio r, y se puede demostrar que el elemento seleccionado ser el que ocupe la posicin dada por
el resultado de multiplicar el nmero aleatorio r por el nmero de elementos de la lista N, sumarle uno y tomar la parte
entera del resultado, es decir, la posicin J seleccionada ser la parte entera de la siguiente expresin: J = [N r + 1]. Si
usramos este procedimiento para los nmeros aleatorios escogidos (0.13, 0.02, 0.18 y 0.33) las latas a muestrear seran
las correspondientes a los nmeros [40x0.13+1, 40x0.02+1, 40x0.18+1 y 40x0.33 1] = [6.2, 1.8, 8.2 y 14.2] = [6, 1, 8, y 14].

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

muestreo sin reemplazamiento tiende a recogerse mas informacin sobre la poblacin de la que puede
obtenerse con muestreo con reemplazamiento
.
Continuando con nuestro ejemplo, podramos preguntarnos que tanto se acerca la media muestral de

X =(X1+ X2)/2, a la media poblacional (5 + 3 + 1 + 2)/4 =2.75 en cada uno de los dos casos. Aunque en este
ejemplo conocemos la media de la poblacin, en aplicaciones reales no podra conocerse sin un censo
completo.
Muestreo con reemplazamiento
La muestra no ordenada (5,3) consta de la unin de [5 primero, luego 3] y [3 primero, luego 5]. La
probabilidad de cada una de estos dos ltimos eventos es 1/16, porque cada uno de los cuatro valores tiene
igual probabilidad de aparecer en cada experimento. Por consiguiente, para esta muestra, x =(5+3)/2=4 tiene
una probabilidad asociada de 2/16. Procediendo de esta manera, podemos obtener la distribucin completa
de x ; a partir de esta distribucin, se calculan la esperanza y la varianza.
Distribucin de
Valor de

Probabilidad

X=

X1 + X 2
2

1.5

2.5

3.5

1/16

2/16

3/16

2/16

3/16

2/16

2/16

1/16

E ( X ) = 1

1
2
1
+ 1.5 + ... + 5 = 2.75
16
16
16
1
2
1
2
E X 2 = 12 + (1.5) + ... + 5 2 = 8.656
16
16
16
2
Var ( X ) = 8.656 (2.75) = 1.094

( )

Muestreo sin reemplazamiento


Cada una de las seis muestras es igualmente probable al realizar el muestreo sin reemplazamiento.
Distribucin de
Valor de x
Probabilidad

X=

X1 + X 2
2

1.5

2.5

3.5

1/6

1/6

1/6

1/6

1/6

1/6

1
1
1
E (X ) = 1.5 + 2 + ... + 4 = 2.75
6
6
6
1
1
1
2
E X 2 = (1.5) + 2 2 + ... + 4 2 = 8.292
6
6
6
2
Var ( X ) = 8.292 (2.75) = 0.729
Usando cualquiera de los 2 mtodos de muestreo, la media muestral X presenta un valor esperado igual a
la media poblacional. Sin embargo, la varianza de X es ms pequea cuando se realiza el muestreo sin
reemplazamiento, de manera que la distribucin de X se concentra ms alrededor de la media. Estas

( )

conclusiones, que pueden demostrarse que son vlidas sin importar el tamao de la poblacin o de la
muestra, han respaldado el mtodo de muestrear sin reemplazamiento, es decir al muestreo aleatorio simple.

Antes de estudiar los estimadores, definamos las cantidades bsicas poblacionales dentro de un marco
*

conceptual general. La poblacin consista de N unidades donde la caracterstica tiene un valor de x i en la


*

unidad u1, x 2 en la unidad u2,... x N en la unidad uN . La media poblacional es entonces el promedio de las
caractersticas de todas las unidades:

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

Media poblacional = =

1 N *
x
ni =1 i

Cuando definimos la varianza poblacional sobre una poblacin finita, usamos el divisor N, y no N1, en
analoga con la frmula para varianza muestral. Estrictamente hablando, el trmino varianza poblacional
debera reservarse para la expresin con el divisor de N, pero aqu nos hemos tomado la libertad para evitar la
introduccin de la ltima cantidad3.

Varianza poblacional = 2 =

1 N
2
( x i )
N i =1

Un propsito principal del muestreo es tratar de obtener la media poblacional . Las inferencias acerca de la
media poblacin estn basadas en la media muestral X , calculada a partir de las n unidades seleccionadas
por el muestreo aleatorio simple. Por otra parte, la varianza poblacional desconocida puede estimarse usando
la varianza muestral S2
Muestra aleatoria simple: X1, X2,..., Xn

Media muestral= X =
Varianza muestral = S2 =

1 n
X
n i=1 i

1 n
X X
n 1 i=1 i

)2

Afirmamos, sin probar, que E( X )= (la media poblacional), por lo cual X es un estimador insesgado de .
Tambin, E(S2)=2, de tal manera que la varianza muestral es un estimador insesgado de 2. La varianza de

viene dada por:

V( X ) =

2 N n 2 N 1 ( n 1) 2
(1f ), donde f = n 1

=
n N 1 n
N 1
N 1
n

donde f = (n 1)/(N 1) es aproximadamente igual a la proporcin de la poblacin incluida en la muestra. Es


importante observar que el tamao finito de la poblacin reduce la varianza de X desde el valor para
2
2
poblacin infinita /n hasta (1- f)/n. El factor (1 - f) es llamado factor de correccin para poblacin finita.
Cuando la proporcin de muestreo f es menor que 0.1 puede ser ignorado.
Propiedades de

y S2 con muestreo aleatorio simple

E (X ) =

2
(1f ), donde f = n 1
n
N 1
2
2
E S =

Desviacin estndar estimada de X =


(1f )
n
V( X ) =

( )

Para aquellos que no estn muy familiarizados con el asunto, puede parecerles sorprendente que de
informacin muestreada de un pequeo porcentaje de la poblacin, se pueda determinar con una buena
3

En la versin original del libro, se calcula la varianza poblacional usando N-1 en el divisor y no N, y como
factor de correccin para poblacin finita se usa (N-n)/N y no (N-n)/(N-1).

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

precisin, un valor de la poblacin. La inspeccin de la expresin para Var(

), proporciona una explicacin

para ello, porque muestra que la desviacin estndar de X decrece esencialmente como 1/ n . Por
consiguiente, una muestra de unos pocos miles, produce un valor pequeo para la desviacin estndar del
estimativo

, cualquiera que sea el tamao de la poblacin.


Inferencias acerca de bajo muestreo aleatorio simple

Estimador puntual:

S
(1 f ),
Lmite aproximado del error al 95%: 2
n

f=

donde

El lmite de error

X + ... + X n
X= 1
n

2s 1 f / n

s =

n 1
N1

(X i X)
1

(n 1)

es aproximado, pero esta aproximacin es bastante buena cuando tanto

el tamao de la muestra n como N-n son muy grandes. Bajo estas circunstancias, la distribucin de
casi normal y

X 2s 1 f / n

puede considerarse como un intervalo de confianza del 95% para ..

es

Ejemplo 16.1 Alguien que est interesado en determinar como gastan su tiempo los directores de escuelas
primarias, realiza un muestreo aleatorio simple usando 12 escuelas de las 30 que hay en un distrito particular.
A los 12 directores se les pregunta cuanto tiempo a la semana necesitan para manejar problemas de
disciplina. De las respuestas se concluye que

S2=22.3
=9.1 horas
Obtenga un lmite aproximado del error al 95% para estimar , el nmero medio de horas semanales que
dedican a solucionar problemas disciplinarios todos los directores del distrito.
El estimativo es x =9.1, y el factor f=(n-1/(N-1) = 11/29=.38. El valor de f es demasiado grande para ser
ignorado, y el limite aproximado del error es:

s
n

(1 f )

= 2

22.3
12

0.62 = 2.15

Ejemplo 16.2 Se manifiesta el inters en conocer la cantidad de dinero que gastan los estudiantes cada mes
en alojamiento. Una muestra aleatoria de 160 estudiantes de una universidad que tiene una poblacin de
32,400 da las siguientes estadsticas, en US$:

=$105.30

S2=453.6

Encuentre un intervalo de confianza aproximado del 95% para la cantidad media poblacional. El intervalo de
confianza aproximado es

x2

s
n

1 f

= 105.3 2

453.6
159
= (101.94, 108.66)
1
32399
160

El factor de correccin finita puede ser ignorado porque es extremadamente pequeo. Ignorando este factor,
el intervalo de confianza ser (101.93, 108.67), que es casi igual al que calculamos antes.
Un resumen completo de la informacin obtenida de la muestra, requiere algo ms que el clculo de X y el
lmite del error. Los mtodos descriptivos discutidos en el Captulo 2 se aplican igualmente aqu. Debera
4

Para calcular el intervalo exacto se reemplaza 2 por t1 / 2,n 1 . Si n 30 el intervalo es exacto.

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

construirse un histograma para obtener una visin de la manera en que los valores se distribuyen sobre la
poblacin. Tambin es aconsejable el registro de cualquier valor extremo y calcular otras medidas
descriptivas si la distribucin no parece ser simtrica.
16.7.

Muestreo para determinar una proporcin

Algunas veces deseamos estimar en la poblacin la proporcin de unidades que tengan cierto atributo. sta
puede ser la proporcin de personas desempleadas o la proporcin de electores que apoyan un asunto
particular. El valor 1 se le asigna a las unidades que tienen el atributo de inters, y el valor 0 a las restantes
unidades. De este modo, la poblacin se divide en dos grupos o tipos, segn el valor numrico de la
caracterstica. Bajo el muestreo aleatorio simple, referido como "muestreo sin reemplazamiento", se sabe que
la distribucin hipergeomtrica describe el nmero de unidades X en la muestra que poseen el atributo en
cuestin.
La tabla siguiente presenta las composiciones de la poblacin y de la muestra:
Poblacin

Muestra

Total numero de unidades

Cantidad

Nmero de unidades con el atributo dado

Proporcin de unidades con el atributo dado

X
M
N

p=

x
n

La proporcin muestral es un estimador insesgado

X
E ( P ) = E =
n
y la varianza est dada por

Var (P) =

(1 ) N n

n N 1

Por supuesto, podramos estimar esta varianza reemplazando por X / n . Sin embargo, generalmente se
emplea el siguiente estimador insesgado

P(1 P ) N n

n 1 N 1

Los procedimientos de inferencia para proporciones y para totales pueden resumirse en:
Los resultados para la poblacin total M se derivaron de:
Muestreo aleatorio simple: Inferencia sobre proporciones.

X
n
P(1 P ) (N n)
2
(n 1) (N 1)
P=

Estimador puntual de p:
Lmite aproximado del error al 95% para p:

M=N

Estimador puntual del total de la poblacin M =Np:


Lmite aproximado del error al 95% para M: 2

X
X
E N = NE = N
n
n
y

X
= NP
n

2 P(1 P) N n

n 1 N 1

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

P(1 P ) (N n)
X
X
Var N = N2 Var =N2 Var (P ) =N2
n 1 (N 1)
n
n
En el captulo 5, concluimos que el muestreo sin reemplazamiento es casi lo mismo que el muestreo con
reemplazamiento cuando el tamao de la poblacin N es grande y la fraccin de muestreo (n1)/(N-1) es
pequea. Para muestreo con reemplazamiento se aplica la distribucin binomial, y la varianza de X/n es
(1-)/n, la cual difiere de la expresin anterior por la ausencia del factor (N - n)/(N - 1). Este factor hace la
varianza ms pequea para muestreo aleatorio simple. En todo caso, incrementando el tamao de la muestra
n, la varianza del estimador X/n decrece a la tasa 1/n. Una conclusin es que la varianza de la proporcin de
votos a favor basada en un tamao de muestra de 5000 es aproximadamente igual para poblaciones de
100.000 y un milln. Este resultado, que no es intuitivo, explica parcialmente por qu las predicciones de
elecciones modernas basadas en solamente una pequea fraccin del electorado a menudo son tan exitosas
en pronosticar los resultados de la eleccin.
Ejemplo 16.3. Suponga que tenemos una poblacin de tiendas de campaa u1, u2, u3, u4, u5, u6, donde u2 y u4
no son hermticas. Consideremos estimar la proporcin de tiendas de campaa defectuosas en la poblacin
con base en una muestra aleatoria simple de 2.
Cada una de las siguientes muestras son igualmente probables; los valores para X = nmero de tiendas de
campaa defectuosas en la muestra estn dados en parntesis:
u1 ,u 2(1)
u1 ,u 3(0)
u1 ,u 4(1)
u1 ,u 5(0)
u1 ,u 6(0)

u 2,u 3(1)
u2 ,u 4(2)
u2 ,u 5(1)
u2 ,u 6(1)

u3 ,u 4(1)
u3 ,u 5(0)
u3 ,u 6(0)

u4 ,u 5(1)
u4 ,u 6(1)

U5,u 6(0)

La distribucin de X y la media para esta poblacin son:


X
P(X=x)

6/15 8/15

2
1/15

E(X)= 0 x 6/15 + 1x 8/15 + 2x 1/15 = 2/3


E(X/n)= 1/2 x 2/3 = 1/3

Observe que E (X/n) = 1/3, que corresponde a la proporcin de la poblacin. El estudiante interesado tambin

2 4 6
/
x 2 x 2

debera verificar que P [X = x] est dada por la distribucin hipergeomtrica:

Si nuestra muestra consta de u2 y u5, entonces nuestra estimacin de la proporcin poblacional es 1/2, y la
varianza estimada de la proporcin de la muestra es:

1
1 ( 6 2) 1
=
1
2 2 6( 2 1) 6

Ejemplo 16.4. Para investigar irregularidades electorales, una muestra aleatoria simple de tamao 60 es
tomada de la lista de 1024 votantes inscritos en un barrio particular. Se encuentra en la muestra que 12
personas se registraron en direcciones inexistentes.
Qu podemos estimar para el barrio?
Tenemos que: N = 1024, n = 60, y x = 12, de tal manera que

x 12
=
= 0 .2
n 60
es una estimacin de la proporcin poblacional. La varianza de P es estimada por:
(1024 60 ) = 0.0026
Var (P)= (0.2)(0.8 )
1023(60 1)
P=

El lmite del error al 95% es 2 0.0026 = 0.10 . De modo semejante, (0.2)(1024)=204.8 es una estimacin
del nmero total registrado en direcciones inexistentes.

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.


16.8.

10

Muestreo aleatorio estratificado

El objetivo principal de un diseo muestral es hacer uso eficiente del presupuesto asignado para un estudio
obteniendo un estimativo tan preciso como sea posible de una cantidad de la poblacin. El muestreo aleatorio
simple es la tcnica de muestreo ms bsica que no slo asegura una muestra representativa sino que
tambin produce una estimacin de la cantidad de una poblacin y una especificacin de la precisin.
Muchas ramificaciones han evolucionado a partir de este concepto central del muestreo aleatorio simple que
permite alcanzar inferencias ms precisas para diferentes tipos de poblaciones. Uno de los diseos
prcticamente ms tiles, llamado muestreo aleatorio estratificado, primero divide la poblacin en segmentos
homogneos y despus toma muestras aleatorias simples de esas subpoblaciones individuales.
Al principio, puede parecer sorprendente que la tcnica del muestreo aleatorio simple pueda ser mejorada.
Para clarificar este punto, consideremos una ciudad en la cual los distritos del norte son predominantemente
reas con altos ingresos y los distritos del sur son primariamente reas con bajos ingresos. Para determinar
el costo promedio de vivienda en toda la ciudad, es intuitivamente aparente que muestras aleatorias simples
relativamente pequeas tomadas separadamente de cada uno de los distritos, es probable que muestren
informacin ms exacta que un nico muestreo tomado en toda la ciudad. La esencia de la estratificacin es
que sta saca provecho de la homogeneidad conocida de las subpoblaciones, de tal forma slo se requieran
muestras relativamente pequeas para estimar las caractersticas de cada subpoblacin. Estas estimaciones
individuales pueden entonces ser fcilmente combinadas para producir una estimacin de toda la poblacin.
Adems de la economa en el tamao de la muestra, un valioso subproducto del esquema de muestreo
estratificado es que las estimaciones obtenidas para diferentes partes de la poblacin se pueden usar
posteriormente para hacer comparaciones.
Para una descripcin general del muestreo aleatorio estratificado y los mtodos de inferencia asociados con
este procedimiento, suponemos que la poblacin est dividida en h subpoblaciones o estratos de tamaos
conocidos N1, N2,...,Nh tal que las unidades en cada estrato sean homogneas respecto a la caracterstica en
2
cuestin. La media y la varianza desconocidas para el i-simo estrato son denotadas por i y i ,
respectivamente.
Estructura de poblacin
Estrato
1
N1
1
2
i

Tamao (conocido)
Media
Varianza

2
N2
2
22

........
........
........
........

h
Nh
h
2
h

Tamao de toda la poblacin: N = Ni


i=1

Media de toda la poblacin:

h
= N i i / N
i =1

El muestreo aleatorio estratificado consiste en tomar muestras aleatorias simples independientes de tamaos
predeterminados n1, n2,...,nh de los estratos 1, 2, 3,...., h, respectivamente, y medir la caracterstica para cada
unidad muestreada. Denotando la j-sima observacin del i-simo estrato por Xij podemos registrar el
resumen de estadsticas:
Estratos
Tamao de cada muestra
Media muestral
Varianza muestral
Donde Xi =

1 ni
Xij
ni j = 1

Estructura de la muestra
1
2
n1
N2

...

h
nh

X1

X2

Xh

S12

S2
2

2
Sh

1 ni
2
Xij Xi
Si2 =
ni 1 j = 1

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

11

Aplicando la propiedad del muestreo aleatorio simple a las subpoblaciones individuales, la media muestral

i un estimador insesgado de ui y su varianza es


Var (

i)=

i2
1 ni
ni Ni

porque la media global de la poblacin es el promedio ponderado:

N
N
N
= 1 1+ 2 2+ ...+ h h
N
N
N

donde cada Ni es un tamao de subpoblacin conocida, un estimador insesgado de se obtiene como:

N
N
N
Xst = N1 X1+ N2 X2 + ...+ Nh Xh
El sufijo st indica el hecho de que el estimador es construido a partir de muestras estratificadas. Adems,
debido a la independencia de las muestras, la varianza de Xst es la suma de las varianzas de las
componentes, donde:

2
N i2 i2 n i 1
Ni N i
1

Var (Xi )=
Var Xi =

N N2
N 2 ni Ni 1
Al establecer los limites de error y los intervalos de confianza, la varianza desconocida

puede estimarse

por la correspondiente varianza muestral simple si2 .

Estimacin de por muestreo estratificado


1 h
Estimador puntual: Xst = N1 X1+ N2 X2 + ...+ Nh Xh = Ni Xi
N
N
N
N i=1
E( X st ) =

2
2
2
(
(
1 2 (N1 n1) 1
N 2 n 2 ) 2
N h n h ) h
2
2

Var (X st ) =
+ N2
+ ... + N h
N1
N1 1 n1
N2 1 n 2
Nh 1 n h
N 2

2
( N i n i) i
1 h
2
=
Ni
Ni 1 ni
N2 i =1
Lmite aproximado del error al 95% para :

2
Xst N Ni
i=1

(Ni ni) Si2


Ni 1 ni

Incidentalmente, debera observarse que el estimador insesgado Xst es generalmente diferente de la media
muestral combinada

X = n1 X1+ n2 X2 + ...+ nh Xh,


n
n
n
Sin embargo,

donde

n= ni
i=1

st coinciden cuando los tamaos de muestra de los estratos prueban cumplen que

n1 = N1, n2 = N2 ,..., nh = Nh
n

N n

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

12

Esta situacin se la denomina asignacin proporcional debido al hecho de que el tamao de la muestra total n
es asignado a los diferentes estratos en forma proporcional al tamao del estrato.
Ejemplo 16.5 Cada rbol en el huerto de manzanas mostrado en la figura 16.1 est marcado con su cosecha
medido en fanegas (medida para granos equivalente a 38.23 litros). Los rboles de las tres ltimas filas son
ms jvenes que los otros. Estime la cosecha media de la poblacin por rbol, basado en muestras
estratificadas de tamao 6 para la subpoblacin de las primeras cinco filas y de tamao 2 de la subpoblacin
de las ltimas tres filas.

7
5
4
6
6

8
4
7
4
3

Produccin del Huerto de Manzanas


5
6
6
10
4
7
6
6
8
10
8
4
6
4
8
7
9
9
7
8

7
3
6
9
11

6
8
6
8
9

6
5
4

3
3
5

4
3
4

4
3
3

3
4
6

3
4
3

5
5
3

2
4
4

Figura 16.1 La huerta de manzanas del ejemplo 16.5, indicando la cosecha en fanegas para cada rbol
Aqu, N1 = 40, N2 = 24, n1 = 6, n1 = 2.
Leyendo parejas de nmeros de una tabla de nmeros aleatorios, uno por fila y uno por columna,
seleccionamos rboles con los valores:
__
Estrato 1:
6
4
7
6
7
9
X1 = 6.5, s12 = 2.7
__
Estrato 2:
5
4
X2 = 4.5
s22 = 0.5

Nuestro estimador puntual de es:

40
24
N
N
Xst = N1 X1+ N2 X2 = 64 6.5 + 64 4.5 = 5.75
con un lmite del error del 95% de:

2
(N )
2 (N ) S
N12 1 n1 1 + N22 2 n2

N
1
n1
N2 1
N1

1/ 2

S2
2

n2

1/ 2
2 2 ( 40 6 2.7
2 (24 2) 0.5
)
+
40 40 1 6 24 24 1 2 = 0.86
64

Comenzamos esta discusin declarando que pueden hacerse inferencias ms precisas con respecto a las
diferentes poblaciones usando muestreo estratificado que usando muestreo aleatorio simple. Consideremos
ahora una situacin ideal para ver por qu esto es verdad. Suponga que deseamos obtener informacin sobre
salarios y que la oficina de nmina nos dice que N1=20 obreros estn en un nivel salarial y N2=4 estn en otro.
Claramente, dada esta estratificacin, tomando una muestra de tamao 1 de cada estrato se mantendra el
sueldo medio correcto con respecto a la poblacin de 24 obreros. Si se tomara una muestra aleatoria simple,
la media de las dos observaciones de la muestra sera todava insesgada. Sin embargo es posible que las dos
observaciones pudieran seleccionarse del mismo estrato. Si los niveles de salario de los dos estratos fueran
$100 y $400, por ejemplo, entonces la media de la muestra seria $100, $250 $400. Esta estimacin variar
en repetidas observaciones de la muestra, mientras que el muestreo estratificado proporciona un resultado
exacto. Una comparacin similar se extiende a situaciones ms prcticas cuando la poblacin se divide
internamente en estratos homogneos.
Ejemplo 16.6. Compare la varianza de [, basada en una muestra aleatoria simple de tamao 8, con la
varianza de [st para el huerto de manzanas dado en la figura 16.1.
Los clculos que involucran los registros de produccin de N = 64 rboles en la poblacin entera nos da:

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

13

Media de la poblacin:
= 5.5625
2
Varianza de la poblacin: = 4.66
y clculos por separado para los primeros 40 rboles del primer estrato y para el segundo estrato de 24
rboles nos da:
Media i
Estrato 1
Estrato 2
Por consiguiente, con
Muestreo Aleatorio Simple

V( X )=

Varianza

6.635
3.795

i2

3.984
0.781

Muestreo Aleatorio Estratificado

n 1
2
)
(1
N 1
n

V( Xst ) =

2
2
1 2 (N1 n1) 1
2 (N2 n2) 2
+
N1

N2 2 1
n2
N1 1 n1
N2

7
4.66
)
(1
63
8

Var ([st) =

1 2 ( 40 6) 3.98
(24 2) 0.781
+ 242
2 40
39
6
23
2
64

Var ([) =

= 0.52

= 0.28

y el estimador basado en muestreo estratificado tiene una menor varianza.


16.9.

Asignacin de tamaos de muestras

Aunque el tamao total de la muestra n est generalmente limitado por el presupuesto disponible para el
estudio, la asignacin del tamao de la muestra de cada estrato depende del criterio del investigador.
Intuitivamente, la opcin ms plausible es la asignacin proporcional que relaciona los tamaos de las
muestras de los estratos en proporcin a los tamaos de las subpoblaciones.

Asignacin proporcional:

Ni
ni = n
N

i = 1..h

La asignacin proporcional est motivada por el concepto de una muestra representativa: si un estrato
comprende una gran porcin de la poblacin total, deber contribuir en buena proporcin a la muestra.
Debido a que nuestra principal meta es mejorar la precisin de nuestra estimacin (es decir reducir su
varianza), un criterio ms importante de asignacin de los tamaos de muestras debe ser la minimizacin de

Var (Xst ) . Esto es factible cuando las varianzas de los estratos i2 son conocidas, o al menos cuando hay

disponibles algunas estimaciones de stas mediante una prueba piloto. Especficamente, la asignacin n1, ,
nk con (n1 + + nk ) = n fijo que minimiza Var Xst est dado por:

( )

Asignacin ptima : n i = n

N i i
h
N j j
j =1

Esto requiere que el tamao de la muestra sea proporcional al producto del tamao del estrato y la desviacin
estndar del estrato. Cuando todas las desviaciones estndares de los estratos son iguales, la asignacin
ptima coincide con la asignacin proporcional.

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

14

Ejemplo 16.7 Los tamaos de tres pequeos pueblos son: N1 = 40,000, N2 = 20,000 y N3 = 30,000. Se va
a tomar una muestra aleatoria estratificada aleatoria con un tamao total de muestra de n = 400. Determine el
tamao de la muestra que debe ser tomada de cada pueblo utilizando (a) asignacin proporcional y (b)
asignacin ptima cuando de un estudio previo se conocen estimativos burdos de las desviaciones
estndares, que son 1 = 20, 2 = 12 y 3 = 14.

(a) asignacin proporcional:


Ni
n1 = n = 400(4/9) = 178
N

Ni
Ni
n2 = n = 400(2/9) = 89 n 3 = n = 400(3/9) = 133
N
N

(b) asignacin ptima:


N11 = 800,000
N22 = 240,000
N33 = 420,000
Total = 1,460,000
n1 =

n3 =

N 1 1

800
= 400
= 219
1460
Ni i

n2 =

N 2 2

240
= 400
= 66
1460
Ni i

N 3 3

420
= 400
= 115
1460
Ni i

Concluimos esta discusin planteando las situaciones para las cuales la estratificacin es una tcnica de
muestreo beneficiosa. Primero, la estratificacin generalmente crea una reduccin en la varianza del
estimador de una caracterstica de una poblacin. Esta reduccin puede ser sustancial si cada estrato es
homogneo pero difiere de los otros con respecto a la caracterstica. Segundo, si se requieren estimativos
para ciertas subdivisiones de una poblacin, puede ser til tratar las subdivisiones como estratos para obtener
estos estimativos. Por ejemplo, podemos querer estimar los ingresos de los miembros de cierto grupo
minoritario mientras realizamos un estudio de los ingresos de una poblacin urbana.
16.10.

Muestreo estratificado para determinar una proporcin

Las tcnicas de estratificacin tambin proveen estimaciones mejoradas de la proporcin de la poblacin. La


notacin y la estructura son:
Estratos
1

....

Combinado

N1

N2

....

Nh

N = Ni

Poblacin

Tamao

i=1

Proporcin

....

h N ip i
=
i =1 N

Tamao

n1

n2

....

nh

n = ni

Conteo

X1

X2

....

Xh

Muestra

Proporcin

P1=

X1
n1

P2 =

X2
n2

....

Ph =

i=1

Xh
nh

Las frmulas para el estimador insesgado de la proporcin de la poblacin y su error estndar se obtienen
exactamente de la misma forma que se obtiene el estimador de la media de la poblacin.

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

15

Muestra estratificada: Inferencia sobre una proporcin

1
N
N
N
Estimador puntual: P st = 1 P1+ 2 P 2+...+ h Ph =
Ni Pi
N

Lmite del error aproximado al 95%:

Ni = 1

2
2
h Ni (Ni ni) P (1 P )
h
2
i
i = 2 Ni (Ni ni) Pi (1 Pi)


N i = 1 Ni 1
ni 1
ni 1
i = 1 N Ni 1

Con relacin a la asignacin de los tamaos muestrales, la distribucin proporcional ni=n(Ni/N) puede
implementarse convenientemente. La asignacin ptima que minimiza la varianza de Pst requiere que ni sea
proporcional a

(1 ) , o
i
i
Asignacin optima

Ni i (1 i )
ni = n
h
N j j (1 j )
j=1

Obviamente, una implementacin de la asignacin ptima requiere algn conocimiento previo acerca del valor
aproximado de la proporcin de cada estrato i.
Muchos estudios, particularmente los que consisten en enviar un cuestionario por correo a un nmero de
personas seleccionadas, son frecuentemente puestos en peligro porque hay un gran nmero de personas que
no responden. Si un estudio requiere informacin sobre el salario actual de los que se han graduado alrededor
de 1975, las personas que ganan bajos salarios estn menos dispuestos a responder que las personas que
ganan salarios altos. El estimativo muestral estar entonces seriamente sesgado hacia el lado de los de altos
salarios. Para remediar esto, podramos considerar los que no responden como un estrato e iniciar algn tipo
de entrevistas de seguimiento hasta obtener la informacin necesaria de al menos unos pocos de los que no
responden. Podramos entonces combinar esta informacin con los datos obtenidos previamente para llegar al
estimador de toda la poblacin.
Ejemplo 16.8 Ciertos estudiantes que van a una gran universidad del medio oeste, y viven en apartamentos,
son encuestados por telfono. Una de las preguntas de la encuesta es si se les exigi o no un depsito de
seguridad para el apartamento. Originalmente, 200 estudiantes fueron seleccionados de un directorio del
campo universitario, ignorando aquellos estudiantes que viven en otras residencias. Los depsitos de
seguridad fueron requeridos para 108 de 160 estudiantes que respondieron en tres intentos de la encuesta.
Los 40 que no respondieron fueron tratados como un estrato y 4 fueron seleccionados aleatoriamente para ser
tenidos en cuenta en un estudio de seguimiento. De los 4 estudiantes, a uno se le solicit hacer un deposito
de seguridad.
Estime la proporcin de estudiantes que viven en apartamentos a quienes se les solicit hacer un depsito de
seguridad.
Podemos suponer que la poblacin se divide en dos estratos en las mismas proporciones que aquellas que se
observaron en la muestra. En otras palabras, asumimos que N1/N es lo mismo proporcin que 160/200 =.8, y
que N2/N es lo mismo que 40/200=.2. El estimador se convierte entonces en

108
1
+ 0.2 =0.59
160
4

pst = N1p1+ N2 p2 =0.8


N

Tomando los factores 1 (n1-1)/(N1-1) y 1 (n2-1)/(N2-1) como 1, el lmite aproximado del error con una
confiabilidad del 95% puede escribirse

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

16

1/ 2

(0.8 )2 108 52 (0.2)2 1 3

160 60

4 4
2
+

159
3

16.11.

= 0.116

Otros mtodos de muestreo

La aleatorizacin y la estratificacin constituyen los conceptos bsicos del muestreo. Sin embargo, se han
diseado muchos otros mtodos bien sea para explotar estructuras especficas de la poblacin o por
conveniencia administrativa. Aqu describiremos algunos de estos mtodos adicionales y discutiremos sus
ventajas y desventajas.
16.11.1. El Muestreo Sistemtico
Como el nombre lo sugiere, el muestreo sistemtico, implica seleccionar las unidades de manera sistemtica y
por lo tanto de una manera no aleatoria. El propsito de esta tcnica es usualmente seleccionar unidades de
manera uniforme por toda la poblacin. Especficamente si k = N/n, donde N es el tamao de la poblacin y n
es el tamao de la muestra deseado, este mtodo toma una unidad de los primeros k elementos de la
poblacin y a partir de ah cada k-simo elemento. Generalmente se introduce un factor aleatorio, escogiendo
la primera unidad al azar. Sin embargo, la seleccin de la primera unidad determina el resto de los elementos
escogidos en la muestra.
La mayor ventaja del muestreo sistemtico es su conveniencia operacional, especialmente cuando la muestra
debe ser seleccionada de una lista, como una lista de estudiantes, un directorio telefnico o un grupo de
tarjetas. El muestreo sistemtico puede mirarse como una aproximacin al muestreo aleatorio simple si el
orden en la lista no es relevante a la caracterstica en cuestin, como por ejemplo la "edad del estudiante"
cuando la lista est organizada en orden alfabtico segn el apellido. Tambin, si se miran los conjuntos
consecutivos de k unidades como estratos, un muestreo sistemtico tendr la apariencia de un muestreo
estratificado. Sin embargo, el rendimiento de una muestra sistemtica puede ser muy inferior al de un
muestreo estratificado correctamente ejecutado, debido a que en este caso los estratos son construidos
arbitrariamente sin considerar la homogeneidad interna.
A pesar de todo lo atrayente que pueda parecer, el muestreo sistemtico a menudo produce una muestra no
representativa cuando la lista contiene alguna periodicidad escondida. Por ejemplo, en una lista de jugadores
de ftbol, organizados por equipo, un muestreo sistemtico de cada primer lugar podra contener solo los
nombres de los arqueros.
16.11.2. El Muestreo por Conglomerados
En muchas situaciones puede lograrse un ahorro substancial en los costos haciendo un anlisis con grupos o
conglomerados de unidades muestrales seleccionados al azar, en lugar de hacer un muestreo aleatorio simple
de toda la poblacin. Suponga que se va a seleccionar una muestra de la poblacin de todos los estudiantes
de quinto grado de una regin en particular. Podemos ver cada escuela en dicha regin como un
conglomerado de las unidades muestrales bsicas, los estudiantes de quinto grado. En el muestro por
conglomerados, primero escogemos una muestra aleatoria de unas pocas escuelas en la regin y luego se
entrevistan todos los estudiantes de quinto en dichas escuelas.
Recolectar una muestra aleatoria simple de un tamao comparable, es excesivamente costoso por dos
razones. Primero, para construir una poblacin, debemos hacer una lista de todos los estudiante de quinto
grado en todas las escuelas de la regin. Segundo, los elementos seleccionados en un muestreo aleatorio
simple estarn tpicamente distribuidos por toda la regin, y los gastos de los viajes de los entrevistadores
sern considerablemente altos. El muestro por conglomerados evita la necesidad de construir una poblacin
objetivo con todos los elementos posibles, lo cual es generalmente un trabajo extenuante y costoso en s
mismo. Adicionalmente, debido a que las unidades en los conglomerados son adyacentes entre s y por la
misma razn, fciles de localizar, el proceso de muestreo es notablemente rpido. Sin embargo el precio que
hay que pagar es la reduccin en la precisin de los estimativos. Una muestra aleatoria simple de 400
estudiantes generalmente representa mejor una poblacin, y por consiguiente provee mejor informacin sobre

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

17

la poblacin, que un grupo de 100 estudiantes analizados en cada una de las cuatro escuelas especificadas.
Por eso la eleccin entre los dos mtodos de muestreo debe ser guiada por consideraciones de costo y por el
grado de precisin deseada en los estimativos.
La mayora de los resultados de las encuestas de muestreo, tales como la encuesta Gallup, los ndices de
precios al consumidor, y las cifras de desempleo que aparecen regularmente en los peridicos y otros medios
de informacin masivos, no solo emplean estratificacin y muestreo aleatorio sin reemplazamiento sino que
tambin utilizan estratos dentro de estratos o incluso una combinacin de muestreo por conglomerados y
muestreo estratificado. A veces se usan mtodos ms sofisticados como el muestreo doble y el muestreo
probabilstico proporcional al tamao para obtener muestras representativas y estimadores precisos. Las
ideas presentadas aqu ofrecen tan solo una introduccin a algunos de los conceptos bsicos que definen el
la planeacin de un muestreo por encuestas. Cochran[2] es una excelente referencia para estudiantes
interesados en familiarizarse con tcnicas de muestreo avanzadas.
Cuando se emplea un mtodo de muestreo no probabilstico, deben tomarse precauciones extras para evitar
el sesgo. Si al entrevistador se le da demasiada amplitud, puede incluir en la muestra los individuos fciles de
contactar. Las opiniones de la gente que camina al medio da en las calles de una gran ciudad, pueden diferir
de aquellas que estn en sus casas al medio da; un estimativo de la proporcin de los estudiantes que no
trabajan en vacaciones, ciertamente no puede estar basada en las muestras recogidas en una playa.
16.12.

Planeacin de un estudio muestral

En las secciones previas presentamos unos pocos mtodos bsicos de muestreo y de procedimientos de
inferencia asociados con el muestreo aleatorio simple y estratificado. Planear y elaborar un estudio muestral
es usualmente un proceso mucho ms intrincado que requiere cuidadosa reflexin de las complejidades
involucradas en la estructura de una poblacin, en la factibilidad prctica de los mtodos de muestreo, en la
coordinacin y supervisin del trabajo de campo, y finalmente, en el procesamiento y anlisis de los datos.
Para presentar brevemente estos elementos, analizaremos a continuacin los pasos principales involucrados
en la planeacin y la ejecucin de una encuesta. Debido a la diversidad de poblaciones al igual que a las
facilidades y que el personal disponibles para un muestreo pueden presentar diversas dificultades al ejecutar
un estudio; nuestra exposicin tratar de ser ilustrativa en lugar de exhaustiva.
Propsito del Estudio
La necesidad de una clara definicin del propsito del estudio no puede ser sobredimensionada. Sin
establecer el objetivo de una investigacin, incluyendo lo que esperamos aprender de los datos, cualquier
deliberacin acerca de la eleccin de diferentes mtodos de muestreo no tendra ningn significado. Si no se
sabe lo que se est buscando, no se sabr donde buscar. La recompensa, por el cuidado y la planeacin
invertidos en la definicin inicial del propsito de un estudio tan especficamente como sea posible, es que la
informacin vital no ser pasada por alto cuando las unidades sean muestreadas.
Poblacin Objetivo
La poblacin de la cual se hacen las inferencias, llamada poblacin objetivo, debe ser definida tan claramente
como sea posible. En el transcurso del desarrollo de un estudio, debe tenerse cuidado en asegurar que la
poblacin muestreada no se desve drsticamente de la poblacin objetivo. Cuando la poblacin muestreada
se restringe por conveniencia prctica, debemos ser precavidos al extender las inferencias a la poblacin
objetivo.
Que Datos Deberan Recogerse?
Guiado por la declaracin del propsito, debemos determinar la naturaleza de los datos que se han de recoger
de las unidades muestreadas. Debe tenerse cuidado especial para incluir todos los datos esenciales y, al
mismo tiempo, evitar recoger datos que son irrelevantes al propsito del estudio. Al muestrear poblaciones
humanas, el vehculo primario para obtener los datos es el cuestionario, y un cuestionario bien diseado es
crucial para el xito de la encuesta. Frecuentemente hay una tendencia a preparar cuestionarios demasiado
largos, pensando errneamente que darn mucha ms informacin. Por el contrario, una cantidad
inusualmente grande de preguntas puede aburrir al encuestado y puede disminuir la calidad de los datos
recolectados sobres puntos vitales. El propsito del estudio debe ser tenido en mente mientras se disea el
cuestionario y las preguntas deben ser cuidadosamente pensadas para evitar guiar las respuestas en
cualquier direccin. Una pregunta no debe indicar la respuesta deseada (Evite preguntas como: "No cree
usted que...?"). Por otro lado una pregunta no debe ser redactada de una manera ambigua. La pregunta
"Cuantas personas que no trabajan hay en su familia?", no indica si deben incluirse o no los nios,

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

18

estudiantes o jubilados. Por encima de cualquier otra consideracin, las preguntas deben limitarse a puntos
relevantes, y la brevedad debe ser una consideracin primaria. Cada pregunta debe pasar esta prueba: Qu
informacin pertinente dar la respuesta?.
Qu mtodo de Muestreo debe ser Utilizado?
Determinar el mtodo de muestreo a ser usado y la escogencia del tamao de la muestra son elementos
importantes en la planeacin de un estudio. La seleccin de una mtodo de muestreo apropiado se basa en
factores como la estructura de la poblacin, el tipo de informacin buscada y, las facilidades administrativas y
el personal disponible para ejecutar el estudio. Junto con la eleccin del mtodo apropiado de muestreo, debe
determinarse el tamao de la muestra especificando el grado de precisin deseado en los estimadores.
Tambin debe verificarse si el tamao elegido de la muestra es factible con el presupuesto destinado para el
estudio.
Estudio Piloto
Con frecuencia, es conveniente gastar una porcin del presupuesto en realizar un estudio a pequea escala
llamado prueba piloto o pre-test. Una prueba piloto es la oportunidad de poner a prueba el cuestionario para
detectar y corregir cualquier irregularidad seria o situacin inadecuada. Una encuesta piloto tambin puede
dar informacin o sugerencias para mejorar el diseo del estudio. En el muestreo estratificado, por ejemplo, la
informacin sobre las varianzas puede obtenerse a partir del estudio piloto, informacin que puede ser
utilizada para lograr una eleccin ms adecuada (cerca de la ptima) de los tamaos muestrales en el estudio
a gran escala.
Anlisis de los Datos
Una vez que se ha completado la encuesta, la fuerza de las tcnicas grficas y numricas puede ser
empleada en su totalidad para interpretar los resultados. Histogramas y tablas de frecuencia conjuntas
ayudan a mostrar la correlacin entre las respuestas. Inventiva en crear grficos puede sugerir interesantes
relaciones y conclusiones. En el reporte de los estimativos de las cantidades poblacionales, debe darse la
informacin sobre la incertidumbre en trminos de errores probabilsticos o intervalos de confianza.
Referencias
1.- A Million Random Digits with 100,000 Normal Deviates. The RAND Corporation. The Free Press, New
York, 1995.
2.- Cochran, W. G., Sampling Techniques, 2nd Ed., JohnWiley & Sons, New York, 1963.
EJERCICIOS
1.
(a)
(b)
(c)
(d)
(e)

Discutir las alternativas apropiadas para hacer un muestreo y el marco o estructura en cada uno de los
estudios siguientes:
Un departamento de justicia estatal desea estimar, en un rea metropolitana en particular, la duracin
promedio de detencin antes del juicio de las personas que son arrestadas por cometer un delito grave.
La divisin de mercadeo de una compaa farmacutica desea determinar el porcentaje de hospitales en
el pas que usa su marca de solucin desinfectante para esterilizar equipo quirrgico.
Un cuerpo de gobierno universitario est interesado en estudiar opinin estudiantil sobre un cambio
reciente en el calendario acadmico propuesto por un comit de facultad.
Un juez elegido desea determinar cmo se siente su distrito electoral sobre un artculo propuesto en la
legislacin contra la obscenidad.
Una agencia de salud pblica estatal est emprendiendo un proyecto para evaluar la calidad del cuidado
de la salud en el estado. Parte del proyecto est diseado para estimar el promedio del gasto anual para
el cuidado dental en el que incurren las familias.

2. Para cada estudio (encuesta) en el Ejercicio 1, discuta:


(a) La construccin de la estructura o marco y cualquier dificultad que podra encontrarse en el proceso.
(b) Los mtodos apropiados para realizar el muestreo: por telfono, mandando por correo una encuesta, u
otros mtodos pertinentes.
(c) Las ventajas y las posibles desventajas de usar su mtodo propuesto
3. Identifique las causas principales de sesgo en cada una de las situaciones siguientes:
(a) Se realiza una encuesta para estudiar la extensin del uso de comidas convenientes (como las cenas
ofrecidas en la Televisin y las comidas enlatadas) en las casas de una comunidad. Se selecciona una

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

19

muestra aleatoria de casas, y los datos son recogidos mediante entrevistas realizadas por telfono
hechas durante las horas de trabajo (De 8 AM a 5 PM). Los que no responden son ignorados.
(b) Para estudiar la participacin de residentes en una ciudad particular en actividades deportivas al aire
libre, los datos se recogen por entrevistadores que visitan las casas (de la muestra), normalmente
durante las tardes de fines de semana. Si los residentes de una casa no estn presentes, se visita en
cambio una casa vecina.
(c) Una agencia decide usar un mtodo conveniente y barato de muestreo para realizar una encuesta de
opinin pblica. Los entrevistadores, estacionados en los supermercados ms importantes durante tardes
de das laborales, recogen la informacin de los compradores cada tres minutos cuando se preparan para
entrar en las tiendas.
(d) Una estacin de radio realiza una encuesta de opinin pblica sobre un tema poltico transmitiendo a sus
oyentes una solicitud para que llamen a la estacin y expresen sus opiniones.
4.

Un sitio de descanso tiene 32 moteles, que se toman colectivamente como una poblacin. La
caracterstica a ser estudiada es el cargo por da para los cuartos dobles. Los valores de la poblacin son
las siguientes tasas por da, en dlares: 25, 20, 35, 21, 22, 22, 24, 25, 30, 28, 24, 20, 20, 25, 20, 19, 25,
23, 20, 24, 28, 24, 24, 22, 28, 26, 23, 25, 22, 27, 25, 23. Usando los nmeros aleatorios en la tabla 14 del
apndice, tome una muestra aleatoria simple de tamao 10 de esta poblacin.

5.

Refirindose al Ejercicio 4, use la muestra aleatoria simple que se tom para calcular la media muestral.
Tambin estime la varianza de la media de una muestra aleatoria simple de tamao 10.

6.

2
La varianza de la poblacin en ejercicio 4 es = 13.97. Cul es la varianza de X basada en una
muestra aleatoria simple de tamao 10? De tamao 20? De tamao 30?

7.

Suponga que 588 granjas localizadas en una rea particular constituyen una poblacin y que el gasto de
capital de su ltimo ao en maquinaria y en equipo de la hacienda es la caracterstica a ser estudiada. El
registro completo para la poblacin entera aparece en la Tabla 16-1 dividida en tres conjuntos de datos de
acuerdo a una clasificacin segn el tamao de las granjas (cortesa de Harlan Hughes). De la poblacin
entera de 588 granjas, tome una muestra aleatoria simple de tamao 60 usando los nmeros aleatorios
del Apndice de la Tabla 14. Registre las unidades de gasto y guarde sus datos para usarlos en el
Ejercicio 8.

8.

Refirindose al Ejercicio 7, suponga que el valor de la poblacin no es conocido y que usted tiene slo los
datos proporcionados por la muestra de tamao 60. Estime el gasto promedio de la poblacin por
hacienda y establezca un error lmite al 95% para su estimacin.

9. Una muestra aleatoria simple de tamao 350 se toma de una poblacin de 4000 obreros emigrantes de las
granjas en un estado particular, y se registran los datos de sus sueldos horarios. La media muestral y la
desviacin estndar son $3.45 y $1.07, respectivamente. Construya un intervalo de confianza del 90%
para el sueldo promedio horario de esta poblacin.
10. Los errores que se presentan en las cuentas por cobrar son de importancia vital para los interventores. Un
interventor que trabaja para una compaa de transportes desea estimar la proporcin de casos en los
que clientes reciben facturas defectuosas. Suponga que durante un periodo dado de tiempo, se archivan
2325 cuentas por cobrar en la oficina del interventor. Una muestra aleatoria simple de 500 de estas
cuentas se toman, y se encuentran que 48 de ellas involucran facturacin defectuosa. Construya un
intervalo de confianza del 95% para la proporcin de cuentas por cobrar con facturacin defectuosa que
involucran a clientes.

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

20

TABLA 16 - 1
GASTOS IMPORTANTES EN MAQUINARIA Y EQUIPO (EN MILES DE DOLARES)
GRANJAS PEQUEAS
17
9
9
25
21
13
18
15
26
16
30
24
32
21
21

38
13
18
19
9
14
23
41
27
5
41
32
27
42
33

9
26
6
28
29
23
16
38
39
19
28
19
43
27
19

7
36
19
15
22
17
26
21
30
36
19
18
45
32
20

11
18
52
18
10
27
11
34
31
36
32
31
45
33
32

14
8
14
24
18
18
37
23
28
17
18
25
25
21

17
11
5
23
45
34
23
24
39
21
19
26
17
35

10
23
27
27
24
18
32
27
28
43
33
21
30
44

31
19
14
24
16
16
24
34
34
21
27
18
27
24

24
16
14
20
95
17
16
5
28
19
28
36
28
26

22
14
28
21
40
20
24
34
24
14
26
29
16
38

21
14
17
27
42
23
34
29
44
14
23
47
44
57

9
17
9
21
11
18
37
22
22
31
32
26
20
54

41
20
11
34
17
42
31
26
23
27
36
31
15
24

19
20
12
26
17
22
29
30
40
39
21
26
31
37

41
39
40
18
56
25
45
33
30
25
46
52
53
43
56
18
57

28
36
24
60
42
15
35
41
35
23
40
39
43
29
47
27
64

33
22
48
28
55
66
31
32
50
39
47
61
59
58
39
38
51

35
25
41
47
39
34
30
45
28
40
41
46
41
47
51
36
53

24
54
30
61
24
25
42
44
21
44
38
36
52
85
48
41
55

36
53
42
25
38
11
22
51
21
41
48
16
51
52
48
11
63

56
41
52
52
42
63
68
95

37
57
61
59
41
88
50

39
30
49
55
77
87
74

37
39
52
22
76
63
100

40
28
67
18
83
91
144

66
80
36
84
36
117
80

GRANJAS MEDIANAS
37
28
36
20
22
42
45
23
39
12
14
40
37
47
48
23
42
39

30
20
14
38
25
27
28
46
35
30
37
32
38
72
23
24
42
31

41
23
22
23
48
30
40
14
22
28
32
31
51
46
39
39
65
48

17
27
32
17
53
34
32
42
44
60
22
22
25
29
40
30
27

38
34
21
38
35
43
38
33
35
35
27
24
35
25
43
59
34

29
33
35
16
25
29
33
31
24
49
23
25
49
42
52
35
72

32
36
35
23
23
35
48
75
29
33
37
33
9
42
36
39
49

21
25
39
28
44
43
46
50
23
22
59
54
46
43
35
32
39

39
28
32
32
18
62
54
44
32
58
50
36
35
46
27
51
44

GRANJAS GRANDES
53
49
79
35
57
42
107
64

63
39
61
57
86
39
48
101

44
54
81
63
50
72
56
105

66
30
53
32
54
84
71
77

40
68
57
48
96
34
54
85

42
36
54
57
45
55
64
60

48
42
29
50
28
51
45
63

44
28
94
62
59
66
61
66

27
29
77
51
64
96
59
36

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

21

11. Un guardabosque desea estimar la proporcin de rboles en un bosque de tierras bajas que tienen
infecciones de madera mojada. Estas infecciones pueden descubrirse por la presencia de una bacteria
particular en el jugo extrado de los agujeros taladrados. Se sabe que hay aproximadamente 5000 rboles
en el bosque. Pruebas realizadas a una muestra aleatoria simple de 400 rboles indican que hay 139
rboles afectados. Construya un intervalo de confianza del 95% para la proporcin de la poblacin de
rboles que tienen infecciones de madera mojada.
12. Un estudio de nutricin es dirigido para determinar la calidad de la comida ingerida por nios en una
escuela primaria. De un total de 1500 nios en escuelas primarias en una ciudad en particular, se
selecciona una muestra aleatoria simple de 80, y se les pide a los padres llevar un registro de los
alimentos comidos por sus nios para un periodo de una semana. Para cada nio se determina la
ingestin media calrica por da. De los datos obtenidos para la muestra de 80 nios, se obtiene que la
media muestral y la desviacin estndar de ingestin calrica es de 752 y 138, respectivamente. Basado
en esta informacin, construya un intervalo de confianza del 95% para el promedio diario calrico ingerido
por la poblacin.
13. Refirindose al Ejercicio 7, suponga que los tres grupos de granjas son tratados como tres estratos.
Usando los nmeros aleatorios del Apndice Tabla 14, tome muestras aleatorias simples e
independientes de tamaos 22, 26, y 12 de los estratos de granjas pequeas, medianas, y grandes,
respectivamente, y registre sus datos para usarlos en el Ejercicio 14.
14. Usando su informacin de la muestra de Ejercicio 13 y la informacin sobre los estratos clasificados de los
tamaos de los estratos, estime el gasto medio capital de la poblacin por granja. Tambin construya un
intervalo de confianza del 95% para la media poblacional.
15. Un departamento de transporte de una ciudad est dirigiendo una encuesta para determinar los usos de
gasolina de sus residentes. Se va a usar el muestreo aleatorio estratificado, y los cuatro distritos de la
ciudad se tratan como los estratos. La cantidad de gasolina comprada en la ltima semana se registra
para cada una de las casas de la muestra. Los tamaos de los estratos y la informacin resumen obtenida
de la muestra son:
ESTRATO
I
II
III
IV
Tamao del estrato
3750
3272
1387
2475
Tamao de la muestra
50
45
30
30
Media muestral (en galones)
12,6
14,5
18,6
13,8
Varianza muestral
2,8
2,9
4,8
3,2
Estime el uso medio semanal de gasolina para las casas de la poblacin de la ciudad y
construya un lmite del error al 95% para su estimativo.
16. El editor de una revista de las noticias est realizando una encuesta para determinar los puntos de vista
de los subscriptores con respecto al cubrimiento de la revista de asuntos internacionales. Debido a que se
llevan registros del suscriptor que cubren partes diferentes del pas en tres oficinas principales de la
regin, es conveniente tomar una muestra aleatoria estratificada tratando las tres regiones como los
estratos. A los subscriptores muestreados de cada estrato se les pregunta: "Est usted satisfecho con el
cubrimiento que hace la revista de los asuntos internacionales"?. Los datos sumarios obtenidos son:

Tamao del estrato


Tamao de la muestra
Respondieron "Si" (total)

I
2 millones
500
225

ESTRATO
II
5 millones
600
336

III
3 millones
600
286

Estime la proporcin de la poblacin de subscriptores que estn satisfechos con el cubrimiento de la revista
de asuntos internacionales y construye un lmite del error del 90% para su estimativo.
17. Refirindose al ejercicio 15, suponga que deseamos seleccionar una muestra aleatoria estratificada de un
tamao total de la muestra de 1000 casas. Determine el tamao de la muestra para los estratos
individuales segn una asignacin proporcional.

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

22

18. Refirindose al Ejercicio 15, suponga que el muestreo actual es realmente un estudio piloto designado
para estimar las varianzas de los estratos con el propsito de determinar la asignacin ptima de un
estudio a gran escala para ser realizado con un tamao de muestra total de 1000. Usando la informacin
sobre los tamaos de los estratos y los estimativos de la varianza de los estratos del Ejercicio 15,
determine la asignacin ptima para el tamao de la muestra total de 1000.
19. Asignacin ptima con costo (Asignacin de Neyman): En el muestreo estratificado, el costo de muestrear
una unidad a menudo vara de un estrato a otro. Por ejemplo, los gastos de viaje para los entrevistadores
pueden ser substancialmente menores para unidades localizadas en ciudades mayores que para
unidades localizadas en reas rurales remotas. Si el costo del muestreo vara de estrato a estrato, esto
debera tenerse en cuenta al determinar la asignacin ptima de los tamaos de la muestra.
Sea Ci el costo de probar una unidad del estrato i, i=1,... ,h, donde C representa el presupuesto total para
el estudio, y sea Co un costo fijo independiente del tamao de la muestra. La asignacin ptima, aquella
que minimiza Var ( Xst ) para el presupuesto total C, es entonces

ni = n

Nii / Ci
k
Njj / Cj
j =1

donde el tamao total de la muestra n es

n = (C C 0)

N ii /

Ci

N /
j

Cj

j =1

Ahora suponga que se conoce que la poblacin se divide en tres estratos:

N 1 = 1000

Tamao:

1 = 20

Desviacin Estndar:
Costo:
y que el costo fijo es
a)
b)
20.

C1 = 1

N2 = 5000

2 = 32
C 2 = 0 .25

N 3 = 2000

3 = 40
C3 = 4

C 0 = 10

Determine la asignacin ptima aproximada cuando el desembolso mximo segn el presupuesto total
es 200.
Cul es la Var ( Xst ) dada su asignacin?
Refirindose al ejercicio 19, la misma asignacin tambin minimizar el costo total para un valor V02
especificado por la Var( Xst ). En este caso el tamao de la muestra total dado por n es:

k Nj
k Nj

j Cj j / Cj

j =1 N
j =1

n=
k
1
j
N
2
2
V 0 + j
N j =1 N
a) Usando los valores entregados por el ejercicio 19, determine la asignacin ptima si V02 = 4.
c) Cul es el costo total de este estudio? (NOTA: El costo total es C = C 0 + C 1n1 + ... + Cknk )
Proyectos de clase
1. Organice una encuesta usando muestreo aleatorio simple. (Sugerencias: Una encuesta sobre pago de
alquiler de renta por parte de los estudiantes, o una encuesta de opinin; si es tiempo de eleccin, puede
pensar en predecir el resultado). Escoja un problema que requiera tanto la estimacin de una proporcin
y la estimacin de la media de una poblacin.
2. En el contexto de la encuesta escogido, discuta la factibilidad y las ventajs esperadas de a estratficacin
vs otros tipos de muestro.

Mtodos y Conceptos Estadsticos. Muestreo de encuestas.

23

Tabla de nmeros aleatorios


6017
3268
0632
0372
3132
3213
6075
2009
8964
7080
4098
3328
9976
6420
6523
7475
4928
8355
0084
6319
7335
0164
8751
6070
8094
2778
7672
1449
2984
7555
3396
3918
6409
8988
2707
9142
4761
4826
8877
1704
2082
4009

2438
5788
5878
1222
3375
0670
7161
3799
8261
9448
6758
3604
8845
0204
7018
2647
3235
2702
7215
5007
6191
0416
7452
4807
4307
6633
7480
3173
3961
6049
2295
7558
0063
1154
4234
2225
7781
4927
9409
4912
1149
2840

3828
5965
0726
1781
7801
1158
6505
8336
1914
0848
9526
7368
6219
3168
0413
8714
0889
0780
6568
4973
6314
8561
7483
2681
6627
6219
2976
4095
0226
9829
4353
0051
7009
5907
8884
5394
7083
7133
3631
6705
1280
7902

2161
4427
5624
0216
2782
0562
0599
8189
4651
8331
6559
9744
2593
5283
5606
6275
1701
5091
4753
3050
2974
4309
5945
1311
6067
4301
3952
2528
3491
9473
3021
2230
8758
4063
2974
5404
3070
9985
3490
0872
6903
2616

6601
9227
7813
5798
1500
6208
1398
8441
9081
9069
5435
8842
8337
6869
2869
9693
3778
6964
0215
7658
2783
6759
2360
2724
2654
5528
3061
6684
5758
2554
2301
4406
0165
5507
2233
8837
5232
3409
5633
8505
8462
8351

8762
8468
7905
5805
4249
6641
2947
5748
3202
4214
6428
0456
2222
1675
5234
5937
4803
6693
4797
6044
6280
1658
3542
4979
2265
2485
8719
9596
6907
3600
2286
3649
6838
4041
1364
5374
1600
8105
5940
7423
0362
9548

8166
1298
9611
3719
4702
5057
7797
3587
9692
3824
6362
6317
7455
408
5344
0516
3637
7576
2589
3277
8045
1085
7421
6886
9557
3996
4613
4762
6856
7892
3185
3782
8588
9653
7361
1564
3057
0989
5279
2394
0947
1005

3756
4343
3839
3155
1799
1747
0038
9128
5605
2350
7876
0218
1587
7816
5181
1304
6609
9651
2416
2416
6139
6807
9632
2426
4753
5792
2271
1133
1359
5033
3869
0904
5394
4945
3152
7192
8561
2252
1804
5924
9180
5891

6483
1346
6226
6336
9587
7559
4414
2088
7902
4986
7746
3826
2778
9054
2457
1156
1152
3543
4746
5823
1575
4425
5936
4486
3174
1741
8921
1784
2532
3341
8153
9778
3374
7381
7014
8456
7477
2316
1161
9999
8758
2025

7405
0861
3452
4710
2788
548
3904
8840
9525
8556
3562
6603
6178
1931
9569
4133
6832
2515
2469
0871
7728
7435
9718
2350
2253
4351
0848
9004
8928
9106
4610
0665
5671
3262
2511
8702
6097
8041
5940
2517
4187
7829

6595
5400
7352
7311
7421
9614
8021
6838
4932
5394
1567
4549
6670
1771
6402
3926
9422
6981
2613
2378
4264
5645
3034
1654
1168
5324
8062
9366
2850
1410
1727
1244
1602
0685
1262
1522
0544
0427
4524
5588
8528
6113

8695
5286
9818
5553
3631
6265
5093
5810
9719
1971
7828
2501
4229
3513
9317
1961
8956
4808
7049
0150
4703
4685
7107
4411
2303
4159
1366
1677
3798
8797
7306
7495
7046
9314
8569
0684
3517
0619
0521
9043
9004
9015

También podría gustarte