Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DE
MUESTREO
W IL L IA M G. COCHRAN
Professor o f Statistics, Emeritus-Harvard University
DISTRIBUIDORES:
Cap. Pág.
P r e fa c io .......................................................................... 7
I*?I& 0Iíü C C íO N ........................................................... 19
4.1 Un Ejemplo H ip otético ................................. 103 5A.1 Efectos de las Desviaciones a Partir de la Asig
4.2 Análisis del Problema ......................................... 105 nación Optima • 155
4.3 La Especificación de la P re c is ió n ................. 106 5A,2 Efectos de Errores en los Tamaños de los Es
4.4 La Fórmula para n al Hacer un Muestreo para tratos 157
Determinar una P rop orción ........................... 107 5A.3 El Problema de la Asignación con más de una
4.5 Atributos Raros-Muestreo In v e rs o ................. 108 Característica ...................................................... 160
4.6 La Fórmula para n con Datos Continuos .......... 109 5A.4 Otros Métodos de Asignación con más de un
4.7 Estimaciones Anticipadas de Varianzas de Po Atributo .............................................................. 161
blación 110 5A.5 Estratificación en dos Direcciones, con Muestras
4.8 Tamaño de la Muestra con más de una Carac Pequeñas .............................................................. 165
terística ................................................................ 124 5A.6 Selección Controlada ........................................... 167
4.9 Tamaño de la Muestra Cuando las Estimaciones 5A.7 La Construcción de los E stratos.............. 169-
se Quieren para Subdivisiones de la Población .. 115 5A.8 Número de Estratos ........................................... 174'
4.10 El Tamaño de la Muestra en Problemas de De 5A.9 Estratificación Después de la Selección de la
cisión .................................................................. 117 Muestra (P ostestratíficación )................. 177
4.11 El Efecto del Diseño ( Deff) ......................... 119 5A.1Q Muestreo por C u o ta .................................. 178
Ejercicios .............................................................. 120 5A.11 Estimación a Partir de una Muestra de la Ga
5 MUESTREO ALE A TO R IO E S T R A T IF IC A D O ................ 125 nancia Debida a la E stratificación....... 179
5A.12 Estimación de la Varianza con una Unidad por
5.1 Descripción ......................................................... 125 Estrato ............................................................. 181
5.2 Notación .............................................................. 126
5A. 13 Estratos como Dominios de E stu d io ........ 184
5.3 Propiedades de las Estim aciones.............. •......... 127 5A.14 Estimación de Totales y Medias Sobre Subpo
5.4 La Varianza Estimada y Límites de Confianza . . . 132 blaciones ....................................... 186
14 IN D IC E DE M A T E R IA S IN D IC E DE M A T E R IA S 15
5A.15 Muestreo a Partir de dosMarcos ........................ 189 7.6 Exactitud de las Fórmulas de Muestras Grandes
Ejercicios ............................................................ 190 Para V ( ylr ) y n ( y t ) .......................................... 247
7.7 Sesgo de la Estimación de Regresión Lineal . . . . 249
G ESTIMADORES DE RAZO N ......................................... 195
7.8 El Estimador de Regresión Lineal en un Modelo
6.1 Métodos de Estimación ........................................ 195 de Regresión L in e a l ............................... 250
6.2 El Estimador de R a z ó n ........................................ 196 7.9 Estimáciones de Regresión en Muestreo Estra
6.3 Varianza Aproximada de la Estimación de Razón 198 tificado ................................................................. 251
6.4 Estimación de la Varianza a Partir de una Muestra 201 7.10 Coeficientes de Regresión Estimados de la Muestra 252
6.5 Límites de C o n fia n za ............................................ 202 7.11 Comparación de los dos Tipos de Estimaciones
de Regresión ........................................................ 254
6.6 Comparación de la Estimación de Razón con la
Ejercicios .............................................................. 255
Media por U n id a d ................................................ 203
6.7 Condiciones Bajo las Cuales el Estimador de Razón 8 MUESTREO S IS T E M A T IC O ........................... 257
es un Estimador Insesgado Lineal O p tim o ............ 204
6.8 Sesgo de la Estimación de R a z ó n ................ 207 8.1 Descripción .......................................................... 257
8.2 Relación con el Muestreo C onglom erado............ 259
6.9 Exactitud de las Fórmulas para la Varianza Es
8.3 Varianza de la Media E stim ad a............................ 260
timada .................................................................. 209
8.4 Comparación del Muestreo Sistemático con el
6.10 Estimaciones de Razón en Muestreo Aleatorio
Muestreo Aleatorio E stratificad o........................... 265
Estratificado ........................................................ 211/
8.5 Poblaciones en Orden A le a to rio ........................... 266
6.11 La Estimación de Razón Com binada.................... 212
8.6 Poblaciones con Tendencia L in e a l...................... 268
6.12 Comparación de las Estimaciones Separadas y
8.7 Métodos para Poblaciones que Presentan Tenden
Combinada .......................................................... 214
cias L in ea les .......................................................... 269
6.13 Cálculo Abreviado de la Varianza Estimada . . . . 217
8.8 Poblaciones con Variación P erió d ica .................. 271
6.14 Asignación Optima con una Estimación de Razón 220 8.9 Poblaciones Autocorrelacionadas......................... 273
6.15 Estimaciones Insesgadas del Tipo de Razón . . . . 222 8.10 Poblaciones N a tu ra le s........................... 276
6.16 Comparación de los Métodos .............................. 225 8.11 Estimación de la Varianza a Partir de una sola
6.17 Estimación Mejorada de la V a r ia n z a ................ . 227 Muestra ................................................................ 278
6.18 Comparación de dos R a zo n e s .............................. 229 8.12 Muestreo Sistemático E stratificado...................... 282
6.19 Razón de dos Razones .......................................... 232 8.13 Muestreo Sistemático en dos D im ensiones 283
6.20 Estimaciones de Razón M ultivariantes................ 234 8.14 Resumen .............................................................. 285
6.21 Estimadores Produ cto............................................ 235 Ejercicios ...................... 287
Ejercicios ............................................................ 236
9 MUESTREO PO R CONGLOMERADOS, DE UNA ETA-
7 ESTIMADORES DE REGRESION ................................. 239 PA: CONGLOMERADOS DEL MISMO TAM AÑO • •• 289
7.1 La Estimación de Regresión L in e a l .................... 239 9.1 Motivos del Muestreopor Conglom erados............. 289
7.2 Estimaciones de Regresión con b Preasignada . . 241 9.2 Una Regla S im p le .................................................. 290
7.3 Estimaciones de Regresión Cuando b se Calcula 9.3 Comparaciones de Precisión, Flechas a Partir de
a Partir de la M u estra.......................................... 243 Datos de E ncu estas................................................ 294
7.4 Estimación de Muestra de la V a ria n za ................ 245 9.4 Varianza en Términos de la Correlación Dentro
7.5 Comparación en Muestras Grandes con la Esti de Conglom erados.................................................. 298
mación de Razón y la Media por U n id a d ............ 246 9.5 Funciones de la V a r ia n z a ..................................... 300
16 IN D IC E DE M A T E R IA S IN D IC E DE M A TE R IA S 17
Cap. Pág.
12.8 Varianza Estimada en Muestreo Doble para Re
gresión ................................................................ 416 C A P IT U L O 1
12.9 Estimadores de Razón ........ .'...................... 417
12.10 Muestreo Repetido de la Misma P ob lación ....... 418
12.11 Muestreo en dos O casion es.......................... 420
12.12 Muestreo en más de dos Ocasiones .................. 423
12.13 Simplificaciones y Adelantos U lterio res...... 426 Introducción
Ejercicios .................................................................... 431
IIIIIEIIIIIHIII
Costo reducido 4011627 1.2 A L G U N O S USO S D E L A S E N C U E S T A S
P O R M UESTR EO
Si los datos se obtienen únicamente de una pequeña fracción del
total, los gastos son menores que los que se realizarían si se llevara Para quien observa el desarrollo del muestreo y sus aplicaciones
a cabo un censo completo. En poblaciones muy grandes se pueden en los últimos 25 años, lo más sorprendente es el rápido aumento
obtener resultados lo suficientemente exactos cuando se analizan del número y tipos de encuestas realizadas por muestreo. La Oficina
muestras que representan sólo una pequeña fracción de la población. de Estadística de las Naciones Unidas publica ocasionalmente un
En los Estados Unidos las investigaciones periódicas más importan informe sobre las Encuestas por Muestreo de actualidad ( “Sample
tes las lleva a cabo el Gobierno, que usa muestras de alrededor de Surveys o f Current Interest” ) que llevan a cabo los países miembros.
105 000 personas o sea aproximadamente, una persona por cada El informe de 1968 incluye una lista de encuestas procedentes de
1 240. Las encuestas realizadas para obtener información en cone 46 países. Muchas de ellas contienen información de gran interés
xión con las ventas o campañas de publicidad en la investigación de sobre la planeación nacional en áreas tales como la producción agrí
mercados, pueden emplear muestras de sólo unos cuantos miles cola y la utilización de la tierra, el desempleo y la fuerza de trabajo
de observaciones. disponible, la producción industrial, los precios al mayoreo y menu
deo, las condiciones de salud de la población, y los ingresos y gastos
Mayor rapidez familiares. Pero también existen estudios más especializados, por
ejemplo, los arreglos para vacaciones anuales (Australia), las'cau
Por la misma razón, los datos pueden ser recolectados y resu sas de divorcio (H u n gría), la deuda e inversiones rurales (In d ia),
midos más rápidamente con una muestra que con una enumeración el consumo doméstico de agua (Is ra e l), los radioescuchas (M ala
completa. Esta es una consideración vital cuando se necesita la sia), los gastos de vacaciones (H olan d a), la estructura de edades
información con urgencia. en el ganado vacuno (Checoslovaquia), y los empleos vacantes (E.
U. A .).
Más posibilidades El muestreo ha venido a representar un papel muy importante
en los censos nacionales que se llevan a cabo cada 10 años. En los
Para obtener la información en ciertos tipos de encuestas, se
Estados Unidos, se incluyó en el censo de 1940 una muestra del
utilizan los servicios de personal altamente calificado o equipo muy 5 % . Que hace preguntas extra sobre la ocupación, tamaño de la
especializado de disponibilidad limitada. Por lo tanto, en estos casos familia, fertilidad, etc., a todas aquellas personas cuyos nombres
el censo completo es impracticable y como alternativa a la obtención estaban en 2 de los 40 renglones de cada página de la lista. El uso
de datos por muestreo, sólo existe la de no obtenerlos. De ahí que del muestreo se aumentó grandemente en 1950. De una muestra del
las encuestas basadas en el muestreo tienen más posibilidades y 20% (un nombre cada 5 renglones) se obtuvo información sobre el
flexibilidad respecto a la información que puede obtenerse. Por otra ingreso, la escolaridad, la migración y el servicio en las fuerzas
parte, se desea una información exacta de muchas subdivisiones de armadas. A l tomar una de cada 6 personas en la muestra del 20% ,
la población, el tamaño de la muestra requerida es en ocasiones tan se creó otra muestra del 3%% para obtener información sobre el
grande que la mejor opción es la enumeración completa. matrimonio y la fertilidad. Una serie de preguntas, sobre la condi
ción y edad de las viviendas, se dividió en 5 grupos, cada grupo
se contestó en una de cada cinco casas. También se empleó el
Mayor exactitud
muestreo para aumentar la rapidez de la publicación de los resulta
Debido a que al reducir el volumen de trabajo se puede emplear dos. Las tabulaciones preliminares para muchos atributos importan
personal más capacitado y someterlo a un entrenamiento intensivo tes, obtenidas por muestreo, se publicaron un año y medio antes que
y debido también a que en estas condiciones será factible la super los reportes finales.
visión cuidadosa del trabajo de campo y del procesamiento de los Este proceso se continuó en los censos de 1960 y 1970. Salvo
resultados, una muestra puede producir resultados más exactos que cierta información básica que se necesitaba obtener de cada persona
la enumeración completa. por razones constitucionales o legales, todo e l censo se cambió a
IN TR O D U C C IO N 23
22 TE C N IC A S DE M U E S TR E O
y finalmente, la gigantesca encuesta sobre la efectividad de la va limitación exacta. Estas reglas deben ser aplicables a la práctica:
cuna Salk. El estudio que hizo Coleman (1 9 6 6 ) sobre la igualdad el enumerador debe ser capaz de decidir en el campo, sin demasiados
en las oportunidades de educación, realizado en una muestra nacio titubeos, si un caso dudoso pertenece o no a la población.
nal de escuelas, contenía numerosos análisis de regresión que esti L a población que se muestrea (la población muestreada) debe
maban las contribuciones relativas de las características de la escue coincidir con la población sobre la cual se desea información (la
la, el medio familiar, y la actitud del niño frente a los diferentes población objetivo). En ocasiones, por razones de factibilidad, o sim
resultados en los exámenes. ple conveniencia, la población muestreada es más restringida que
la población objetivo. De ser así, debe recordarse que las conclusio
1.3 E T A P A S P R IN C IP A L E S E N U N A E N C U E S T A nes extraídas de la muestra son aplicables a la población muestrea
P O R M UESTREO da, y habrá que recurrir a otras fuentes de información para decidir
hasta qué grado se aplican estas conclusiones a la población objetivo.
Como introducción a una discusión sobre el papel que desempeña Toda información que se obtenga respecto a las diferencias entre
la teoría en una encuesta por muestreo, es útil describir brevemente ambas poblaciones será de utilidad.
los pasos involucrados en la planeación y ejecución de una encuesta.
Las encuestas varían considerablemente en su complejidad. Es una Los datos recogidos
tarea fácil el tomar una muestra de 5 000 tarjetas cuidadosamente
Es conveniente cerciorarse que todos los datos son pertinentes a
arregladas y numeradas en un archivo. Pero la situación es otra si
la encuesta y que no se omiten datos esenciales. Particularmente en
se desea tomar una muestra de los residentes de una región donde se
presencia de poblaciones humanas, existe la tendencia a hacer un
usa un medio de transporte fluvial a través de la selva, donde
número excesivo de preguntas que no se analizan posteriormente.
no hay mapas, donde se hablan 15 dialectos diferentes y los habitan
Un cuestionario demasiado largo produce una baja general de la
tes desconfían de todo extranjero inquisitivo. Problemas que son
calidad de las respuestas, tanto a las preguntas importantes como
desconcertantes en una encuesta pueden ser triviales o inexistentes a las otras.
en otra.
Los pasos principales en una encuesta están agrupados más o Grado de precisión deseado
menos arbitrariamente bajo 11 encabezados y se citan a continua
Los resultados de una encuesta por muestreo están siempre su
ción.
jetos a cierta incertidumbre porque sólo se mide una parte de la
población, y por los errores en las mediciones realizadas. Esta falta
Objetivos de la encuesta '
de certeza se puede reducir al tomar muestras más grandes y em
Una exposición clara de los objetivos es lo más útil. Sin esto, plear mejores dispositivos de medición. Pero esto suele costar tiempo
es fácil olvidarlos en una encuesta compleja al preocuparse por los y dinero, en consecuencia, la especificación del grado de precisión
detalles de la planeación y por lo tanto tomar decisiones que varían deseado, es un paso importante en la preparación de la encuesta.
de los objetivos. Este paso es responsabilidad de la persona que va a utilizar los datos
y puede presentar dificultades, porque los administradores no están
Población bajo muestreo acostumbrados a pensar en términos de la magnitud del error tole
La palabra población se emplea para denominar el conjunto del rable en las estimaciones, compatible con una buena decisión. El
que se elige la muestra. La definición de población puede no pre estadístico puede ayudar en esta etapa.
sentar problema, por ejemplo, cuando se muestrea un grupo de focos
de luz eléctrica a fin de estimar su tiempo de vida promedio. Por Métodos de medición
otra parte, en el muestreo de una población de propiedades agrícolas, Puede existir la posibilidad de escoger el método de medición y
se deben fija r las reglas para definir lo que es por ejemplo, un rancho el método de inspección de la población. Los datos acerca del estado
o una hacienda, y surgen casos dudosos al tfatar de hacer una de de salud de una persona se pueden obtener de sus declaraciones,
IN TR O D U C C IO N 27
26 TE C NIC AS DE M U E S TR E O
Selección de la muestra
O de un examen médico. La encuesta puede emplear un cuestionario
autoadministrado, o un proceso de entrevistas en las que los entre Existe, actualmente, una gran variedad de planes para seleccio
vistadores simplemente leen un cuestionario prescrito, o bien, un nar una muestra. Por cada plan considerado, se pueden hacer, gros-
proceso en el que se permite mucha libertad en la form a y el orden so modo, estimaciones del tamaño de la muestra, partiendo de un
de las preguntas. La inspección puede ser por correo, por visitas conocimiento del nivel de precisión deseado. Los costos relativos y
personales, por teléfono o por una combinación de los tres medios. el tiempo empleado para cada plan también se comparan antes de
Se ha estudiado mucho sobre los métodos de entrevista y sus pro tomar una decisión.
blemas (véase, por ejemplo, Hyman, 1954 y Payne, (1951).
Una parte importante del trabajo preliminar es la construcción de L a encuesta piloto
las formas de registro donde entrarán las preguntas y las respuestas.
En cuestionarios sencillos a veces es posible precodificar las respues Es de gran utilidad probar el cuestionario y los métodos de campo
tas, es decir, colocarlas de tal modo que puedan transferirse rutina en pequeña escala. Esto casi siempre da por resultado mejoras al
riamente a un equipo mecánico. De hecho para la construcción de cuestionario y puede evitar otros problemas que serían serios a ma
buenas formas de registro se necesita prever la estructura de las yor escala, por ejemplo, que el costo fuera mucho mayor que el
tablas de resúmenes finales que se utilizan para obtener las con esperado.
clusiones.
Organización del trabajo de campo
El marco
En encuestas extensas se encuentran muchos problemas de orden
Antes de seleccionar la muestra, la población debe ser dividida administrativo. El personal debe recibir un entrenamiento sobre
en partes llamadas unidades de muestreo o unidades. Estas deben el propósito de la encuesta y los métodos de medición que se em
cubrir la totalidad de la población y no traslaparse en el sentido de plearán. Además, se debe supervisar adecuadamente su trabajo. Un
que todo elemento de la población pertenezca a una y solamente a procedimiento de verificación anticipado sobre la calidad de las res
una unidad. Algunas veces, la unidad apropiada es obvia como en puestas es de incalculable valor. Se deben hacer planes para ma
el caso de la población de los focos donde la unidad es el foco. En nejar las no-respuestas, es decir, la falla del enumerador para obte
otras ocasiones, existe la posibilidad de escoger lo que será la unidad ner la información de ciertas unidades de la muestra.
de muestreo. En e l muestreo de los residentes de una ciudad, la
unidad puede ser una persona, los miembros de una familia, o las Resumen y análisis de los datos
personas que viven en una manzana. En el muestreo de una co
secha agrícola la unidad puede ser un lote, una granja, o una área El primer paso después de realizar la encuesta es el editar los
de terreno cuya forma y dimensiones quedan a nuestra discreción. cuestiónanos obtenidos, con la esperanza de corregir errores o cuan
Frecuentemente, la construcción de esta lista de unidades de do menos desechar los datos que obviamente están equivocados.
muestreo, llamada marco, es uno de los principales problemas prác Habrá necesidad de tomar ciertas decisiones respecto al procedimien
to de cálculo en los casos de omisión de respuestas de quienes res
ticos. Con base en amargas experiencias, los técnicos han adquirido
ponden o de eliminación de datos en el proceso de edición. Después
una actitud crítica frente a las listas que han sido recolectadas en
se realizarán los cálculos que conduzcan a las estimaciones. Puede
forma rutinaria y con algún propósito específico. Aunque se asegure
haber diferentes métodos de estimación para los mismos datos.
lo contrario estas listas suelen ser incompletas, parcialmente ilegi
bles, o contienen duplicaciones de magnitud desconocida. Será difícil Una práctica aconsejable en la presentación de los datos es in
encontrar un buen marco cuando la población es especializada, como formar la magnitud esperada de error en las estimaciones más im
por ejemplo, la población de editores de libros o de criadores de portantes. Una de las ventajas del muestreo de probabilidad es que
pavos. Jessen (1 95 5) presenta un método interesante para cons se pueden hacer tales enunciados (d e error esperado) aunque debe
truir un marco a partir de las ramas de un árbol frutal. rán ser muy calificados si la cantidad de no-respuestas es importante.
28 TE C N IC A S DE M U E S TR E O IN TR O D U C C IO N 29
Información conseguida para encuestas futuras Una simplificación adicional que podemos hacer, consiste en su
poner, lo que es razonable en la práctica si se trata de muestras
Cuanta más información de una población se tenga inicialmente,
de tamaño común, que las estimaciones de muestra tienen una dis
más fácil será e l diseño de una muestra que proporcione estimacio
nes exactas. Toda muestra obtenida es una guía potencial de futuros tribución aproximadamente normal. Con una estimación distribuida
en forma normal se conoce la distribución de frecuencias, si son
muéstreos, por los datos que revela sobre las medias, las desviacio
conocidas la media y la desviación estándar o la varianza. Una
nes estándar, y la naturaleza de la variabilidad de las medidas prin
parte considerable de la teoría del muestreo se ocupa de encontrar
cipales, así como sobre los costos de obtención de datos. La práctica
fórmulas para estas medias y varianzas.
de muestreo avanzará más rápidamente si se prevé lo necesario para
reunir y registrar este tipo de información. Hay dos diferencias entre la teoría estándar de encuestas por
Hay otro aspecto importante en el que una muestra completa muestreo y la teoría clásica del muestreo como aparece en los libros
facilita la obtención de otras posteriores Las cosas nunca resultan de estadística matemática. En la teoría clásica, las mediciones he
como se planearon para la obtención de una muestra compleja. Un chas sobre las unidades de muestreo de la población suele suponerse
muestxeador hábil aprende a reconocer los errores de ejecución y que siguen una distribución de frecuencia de fonna matemática co
a evitar que se repitan. nocida, como sería la distribución normal, cuyos parámetros, media
y varianza, por ejemplo, se estimarían a partir de los datos de las
muestras. Por otro lado, en la teoría de las encuestas por muestreo,
1.4 E L P A P E L D E L A T E O R IA D E L M UESTR EO se supone que sólo se dispone de una información muy limitada
El objeto de encontrar los pasos para una encuesta por muestreo sobre dicha distribución, y sobre todo, no se supone conocida su
es recalcar que el muestreo es un negocio práctico y exige muchas forma matemática, así que el enfoque se puede describir como in
y diversas habilidades. En algunos pasos, como por ejemplo en la dependiente de un modelo o de una distribución de frecuencia. Esta
definición de la población, en la determinación de los datos a reco es una actitud natural para encuestas muy grandes en las que se
ger y de los métodos de medición, y en la organización del trabajo efectúan numerosas mediciones diferentes de las unidades que si
de campo, poco o nada tiene que ver la teoría del muestreo. Aunque guen diversas distribuciones de frecuencia. Para las encuestas en
estos asuntos no se discutirán en el resto del libro, hay que tener las que sólo se realizan pocas mediciones en cada unidad, el estudio
presente su importancia. El muestreo requiere atención en todas las de sus distribuciones de frecuencia puede justificar la hipótesis de
fases de la actividad: un trabajo mediocre en una de ellas puede que son de forma matemática conocida, lo que permite la aplicación
de la teoría clásica.
arruinar tocTá'la encuesta.
El propósito de la teoría del muestreo es que éste sea más efi Otra diferencia es que las poblaciones en una encuesta tienen un
ciente. Su objetivo es desarrollar métodos de selección de muestras número finito de unidades. Los resultados son ligeramente más
y de estimación, que proporcionen, al menor costo posible, estima complicados cuando el muestreo es de una población finita y no
ciones con la suficiente exactitud para nuestros propósitos. Este de una infinita. Por razones prácticas, a menudo se ignoran estas
principio de exactitud específica a costo mínimo aparece una y otra diferencias en los resultados para poblaciones finitas e infinitas. Los
vez en la presentación de la teoría. casos en que no se ignoren, los indicaremos.
Para aplicar este principio, debemos ser capaces de predecir en
cualquier método de muestreo que se considere, la precisión y el
1.5 M U E STR E O P R O B A B IU S T A
costo esperados. Respecto a la precisión, no podremos predecir cuál
será el error de una estimación en una situación específica, porque
Los procedimientos de muestreo considerados en este libro com
esto implicaría el conocimiento del verdadero valor de la población. parten las siguientes propiedades matemáticas.
En lugar de ello, la precisión de un procedimiento de muestreo se
juzga al examinar la >distribución de frecuencia generada para las 1. Podemos definir el conjunto de muestras distintas S3>. . . ,
estimaciones, suponiendo que el proceso de muestreo se aplica va S„, que el procedimiento es capaz de elegir si se aplica a una pobla
rias veces a la misma población. Desde luego, ésta es la técnica ción específica. Esto significa que podemos decir con precisión cuá
estándar con la que se juzga la precisión en la teoría estadística. les son las unidades de muestreo que pertenecen a StI S-, etc.
30 TE C N IC A S DE M U E S TR E O
IN TR O D U C C IO N 31
Supongamos, por ejemplo, que la población consta de seis unidades, 1. La muestra es una parte de la población fácilmente accesible.
numeradas de 1 a 6 . Un procedimiento común para elegir una mues Una muestra de carbón en un vagón abierto se puede tomar a 15
tra de tamaño 2 ofrece tres posibilidades S , ~ ( l , 4 ) ; S..~(2. 5 ); S3 o 20 cm de la parte superior.
^ ( 3 , 6 ). Nótese que no se incluyen todas las posibles muestras de 2. La muestra se selecciona a la ventura. AI tomar diez conejos
tamaño 2 . de una jaula en un laboratorio, el investigador puede sacar aquellos
2. Cada muestra posible S¡ tiene asignada una probabilidad de que alcance con la mano, sin una planeación consciente.
selección r*. 3. Con una población pequeña pero heterogénea, el investigador
3. Se selecciona una de las S¡ por un proceso aleatorio, en el inspecciona la totalidad de ésta y selecciona una pequeña muestra
que cada S¿ tiene una probabilidad ir* de ser elegida. En el ejemplo de unidades “típicas”, es decir, unidades que a su parecer están cer
anterior, podríamos asignar la misma probabilidad a cada muestra. canas al promedio de la población. Este método algunas veces es
Posteriormente, la selección se podría realizar al elegir un número llamado de ju icio o de selección intencional.
aleatorio entre 1 y 3. Si el número es j, se toma la muestra S¡. 4. La muestra consta esencialmente de voluntarios, en estudios
4. El método para calcular la estimación a partir de la muestra en los cuales el proceso de medición es desagradable o penoso para
debe ser definido y debe conducir a una estimación única para cual la persona que está siendo investigada.
quier muestra específica. Podemos decir, por ejemplo, que la esti En condiciones adecuadas cualquiera de estos métodos puede
mación es el promedio de las mediciones correspondientes a las dar resultados útiles. Sin embargo, no son los indicados para el
unidades individuales de la muestra. desarrollo de una teoría de muestreo, ya que no involucran ningún
Para todo procedimiento de muestreo que satisfaga estas condi elemento aleatorio en el procedimiento de selección. Casi la única
ciones, podemos calcular la distribución de frecuencia de las esti manera de examinar qué tan bueno puede ser uno de los métodos
maciones que genera el proceso, si se aplica repetidamente a la es encontrar una situación en la cual los resultados sean conocidos,
misma población. Sabemos la frecuencia con que se elige cualquier ya sea para la población total o para una muestra basada en pro
muestra S¡, y sabemos cómo calcular la estimación a partir de los babilidades y posteriormente hacer una comparación. Pero aun así,
datos de S,. Por lo tanto, es claro que se puede desarrollar una si un método resulta adecuado en la comparación, puede ser inade
teoría de muestreo para cada procedimiento de este tipo, aunque los cuado al variar las condiciones.
detalles del desarrollo puedan ser intrincados. Un método de esta En relación con lo anterior (muéstreos probabilistas y no pro
clase se conoce con el nombre de muestreo probabilista. babilistas) señalamos que algunos de los primeros usos del mues
En la práctica, rara vez se extrae una muestra de probabilidad treo que hicieron los gobiernos a nivel urbano o nacional, desde
dando las S¡ y los números ir( como se esbozó anteriormente. Es 1850, tenían como finalidad reducir los costos de las estimacio
un trabajo muy laborioso paTa una gran población, en la cual un nes de los resultados de un censo. Para los tributos más impor
procedimiento de muestreo puede producir billones de muestras po tantes del censo, se calculaban los totales de la ciudad o el país,
sibles. Por lo general, la extracción se hace al especificar probabi aprovechando completamente la información obtenida del censo.
lidades de inclusión en la muestra para las unidades individuales Para las mediciones restantes se tomaba una muestra que variaba
y extraer unidades, una a la vez, o en grupos, hasta constituir la entre el 15 y el 25% de los formularios devueltos después del
muestra del tamaño y tipo deseado. Desde el punto de vista teórico, censo, con objeto de aligerar el trabajo de estimación de los totales
basta saber que si quisiéramos, podríamos especificar las subcolec- de la ciudad o el país para dichas mediciones. Se usaron dos métodos
ciones S¡ y las tt¡, siempre y cuando tuviéramos tiempo ilimitado diferentes para la selección de la muestra. El primero, llamado de
para hacerlo. selección aleatoria es una aplicación del muestreo de probabilidad
según el cual cada unidad de la población (cada formulario devuelto
después del censo) tiene la misma oportunidad de ser incluido en
1.6 A L T E R N A T IV A S A L M UESTR EO P R O B A B IL IS T A la muestra. Para este método se constató que, como se dijo anterior
mente, con ayuda de la teoría del muestreo y la distribución normal
A continuación veremos algunos tipos comunes de muestreo no es posible predecir, en forma aproximada y con los datos de la
probabilistas. muestra, la magnitud del error esperado en las estimaciones hechas
32 TE C N IC A S DE M U E S TR E O IN TRO D U C CIO N 33
a partir de la muestra. Más aún, en los ítems más importantes para donde pt es la estimación dada por la i-ésima muestra. El símbolo
los que se disponía de los datos completos que suministró el censo, E, que significa “valor esperado de” , es de uso común.
es posible, hasta cierto grado verificar la exactitud de las predic Como se mencionó en la Sec. 1.4, las muestras en algunas en
ciones. cuestas son tan grandes que siguen una distribución aproximada
El segundo método es la selección a -propósito. Esta no se definía mente normal. Además, con el muestreo probabilista, tenemos
en detalle, pero presentaba dos rasgos comunes. La unidad de mues fórmulas que dan la media y la varianza de las estimaciones. Su
treo consistía en grupos de formularios, a menudo relativamente pongamos que hemos tomado una muestra por un proceso que se
grandes. Por ejemplo, en el censo italiano de 1921, el país tenía sabe que proporciona un estimador insesgado y que hemos calculado
8 354 comunas, agrupadas en 214 distritos. Al extraer una muestra la estimación de muestra p y su desviación estándar <r¿ (que suele
del 14% , los estadísticos italianos Gini y Galvani seleccionaron a llamarse su error estándar). ¿Qué tan buena es esta estimación? No
propósito 29 distritos, en lugar de 1 250 comunas. En segundo podemos conocer el valor exacto del error de estimación (p — n )
lugar, los 29 distritos se eligieron de tal modo que la muestra pro pero por las propiedades de la curva normal, puede esperarse que
porcionara estimaciones exactas para 7 importantes variables de 0.32 (en 1 caso de 3 ) el error absoluto |/í - /t| excede a¡i
control, cuyos resultados eran conocidos para todo el país, y con
0.05 (en 1 caso de 2 0 ) el error absoluto |p - p\ excede 1.96ap - 2 ap.
esto se esperaba que la muestra diera buenas estimaciones de las
0.01 (e n 1 caso de 1 0 0 )el error absoluto |jl — excede 2.58o/i
otras variables altamente correlacionadas con las de control.
En la década de los 20, el Instituto Estadístico Internacional Por ejemplo, si una muestra probabilista de los registros de
nombró una comisión para estudiar las ventajas y desventajas de acumuladores de uso rutinario en una fábrica muestra una vida
los dos métodos. El informe de Jensen (1 92 6) pareció favorecer promedio p. - 394 días, con error estándar de a¿ - 4.6 días; se es
ol método de selección a propósito. Sin embargo, este método se pera que en 99 de 100 casos la vida promedio en la población de
abandonó relativamente pronto como técnica de muestreo para ob baterías se sitúe entre
tener estimaciones nacionales en las encuestas que medían muchas
/l =394-(2.58X4.6) = 382 días
variables, ya que carecía de la flexibilidad que ofrecían los métodos
y
de muestreo probabilista desarrollados posteriormente, no podía pre
P u = 394 + (2.58X4.6) = 406 días
decir a partir de la muestra la exactitud esperada en las estimaciones
y usaba unidades de muestreo demasiado grandes. Gini y Galvani Los límites, 382 días y 406 días, se llaman límites de confianza
concluyeron que el método de muestreo denominado muestreo alea inferior y superior. Con una sola estimación de una encuesta, la
torio estratificado (Cap. 5 ) que utiliza la comuna como unidad de afirmación “p. está entre 382 y 406 días" no es correcta con certeza.
muestreo, habría dado mejores resultados que su método. La magnitud “99% de confianza" implica que si se usara el mismo
plan de muestreo muchas veces en una población, haciendo un
enunciado de confianza a partir de cada muestra, el 99% (aprox.)
1.7 U S O D E L A D IS T R IB U C IO N N O R M A L
serían correctas y 1% estarían equivocados. Cuando el muestreo
En ocasiones es útil usar la palabra estimador para designar la ha sido introducido en una operación en la que previamente se haya
regla por la cual se calcula alguna característica n de la población, usado un censo completo, una demostración de esta propiedad algu
a partir de los resultados de la muestra, y la palabra estimación nas veces se hace sacando muestras repetidas del tipo propuesto de
para el valor obtenido de una muestra específica. Un estimador p una población para la cual exista un registro completo, de tal mane
de n dado por un plan de muestreo se llama insesgado si el valor ra que ¡i sea conocido (véase, por ejemplo, Trueblood y Cyert, 1957).
medio de p, tomado sobre todas las muestras posibles proporcionadas La verificación práctica de que aproximadamente la proporción es
por el plan, es igual a p. En la notación de la Sec. 1.5, puede es tablecida de aseveraciones es correcta, es útil para educar y tran
cribirse esta condición quilizar a los administradores respecto a la naturaleza del muestreo.
De modo semejante, cuando se toma una sola muestra de cada una
de una serie de poblaciones diferentes, cerca de un 95% de las ase
£ (£ )= X =M
/-i veraciones de confianza al 95% son correctas.
IN TR O O U C C IO N 35
TABLA 1.1. E f e c t o d e u n s e s g o B e n l a P r o b a b il i d a d de Co m e t e r un no excederá a 0.1. Por otro lado, con sesgos causados por errores
E r r o r M a y o r q u e 1.96a
de medición o de no-respuesta, generalmente es imposible encontrar
el límite superior para B/o que es pequeño. Este enfadoso proble
Probabilidad de error
ma se discute en el Cap. 13.
B/o < -1.96o > 1-96cr Total
Aun si B/<T - 0.6, los cambios en las probabilidades al compa aproximadamente de una manera normal con un error estándar de 0.0082. Si
el valor del inventario según los libros de registro es de $80 000, calcule los
rarlas con los valores obtenidos para B/<r - 0 son ligeros.
límites de confianza del 95% para el valor real.
Debido a la dificultad de poder asegurar que ningún sesgo in
1.6. Frecuentemente los datos se deben tratar como una muestra, a pesar
sospechado se introduce en las estimaciones, generalmente hablare de que a primera vista parece que constituyen una enumeración completa.
mos de la p r e c i s i ó n de un estimador más que de su e x a c t it u d . La El propietario de un lote de estacionamiento encuentra que el negocio dismi
exactitud se refiere a la magnitud de las desviaciones respecto a la nuye los domingos por la mañana. Después de 26 domingos de operación, su
media verdadera mientras que precisión se refiere a la magnitud percepción promedio por dom ingo es exactamente $ 10.00. El error estándar
de esta cifra, calculado a partir de las variaciones de semana a semana, es de
de las desviaciones respecto a la media m obtenida por la aplicación
$1.20. Los costos del cuidador son de $7.00 cada domingo. El propietario quie
repetida del procedimiento de muestreo. re mantener abierto el lote los domingos por la mañana siempre y cuando su
utilidad esperada fuera de $5.00. ¿Cuál es la probabilidad de que la utilidad a
largo plazo sea de, al menos, $5.00? ¿Qué suposición se debe hacer para
E J E R C I C I O S responder a esta pregunta?
1.7. En la Tabla 1.2, ¿qué pasaría a la probabilidad de excederse en
1.1. Suponga que usa el muestreo para estimar el número total de pala
bras de un libro que contiene ilustraciones. 1 V E C M , 1.96 V’ECM y 2.576 y/ECM cuando B/a tiende a ser infinita, es decir,
cuando e l ECM es debido enteramente a sesgo? ¿Concuerdan sus resultados
( a ) ¿Hay algún problema para la definición de la población? ( b ) ¿Cuáles con la dirección de los cambios anotados en la Tabla 1.2 conforme B/a varíe
son los pros y los contras de: ( 1) la página, ( 2 ) el renglón, como unidad de de 0 a 0.6?
muestreo?
1.8. Cuando es necesario comparar dos estimaciones que tienen diferentes
1.2. Se va a tom ar una muestra de una lista de nombres que están en tar distribuciones de frecuencia de errores (#2 — ¡i), ocasionalmente es posible, en
jetas (u n nombre por tarjeta) numeradas consecutivamente, las cuales se
problemas especializados, calcular el costo o la pérdida que resultaría de
encuentran en un archivo. Cada nombre tendrá la misma oportunidad de ser
un error ( j l — /*) de cualquier tamaño dado. Se prefiere la estimación que
incluido en la muestra. ¿Qué problemas surgen de las siguientes situaciones da la pérdida esperada más pequeña, siendo el resto de las condiciones iguales.
comunes? ( a ) Algunos de los nombres no pertenecen a la pohlación-objeto, a Demuestre que si la pérdida es una función cuadrática \ ( f i — t i)- del error,
pesar de que este hecho no puede ser verificado para ningún nombre hasta debemos escoger la estimación con el error cuadrático medio menor.
que no se seleccione, ( b ) Algunos nombres aparecen en más de una tarjeta.
Todas las tarjetas con el mismo nombre llevan números consecutivos y, por
lo tanto, aparecen juntas en el archivo, ( c ) Algunos nombres aparecen en
más de una tarjeta, pero las que llevan el mismo nombre pueden estar colo
cadas en cualquier lugar dentro del archivo.
1.3. E l problema para encontrar un marco completo que permita la obten
ción de una muestra es frecuentemente un obstáculo. ¿Qué clase de marcos
pudieran ser convenientes para las siguientes encuestas? ¿Tienen los marcos
alguna deficiencia seria? ( a ) Una encuesta de tiendas que venden petacas
en una gran ciudad, ( b ) Una encuesta de artículos que se dejan en los trenes
subterráneos o autobuses, ( c ) Una encuesta de las personas mordidas por
víboras durante el último año.
1.4. Un directorio de la ciudad, de hace cuatro años, enlista las direccio
nes en orden a lo largo de cada calle, y da los nombres de las personas que
viven en cada dirección. Para una encuesta que se lleva a cabo actualmente
por medio de entrevistas a la gente de la ciudad, ¿cuáles son las deficiencias
de este marco? ¿Pueden ser remediadas por los entrevistadores durante el
desarrollo de la encuesta? Al usar el directorio, ¿sacaría usted una lista de
dilecciones (d om icilios) o una lista de personas?
1.5. En una estimación para muestreo del valor real de objetos pequeños
en el inventario de una gran firm a, el valor real y el registrado en los libros
se obtuvieron para cada objeto de la muestra. Para la muestra total, la razón
del valor real al registrado fue de 1.021; esta estimación está distribuida
C A P IT U L O 2
2.1 M U E STR E O A L E A T O R IO S IM P LE
n_ ( n - 1) (n - 2 ) 1 _ n \ (N -n )\ ^ 1
N ( N —l ) ( N —2) " (JV-n + 1) <N)!
Como en todas las extracciones subsecuentes se descarta un núme
ro extraído, este método también se llama muestreo aleatorio sin
restitución. El muestreo aleatorio con restitución es perfectamente
M U E S TR E O A LE A TO R IO S IM P L E 43
42 TE C N IC A S DE M U E S TR E O
TABLA 2.1. U n M i l l a r d e D íg it o s A l e a t o r io s
factible: en cada extracción todos los N miembros de la población
reciben la misma oportunidad de extracción, sin que importe el nú
mero de veces que se extrajeron antes. Las fórmulas de varianzas 00-04 05-09 10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49
y varianzas estimadas de las estimaciones realizadas a partir de la
muestra son a menudo más simples cuando el muestreo es con res 00 54463 22662 65905 70639 79365 67382 29085 69831 47058 08186
01 15389 85205 18850 39226 42249 90669 96325 23248 60933 26927
titución que en el caso contrario. Por esta razón, se utiliza el mues
02 85941 40756 82414 02015 13858 78030 16269 65978 01385 15345
treo con restitución en los planes de muestreo más complicados, 03 61149 69440 11286 88218 58925 03638 52862 62733 33451 77455
aunque a primera vista parece inútil tener dos o más veces la misma 04 05219 81619 10651 67079 92511 59888 84502 72095 83463 75577
unidad dentro de la muestra.
05 41417 98326 87719 92294 46614 50948 64886 20002 97365 30976
06 28357 94070 20652 35774 16249 75019 21145 05217 47286 76305
07 17783 00015 10806 83091 91530 36466 39981 62481 49177 75779
2.2 SE LE C C IO N D E U N A M U E S T R A A L E A T O R IA S IM P LE 08 40950 84820 29881 85966 62800 70326 84740 62660 77379 90279
09 82995 64157 66164 41180 10089 41757 78258 96488 88629 37231
Las tablas de números aleatorios son tablas de los dígitos 0, 1,
2 , . . . 9, donde cada dígito tiene la misma probabilidad de ser se 10 96754 17676 55659 44105 47361 34833 86679 23930 53249 27083
11 34357 88040 53364 71726 45690 66334 60332 '22554 90600 71113
leccionado en cada extracción. Entre las tablas más grandes están
12 06318 37403 49927 57715 50423 67372 63116 48888 21505 80182
las que publicó la Rand Corporation (1 9 5 5 ) con un millón de dígi 13 62111 52820 07243 79931 89292 84767 85693 73947 22278 11551
tos y las de Kendall y Smith (1 9 3 8 ) con 100 000 dígitos. En los 14 47534 09243 67879 00544 23410 12740 02540 54440 32949 13491
textos estándar de estadística se pueden encontrar muchas tablas.
15 98614 75993 84460 62846 59844 14922 48730 73443 4816"7 34770
La Tabla 2.1 muestra 1 000 dígitos aleatorios y para ilustración, de 18644 44104
16 24856 03648 44898 09351 98795 39765 71058 90368
Snedecor y Cochran (1967). 17 96887 12479 80621 66223 86085 78285 02432 53342 42846 94771
18 90801 21472 42815 77408 37390 76766 52615 32141 30268 18106
Cuando se usan estas tablas para seleccionar una muestra alea
19 55165 77312 83666 36028 28420 70219 81369 41943 47366 41067
toria simple, el primer paso es la enumeración de las unidades de la
población de 1 a N. Si el primer dígito de N es un número entre
5 y 9, el siguiente método de selección es el adecuado. Supóngase
N = 528 y queremos n - 10. Tómense tres columnas de la T a
números entre 801 y 999 y desde luego 000 de todos los números
bla 2.1, digamos la 25, 26 y 27. Recórrase hacia abajo cada columna
entre 000 y 200. Todos los residuos mayores que 129 y los números
seleccionando los 10 primeros números distintos, entre 001 y 528.
000, 200, etc., se desechan. A l utilizar las columnas 05 a 07 de la
Estos son 36, 509, 364, 417, 348, 127, 149, 186, 290 y 162. Para
Tabla 2.1 obtenemos 26, 52, 7, 94, 16, 48, 41, 80, 128 y 92, la ex
los dos últimos números saltamos a las columnas 30 a 32. En selec
tracción que requiere 15 números de tres dígitos para n - 10. En
ciones repetidas es aconsejable cambiar el punto de partida en
esta muestra la tasa de rechazo 5/15 = 33% es cercana a la pro
la tabla.
babilidad de rechazo 72/200 = 36% , para este método. Al usar este
La desventaja de este método es que los números de tres dígitos
método con número N como 384, nótese que uno substrae 400 de un
000 y todos los del 529 a 999 no se usan aunque al saltarse núme
número entre 401 y 800, pero automáticamente desecha todos ios
ros no se pierde mucho tiempo. Cuando el primer dígito de N es
números mayores a 800. La substracción de 800 de los números
menor que 5, algunos pueden preferir este método si n es pequeño
entre 801 y 999 daría una mayor probabilidad de aceptación de re
y se dispone de una tabla de números aleatorios bastante grande.
siduos entre 001 y 199 que de los residuos entre 200 y 384.
Con N - 128, por ejemplo, un segundo método con menos re
Hay otros método de muestreo que se prefieren al muestreo alea
chazos y de más fácil aplicación es el siguiente. En una serie de
números de tres dígitos se substrae 200 de todos los números que torio simple por razones de conveniencia o de mayor precisión. El
muestreo aleatorio simple es el más adecuado para una introduc
hay entre 201 y 400, se substrae 400 de todos los números entre 401
y 600, 600 de todos los números entre 601 y 800, 800 de todos los ción a la teoría de! muestreo.
44 TE C N IC A S DE M U ESTRE O
M U E S TR E O ALEA TO RIO S IM P L E 45
tiende a cero al crecer la muestra. Un enunciado exacto de esta de El multiplicador debe ser n/N, ya que la expresión de la izquierda
finición requiere cierto cuidado para planes de encuesta complejos. tiene n términos y la de la derecha tiene N términos. Esto conduce
Como hemos visto, un método de estimación es insesgado si el al resultado.
valor promedio de la estimación, que se toma sobre todas las mues
tras posibles de un tamaño n dado, es exactamente igual al valor
verdadero de la población. Si el método va a ser insesgado, este re 2.5 V A R IA N Z A S DE L A S E ST IM A C IO N E S
sultado debe ser cierto para cualquier población de valores finitos j/í
y para cualquier n. Para investigar si y es insesgado con e l mues La varianza de los valores y¿ en una población finita usualmen
treo aleatorio simple, calculamos el valor de y para todas las yC„ te se define como
muestras y buscamos el promedio de las estimaciones. Con el sím
bolo E se indica este promedio sobre todas las muestras posibles.
U y > -Y )2
Teorema 2.1. La media muestra! y es un estimador insesgado
- 2 =-L- ) 7 — <2'6>
de Y.
Prueba: Por definición, Por motivos de notación, los resultados se presentan en términos de
una expresión ligeramente diferente, en donde el divisor ( N — 1)
E 9 = L ± M y ± + y2+ - - - + y ¿ (2 2 ) se usa en lugar de N. Entonces tenemos:
y vC, n[JV!/n!(N-n)!j . (¿U)
En donde la suma se extiende sobre todas las jVC„ muestras. Para X (y .- y )2
evaluar esta suma, buscamos en cuántas muestras aparece un valor
específico cualquiera, y¡. Como están disponibles otras ( N - 1) uni s
2=V r (2
-
7)
dades para el resto de la muestra y otros (n — 1 ) lugares para com
Esta convención la usan quienes enfocan la teoría del muestreo por
pletar la muestra, el número de muestras que contienen y, es
medio del análisis de la varianza. Su ventaja es que la mayoría de
_ ( N - 1)! los resultados teman una forma ligeramente más simple. Siempre y
n - i L * -' (n _ 1)!(JV_ n)! (2-3) cuando se use consistentemente la misma notación, todos los resul
tados son equivalentes en ambas notaciones. Consideremos ahora la
De donde:
varianza de y. Por esto queremos decir E (y - Y ) 5 tomada sobre to
das las nC» muestras.
£ ( y , + y 2+ - ■ ' - + y~)
Teorema 2.2. La varianza de la media y de una muestra alea
Sustituyendo en (2 .2 ) tenemos:
toria simple es
( N - 1)! n l(N -n )\ ,
E ? = (n - m N - „ ) t nN\ iy' +y' + ' ’ ^
V(y) = E ( y - Y ) 2= - (- ^ ^ = - ( , l - f ) (2.8)
n /V n
, ( y, +y2+ - ( 24)
en donde f - n /N es la fracción de muestreo.
Corolario. Y = N y es un estimador insesgado del total de la Prueba:
población Y.
n ( y - Y ) = (y i- Y ) + {y2- Y ) + - - - + ( y n- Y } (2.9)
Una prueba menos complicada del Teorema 2.1 es como sigue:
como cada unidad aparece en el mismo número de muestras, está
Por el argumento de simetría usado en la relación (2 .5 ), se tiene que
claro que
£(y, + </2 4 - 1- y„) debe ser un múltiplo de yy + y2 + • • • + ys (2.5)
48 TE C NIC AS DE M U ESTRE O M U E S TR E O A LEA TO RIO S IM P L E 49
En (2 .1 1 ) la suma de los productos se extiende sobre todas las pa Para una muestra al azar de tamaño n de una población infinita,
rejas de unidades en la muestra y en la población, respectivamente. se sabe que la varianza de la media es <r2/n. El único cambio en
La suma del lado izquierdo contiene n (n — l)/ 2 términos y la suma este resultado, cuando la población es finita, es la introducción del
de la derecha N ( N - l) / 2 términos. f actor ( N — w)/N. Los factores ( N - n )/ N para la varianza y
Ahora, elevando al cuadrado (2 .9 ) y promediando sobre todas V ( N — 7z) /N para e l error estándar se denominan correcciones de
las muestras aleatorias simples. Usando (2 .1 0 ) y (2 .1 1 ), obtenemos bidas a población finita o corrección por finitud (c p f). Algunos auto
res que presentan los resultados en términos de <r dan estas correc
ciones con un divisor ( N — 1 ) en lugar de N. Siempre y cuando la
n2E (y - Y)2= ^ {(y , - V>2+ • •' + - * )’ fracción n/N sea pequeña, estos factores toman valores cercanos a
la unidad y el tamaño de la población como tal no tiene un efecto
directo en el error estándar de la media de la muestra. Por ejemplo,
+ [ ( y 1- Wyz - ? ) + • • • + (y .v -i - iO (y N - * ) ] }
si S es la misma en dos poblaciones, una muestra de 500 de ima
Completando el cuadrado en el término que incluye el doble produc población de 200 000 da una estimación de la media de la población
casi tan preciso como una muestra de 500 de una población de
to, tenemos
10 000. Las personas que no están familiarizadas con el muestreo,
con frecuencia encuentran este resultado muy difícil de creer y,
n2£ (y - f )2 = ^ { (1 - ^ ) [ ( y , - Y )2 + ' •' + (y^ - ÍO2] desde luego es asombroso. Para ellas es obvio que, si la información
se obtuvo únicamente con una pequeña fracción de la población,
+ ^ [ ( y . - ' m - - - + ( y N - v O ] 2} la media de la muestra no puede ser exacta. Es conveniente que el
lector considere por qué este punto de vista es erróneo.
En la práctica, el cpf se puede ignorar siempre y cuando la frac
El segundo término dentro de la llave desaparece, ya que la suma de
ción de muestreo no exceda un 5 % y para muchos propósitos, aun
y¡ es igual a N Y. La división entre n 2 da si es tan alto como el 10% . El efecto de ignorar la corrección es
sobreestimar el error estándar de la estimación y.
El siguiente teorema, que es una extensión del Teorema 2.2, no
se necesita para la discusión de este capítulo, pero se prueba aquí
Corolario 1. El error estándar de y es para referencia posterior.
_________ 5___ Teorema 2.3. Si yit x, son dos variables definidas en toda unidad
era = —f d ( N —n )/ N = 1—f (2.12) de la población, y y, x son las medias derivadas de una muestra
vn Vn
aleatoria simple tamaño n, entonces su covarianza e s :
Corolario 2. La varianza de Y - Ni/, como un estimador del to
tal de la población Y, es £ (y - Y )(x - X ) = ^ ^ J f o - Y )(r ,- X ) (2.15)
* * !< ,- « (213) Este teorema se reduce al Teorema 2.2 si las variables y¡, x¡ son
n ¡y n iguales en cada unidad.
50 TE C N IC A S DE M U ESTRE O
M U E S T R E O A L E A T O R IO S IM P L E 51
o sea, (2.18)
con una relación similar para E (x — X)=. Por lo tanto, estos dos tér E [ n ( y - Y ) 2] = ~ - S 2
minos se cancelan en ambos lados de la Ec. (2.16). El resultado del N
teorema (Ec. 2.15) se deriva de los dobles productos. Por lo tanto,
Encontramos
2.8 L IM IT E S D E C O N F IA N Z A
n = Z f l -S 0 , y = Z f y , = 1471, l f y ? = 54497
Generalmente se presupone que las estimaciones y y Y se dis
tribuyen en forma normal alrededor del valor correspondiente de la Por lo tanto, la estimación del número total de firm as es
población. Las razones para esta suposición y sus limitaciones se
consideran en la Sec. 2.15. Si la suposición es verdadera, los límites (676X1471)
de confianza superior e inferior para la media y total de la pobla > = -----50---- 19 888
La varianza s* de la muestra es
ción son como sigue:
Media:
donde la suma se extiende sobre todas las unidades N en la pobla 2.10 M UESTREO A L E A T O R IO C O N R E ST IT U C IO N
ción. En esta expresión, las a¡ son variables aleatorias y las y ¡ son
un conjunto de números fijos. Un enfoque semejante se aplica cuando el muestreo es con res
titución. En este caso la unidad t-ésima puede aparecer 0, 1, 2, . . . ,
Claramente, n veces en la muestra. Sea t¡ el número de veces que la i-ésima uni
dad aparece en la muestra, entonces;
Pr (a, = 1) = ^;, P r (« ,= 0 ) = l “
- 1 T
y = -rlXjm
'.|y . (2.32)
Por lo tanto, a¡ se distribuye como una variable binomial unita
ria con P - n/N. Por lo que Como la probabilidad de que la i-ésima unidad esté presente en la
muestra es 1/N para cada unidad muestreada, la variable U se dis
v w - «j- A (i- D (2.26) tribuye como un número binomial de éxitos en n experimentos con
P = 1/N. Por lo que:
Para encontrar V ( y ) necesitamos también la covarianza de a¡
y a¡. El producto a¡ a¡ es 1 si las unidades i-ésima y j-ésima están EM ' n V < í)- " ( ¿ ) ( 1- ¿ ) (2 33)
en la muestra y es 0 de otra manera. La probabilidad de que dos
unidades específicas estén ambas en la muestra es n (n - 1 )/ N (N Conjuntamente, las variables t¡ siguen una distribución multino-
mial, por lo tanto:
- 1 ) . Por lo tanto,
de unidades distintas de la muestra y f ( » ) es una función de v, en normalidad y el sesgo se vuelve despreciable. Los siguientes resul
tonces V ( y ) < V ( 5/ ) si S2 < N Y\ condición que satisfacen casi tados aproximados servirán para la mayoría de las aplicaciones; la
todas las poblaciones encontradas en las encuestas por muestreo. distribución de R se estudia con mayor detalle en el Cap. 6 .
L o a n te rio r c o m p le ta la p ru eb a . . 907.2
=$27.49
33
V a le la p e n a e n fa t iz a r la m a n e r a c o m o se p r o b ó e l T e o r e m a 2.5.
Por e l Teorema 2.2 (ignorando el c p f), su error estándar es.-
E n e l T e o r e m a 2 .2 s e d e m o s tr ó q u e la fó r m u la p a r a la v a r ia n z a d e
La m e d ia m u e s tr a l y d a la fó r m u la p a ra l a v a r ia n z a a p r o x im a d a d e la
p r o p o r c ió n y/x, si la v a r ia b le yi se r e e m p la z a p o r la v a r ia b le
vn n-1 •/«(« - 1) n
( y ¡ — R x ¡ ) / X . E s te m is m o re s u lta d o , o su e x te n s ió n n a tu r a l, es c ie r to
ta m b ié n e n s itu a cio n es m á s c o m p le ja s y se u sa m á s a d e la n te y c o n
fr e c u e n c ia e n e s te lib ro . = 7( ¿ 32)'/^ 224-(907'2)2/33 = SL76
(L a suma de cuadrados sin corregir: 28 224 se muestra en la parte inferior
C o m o u n a e s tim a c ió n m u e s tr a l d e oe ía lab ia 2 .3 .)
Gasto semanal en alimento por persona. Como el tamaño de la fam ilia A primera vista, 9, parece ser una estimación de razón, descrita
varía, la estimación es una razón de dos variables,
en la Sec. 2.11, puesto que, a pesar de que n es fija, n, variará de
X y 907.2 una muestra de tamaño n a otra. Se puede evitar la complicación
R, = - — = — — = $7.38 por persona
Y.X, 123 de usar una estimación de razón al considerar la distribución de y,
Las sumas de cuadrados y de productos necesarios para calcular S ( R ) sobre muestras en donde tanto n como n, son constantes. Sea n¡ > 0.
según la Ec. (2 .4 7 ) se encuentran en la parte inferior de la Tabla (2 .3 ). En la totalidad de muestras con n y n, constantes, la probabi
Necesitamos, además,
lidad de sacar un conjunto específico de n, unidades de las N , uni
2 á ¡ = 14.7512, 6 t2= 54.3996. i , = 3.7273 dades en el dominio j está dada por
Los decimales extra en Á „ 2 R „ R , 2 se incluyen por exactitud. Entonces, uti N '- ’V.C’n— __________1
2.12 E ST IM A C IO N E S D E M E D IA S EN S U B P O B L A C IO N E S
Del Teorema 2.2: el error estándar y, es - W l -(«,/ N ,) (2 .5 0 )
En muchas encuestas, la población se subdivide en clases dentro v «,
Ns'
s (Y l) = - = J l - ( n / N )
•Jn
64 TE C N IC A S DE M U ESTRE O M U E S TR E O ALEA TO RIO S IM P L E 65
2.14 C O M P A R A C IO N E N T R E L A S M E D IA S
Si Y, y S, son la media y la desviación estándar en el dominio
DE LO S D O M IN IO S
de interés (es decir, obtenidas con las unidades que no son cero)
el lector puede verificar que
Supongamos que yy, y* son los promedios de la muestra en el
/'-ésimo y fe-ésimo dominios de un grupo de ellos, en los que se han
( N - 1)S' 2 = (Nj - l)S /+N yy / ( l - j ¡ ) (2.60) clasificado las unidades de una muestra aleatoria simple. La va
rianza de sus diferencias es
Como los términos 1/Ny y 1/N son casi siempre despreciables,
V (S t- 7k ) - m ) + V<9 k) (2.66)
S '2 == PiSf+P/Q/Y* (2.61)
Esta fórmula se aplica también a la diferencia entre dos razones
en donde P, - N ,/ N y Q, - 1 - P,. Esto da R, y Rk.
M U E S TR E O ALEA TO RIO S IM P L E 67
66 TE C N IC A S DE M U ESTRE O
JOebe observarse que rara vez es de interés científico preguntar N v). Para esta población, sea S„T el conjunto de unidades en la
si Y, ■= Yk porque estas medias no serán exactamente iguales en una población para la cual
población finita, excepto por casualidad, aun cuando los datos en
ambos dominios fueran sacados al azar de la misma población in |y«- - K l > T-Jnv( l - f y)S„
finita. En lugar de esto, probamos la hipótesis nula de que los dos
dominios se sacaron de poblaciones infinitas con la misma media. en donde Yv, S,, f„, son la media de la población, desviación están
Por consiguiente, omitimos el cpf cuando calculamos V ( y , ) y V dar y cpf, y r es un número > 0. Entonces, la condición tipo Lin-
( 5* ), usando la fórmula deberg
S? Sk2
y(y¡-yk)=~+—
n¡ nk
(2.67) S ( v . - ñ )2
Y > y + 1.96jf
F i g . 2.1. D is trib u c ió n d e fr e c u e n c ia s de ta m a ñ o s de 1 96 c iu d a d es de lo s v l
Z y = ah, -y = ah
Estados Unidos en 1920 n
0n -\ )s 2= l y 2- n f = ah2- —
n
a (n -a )
Sy n n2 n - \
Por lo tanto, los límites normales de confianza al 95% para Y son
y±1 .9 6 í, = - L ± 1 . 9 6 \ / ^ ^ l { 2 .68)
nL /t— 1 J
cipaimente cuando la población contiene algunos individuos extre Hartley y J. N. K. Rao (1968-1969) han desarrollado otras pro
mos que dominan el promedio de muestra cuando están presentes. piedades de y, al igual que Royall (1 9 6 8 ) y C. R. Rao (1971). En
Sin embargo, estos extremos también tienen un efecto más serio al cualquier población finita habrá cuando mucho T < N valores dis
aumentar la varianza de la muestra y disminuir la precisión. Por lo tintos de los t/¡. En la muestra, sean n¡ valores iguales a y, donde
tanto, se aconseja segregarlos y hacer planes separados para su
Y.n, = n. Hartley y Rao (1 9 6 8 ) demuestran que y tiene varianza m í
control, tal vez enumerándolos completamente si no son muy nume
rosos. Esta eliminación de los individuos extremos de la población nima entre los estimadores insesgados de Y que sólo son funciones
reduce la asimetría y mejora la aproximación normal. Esta técnica de n t y t/i. Para muestreo aleatorio con restitución, prueban que la
es un ejemplo del muestreo estratificado que se discutirá en el Cap. 5. media de los valores distintos en la muestra es el estimador de máxi
ma verosimilitud de Y, aunque no tiene la varianza mínima en to
2.16 EST IM AD O R E S L IN E A L E S DE L A M E D IA das las poblaciones.
D E P O B L A C IO N C. R. Rao (1 9 7 1 ), siguiendo los trabajos de Kempthome (1 9 6 9 ),
En muestreo aleatorio simple nos preguntamos si la media mues consideró los estimadores insesgados 7 = £ Wt,y¡ discutidos por Godam
tral y es el mejor estimador de 7. Esto naturalmente ha dado lu be. Para representar el caso donde las etiquetas l no dan informa
gar a un buen número de trabajos. La respuesta depende del con ción respecto a los valores y¡, C. R. Rao calculó el promedio de V {Y )
junto de competidores permitidos para y, y de la definición de “el sobre todas las N ! permutaciones de las etiquetas asignadas a los
mejor”. Para el muestreo, las unidades de la población suelen nu valores y demostró que sobre estas permutaciones, y tiene varianza
merarse en alguna forma de 1 a N. Estos números suelen llamarse promedio mínima. Royall (1970b) dio un resultado más general.
las etiquetas que se ponen a las unidades.
El trabajo de Godambe (1 9 5 5 ) estimuló numerosas investiga
Los primeros resultados probados por Horvitz y Thompson (1952)
ciones en el diseño de muestras y la estimación incluyendo temas
para estimadores lineales en muestreo aleatorio simple son los si
como los criterios para juzgar los estimadores, el papel de la máxima
guientes. Si cualquier t/¡ recibe siempre el mismo peso u i siempre que
verosimilitud, el uso de la información auxiliar que las etiquetas
se extraiga la unidad rotulada con i, la media muestral y es el único
pueden contener respecto a les y¡, los estimadores bayesianos, y los
__ n
estimador insesgado de Y de forma £ w¡y¡. Dado que cada unidad métodos de estimación cuando se pueden hacer suposiciones sobre la
distribución de frecuencia de los y¡. La influencia dé este trabajo en
aparece en una fracción n/N de muestras aleatorias simples, la práctica del muestreo ha sido hasta ahora limitada, pero debe
aumentar constantemente. En ocasiones nos referiremos a dicho tra
E ( t wtfi) = W 'y ¡)jW m y sólo si cada - 1/n. Si, por otro lado, bajo. Para una revisión de estos trabajos, véase J. N. K. Rao* (1975a)
y Smith (1 9 7 6 )....
el peso dependiera sólo del orden con que se extrae la unidad para
la muestra, entonces y tiene varianza mínima entre los estimadores
n E J E R C I C I O S
lineales insesgados de la forma £ wdy(d), donde y(i, es el valor y en la
d
2.1. En una población con N — 6 los valores de y¡ son 8 , 3, 1, 11, 4 y 7.
unidad que se saca en la extracción d-ésima.
Calcular la media de muestra y para todas las posibles muestras aleatorias
n
simples de tamaño 2. Verificar que y es una estimación insesgada de Y y que
Una clase más amplia de competidores es el conjunto Y. w¡,y¡, don
su varianza es la expresada en el Teorem a 2.2.
de wu puede depender de las otras unidades que caen en la muestra, 2.2. Para la misma población, calcular s2 para todas las muestras aleato
así como de i. Godambe (1 9 5 5 ) demostró que en esta clase no exis rias simples de tamaño 3 y verificar que E (s ! ) = S’ .
te estimación insesgada de Y con varianza mínima para todas las • E n lo su ces ivo a l m e n c io n a r e l a p e llid o R a o , n os re fe r ir e m o s e x c lu s iv a m e n te a
poblaciones. J. N . K. R a o a m e n o s q u e e s p e c ifiq u e l o co n tra rio .
74 TE C N IC A S DE M U E S TR E O M U ESTRE O A LE A TO R IO S IM P L E 75
2.3. Si las muestras aleatorias de tamaño 2 se sacan con restitución de la 2.8. E n el ejemplo anterior pruebe al nivel del 5% si la razón de estudian
población, demuestre, buscando todas las muestras posibles, que V ( y ) satisface te/maestro es significativamente diferente en ambos tipos de instalaciones.
la ecuación
2.9. Para las instalaciones públicas, estimar el número total de maestros:
( a ) a sabiendas que el número total de instalaciones públicas en la población
V {y) -
n n N es 251, ( b ) sin conocer esta cifra. En cada caso calcule el error estándar de
su estimación.
2.4. Una muestra aleatoria simple cíe 30 fam ilias se obtuvo de una área de
2.10. La Tabla siguiente muestra el número de residentes en cada una
la ciudad que condene 14 848 familias. E l número de personas por fam ilia en la
de las 197 ciudades de Estados Unidos que tenían más de 50 000 habitantes en
muestra obtenida fue como sigue:
1940. Calcular el error estándar del número total de habitantes estimado en
5 ,6,3, 3,2,3, 3 ,3 ,4 .4 ,3 ,2 .7 ,4 , 3,5 ,4 ,4 ,3 ,3 ,4 ,3 , 3 ,1 ,2 ,4 ,3 ,4 ,2 ,4 las 197 ciudades utilizando los siguientes métodos de muestreo: ( a ) una mues
tra aleatoria simple de tamaño 50, ( b ) una muestra que incluya las 5 ciuda
Estime el número total de gente en el área y calcule la probabilidad de que
des más grandes y una muestra aleatoria simple de tamaño 45 para las 192
esta estimación esté dentro del ± 10% del valor verdadero.
ciudades restantes, ( c ) una muestra que incluya las 9 ciudades más grandes
2.5. En un estudio sobre el posible uso del muestreo para reducir e l trabajo y una muestra aleatoria simple de tamaño 41 para las ciudades restantes.
de inventario de existencias en una bodega, se hizo un conteo del valor de
2.11. Calcular el coeficiente de asimetría G, para la población original y
los artículos de cada uno de los 36 estantes en la bodega. Los valores aproxi
mados fueron: para la población restante después de elim inar: ( a ) las 5 ciudades más gran
des, ( b ) las 9 ciudades más grandes.
29,38,42,44,45,47,51,53,53,54,56,56,56,58,58,59,60,60,
D is t r ib u c ió n d e F r e c u e n c ia d e lo s T am años de las C iu d a d e s
60,60,61,61,61,62,64,65,65,67,67,68,69,71,74,77,82,85.
La estimación del valor total a partir de una muestra debe ser correcta
Clase del Clase del Clase del
módulo un error máximo de $200.00, excepto para una posibilidad en veinte.
tamaño tamaño tamaño
Un consultor sugiere que una muestra aleatoria simple de 12 estantes es sufi
(m ile s ) / (m iles) f (m iles) /
ciente para hacer la estimación. ¿Está usted de acuerdo?
2.13. Una muestra aleatoria simple de tamaño 3 se obtiene de una pobla estudio entre los empleados elegibles y Qy es la proporción de empleados no
ción de tamaño N con restitución. Demuestre que las probabilidades de que la elegibles de la compañía. Ignore la cpf.
muestra contenga unidades diferentes de 1, 2 y 3 (p o r ejemplo, aaa, aab, abe, 2.16. Se toma una muestra aleatoria simple de tamaño n = n, + n 2 con
respectivamente) son media y en una población fin ita y también una submuestxa aleatoria simple
de tamaño n, de la misma población y con m edia yl . Demostrar que ( a )
P = i_ P p J N -i)(N -2 ) V (S i — F j) — Sa[ ( 1 /nx) + ( l/n2)] donde y . es la media de las restantes n z
' N 7’ 2 N2 ' 3 N2 unidades de la muestra, ( b ) V (y , - g ) = S2[( l / n 1) — (1 / n )], ( c ) Cov {y ,
S¡ — U) = El muestreo repetido implica extracciones repetidas tanto de
Como una estimación de Y se toma y’, la media no ponderada sobre las
la muestra como de la submuestra.
diferentes unidades en la muestra. Demostrar que la varianza promedio de y’ es
2.17. El número de muestras aleatorias simples distintas de tamaño n
es desde luego N !/ n !(N — n )!. Es de interés encontrar conjuntos más pe
queños de muestras de tamaño t i que tengan las mismas propiedades que
el conjunto de muestras aleatorias simples. Un conjunto tal es el de los
Una manera de hacer esto es demostrar que diseños por bloques incompletos equilibrados ( b i b ) . Estas son muestras de
n distintas unidades tomadas entre N , tales que ( i ) cada unidad aparece en
el mismo número ( r ) de muestras, ( i i ) cada par de unidades aparece simul
táneamente en X muestras.
Por lo tanto, demostrar que V (y ’ ) < V ( y ), donde y es la media aritmética Verifiqúese que X = r (n — 1) / ( N — 1) y que el número de muestras dis
de las n observaciones en la muestra. E l resultado V (y‘) < V (y ) para cual tintas en el conjunto es rN/n. Sobre el conjunto de las muestras bib, demués
quier n > 2 fue probado por Raj y Khamis (1 958). trese en la notación usual que si y es la m edia de una muestra ( o ) V (i/ ) =
2.14. Dos dentistas A y B, hicieron una encuesta para investigar el estado (1 — f ) S 2/n y ( b ) v (y ) - (1 — f ) ¿ ( y , — y )»/ n (n — 1 ) es una estima
de los dientes de 200 niños en una colonia. E l Dr. A seleccionó una muestra ción insesgada de V ( y ) .
aleatoria simple de 20 niños y contó el número de dientes cariados de cada
niño, con los siguientes resultados: Notó. N o existe un método genera] para encontrar el más pequeño r para
el cual pueda construirse un bib. En ocasiones, el más pequeño r-conocido
Número de dientes 0 1 2 3 4 5 6 7 8 9 10 proporciona N !/ n !(N — n ) i muestras, lo que nos lleva a las muestras alea
cariados, por niño torias simples. Pero para N = 91, n = 10 el más pequeño conjunto bib tiene
Número de niños 8 4 2 2 1 1 0 0 0 1 1 91 muestras contra más de 6 trillones (E .U .) de muestras aleatorias simples.
Avadhani y Sukhatme (1 9 7 3 ) han mostrado cómo se pueden usar los diseños
E l Dr. B, usando las mismas técnicas dentales examinó a los 200 niños bib para tratar de reducir los gastos de viaje entre unidades de muestreo.
y sólo registró aquellos que no tenían los dientes cariados. Encontró que 2.18. La siguiente es una Ilustración debida a RoyaU (1 9 6 8 ), el hecho
60 niños no tenían dientes dañados. de que en el muestreo aleatorio simple la media de muestra y no presenta
Estimar el número total de dientes cariados en los niños de la colonia, varianza uniformemente mínima en la clase de los estimadores de la form a
( a ) usando sólo los resultados de A, ( b ) usando los resultados de A y B, ( c )
X H\*yi considerada por Godambe (1 9 5 5 ) donde el peso w puede depender
¿Son insesgadas las estimaciones? ( d ) ¿Qué estimación espera que sea más
de las otras unidades que caigan en la muestra. Para N = 3, n =» 2 consi
precisa?
derar el estimador
2.15. Una compañía intenta entrevistar una muestra aleatoria simple de
empleados asociados con ella por más de cinco años. La compañía tiene
? i 2= { y i + i y 2; fi3 - J y ,+ iy s ; Y 23 = iy2+ jy 3
$1 000 para este estudio y cada entrevista cuesta $10. N o hay una lista A
separada de empleados con más de 5 años de servicio, pero se puede com donde Y ¡¡ es el estimador para la muestra que tiene las unidades (i, ; ) . De
pilar una lista de los expedientes a un costo de $200. La compañía puede:
mostrar que en los resultados de Royall Yi f es insesgado y < V (y )
( a ) compilar la lista y entrevistar a las personas’ incluidas en una muestra
s‘ — 3y, — y3) > 0. La ilustración se toma de un ejemplo anterior
aleatoria simple sacada de los empleados elegidos o ( b ) sacar una mues
de Roy y Chakravarti (1960).
tra aleatoria simple de todos los empleados, y entrevistar sólo a los elegibles.
El costo de rechazar aquellos empleados incluidos en la muestra que no son 2.19. Este ejercicio es otro ejemplo de estimadores construidos con base
elegibles es despreciable. en ciertos rasgos particulares de las poblaciones. Después de decidir la toma
Demostrar que para estimar un total sobre la población de empleados de una muestra aleatoria simple se dieron cuenta de que y, sería inacostum-
elegibles, el plan ( a ) da una varianza más pequeña que el plan ( b ) sólo si bradamente bajo y y v inacostumbradamente alto. Para esta situación, Samdal
(197 2 ) examinó el siguiente estimador insesgado de Y.
C < 2J o , , donde C es el coeficiente de variación de la característica bajo
74 TE C N IC A S DE M U ESTRE O
78 T E C N IC A S DE M U ESTBE O
de manera que V/( Y s) < V /(y ) si 0 < c < ( y v —y «)/ Muestreo para Proporciones
2.20. Para una población con N = 8 y valores y, = 1, 4, 5, 5, 6 ,6, 8, 13,
demostrar que con n = 4, V ( 5 ) - 1.5, en tanto que V ( f s) - 0.214cuando y Porcentajes
c = 1.5 (su m ejor v a lo r), y 0.357 cuando c = 1 o 2.
Con base en la información del E jercicio 2.19, otro plan de muestreo con
siste en incluir tanto y , como y, en cada muestra, y extraer una muestra
aleatoria simple de tamaño 2 de y 2 y , con m edia y,. La estimación de
Y es
3.1 C A R A C T E R IS T IC A S C U A L IT A T IV A S
distribución correcta en poblaciones finitas es la hipergeométrica, Al aplicar los Teoremas 2.1, 2.2 y 2.4 a esta población se obtienen
aun cuando la binomiales una aproximación generalmente satis los siguientes resultados para un muestreo aleatorio simple de las
factoria. unidades clasificadas.
Teorema 3.1. La proporción en la muestra p ■= a/n es una es
timación insesgada de la proporción en la población P = A/N.
3.2 V A R IA N Z A S D E L A S E S T IM A C IO N E S M U E S T R A LE S
Teorema 3.2. La varianza de p es
Por medio de un artificio simple se pueden aplicar los teoremas
presentados en el Cap. 2 a esta situación. Para cualquier unidad en
la muestra o población, se define y¡ como 1 si la unidad está en C,
Al usar (3 .4 ).
y como 0 si la unidad está en C'. Para esta población de valores t/¡,
está claro que Corolario 1. Si p y P son los porcentajes de la muestra y de la
población respectivamente, que caen en la clase C, (3 .6 ) continúa
Y = T .y ¡= A (3.1) siendo la varianza de p.
1
Corolario 2. La varianza de Á - Np, la estimación del número
s total de unidades en la clase C, es
l y> .
=P (3.2)
N N
En la misma forma, para la muestra.
Teorema 3.3. Una estimación insesgada de la varianza de p, de
n
rivada de una muestra, es
Xy,
= fl_ (3.3) N -n
n n ®<P>“ * 2- :70“. - UÍUn3”*í <3-8)
De modo que, el problema de estimar A y P es similar a la esti
Prueba. En el corolario del Teorema 2.4 se demostró que para
mación del total y la media de una población en la cual, todos los una variable continua y¿ una estimación insesgada de la varianza
valores y{ son 1 o 0. Para usar los teoremas del Cap. 2, debemos pri de la media muestral y es
mero expresar Ss y s5 en términos de P y p. Nótese que
J2 ( N - n )
X (y. - Y ) 2 Íy ? -N Y 2 (3.10)
s 2= ------------ = --------------- Por lo tanto:
N- 1 N —1
TABLA 3 .2 . V a lo r e s de -J q /P P a ra D ife r e n te s V a lo r e s son grandes con respecto al tamaño de muestra n, o que el muestreo
de P es con restitución.
Con esta suposición, el proceso de obtención de individuos para
P - Porcentaje de la población en la clase C formar la muestra consiste de una serie de n ensayos, en cada uno
de los cuales, la probabilidad de que la unidad que se ánahza per
0.1 0.5 1 5 10 20
p 0 tenezca a C es P. Esta situación da lugar a la distribución de fre
Y q /p oo 3 1 .6 14.1 9.9 4.4 3.0 2 .0 cuencia conocida como binomial para el número de unidades en C
en la muestra. La probabilidad de que la muestra contenga a uni
p ____ 30 40 50 60 70 80 90
dades de C es:
Y q Tp 1.5 1.2 1.0 0.8 0.7 0.5 0.3
<314>
Para un tamaño fijo de muestra, el coeficiente de variación del
De esta expresión podemos tabular la distribución de frecuencia
total estimado en la clase C disminuye consistentemente conforme
de a, de p = a/n, o del total estimado Np.
aumenta el verdadero porcentaje en C. El coeficiente es alto cuando
Existen 3 conjuntos de tablas satisfactorias. Todas ellas dan a
P es menor que el 5% . Se necesitan muestras muy grandes para
P en intervalos de 0.01, La amplitud para n es como sigue:
obtener estimaciones precisas del número total de individuos que
poseen cualquier atributo que sea raro en la población. Para P = 1% , U.S. Bureau o f Standards (1 9 5 0 ).
debemos tener V~ñ = 99 con el fin de reducir el coeficiente de va n - 1 (1 )4 9 (es decir, varía de 1 a 49 con interva
riación de la estimación a 0.1 o 10% . Esto da un tamaño de muestra los de 1 ).
de 9 801. El muestreo aleatorio simple, o cualquier método de mues Rcmig (1 9 5 2 ): n - 50(5)100.
treo que se adapte para propósitos generales, resulta costoso en la
estimación del número total de unidades que posean un atributo Harvard Computation Laboratory (1 9 5 5 ):
raro y se encuentren en número reducido en la población. n - 1(1)50(2)100(10)200(20)500(50)1000
Puesto que la población es de un tipo particularmente simple, La distribución de p puede encontrarse sin suponer que la pobla
en donde la y> toma los valores 1 o 0 , podemos encontrar la dis ción es grande en relación a la muestra. Los números de unidades
tribución real de frecuencias de la estimación p y no sólo su media en las dos clases C y C' en la población, son A y A', respectivamente.
y varianza. Calcularemos la probabilidad de que los números correspondientes
La población contiene A unidades que están en la clase C y N en la muestra sean a y a ' donde
- A unidades en C', en donde P - A/N. Si la primera unidad que
a + a ' = n, A+A'=N
se analiza sucede que pertenece a C, quedarán en la población A
- 1 unidades en C y N - A en C'. Por lo tanto, la proporción de
unidades en C, después de obtener la primera unidad, cambia lige En el muestreo aleatorio simple cada una de las ^ N ^ seleccio
ramente a ( A - 1 )/ (N - 1 ). Alternativamente, si la primera uni nes diferentes de n unidades obtenidas de N tienen igual probabili
dad analizada se encuentra en C , la proporción en C cambia a dad de obtenerse. Para encontrar la probabilidad deseada, contamos
A / (N — 1 ). En el muestreo sin restitución, la proporción cambia el número de muestras que contienen exactamente a unidades per
de esta manera a lo largo del proceso de obtención de unidades. En tenecientes a C y a' de C'. El número de selecciones diferentes de a
la presente sección, estas variaciones se ignoran, es decir, se pre
supone que P es constante. Esto equivale a suponer que A y N - A unidades entre las A que están en C es mientras que el nú
M U E S TR E O P A R A PRO PO RCIO NES Y PO R C EN TAJES 87
86 TE C N IC A S DE M U ESTRE O
x a nA (4X3) 3
E(«p) = nP = — - — =-
mero de selecciones diferentes de a' entre las A' es ^ ^ ^ . Cada una
N -n 3 5 4 15
de las selecciones del primer tipo se puede combinar con cualquiera V in p ) = np Q - = A-—
del segundo para dar una muestra diferente del tipo requerido. El
número total de muestras de los tipos requeridos es, por lo tanto,
3.6 LIM IT E S D E C O N F IA N Z A
(X)
De aquí que, si se obtiene una muestra aleatoria simple de ta
Primero discutiremos el significado de los límites de confianza
para el caso de características cualitativas. En la muestra, a indivi
maño n la probabilidad de que sea del tipo requerido es duos de los n pertenecen a la clase C. Supóngase que las inferencias
se van a hacer respecto al número A en la población que pertenece
a la clase C. Para el límite de confianza superior respecto a A, calcu
0 <315> lamos un valor Á u tal, que para éste, la probabilidad de obtener a
Esta es la distribución de frecuencias de a o np, de la cual, la o menos individuos pertenecientes a C en la muestra es una peque
de p es inmediatamente derivable. La distribución se llama hiper-
ña cantidad ac, por ejemplo, 0.025. Formalmente, A y satisface la
geométñca. ecuación
Para propósitos de cálculo la probabilidad hipergeométrica (3 .1 5 )
puede escribirse como sigue: ¿ Pr(/, n - j \ Á v, N —Á u ) = av U (3.17)
i -o
ni A ( A - í ) . . . ( A - a + 1 ) ( A ' ) ( A ' - 1 ) ■ ( A '- a ’+ l )
donde Pr es la probabilidad para la distribución hipergeométrica,
a l(n - a ) l N ( N - l ) . . . ( N - n +1)
según se definió en (3.15).
E jem p lo . Una familia de 8 miembros está formada por 3 hombres y 5
Cuando av se escoge por adelantado (3 .1 7 ) requiere en general
mujeres. Encontrar la distribución de frecuencias del número de hombres en
una muestra aleatoria simple de tamaño 4. En este caso un valor no entero para satisfacerla, mientras que conceptualmente
A u debería ser un número entero. En la práctica elegimos Á y como el
A = 3; A ' = 5, N = 8; n= 4
valor entero más pequeño de A tal que el lado izquierdo de (3.17)
De la Ec. (3.16) la distribución del número de hombres, a. es la siguiente: es menor que, o igual a, av. En la misma forma ellímite de confian
za inferior A¡_ es el valor entero más grande tal que
a Probabilidad
4! 5.4.3.2 1 Í Pr(/, n -j\ Á L, N - Á L) * a L (3.18)
í-a
0!4! 8.7.6.5 14
Los límites de confianza para P se encuentran entonces al tomar
4! 3.5.4.3 6
P u = Á u/N ,P l = Á l/N.
1 !3! 8.7.6.5 14
Existen numerosos métodos disponibles para calcular los límites
4! 3.2.5.4 6
de confianza.
2 !2! 8.7.6.5 14
4! 3.2.1.5 1
Métodos exactos
3! 1! 8.7.6.5 14
nos individuales y acumulativos de la distribución hipergeométrica, entre 2.5 y 3.5% y la probabilidad de que el límite inferior exceda
pero N se extiende solamente hasta 100. a P está entre 2.5 y 1.5%.
p l ) + 2^ ] (3-19) E l ejem plo es del tipo para el cual se recomienda la aproximación normal. El
error estándar estimado de p es
Los límites que se obtienen de las gráficas de Chung y DeLury son 0.045 y
0.157, respectivamente.
^ h :x x ‘j/o
Ejemplo 3. En los registros de auditoría en los cuales se necesita una
Esta expresión es la extensión natural de (3 .1 5 ), Seo. 3.5, para la
tasa muy pequeña de error, el lím ite de confianza superior para A es de par
ticular importancia. Supongamos que se verifican 200 de 1 000 registros y que distribución hipergeométrica. El numerador es el número de mues
se acepta e l conjunto de 1 000 si no se encuentran errores. Se han creado tras distintas de tamaño n que se pueden formar con a, unidades en
tablas especiales que dan los lím ites de confianza superiores para el número la clase 1, a., en la clase 2 y a¡ en la clase 3.
de errores en un grupo de observaciones. Una buena aproximación resulta de
las siguientes relaciones. La probabilidad de no encontrar errores en n cuando
A errores están presentes en N es, de la distribución hipergeométrica, 3.8 LIM IT E S D E C O N F IA N Z A C U A N D O E X IS T E N M A S
( N - A ) ( S - A - l ) . . . ( N - A - n 4-1) ^ Z N - A - m V D E DO S C LA SE S
J V (iV - l)...(N - * + l) \ N -u I
Deben distinguirse dos casos diferentes.
donde u = (n — l)/ 2 . Por ejemplo, con n = 200, A = 10, N = 1 000, la aproxi
mación da (890.5/900.5 ) 20», la cual, por logaritmos resulta ser 0.107. Por lo Caso 1. Calculamos
tanto, A = 10 (una tasa de error del 1 % ) es aproximadamente el lím ite de
confianza superior al 90% para e l número de errores en el grupo. p _ Número en cualquier clase en la muestra a,
n n
3.7 C L A S IF IC A C IO N E N M A S D E DO S C LA S E S Número total en un grupo de clases _ ak + a, + a3
V=
n n
Frecuentemente, en la presentación de resultados, se clasifican
_ En cualquiera de estas situaciones, a pesar de que la clasifica
las unidades en más de dos clases. Así, una muestra de una pobla
ción original contiene más de dos clases, p misma se obtiene de una
ción humana se puede arreglar en 15 grupos correspondientes a in
subdivisión de las n unidades en solamente dos clases. La teoría an
tervalos de 5 años de edad. Aun cuando una pregunta se supone
tes presentada se aplica a este caso. Los limites de confianza se
que puede contestarse por un simple “sí” o “no” , el resultado realmen
calculan ccmo se describió en la Sec. 3.6.
te obtenido puede caer en cualquiera de las siguientes 4 clases: “sí” ,
“no” , “no sé” , y “ sin respuesta”. La extensión de la teoría a estos casos Caso 2. Algunas veces se omiten ciertas clases, al calcular p
la ilustra una situación en la que existen 3 clases. de una subdivisión en dos partes de las clases restantes. Por ejem
Supongamos que el número que cae en la i-ésima clase es en plo, podríamos omitir las personas que no saben, o no dieron, una
la población y a¡ en la muestra, donde respuesta y considerar la proporción del número de respuestas “sí”
respecto al número de respuestas “sí” “no”. Las proporciones que
N = £ A it n=Yah p¡ = —', p ¡= ^ estructuralmente son de este tipo, con frecuencia son de interés en
encuestas por muestreo. El denominador de una proporción tal no
Cuando la muestra de tamaño n es pequeña en relación al total es n sino un número n' más pequeño.
de A¡, las probabilidades P¡ se pueden considerar .efectivamente cons Aunque n ’ varía de muestra a muestra, pueden seguir usándo
tantes a lo largo de la obtención de la muestra. La probabilidad de se los resultados previos, al considerar la distribución condicional
obtener la muestra observada está dada por la expresión midti.nom.ial. de p y las muestras en las que tanto n como n‘ son fijas. Este re
curso ya se empleó en la Sec. 2.12. Supongamos que
Pr(a¿)= (3-20)
ai f
P —— —— , n - a ¡ + a2, n = a ¡ + a2+ a3
Esta es una extensión correcta de la distribución binomial y es una ü. i "T£?2
buena aproximación cuando la fracción de muestreo es pequeña. por lo que a¡ es el número en la muestra que cae en las clases
La expresión co rrecta de la probabilidad de obteneT la m u estra ob que, por el momento, no estamos interesados. Entonces, como se
servada es muestra en la siguiente sección, la distribución condicional de ay y
92 TE C N IC A S DE M U ESTRE O
m u estreo para p r o p o r c io n e s y po r cen tajes 93
'’ ± h / ( 1“ £ ) ( ^ V ¿ ] 022) Si las muestras se especifican por los valores alt a2, sólo son posibles dos ti-
Si el valor de N ' no es conocido, n/N se puede sustituir por P°s - ai . — 0; a, == 0, a, = 1. Sus probabilidades condicionales, 1/3 y 2/3
n'/N ' en el término cp f de la Ec. (3 .2 2 ). respectivamente, concuerdan con la expresión general (3 .2 4 ). Además,
E (p ) = i
3.12 E S T IM A C IO N D E P R O P O R C IO N E S EN
Á/ = — (3-27)
n E L M U E STR E O P O R C O N G L O M E R A D O S s )fr í
con un error estándar estimado
Como se mencionó en la Sec. 3.2, los métodos precedentes no
s ( Á ,') = N V 1 - ( n / N ) v p q / ( n - 1 ) (3.28) son válidos si cada unidad es un conglomerado de elementos y esta
mos estimando la proporción de estos que pertenecen a la clase C.
donde p = a jn . Si cada unidad contiene el mismo número de elementos m, sea
P¡ ~ a j m la proporción de elementos en la i-ésima unidad pertene
3.11 C O M P A R A C IO N E S E N TR E D O M IN IO S D IFER EN TES ciente a la clase C. La proporción de elementos que pertenecen a C
en la muestra es
Puesto que las proporciones son estimadas independientemente
en los diferentes dominios, las comparaciones entre dichas propor
ciones se hacen por métodos estándar elementales. Por ejemplo, para
probar si la proporción p, — a,/(a, + a / ) difiere significativamente es decir, la estimación p es la media no ponderada de las cantidades
Vi . En consecuencia, si se reemplaza por p¡, las fórmulas del Cap.
de la proporción p2 = cu/(a. + ), formamos una tabla 2 x 2
2 se pueden aplicar directamente para dar la varianza verdadera y
común y corriente, estimada de p.
96 TE C N IC A S DE M U E S TR E O M U E S TR E O PA R A PR O PO R CIO N ES Y PO RCENTAJES 97
Ejemplo 1. Un grupo de 61 pacientes leprosos fue tratado con una droga Estructuralmente, ésta es una estimación de razón típica discutida
durante 48 semanas. Para medir el efecto de la droga en el bacilo de la lepra, en la Sec. 2.11 y después en el Cap. 6 . Es ligeramente sesgada aun
se probó bacteriológicamente la presencia del bacilo en 6 lugares diferentes
cuando el sesgo rara vez tiene importancia práctica.
del cuerpo de cada paciente. De las 366 observaciones, 153, o sea el 41.8%
fueron negativas. ¿Cuál es el error estándar de este porcentaje? Si ponemos a. por y{ y m¡ por en la Ec. (2 .3 9), la varianza
Este ejemplo proviene de un experimento controlado, n o de una encues aproximada de p es
ta, pero ilustra qué tan errónea puede ser la fórmula binomial. Utilizando la
fórmula binomial tenemos n = 366 y 2
Esta cifra es aproximadamente 1.8 veces el valor dado por la fórmula bino- „ (p ) = W IfL Z M W ¿ T m L
mial. L a fórmula binomial requiere la suposición de que los resultados obte nm n —1 w - 3**;
nidos en los lugares diferentes en el mismo paciente sean independientes,
donde m = T m,/n es el número promedio de elementos por conglo
aun cuando en realidad presentan una fuerte correlación positiva. La última
linea en la Tabla 3.4 muestra los números esperados de pacientes con 0, 1, merado en la muestra.
2 , . . . lugares negativos, calculados con la binomial (0.58 4- 0.42)3. Nótese
Ejemplo 2. Una muestra aleatoria simple de 30 fam ilias se obtuvo de un
el marcado exceso de frecuencias f de pacientes con 0,5 y 6 lugares negativos.
censo hecho en 1947 en los Distritos 6 y 7 del Eastem Health District de Bal
timore. La población contiene aproximadamente 15 000 familias. En la Ta
bla 3.5 las personas en cada fam ilia se clasifican, ( a ) de acuerdo a si han
TA B LA 3.4. N úm ero de L ugares N e g a t iv o s por P a c ie n t e
consultado un médico en los últimos 12 meses, ( b ) de acuerdo a su sexo.
y, = 6^/100 0 1 2 1 4 5 6 Total
Nuestro propósito es comparar la fórmula de razón con la binomial que
es inapropiada. Considerando primero la proporción de personas que han con
17 11 4 4 7 14 4 61
/ sultado un doctor. Con la fórmula binomial, tendremos:
/y. 0 11 8 12 28 70 24 153
2.3 10.1 18.3 17.6 9.6 2.8 0.3 61.0
/exp
m uestreo para p r o p o r c io n e s y po rcentajes 99
98 TE C N IC A S DE M U E S TR E O
Luego
TA B L A 3.5. I n f o r m a c ió n d e u n a M u e s t r a A l e a t o r ia Sim p l e
de 30 F a m il ia s H. o ,„0197
n 104
Médico visto
en el último Con la fórmula de razón, notamos que hay 30 conglomerados y tomamos
Núm ero de
año
i>um. ae n= 30
Familia personas Hombres Mujeres S í '7 No m, = número total en la i-ésima fam ilia
número m. a. ai
1 a, = número de personas en la t-ésima fam ilia que ha visto al doctor
1 5 1 4 5 0
p= 0.2885, como antes
2 6 3 3 0 6
3 3 1 2 2 1 104
m = — = 3.4667
4 3 1 2 3 0 30
5 2 1 1 0 2
£ a,2= 86; £ m,2 = 404; £ a,m¡ = 113
6 3 1 2 0 3
7 3 1 2 0 3 -f La cp f se puede ignorar. Por lo tanto (utilizando la Ec. 3.34),
8 3 1 2 0 3 (86) - 2(0.2885)(113) + (0.288S)2(404)
9 4 2 2 0 4
(3 0 ) ( 2 9 ) ( 3 . 4 6 6 7 ) 2
10 4 3 1 0 4
11 3 2 1 0 3 La varianza dada por el método de razón, 0.00520, es mucho más grande
12 1 1 0 2 que la obtenida con la fórm ula binomial, 0.00197. Por diversas razones, las
13 7 3 4 0 7 fam ilias difieren en la frecuencia en que susmiembros han consultado almé
14 4 3 1 4 0 dico. Para la muestra completa, la proporción dequienes lo consultaron es
15 3 2 1 1 2 solamente un poco más de uno en cuatro, pero hay varias familias en las
16 5 3 2 2 3 que cada miembro de ellas ha visto al médico. Se obtienen resultados simi
17 4 3 1 0 4 lares para cualquier característica en la cual los miembros de la misma fam i
18 4 3 1 0 4 lia tienden a actuar en la misma forma.
19 3 2 1 1 2
En la estimación de la proporción de hombres en la población, los resul
20 3 1 2 3 0
tados son diferentes. Por el mismo método de cálculo, encontramos
21 4 1 3 2 2
22 3 2 1 0 3
Fórmula binomial: v (p ) = 0.00240
23 3 2 1 0 3
Fórmula de razón: u(p) = 0.00114
24 0 1 0 1
25 2 1 1 2 0
En este caso, la fórmula binomial sobreestima la varianza. La razón por la
26 4 3 1 2 2
27 2 que ocurre esto es interesante. La mayoría de las familias se form an como
3 1 0 3
28 4 2 2 resultado de un matrimonio; por lo tanto, contienen cuando menos un hom
2 2
29 2 1 1 0 2 bre y una mujer. En consecuencia, la proporción de hombres por fam ilia se
30 4 2 2 1 3 separa menos de de lo que se podría esperar con la fórmula binomial.
Ninguna de las 30 familias, excepto una con un solo miembro, está compues
Totales 104 53 51 30 74 ta totalmente por hombres o por mujeres. S i la distribución binomial fuese
aplicable, con una verdadera P de aproximadamente Vá, las familias con todos
los miembros de un mismo sexo constituirían la cuarta parte de la fam ilia de
tamaño 3 y Va de las fam ilias de tamaño 4. Esta propiedad de la distribución
del sexo ha sido discutida por Hansen y Hurwitz (1 9 4 2 ). Kish (1 9 5 7 ) ha dado
otras ilustraciones del error cometido con el uso impropio de la fórm ula bino
mial en investigaciones sociológicas.
100 TE C N IC A S DE M U ESTRE O M U E S TR E O PA R A PRO PO RCIO NES Y PO R C EN TAJES 101
(/ t-D ! pmQH-m (n ^ m)
(m —l)!(n -m)\
donde P es la frecuencia de la característica rara. Encontrar el tamaño pro
medio de la muestra total y demostrar que si m > 1, p = (m — 1 )/ (n — 1)
L a Estimación del Tam año
es una estimación insesgada de P. (P a ra una m ayor discusión véase Finney,
1949, y Sandelius, 1951, quienes consideran un plan en el cual el muestreo
continúa hasta que se encuentren m individuos o el tamaño total de la mues
de la Muestra
tra alcance un lím ite n„ predeterminado.) Véase también la Sec. 4.5.
Para evitar malentendidos, es aconsejable aclarar al antropólogo El método para aplicar el reajuste en caso necesario, se discutirá
que no le podemos asegurar una exactitud dentro de un 5% , a en la Sec. 4.4.
menos que se analice el tipo sanguíneo de todos los habitantes, Por
muy grande que se tome n, existe la posibilidad de una muestra 4.2 A N A L IS IS D E L P R O B L E M A
desafortunada que presente un error mayor al 5% deseado. El an
tropólogo contesta fríamente que lo sabe, que acepta el riesgo de Los pasos principales involucrados en la elección del tamaño
una posibilidad en veinte de obtener una muestra poco afortunada de la muestra son los siguientes:
y que todo lo que pide es un valor de n y no una clase de estadística.
Ahora estamos en posición de estimar en términos generales 1. Debe existir algún enunciado respecto a lo que se espera de
el valor de n. Para simplificar las cosas se ignora la cp f y el por la muestra. Este puede darse en términos de límites de error desea
centaje de muestra p se supone normalmente distribuido. Si estas dos, como en el ejemplo anterior, o bien en términos de alguna deci
hipótesis son razonables, puede verificarse cuando se conoce el sión o acción que debe tomarse una vez que se conocen los resulta
valor n inicial. dos de la muestra. La responsabilidad de este enunciado es pri
En términos técnicos, p debe encontrarse en el intervalo ( P ± 5 ), mordialmente de las personas que van a usar los resultados de la en
excepto para un caso en 20. Dado que p se supone normalmente cuesta, aunque con frecuencia, dichas personas necesitan de una
distribuida alrededor de P, se encontrará en el intervalo ( P ± 2<rp), guía para expresar sus deseos en términos numéricos.
salvo para una posibilidad en 20. Además, 2. Se debe encontrar una ecuación que relacione n con la pre
cisión deseada de la muestra. L a ecuación variará según el conteni
Op =-Jp Q/n do del enunciado de precisión y el tipo de muestreo propuesto. Una
de las ventajas del muestreo probabilista es que permite la elabo
De modo que podemos escribir
ración de esta ecuación.
, 4PQ 3. Esta ecuación tendrá como parámetros ciertas propiedades
2v PQ/ n = 5 o n=
desconocidas de la población, que deben estimarse para obtener
resultados específicos,
En este momento aparece una dificultad común a todos los pro
4. Con frecuencia sucede que los datos estipulan para ciertas
blemas para la estimación del tamaño de la muestra. Se obtuvo
subdivisiones mayores de la población y que los límites de error de
una fórmula para n, pero n depende de una propiedad de la pobla
ción sujeta al muestreo. En este caso, la propiedad es la cantidad seados se establecen para cada subdivisión. De ser- así, se hace un
P que desearíamos medir. Por lo tanto, preguntamos al antropólogo cálculo separado para el valor n en cada subdivisión y el n total se
si nos puede dar una idea del valor que se espera de P. El contesta encuentra por adición.
que con base en datos obtenidos previamente con otros grupos étni 5. Generalmente se mide más de un atributo o característica en
cos, y de acuerdo a sus especulaciones sobre la historia racial de una encuesta por muestreo: en ocasiones, el número de atributos
la isla, le sorprendería que P estuviera fuera del intervalo del 30 es grande. Si se estipula un grado de precisión para cada atributo,
al 60% . los cálculos conducirán a una serie de valores conflictivos de n uno
Esta información será suficiente para proporcionar una res para cada atributo. Por lo tanto, debe encontrarse un método para
puesta útil. Para cualquier valor de P entre 30 y 60, el producto reconciliar estos valores.
PQ está entre 2 100 y un máximo de 2 500 con P - 50. El valor co 6 . Finalmente, debe apreciarse e l valor elegido de n, para que
rrespondiente de ti está entre 336 y 400. Para no correr riesgos se sea consistente con los recursos de muestreo disponibles. Esto exige
toma 400 como estimación inicial de n. una estimación del costo, trabajo, tiempo y materiales que se ne
Ahora pueden reexaminarse las hipótesis hechas en este análisis. cesitan para obtener la muestra del tamaño propuesto. En ocasio
Con n — 400 y p entre 30 y 60, la distribución de p debería estar nes es claro que n debe reducirse drásticamente, y entonces es
cerca de la normal. Si se requiere o no la cpf, dependen del núme necesario tomar una decisión difícil, que es la de proceder con una
ro de habitantes de la isla. Si la población excede a 8 000, la frac muestra mucho más pequeña, lo que reduce la precisión, o bien,
ción de muestreo es menor al 5% y no se necesita ajuste para la cpf. abandonar los esfuerzos hasta contar con mayores recursos.
lUt> TE C N IC A S DE M U E S TR E O LA E S T IM A C IO N D E L T A M A Ñ O DE L A M U E S T R A 107
En secciones subsecuentes se examinarán en detalle estas di que se va a gastar en alguna empresa), entonces, la precisión re
ficultades. querida se puede enunciar usualmente de una manera más especí
fica, en términos de las consecuencias de los errores de decisión.
Un enfoque general a los problemas de esta índole se presenta en
4.3 L A E S P E C IF IC A C IO N D E L A P R E C IS IO N
la Sec. 4.10, que ofrece un punto de partida lógico para la solución.
La precisión deseada se puede establecer, al definir la cantidad
de error tolerable en las estimaciones muéstrales. Esta cantidad se
4.4 L A F O R M U L A P A R A n A L H A C E R U N M UESTREO
determina mejor a la luz de los usos a que se destinan los resulta
P A R A D E T E R M IN A R U N A P R O P O R C IO N
dos de la muestra. En ocasiones, es difícil saber qué tanto error
debería tolerarse, particularmente cuando los resultados se desti
Las unidades se clasifican en dos clases, C y C'. Se ha conve
nan a varios fines. Supongamos que preguntamos al antropólogo
nido en algún margen de error d de la proporción estimada p de las
por qué desea que el porcentaje del conjunto de personas en el
unidades en la clase C, y existe un pequeño riesgo a, que estamos
grupo sanguíneo O tenga una corrección de un 5% en lugar de 4
dispuestos a correr, de que el error real supere a d; es decir, quere
o 6 % . Su respuesta podría ser que los datos sobre el grupo sanguí
mos que
neo se destinan principalmente a la clasificación facial y sospecha
que los isleños pertenecen a un grupo racial con un valor de P apro Pr(|p-/>|>d) = «
ximado al 35% , o a un tipo racial con un valor de P cercano al 50% .
Se supone un muestreo aleatorio simple y p se toma con dis
Un límite de error de 5% en la estimación le parece lo suficientemen
tribución normal. A partir del Teorema 3.2, Sec. 3.2,
te pequeño para permitir la clasificación en uno de estos dos tipos.
Sin embargo, se opondría en forma violenta a límites de error en [N -n ÍP O
tre 4 o 6 % . ’ V jV - 1 * „
De modo que el límite de error de 5% que escogió el antropólogo,
Por lo tanto, la fórmula que relaciona n con el grado de pre
es en cierta medida arbitrario. A este respecto, el ejemplo muestra
cisión deseado es
cómo se suelen decidir los límites de error. De hecho el antropó
logo, estaba más seguro de lo que quería, en comparación con ¡PQ
muchos científicos y administradores. Cuando por primera vez se n
pregunta a estas personas el grado de precisión deseado, a menudo
donde t es la abscisa de la curva normal que corta un área de « en
confiesan que nunca han considerado el asunto y no tienen idea de
la respuesta. Me he percatado, gracias a la experiencia, que des las colas de la distribución. Al resolver para n encontramos
pués de discutir el asunto, son capaces de indicar, al menos apro t2PQ
ximadamente, el tamaño del límite de error que les parece razonable.
En muchas situaciones prácticas no podemos ir más adelante.
Parte de la dificultad es que no se sabe lo suficiente sobre las con
secuencias que producirían errores de diferentes magnitudes en las
decisiones prácticas que se toman con base en los resultados de la Para fines prácticos, se sustituye una estimación anticipada p
encuesta. Aun cuando estas consecuencias se conozcan, los resul de P en esta fórmula. Si N es grande, una primera aproximación es
tados de muchas encuestas importantes, los utilizan diferentes
personas con diversos propósitos, y algunos de ellos no se han pre
=™ (4.2)
visto al planear la encuesta. Por lo tanto, es de esperarse que exista
un cierto elemento de adivinanza en la especificación de la precisión donde
para un futuro más o menos inmediato.
Si la muestra se toma con un propósito bien definido (com o sería pq
V = — - varianza deseada de la proporción de muestra
una decisión entre “sí" o “no” , o bien, sobre la cantidad de dinero
108 TE C N IC A S DE M U E S TR E O LA E S T IM A C IO N D EL T A M A Ñ O DE L A M U E S TR A 109
En la práctica, primero calculamos n„. Si n,/N es despreciable, necesario de n, para un error relativo r específico es 11 veces más
una aproximación satisfactoria a n de (4 .1 ) será n 0. De no ser grande cuando P - 1% que cuando P = 10%. En esta situación
así, es claro, al comparar con 4.1 y 4.2 que n se obtiene como (un valor pequeño de P pero no muy bien conocido de antemano), el
método de Haldane (1 9 4 5 ) del muestreo continuo hasta que m de los
= n° = n° (A 3)
" l + (n 0- l ) / N 1 + («o / A 0 ' ’ atributos raros se hayan encontrado en la muestra, tiene una gran
ventaja. El método suele llamarse muestreo inverso.
Ejemplo. En e l ejemplo hipotético de los grupos sanguíneos teníamos Si n es el tamaño de la muestra en el que aparece el m-ésimo
d = 0 .0 5 , p = 0 .5 , a = 0 .0 5 , t=2 atributo raro, (m > 1 ), una estimación insesgada de P es p - ( rn
- . l ) / ( n - 1 ). Para N muy grande, P pequeña y m > 10, una bue
Luego na aproximación de V ( p ) es mPsQ /(m — l ) 2. Luego, c t / ( p ) -
( 4 )(0 .5 )< 0 .5 ) (m Q )'r-/ (m - 1) < y jlñ / {m — 1), que será un límite superior
167o
"fl= ói?
r=400 bastante ceñido si P es pequeño. De modo que al fijar m de
Supongamos que sólo hay 3 200 isleños. La cp f será necesaria y encontramos antemano, podemos controlar el valor de c v (p ) sin conocer anticipa
damente P. El valor m = 27 da c v (p ) < 2 0 % , pero el valor m -
rt„ 400
=356 102 se necesita para c v ( p ) < 10%. El valor de n con este método
es una variable aleatoria, pero será grande si P es pequeña.
La fórmula para también se aplica si d, p y q se expresan como p o r
centajes en lugar de proporciones. Dado que e l producto pq crece al tender
p a Vt o 5 0 % , una estimación conservadora de n es la que se obtiene al 4.6 L A F O R M U L A P A R A n CO N D A T O S C O N T IN U O S
seleccionar como p el valor más cercano a Vít en el intervalo en que se espera
esté p. Si por ejemplo, p parece estar entre 5 y 9 % , tomamos 9% para la Generalmente se desea controlar el error relativo r en la estimación
estimación de n. del total o la media de la población. Con una muestra aleatoria sim
Algunas veces, particularmente al estimar el número total NP ple de media y, queremos que
de unidades en la clase C, deseamos controlar en N P el error rela
tivo r en lugar del error absoluto, así, por ejemplo, podríamos desear
estimar N P con un error no mayor al 10%, o sea, queremos que
donde a es una pequeña probabilidad. Suponemos que y sigue una
pr > r) = pr (|p _ p \a rp) = a distribución normal: del Teorema 2.2. Corolario 1, sabemos que
el error estándar es
Para esta especificación, sustituimos rP por r p en vez de d en
•las Fórmulas (4 .1 ) y (4 .2 ). A partir de (4 .2 ) obtenemos lN -n S
4.7 E S T IM A C IO N E S A N T IC IP A D A S DE
V A R IA N Z A S D E P O B L A C IO N Si S se conociera exactamente, el tamaño requerido de la muestra
sería S2/V. El efecto de no conocer S es incrementar el tamaño pro
El ejemplo del vivero no es típico en cuanto a que la varianza
medio por un factor (1 + 2 /nx).
de población S2 se conocía. En la práctica, hay cuatro caminos para
112 TE C N IC A S DE M U E S TR E O L A E S T IM A C IO N D EL T A M A Ñ O DE L A M U E S TR A 113
Estimación de P con Varianza V conglomerados de unidades. Así, el valor s2 calculado, mide prin
Sea P i la estimación de P a partir de la primera muestra. El ta cipalmente la variación dentro de un conglomerado y puede ser una
maño combinado de las dos primeras muestras debería ser subestimación del valor pertinente S2. La relación entre las varia
ciones intra e interconglomerados se discutirá en el Cap. 9. El mis
mo problema surge en el muestreo por conglomerados para pro
V ."¡i, Vn¡ porciones, en donde la fórmula pq/n puede subestimar el efecto de
El primer término de la derecha es el tamaño requerido si se sabe la variación entre conglomerados. Cornfield (1 95 1) ilustra ade
que P es igual a p,. Con este método, la estimación binomial ordi cuadamente la estimación del tamaño de la muestra en muestreo
naria p hecha a partir de la muestra completa, de tamaño n, es li por conglomerados para proporciones.
geramente sesgada. Para corregir el sesgo, tómese El tercer método — uso de los resultados de encuestas previas — ,
p V 0 -2 p ) señala el valor que tiene el poner a disposición, o al menos mante
ner accesible, cualquier dato sobre la desviaciones estándar obte
PQ
nidas en encuestas previas. Infortunadamente, el costo de computa
ción de las desviaciones estándar en encuestas complejas es elevado,
Estimación de P con cv = V C dado
aun con máquinas electrónicas, y es frecuente que sólo aquellas
Tómese desviaciones estándar requeridas para dar una vaga idea de la pre
cisión de las estimaciones principales, se computen y registren. Si
n = y r -+ — +77— (4.9) se encuentran datos anteriores apropiados, el valor de S2 puede re
t-Pi p ¡<Ji Cpiti\
A querir un ajuste, para actualizarlo. Con datos asimétricos en los
La estimación es P = p — Cp/q. En todos los resultados anteriores
que Y cambia con el tiempo, frecuentemente se encuentra que S2
se ignora la cpf.
varía de acuerdo a una razón comprendida entre kY y kY2 donde
Ejemplo. Un muestreador desea estimar P con un coeficiente de varia
ción de 0.1 (1 0 % ) y conjetura que P se encontrará entre 5 y 20% . Este in k es una constante. Por lo tanto, si se cree que Y ha aumentado en
tervalo es demasiado amplio para dar una buena estimación inicial del n 10% en el intervalo de tiempo transcurrido desde la encuesta pre
requerido. Como el cv de P es V Q / n P , fácilm ente se verifica que n — 400 via, podríamos incrementar nuestra estimación inicial de S2 entre
es adecuado para P ■= 20% , pero n = 1900 se requerirá si P es sólo 5% . un 10 y un 20 % .
De acuerdo con esto, el muestreador toma una muestra inicial con w, Por último, en ocasiones es posible hacer una estimación útil de
396 y encuentra p, — 0.101. Dado que V c= 0.1, C = 0.01. La Ele. 4.9 con S2 a partir de una información relativamente escasa respecto a la
duce a
naturaleza de la población. En estudios previos sobre el número de
(0.899) 3 1 gusanos en suelos, se utilizó un instrumento para tomar una mues
" (0.01)(0 .101) + (0.0908)+ (0.01 )<40) tra de ( 9 X 9 X 5 p lg) de la capa superficial. Para estimar n, el
La muestra combinada da np = 88; p = 88/926 = 0.0950. La corrección por muestreador necesitaba conocer la desviación estándar del número
sesgo, Cp/q, viene a ser 0.0011, lo que da una estimación fin al de 0.094 o de gusanos encontrados en una extracción con ayuda del instrumen
9.4%. to. Si los gusanos se distribuyeran al azar en la capa superficial, el
En el segundo método, una pequeña encuesta piloto sirve para número encontrado en un pequeño volumen se apegaría a una dis
varios tiñes, especialmente si se duda de la posibilidad de la encues tribución de Poisson para la cual S2 = Y. Como los gusanos pueden
ta principal. Si la encuesta piloto es en sí una encuesta aleatoria
tender a congregarse se decidió suponer S2 - 1.27, donde el factor
simple, se aplican los métodos precedentes. Pero con frecuencia,
1.2 es un factor arbitrario de seguridad. Aunque se desconocía Y,
el trabajo piloto se limita a una parte de la población que se puede
manejar convenientemente, o que revelará la magnitud de ciertos sus valores de importancia económica respecto al daño en la cose
problemas. Se debe tener en cuenta la opción selectiva de la encues cha se pudieron delinear. Estas dos informaciones hicieron posible
ta piloto al usar sus resultados para estimar S2 o P. Por ejemplo, la determinación de los tamaños de muestra que resultaron satis
es una práctica común la de confinar el trabajo piloto a algunos factorios.
LA E S T IM A C IO N DEL T A M A Ñ O D E L A M U E S T R A 11 5
Deming ( 1 9 6 0 ) muestra cómo algunas distribuciones matemá puede no deberse exclusivamente al tamaño de la muestra. Algunas
ticas simples son útiles en la estimación de S2, a partir de cierto características requerirán tipos diferentes de muestreo en compa
conocimiento del intervalo donde se encuentre y de una idea general ración con otras. Con poblaciones que se muestran repetidamente
de la forma de la distribución. Si la distribución es como una bino es útil reunir información respecto a las características que se pue
mial, con una proporción p de las observaciones en un extremo den combinar económicamente en una encuesta general y las que
del intervalo y una proporción q en el otro, S= = pqhr donde h es la requieren métodos especiales. Como ejemplo, en la Tabla 4.1 pre
longitud del intervalo cubierto por la distribución. Cuando p — q = sentamos una clasificación de características en 4 tipos, sugerida
!4 el valor de S- - 0.25h* es el máximo posible para una longitud h por la experiencia en encuestas agrícolas regionales. En esta cla
dada. Otras relaciones útiles son S* = 0.083h- para una distribución sificación, una encuesta general quiere decir una en Ja cual las uni
rectangular, S2 = 0.056b2 para una distribución que tiene forma de dades están más o menos uniformemente distribuidas en alguna
triángulo rectángulo y S! = 0.042h- para un triángulo isósceles. región, como sucede, por ejemplo con una muestra aleatoria simple.
Estas relaciones no son de mucha ayuda si h es grande o poco
conocida. Sin embargo, si h es grande, es conveniente estratificar T A B L A 4.1. Un E j e m p l o de T ip o s D if e r e n t e s de C a r a c t e r ís t ic a s en
mar con una varianza específica V. Para la z-ésima subdivisión, para cada par de subdivisiones (dominios). En este caso
tenemos n, = S */V, por lo tanto, el tamaño de la muestra total
( 4 .1 3 )
n - £ S ¡7 V . Las S¡2 individuales serán en promedio más pequeñas U V \ir, 77; /
que S2, la varianza de la población, pero a menudo sólo un poco
Si las S¡2 no son muy diferentes de S‘, n será 2kS2/V 'cuando los
más pequeñas. De modo que si existen k subdivisiones, n = feSVV,
k dominios son del mismo tamaño, y aún mayores en el otro caso.
en tanto que si sólo se desea obtener la estimación para la pobla
El efecto de los términos de cpf, despreciados en esta discusión,
ción como un todo, se toma n = S"/V.
es la reducción en cierta medida de los n requeridos.
Por lo tanto, si queremos estimaciones con varianza V para ca
da una de las k subdivisiones, el tamaño de la muestra puede apro
ximarse a k veces el n necesario para una estimación global de la 4.10 E L T A M A Ñ O D E L A M U E S T R A EN
misma precisión. E-ste aspecto tiende a ignorarse en los cálculos P R O B L E M A S D E D E C ISIO N
del tamaño de la muestra, y le ocurre especialmente a las personas
sin experiencia en métodos de encuesta. En ocasiones, puede desarrollarse un enfoque más lógico para
determinar el tamaño de la muestra, cuando se va a tomar una de
Si las subdivisiones representan clasificaciones por variables tales
cisión práctica, basada en los resultados de la muestra. Se puede
como la edad, el sexo, el ingreso, los años de educación, etc., la
presuponer que la decisión estará más sólidamente fundamentada,
subdivisión a la que una persona pertenece no se conoce sino hasta
si la estimación muestral tiene un error, pequeño, en lugar de uno
después de haber tomado la muestra. Incluso se pueden hacer esti
elevado. Podemos calcular en términos monetarios la pérdida l ( z )
maciones anticipadas del tamaño de la muestra, si se conocen las
que ocurrirá al tomar una decisión que presente un error correspon
proporciones tt¡ de las unidades que pertenecen a las diferentes sub
diente de z en la estimación. Aunque el valor real de z no se puede
divisiones. Si se selecciona una muestra aleatoria simple de tama
predecir de antemano, la teoría del muestreo nos permite encontrar
ño n, el tamaño esperado de la muestra a partir de la i-ésima sub
la distribución de frecuencia f ( z , n ) de z, que para un método de
división es riTTi. La varianza promedio de la media a partir de esta
muestreo específico, dependerá del tamaño de la muestra n. Por lo
subdivisión es
tanto, la pérdida esperada para un tamaño de muestra dado es
V(yt) = E ¡ f - (4.10)
\n¡ 1 rnr¡ I ( n ) = | / (z)/ (z, 7i)d z (4.14)
si 7i 7ri es grande. Por lo tanto, requerimos ti = SiYn-jV para hacer
El propósito de tomar la muestra es disminuir esta pérdida. Si
V (y.) = V. Si esto es válido para cada subdivisión, C ( n ) es el costo de una muestra de tamaño n es razonable elegir
7? para minimizar.
C (n )+ L (n ) (4.15)
Si las subdivisiones están hechas en clases como la edad o el ingre puesto que éste es el costo total involucrado al tomar la muestra y
so, Si-/v( puede ser menor que S2 para las clases centrales, pero pue las decisiones a partir de sus resultados. La elección de n deter
de ser grande para una clase extrema con v¡ pequeña. En este ca mina tanto el tamaño óptimo de la muestra, como el grado de pre
so, tendremos que incrementar el valor de V en esta subdivisión, o cisión más ventajoso.
bien, encontrar alguna manera de identificar de antemano unidades Alternativamente puede presentarse el mismo enfoque en tér
en esta subdivisión para que se puedan muestrear a una mayor tasa. minos de la ganancia monetaria que ocurre al tener la información
En ocasiones, el método del muestreo doble (Cap. 12) es útil para muestral en lugar dela pérdida derivadade los errores en dicha
este propósito. información. Si se usala ganancia monetaria, construimosuna ga
Las exigencias en el tamaño de la muestra son aún mayores en nancia esperada G (n ) a partir de un tamaño de muestra n, donde
estudios analíticos, donde las especificaciones son G ( 77) es cero si no se toma muestra alguna. Maximizamos
Y (y t - y , ) ^ V (4.12) G (n )- C ( n )
118 TE C N IC A S DE M U E S TR E O LA E S T IM A C IO N D E L T A M A Ñ O DE LA M U E S TR A 119
En esta forma, el principio es equivalente a la regla de la economía como cuantitativos. Se puede ver una relación bastante completa
clásica de la maximización de la utilidad. del método en el trabajo de R aiffa y Schlaifer (1961). Aunque to
La aplicación más simple se presenta cuando la función pérdida davía no es evidente la frecuencia con que podrán llevarse a una
Z(z), es Az5, donde A es una constante. Lo que da como resultado solución completa los problemas de decisión con ayuda de este mé
que todo, puede afirmarse que es valioso ya que estimula las reflexiones
respecto a los factores importantes de una buena decisión. Una área
L (n ) = X E (z2) (4.16) que parece adaptarse convenientemente a las aplicaciones es la del
* — — —
Por ejemplo, si Y es la estimación muestralde Y, y z = Y — Y, muestreo de los lotes de artículos en un proceso de producción en
masa, para decidir si se acepta o se rechaza el lote con base en su
L (n ) = \ V ( ? ) = — ~ (4.17) calidad estimada. Sittig {1 951) considera la economía de la deter
n N
minación del tamaño de muestra, al tomar en cuenta costos de
si se usa muestreo aleatorio simple. inspección y de aceptación de artículos defectuosos, así como costos
El tipo más simple de función costo para la muestra es ligados a la existencia de artículos reglamentarios en lotes recha
zados.
C(rt) = c0+ c l n (4.18)
donde c, es el costo fijo. Al derivar, el valor de n que minimiza costo 4.11 E L EFECTO D E L D ISE Ñ O (D eff)
más pérdida es
Con los planes de muestreo más complejos que se describen pos
n = V Á 5 I /c¡‘ (4.19)
teriormente, una cantidad útil es el llamado efecto del diseño ( def f )
Yates (1 9 6 0 ) da una form a más general de este resultado. El mis del plan de muestreo (Kish, 1965). Este autor describe dicha can
mo análisis se aplica a cualquier método de muestreo y de esti tidad como la razón de la varianza de la estimación obtenida a partir
mación en el que la varianza de la estimación es inversamente de la muestra más compleja a la varianza de la estimación obteni
proporcional a n y el costo es una función lineal de n.
da a partir de una muestra aleatoria simple del mismo número de
Blythe (1 94 5) describe la aplicación de este principio a la esti unidades. El efecto del diseño tiene dos usos primordiales — en la
mación del volumen de madera en un lote con fines de venta (ver estimación del tamaño de muestra y en la apreciación de la efi
Ejercicio 4.11). Nordin (1 9 4 4 ) discute el tamaño óptimo de la
ciencia de planes más complejos— . Por ejemplo, al estimar la pro
muestra para estimar las ventas potenciales de un mercado al que
porción de personas que presentan cierto atributo, a menudo es
desea entrar un fabricante. Si las ventas pueden pronosticarse exac
conveniente usar la casa en vez de la persona, como unidad de mues
tamente, la cantidad de equipo fijo y de producción por unidad de
treo. Como se notó en el Cap. 3, la fórmula PQ/n no se puede usar en
tiempo se podrá asignar de tal manera que maximice la utilidad
estos planes. Para estimar la proporción de los que han visto a un
esperada por el fabricante. Grundy y otros (1954-1956) consideran
médico (Sec. 3.12) una muestra aleatoria simple de casas, dio
el tamaño óptimo de una segunda muestra, cuando se conocen los
v ( p ) = 0.00520 contra pq jn -= 0.00197 para una muestra aleatoria
resultados de una muestra inicial.
simple del mismo tamaño constituida por personas. Una estimación
Este enfoque ha sido desarrollado sustancialmeníe en trabajos
del deff para esta muestra por conglomerados y esta variable es
sobre la teoría de decisión estadística. Las generalizaciones inclu
520/197 - 2.6. Cuando las fracciones de muestreo son pequeñas,
yen la sustitución de la utilidad por el valor monetario como una
escala en la que se miden costos o pérdidas, el uso explícito de in podemos, por lo tanto, estimar el tamaño de la muestra al calcular el
formación anterior subjetiva respecto a parámetros desconocidos, n (número de personas) requerido con una muestra aleatoria sim
al expresar esta información como distribuciones de probabilidad a ple de personas y multiplicar por 2.6. Al observar las razones deff
priori de los parámetros desconocidos, y la investigación de diferentes de esta manera para las variantes importantes con un plan comple
tipos de funciones de costo y pérdida, y de datos tanto cualitativos jo, podemos usar las fórmulas simples de este capítulo para estimar el
120 TE C N IC A S DE M U ESTRE O L A E S T IM A C IO N D EL T A M A Ñ O DE L A M U E S T R A 121
4.8. Los colegios con programas de estudio de cuatro años, en los Es ( h ) Suponga que en ( a ) el diente opina que las características están po
tados Unidos se dividieron en clases de 4 tamaños diferentes de acuerdo con sitivamente correlacionadas, pero no conoce la correlación, si se sugiere
sus inscripciones de 1952-1953. Las desviaciones estándar dentro de cada una muestra inicial de 200, con los siguientes resultados.
clase se muestran a continuación.
Características
Clase 1 2 Número de unidades
1 2 3 4 Sí Sí 72
Sí No 44
Número de estudiantes <1000 1000-3000 3000-10 000 más de 10 000 No Sí 14
S, 236 625 2008 10 023 No No 70
200
Si conoce los limites de clase pero no los valores de S¡, ¿qué tan bien
puede estimar los valores de los S¡ usando cifras matemáticas simples (Sec. ¿Qué tamaño de muestra se recomienda para estimar (P . — P2) con un
4.7)? Ningún colegio tiene menos de 200 estudiantes y el más grande tiene error estándar < 2 % ?
cerca de 50 000 estudiantes. 4.13. ( a ) Suponga que se está estimando la razón de sexos, que es cer
4.9. Con una función cuadrática de pérdida y una función lineal de cos cana a la unidad, y que se pueden muestrear domicilios donde viven 4
tos como en la Sec. 4.10, Sa se reduce a S'! mediante un plan de muestreo personas, padre, madre y dos hijos. Al ignorar la pequeña proporción de fa m i
lias con gemelos idénticos, encontrar e l factor deff para una muestra alea
más eficiente, c0, c, y X permanecen sin cambio. Si n', V ' denotan un nuevo
toria simple de re casas contra una muestra de las 4n personas, ( b ) Las fa
tamaño óptimo de muestra y V (Y ), demostrar que n ' <; n y que V' < V. milias donde hubiese gemelos idénticos, ¿ elevarían o redudrían el factor deff?
4.10. Si la función de pérdida debida a un error en y es \ ¡y — Y| y
si el costo C = c„ + c,n, demuestre que con un muestreo aleatorio simple,
ignorando la cpf, e l valor más económico de n es
t í= T
4.11. (Adaptado de Blythe, 1945.) El precio de venta de un lote de
madera en pie es LTW, en donde U es el precio por unidad de volumen y
W es el volumen de la madera en e l lote. Se cuenta el número N de tron
cos en el lote, y mediante una muestra aleatoria simple de n troncos, se
estima el volumen promedio por tronco. Se hace una estimación pagada por
el vendedor y ésta es provisionalmente aceptada por el comprador. Después,, el
comprador determina el volumen exacto comprado, y el vendedor le reembol
sa, en caso de que el comprador haya pagado más de lo que le fue entregado.
Si el comprador ha pagado menos de lo recibido, no menciona e l hecho.
Construya la función de pérdida del vendedor, A l suponer que e l costo
de la medición de n troncos es en, encuentre e l valor óptimo de n. La des
viación estándar del volumen por tronco se puede indicar por S y la cpf se
puede ignorar.
4.12. ( a ) La presencia o la ausencia de dos características se debe medir
en cada unidad de una muestra aleatoria simple de una población grande.
Si P „ P2 son los porcentajes de unidades de la población que tienen las ca
racterísticas 1 y 2, un cliente desea estimar (P , — P 2) con un error estándar
que no exceda dos puntos por ciento. ¿Cuál es el tamaño de la muestra,
que debe sugerirse sí el cliente piensa que tanto P, como P. están entre
el 40 y el 60% , y que las características se distribuyen independientemente
en las unidades?
C A P IT U L O 5
5.1 D E S C R IP C IO N
y* valor obtenido para la i-ésima unidad Esto significa que la fracción de muestreo es la misma en todos los
estratos. Esta estratificación se describe como estratificación con
ponderación del estrato
*-3 asignación proporcional de los números n h y da lugar a una muestra
autoponderada. Si se hacen numerosas estimaciones, este tipo de
muestra ahorrará tiempo.
fh ~ tt " fracción de muestreo en el estrato Las propiedades principales de la estimación y,t se bosquejan
en los siguientes teoremas. Los dos primeros, se aplican al mués-
128 TE C N IC A S DE M U E S TR E O M U E S TR E O A LE A TO R IO E S TRATIFIC AD O 129
treo estratificado en general y no se restringen al muestreo aleato pendiente en los diferentes estratos, entonces y3t es una estimación
rio estratificado; es decir, que la muestra en un estrato cualquiera insesgada de Y con varianza IW V 'V (y *).
no es necesariamente una muestra aleatoria simple. Lo importante con respecto a este resultado es que la varianza de
y,t sólo depende de las varianzas de las estimaciones de las medias Y*
Teorema 5.1. Si en cada estrato la estimación muestral es in de los estratos individuales. Si fuese posible dividir una población
sesgada, entonces y,t es una estimación insesgada de la media de altamente variable en estratos de un modo tal que todos los atributos
población Y. tuviesen el mismo valor dentro de un estrato, podríamos estimar Y
sin error alguno. La Ec. 5.4 muestra que el uso de las ponderacio
Prueba. nes de estratos correctos N h/N al hacer la estimación y „ es el que
conduce a este resultado.
E(yu) = E Í Whyh = £ WhY„
ft-i (i-i Teorema 5.3. Para el muestreo aleatorio estratificado, la varian
puesto que las estimaciones son insesgadas en los estratos individua za de la estimación y,t es
les. Pero la media de población Y puede escribirse
L N» L
• V U . ) - ¿ I Nh(Nh - n h) ^ - = Í Wh2— ( l - f h ) (5.6)
r» (i-i nh (.-i nh
I I yu I N,,Yh
y _ (. —M—1 —(i -1_______ yw y Prueba. Puesto que yh es una estimación insesgada de Y* pue
Y N ~ N hYh de aplicarse el Teorema 5.2. Además, por el Teorema 2.2, aplicado
lo que completa la demostración. a un estrato individual
Corolario 3. Si el muestreo es proporcional y las varianzas en tenidos tomando entre la 5a. y la 68a. ciudades de los Estados Unidos del total
ordenado respecto al número total de habitantes en 1920. Las ciudades se co
todos los estratos tienen el mismo valor, Su,2, obtenemos el siguiente
locaron en dos estratos, el primero contiene las 16 ciudades más grandes y el
resultado segundo las 48 restantes.
El número total de habitantes del total de 64 ciudades en 1930 se va a
estimar de una muestra de tamaño 24. Encontrar el error estándar del error
<s « estimado por: ( 1 ) una muestra aleatoria simple, ( 2 ) una muestra aleatoria
Teorema 5.4. Si Y,¡ = N y „ es la estimación del total de la po estratificada con asignación proporcional, ( 3 ) una muestra aleatoria estratifi
blación Y, entonces cada con 12 unidades obtenidas de cada estrato.
Esta población se asemeja a las poblaciones de muchos tipos de nego
cios en que algunas unidades — las ciudades grandes— contribuyen sustan
V t f u ) = 2 K ( N h- n h)^ ~ (5.10) cialmente al total y presentan una variabilidad mucho mayor que las restantes.
Los totales por estrato y las sumas de cuadrados se muestran abajo de la
Lo anterior es inmediato, considerando el Teorema 5.3. Tabla 5.1. En este ejemplo sólo se utiliza la información de 1930: la in for
Ejemplo. La Tabla 5.1 muestra e l número de habitantes en 1920 y 1930, mación de 1920 aparece en un ejemplo posterior.
en miles, en 64 grandes ciudades de los Estados Unidos. Los datos fueron ob- Para la población completa en 1930, encontramos
Tamaño en Tam año en Las tres estimaciones de Y se representan por Y „ „ , Yprgp, y Y ¡gutl.
1920 (* H ) 1930 (jfc j) 1. Con muestreo aleatorio simple
797 314 172 121 900 364 209 113 del Teorem a 2.2, Corolario 2. E l error estándar es
773 298 172 120 822 317 183 115 < r ( £ j = 2365
748 296 163 119 781 328 163 123
734 258' 162 118 805 302 253 154 2. Las varianzas para los estratos individuales son
588 256 161 118 670 288 232 140
S t2= 53 843, S22= 5581
577- 243 159 116 1238 291 260 119
507 238 153 116 573 253 201 130 Nótese que el estrato con las ciudades más grandes tiene una varianza apro
507 237 144 113 634 291 147 127 ximadamente 10 veces mayor que la del otro estrato.
457 235 138 113 578 303 292 100 Con asignación proporcional, tenemos n ¡ — 6, n , = 18. De la Ec. (5 .7 )
438 235, 138 110 487 272 164 107 multiplicando por N~, tenemos
415 216 138 110 442 284 143 114
401 208 138 108 451 255 169 111
387 201 136 106 459 270 139 163
381 192 132 104 464 214 170 116 = ! t [(16)(S3 843) + (48)(5581)]= 1 882 293
324 180 130 101 400 195 150 122
< 7 (^ 1 = 1 3 7 2
315 179 126 100 366 260 143 134
3. Para n , — = 12 utilizamos la fórmula general (5 .9 ):
Nota: Las ciudades están clasificadas en e l mismo orden en ambos años.
En este ejemplo las muestras de igual tamaño en ambos estratos son más cación estricta de este método. El siguiente es un método aproxi
precisas que la asignación proporcional. Ambas son superiores al muestreo mado de asignación de un número efectivo de grados de libertad a
aleatorio simple.
s (y aí) (Satterthwaite, 1946).
Podemos escribir
5.4 L A V A R I A N Z A E S T IM A D A Y LIM ITES 2/- \ 1 £ r2 . , Nfc(yvh-iz„)
D E C O N F IA N Z A S (y«) = 772 I ShSh , donde g* -------------
N h-\ nh
Si se toma una muestra aleatoria simple dentro de cada estrato, E! número efectivo de grados de libertad ne es
una estimación insesgada de S*5 (d el Teorema 2.4) es
1
n,
M a
-------- 3— 4- (5.16)
v = - — 7 l ( y M- y k )2 (5.11)
nh~ 1 .-i
L nh - 1
Por lo tanto, obtenemos el siguiente.
El valor de n e siempre está entre el más pequeño de los valores
Teorema 5.5. Con muestreo aleatorio estratificado, una estima
( 71» — 1 ) y su suma. La aproximación toma en cuenta el hecho de
ción insesgada de la varianza de y.t es que Sh* puede variar de un estrato al otro y supone que y¡,¡ sea nor
mal, pues depende del resultado de que la varianza de s„2 sea 2<^4/
» ( 7 J - « * ( f c » ) - ¿ l N h(N h - n h) — (5.12) (72,, — 1). Si la distribución de y*; tiene una curtosis positiva, la va
H h -t nh
rianza de Si,- será mayor que esto y la Fórmula 5.16 sobreestima los
Una forma alternativa para propósitos de cálculo es grados efectivos de libertad.
¿ JS& L | «£ ! (5 . 13 )
h- i nh i N
5.5 L A A S IG N A C IO N O P T IM A
El segundo término del lado derecho de la expresión anterior repre
senta la reducción debida a la cpf. En el muestreo estratificado, los valores de los tamaños de mues
Para calcular esta estimación, debe haber cuando menos dos tras n* en los respectivos estratos, los elige quien hace el muestreo.
unidades provenientes de todos y cada uno de los estratos. La esti Se pueden seleccionar para minimizar V ( y 3t) para un costo especí
mación de la varianza cuando la estratificación se lleva al punto en fico de tomar la muestra, o bien, para minimizar el costo para un
el cual sólo se escoge una unidad por estrato, se discute en la Sec. valor específico de V ( y „ ) .
5A.12. La función de costo más simple es de la forma
Las fórmulas para los limites de confianza son:
costo = C = c0+ £ <vyi (5.17)
Media de la población: y„ ± ts{y„) (5.14)
Total de la población: Ny„±tNs(y„) (5.15) Dentro de cualquier estrato, el costo es proporcional al tamaño de
la muestra, pero el costo por unidad c* puede variar entre estratos.
Estas fórmulas suponen que está normalmente distribuida y El término c0 representa un costo fijo.
que s ( y „ ) está bien determinada, de modo que el multiplicador t pue Esta función de costo es apropiada cuando la parte principal del
da encontrarse en las tablas de la distribución normal. costo es la de tomar las medidas en cada unidad. Si los costos de
Si sólo se dan algunos grados de libertad para cada estrato, el viaje entre las unidades son importantes, los estudios empíricos y
procedimiento usual para tomar en cuenta el error de muestreo in matemáticos sugieren que los costos de viaje se representen mejor
herente a una cantidad como s ( y „ ) consiste en leer el valor t en las por medio de la expresión 1th donde th es el costo de viaje por
tablas de la í de Student, en lugar de la tabla normal. La distribución unidad (Beardwood y otros, 1959). Aquí sólo se considera la función
de s(yít ) es en general demasiado compleja, para permitir una apli de costo lineal (5 .1 7).
134 TE C N IC A S DE M U ESTRE O
M U ESTRE O A LE A TO R IO E S TRATIFIC AD O 13 5
Teorema 5.6. En el muestreo aleatorio estratificado, con una Por lo tanto, ninguna elección de los nh puede hacer V'C' menor que
función de costo lineal de la forma (5 .1 7 ), la varianza de la media
estimada y3t es un mínimo para un costo específico C y el costo es
(i
un mínimo para una varianza específica V ( y ,t) donde nh es propor
cional a W;,SWc/,. El valor mínimo ocurre cuando
Prueba. Tenemos
— = T Trir = constante (5.22)
üh
C - c 0+ Z chnh (5.17) como se afirma en el teorema.
a» i
En términos del tamaño total de muestra n* en un estrato, te
L W,2(>,2 r W,2C.2 r W.2C,2 nemos
V = V (y „ ) = 1 - ^ ( 1 - / * ) = I (5.18)
fc-i Hit h -i nh i
n*= WkSJ'G. N&/JZ
Nuestros problemas son ya sea ( 1 ) elegir los nhparaminimizar V
con C especificada, o bien, ( 2 ) elegir los nkparaminimizar C con * L ( V W ^ ) l ( N hS J ^ 7h)
V especificada. Lo que ocurre es que a excepción de los pasos finales, Este teorema da lugar a las siguientes reglas de conducta. En un
estos problemas tienen la misma solución. A l elegir los nh para mi estrato dado, se toma una muestra más grande si
nimizar V con C fija o C con V fija, ambos son equivalentes a mini
mizar el producto, 1. El estrato es más grande.
2. El estrato es más variable internamente.
V 'C = ( v + l ^ ^ y c - c J
3. El muestreo es más barato en el estrato.
Se necesita un paso más para completar la asignación. La Ec.
(5.19) (5 .2 3 ) da el nh en términos de n, pero todavía no conocemos qué
Stuart (1 95 4) observó que (5 .1 9 ) se puede minimizar “limpia valor tiene rt. La solución depende de si la muestra se escoge para
mente” usando la desigualdad de Cauchy-Schwarz. Si ah, h* son dos satisfacer un costo total especificado C o para dar una varianza
conjuntos de L números positivos, esta desigualdad proviene de la especificada V para y„. Si el costo es fijo, se sustituyen los valo
identidad res óptimos de nh en la función de costo (5 .1 7 ) y se resuelven para
ti. Esto da
( i a*2) ( l V ) - ( l ü/A) = 1 1 (a¡b, - a fitf (5.20) „ _ ( C - c 0) I ( N A / v ^ )
' ' ' i i>¡
De (5 .2 0 ) vemos que K A V J .v Q (5‘24)
Si V es fija, se sustituye la nk óptima en la fórmula para V ( y „ ) .
(S ah :) ( l ó fc2) s ( x a A ) ' (5.21) Encontramos
Vnn = ( \ - f ) ^ (5.29)
nh=nr é k =ni (5-26)
Esta asignación se llama a veces asignación de Neyman, por Ney-
V „ - ^ l W A ' - l ^ ¿ Z S Í (5.30)
man (1 9 3 4 ) cuya prueba dio prominencia al resultado. Más tarde
se descubrió una prueba anterior de Tschuprow (1923).
[de la Ec. (5 .8 ), Sec. 5.3.]
Una fórmula para la varianza mínima con n fija se obtiene al
sustituir el valor de n en (5 .2 6 ) en la fórmula general para V (y J().
'2
El resultado es V a=- _ _ L & (531)
^ n N C5,31)
[de la Ec. (5 .2 7 ), Sec. 5.5.]
Vmín(y «) = - --- — — ( 5. 27) Tenemos, usando la identidad algebraica estándar para el análisis
de la varianza de una población estratificada
El segundo término de la derecha representa la cpf.
(N -D S *-lZ (y u- f )*
h i
5.6 PR E C IS IO N E S R E L A T IV A S D E L M U E STR E O
A L E A T O R IO E S T R A T IF IC A D O Y D E L = Z I (y* - Y h)2+ 1 N h( ñ - Y)2
h i h
M U E ST R E O A L E A T O R IO S IM P LE
=S - 1)5*2+I Nfc(Y* - f ) 2 (5.32)
Si se usa la estratificación de manera inteligente, casi siempre
da como resultado una varianza más pequeña para la media esti Si los términos 1/N* son despreciables y, por tanto, también lo es
mada o para el total, que la dada por un muestreo aleatorio simple 1/ÍV, (5 .3 2 ) obtenemos
comparable. Sin embargo, no es verdad que cualquier muestreo alea
S2= l WhSk2+ l V ^ ( ñ - Y )2 (5.33)
torio estratificado dé una varianza menor que un muestreo aleato
rio simple. Si los valores de los n, están lejos del óptimo, el mues Por lo tanto
treo estratificado puede tener una varianza más alta. De hecho, aun
la estratificación con asignación óptima para un tamaño de mues V „n = ( l - / ) ^ = ^ I Wh(Y h- Y ) 2 (5.34)
n n n
tra total fijo puede dar una varianza más alta, aunque esto es más
bien una curiosidad académica y no algo que sucede en la práctica. = V ^+— I ^ (ñ - ñ J (5.35)
En esta sección se comparan el muestreo aleatorio simple y el
muestreo aleatorio estratificado con asignación proporcional y ópti por la definición de V¿pl debemos tener Vprov > V^,. Por (5 .3 0 ) y
ma. Esta comparación demuestra cómo se logTa una ganancia (5 .3 1 ) su diferencia es
gracias a la estratificación.
Las varianzas de las medias estimadas se denotan con Vro„, V „ op whs„2-(i u;s*)2]
y Vtpt respectivamente.
A partir de (5 .3 5 ) y (5 .3 6 ) con los términos en l / N h despre estratificar por los valores de y, no habría traslape entre los estratos
ciables, y la varianza dentro de ellos, sería mucho menor que la varianza glo
bal, particularmente si hay muchos estratos. Esta situación se ilus
% (S „ - S ) 2+ ^ - ~ X Wh(Y h - Y ) 2 (5.37) tra mediante el ejemplo de la Sec. 5.3, Pág. 130. La población con
sistía en los tamaños (números de habitantes) de 64 ciudades en
Para resumir, en la Ec. (5 .3 7 ) hay dos componentes de la dis 1930, estratificadas por tamaños. Aunque sólo había dos estratos
minución en la varianza cuando pasamos del muestreo aleatorio sim la estratificación proporcional reducía la estimación muestral ( Y )
ple a la asignación óptima. La primera componente (término a la ex de 2365 a 1372. Al estratificar con n, = n2 = 12, que es el óptimo en
trema derecha) proviene de la eliminación de las diferencias en la asignación de Neyman, se obtenía una nueva reducción a 1044
tre las medias de estratos, la segunda (término medio a la derecha)
En la práctica desde luego, no podemos estratificar por valores
proviene de la eliminación del efecto de las diferencias entre las
de y. Pero algunas aplicaciones importantes se acercan a esta situa
desviaciones estándar de estratos. La segunda componente represen
ción, y dan lugar a una mejora considerable en la precisión, si se sa
ta la diferencia en varianza entre la asignación óptima y la propor
tisfacen las siguientes condiciones.
cional.
Si los términos en l/N* no son despreciables, el sustituir por S= 1. La población consta de instituciones que varían mucho en
de (5 .3 2 ) se obtiene tamaño.
2. Las principales variables a medir están íntimamente relacio
Vra„ = v u + ; ^ r j j [ I N * ( ñ - Y )2~ Z ( N - N „ ) s h2] (5.38) nadas con los tamaños de las instituciones.
en lugar de (5.35). 3. Se cuenta con una buena medida de tamaño para establecer
Por lo tanto, la estratificación proporcional da una varianza más los estratos.
elevada que el muestreo aleatorio simple si Como ejemplos tenemos los negocios de un tipo específico, por
ejemplo, tiendas de alimentos (en las encuestas que tratan sobre
Z N h( Yh - Y ) * < ± U N - N h)S„2 (5.39) el volumen de los negocios o el número de empleados), escuelas (en
encuestas relacionadas con el número de alumnos), hospitales (e n es
Matemáticamente, esto puede ocurrir. Supóngase que las S*3 son igua
tudios sobre la cantidad de pacientes), y formas de impuestos (pa
les a Sw2de modo que la asignación proporcional es óptima en el sen
ra características altamente correlacionadas con el ingreso suscepti
tido de Neyman. Entonces (5 .3 9 ), viene a ser
ble de impuesto). En los Estados Unidos, las granjas varían mucho
X N , ( ñ - Y ) 2< ( L - l ) 5 w2 en tamaño, al medirlas según su extensión total o su ingreso bruto,
o pero las características comunes, como son la producción de cier
tas cosechas o tipos de ganado, con frecuencia muestran solamen
Z N h( ? „ - Y ) 2 2
<SW (5.40) te una correlación moderada con respecto al tamaño de la granja,
por lo tanto, no se puede ganar mucho al estratificar los tamaños
Los lectores familiarizados con el análisis de la varianza, reconocerán de las granjas.
esta relación, que implica que el cuadro de la media entre estratos Si el tamaño de la institución permanece estable a través del tiem
es más pequeña que dentro de los estratos, es decir, que la razón F po, o al menos en periodos cortos, generalmente, su mejor medida
es menor que 1. práctica es el tamaño de la institución tomado en un censo reciente.
El ejemplo de la Sec. 5.3, ilustra la situación en la que se disponía
5.7 ¿E N Q U E C A S O S P R O D U C E L A E S T R A T IF IC A C IO N de buenos datos previos. La Tabla 5.2 muestra las S,. y los óptimos
C O N S ID E R A B L E S G A N A N C IA S D E P R E C IS IO N ? nÁ <x N*Si, resultantes, cuando la asignación se hace de datos de
1920 y de 1930. respectivamente.
La variable ideal para la estratificación, es el valor de y en sí. Los datos de 1920 indican un n, de 11.56 contra un óptimo “ver
o sea, la cantidad que se va a medir en la encuesta. Si pudiésemos dadero" de 12.21 para los datos de 1930. Se redondea a enteros,
140 TE C N IC A S DE M U ESTRE O M U E S TR E O a l e a t o r io e s t r a t if ic a d o 141
5.9 E S T IM A C IO N D E L T A M A Ñ O DE L A M U E S T R A
5.8 A S IG N A C IO N Q U E R E Q U IE R E M A S D E L 100%
CO N D A T O S C O N T IN U O S
D E L M U E STR E O
Como se mencionó en la Sec. 5.7, la fórmula para el óptimo pue Las fórmulas para la determinación del valor de n en una asig
de producir en cierto estrato un nh que sea mayor que el correspon nación óptima estimada son las que se dieron en la Sec. 5.5. Esta
diente N k. Considérese el ejemplo de los tamaños de las ciudades en sección presenta las fórmulas para cualquier asignación con algunos
la Sec. 5.3. Una muestra de 24 ciudades distribuidas entre los es casos especiales de utilidad. Se supone que la estimación se ha es
tratos, requería 12 ciudades de 16 en el primero y 12 de 48 en el pecificado con varianza V. Si en lugar de ello, se especifica el margen
segundo. Si la muestra hubiese sido de tamaño 48, la asignación de error d (Sec. 4.4 ), V - ( d/t ) 2 donde t es el desvío correspon
hubiera requerido 24 ciudades de 16 en el primer estrato. Lo más diente a la probabilidad que podemos conceder de que el error exce
que se puede hacer es tomar todas las ciudades en el estrato, y dejar da el margen deseado.
32 ciudades para el segundo estrato en lugar de las 24 postuladas
por la fórmula. Este problema sólo surge cuando la fracción global
Estimación de la M edia de Población F
de muestreo es importante, y algunos estratos son mucho más varia
bles que otros. Esto ocurre en la práctica con mucha frecuencia. Sea sh la estimación de S» y sea = w„n donde los wk han sido
Si la estimación original da n, > N, cuando hay más de dos estra elegidos. En estos términos, la V ( y „ ) anticipada (p or el Teorema 5.3,
tos, la asignación óptima revisada es: Sec. 5.3.) es
« i = N ,; ñh = ( n - N i ) ~ — (/i s 2) (5.41)
i w hsh <5 « >
2
con W* - Nj,/N. Esto da como fórmula general para n
siempre que ñ» < N* para h > 2 . Si ocurriese que ñ 2 > N 2, cambia
ríamos la asignación a r w „W
I Whsh2 «o Estrato N„ s„ „h
n = -^ - (5.48)
1 13 325 4 225 9
2 18 190 3 420 7
3 26 189 4914 10
Estimación del Total de Población 4 42 82 3 444 7
5 73 86 6 278 13
Si V es la V ( Y „ ) deseada, las fórmulas principales son 6 24 190 4 560 10
En general:
Totales 196 26 841 56
y N fc V
(5.49) La Tabla 5.4 muestra los valores de Nk, sh y N ;,Sj, que se conocían antes
V + IN .V
de determinar n.
Optimo supuesto (para n f ijo ): La fórmula apropiada para n es (5 .5 0 ) que se aplica a una asignación
"óptim a” para estimar un total. Con sólo 196 unidades en esta población no
es probable que la cp f sea despreciable. Sin embargo, para propósitos de ilus
( 5 '5 0 ) tración, una primera aproximación que ignora la cp f será la que se busque.
Esto es:
Proporcional:
(S / V J 2 (26 841)~
n0= ^ l N hsh\ (5-51) 0 V 7 974 976
Obviamente es necesario un ajuste. Para la n correcta en (5 .5 0 ), tenemos
1+ N
—------ = - * ° - 34 ,5 7 1
Ejemplo. Este ejem plo proviene de un artículo de Comell (1 9 4 7 ) que , , 1 V- , 4 640 387
describe una muestra de universidades y colegios de los Estados Unidos to V hSh + 7 974 976
mada en 1946 por la oficina de educación con objeto de estimar las inscrip
ciones para el año académico 1946-1947. La ilustración es para la población Se escogió un tamaño de muestra de 56 unidades.* La n-n para estratos in
de 196 colegios de maestros y escuelas normales. Se les dispuso en siete es dividuales aparece en la columna del lado derecho de la Tabla 5.4.
tratos, de los cuales se ignorará uno pequeño. Los cinco primeros estratos se
construyeron por tamaño de la institución: el sexto sólo contenía colegios
para mujeres. Se calcularon las estimaciones sh de las Sh a partir de los re 5.10 M UESTREO E S T R A T IF IC A D O P A R A PR O PO R CIO N ES
sultados obtenidos para el año académico 1943-1944. Se usó una estratifi
cación "óptima" basada en estos valores s*. Si queremos estimar la proporción de unidades en la población
E1 objetivo era un coeficiente de variación de 5% en el total de inscrip que pertenecen a una clase definida C, la estratificación ideal se ob
ciones estimado. En 1943 el número total de inscripciones para este grupo de tiene si colocamos en el primer estrato toda unidad que pertenezca
colegios fue de 56 472. De modo que el error estándar deseado es a C y en el segundo toda unidad que no pertenezca a C. Si esto falla,
tratamos de construir estratos tales que la proporción en la clase C
(0.05)(56 472) = 2824
varíe tanto como sea posible de estrato a estrato.
y, por lo tanto, la varianza deseada es Sea
ción total, la estimación apropiada en el muestreo aleatorio estrati Varianza mínima para un tamaño de muestra total fijo.
ficado es
nhce NhM / ( N h - l h ^ Q h = Nh'ÍPhQh
P« = 1
a. ^ N
7* <5.52)
Por lo que
Sea yhi una variable que toma el valor de uno cuando la unidad
está en C y 0 en otro caso. En la Sec. 3.2, Ec. 3.4, se demos 5.11 G A N A N C IA S EN P R E C IS IO N E N E L M UESTR EO
tró que para esta variable E S T R A T IF IC A D O P A R A PR O PO R CIO N ES
Si los costos por unidad son los mismos en todos los estratos,
Nh- l dos reglas de trabajo úüles son: ( a ) la ganancia en precisión del
Esto da el resultado. muestreo aleatorio estratificado sobre el muestreo aleatorio simple
N ota : Prácticamente en todas las aplicaciones, aun si la cpf es pequeña o modesta a menos que la P* varíe mucho de estrato a
no es despreciable, lostérminos en 1/N* serán despreciables y se estrato; ( b ) la asignación óptima con una n fija gana poco sobre
puede usar la siguiente fórmula ligeramente más simple. la asignación proporcional si todas las P* caen entre 0,1 /0.9.
Para ilustrar el primer resultado, en la Tabla 5.5 se muestra la
V (p J = ^ Z N h(Nh- n H) ^ = Z y £ ^ ( l - f h) (5.56) comparación del muestreo aleatorio estratificado (asignación pro
N nh nh
porcional) con el muestreo aleatorio simple en 3 estratos de igual ta
Corolario 1. Cuando pueda ignorarse la cpf maño (W * = y3). Están incluidos 4 casos, el primero con P¡, - 0.4,
0.5 y 0.6 en los tres estratos y el último ( y más extremo) con P» -
V(p„) = XVP„2^ (5.57) 0 . 1 , 0.5 y 0.9. Las siguientes dos columnas muestran las varianzas
«a
Corolario 2. Con asignación proporcional T A B L A 5.5. P r e c is ió n R e l a t iv a d e l M uestreo E s t r a t if ic a d o
y el M uestreo A l e a t o r io S im p l e
N -n 1 N„2PHQh
(5’58) Simple Estratificado
„ I Whphqh n0
Por lo tanto, la precisión relativa de la asignación proporcional res n° ~ 7/ ’ — (5.65)
pecto a la asignación óptima es,
E J E R C I C I O S
T A B L A 5.6. P r e c is ió n R e l a t iv a d e l a A s ig n a c ió n P r o p o r c io n a l
R especto a l a A s ig n a c ió n O p t im a
5.2. Las fam ilias de un pueblo se van a muestrear para estimar la canti 5.6. Un muestreador propone tom ar una muestra aleatoria estratificada.
dad promedio de bienes por fam ilia que se pueden convertir en dinero en efectivo Espera que sus costos de campo serán de la form a £cj,nv Sus estimaciones
rápidamente. Las familias se estratifican en un estrato de renta alta y otro adelantadas de las cantidades relevantes para los dos estratos son como sigue:
de renta baja. Se piensa que una casa en el estrato de renta alta tiene cerca
de 9 veces más bienes que los existentes en una casa en el estrato de renta
Estrato W„ Sh Ck
baja, y se espera que Sh sea proporcional a la raíz cuadrada de la media del
estrato.
1 0.4 10 14
Existen 4 OOO fam ilias en el estrato de renta alta y 20 000 fam ilias en el
2 0.6 20 S9
estrato de renta baja, ( a ) ¿Cómo distribuiría una muestra de 1 000 familias
entre los dos estratos? ( b ) Si el objetivo es estimar la diferencia entre los
bienes por fam ilia en ambos estratos, ¿cóm o debe estar distribuida la muestra?
(a ) Encuentre ios valores de n j t i y n .J n que minimizan los costos de
5.3. La información que aparece a continuación, representa la estratifica
campo totales para un valor dado de V ( h „ ) . ( b ) Encontrar el tamaño de mues
ción de todas las propiedades agrícolas en un condado, clasificadas por tamaño
tra requerido bajo esta asignación óptima, para hacer V (y J() = 1. Ignore la
promedio de acres de maíz por propiedad en cada estrato. Para una muestra
cpf- ( c ) ¿Cuál será el costo total de campo?
de 100 propiedades, calcule los tamaños de muestras en cada estrato bajo
5.7. Después de haber tomado la muestra en el Ejercicio 5.6, el muestreador
( a ) asignación proporcional,» ( b ) asignación óptima. Compare las precisiones
encuentra que sus costos de campo fueron, en realidad, de $2.00 por unidad
de estos métodos con la del muestreo aleatorio simple.
en el estrato 1 y de $12.00 en e l estrato 2. ( a ) ¿Qué tanto más alto es el
costo de campo en comparación con lo que se había previsto? ( b ) Si hubiesen
Promedio de
conocido los costos correctos de campo por adelantado, ¿podría haber obtenido
Tam año de la Número de acres de Desviación
la V C y ,¡) «» 1 para el costo de campo estimado originalmente en el Ejercicio
propiedad propiedades maíz estándar
5.6? (N ota . La desigualdad Cauchy-Schwarz, en la Pág. 134, con V ' = 1, da la
(a cres) N* 7, s*
respuesta a esta pregunta sin encontrar la nueva asignación.)
5.8. En una estratificación con 2 estratos, los valores de W¿, y Sk son
0-40 394 5.4 8.3
como sigue:
41-80 461 16.3 13.3
81-120 391 24.3 15.1 Estrato Wh Sh
121-160 334 34.5 19.8
161-200 169 42.1 24.5 1 0 .8 2
201-240 113 50.1 26.0 2 0.2 4
241- 148 63.8 35.2
Calcule los tamaños de muestra n „ « . necesarios en ambos estratos para
Total o media 2010 26.3 satisfacer las siguientes condiciones. Cada caso requiere un cálculo separado.
(Ign ore la c p f.) ( a ) El error estándar de estimación de la media de la po
blación y „ debe ser 0.1 y el tamaño de muestra total n =* n2 + n., debe ser
5.4. Verifique el resultado establecido en la fórm ula 5.38, Sec. 5.6: minimizado, ( b ) E l error estándar de la medía estimada de cada estrato debe
ser 0.1. ( c ) E l error estándar de la diferencia entre 2 medias estimadas de los
estratos debe ser 0.1, nuevamente minimizando el tamaño de muestra total.
5.9. Con dos estratos, a un muestrador le gustaría tener n, =» n.. por conve
5.5 Un muestreador tiene dos estratos con tamaños relativos W t, W r El
niencia administrativa, en lugar de usar los valores dados por la asignación de
cree que S,, S2 pueden ser consideradas iguales pero piensa que c t puede
Neym an, Si V (v ,( ) , V ^ .fy ^ ,) representan las varianzas dadas por la asignación
estar entre 2 veces ct y 4 veces cr Preferiría usar la asignación proporcional
ni = nt y Ia asignación de Neym an, respectivamente, demuestre que el aumen
pero no quiere incurrir en un aumento sustancial en la varianza comparada
to fraccionario en la varianza es
con la asignación óptima. Para un costo dado C == + Cjttj, ignorando
la cpf, demostrar que
(r-iy
V W (y » ) W :c 2 vmy m) W i/
VV(y„) (W ^ + W ^ f
en donde r — 71,/n, de acuerdo con la asignación de Neyman. Para los estratos
Si W , » W e, calcule e l aumento relativo en la varianza al usar la asigna en el Ejercicio 5.8, caso a. ¿ cuál sería el aumento fraccionario de la varianza
ción proporcional cuando c,/c, = 2, 4. al usar n l — n , en lugar de la asignación óptima?
152 TE C N IC A S DE M U ESTRE O
M U ESTRE O A LEA TO RIO E S TRATIFIC AD O 153
Optimo
Población 1 Población 2 Estrato s„
Estrato A Estrato P, 1 60 2 15
2 30 4 15
1 0.1 1 0.01 3 10 15 10
2 0.5 2 0.05
3 0.9 3 0.10 100 40
5A.1 EFECTOS D E L A S D E S V IA C IO N E S A P A R T IR
D E L A A S IG N A C IO N O P T IM A
k z WhSh
En el primer término de la derecha, sustitúyase W*S* por su expre T A B L A 5A.1. Efecto s de las D e s v ia c io n e s d e i .a A s ig n a c ió n O p t im a
sión en términos de nk' a partir de (5 A .1 ). Esto da el siguiente re K “ « a'| (>»A ~ "*')*
sultado interesante Estrato
(ó p t.) (r e a l)
muestra para el cual la estimación es menos precisa que el mues y 0.06 en ( b ) . Por lo tanto, tenemos los siguientes ECM comparables para
treo aleatorio simple y se pierde toda ganancia en precisión debido a una muestra de tamaño n:
los estratos.
Muestreo aleatorio sim ple: V (y ') = -
3. La estimación usual s (y ,( ) subestima el verdadero error n
de y„, ya que no contiene la contribución del sesgo al error. Muestreo aleatorio estratificado:
0.91
Para justificar estas declaraciones, nótese que en muestreo re ( a ) : ECMCí/,( ) + 0.0004
n
petido, el valor medio de la estimación es /hYh. El sesgo alcanza,
0 .1 9
por lo tanto, una cantidad igual a ( b ) : ECMC j/j, ) ------- + 0.0036
n
E K - H 'J ñ Como se ve en la Tabla 5A.2, con relación a ( a ) , el muestreo aleatorio
simple comienza a ganar con n *= 300. Hay, sin embargo, poco qué escoger
Esto es independiente del tamaño de muestra. Para encontrar el entre los dos métodos hasta n = 1 000.
error cuadrático medio ( E C M ) de la estimación, es fácil verificar En ( b ) , con más en juego, la estratificación es superior hasta n = 200,
que el término de la varianza está dado por la fórmula usual, con aunque la mayor parte de la ganancia potencial ya se ha perdido con este
wh en lugar de W*. Por lo tanto, tamaño de muestra. Más allá de n = 300 la estratificación se vuelve mar
cadamente inferior al muestreo aleatorio simple. Una estimación exacta de
las W h es en particular importante cuando la estratificación es altamente
ECM (y„) = I l - f „ ) + [ l ( w h- W h) Yh]2 (5 A.9) efectiva o cuando e l tamaño de muestra es grande.
Esta expresión fue dada por Stephan (1941). Finalmente, la En algunas encuestas puede tomarse una muestra preliminar gran
de de tamaño n ’ para estimar W k. Esta técnica, conocida como mues
fórmula usual para s*(ys, ) es claramente una estimación sin sesgo
treo doble, o muestreo en dos fases, tiene numerosas aplicaciones y se
del primer término en (5 A .9 ) pero no toma en cuenta el segundo
término. discute en el Cap. 12. Se mostrará que con muestreo doble el error
cuadrático medio de ya, es aproximadamente
Ejemplo. Este ilustra la pérdida en precisión debida a ponderaciones in
correctas cuando la estratificación es: ( a ) poco efectiva, ( b ) altamente efec I ^ S h2 T W h(Y h - Y ) 2
(5A.11)
tiva. Considérese una población grande con S5 = 1, divisible en dos estratos
con W , = 0.9, W , = 0.1. Supongamos S, = S2 = Si . Entonces, despreciando
los términos en 1/iV*, Comparando este ECM con SVn, como lo da la Ec. (5 A. 10), ve
mos que la mayor parte de la ganancia de la estratificación se retie
•sJ - I w ;s *2+ v w ; ( ñ - y )2 (5a . i o ) ne, siempre que n ' sea mucho más grande que n. Para ponerlo en
= s„2+ w, iv2( ? , - y 2)2 forma más general, un grupo de ponderaciones estimadas preserva
la mayor parte de la ganancia potencial con estratificación, si las
esto es,
Aleatorio estratificado
En ( a ) tome Y, — Y s = 1. Entonces Sh- «= 0.91 y la estratificación pro
A le a to r io
porcional reduce la varianza en 9 % , comparada con muestreo aleatorio simple.
n simple («> (b )
En ( b ) tome Y , — Y„ « 3, dando Sk' = 0.19, una reducción en varianza
de más de 80% . 50 0.0200 0.0186 0.0074
Con dos estratos y ponderaciones incorrectas el sesgo puede escribirse 100 0.0100 0.0095 0.0055
200 0.0050 0.0049 0-0045
K - » ', ) ( ? , - ? , ) 300 0.0033 0.0034 0.0042
400 0.0025 0.0027 0.0041
ya que (w l — VV,) *= — (u/., — W , ). Suponga que las ponderaciones esti
1000 0.0010 0.0013 0.0038
madas son vjí = 0.92 y i » , = 0.08. E l sesgo alcanza < 0 .0 2 )(1 ) = 0.02 en ( a )
160 TE C N IC A S DE M U ESTRE O OTROS ASPECTO S D EL M U E S TR E O E S TR A TIFIC AD O 161
Ejemplo. Los datos dados por Jessen (1 9 4 2 ) ilustran una encuesta de Optima 0.0127 0.0800 76.9
este tipo con fincas. El Estado de Iowa se dividió en cinco regiones geográ Compromiso 0.0128 0.0802 77.6
ficas, cada una designada de acuerdo con su principal actividad agrícola. Su Proporcional 0.0131 0.0837 80.9
póngase que estas regiones serán usadas como estratos en una encuesta de
explotaciones lecheras. Las tres características de mayor interés son el número
de vacas ordeñadas por día, el número de galones de leche por día y las entradas óptimos para las tres características, mostrado en la columna de la derecha,
totales anuales en efectivo por productos lácteos. De un reconocimiento he provee una asignación de compromiso satisfactoria.
cho en 1938, las desviaciones estándar estimadas s,, dentro de estratos se La Tabla 5A.5 muestra las varianzas de muestreo esperadas de ylt, co
muestran en la Tabla 5A.3. En la Tabla 5A.4 se dan las asignaciones óptimas m o las dan las asignaciones óptimas individuales, la de compromiso y la
de Neyman, basadas en estas sh para las características individuales en una proporcional. Las fórmulas son:
muestra de 1 000 fincas.
Las asignaciones óptimas individuales difieren una de la otra sólo mo (I H V *)2 «.(H tfJ 1
V o f = Vco m p = l — -------- . « V * = -----------------
deradamente. Con una excepción, las tres se desvian en la misma dirección n , n
en comparación con la asignación proporcional. Así, en el primer estrato, la
La asignación de compromiso da resultados casi tan precisos como cuando
asignación proporcional sugiere 197 fincas y las asignaciones individuales con
fuese posible unas asignaciones óptimas separadas para cada ítem. Más no
ducen a números entre 236 y 258. El promedio de los tamaños de muestra
table aún es el hecho dé que la asignación proporcional es tan sólo un
poco menos precisa que la de compromiso o los óptimos individuales. Además
TA B LA 5 A .3 . D e s v ia c io n e s E stándar Dentro de E strato s la Tabla 5A.5 sobreestima la precisión de las asignaciones de óptimas y de
compromiso porque éstos fueron a partir de varianzas estimadas. Este re
Entradas sultado es otra ilustración de que el óptimo es plano, lo que se mencionó en
por la Sec. 5A.1.
í» productos
Vacas Galones lácteos
W *
Estrato w* m H ordeñadas de leche ($ ) • 5A.4 OTROS M ETODOS D E A S IG N A C IO N CO N M A S
Lechería noreste 0.197 4.6 11.7 332 D E U N A T R IB U T O
Existencias de grano 0.191 3.4 9.8 357
Ganado occidental 0.219 3.3 7.0 246 Una asignación alternativa de compromiso es la que sugiere
Pastizal del sur 0.184 2.8 6.5 173 Chatterjee (1 9 6 7 ), en ella se eligen los n* que minimizan el pro
Ganado oriental 0.208 3.7 9.8 279 medio de los incrementos proporcionales en varianza a partir de
OTROS ASPECTO S D EL M U ESTRE O E S TR A TIFIC AD O 163
162 TE C N IC A S DE M U E S TR E O
(5 A .7 ) al tomarlos sobre las variables. Si j denota una variable, ejemplo supóngase que el valor de L se ha especificado y que el
esto nos lleva a elegir término cpf puede ignorarse. Tenemos
„ ( l ( 5A17)
n h = n J z n lh'2/ Z \ J lH jh '2 (5A.12) £ (K W v Q
i • h Y ¡
Ejemplo. (Para cuatro estratos, dos variables.) Los datos y la Como lo hacen notar Booth y Sedransk n < ñ en todos los pro
aplicación aproximada del método se demuestran en las columnas blemas de este tipo, ya que n satisface la restricción L - V*, pero
( 1 ) a ( 6 ) de la Tabla 5A.6. El problema es encontrar el n más pe no es necesario que satisfaga la restricción sobre cada variable, en
queño para que tanto que la asignación ñ satisface L, al igual que las restricciones
individuales.
U (y ,J 50.04, V (v 2„)< 0 .0 1
Columna (1) (2) (3) (4) (5) Supongamos que hay dos criterios de estratificación, digamos por
(6) (7)
R filas y C columnas, lo que da RC celdas. Si n > RC cada celda se
Estrato W„ s i s i WkA„ nh
puede representar en la muestra. Un problema surge cuando n < RC
ñh
l y desearíamos que la muestra nos diera la representación proporcional
de cada criterio de estratificación. En un método simple desarrollado
1 0.4 25 1 5.8 0.963 206 194
2 0.3 25 4 por Bryant, Hartley y Jessen (1 9 6 0 ), la técnica sólo requiere que n
8.2 0.859 183 180
3 0.2 25 16 17.8 0.844
exceda al más grande de R y C.
180 187
4 0.1 25 64 56.2 0.750 160 171 Para ilustrar este método, supongamos que se estratificó una
pequeña población de 165 escuelas, según el tamaño de la localidad,
Totales 3.416 729 732 en cinco clases y, según el costo promedio por alumno, en cuatro cla
ses. Los números de escuelas y las proporciones de escuelas
Fu = 7n¡;/165 en cada una de las 20 celdas se muestran en la T a
A l encontrar la asignación óptima para cada variable en forma
bla 5A.7. ,
independiente, fácilmente se verifica que n = 625 es el requerido para
satisfacer la primera restricción, y n = 676 para satisfacer la se T A B L A 5A.7. N úm ero y P r o p o r c ió n de Escuelas e n Cada Ce l d a
gunda. Sin embargo, n = 676 con su asignación no satisface la pri Tamaño Gasto por alumno
mera restricción al obtenerse 0.0589 en lugar de 0.04 para V,. Una de la
solución de iteración para satisfacer ambas restricciones (que presen ciudad A B C D Totales »f.
tamos en la segunda edición) dio ñ - 732, con el ñ h que aparece
en la columna ( 7 ) de la Tabla 5A.6. f
1
mu 15 21 17 9 «i 62
Pu 0.091 0.127 0.103 0.055 pi. 0.376 4
Para usar el método de Booth y Sedransk con V, = 0.04 y
Vs = 0.01, especificamos ir
u
m2¡ 10 8 13 7 «2 . 38
pzi 0.061 0.049 0.079 0.042 Pz. 0.231 2
L = 0.2 V(y,„) + 0.8 K(y,„) = — °' 01) = 0.016
n
n ii m3i 6 9 5 8 «3 . 28
P » 0.036 0.055 0.030 0.049 P3. 0.170 2
A partir de (5 A .1 8 ) con Ch = 1, tenemos
«41 4 3 6 6 «1 19
( i WhAhJ 1IV
v
(3.416)2 P,< 0.024 0.018 0.036 0.036 P i. 0.114 1
= 729
0.016
vV m¡i 3 2 5 8 «5 18
A l usar la columna ( 5 ) de la Tabla 5A.6. De (5 A .1 7 ), la columna Pu 0.018 0.012 0.030 0.049 P 5- 0.109 1
( 5 ) también conduce a los valores nk que aparecen en la colum
Totales «J 38 43 46 38 165
na ( 6 ) de la Tabla 5A.6. Como se ve en las columnas ( 6 ) y (7 ),
Pj 0.230 0.261 0.278 0.231 1.000
las dos soluciones n k y ñh concuerdan satisfactoriamente. 2 3 3 2
n.l
166 TE C N IC A S DE M U ESTRE O o tro s aspecto s del m u estreo e s t r a t if ic a d o 167
El objetivo de dar a cada escuela una oportunidad igual de selec TA B LA 5A.9. A s ic n a c ió n de l a M uestra a las 20 C eld as
5A.6 S E L E C C IO N C O N T R O L A D A
Nótese que las columnas 1 y 2 se asignan al estrato marginal A Goodman y Kish (1 9 5 0 ) nos dan otra técnica para este pro
ya que n¡ — 2. Similarmente, las hileras 1 hasta 4 se asignan al estado
blema con muestras pequeñas, llamada selección controlada. Existe
marginal I, ya que n, = 4 y así las demás. Esto completa la asignación
una Ilustración simple debida a Hess, Riedel y Fitzpatrick (1 96 6)
de la muestra a las 20 celdas. La asignación aparece en una forma
que aplicaron el método a un muestreo de hospitales, donde se ilustra
más compacta en la Tabla 5A.9. Dos escuelas se extraen al azar de la idea básica. La estratificación principal es por el tamaño del hos
o tro s aspecto s del m u estreo e s t r a t if ic a d o 16 9
168 TE C N IC A S DE M UESTREO
pital (dos estratos). También es deseable la representación de dos < r < 40 selecciona 4', y así sucesivamente. De modo que 1 < r <
tipos de propietarios de hospital, pero sólo se va a extraer una unidad 20 selecciona (1 .3 '), 20 < r < 25 selecciona (1 ,4 ') y así sucesiva
(hospital) de cada estrato principal. A l numerar las unidades dentro mente. Las selecciones conjuntas y sus probabilidades son como sigue.
de los estratos se usa una prima ( ' ) que indica un tipo de propie
dad, la ausencia de este símbolo indica el otro tipo de propiedad. La Par: (1,3') (1,4') (2,4*) (2,5') (3', 5') (3', 1) (4', 1) (4', 2)
Tabla 5A.10 (lado izquierdo) muestra las unidades en ambos estratos. Probabilidad .20 .05 .15 .10 .10 .15 .05 .20
Si se extrae la unidad 1 o 2 del estrato I, desearíamos extraer Este asunto presenta varios problemas. ¿Cuál es la mejor carac
las unidades 3', 4' o 5' del estrato II, de modo que ambos tipos de terística para la construcción de los estratos? ¿Cómo se determinan
estratificación se encuentren presentes con n = 2. De manera seme los límites entre estratos? ¿Cuántos estratos debería haber? Para
jante, 3' o 4' (estrato I ) es la unidad deseada con 1 o 2 (estrato II ). una sola característica o variable y, la mejor característica es, por
La selección controlada hace tan alta como es matemáticamente supuesto, la distribución de frecuencia de y. La siguiente mejor es
posible la probabilidad de estas combinaciones deseadas, al conservar probablemente la distribución de frecuencia de alguna otra cantidad
l.i misma probabilidad de selección dentro de los estratos y, por tanto, altamente correlacionada con y. Dado el número de estratos, las
las estimaciones insesgadas por medio de las fórmulas usuales para ecuaciones para determinar los mejores límites entre ellos bajo
el muestreo estratificado. El propósito es una mayor exactitud para un asignación proporcional y de Neyman, han sido obtenidas por Dale-
ti dado o bien, un ahorro en costos de campo. nius (1 9 5 7 ), otros investigadores han encontrado algunos métodos
Con el muestreo aleatorio estratificado, la probabilidad de una de aproximación más rápidos. Consideraremos la asignación de Ney
combinación deseada es ( . 5 ) ( . 6 ) 4- ( . 5 ) ( . 4 ) - .5. Esta probabilidad man, puesto que generalmente es superior a la asignación propor
puede incrementarse a .9 por dos cambios simples en la selección de cional en poblaciones donde se gana más al estratificar.
la muestra. Se reacomodan las unidades del estrato II, de modo que Se supone primero que los estratos se establecen al usar el va
las combinaciones deseadas (3 ', 4', 5 ') con 1 y 2 en el estrato 1 lor en sí de y.
aparezcan primero, como se ve a la derecha de la Tabla 5A.10. Pos- Sean y„, yL el valor menor y mayor de y en la población. El pro
leriormente se extrae un número aleatorio r entre 1 y 100 y se usa para blema es encontrar límites intermedios entre estratos yu y2, . . . . y¿,-j
seleccionar las unidades de ambos estratos. En el estrato I, 1 < r < tales que
25 selecciona la unidad 2, etc., de modo que cada unidad recibe un
cuarto de probabilidad de ser elegida. De manera semejante, en el
(5A.21)
estrato II, la condición 1 < r < 20, selecciona 3', la condición 21
170 TE C N IC A S DE M U ESTRE O OTROS ASPECTOS D EL M U E S TR E O E S TR A TIFIC AD O 171
sea un mínimo. Si se ignora la cpf, es suficiente con minimizar £ Si los estratos son numerosos y estrechos, f ( y ) debería ser aproxima
W»S». Dado que y* aparece en esta suma solamente en los términos damente constante (rectangular) dentro de un estrato dado. Por
W»S,, y W htlSu*i, tenemos lo tanto.
población de 13 435 bancos de los Estadose Unidos de Norteamérica (1 96 6) encontraron que el método de Ekman es ligeramente supe
(M cEvoy, 1956). La distribución es oblicua, con su moda en el extremo inferior. rior al método cum V f y al de Sethi para L > 2, también Murthy
En la columna cum y/f, 58.9 ■= x/3 436, 109.1 = y/Z 464 + y j2 516, y así (1 9 6 7 ) obtiene buenos resultados con el método de Ekman.
sucesivamente. __ Las relaciones (5A . 32) tienen una consecuencia interesante. Si
Supóngase que se quieren cinco estratos. Dado que el total de cum y/f W»S* es constante, la asignación de Neyman, da un tamaño de mues
es 389.5, los puntos de división deberían estar a 77.9, 155.8, 233.7 y 311.6 en
tra constante nh - n/L en todos los estratos. Para los métodos apro
esta escala. Los puntos disponibles más cercanos son los siguientes:
ximados, las comparaciones realizadas sugieren que la regla simple
Estrato re» - n/L es satisfactoria.
Hasta áquí, hemos supuesto en forma poco realista que la estra
1 2 3 4 5 tificación se puede basar en los valores de y. En la práctica, se utiliza
alguna otra variable x (tal vez el valor de y en un censo reciente).
Límites _ 0-5 % 5-15% 15-25% 25-45% 45-100% Dalenius (1 9 5 7 ) desarrolla ecuaciones para límites de x que mini
Intervalo en cum .'S f 58.9 96.6 73.6 85.6 74.8 mizan Y. Sy,„ siempre y cuando se tenga cierto conocimiento de
la regresión de y sobre x. Si esta regresión es no lineal, estos lím i
tes pueden diferir considerablemente de los óptimos, cuando x es
Los dos primeros intervalos, 58.9 y 96.6, son bastante desiguales, pero no la variable que se mide. Sin embargo, las ecuaciones significan
se pueden mejorar sin una subdivisión más fina de las clases originales.
que si la regresión de y sobre x es lineal, y la correlación entre y y
Si los intervalos de clase en la distribución original de y son de x es alta, dentro de todos los estratos, los dos conjuntos de límites
longitudes desiguales, se necesita un ligero cambio. Cuando el in deberían ser casi los mismos. Sea
tervalo cambia de uno de longitud d a uno de longitud ud. el valor y = a + füx + e
de y / f para el segundo intervalo se multiplica por y/u al formar cum
donde E ( e ) = 0 para todo x y e, las x no son correlacionadas. La
VT-
varianza de e dentro del estrato h es S ^ . Entonces, los límites de x
Otro método propuesto por Sethi (1 9 6 3 ) consiste en encontrar
que minimizan V (y At) satisfacen las ecuaciones (Dalenius 1957).
los límites dados por las ecuaciones de cálculo (5 A .2 7 ) para una dis
tribución continua estándar, parecida a la población de estudio. P 2[(xh ~Hxh)2+ Sih2]+2Sth2 0 2[(xh - fix h * i)2+ S 2
. k^,]+2S2L^,
Para las distribuciones normales y varias distribuciones x2 Sethi ta eSxhJ H -S '„ 2/f}2Slh2
buló los límites óptimos para asignaciones de Neyman, iguales y
Si S'S/p-S,** es pequeño para todo h, estas ecuaciones se reducen a
proporcionales para L < 6 . Si una de estas distribuciones parece apro la forma (5 A .2 7 ) que da los limites óptimos para x. Pero S)h/p2S x
2h =
ximarse a la población de estudio, los límites se pueden encontrar en (l~Pii )/Ph donde ph es la correlación entre y y x dentro del es
las tablas de Sethi. trato h.
Otros dos métodos aproximados requieren algo de prueba y error. Aunque es necesario continuar la investigación, este resultado
A partir de las relaciones (5 A .3 2 ) la regla de Dalenius-Hodges es más sugiere que la regla de cum y / f aplicada a x debería dar una estrati
o menos equivalente a hacer W hSh constante, como lo conjeturó an- ficación eficiente para otra variable y que tiene una regresión lineal
les Dalenius y Gumey (1 9 5 1 ). Una regla semejante es la de Ekman de x con correlación elevada. Algunos resultados numéricos por
(1959), en la que W „ (yu - yh_t) se hace igual a una constante. Cochran (1 9 6 1 ) corroboran esta conjetura. Además, si las p* son
Al comparar ciertas poblaciones teóricas y ocho poblaciones de apenas moderadas, como sucederá cuando aumenta el número de es
estudio. Cochran (1 9 6 1 ) encontró que la regla cum y / f y la regla tratos, la falla, al usar los límites óptimos de x, debería tener un
de Ekman tenían resultados consistentemente buenos (n o intentó el efecto menor en y.
método de Sethi). En un estudio sobre capacidad (cam as) de hospi La discusión anterior es desde luego, principalmente pertinente
tales en los Estados Unidos, cuya distribución se asemeja a una distri al muestreo de instituciones estratificadas por alguna medida de
bución x5 con un grado de libertad, Hess, Sethi y Balakrishnan tamaño. La situación es diferente cuando un grupo de variables está
OTROS ASPECTO S D EL M U E S TR E O E S TR A TIFIC AD O 175
174 TE C N IC A S DE M U ESTRE O
Con este modelo, la Tabla 5A.12 muestra V (y el) / V ( y ) para si no se requiere cambio alguno en la organización del trabajo de cam
P = 0.99, 0.95, 0.90 y 0.85 y L = 2 a 6 , suponiendo que la rela po; en otras, se establece una unidad de campo separada en cada
ción (5 A .39 ) es una igualdad. Las columnas del lado derecho de estrato. Cualquiera que sea la forma de la función de costo, los
la tabla dan V (y J{) / V ( y ) para tres conjuntos de datos actuales, resultados en la Tabla 5A.12 sugieren que si un aumento en L más
descritos abajo de la tabla en donde x es el valor de y en alguna allá de 6 necesita cualquier reducción en n para mantener el costo
ocasión anterior. constante, el aumento es rara vez provechoso.
Los resultados para el modelo de regresión indican que a me La discusión en esta sección está confinada a encuestas en las
nos que p exceda 0.95, deberá esperarse poca reducción de la va cuales se van a hacer estimaciones globales. Si también se desean
rianza más allá de L *=> 6 . Los conjuntos de datos 2 y 3 apoyan esta estimaciones para subdivisiones de la población, es más fuerte el
conclusión, aunque un nuevo incremento de L puede ser provecho argumento en favor de un número mayor de estratos.
so en el caso del registro en colegios (grupo ). En dos comparaciones
sobre datos de encuesta, Hess, Sethi y Balakrishnan (1 9 6 6 ) encon
traron que V ( i ) „ ) decrecía más rápidamente con L de lo que(5A.39) 5A.9 E S T R A T IF IC A C IO N D E S P U E S D E L A SE LE C C IO N
predice, lo que sugiere que el modelo (5 A .37 ) es una sobresimpli- D E L A M U E S T R A (P O S T E S T R A T IF IC A C IO N )
fícación.
Con algunas variables adecuadas para la estratificación, el es
Para completar este análisis, requerimos una función de costo que
trato al que pertenece una unidad no se conoce sino hasta después
muestre cómo éste depende de L. Dalenius (1 9 5 7 ) sugiere la rela
de recoger los datos. Ejemplos comunes son las características
ción C - L C , + toC„. La razón de costo C,/Cn variará con el tipo
personales como la edad, el sexo, estatura, etc., y el nivel de educa
de encuesta. Un aumento en el número de estratos implica trabajo
ción. Los tamaños de los estratos N h se pueden obtener de ma
extra en la planificación y extracción de la muestra y aumenta el
nera bastante exacta a partir de las estadísticas oficiales, pero
número de ponderaciones usadas en el cálculo de los estimados, a
las unidades se pueden clasificar en estratos, solamente después de
menos que los mismos sean autoponderados. En algunas encuestas ca-
conocer los datos de la muestra. Aquí suponemos que W* y los N h son
conocidos.
T A B L A 5 A .12 . V (5 ),)/ V (? ) Como una F u n c ió n de L Para el M odelo
Un procedimiento consiste en tomar una muestra aleatoria sim
de R e g r e s ió n L i n e a l y A lg unos D ato s Reales
ple de tamaño n y clasificar las unidades. En lugar de la media
Modelo de regresión lineal Datos, grupo muestral y usamos la estimación y w = £ Whyh, donde yh es la media de
las unidades de la muestra que caen en el estrato h y W h = N»/N.
P =
Este método es casi tan preciso como el muestreo estratificado pro
L 0.99 0.95 0.90 0.85 1 2 3
porcional siempre y cuando: ( a ) la muestra sea razonablemente
0.323 0.392 0.458 0.197 0.295 0.500 grande, digamos mayor que 20 en cada estrato, y ( b ) los efectos
2 0.265
3 0.129 0.198 0.280 0.358 0.108 0.178 0.375 de los errores en las ponderaciones W h puedan ignorarse (v e r la
4 0.081 0.154 0.241 0.323 0.075 0.142 0.244 Sec. 5A.2).
5 0.059 0.134 0.222 0.306 0.065 0.105 0.241 Para demostrarlo, sea ttc* el número de unidades de la muestra
6 0.047 0.123 0.212 0.298 0.050 0.104 0.212 que se encuentran en el estrato h donde mHvariará de una muestra
oo 0.020 0.098 0.190 0.277 — — —
a otra. Para muestras en donde m* son números fijos que exceden
todos a cero,
Tipos de Datos
11/ 2o 2 1
Grupo Datos * V Fuente V(yw) = l ^ - ~ l W,Sh2 (5A.40)
1 Inscripciones a colegios 1952 1958 Cochran (1961) El valor promedio de V (y lc) en muestras repetidas de tamaño n
2 Tamaño de las ciudades 1940 1950 Cochran (1961) debe calcularse ahora. Esto requiere un poco de cuidado porque uno
3 Ingresos familiares 1929 1933 Dalenius y Gumey (1951)
o más de los m h podrían ser nulos. Si esto ocurriera, habría que com
178 TE C N IC A S DE M U ESTRE O OTROS A S rE C TO S D EL M U E S TR E O E S TR A TIFIC AD O 179
binar dos o más estratos antes de hacer la estimación, y se lograría dor elige personas al azar, dentro de las áreas geográficas, y asig
una estimación menos precisa. A l incrementar n, la probabilidad nase a cada una su estrato apropiado, el método coincidiría con el
de que cualquier mk sea nulo se hace tan pequeña, que la contri muestreo aleatorio estratificado. Se requiere una cantidad conside
bución a la varianza de esta fuente es despreciable. rable de trabajo de campo para completar las cuotas, porque en
En el caso en que m„ sea nulo, se ignora, Stephan (1 9 4 5 ) ha las últimas etapas, la mayoría de las personas examinadas, corres
demostrado que para los términos de orden ir* ponden a cuotas ya saturadas.
Para hacer más expédito el llenado de las cuotas, se permite
cierta flexibilidad al encuestador, en lo que respecta a las personas
£'(-“ ) (5A.4 i)
\mhJ nWh n Wh o domicilios por incluirse. El grado de flexibilidad en general es
Por tanto, variable, pero en general el muestreo por cuota puede describirse
como muestreo estratificado con una selección más o menos no alea
toria dentro de los estratos. Por esta razón, las fórmulas de error de
E [ V(yw)] = \VhSh2+ - 7£ (1 - Wh)Sh2 (5A.42)
n n muestreo no podrán aplicarse con confianza a los resultados de mues
tras por cuota. Cierto número de comparaciones entre los resultados
Eí primer término es el valor de V ( y „ ) para estratificación pro de muestras por cuota y por probabilidad han sido resumidos por
porcional. El segundo, representa el incremento en varianza que Stephan y McCarthy (1 9 5 8 ), quienes dan una crítica excelente so
surge ya que los m» no se distribuyen proporcionaimente. Pero bre el comportamiento de ambos tipos de reconocimiento. El mé
todo de cuota es probable que produzca muestras que contienen
- ^ 1 ( 1 - WJSh’ = - ( - ) s , 2— !r l WfcS„2= ^ r 5 * 2— Í j I WhSh2 (5A.43) sesgo en características tales como: ingresos, educación y ocupa
n n 'M/ n n n n
ción, aunque a menudo concuerda bien con las muestras por pro
donde §*= es el promedio de las S*s, y ñ» = n/L es el número prome babilidad en cuestiones de opinión y actitud.
dio de unidades por estrato. Así que, si las Si,- no difieren mucho,
el incremento es aproximadamente de (L — 1 )/Lñk veces la varian
5A.11 E S T IM A C IO N A P A R T IR D E U N A M U E S T R A
za para estratificación proporcional, al ignorar la cpf. El incremen
DE L A G A N A N C IA D E B ID A A L A
to será pequeño si ñ h es razonablemente grande.
E S T R A T IF IC A C IO N
Este método también puede aplicarse a una muestra ya estrati
ficada por otro factor, por ejemplo, en cinco regiones geográ Cuando se tomó una muestra aleatoria estratificada, puede ser
ficas, a condición de que los W * se conozcan separadamente en
de interés como una guía en la conducción de futuras encuestas,
cada región. Esta estratificación doble se emplea mucho en las en
estimar la ganancia en precisión en relación con muestreo aleato
cuestas nacionales de los Estados Unidos: véase Bean (1 97 0) para
rio simple.
una descripción de las fórmulas de estimación de la encuesta de
Los datos disponibles de la muestra son los valores de N h, nh,
salud por entrevistas, realizada por el National Center for Health
y,, y si,1. De la Sec. 5.4, la varianza estimada de la media ponderada
Statistics.
a partir de una muestra estratificada es, por la Fórmula (5 .1 3 ),
^ w „W
5A.10 M U E ST R E O PO R C U O T A
f < y « ) = I ---------- 1 -
nh N
En otro método usado para sondeos de opinión y en las in El problema es comparar esta varianza con una estimación de
vestigaciones de mercados, los n h requeridos en cada estrato se la varianza de la media que se hubiera obtenido de una muestra
calculan por adelantado, de modo que la estratificación sea pro aleatoria simple. Un procedimiento usado algunas veces calcula la
porcional. El enumerador tiene instrucciones de seguir muestreando
desviación cuadrática media de la media de la muestra.
hasta obtener la cuota necesaria en cada estrato. Las variables más
comunes para estratificación son el área geográfica, la edad, el Z (y/..-y )2
í 2=
sexo, la raza y alguna medida del nivel económico. Si el enumera- n- 1
180 TE C N IC A S DE M U ESTRE O OTROS ASPECTO S D E L M U E S TR E O E S TRATIFIC AD O 181
donde se ignoran los estratos. Esta se toma como estimación de s*, de Si n es grande, (n — 1 ) = n, ( N — 1 ) = N, y el término en
tal modo que Vran = ( N - n ) s 2/Nn‘ para la media de una muestra es de orden 1/n relativamente al término en s* en (5A.49).
aleatoria simple. Este método funciona bastante bien, si la asignación
es proporcional, ya que una muestra aleatoria simple está distri Luego, ' vran (5A.50)
buida en sí misma, aproximadamente en proporción, entre los es
tratos. Pero, si se ha adoptado una asignación alejada de la propor para asignación proporcional. En el caso general la simplificación
cional, la muestra tomada realmente no se parece a una muestra alea correspondiente (n grande) es
toria simple, y este ss puede ser un estimador mediocre. Damos un . (N - n )f 1
procedimiento general cuya prueba se debe a J. N. K. Rao (1962). V.an =
nN I N nh
Teorema 5A.1. Dados los resultados de una muestra aleatoria Ejemplo. Los cálculos se ilustran a partir de los tres primeros estratos
estratificada, un estimador insesgado de V,an, varianza de la media en la muestra de los colegios para maestros (Sec. 5.9). Los datos de la T a
de una muestra aleatoria simple de la misma población, es bla 5A.13 son para la muestra posterior de 1946. Las medias representan ins
cripciones por colegio en miles. Los valores s,2 son un poco mayores que
en la segunda edición, debido a una corrección.
v,an = 1 ( N —i ) [ ñ ? ^ ? y l - y l + ^ y s , ) ] (sa.44)
TA B LA 5A.13. D atos B á s ic o s de u n a M u estra E st r a t if ic a d a de
C o l e g io s de M aestros
donde v ( y „ ) es el estimador insesgado usual de V ( y sl).
Prueba. Estrato Nh n,, 9h i*2
( N —n)
V
* rart =■ . r
n¡\ ’ 5 y J (5 A -45) 1 13 9 2.200 1.8173 83.920
2 18 7 1.638 0.0735 49.429
Ahora bien
3 26 10 0.992 0.0859 27.596
i /l \r, "h \ i l Nh
(5A.46) 57 26 160.945
A \h nh i / J'i h i
También como v ( y . t ) y y „ son estimadores insesgados de V ( y ,t) y
Y, respectivamente, Si n es pequeña usamos la Fórmula (5 A .4 4 ). Encontramos y „ = 1.4715.
Los valores de las yñ, para la muestra no se reportaron, pero e l número en
£ v(y „) = V(y„) = E ( f „ ) - Y 2 (5A.47) la columnas de la derecha puede obtenerse de las precedentes de la Tabla 5A.13.
Las fórmulas dan
y luego un estimador insesgado de Y 5 en (5 A .4 5 ) es
v(y„)-4l— =0.00497
y l~ v (y ¡t) (5A.48) /v
De (5 A .46 ) y (5 A .4 8 ) se infiere que un estimador muestral inses
gado de Vraa en (5 A .4 5 ) es - d ¡ k F ^ , i '4 7 i 5 > , + o o ° 4 9 7 ] - 0 0 , 4 1 2
trato. En este caso, las fórmulas dadas anteriormente para estimar Si A* es un buen pronóstico, el sesgo positivo del término v2 que
V ( Y , i ) y V ( y „ ) no podrán usarse. Con L par, se puede intentar una proviene de las desviaciones (Y/* — Ay*Y,/A, ) 2 es de esperarse
estimación al agrupar los estratos en pares que de antemano se que sea menor al término correspondiente en v,, aunque difiriera de
cree que tienen aproximadamente los mismos totales de estrato. La Vi, Vi también da una estimación sesgada del término en la SY que
asignación en pares deberá hacerse antes de ver los resultados de aparece en V ( Y „ ) . Hartley, Rao y G. Kiefer (1 96 9) encontraron
la muestra por razones que veremos en lo sucesivo. que Vi es menos sesgado que v2 en dos de tres poblaciones, con poca
Sean y „ , y¡-> las observaciones de la muestra, en un par típico, diferencia en la tercera.
donde j recorre los valores de 1 a L/2. Sea Y ¡ t - N n y,u Y¡2= Ni2yn Estos autores desarrollaron un método que no involucra la con
los totales estimados de estratos. Ahora tracción de estratos. Este método usa una o más variables auxiliares
Y}, - Y l2 = (Y n - Yn ) + (Y „ - Y n ) - ( f l2- Y¡2) (5A.52) xIk, x n y así_sucesivamente, sobre las cuales las verdaderas medias
de estratos Y* se cree que tienen una regresión lineal. Si y¡> es el
Luego, al promediar en todas las muestras de este par
valor muestral en el estrato h, el método usa las desviaciones
E ( Y n - Yrf = ( Yn - Yj2)2+ N n (Nn - l ) S 2i + N,2(N¡2- 1 )Sj2 (5A.53)
d h = y h -y - X b ¡( x ¡ h - x ¡ ) (5A. 58)
Para V ( Y „ ) considérese la estimación i
La matriz de varianza y covarianza de las dh puede expresarse
v A Y , . ) = l (Y'/í-Y/z)2 (5A.54) como una función lineal de las <n,2 más ciertos términos de sesgo.
/-i A l invertir esta relación, se obtienen estimaciones <Y donde o-,,2 =
Por (5 A .5 3 ) el valor esperado de esta cantidad es (N h- l ) S 2/Nh, lo queda
r , U2
E v i (Y„)*= £ N h(N h- í ) S h2+ I ( Y/i — Yj2) (5A.55)
h=l i- 1 v3( Y „ ) = £ N h2áh2 (5A.59)
El primer término de la derecha es la varianza correcta (p or el
El método parece prometedor y se extiende aestimaciones de razón,
Teorema 5.4 con n h ** 1 ). El segundo, representa un sesgo positivo
pero losautoresprevienen que se necesitan métodosadicionales de
cuyo tamaño depende del éxito alcanzado al seleccionar pares de
comparación con “estratos contraídos” .
estratos cuyos verdaderos totales difieren un poco. La forma de la
A l utilizar otro enfoque, Fuller (1 9 7 0 ) desarrolló un método de
estimación (5 A .54 ) nos dice que la construcción de pares al hacer
construcción de estratos que proporciona una estimación muestral
que los totales estimados de muestra difieran lo menos posible,
insesgada de V (Y al) con una unidad por estrato. Por sencillez, su
puede conducir a una seria subestimación. La técnica se llama mé
pongamos que N/n = N / L = fe (un entero). Elíjase un número
todo de los “estratos contraídos".
aleatorio r entre 1 y fe. El primer estrato consiste en las unidades nu
Con L impar, cuando menos un grupo debe ser de tamaño dife
meradas de ( r + 1 ) hasta ( r + fe), el segundo, de las unidades
rente de 2. La extensión de la estimación (5 A .5 4 ) a G gTupos de
numeradas de ( r + fe + 1 ) hasta (r + 2 fe) y así sucesivamente, el
cualesquier tamaños elegidos L, > 2 es
último estrato (L-ésimo, n-ésimo) de las unidades numeradas de
S T^T I (Y * - Yí/L,)2 (5A.56) r + (-n — 1 )fe + 1 hasta N = ufe y aquellas de 1 a r. A primera
í - l L ¡ ~ í ic = t vista, este último estrato parece ser una elección mediocre. Pero co
donde Y¡ es el total estimado para el grupo ;. Para L¡ = 2, cuando mo Fuller lo hace notar, el método da resultados en la estratifica
Y, - Y n + Y¡2, esta forma concuerda con (5 A .5 4 ). Como ocurre con ción geográfica con unidades de área. Aquí, la estratificación suele
(5 A .5 4 ), la esperanza de esta v x{ Y „ ') da la varianza correcta V ( Y „ ) basarse en la noción de que las unidades cercanas entre sí tienden
más un sesgo positivo que sustituye Y,* y Y, por Y,* y Y, en (5 A .56 ) a ser semejantes. Al numerar las unidades como serpentina, podemos
Cuando se conoce una variable auxiliar A,-, para cada estrato, tener y,v cerca de y, de modo que el estrato que contiene yy y y, tam
que pronostica el total de estrato Y*, Hansen, Hurwitz y Madow (1953) bién puede ser internamente homogéneo. La estimación x>(Y,i) es
sugirieron el estimador de varianza alternativo una suma ponderada de las diferencias (y* -
El método circular sería menos efectivo para una población con
Vi{Yv) = £ ~r~L~\ í ( % - A i k Y M i ) 2 (5A.57) tendencia creciente de y, a y.v en donde el estrato que incluye y, y
(=1 L, —I k=\
184 TE C N IC A S DE M U E S TR E O OTROS ASPECTOS D E L M U E S TR E O E S TRATIFIC AD O 185
i/y tendría una considerable variabilidad interna. Para esta situa Esta regla puede dar como resultado una comparación más
ción, Fuller da un segundo plan, un poco más complejo, que debería precisa en algunos pares de estratos y en otros una compara
proporcionar una buena precisión con tendencia creciente y también ción menos precisa de los apropiado. Como alternativa tenemos la
proporciona una estimación insesgada de V ( Y „ ) . selección de nh de modo que la desviación estándar de la diferencia
sea la misma, digamos y/Vpara cada par de estratos. Esto equivale
5A.13 ESTRATOS C O M O D O M IN IO S DE E S T U D IO a hacer S*Vm = V/2 para cada estrato. Para un costo fijo, este
método proporciona menos precisión global que el primero. Se pue
En esta sección veremos las encuestas cuyo propósito primordial de verificar que las dos asignaciones óptimas dan
es el de comparar entre diferentes estratos, supuestamente identi-
ficables de antemano. Las reglas para asignar los tamaños de mues V -2 g S !& l (5A.65)
tra para los estratos, son diferentes a las que se aplican cuando el L ( C —c o) \C Co)
objetivo es estimar globales de población. Si sólo hay dos estratos, Se infiere de la desigualdad de Cauchy-Schwarz que V es siempre
podríamos elegir n „ n 2 para minimizar la varianza de la diferencia
mayor que V excepto cuando Sj,Vcj. = constante. Si V es bastan
(y, — y2) entre las medias estimadas de estratos. A l omitir la cpf
te mayor que V en ocasiones se puede encontrar una asignación de
por razones que vimos en la Sec. 2.14, tendremos
compromiso, con un poco de prueba y error, que dará una varianza
promedio cercana a V y conserve V (y k - y>) razonablemente cons
V ( y i - y 2) = — ■+■— (5 A . 60)
«i n2 tante.
Con una función costo lineal Si el objetivo es obtener estimaciones para cada estrato, así co
C = c0 + c 1/i1+ c 2n2 (5A.61) mo estimaciones globales para toda la población, al planear una en
cuesta podríamos especificar las siguientes condiciones
V se minimiza cuando
nS 1 nS2
F(yfc) = — (1 - A ) s Vh, V (y J = I (l-A )sV
nh nh
n 1= ------ .—ÍCl-- j= , n2= -------¿ 2 .---- (5A.62)
S ¡I C\+ S2f v c2 •5i/vCi + 52/Vc2
Se incluyen ahora los términos cp f porque el propósito es especi
Con L estratos, L > 2, la asignación óptima depende de la precisión ficar la precisión con la que deben estimarse las medias en la po
deseada en las diferentes comparaciones. Por ejemplo, el costo po blación finita. Las condiciones sobre las V (ifr) determinan límites
dría minimizar siempre y cuando el conjunto de L ( L - l)/ 2 haga inferiores a los valores de los n*. Si estos límites inferiores satisfacen
que V (y h - y ¡) < Vhi, donde los valores de Vhi se eligen según la la condición sobre V (y 3¡), se ha resuelto el problema de asignación.
precisión que se considere necesaria para una comparación satisfac Cuando la condición impuesta a V ( y „ ) no se satisface, tenemos un
toria de los estratos h e i. método gráfico elaborado por Dalenius (1957).
Con frecuencia hay un método de asignación, más simple pero
Cuando los L = 2* estratos representan todas las combinaciones
adecuado, especialmente si las Sh y c* no difieren mucho. Un en
de k factores en dos niveles, surgen problemas más complejos y el
foque es el de minimizar la varianza promedio de la diferencia entre
objetivo es estimar los efectos promedio de los factores. Si el estrato
todos los L ( L — l)/ 2 pares de estratos, o sea minimizar
o celda al que pertenece cualquier miembro de la población, se co
noce de antemano (antes del muestreo) podrá sacarse del estrato
(5 A .63)
L\n 1 n2 nL J h una muestra de tamaño deseado. n h Para 2, 3 o 4 factores, Sedransk
(1 96 7) ha dado métodos para determinar los nh que minimizan el
V se minimiza, para C fija, por medio de la regla de (5 A .62 )
costo en diferentes especificaciones respecto a las varianzas de los
nhcc-^= (5A.64) efectos promedio estimados de los factores, y la potencia deseada
ve* de una prueba para interacciones.
186 TE C N IC A S DE M U ESTRE O OTROS A SPE CTO S D E L M U E S TR E O E STRATIFIC AD O 187
5A.14 E S T IM A C IO N D E T O T A L E S Y M E D IA S SOBRE donde las S**, es la varianza entre unidades en el dominio j, dentro
S U B P O B L A C IO N E S del estrato h. Pero en la práctica rara vez se conocen los N-H¡.
Con frecuencia sucede que las subpoblaciones o dominios de es Estimación de Totales de Dominios
tudio estén representados en todos los estratos. Si la estratificación
es geográfica, por ejemplo, pueden desearse estimaciones separa A falta de los N h¡ cada total de estrato del dominio se estima co
das de toda la población, para hombres y mujeres, para diferentes mo en la Sec. 2.13. Estos totales se suman para obtener un total de
grupos de edades, para usuarios y no usuarios de equis pasta den dominio estimado, o sea
tal y cosas semejantes. El problema presenta algunas complicacio Ni. "*»
nes. Las fórmulas básicas las dio Yates (1 9 5 3 ), y Durbin (1 9 5 8 ) y yi = /1— 1 y*/
. nh i
(5A.67)
Hartley (1 9 5 9 ) aportaron discusiones y pruebas. En las Secs. 2.10
y 2.11 se vieron los métodos aplicables a un solo estrato. La varianza verdadera y estimada de Y) se encuentra por medio
La notación siguiente se aplica a las unidades del estrato h que del artificio usado en la Sec. 2.13. Se introduce una variable yU que
se encuentran en el dominio j. es iguala y para todas las unidades deldominio j e igual a cero
Notación. paratodas las otras unidades de la población. Como se demostró en
la Sec. 2.13, esto da para la varianza estimada
Número de unidades: Nh„ Y N h¡ = N h
i v{Yi) = lh- nh(nh
f f - \n) ( w 4 L"¿f ( 5A. 68)
, nh J
Número en la muestra: nh„ Y nh¡ = nh
i
Medición en la unidad individual: y^ Estimación de Medias de Dominio
da un método general al muestreo de dos marcos, aplicable a cual V 'í y . J s v t-, v & js v ,
quier diseño de muestras en ambos marcos.
para el costo mínimo C = ^ . c hnh. La cpf puede ignorarse, ( a ) Demostrar
el resultado de Chatterjee (197 2 ) en el que una asignación de compromiso
será necesaria si
E J E R C I C I O S
l w hs2>J7h j . w h( s y s lh)Jrh
5A.1. AI planear una encuesta de ventas en cierto tipo de tienda, con
IW b & J S »,)^ V,
n = 550, se dispone de buenas estimaciones de Sv provenientes de una en
cuesta anterior, en dos de los tres estratos. E l tercer estrato consiste de tiendas (fc ) Si V„/V, es igual o excede al lím ite superior, la asignación óptima
nuevas y tiendas que no tuvieron ventas en la encuesta anterior, de tal para y, satisface ambas tolerancias con un resultado correspondiente cerca
manera que se tiene que conjeturar un valor para S v Si S3, es actualmente 10, no al límite inferior.
5A.6. Una encuesta con tres estratos se ha planeado para estimar el por
calcule V ( j ? „ ) según una asignación estimada de Neym an cuando S3 se con
centaje de fam ilias que tienen cuentas de ahorros en el banco y la cantidad
jetura como ( a ) 5, ( b ) 20. Muestre que en ambos casos el aumento pro
promedio invertida por familia. Los siguientes son estimaciones de los por
porcional en varianza sobre el óptimo verdadero es ligeramente mayor al 2 % . centajes Ph y las Intraestratos para la cantidad invertida.
192 TE C NIC AS DE M U ESTRE O OTROS ASPECTO S D EL M U E S TR E O E S TRATIFIC AD O 193
1 0.6 20 90
2 0.3 40 180 22- 32 6 i. 5.7 663 65.3 192
3 0.1 70 520 24- 30 7 5.5 693 70.8 210
26- 27 8 5.2 720 76.0 216
28- 18 9 4.2 738 80.2 162
Calcular los tamaños más pequeños de muestra y los n* que satisfagan am
30- 22 10 4.7 760 84.9 220
bos requisitos: ( a ) el porcentaje de fam ilias debe estimarse con desviación
estándar igual a 2 y la cantidad promedio invertida con error estándar igual 32- 21 11 4.6 781 89.5 231
a $5. ( b ) El porcentaje de familias debe estimarse con un error estándar de 1.5 34- 19 12 4.4 800 93.9 228
y la cantidad invertida promedio con un error estándar de $5. 36- 16 13 4.0 816 97.9 208
La parte ( b ) requiere una asignación de compromiso, ya sea por medio 38- 14 14 3.7 830 101.6 196
de un programa de cálculo o bien, por el método de la segunda edición (P á g 40- 17 15 4.1 847 105.7 255
164). La asignación - 371 344 315, con n - 1030 satisface las dos tole 42- 9 16 3.0 856 108.7 144
rancias. Demostrar que el método de Booth-Sedransk, (Sec. 5 A .4 ) da nh/n = 44- 8 17 2.8 864 111.5 136
0.431, 0.326, 0.243. Esta asignación requerirla n = 1 073 para satisfacer 46- 11 18 3.3 875 114.8 198
ambas tolerancias. 19 3.0 884 117.8 171
48- 9
5A.7. La tabla de la parte superior de la Pág. 192, es de la distribución 2.6 891 120.4 140
50- 7 20
de frecuencia de una población de 911 tamaños de ciudades, para ciudades 2.0 895 122.4 84
52- 4 21
entre 10 000 y 60 000, dispuestas en clases de 2 000. Para abreviar los cálcu 124.6 110
54- 5 22 2.2 900
los, se da una y ' codificada y los valores de V f cum yff, cum f f y ', y X/y'2.
56- 5 23 2.2 905 126.8 115
Aplicar la regla de Dalenius-Hodges para crear dos estratos con asignación
58- 6 24 2.4 911 129.2 144
óptima en el sentido de Neyman. Encontrar los valores de W A y S. para
cada uno de los estratos. Verificar ( a ) que los tamaños óptimos de muestra
non casi -los mismos en ambos estratos y ( b ) al encontrar S2 para toda la po Totales 911 129.2
blación, que
V (y )
7TT = 4.8 J yj/ 'í = 50 395
Límites de
estratos N„ yk Sh*
Estimadores de Razón
5A.12. Una población tiene dos estratos de tamaños realtivos VV1 = 0.8,
W.. = 0.2 y varianzas dentro de estratos = 100, S * - 400. Se to
ma una muestra aleatoria estratificada que satisface las siguientes condi
ciones: ( i ) las medias de cada estrato deben estimarse con varianza < 1 ; ( t i )
V (y > i) s 0.5. A l ignorar la cp f encontrar los valores de rel( n2 que satisfacen
las tres condiciones para el m ínim o n = n 1 -f- n,. 6.1 M E TO D O S D E E S T IM A C IO N
Sugerencia. Nótese que -d V (y „)/ d n , > -d V (y „ )/ d n 2 si n t < 2rc.. Fuller
(1 9 6 6 ) ha discutido varios métodos para tratar este problema. Uno de los rasgos de la estadística teórica es la creación de una
5A.13. En un ejemplo de Nordbotten (3 9 5 6 ) que estudió Kokan (1 9 6 3 ) se vasta teoría que discute los métodos de obtención de buenas estima
planea una encuesta para estimar el empleo total YJ y el valor de la pro ciones a partir de los datos. En el desarrollo de la teoría, específica
ducción Y., en fábricas de muebles. Cuando las fábricas se estratifican por mente para encuestas de muestreo, se han utilizado poco estos cono
tamaños, los Nh y las Sfh estimadas burdamente son como sigue:
cimientos, por dos causas principales. Primero, en las encuestas que
Estrato Nh S2
lh S f* contienen un gran número de atributos, es una gran ventaja, aunque
se disponga de máquinas computadoras, el poder utilizar procedi
Grande 600 200 500 000 mientos de estimación que requieran poco más que simples sumas,
Pequeña l 000 10 4 000 en tanto que los métodos superiores de estimación de la estadística
teórica, como son la máxima verosimilitud, podrían necesitar una
1600 serie de aproximaciones sucesivas antes de encontrar la estimación.
La condición de que las estimaciones de Y t y Y„ no estén equivocadas en En segundo lugar, como se dijo en la Sec. 1.4, son diferentes las
más del 6% (P — 0.95) equivale a las tolerancias
actitudes tomadas en estas dos divisiones de investigación. La ma
V , = V (y ljt)s 0 .0 3 5 1 : V2 = V ( f r J <56.25 yoría de los métodos de investigación de la estadística teórica supo
nen que se conoce la forma funcional de la distribución de frecuencia
Demostrar que la asignación óptima para y , con ra¡ = 450, m, ■= 167, satisface
que sigue a los datos de la muestra, y el método de estimación está
las dos tolerancias. Obsérvese que en este problema no puede Ignorarse la
cpf. cuidadosamente engranado de acuerdo a este tipo de distribución.
5A.14. En muestreo aleatorio estratificado con una unidad por estrato, se En la teoría de encuestas por muestreo se ha preferido hacer, cuando
supone que los estratos pueden agruparse en pares con N jl = N¡„ » N ¡ más, algunos supuestos respecto a esta distribución de frecuencia
( j = 1 , 2 , . . . , L / 2 ). Un método alternativo de muestreo saca dos unidades (que es muy asimétrica, o que es bastante simétrica) y dejar fuera
al azar de cada par de estratos. Demostrar que para este método de la discusión su forma funcional específica. Esta preferencia con
(\r _ n i/2 r 2 -i duce a la utilización de métodos simples de estimación que dan bue
V ( h (N' - X), 5 5^+( y- - * w ] nos resultados en cierta gama de tipos de distribuciones de frecuen
Por lo tanto, demostrar que el valor esperado de la estimación v . ( Y „ ) de es cia. Esta actitud resulta razonable para tratar encuestas en las que
tratos contraídos en la Fórmula (5 A .5 4 ), Sec. 5A.12. sobreestima V (Y 1¡;), el tipo de distribución puede variar de un atributo a otro, y cuando
la varianza que se aplicaría si se usaran estratos dos veces más grandes. no deseamos detenemos a examinarlas todas, antes de decidir cómo
hacer cada estimación.
196 TE C NIC AS DE M U ESTRE O ESTIM AD O RES DE R A Z O N 197
En consecuencia, actualmente, las técnicas de estimación para nocer X. El uso de estimaciones de razón para este propósito ya se
el trabajo de encuestas por muestreo~son de alcances restringidos. discutió en la Sec. 2.11 y (con muestreo por conglomerados para
Ahora consideraremos dos técnicas, el método de razón en este capí proporciones) en la Sec. 3.12.
tulo y el método de regresión lineal en el Cap. 7.
Ejemplo. La Tabla 6.1 muestra el número de habitantes (e n m iles) en
cada una de las 49 ciudades extraídas en una muestra aleatoria simple de la
población de 196 grandes ciudades discutidas en la Sec. 2.15. El problema es
6.2 E L E S T IM A D O R D E R A Z O N
estimar e l número total de habitantes en las 196 ciudades en 1930. Se supone
que se conoce el verdadero total para 1920, X, su valor es 22 919.
En el método de razón se obtiene una variable auxiliar x¡, corre
El ejemplo es conveniente para una estimación de razón. La mayoría de
lacionada con y¡, para cada unidad de la muestra. El total de pobla las ciudades en la muestra presentan un aumento en tamaño de 1920 a 1930
ción X de las x t debe conocerse. En la práctica, x¡ suele ser el valor del orden de 20% . De los datos de la muestra tenemos
de yi en alguna ocasión anterior cuando se tomó un censo completo.
La finalidad de este método es obtener un incremento de precisión, al y = Z y, =6 262, r = X r, = 5054
utilizar la correlación entre y x¡. Por el momento, suponemos Consecuentementela estimación de razón del total de 1930 para todas las
muestreo aleatorio simple. 196 ciudades es
La estimación de razón de Y, el total de la población para los
V¡, es Y„ = - * = 7^7(22 919) =28 397
x 5 054
La estimación correspondiente basada en la media de la muestra por ciudad es
Y * = - AT= | * (6.1)
x x
O96X6262) = 25 048
donde y, x son los totales de muestra de y¡ y x* respectivamente. 49
Si x¡ es el valor de i/¡ en una ocasión anterior, el método de la El total correcto en 1930 es 29 351.
razón utiliza la muestra para estimar el cambio relativo Y / X ocurrido
desde la ocasión anterior. El cambio relativo estimado y j x se mul
T A B L A 6.1. Tam años de 49 G r a n d e s C iu d a d e s de E sta d o s
tiplica por el total de población X conocido anteriormente, para pro U n id o s (e n m ile s ) e n 1 920 ( x ¡ ) y 1 930 ( y t )
porcionar una estimación del total de la población actual. Si la razón
yjx, es casi la misma en todas las unidades del muestreo, los valores x¡ y¡ xt Vi xi Vi
de y/x varían poco entre las muestras y la estimación de razón es
76 80 2 50 243 291
altamente precisa. En otra aplicación, x¡ puede ser el número total
138 143 507 634 87 105
de acres de una finca y t/¡ el número total de acres dedicados a cierto 30 111
67 67 179 260
cultivo. La estimación de razón será exitosa en este caso si todos los 121 113 71 79
29 50
agricultores dedican más o menos el mismo porcentaje de su propie 381 464 50 64 256 288
dad a dicho cultivo. 23 48 44 58 43 61
37 63 77 89 25 57
Si la cantidad que se ha de estimar es Y, el valor de la media de 64 63 94 85
120 115
la población de yit la estimación de razón es 69 64 77 43 50
61
387 459 56 142 298 317
fc -* * 93 104 40 60 36 46
x 40 64 161 232
172 183
A menudo se deseará estimar una razón y no un total o una 78 ' 106 38 52 74 93
66 86 136 139 45 53
media, por ejemplo, la razón de acres de maíz al de acres de trigo,
60 57 116 130 36 54
la razón de los gastos debidos a la fuerza de trabajo, a los gastos
46 65 46 53 50 58
totales, o la razón de activos corrientes a la de activos totales. La 48 75
estimación muestral es R = y/x. En este caso no es necesario co-
198 TE C N IC A S DE M U ESTRE O
ESTIM AD O RES DE RA ZO N 199
i ( y t - R x if
i-i
6.3 V A R I A N Z A A P R O X IM A D A D E L A (6.3)
—
►
1
n
1
E S T IM A C IO N D E R A Z O N
“ .V
I (yt - R x ¡ ) 2
La distribución de la estimación de razón ha sido siempre un w i-i
problema porque tanto y como x varían de muestra a muestra. Los V (R )= - (6.4)
nX1 N - 1
resultados teóricos conocidos no corresponden a lo que quisiéramos
saber para aplicaciones prácticas. Los resultados principales se ex donde f = n/N es la fracción de muestreo. El método que se usa en
ponen primero sin prueba. el Teorema 2.5 muestra que (6 .2 ), (6 .3 ) y (6 .4 ) también son aproxi
La estimación de razón es consistente (esto es obvio). Tiene ses maciones a los errores cuadrados medios del estimador en estas
go, excepto para algunos tipos especiales de poblaciones, aunque el fórmulas.
sesgo es despreciable en muestras grandes. La distribución límite
El argumento que conduce al resultado aproximado (6 .4 ) se dio
de la estimación de razón, conforme n se hace muy grande, es nor
en el teorema 2.5. Dado que Y* = XR, Y K - N X R , los otros dos
mal, sujeta a algunas restricciones menores sobre el tipo de población
resultados vienen como consecuencia inmediata.
de la cual estamos muestreando. En muestras de tamaño mode
rado la distribución presenta una tendencia hacia asimetría posi Corolario 1. Hay varias formas alternativas del resultado. Dado
tiva en las clases de poblaciones para las cuales se usa el método
que Y - RX, podemos escribir
200 TE C N IC A S DE M U ESTRE O ESTIM AD O RES DE R A ZO N 201
6.4 E S T IM A C IO N D E L A V A R IA N Z A A
N 2( l - f ) "
V (Y R = ' z [(y ,-Y )-R (x -X )r P A R T IR D E U N A M U E S T R A
» { N - 1 ).- ,'
Ar De la Ec. (6 .2 )
= ^ r i y [ I (yi - i Ó 2+ i? 2Z U - ^ )2
v í v v /v2u - / ) £ ( y . - * * ) 2
-2 R E (y ,-Y )(x ,-X )\ n N - 1
El coeficiente de correlación P entre y, y x¡ en la población finita Como ya se mencionó en la Sec. 2.11, tomamos
está definido por la ecuación
Í (y . - - R ^ )2
E (y ,-Y )(x , - X ) I (y/ “ Y)(x¡ - X ) (n-D
p -JE( y , - Y )2E ( x , —X ) 2 ( N - 1)5,5, como estimación muestral de la varianza de población. Esta estima
ción presenta un sesgo del orden de 1/n.
Esto conduce al resultado
Para la varianza estimada, i’( Y s), esto da
_ N 2( l - / ) , „ 2
V( Yr ) =
n
-'-Hs/ + R 2S 2- 2RpSySx) (6.5)
v (Y * ) = Vn <
( nr- n z (y‘ ~ Rx¡)2
l ) ,_i (6-9)
Una forma equivalente es Este resultado puede expresarse de muchas maneras diferentes.
Por ejemplo,
La cantidad ( c v ) 1 se ha llamado la varianza relativa en Hansen y Esta forma también podría usarse para v ( Y K), al tomar v ¡ ( Y K) =
otros (1 9 5 3 ). Su uso evita la repetición de las fórmulas de varianza X*v 2( R ) .
para cantidades relacionadas como la media o el total de población Esto plantea la siguiente pregunta: Si se conoce X, ¿es preferi
estimados. ble vl a v}? La respuesta no la sabemos claramente aún. P.S.R.S.
202 TE C N IC A S DE M U E S TR E O
E S T IM A D O R E S DE R AZO N 203
Jl ~ ¡Í ^ ~ Z Cy f ) ± Z Y ( C y y + C e i — 2 l ' y j ) — Z ; (C j|^¿,- ~ C y ¡ )
6.5 LIM IT E S D E C O N F IA N Z A
1 - z cu
Si la muestra es lo suficientemente grande, de modo que se apli donde
que la aproximación normal, se pueden obtener límites de confianza . N -n S y 2
para Y y R.
Y :Y r ± z ^ v (Y r ) (6.14)
es el cuadrado del cv estimado de y, con definiciones análogas de ci5
y c¿¡r. Si z"c¡¡,j, ¿‘c u y z!Cj» son todas relativamente pequeñas compa
R : R ± z-J 'v(R ) (6.15)
radas con 1, los límites se reducen a
donde z es el desvío normal correspondiente a la probabilidad de
confianza elegida. R = R ± z/C yy + Cu - ZCyx
Eji la Sec. 6.3 se sugirió que la aproximación normal se aplica
razonablemente bien si el tamaño de la muestra es al menos de Esta expresión es la misma que la aproximación normal (6 1 5 ), Aun
30 y si es lo suficientemente grande para que los c v de y y x sean con normahdad bivariada, los limites de Fieller han sido criticados
ambos menores que 0.1. Cuando no se reúnen estas condiciones, la por no ser lo suficientemente conservadores. Wilkinson, James y Ve
fórmula para v ( R ) tiende a dar valores que son demasiado bajos y nables (1 9 7 5 ) explican la dificultad y dan un método alternativo.
puede volverse notoria la asimetría positiva en la distribución de R.
Un métodoalternativo para calcular límitesde confianza se ha
usado en ensayos biológicos (Fieller, 1932; Paulson, 1942). El mé
6.6 C O M P A R A C IO N D E L A E S T IM A C IO N D E R A Z O N
todo requiere que y y x sigan una distribución normal bivariable, de
C O N L A M E D IA PO R U N ID A D
tal forma que (y — R x ) esté normalmente distribuida. Resulta en
tonces que en una muestra aleatoria simple la cantidad
El tipo de estimación de Y que se estudió en capítulos anteriores
y -R x es Ny, donde y es la media por unidad para la muestra (en mues
(6.16)
v '[(N - n ) / N n ]>/fy2+ /? 2Rsyx treo aleatorio simple) o una media ponderada por unidad (en
muestreo aleatorio estratificado). Estimaciones de esta clase son lla
está casi normalmente distribuida con media cero y desviación es
madas estimaciones basadas en la media por unidad o estimaciones
tándar unitaria.
obtenidas por expansión simple.
204 TE C N IC A S DE M U ESTRE O E S T IM ADORES D E R A Z O N 205
Teorema 6.2. En muestras grandes, con muestreo aleatorio sim cionan una estimación insesgada de Y. El estimador con la varianza
ple, la estimación de razón tiene una varianza menor que la esti más pequeña se llama el mejor estimador lineal insesgado (BLUE
mación ? = Ny obtenida por expansión simple, si - best linear unbiased estimator).
Formalmente, Brewer y Royall, suponen que los N valores de
_ coeficiente de variación x¡
p > :2 \ X J / \ y ) población (y ¡ x ¡) son una muestra aleatoria de una suprapoblación
2(coeficiente de variación de y ,)
J
en la que
Prueba. Para Y tenemos y¡= Px,+ e¡ (6.19)
M jL- j g g ( 6 .2 6 )
En resumen los resultados de Brewer-Royall muestran que la su
(nx)* nx posición de un cierto tipo de modelo, conduce a un estimador de
razón insesgado y a las fórmulas para V (Y R) y v(Y R) que resultan
Fácilmente se ve que un estimador insesgado según modelo de X para
simples y exactas para n > 1. Los resultados podrían usarse en la
esta muestra es
práctica en los casos donde el examen de los pares y, x a partir de
los datos disponibles sugieren que el modelo es razonablemente co
Á = Í - ( y i - i t r i)2/ ( n - l ) (6.27)
Xi rrecto. Las fórmulas de la varianza (6 .2 6 ) y (6 .2 7 ) parecen ser
sensibles a la inexactitud en este modelo, aunque esto requiere más
donde R = y/x, como de costumbre. Este valor se puede sustituir en
estudio.
(6 .2 6 ) para dar una estimación muestral insesgada según modelo
de V (Y r ). En trabajos posteriores de Royall y Herson (1 97 3) se discute el
tipo de distribución muestral requerido con respecto a los x¿, para
La importancia práctica de estos resultados es que sugieren las
que Yr se mantenga insesgado cuando hay una regresión polinomial
condiciones en las que el estimador de razón es superior no sólo a y
de y i respecto a x¡.
sino que además, es el m ejor de toda una clase de estimadores. Cuan
do tratamos de decidir la clase de estimación a usarse, puede ser
útil una gráfica en donde se marquen los valores de y, contra los 6.8 SESG O D E L A E S T IM A C IO N D E R A Z O N
de x¡. Si esta gráfica muestra una relación rectilínea que pase por
el origen y si la varianza de los puntos y, alrededor de la línea pare En general, la estimación de razón tiene un sesgo de orden 1/n.
cen ser más o menos proporcionales a x¡, será difícil obtener algo Como el error estándar de la estimación es del orden 1 / Vñ, la can
mejor que el estimador de razón. tidad (sesgo/error estándar) también es del orden 1/ -fn y se vuelve
En ocasiones, la varianza de los y, en arreglos donde x¡ es fijo, despreciable al crecer considerablemente n. En la práctica, esta can
no es proporcional a x¡. Si esta varianza residual es de la forma tidad es de poca importancia para muestras de tamaño moderado.
Xv ( X j ) , donde se conoce u (x ¡), Brewer y Royall demostraron que Sin embargo, su valor en pequeñas muestras es interesante en el
el estimador BLUE se convierte en muestreo estratificado con muchos estratos, en donde quisiéramos
n
calcular y examinar las estimaciones de razón en estratos indivi
duales con pequeñas muestras en los estratos. A continuación, pre
Y=X ^ ^ (6.28) sentamos dos resultados útiles respecto al sesgo.
I w *2 El primero proporciona el término guía del sesgo, cuando se le
donde w¡ = 1/ v (x ¡). En una muestra de población tomada en Grecia, desarrolla en una serie de Taylor.
Jessen y otros (1 94 7) juzgaron que la varianza residual aumentaba
ESTIM AD O RES DE RA ZO N 209
208 TE C N IC A S DE M U ESTRE O
E (y -R x ) = Y - R X = O = Y -X E (R ) (6.38)
por lo tanto, el término guía del sesgo proviene del segundo término Así que
entre corchetes. Además,
E ( R ) r * X - j . c° v (R, x ) = R - ^ cov (R, x) (6.39)
E y ( x - X ) = E ( y - Y ) ( x - X ) = — pSyS, (6.32)
n De modo que el sesgo en R es — cov (R, x)fX. A diferencia de la
por el Teorema 2.3 (Pág. 4 9 ) y la definición de P. También, aproximación de Taylor al sesgo (6 .3 3 ), esta expresión es exacta,
además,
E x ( x - X ) = E ( x - X ) 2= — St2 , ¿i \pk.¡crncrl \
n |sesgo en R |=------ -----
l.n consecuencia, el término guía del sesgo es
V r (J!
E ( R - R ) = ^ l ( R S x2- p S ySx) (6.33)
aía
puesto que R y x no pueden tener una correlación mayor que 1.
= — (C ^ -C J R (6.34) Por lo tanto,
n
¡Sesgo_=nKls 3 = c v d = . (640)
Para una justificación rigurosa de (G .34) véase David y Sukhatme
(1 9 7 4 ). (X A X
Ahora, el término guía en V (R ) es Desde luego, se aplica la misma cuota al sesgo en YR y YR. De modo
que si el cv de x es menor que 0.1 se puede considerar despreciable
Y (R ) = + R 2SX2-2RpSySx) (6.35) el sesgo al compararlo con el error estándar.
nX
ii partir de (6 .5 ) al sustituir R = Y r/NX.
6.9 E X A C T IT U D D E L A S F O R M U L A S P A R A L A
De (6 .3 3 ) y (6 .3 5 ) el término guía de la cantidad (sesgo/error V A R IA N Z A Y L A V A R IA N Z A
estándar), que es el mismo para R. YR, y YR, puede expresarse como E S T IM A D A
¡sesgo en YRí\
<r( Vrj)
[sesgo en i?J |pa \
es de orden ■ - ¡SSr V V -scvde x „ . (6.50)
&R. vA
-/Zfcvdeii,) Así, los sesgos en R c, y YRc son despreciables en relación a sus erro
Por ejemplo, con 50 estratos y el cv de xh aproximadamente 0.1 res estándar siempre que el cv de x„ sea menor que 0.1.
en cada estrato, el sesgo en YRs podría ser tan alto como 0.7 veces
Teorema 6.5. Si el tamaño total de la muestra n es grande,
su error es estándar. La contribución del sesgo al error cuadrático me
dio de YRs seria entonces como de un tercio. v ( K ) - i t ¿ i í z M iSyh^ R ^ _ 2 R n S A ) (651)
Aunqueen la práctica, el sesgo es mucho máspequeño que su h rlh
cota superior, hay que tener presente el peligro del sesgocon esti
Prueba. Esta sigue el mismo argumento que el Teorema 2.5.
mación de razón separada si vX (c v de xh ) excede, digamos, a 0.3.
En el caso presente la ecuación clave es
6.11 L A E S T IM A C IO N D E R A Z O N C O M B IN A D A NX
( YRc - Y ) = — (yu - Rxu)= N (y „ - Rx„) (6.52)
X St
Podemos escribir
Estratos y* xk nn Q k = WV/n* v* Vh
=i _ Rh f Sxh2+ 2(Rh - R ){pkSyhSxR- RhSxh2)] Consideramos cinco métodos para estimar la media de población de acres
«/. de maíz por finca. Las cpf se ignoran.
Los resultados muestran un punto interesante de amplia aplica donde dyh = (yhi - yh3) . Por lo tanto
ción. La estratificación por tamaño de las fincas cumple el mismo
propósito general que una estimación de razón en la cual, el deno v ( Yh) = ( y ) *2(1 —fh)syh = (1 - A ) ( y * i '- J ’hz')2 = (1 - U ) ( d y h')2 (6.56)
minador es el tamaño de la finca. Ambos planes disminuyen el efec
to de las variaciones en tamaño de las fincas sobre el error de mues donde y'^ = N* yhi/2. De igual forma, para la estimación mues-
treo de la media estimada de acres de maíz por finca. Por ejemplo, la tral de la covarianza,
ganancia en precisión de una estimación de razón es 77% cuando se
cov ( YhX h) = (1 - f h)(dyh’){dxh') (6.57)
usa muestreo aleatorio simple, pero es solamente 36% (203 contra
149) cuando se usa muestreo estratificado. Ahora
En el diseño de encuestas, puede haber una elección entre in
troducir un factor dentro de la estratificación o utilizarlo en el mé R P. — P — ^ / Y„ XjA
todo de estimación. La mejor decisión depende de las circunstan R• R ~ X , R V x Ky - K ) <658)
cias. Los puntos relevantes son: ( a ) algunos factores, por ejemplo, Como el muestreo es independiente en estratos diferentes
localización geográfica, que se pueden introducir más fácilmente en
la estratificación que en el método de estimación; ( b ) el asunto
depende de la naturaleza de la relación entre y¡ y x4. Todos los
métodos simples de estimación trabajan en forma más efectiva con
una relación lineal. Con una relación compleja o discontinua, la es
tratificación puede ser más efectiva, ya que, si hay suficientes
Keyfitz (1 9 5 7 ) ha extendido este método a los estimadores post-
estratos, la estratificación eliminará los efectos de casi cualquier
estratificados, al muestreo de varias etapas y a la obtención de va
clase de relación entre y¡ y x 4. ( c ) Si algunas variables importantes
rianzas de las diferencias de las estimaciones, a partir de encuestas
son aproximadamente proporcionales a x 4, pero otras son aproxi
sucesivas en muestras periódicas. W oodruff (1 97 1) da un enfoque
ESTIM AD O RES DE R A Z O N 219
218 TE C N IC A S DE M U ESTRE O
YPS= Z X j a = Z X a£ (6.68)
donde a a y\a
Se recordará que para una varianza mínima con una media por uni Estratos N, («) N ,S „ (6) VW , N ,Y Y , (c) N ,Y, (d)
dad se escoge n h proporciona] a N kSvi/Vc¡¿
1 47 18 4384 22 7.33 344.5 20 2529 22
En el planeamiento de una muestra, la distribución con una es
2 118 46 8016 40 5.57 657.3 39 3666 32
timación de razón puede ser un poco complicada, porque parece 3 91 36 7781 38 7.55 687.1 41 5184 46
difícil especular sobre los valores probables de Sdh. Hay dos reglas
útiles. Con una población en la cual la estimación de razón es la Pob. 256 100 20181 100 20.45 1688.9 100 11379 100
mejor estimación lineal sin sesgo, S® será aproximadamente pro
porcional a (según el Teorema 6.3). En este caso, los n h deberían La parte superior de la tabla muestra los datos básicos. E l método empleado
ser proporcionales a N hsfxh/ V ch. Algunas veces, la varianza de dM para calcular las cuatro varianzas fue encontrar primero los n h para cada tipo
puede ser más aproximadamente proporcional a Xhs. Esto conduce de asignación. Estos valores aparecen en las columnas encabezadas ( a ) hasta
( d ) en la parte inferior del cuadro. Así, con asignación (®)> nh - n N h/N -
a la distribución de nh proporcional a N hXh/ V cT, o sea, al total’ de de tal manera que en el primer estrato.
xM por estrato, dividido entre la raíz cuadrada del costo por unidad.
Un ejemplo de este tipo lo discute Hansen, Hurwitz y Gumey (1 94 6) (100)(47) ,n
con una muestra diseñada para estimar las ventas de tiendas al = 256 ~~
menudeo.
Cuando se han obtenido los tih, se encuentra la V ( Y r, ) correspondiente
Si se usa la estimación, YRc se aplica mismo el razonamiento sustituyendo en la fórmula
general.
V(YRl) = Z Nh(Nh~ nh)S ^
Ejemplo. Los diferentes métodos de asignación pueden compararse con i, nh
los datos recolectados en una lista completa de 257 huertos comerciales de
duramos en Carolina del Norte, en junio de 1946 (Finkner, 1950). E l propósito donde
fue determinar el procedimiento de muestreo más eficiente para estimar la
Sdh = S,h2+ R¡,2S,h2—2RhS.lxh
producción comercial de duraznos en esta área. Se obtuvo información sobre
el número de árboles de durazno y la producción total estimada en cada Las cantidades S s o n las mismas para todas las cuatro asignaciones y se
huerto. La alta correlación entre estas dos variables sugirió el uso de una dan en el extremo derecho de la mitad superior de la Tabla 6.4.
estimación de razón. Se omitió un huerto m uy grande. En la Tabla 6.5 se muestran las varianzas y precisiones relativas.
222 T E C N IC A S DE M U ESTREO
ESTIM ADORES DE R A Z O N 223
TA B LA 6 .5 . C o m p a r a c ió n de Cuatro M étod os de A s ig n a c ió n
Pero en muestreo aleatorio simple E ( r ) ■= E ( r ¡ ) . Por lo tanto,
Varianza
Método d e ---- sesgo en r = E ( r ) - R = - J - £ r f a - X ) (6.73)
asignación: n-„ Estrato j\IW /-1
proporcional a Precisión
Total relativa Por el Teorema 2.3, una estimación insesgada de muestra de
1 N
4 9 824 105 833 376215 5 3 ! 872 100 £ r.(x .-X )
1. Nk N - 1. =,
35 144 131 847 343 44 6 510 437 104
2.
41 750 136 964 3 0 0 312 4 7 9 026 111 es
3. N^Xk
4. N\Xh 35 144 181 7 1 0 2 4 0 888 457 742 116
——r £ r i ( x ¡ - x ) = —^— ( y - r x )
n - 1 (-i n -1
N o hay mucho que escoger entre las diferentes asignaciones, como se
esperaría, ya que los nu no difieren grandemente en los cuatro métodos. El A l sustituir en (6 .7 3 ), la estimación F, corregida por sesgo, se vuelve
método 4, en el cual la asignación es proporcional al número total de árboles
en el estrato, parece ser ligeramente superior a los otros.
(6 ' 7 4 )
R0 = w R - (w - l)R - (6.82)
mas estadísticos en los que la estimación propuesta tiene un sesgo
de orden 1/n. Se ha llamado jackknife porque se trata de un instru donde xu = g [1 — (n — m ) / N ] , o con m = 1, g = n, vj — n [1 —
mento de múltiples usos. La utilidad de este método para estimacio (n —1 )/N ].
nes de razón la señaló Durbin (1959). El estimador de Beale (1 9 6 2 ) es
Al ignorar la cpf por el momento, el sesgo de estimaciones como ó y + [(l-/ )/ n ](s y,/-f) .__ a l + [(l-/ynJCy.t o.x
R se puede desarrollar en una serie del tipo B x + [ ( l - f ) l n \ s x2/x) 1 + [(1 ~ f ) / n ] c xx
E^ - » á' > R - ^ w - R - ^ i r i5 Ejemplo. La población artificial de la Tabla 6.6 contiene tres estratos
con N,, = 4, n h = 2 en cada estrato. La población se construyó deliberada
Ahora el sesgo es de orden 1/n2. Podemos construir g estimaciones mente de modo que ( a ) R h varíe marcadamente de un estrato al otro, lo que
de estetipo, una para cada grupo. El estimador deQuenouille (el
jackknife) es el promedio de estas g estimaciones, o sea TA B L A 6.6. U n a P e q u e ñ a P o b l a c ió n A r t if ic ia l
Ejemplo. E l experimento de campo de la vacuna Salk contra la polio Para v ( R ) , v ( R ') y co v (R R '), se requieren todas las sumas de cuadrados
se condujo entre niños en ios primeros tres grados en todas las escuelas de y productos sin corregir entre las cuatro variantes.
cierto número de condados. Los condados no fueron seleccionados al azar,
ya que se favoreció a aquellos con una historia de polio previa, pero para v (R )= . 1 -- i ( X y 2- 2 R X y x + Á ; I ^ )
esta ilustración se supondrá que fueron una muestra aleatoria de alguna n(n - I)*
población.
Los niños cuyos padres no les dieron permiso para participar en la prueba, = i ----------[(564) - (1.05137)(822.2) + (0.27635)(1661.92)]
(34)(33)(4.9235)
se llamaron el grupo de los “no inoculados” y, desde luego, no recibieron
inyecciones. La mitad de los niños que sí tenían permiso, recibieron tres inyec = 0.00584
ciones de un líquido inerte y se llamaron el grupo “placebo” . De los datos en
la Tabla 6.9, compare las frecuencias R, R ' de polio con parálisis en los gru Similacmente, encontramos v ( R ') = 0.00240.
pos "n o inoculado” y “placebo”. Para reducir la cantidad de datos, la com
paración se restringe a 34 condados, cada uno con más de 4 000 niños en co v ( R R ') = l ,._-_-l( I y y ' - R l . y ' x - R , Y y x ’ + R R 'Z x x ')
n (n - \ )x x
ambos grupos combinados.
En estos datos cualquier variación en el grado de ataque de polio de (497) - (0.52569)(844.6) —(0.34786)(1397.4)
condado a condado produciría una correlación positiva entre R y R'. Las ____________________ + (0.52569)(0.34786)(2690.8)
siguientes cantidades se derivan de los totales.
( 3 4 ) ( 3 3 ) ( 4 . 9 2 3 5 ) ( 8 .3 7 0 6 )
QQ 1Z**T A
Placebo: / ? = — — -=0.525687, x = — ^- = 4.9235 = 0.00127
167.4 34
232 TE C N IC A S DE M U ESTRE O
En algunas aplicaciones deseamos estimar la razón R/R' de dos v (R / R ‘) = (1.511)2(0.0211 +0.0198) -0.0139) = 0.0617
razones. Así, en el ejemplo precedente, podríamos interesarnos en e.e. (R / R ') = 0.248
la razón R/R' de las tasas de niños paralíticos que recibieron un "pla
_ La_ estimación de razón doble se ha utilizado ocasionalmente en lugar de
cebo” y de los niños no inoculados, o la razón de las proporciones Y„ = R X , para estimar un total de población Y. como lo sugirió Keyfitz (Ya
de hombres y mujeres que trabajan, tomados de una muestra con tes, 1960). Supóngase que R '~ (y'/x') se conoce para la misma muestra en
glomerada. Si los datos (y, x ) están a la disposición en la misma un periodo previo y que también se conoce R '= Y '/ X '. Si R'/R' se encon
muestra para dos periodos de tiempo, la cantidad podría ser la razón tró que es, digamos un poco superior a > 1, podríamos argüir intuitivamente
de gastos semanales alimenticios por cada casa en los dos tiempos que R también es de esperarse que dé una sobreestimación de R que debería
diferentes. ajustarse hacia abajo, al dividirla entre la razón R'/R'. Esto conduce a la
estimación de razón doble YDR.
Con una muestra aleatoria simple (es decir de conglomerados)
la estimación muestral de R/R' es R/R’ = {y/x)/(y'/x'), llamada en
Yd r = j , ( R X ) = ^ , ( R 'X ) (6.97)
ESTIM AD O RES DE RA ZO N 235
234 T E C N IC A S DE M U ESTREO
Cy2 C i2 c 22
= Wl f'Rl + W2f Jtl + - - - + W,YRp
Si Vi/ = nv¡¡/( 1 - f)Y - , la matriz v,/ se obtiene fácilmente al to
donde las W ¡ son ponderaciones por determinarse para maximizar la
mar contrastes diagonales en C, esto es,
precisión de YMR, respecto a s W j = 1. Este tipo de estimación pa
rece conveniente cuando la regresión de y en xe, x 2, . .. x„ es lineal an = cyy+Ci i - cyi —cyx
y pasa por el origen. Deben conocerse los totales de población X¡. t ' i 2' = cyy + ci2- c v, - c y2 etc.
El método se describe para dos variables x, ya que esta seria la
aplicación más frecuente. Tenemos El factor (1 — f)Y-/n no se necesita para calcular w¡, pero debe ser
insertado cuando se calcula la varianza mínima. Entonces
Ym r - Y = Wí (Y r - Y ) + W2(Y r , ~ Y) ■
¡y
Vmm( * MR)
( t’n 't’2
,
2, ~t-1
i ,
i2'~)' o >\
(61011
(O .lU l)
Por lo tanto, al suponer que el sesgo es despreciable, n (vn +1722 -2t7l2)-
V (Ym r ) = W l W ( Y Ri) + 2 W l W2cov ( ÉR, Yr ¡ ) + VY22V( YK¡) En vista de la cantidad de cálculos involucrados, esta estimación
probablemente se restringirá a encuestas pequeñas de alcance espe
= WS Vu + 2 W 2 Y 12+ VU22 U22 (6.99)
cializado. El método es capaz de dar un marcado aumento en preci
donde Vn = V (Y R,), etc. Los valores de W 1( W 2, los cuales minimi sión sobre Y r¡ o Y*s solas.
zan la varianza, respecto a W , + W , = 1, se encuentra que son
6.5. Los datos siguientes son de una pequeña población artificial con
(cu)2= — ~ ( C yy+ Cxx + 2Cvx)
(6.103) N ■= 8 y dos estratos de mismo tamaño.
n
A
donde ( c v ) 2 es el cuadrado del coeficiente de variación de Yp o de Estrato 1 Estrato 2
Yp. P.S.R.S. Rao y Mudholkar (1 9 6 7 ) han extendido el estimador
Vu x2i Va
de razón multivariante de Olkin a ¡una combinación ponderada de es
2 0 10 7
timadores de razón (para x¡ positivamente correlacionados con y)
5 3 18 15
y estimadores producto (para .r¡ negativamente correlacionados
9 7 21 10
con y). 15 10 25 16
E J E R C I C I O S
Para una muestra aleatoria estratificada en la cual 7^ = n2 — 2, compare
los ECM de YKs y Y *c encontrando los resultados para todas las muestras po
6.1. Una encuesta piloto de 21 hogares dio los siguientes datos para nú sibles. ¿Hasta qué punto es la diferencia en el ECM debida a sesgos en las
mero de miembros ( x ) , hijos ( y , ) , automóviles ( y 2) y receptores de T V (j/3). estimaciones?
6.6. En el Ejercicio 6.5 calcule la varianza dada usando el método de Lahiri
X Vi Vi 1/3 X ¿6 V i V3 X y2 y3
de selección de la muestra dentro de cada estrato y una estimación de razón
separada.
5 3 1 3 2 0 0 1 6 3 0
3 1 1 4 2 1 1 6.7. Cuarenta y cinco estados de los Estados Unidos (excluyendo los 5
2 0 1 1 1
a más grandes) fueron colocados en 9 estratos con cinco estados cada uno, los
4 1 2 0 0 2 0 4 2 1 1
estados dentro del mismo estrato tienen aproximadamente la misma razón
4 2 1 1 6 4 2 1 3 1 0 1
de población de 1950 a 1940. Una muestra aleatoria estratificada con nh = 2
6 4 1 1 3 1 0 0 2 0 2 1 dio los siguientes resultados para la población en 1960 (¡/) y 1950 ( x ) , en
3 1 1 2 4 2 1 1 4 ¿- 1 1 millones.
5 3 1 1 5 3 1 1 3 1 i 1
Estrato
Suponiendo que se conoce el total de población X, ¿recomendaría usted 1 2 3 4 5 6 7 8 9
que se usaran estimaciones de razón en lugar de expansiones simples para
estimar el total de hijos, automóviles y receptores de TV? Vu 0.23 0.63 0.97 2.54 4.67 4.32 4.56 1.79 2.18
6.2. En un campo de cebada se pesaron el grano, y¡, y el grano más *A1 0.13 0.50 0.91 2.01 3.93 3.96 4.06 1.91 1.90
la paja, x¡, en cada una de un gran número de unidades de muestreo locali y»2 4.95 2.85 0.61 6.07 3.96 1.41 3.57' 1.86 1.75
zadas al azar por todo el campo. También se pesó la cosecha total (grano 2.78 2.38 0.53 4.84 3.44 1.33 3.29 2.01 1.32
más p a ja ) del campo completo. Se obtuvieron los siguientes datos: cn = 1.13,
c ■= 0.78, cXI = 1.11. Calcule la ganancia en precisión obtenida al estimar
el rendimiento en grano del campo, de la razón grano a cosecha total en Dado que el total de población en 1950, X, es 97.94, estime la población
lugar de usar el rendimiento medio de grano por unidad. en 1960 mediante la estimación de razón combinada. Encuentre el error están
Se necesitan 20 min para cortar, trillar y pesar e l grano en cada unidad, dar de su estimación mediante el método abreviado de Keyfitz (Sec. 6.13).
El total con-ecto para 1960 fue 114.99. ¿Coincide su estimación con esta cifra
2 min para pesar la paja en cada unidad y 2 horas para recolectar y pesar
dentro de los errores de muestreo?
toda la cosecha del campo. ¿Cuántas unidades se deben tomar por campo
para que la estimación de razón sea más económico que la media por unidad? 6.8. En el ejem plo de una razón bivariante dado por Olkin, se tomó una
6.3. Para los datos en el Tabla 6.1, YR = 28,367 y cw = 0.0142068, cft = muestra de 50 ciudades de una población de 200 ciudades. Las variables
0.0146541, Cu = 0.0156830. Calcule los límites cuadráticos de confianza al y. x,, x„ son número de habitantes por ciudad en 1950, 1940 y 1930, respec
95% para Y y compárelos con los límites encontrados mediante la aproxima tivamente. Para la población, y = 1699, X , = 1482,X , = 1420 (en cientos) y,
ción normal. para la muestra y = 1896,x, = 1 6 9 3 , = 1643. La matriz C según se define
en la Sec. 6.20 es
6.4. Los valores de y y x se miden para cada unidad en una muestra alea
toria simple de una población. Si se conoce X , la media de población de x,
y x¡ *2
¿cuál de los procedimientos siguientes recomienda, para estimar Y/X? ( a ) 1.213
y 1.241 1.256
Usar siempre y/X. ( b ) Usar algunas veces y/X y otras veces y/x. ( c ) Siempre 1.241
X, 1.302 1.335
usar y/x. Dé sus razones.
*2 1.256 1.335 1.381
238 TE C N IC A S DE M UESTREO
y,, = y + b ( X - x ) (7.1)
donde el subíndice Ir denota regresión lineal y b es una estimación
del cambio en y por incremento unitario de x. El fundamento de esta
estimación es que si x está por debajo del promedio, también debe
ríamos esperar que y lo estuviera por una cantidad b { X - x ) debido
a la regresión de y^ sobre x¡. Para una estimación del total de pobla
ción y, tomamos Y,r - Nylr.
Watson (1 93 7) utilizó una regresión del área foliar respecto al
peso foliar, para estimar el área promedio de las hojas de una planta.
El procedimiento consistía en pesar todas las hojas de la planta. Se
determinó el área y el peso de cada hoja, para una pequeña muestra
de hojas. Posteriormente se ajustó la media muestral del área por
medio de la regresión respecto al peso de las hojas. La cuestión es
desde luego que es fácil pesar una hoja, pero determinar su área
es laborioso.
240 T E C N IC A S DE M U ESTREO E S T IM A D O R E S D E R E G R E S IO N 241
Esto resulta de inmediato al aplicar el Teorema 2.4 a la variable Dado que BSX = PSy, esto se puede escribir
auxiliar y, - b0(x, - X ) .
En este momento podemos preguntar: ¿Cuál es el mejor valor + (7.17)
de ¿o? La respuesta la da el Teorema 7.2.
Por lo tanto, si el incremento proporcional en la varianza debe
Teorema 7.2. El valor de b0 que minimiza V(y¡r) es ser menor que «, tendremos
I (y¡-y)(Xi-x)
b=— n--------------- (7.19)
I
(=i
Es claro que ésta se minimiza cuando d = 0. Como P2 *= S^/S/S*2, La teoría de la regresión lineal desempeña un papel prominente
en la metodología estadística. Los resultados estándar de esta teoría
Vn,¡n(yir) = — Sy2( l - p 2) (7.14) no son enteramente adecuados a las encuestas por muestreo, porque
n
se necesita suponer que la regresión de población de y respecto a x
Puede usarse el mismo análisis para ver qué tanto se aleja bode
sea lineal, que la varianza residual de y alrededor de la línea de regre
B sin incurrir en una pérdida importante de precisión. De (7 .1 3 )
sión sea constante y que la población sea infinita. Si los dos primeros
y (7 .1 4 ),
supuestos son demasiado incorrectos, probablemente no se use una
estimación de regresión lineal. Pero en encuestas en donde la regre
sión de y respecto a x se cree que es aproximadamente lineal, es
útil poder usar yi, sin necesidad de suponer linealidad exacta o va
rianza residual constante.
244 T E C N IC A S DE M U ESTREO E S T IM A D O R E S DE R E G R E S IO N 245
En consecuencia, presentamos un método que no supone ninguna entonces, en muestras aleatorias simples de tamaño n, con n grande,
relación específica entre y-, y x¡. Como en la teoría análoga para la
estimación de razón, sólo se obtienen resultados de muestras grandes. V(yir) = ^ - ^ - S , 2( l - p 2) (7.25)
n
Con b como en (7 .1 9 ), el estimador de regresión lineal de Y
donde P = S^/SjS* es la correlación de población entre y y x.
en muestras aleatorias simples es
Prueba. El error de muestreo de y,, surge de la cantidad
yir = y + b ( X - x ) = y - b { x - X ) (7.20)
ylr- Y = y - Y + b ( X - x ) (7.26)
En la Sec. 7.7 veremos que el estimador y¡„ al igual que yR. tiene
un sesgo del orden de 1Jn. Al encontrar el error de muestreo de y¡n Como aproximación, reemplacemos y,, por
se reemplaza el valor de b de la muestra, en (7 .2 0 ) por el coeficiente yfr = y + B ( X - x ) (7.27)
de regresión de ia población B, en (7 .1 0 ). En el Teorema 7.3, el
error cometido en esta aproximación se verá que es del orden 1/Vñ donde B es el coeficiente de regresión lineal en la población de y
respecto a x. El error en que incurre esta aproximación es (B - b )
relativo a los términos retenidos. En primer lugar examinaremos
la relación entre b y B. • ( X - x ) . Esta cantidad es de orden 1/n en una muestra aleatoria sim
ple d£ tamaño n, ya que tanto ( b — B ) corno ( x - X ) son de orden
Se introduce la variable auxiliar e¡ definida por la relación
1/Vn. Pero el error de muestreo en yir es del orden 1/Vrc dado que
ei = yi - Y - B { x i - X ) (7.21) es el error en la media muestral de la variable auxiliar (i/¡ — Bx¡).
N Por lo tanto, el término guía en E(yir - Y ) 2 es V(y¡,). Por (7 .1 1 ) en
Dos propiedades de los e¡ son que £e,- = 0 y muestras grandes,
parar con la Tabla 6.2, Pág. 211. que se aplica a la estimación de ra
en muestras pequeñas o moderadas. Los estimadores aproximados en zón en las mismas ocho poblaciones, se ve que el porcentaje de las
(7 .2 5 ) y (7 .2 9 ) son subestimaciones en V y v para y¡, son, cuando menos, el doble de
las de y« en muestras del mismo tamaño.
V(yir) = ^ Sv2( 1—p 2) (7.25)
n
7.7 SESG O DE L A E S T IM A C IO N DE R E G R E S IO N L IN E A L
V( h ) = - ^ T 7 x [(y, - y ) - b ( Xi- x ) f (7.29)
n(n ~ ¿) i
El estimador y¡r tiene un sesgo de 1/n en muestreo aleatorio sim
Supongamos que los y¡ para i = 1, 2, . . . N son una muestra alea
ple. Tenemos
toria de una población infinita en el modelo
V (y je n (7 .2 5 ) 38 34 28
v(y¡,)en (7.29) 48 42 33
250 TE C N IC A S DE M U ESTRE O
ESTIM AD O RES DE REGRESION 251
Este resultado es válido para todo n > 1 y cualquier muestra seleccio Las dos estimaciones se considerarán inicíalmente en el caso en
nada únicamente por valores de x. Este método y su generalización que los bhy b se eligen de antemano, pues suspropiedades son ex
al caso de varianzas residuales fueron dados por Royall (1970). En cepcionalmentesimples en esta situación. De la Sec. 7.2, se sabe
este modelo, un plan de muestreo determinado que tuviera éxito que y(,/, es una estimación insesgada de Yh, de modo que y^ es una
estimación insesgada de Y. Como el muestreo es independiente en
en hacer x = X minimizará V(y,r) para un n dado.
estratos diferentes, vemos por el Teorema 7.1 que
252 T E C N IC A S DE M UESTREO E S T IM A D O R E S DE R E G R E S IO N 253
Z (yh¡-yh)(.xhi- x h)
V((yln, = I - 2(1 f ~ (Syh2- 2bhSyxh +bh2S j ) (7.51)
h nh
(7'56)
El Teorema 7.2 muestra que V(y,rs) es mínima cuando bh = Bk, el i
verdadero coeficiente de regresión en el estrato h. El valor mínimo la estimación de mínimos cuadrados dentro de estrato de B,,.
de la varianza se puede escribir
Al aplicar el Teorema 7.3 a cada estrato, tenemos
Vm-n(y¡r,) = I ^ L Í l z A ) U S (7.52)
i< nh \ ¿>xh / V (y á = Z ~P h ) (7.57)
h n¡,
Volviendo la estimación combinada con b preasignado, (7.50)
muestra que yuc es también una estimación insesgada de Y. Dado siempre que el tamaño de muestra n-„ sea grande en todos los estra
tos. Para obtener una estimación de varianza de la muestra, se
que y,rc es la estimación usual de una muestra estratificada para la
sustituye
variable yh¡ + b ( X - x h¡), podemos aplicar el Teorema 5.3 a esta va
riable, lo que da como resultado
s ; *h = — ^ [ Z (y u ~ h ) 2~ b 2 Z (xu ~ x h)2"] (7 .58 )
H it — ¿ i ¡ ¡ J
V(y,rc) = I Wh- i l ~ fh) (Syh2- 2bSyxh + b 2SX2) (7.53)
h nh en lugar de SBr ( l - p*2) en (7.57).
El valor de b que hace mínima esta varianza es La estimación yirs presenta la misma dificultad que la corres
pondiente estimación de razón, o sea que la razón del sesgo al error
estándar puede llegar a ser apreciable. De la Sec. 7.7 resulta que
h ni, / h nh las estimaciones de regresión y¡,h en los estratos individuales pue
La cantidad Bc es una media ponderada de los coeficientes de re dentener sesgos de orden 1Jnh y los sesgos pueden ser del mismo
gresión de los estratos Bh = S ^ / S rft2. Si escribimos signo entodos los estratos, de tal manera que el sesgo general en
yin también puede ser de orden l/nh. Dado que el término principal
ah = W" { l ~ fh)Sx, 2 ; entonces Bc = 2 ,aAB„/2 a;,. en el sesgo viene de la regresión cuadrática de yh¡ en xH, como se
nh mostró en la Sec. 7.7, este peligro es más agudo cuando la relación
De (7 .5 2 ) y (7 .5 3 ), con Br en lugar de b, encontramos entre las variables se aproxima más bien al tipo cuadrático que al
lineal.
Kr.m(yv) - Vmin (ñ J = Z ahB , 2- (Z a h) V 2
Con la estimación combinada vimos que la varianza es mínima
= Z ah(Bh - B c) 2 (7.55) cuando b = Bc, según se define en (7 .5 4 ). Esto sugiere que tomemos
Este resultado muestra que con las elecciones óptimas,la estima r- WV(1 -/ „) v. , _ , /r Wh2( l - f h ) ^ ,
ción separada tiene una varianza menor que la estimacióncombina bc Y. , Z (yu yh)(xh¡ Xh) Y , ,, Z ( xm x ¡,)
h nh(.nh- \) ¡ / h nh(nh- 1) ,
da, a menos que Bh sea el mismo en todos los estratos.
como una estimación de Bc. Si la estratificación es proporcional y si
Estas elecciones óptimas serían, desde luego, un conocimiento
podemos reemplazar (n ;, - 1 ) en be por nh, bc se reduce a la conocida
avanzado de los valores de Sl/rh y Sxh2.
estimación combinada de mínimos cuadrados
= [y„ - Y +B e( Á - x „ ) ] + ( ¿ c - £ e) ( * - í „ ) (7.59)
resulta que si los errores de muestreo de bc son despreciables E J E R C I C I O S
Número de árbol
viyuc) = X X [(y,, - y j - bAxkc - xh)]2 (7.61)
h nk{nh —1) ¡
1 2 3 4 5 6 7 8 9 10 Total
N o se pueden dar reglas absolutas para decidir si la estimación Como una estimación del peso total real Y, tomamos
separada o combinada es mejor en una situación específica: se re Y = N [X + (y -x )]
quiere ejercer buen juicio para hacer la elección. Los defectos de la
estimación separada son que está más expuesta a sesgos cuando Calcule la estimación y encuentre su error estándar.
las muestras son pequeñas dentro de los estratos individuales y que 7.2. ¿Daría la estimación de regresión lineal, con el b de mínimos cua
su varianza tiene una mayor contribución debida a los errores de drados de la muestra, una estimación más precisa en 7.1?
muestreo en los coeficientes de regresión. El defecto de la estima 7.3. De los datos de la muestra en la Tabla 6.1 (Pág. 197 ) calcule la
ción combinada es que su variancia es inflada si los coeficientes estimación de regresión del número total de habitantes en 1930 en las 196
ciudades grandes. Encuentre el error estándar aproximado de esta estimación
de regresión de la población difieren de estrato a estrato. y compare su precisión con la de la estimación de razón.
Si tenemos confianza en que las regresiones son lineales y si Bh 7.4. En el Ejercicio 7.3 encuentre el número total estimado de habitantes
parece ser el mismo en todos los estratos, hasta donde pueda juz y su error estándar si se toma b como 1.
garse, debe preferirse la estimación combinada. Si las regresiones 7.5. En la siguiente población con N = 5, verifique ( a ) que la regre
sión de y en x es lineal y ( b ) que la estimación de regresión lineal no tiene
parecen lineales (en tal forma que el peligro de sesgo parece peque sesgo en muestras aleatorias con n = 3. Los pares (y, x ) son (3 , 0 ), (5 , 0).
ñ o) pero Bh parece variar de estrato a estrato, es recomendable la (8 , 2 ), (8, 3 ), (12, 3).
estimación separada. Si hay alguna curvilinealidad en las regresiones 7.6. Una medición burda x , hecha en cada unidad, está relacionada a la
cuando se usa una estimación de regresión lineal, la estimación verdadera medida y en la unidad por la ecuación
combinada es probablemente más segura a menos que las muestras x =y +e+d
sean grandes en todos los estratos.
donde d es un sesgo constante y e es un error de medición, no correlacionado
Mickey (1 95 9) y Williams (1 96 3) han desarrollado estimadores con y, el cual tiene media cero y varianza Se2 en la población, que se supone
del tipo de regresión que son insesgados, pero aún no se han probado infinita. En muestras aleatorias simples de tamaño n, compare las varianzas
lo suficiente. Rao (1 96 9) encontró que el estimador de Mickey ge de ( a ) la estimación de “diferencia'’ [y + ( X —x)J de la media Y y ( b ) la
neralmente es inferior a los estimadores de regresión estándar, y a los estimación de regresión lineal, usando el valor de b que da la varianza míni
ma. (L as varianzas pueden depender de S,*.)
estimadores de razón en poblaciones naturales. Una versión del es
256 T E C N IC A S DE M U ESTREO
7.7. Al desarrollar todos los casos posibles compare los ECM de las esti
maciones de regresión separada y combinada del total Y de la siguiente po
blación. cuando se extraen muestras aleatorias simples de tamaño 2 de cada
estrato. Para cada estimación, ¿cuánto es el sesgo de contribución para ECM?
Estrato 1 Estrato 2 C A P IT U L O 8
*1. 2>u x2¡ Va
4 0 5 7
6 3 6 12
7 5 8 13 Muestreo Sistemático
Use las estimaciones de mínimos cuadrados ordinarios de los B, bh y bc en
la Pág. 253.
7.8. En la población del Ejercicio 7.7 mostrar que si el B óptimo preasig-
nado pudiese usarse en cada caso, V (Y U, ) = 4.39, V '(Y lre) =4.43, = 4.43 siendo
ambas estimaciones insesgadas. 8.1 DESCRIPCION
7.9. Por el mismo método, comparar el ECM de las estimaciones de razón
separada y combinada en la población del Ejercicio 7.7. Dado que la razón A primera vista, este método de muestreo es muy diferente al
Y/X es 8/17 = 0.47 en el estrato 1, y 32/19 = 1.68 en el estrato 2, la teoría muestreo aleatorio simple. Supongamos que las N unidades de la po
de muestras grandes sugeriría que Y ^ fuese mayor que YRc. Sin embargo, blación se numeran de 1 a N en cierto orden. Para elegir una mues
se encontrará que en estas muestras muy pequeñas, Y Rc tiene el menor
tra de n unidades, tomamos una unidad al azar entre las fe primeras
ECM. Su superioridad no se debe a que tenga un sesgo menor, ni a que YR, o
y luego tomamos las subsecuentes a intervalos de fe. Así, por ejem
YKc estén materialmente sesgadas. Otra discordancia con respecto a la teoría
de las muestras grandes es, como se verá, que y * , y tienen ECM menores plo, si fe es 15 y la primera unidad que se extrae es la número 13,
que las estimaciones de regresión correspondientes. entonces las subsecuentes se numeran 28, 43, 58, etc. La selección
de la primera unidad determina toda la muestra, que se denomina
muestra de todas las fe-ésimas unidades.
A continuación veremos las ventajas aparentes de este método
respecto al muestreo aleatorio simple.
T A B L A 8,1. L a s P o s ib l e s M u e s t r a s S i s t e m á t i c a s p a r a N *= 2 3 , fe = 5
Muestreo Aleatorio
Núm ero de la muestra sistemática
x = muestra sistemática o = muestra aleatoria estratificada
*-* O-UoO--------L-X— o-J-x-------oJ-x— o— bx--------- 1 II III IV V
k 2k ' 3* 4* 5k 6k I
Núm ero de unidad
1 2 3 4 5
Fie. 8.1. Muestreo aleatorio estratificado y sistemático 6 7 8 9 10
11 12 13 14 15
rrespondiente con una unidad por estrato. La diferencia es que con 16 17 18 19 20
la muestra sistemática, las unidades ocurren en la misma posición 21 22 23
relativa del estrato, mientras que con el muestreo aleatorio estrati
ficado, la posición dentro del estrato se determina separadamente
lecciónese un número al azar entre 1 y N y tómese cada fe-ésima
por aleatorización dentro de cada estrato (véase la Fig. 8.1). La
unidad a partir de ahí y siguiendo el círculo, hasta alcanzar las n uni
muestra sistemática se reparte más uniformemente sobre la pobla
dades deseadas. Supongamos que se desea n = 5 con N - 23. En
ción, y este hecho, algunas veces ha dado al muestreo sistemático
tonces fe = 5. Si el número aleatorio es 19, tomamos las unidades
una precisión considerablemente mayor que la del muestreo alea
torio estratificado. 19, 1 ,6 , 11, 16. Con este método es fácil verificar que cada unidad
tiene la misma probabilidad de selección. Si se desean n = 4 unida
Una modificación al muestreo sistemático consiste en elegir cada des con N *= 23, tomamos fe = 6.
unidad en el centro o cerca del centro de cada estrato. O sea que
en lugar de empezar la sucesión con un número aleatorio elegido
entre 1 y fe, tomamos el número inicial como (fe + l)/ 2 si fe es 8.2 R E L A C IO N C O N E L M UESTR EO C O N G L O M E R A D O
impar y como fe/2 o (fe + 2 )/ 2 si fe es par (Madow, 1953). Este
procedimiento lleva el propósito del muestreo sistemático a su con Existe otra manera de considerar el muestreo sistemático. Con
clusión lógica. Si y, puede considerarse como una función continua N = ;:fe las fe muestras sistemáticas posibles aparecen en las colum
de una variable continua i, hay razones para esperar que esta mues nas de la Tabla 8.2. En él es evidente que la población se ha dividido
tra localizada al centro será más precisa que una localizada aleato en fe grandes unidades de muestra, cada una de las cuales cuenta
riamente. Algunas investigaciones en poblaciones naturales apoyan con n unidades originales. La operación de elegir una muestra sis
esta opinión, aunque las muestras localizadas al centro tienden a temática aleatoriamente localizada, es sólo la de elegir una de estas
comportarse erráticamente. Aquí nos ocuparemos en forma exclusiva grandes unidades de muestreo al azar. Por lo tanto, el muestreo sis
de muestras en donde existe algún elemento aleatorio. temático viene a ser la elección de una sola unidad de muestreo
Como en general, N no es un múltiplo entero de fe, las diferentes compleja, que constituye la muestra total. Una muestra sistemática
muestras sistemáticas de la misma población finita podrán variar su
tamaño en una unidad. Así, con N = 23, fe = 5, los números de uni TA B LA 8.2. C o m p o s ic ió n d e l a s k M u e s t r a s S is t e m á t ic a s
es una muestra aleatoria simple de una unidad conglomerada, tomada Corolario. La media de una muestra sistemática es más precisa
en una población de fe unidades conglomeradas. que la media de una muestra aleatoria simple si y solamente si
S2
W,y > S 2
8.3 V A R IA N Z A D E L A M E D IA E S T IM A D A Prueba. Si y es la media de una muestra aleatoria simple de
tamaño n,
Se han desarrollado numerosas fórmulas para la varianza de yjy,
media de una muestra sistemática. Las tres que se dan a continua
ción se aplican a cualquier clase de muestreo conglomerado en donde
éstos contienen n elementos y la muestra consiste en un conglome De (8 .1 ), V ( yjy) < V ( y ) si y solamente si
rado. En estas fórmulas suponemos N = nk.
N - 1 2 k (n - \ ) n2 , N - n S 2
Si N = nk, es fácil verificar que y!v es una estimación insesgada
de Y para una muestra sistemática aleatoriamente localizada. ~ ñ ~s Ñ ~ s^ < i r 7 (8-3)
En el análisis que sigue, el símbolo y¡, denota el j-ésimo miembro esto es, si
de la z-ésima muestra sistemática, por lo tanto, j = 1 ,2 , . . . n,
i = 1 , 2 , . . . fe. La media de la z-ésima muestra se denota con y¡. fe(w —1)S tv > ( n - 1 - ~ ~ j S2= k ( n - 1)52 (8.4)
Teorema 8.1. La varianza de la media de una muestra siste
mática es Este resultado importante que en general se aplica al muestreo
conglomerado, enuncia que el muestreo sistemático es más preciso
Y(y k (n - 1) 2 . que el muestreo aleatorio simple si la varianza dentro de las mues
N ¿ N 81
( . )
tras sistemáticas es mayor que la varianza de la población total. El
donde muestreo sistemático es preciso cuando las unidades dentro de una
misma muestra son heterogéneas y es impreciso cuando son homo
géneas. El resultado es intuitivamente obvio. Si hay poca variación
dentro de una muestra sistemática en relación con la de la pobla
es la varianza entre las unidades que se encuentran dentro de la mis ción, las unidades sucesivas en la muestra repiten más o menos la
ma muestra sistemática. El denominador de esta varianza, fe(n - 1), misma información.
se construye por medio de las reglas usuales en el análisis de la Otra forma para la varianza se da en el Teorema 8.2.
varianza: cada una de las fe muestras contribuye con (n — 1 ) grados
de libertad a la suma de cuadrados del numerador. T e o re m a 8.2.
( N - l ) S 2 = nkV(yjy) + lc(n - 1 ) 5 ( 8 . 2 )
El resultado prosigue. Pw = ( n - l ) ( N- l ) S 2 ^ ^ (8'?)
262 TE C N IC A S DE M U ESTRE O
M U E S TR E O S IS T E M A T IC O 263
Prueba
Esta cantidad es la correlación entre las desviaciones de los pares
n2* V (y „ ) = n2 ¿ ( y , - Y)2 de características de las medias de los estratos que están en la misma
¡=i muestra sistemática.
2 v- y (ya~yí)(yíu~y.u) l9 ,,v
= I í ( y n - r ) + ( y i2 - Y ) + - - - + ( y ¡n - y ) ] 2
í-1 =«(„-!)(*-!) (8- 14)
Los términos al cuadrado constituyen la suma total de cuadrados de La prueba es similar a la del Teorema 8.2.
las desviaciones de Y, es decir, ( N — l ) ^ . Esto da
Corolario. Una muestra sistemática tiene la misma precisión
n2kV(yn ) = ( N - l ) S 2 + 2£ I (yíy- Y(yiu- Y) (8.8) que la correspondiente muestra aleatoria estratificada con una uni
i ¡< u
dad por estrato, si = 0. Esto es así porque para este tipo de
= ( H - l ) S 2+ ( n - l ) ( N - l ) S 2pw (8.9) muestra, V (y aI) es (Teorem a 5.3, Corolario 3 )
Por lo tanto,
* < « - ( * = #
V(9sy) = 7 ( ^ ) [ l + (" “ 1 K ] (810)
Otras fórmulas para V (y ,„), apropiadas para una población auto
Este resultado muestra que la correlación positivaentre unida correlacionada, fueron presentadas por W. G. y L. H. Madow (1944)
des en la misma muestra, in fla la varianza de la media de la mues quienes hicieron el primer estudio teórico sobre la precisión de
tra. Aun una pequeña correlación positiva puede tener un gran muestreo sistemático.
efecto, debido al multiplicador (n — 1). Ejemplo. Los datos en la Tabla 8.3 son para una pequeña población art:
Los dos teoremas anteriores expresan V ( yJy) en términos de S-, ficial que exhibe una clara y constante tendencia ascendente. Tenemo
por lo tanto, la relacionan con la varianza de una muestra aleatoria N = 40, fe, = 10, n = 4. Cada columna representa una muestra sistemática
las hileras son los estratos. E l ejem plo ilustra la situación en la cual la com
simple. Existe un teorema similar al 8.2 que expresa V (y sy') en tér
lación "dentro de estratos” es positiva. Por ejemplo, en la primera muestr
minos de la varianza de una muestra aleatoria estratificada, en la cada u n o'de los cuatro números 0, 6, 18 y 26 están abajo de la media di
cual, los estratos se componen de las primeras k unidades, las se estrato al que pertenecen. Esto es consistentemente cierto, con unas poca
gundas fe, etc. En nuestra notación, el suscrito j en í/¡,- denota el excepciones, en las primeras cinco muestras sistemáticas. En las últimas cint
estrato. La media del estrato se escribe y ,y. muestras, las desviaciones de la m edia del estrato, son en su mayoría posit
vas. En consecuencia, los términos de los productos cruzados en p lM( son pi
Teorema 8.3. dominantemente positivos. Del Teorema 8.3 esperamos que el muestreo sist.
mático sea menos preciso que el muestreo aleatorio estratificado con ur
unidad por estrato.
V U y) = V - ' ( ^ ) [1 + (n " 1)P~ ] (811)
T A B LA 8 .3 . D atos de 10 M uestras Sis t e m á t ic a s con n = 4,
donde N = fen = 40
Totales 50 58 61 63 75 71 82 88 91 88 72.7
r
M U E S TR E O S IS T E M A T IC O 265
264 TE C N IC A S DE M U ESTRE O
TABLA. 8.4. A n á l is is de V a r ia n z a
cruzados entre las desviaciones desde las medias de estratos sean
negativos para pares de observaciones que están en la misma mues
g.l. s.c. c.m tra sistemática. Por ejemplo, en la primera muestra sistemática, las
desviaciones a partir de las medias de estratos son ahora —4.1,
Entre hileras
(estratos) 3 4828.3 + 4.8, —5.3, +4.9. De los seis productos de pares de desviaciones,
Dentro de estratos 36 485.5 13.49 = £ 2 cuatro son negativos. A grandes rasgos, la misma situación se aplica
totales 39 5313.8 136.25 = S * ‘ en cada muestra sistemática.
Este cambio no afecta Vra„ y V,¡. Con muestreo sistemático se
obtiene un incremento dramático en la precisión, como se ve al com
La varianza V(_y¡y ) se encuentra directamente a partir de los totales de las
muestras sistemáticas como parar los totales de muestra sistemática de la Tabla 8.5 con los de
la Tabla 8.3. Ahora tenemos
V-y= T £ ( f l - ' ñ J= 4 r Í(n y L- n ? ) '
a í- i n K. (- 1
V v = i ? ¿ (73)2+(74)2+■■' + (65) 2- í 7 ? ~ l ='°-46
= ^ [ ( 5 0 ) 2+ (58)’ + •• •+ (88)2- = 11.63
En ocasiones es posible explotar este resultado al numerar las
Para el muestreo aleatorio estratificado necesitamos un análisis de varianza unidades para crear correlaciones negativas dentro de los estratos.
de la población "entre hileras” y "dentro de hileras” . Este se presenta en la Para ello se requiere un conocimiento aproximado de las tendencias
Tabla 8.4. Por lo tanto, las varianzas de las medias estimadas a partir de dentro de la población. Sin embargo, como veremos más adelante, la
muestras aleatorias simples y estratificadas será
situación de la Tabla 8.5 es una en la que resulta difícil obtener una
.. (N -n \ S 2 9 136.25 buena estimación del error estándar de yv a partir de la muestra.
■ai
” V ¿V ) n 10 4 8.4 COMPARACION DEL MUESTREO SISTEMATICO
CON EL MUESTREO ALEATORIO ESTRATIFICADO
Tanto el muestreo aleatorio estratificado como el sistemático son
mucho más efectivos que el muestreo aleatorio simple, pero como se
El éxito del muestreo sistemático con relación al muestreo alea
anticipó, el sistemático tiene menos precisión que el aleatorio estra torio simple o aleatorio estratificado, depende mucho de las propie
tificado.
dades de la población. En algunas poblaciones, el muestreo siste
La Tabla 8.5 muestra los mismos datos, con el orden de las mático es extremadamente preciso y en otras resulta menos preciso
observaciones invertido en los estratos segundo y cuarto. Esto hace que el muestreo aleatorio simple. Para algunas poblaciones y algu
que put, sea negativa, porque logra que la mayoría de los productos nos valores de n, V (y,y ) aun puede incrementarse al tomar una
muestra grande, lo que constituye una desviación sorprendente del
TA B LA 8.5. D a t o s d e l a T a b l a 8 .3 c o n e l O r d e n I n v e r t id o
buen comportamiento. Por lo tanto, es difícil dar un consejo general
en lo s E s t r a t o s I I y IV
respecto a las situaciones donde se aconseja el muestreo sistemá
Números de la muestra sistemática
tico. Es necesario conocer algo sobre la estructura de la población
Medias de
Estratos 1 2 3 4 5 6 7 8 9 10 estratos
para usarlo de manera efectiva.
Se han seguido dos lineamientos en la investigación de este pro
I 0 I I 2 5 4 7 7 8 6 4.1
II
blema. Uno de ellos es comparar los diferentes tipos de muestreo en
17 16 16 15 12 13 10 9 8 6 12.2
III 18 19 20 20 24 23 25 28
poblaciones artificiales, en donde j/t es una función simple de i. El
29 27 23.3
IV 38 38 37 35 32 33 31 31 30 26 33.1 otro es hacer las comparaciones para poblaciones naturales. Algunos
de los resultados principales los presentaremos en las secciones sub
Totales 73 74 74 72 73 73 73 75 75 65 72.7 secuentes.
266 TE C N IC A S DE M U ESTRE O
M U E S TR E O S IS T E M A T IC O 267
8.5 P O B L A C IO N E S E N O R D E N A L E A T O R IO
entonces
El muestreo sistemático se usa en algunos casos, por su conve rtV,y = W'an
niencia, en poblaciones en las cuales la numeración de las unidades
es efectivamente aleatoria. Esto es así en el muestreo a partir de Las condiciones cruciales son que todos los y t tienen la misma me
un archivo arreglado alfabéticamente por apellidos, si la caracterís dia n, esto es, no hay tendencia y no existe correlación lineal entre los
tica que se rriide no tiene relación con el apellido del individuo. No valores de i/¡ y y¡ en dos puntos diferentes. La varianza a," puede cam
habrá entonces tendencia o estratificación en y¿ conforme procede biar de punto a punto en la serie.
mos a lo largo del archivo ni tampoco correlación entre valores ve
Prueba. Para cualquier población finita específica
cinos.
' En esta situación, se esperaría que el muestreo sistemático fuera
v £ (y ,- v )2
esencialmente equivalente al muestreo aleatorio simple y que tuviera
r ra n
la misma varianza. Para cualquier población finita simple, con valo Nn N- 1
res dados de n y k, esto no es exactamente cierto, porque Vn , que se
basa en k grados de libertad, es más bien errática cuando k es pe ahora
queña y puede resultar mayor o menor que Vmn. Hay dos resultados
que muestran, que en promedio, las dos varianzas son iguales. I (y i - Y ) 2= í [ ( . y - p ) - ( Y - n ) ] 2
¡- i ¡=i
Teorema 8.4. Considérense todas las N ! poblaciones finitas las JV
\2 kt /\ s \2
cuales están formadas por las N I permutaciones de cualquier con i-i
junto de números yu y2, .. ., y*. Entonces el promedio sobre estas po
blaciones finitas, Como y i y y ¡, no tienen correlación
B {V „ )= V m (8.16) 1 N
N £ ¡-i
Nótese que Vnn es la misma para todas las permutaciones.
8.7 M E TO D O S P A R A P O B L A C IO N E S QUE
P R E S E N T A N T E N D E N C IA S L IN E A L E S
270 TE C N IC A S DE M U E S TR E O
es
v—^
Número
*—<
»—
& (* ) = /*, (8.34) fe (f e - 1 ). . . 1 fe2
1
«
con
De aquí, el valor promedio de V(yJf), tomado sobre las fe2 combi
pu > pv > 0, siempre que u < v naciones, puede escribirse
La varianza promedio para el muestreo sistemático se denota con Del mismo modo, %V(yv ) puede expresarse como
9Vv = »£ ()> „ - Y )2
t u ( 2 + 2 pk ) + k ( l + p k )J (8.40)
Para esta clase de poblaciones es fácil mostrar que el muestreo
aleatorio estratificado supera al aleatorio simple, pero no se puede De aquí,
establecer un resultado general respecto al sistemático. Dentro de la
clase hay suprapoblaciones en donde el muestreo sistemático supera SV(jJ„) -m u) = ¿ [ I ' u ( p u +p 2k_u- 2pk) ] (8.41)
al aleatorio estratificado, pero también hay suprapoblaciones en don
de el muestreo sistemático es inferior al aleatorio simple para al Pero si
gunos valores de fe.
P u + i + P u -i—2pu (u = 2 , 3 , . . . )
Puede obtenerse un teorema general al suponer además, que el
correlograma es cóncavo hacia arriba. es fácil demostrar que todos los términos dentro del paréntesis son
positivos. Esto completa la prueba. Brevemente, la separación pro
Teorema 8.6. Si además de las condiciones (8 .3 4 ) tenemos medio es fe, tanto para la muestra sistemática como para la estrati
$u2—Pu*i+ Pu-\ —2pu —0 [ « = 2 ,3 ,. . . ,(fen —2)] (8.35) ficada, pero debido a la concavidad, la muestra estratificada pierde
más en precisión, cuando la distancia es menor que fe, de lo que
entonces gana, cuando la distancia excede a fe.
9 v v s w v „ ¿ ¡fs v m (8.36) Quenouille (1 9 4 9 ) ha demostrado que las desigualdades en el
Teorema 8.6 permanecen válidas cuando se relajan dos de las con
para cualquier tamaño de muestra. Además, a menos que 8U2 = 0,
diciones de tal manera que
v. = 2, 3, . . ( fcñ — 2 ),
%Vjy< % V „ (8.37) £(y¡) = P„ %(y¡ ~ p ¡ f = cr2 (8.42)
Cochran (1 94 6) ha demostrado este teorema. En este caso cada una de las tres varianzas promedio se aumenta
en la misma cantidad.
Un bosquejo del argumento para n = 2 ilustra el papel desem
peñado por la condición “cóncava hacia arriba” . En la muestra sis En lo que se refiere a aplicaciones prácticas, varios autores han
temática, los miembros del par distan siempre fe unidades. Por esto, propuesto correlogramas cóncavos hacia arriba, como modelos para
poblaciones naturales específicas. La función pu = tanh (u~vs) la
m U ) = ¡i * 2+ cr2+ 2pkcr2) = ¡<r2( l + pk) (8.38) sugirió Fisher y Mackenzie (1 9 2 2 ) para la correlación entre lluvia
Con la muestra estratificada, hay k posiciones posibles para la uni semanal en dos estaciones meteorológicas las cuales distan una dis
dad tomada de cada estrato, al hacer fe- combinaciones de posiciones. tancia u, la función pu =e~*u por Osbome (1 9 4 2 ) y Matém (1 94 7)
Los números de combinaciones 1, 2, . . (2fe — 1 ) unidades distan para reconocimientos de bosques y uso de la tierra, y la función
tes son como sigue Pu = ( l — u )/ l por Wold (1 93 8) para ciertos tipos de series de tiem
po económicas.
M U E S TR E O S IS T E M A TIC O 277
276 T E C N IC A S DE M U E S T R E O
La varianza promedio para el muestreo sistemático se denota con Del mismo modo, íS V iy ^ ) puede expresarse como
%V)y = m y » - Y ) 2
g,'/(ySy) = ^ p [ Y, u{2 + 2pk) + k (l+ p k)^ (8.40)
Para esta clase de poblaciones es fácil mostrar que el muestreo
aleatorio estratificado supera al aleatorio simple, pero no se puede De aquí,
establecer un resultado general respecto al sistemático. Dentro de la
clase hay suprapoblaciones en donde el muestreo sistemático supera W ( y „ ) - m y „ ) - ¿ [ ‘i 1u(pu - 2f t ) ] (8.41)
al aleatorio estratificado, pero también hay suprapoblaciones en don
de el muestreo sistemático es inferior al aleatorio simple para al Pero si
gunos valores de fe.
Pu+1 "tpu-i —2p„ ( k = 2 ,3 ,...)
Puede obtenerse un teorema general al suponer además, que el
correlograma es cóncavo hacia arriba. es fácil demostrar que todos los términos dentro del paréntesis son
positivos. Esto completa la prueba. Brevemente, la separación 'pro
Teorema 8.6. Si además de las condiciones (8 .3 4 ) tenemos
medio es fe, tanto para la muestra sistemática como para la estrati
5u2=Pu+i+pu- i “ 2pu^ 0 [ h = 2 ,3 .........(fcn—2)] (8.35) ficada, pero debido a la concavidad, la muestra estratificada pierde
más en precisión, cuando la distancia es menor que fe, de lo que
entonces gana, cuando la distancia excede a fe.
(8.36) Quenouille (1 9 4 9 ) ha demostrado que las desigualdades en el
Teorema 8.6 permanecen válidas cuando se relajan dos de las con
para cualquier tamaño de muestra. Además, a menos que = 0,
diciones de tal manera que
u = 2, 3, . . ., (k ii - 2 ),
< %V„ (8.37) %{y¡) = M., %(y¡ ~ M¡)2 = o-,2 (8.42)
Cochran (1 94 6) ha demostrado este teorema. En este caso cada una de las tres varianzas promedio se aumenta
en la misma cantidad.
Un bosquejo del argumento para n = 2 ilustra el papel desem
peñado por la condición “cóncava hacia arriba” . En la muestra sis En lo que se refiere a aplicaciones prácticas, varios autores han
temática, los miembros del par distan siempre fe unidades. Por esto, propuesto correlogramas cóncavos hacia arriba, como modelos para
poblaciones naturales específicas. La función pu = tanh (u~3/5) la
%V(y,y) = 3(cr2+ <r2+ 2pk<r2) = |cr2( l + pk) (8.38) sugirió Fislier y Mackenzie (1 9 2 2 ) para la correlación entre lluvia
Con la muestra estratificada, hay fe posiciones posibles para la uni semanal en dos estaciones meteorológicas las cuales distan una dis
dad tomada de cada estrato, al hacer fe- combinaciones de posiciones. tancia u, la función pu =e~ÁU por Osbome (1 94 2) y Matérn (1947)
Los números de combinaciones 1, 2, . . ., (2fe — 1) unidades distan para reconocimientos de bosques y uso de la tierra, y la función
tes son como sigue Pu = ( i — u )/ l por Wold (1 9 3 8 ) para ciertos tipos de series de tiem
po económicas.
276 TE C N IC A S DE M U ESTRE O M U E S TB E O S IST E M A TIC O 277
278 TE C N IC A S DE M U E S TR E O
donde f c - 4 e i = 1, 2 .......... 4n. Las observaciones sucesivas en la
TABLA 8.7. P r e c is ió n R e la tiv a d e M u e s tre o A le a t o r io E s t r a t ific a d o población son
y S is t e m á t ic o
("i +a ), m, ( m - a ) , m, (m + a ), m, ( m - a ), m,. . .
Precisión relativa de
Si i - 1 se escoge como el primer miembro, todos los miembros de
sistemático a estratificado
la muestra sistemática tienen el valor (m + a ). Para cada una
Datos Intervalo
de k v ,jv ,y de las otras tres posibles elecciones de i, todos los miembros tienen
V J V,y
los valores m, (m — a ), o m , respectivamente. Entonces, a partir
2-20 2.99 5.68 de una sola muestra no tenemos manera de estimar el valor de a
Altitudes
Porcentaje de área pero el valor real de la varianza de muestreo de la media de la mues
(4 tipos de cubierta) --- 4.42
tra sistemática es a-/2. La ilustración muestra que es imposible
1.83
Porcentaje de área (abeto Douglas) construir una varianza estimada que no tenga sesgo si hay variación
2-24 2.42 4.23 periódica.
Temperatura del suelo (1 2 p lg )
Temperatura del suelo (4 p lg ) 4-24 1.45 2.07 Estos resultados no significan que nada pueda hacerse. Exclu
Temperatura del aire 4-24 1.26 1.65 yendo el caso de la variación periódica, podemos saber bastante so
bre la estructura de la población como para poder desarrollar un
3-16 1.37 1.90
Papas modelo matemático que represente adecuadamente el tipo de varia
Volumen de madera ción presente. Podremos entonces desarrollar una fórmula para la
(M onte Stuart) 2-32 1.07 1.35
varianza estimada que es aproximadamente sin sesgo para este mo
Volumen de madera
2-24 1.19 1.44 delo, aunque pudiera ser muy sesgada para otros modelos. La deci
(M onte Black)
Volumen de madera
sión de usar uno de estos modelos queda a juicio del muestreador.
(Dehra D un) 2-32 1.39 1.89 A continuación se presentan algunos modelos simples junto con
Plántulas de madera dura 14 --- 1.89 sus varianzas estimadas correspondientes. N o se ofrecen pruebas.
L4-24 --- 2.22
Plántulas de coniferas Los modelos más simples se aplican a poblaciones en las cuales
12-22 0.93
Coniferas trasplantadas y¡ se compone de una tendencia más una componente “ aleatoria”.
Entonces
(datos de los almácigos forestales), el único que no muestra ganan y¡ =p.' + e,
cia alguna es e l de las coniferas trasplantadas, las cuales son más donde m es alguna función de i. Para la componente aleatoria, su
viejas y más uniformes que las plántulas. ponemos que hay una superpoblación en la cual
£ (*,) = 0, %(€?) = *?, ’¡S(e¡ej) = 0 (i* j)
8.11 E S T IM A C IO N D E L A V A R IA N Z A A P A R T IR Una fórmula S,¥* propuesta para la varianza estimada se denomina
DE U N A S O L A M U E S T R A insesgada si
A partir de los resultados de una muestra aleatoria simple con m s , y2) = w ¡y
n > 1, podemos calcular una estimación insesgada de la varianza esto es, si es sin sesgo para todas las poblaciones finitas que se pue
de la media de la muestra, siendo esta estimación insesgada cual
den extraer de la superpoblación.
quiera que sea la form a de la población. Dado que una muestra sis
temática puede considerarse como una muestra simple aleatoria con
Población en Orden “Aleatorio”
n = 1, esta útil propiedad no prevalece en el caso de una muestra
sistemática. Como ilustración considérese el ejemplo de la “curva /inconstante (/ = 1 , 2 ,..., N )
sinusoidal”. Sea
iri
y¡ = m +a sen —
280 TE C N IC A S DE M U E S TR E O
M U E S TR E O S IST E M A TIC O 281
la propiedad del cuadrado latino, pues cada letra aparece tres veces
en una columna y dos veces en las otras columnas, pero se acerca
a esta propiedad tanto como es posible.
Yates (1 96 0) que denomina estos arreglos muestreo reticular,
discute su uso en muestreo de dos y tres dimensiones. En tres di
mensiones, cada fila, columna y nivel vertical, puede representarse
en la muestra al elegir p unidades de entre las p3 de la población.
Con p2 unidades en la muestra, cada una de las p= combinaciones
de niveles, filas y columnas, de filas y alturas verticales, y de co
lumnas y alturas verticales, se podrá representar. Patterson (1954)
(b ) M u e s tra n o a lin e a d a
ha investigado los arreglos que dan una estimación insesgada del
error.
F ig . 8.4. Dos tipos de muestra sistemática bidimensional
8.14 RESUM EN
Nueva evidencia de la superioridad de una muestra no alineada
se obtiene de la experiencia en un diseño experimental en el que se Las muestras sistemáticas son de extracción y ejecución conve
encontró que el cuadrado latino es un método preciso para disponer niente. En la mayoría de los estudios que hemos reportado en este
tratamientos en un campo rectangular. El cuadrado latino de 5 X 5 capítulo, sobre poblaciones artificiales y poblaciones naturales pu
de la Fig. 8.5a puede verse como una división del campo en cinco dieron compararse favorablemente en lo que a la precisión respecta
muestras sistemáticas, una para cada letra. Existe evidencia de que con las muestras aleatorias estratificadas. Sus desventajas son que
este cuadrado particular llamado el cuadrado latino del “movimiento pueden dar una precisión mediocre cuando se presente una perio
del rey" es un tanto más preciso que un cuadrado elegido al azar, de dicidad insospechada, y que no se conoce aún un método confiable
5 X 5 , probablemente porque no hay alineación en las diagonales, para la estimación de V(yíy) a partir de los datos de muestra.
ni en las filas, ni en las columnas. A la luz de estos resultados podemos recomendar el muestreo
El principio del cuadrado latino lo utilizó Homeyer y Black sistemático en las situaciones siguientes.
(1 94 6) al muestrear campos de avena rectangulares. Cada campo
1. Cuando el ordenamiento de la población es esencialmente alea
contenía 21 lotes. Las tres muestras sistemáticas posibles se denotan torio o contiene a lo más una estratificación débil. Aquí, el muestreo
con A ,B y C, respectivamente, en la Fig. 8.5b. Este arreglo con una
sistemático se usa por conveniencia y se esperan pocas ganancias
de las letras elegidas al azar en cada campo dio un incremento en de precisión. Se cuenta con estimaciones muéstrales del error que
precisión aproximado al 25% , sobre el muestreo aleatorio estratifi son razonablemente insesgadas (Sec. 8.11).
cado con dos filas como estratos. El arreglo no satisface exactamente
2. Cuando se emplea una estratificación con numerosos estratos
y se toma una muestra sistemática independiente en cada estrato.
A B C D E A B C Los efectos de las periodicidades ocultas tienen tendencia a neutra
D E A B C B C A lizarse en esta situación y puede obtenerse una estimación del error
B C D E A C A B que se sabe es una sobreestimación (Sec. 8.12). En forma alterna
E A B C D A B C
C D E A B B C A tiva, podemos usar la mitad de los estratos y tomar dos muestras
C A B sistemáticas, con inicios aleatorios independientes en cada estrato.
A B C Este método da una estimación insesgada del error.
( O C u a d ra d o la tin o d e ( b ) D iseñ o s istem á tic o
3. Para unidades conglomeradas de submuestreo (Cap. 10). En
•‘ m o v im ie n to d e l r e y " p a ra u n c a m p o re c ta n g u la r
3X7 este caso puede obtenerse una estimación casi insesgada o insesgada
del error de muestreo en la mayoría de las situaciones prácticas. Es
Fie. 8.5. Dos diseños sistemáticos basados en el cuadrado latino te es un uso bastante común del muestreo sistemático.
286 TE C N IC A S DE M U E S TR E O M U E S TR E O S IS T E M A T IC O 287
VI E J E R C I C I O S
o ^ r - o v ^ r ~ ' 0 ^ , s 'rtOOTl' ' í o ' QOOO£7' 2 ' 0 " O
<N
8.1. Los datos en la Tabla (Pág. 2 8 6 ) son los números de plántulas por
cada pie de era, en una era de 200 pies de largo.
rl Encuentre la varianza de la media de una muestra sistemática de cada
'l-
vigésimo pie. Compare ésta con las varianzas para ( a ) una muestra aleatoria
simple, ( b ) una muestra aleatoria estratificada con dos unidades por estrato,
( c ) una muestra aleatoria estratificada con una unidad por estrato. Todas
las muestras tienen n = 10. [!({/ ; — Y ) 2 = 23 601.]
s 8.2. Una población de 360 viviendas (numeradas de 1 a 360) en Baltimore
se ordena alfabéticamente en un archivo de acuerdo con el apellido del jefe
de familia. Viviendas en las cuales el je fe no es blanco ocurren en los nú
meros siguientes: 28, 31-33, 36-41, 44 , 45, 47, 55, 56, 58, 68, 69, 82, 83, 85,
o 86, 89-94, 98, 99, 101, 107-110, 114, 154, 156, 178, 223, 224, 296 , 298-300,
1-
302-304, 306-323, 325-331, 333, 335-339, 341, 342. (L as viviendas de no
1 blancos muestran algún "agrupamiento'' debido a la asociación entre apellido
5 y color.)
Compare la precisión de una muestra sistemática l-en-8 con una muestra
cu O
T3 P- 2 aleatoria simple del mismo tamaño para estimar la proporción de viviendas
O I o en las cuales el jefe de fam ilia no es blanco.
s 8.3. Un vecindario tiene tres comunidades compactas, que consisten res
pectivamente, de personas de descendencia anglosajona, polaca e italiana.
£ H ay un directorio actualizado. En él, las personas de una casa están enlistadas
en el siguiente orden: marido, esposa, hijos (p o r edades), otros. Las casas
son enlistadas en orden a lo largo de las calles. El número promedio de per
sonas por casa es de cinco.
o
30
¡
La elección es entre una muestra sistemática de cada quinta persona en
el directorio y una muestra aleatoria simple del 20% . ¿Para cuáles de las
siguientes variables espera usted que la muestra sistemática sea más precisa?
s ( a ) Proporción de personas de descendencia polaca, ( b ) proporción de varones,
i ( c ) proporción de hijos. Dé sus razones.
TT 8.4. En un directorio de 13 casas en una calle, las personas están en
listadas como sigue: Ai = varón adulto, F — m ujer adulta, m = hijo varón,
o 2 S : = 8 8 2 2 S 2 ^ 8 2 S ñ 2 ^ f = hija.
Vivienda
o
o — ® ' c ' ° ! q S 2 “ Ñ r l 2 S S = 2 r' a ? H So. ■e- 1 2 3 4 5 6 7 8 9 10 11 12 13
r'.1
4) M M M M M M M M M M M M M M
13 O
F F F F F F F F F F F F F
f f m m f í m m m f f
m /ti ! m m í f f m
288 TE C NIC AS DÉ M U E S TR E O
Compare las varianzas dadas por una muestra sistemática de una de cada
cinco personas y una muestra aleatoria simple del 20% para la estimación
de ( a ) la proporción de varones, ( b ) la proporción de hijos, ( c ) la propor
ción de personas en hogares de profesionales (viviendas 1, 2, 3, 12 y 13 se
describen/como profesionales). ¿Respaldan estos resultados sus respuestas
C A P IT U L O 9
del Ejercicio 8.3? Para la muestra sistemática numere cada columna hacia
abajo y luego vaya hacia la parte superior de la siguiente columna.
8.5. En el Ejercicio 8.1 podemos estimar V (y,y) ( a ) al considerar cada
muestra sistemática como una muestra aleatoria simple, ( b ) al pretender que
cada muestra sistemática l-en-20 está compuesta de dos muestras sistemá
ticas l-en-40 con inicios al azar separados. Para cada método compare el
promedio de las varianzas estimadas con la varianza real de y,r
Muestreo por Conglomerados,
8.6. En una población que consiste de una tendencia lineal (Sec. 8.6)
demuestre que una muestra sistemática es menos precisa que una muestra de una Etapa:
aleatoria estratificada con estratos de tamaño 2fe y dos unidades por estrato
si n > (4b + 2 )/(fe + 1).
8.7. Una población bidimensional con una tendencia lineal se puede Conglomerados del Mismo Tam año
representar por la relación
cubre una ciudad más uniformemente que una muestra de 20 m an V' 2_i¡¡_;
v = /v¡L C2 N 2S 2 (9.1)
zanas con un promedio de 30 viviendas por manzana. Pero se ten nu V
drán mayores costos de campo para localizar 600 viviendas y des
El costo de tomar n« unidades Cunu = CUNU2S 2/ V. Como N J4 U- cons
plazarse entre ellas que para localizar 20 manzanas y visitar todas
tante para los diferentes tipos de unidad, el costo es proporcional a
las casas de dichas manzanas. A l cotejar costo contra precisión, la
unidad mayor puede resultar más conveniente. CuS 2/ M 2. Por otro lado, si se especifica el costo C, n„ = C/C„ y en
(9 .1 ), V c c CUS 2/ M 2. Esto termina la demostración.
Se puede seleccionar racionalmente entre los dos tipos o tama
ños de unidades mediante el conocido principio de elegir la unidad Corolario 1. Si definimos la precisión neta relativa de una uni
que da la varianza más pequeña para un costo dado, o el menor
dad, como inversamente proporcional a la varianza obtenida para
costo para una varianza prefijada. Como en muchas decisiones
costo fijo, el Teorema 9.1 se puede enunciar como
prácticas, puede haber factores imponderables: un tipo de unidad
puede ofrecer alguna conveniencia especial o desventaja que es M 2
precisión neta relativa ce- ~ 2 (9-2)
difícil incluir en el cálculo de los costos. A l muestrear un cultivo CU3U
en crecimiento, algunas experiencias han sugerido que una unidad
Corolario 2. En el análisis de la varianza, las varianzas por uni
pequeña puede dar estimaciones sesgadas debido a la incertidumbre
entre las fronteras exactas de la unidad. Homeyer y Black (1 9 4 6 ) dades de diferentes tamaños suelen calcularse en lo que se llama
encontraron que las unidades de 2 X 2 pies, daban un rendimiento una base común, que usuaimente es la aplicable a la unidad más
de avena superior en 8% a las unidades de 3 x 3 pies, posiblemente pequeña. Para poner las varianzas sobre una base común, la varianza
porque los muestreadores tendían a situar en los casos dudosos las Su2 entre los totales de unidades de tamaño M u se divide por Aí„. Sean
plantas de la frontera dentro de la unidad. Sukhatme (1 94 7) cita S2
resultados semejantes para cultivos de trigo y arroz. Sli'2= ~ = varianza entre totales de unidades ( sobre una base común)
Mu
En este capítulo se trata el caso en e l que cada unidad conglo C
merada contiene el mismo número de elementos o subunidades. C Jcc- —■= costo relativo para tomar un determinado volumen de
“ muestra
Mu = tamaño relativo de la unidad Si las diferencias en los costos para tomar la muestra se ignoran,
o sea si Cu' es constante, la precisión neta relativa con la u-ésima
Su- = varianza entre los totales de unidades
unidad a 1/S„'5. Los factores deff de Kish para las unidades diferen
C„ = costo relativo para medir una unidad. tes (Sec. 4.11) son, por tanto, proporcionales a las S,/- = suz/Mu-
Entonces, el costo relativo para varianza especificada o la varianza Ejemplo. Los datos de Johnson (1 9 4 1 ) para una era de plántulas de pino
relativa para costo especificado azcuS 2/ M 2. blanco proveen un ejemplo simple. La era tenía seis hileras de 434 pies de
largo cada una. Hay muchas maneras de dividir la era en unidades de mues
Prueba. Supóngase que V es la varianza especificada del total treo. Los datos para cuatro tipos de unidades se muestran en la Tabla 9.1.
estimado de población. Para el tipo u-ésimo de unidad la estimación Dado que la era se contó completamente, los datos son correctos en lo que se
es Nuyu con varianza refiere a valores de población.
292 TE C N IC A S DE M U E S T llE O m u estreo por c o ng lo m er ad o s, de u n a etapa : ... 293
Las unidades fueron El Teorema 9.1 y sus corolarios siguen siendo válidos para mues
treo estratificado con asignación proporcional si todos los estratos
un pie de una sola hilera
son del mismo tamaño y si S„J, Su'3 representan varianzas promedio
dos pies de una sola hilera
dentro de los estratos. Esto es así, en las condiciones enunciadas
un pie del ancho de la era
porque la varianza del total de población estimado ignorando la cpf
dos pies del ancho de la era
es N-S^/n y, por lo tanto, toma la misma forma que en el muestreo
aleatorio simple. El Teorema 9.1 no es válido para tipos de mues
Con las primeras dos unidades se supuso muestreo estratificado por hile
ras. de tal manera que S„J representa las varianzas dentro de hileras. Para treo más complicados.
las dos últimas unidades se supuso muestreo aleatorio simple. Los resultados anteriores se dan para ilustrar el procedimiento
Ya que el costo principal es el de localizar y contar las unidades, los general. Las comparaciones entre unidades deben hacerse siempre
costos se estimaron mediante un estudio de tiempo (ú ltim a hilera de la Ta para la clase de muestreo que se usa en la práctica o bien, si esto
bla 9.1). Con las unidades mayores, se puede contar una muestra más grande aún no se ha decidido, para las clases de muestreo que se consideren.
en 15 mln. por gastarse menos tiempo para ir de una unidad a la otra. Los cambios en el método de muestreo o de estimación alterarán las
La cantidad a estimar es e l número total de plántulas por era. En la precisiones netas relativas de las diferentes unidades. Aun con un
notación del Teorema 9.1, la Tabla 9.1 da los valores de M u y Sus. Los valores
método fijo de muestreo y de estimación, las precisiones netas rela
relativos do Cu, expresados como el tiempo requerido para contar una unidad,
son como sigue: tivas varían con e l tamaño de la muestra si el costo no es una
función lineal del tamaño, o si el tamaño es tal que no se puedan
1 pie 2 pies 1 pie 2 pies
ignorar las cpf.
hilera hilera era era Generalmente hay más de una característica a considerar. Un
(en tiempos de 15 minutos) ¿ t é fg iS posible enfoque es fija r e l costo total y encontrar las precisiones
netas relativas para cada tipo de unidad y cada característica. A
menos que un tipo sea uniformemente superior, se necesitará tomar
Según el Teorema 9.1, Corolario 1, las precisiones netas relativas se calcu una decisión de compromiso que dé la ponderación principal a las
lan en la Tabla 9.2.
características más importantes.
La última línea de la Tabla 9.2 da las precisiones relativas cuando se toma En vista de los numerosos factores que influyen los resultados,
la de la unidad más pequeña como 100. La unidad de 1 pie de era parece
ser la mejor. el estudio de un tamaño óptimo de unidad en una encuesta muy
extensa es una gran tarea. Jessen (1 9 4 2 ) describe un buen ejemplo
Las varianzas entre unidades, expresadas en una base común. También
es conveniente observar. Los valores de Su'~- — S * / M u, aplicables a un solo de muestreo agrícola. Un resumen de sus resultados es el que apa
pie de hilera son, respectivamente, 2.537, 3.373, 3.849, 5.713. Note que estas rece en la Tabla 9.3. En él se comparan cuatro tamaños de unida
varianzas aumentan consistentemente al aumentar el tamaño de la unidad. des, que son un cuarto de sección, una media sección, una sección,
Este resultado frecuentemente (aunque puede haber excepciones). Dado que y un bloque que consiste en dos secciones contiguas. Las secciones
la precisión relativa neta e c l/CU'SU'2, el costo de tomar una muestra dada
en una área de una milla cuadrada, contienen en promedio un poco
M U E S TR E O PO R CONGLOM ERADOS, DE U N A ETAPA: 295
294 TE C N IC A S DE M U E S TR E O
TA B L A 9.3. E r r o r e s E s t á n d a r E s t im a d o s ( % ) p a ra C u a tro
de la población. Sin embargo, a excepción de poblaciones pequeñas,
T a m a ñ o s d e U n id a d , c o n M u e s t r e o A le a t o r io S im p le raramente se puede efectuar un reconocimiento sólo con propósitos
comparativos. La información sobre la unidad óptima usualmente se
Unidades
Items 5/4 5/2 5 25 obtiene como un ingenioso subproducto de una encuesta cuyo pro
mejores
pósito principal es obtener estimaciones.
Número de cerdos 5.0 4.9 5.3 6.2 5/2
Núm ero de caballos
Suponga que en una encuesta, cada unidad se puede dividir
3.4 3.3 3.6 4.2 5/2
Número de borregos 17.4
en Ai unidades menores. En lugar de registrar solamente los totales
15.7 14.9 14.3 25
Número de pollos 3.0 3.0 3.3 3.8 5/4,5/2
para cada unidad “ grande” en la muestra, registramos los datos
Número de huevos producidos ayer 5.7 5.2 4.9 4.7 25 por separado para cada una de las M unidades menores. Entonces,
puede hacerse una comparación entre las precisiones de las unida
Número de ganado 4.7 4.6 4.8 5.5 5/2 des grandes y las pequeñas. Primero se supondrá una muestra
Número de vacas ordeñadas 3.7 3.6 3.8 4.4 5/2 aleatoria simple de tamaño n.
Número de galones de leche 4.4 4.2 4.4 4.9 5/2
Ingresos por productos lecheros 5.5 5.2
El análisis de la varianza en la Tabla 9.4 se puede calcular a
5.4 6.0 5/2
Número de acres de las granjas 2.9 2.8 3.0 3.5 5/2 partir de la muestra.
La varianza estimada de una unidad grande (con base en una
Número de acres de m aíz 3.7 3.5 3.8 4.4 5/2 unidad m enor) es Sb'. Podría pensarse que una estimación apro
Número de acres de avena 4.6 4.8 5.6 7.0 5/4
Rendimiento de maíz
piada de la varianza de una unidad menor sería el cuadrado medio
1.6 1.7 2.0 2.5 5/4
Rendimiento de avena 1.6 1.5
entre todas las unidades menores en la muestra, esto es,
1.6 1.8 5/2
Gastes por alimentos comerciales 12.6 13.6 16.7 21.8 5/4 , (n -lW + n W -D s J
Gastos totales, operador ’ ¡s ím (9-5)
7.8 8.1 9.6 12.0 5/4
Ingresos totales, operador 6.2 6.5 7.7 9.8 5/4 Esta estimación, aunque a menudo satisfactoria, está ligeramente
Ingreso neto líquido, operador 6.8 6.9 7.8 9.5 5/4 sesgada porque la muestra no es una muestra aleatoria simple de
menos que cuatro granjas. En esta comparación se especificaron el unidades menores, dado que éstas se muestran en grupos contiguos
costo de campo total SI 000, la extensión del cuestionario (60 de Ai unidades.
min para llenarlo) y el costo de viaje [5 cts. ( U S A ) por milla], Una estimación insesgada se obtiene a partir de la muestra, al
porque las precisiones netas relativas cambian al alterar cualquiera construir un análisis de la varianza como en la Tabla 9.5 para la
de estas variables. I-os costos están al nivel de 1939. población total, la cual contiene N unidades mayores y NAÍ unida
Los datos de la Tabla son los errores estándar relativos (en por des menores.
centaje) de las medias estimadas por granja para 18 ítems. N o hay
mejor unidad para todos los artículos. La media sección y cuarto T A B L A 9.4. A n á l is is de l a V a r ia n z a d e l o s D ato s de l a M uestra ( con
de sección, sin embargo, son superiores a las unidades más grandes Base e n una U n id a d P e q u e ñ a )
para todas las características, excepto dos de ellas, al haber poco
que elegir entre las secciones medias y cuartas. La media sección g l. c.m.
probablemente sería preferible porque el problema de identificar con
exactitud las fronteras es más fácil. Entre unidades grandes (« - O *b
TABLA 9.5. A n á l i s i s d e ¡l a V a r i a n z a p a r a l a P o b l a c i ó n T o t a l Con muestreo estratificado, las varianzas para las unidades
( c o n B a s e e n u n a U n id a d P e q u e ñ a )
grandes y pequeñas se pueden estimar separadamente en cada es
trato al usar estos métodos y luego sustituirse en la fórmula
g l- c.m. apropiada para la varianza de la estimación a partir de una mues
tra estratificada.
Entre unidades grandes N - 1 ■V
Ejemplo. Los datos son de una muestra de fincas tomada en Carolina
Entre unidades pequeñas
del Norte en 1942 para estimar los empleos rurales (Finkner, Morgan, y
dentro de unidades grandes N (M - 1) SJ
Monroe, 1943). E l método de extracción de la muestra fue localizar puntos
al azar en el mapa y escoger como unidades de muestreo las tres fincas más
Entre unidades pequeñas M (N — 1)S„2 + N (M - \ )S ¿ cercanas a cada punto. El método n o se recomienda ya que una finca grande
NM - 1
en la población NM - 1 tiene una probabilidad mayor de inclusión en una muestra que una finca
pequeña y una finca aislada tiene una probabilidad mayor que otra en una
área densamente explotada. Cualesquiera efectos de este sesgo serán igno
De acuerdo con su definición, la varianza de la población entre rados.
A partir de los datos de las muestras correspondientes a fincas indivi
unidades pequeñas es dada por la última linea de la Tabla, esto es, duales, el grupo de tres fincas se puede comparar con la finca individual
como unidad de muestreo. La característica escogida es e l número de tra
„ 2_ ( N - l ) S b2+ N ( M - l ) S w2
bajadores asalariados. La muestra se estratificó, siendo el estrato un grupo
s ------------ 1W = 1 (9’6) de territorios similares en la densidad de su población de fincas y la razón
tierra de pastoreo a tierra de labranza. Dado que la fracción de muestreo
Con el muestreo aleatorio simple, S¡,2 en la Tabla 9.4, es una esti
fue de 1.9% , puede ignorarse la cpf.
mación insesgada de S¡,2 (sacado de la Sec. 2.3). Puede mostrarse
Ai 2c 2
fácilmente que Sw- es una estimación insesgada de S,/. De esta
manera, una estimación insesgada de la varianza S2 entre todas las h nh
unidades pequeñas en la población es El procedimiento correcto es calcular N 42Ss2/n¡, separadamente dentro de
cada estrato para los dos tipos de unidad, usando un análisis de varianza
(N - \ )s b2+ N ( M - l ) s w2 y la expresión (9 .8 ). Usaremos un procedimiento má6 simple como una
aproximación.
N M -l V - '’ Los estratos conteníán en general entre 300 y 450 fincas y ya sea dos o
Claramente, esta expresión es casi la misma que la expresión tres unidades de tres fincas se tomaron dentro de cada estrato, para hacer
el muestreo aproximadamente proporcional. Asumiendo proporcionalidad, esto
más simple
es, rLh/N k = n/N, podemos escribir
v ( y j = - i N A 2 i — s„2
Si t i > 50, (9 .5 ) para s2 también se reduce a (9 .8 ), de tal manera Y si suponemos además, que las Sh: no varían grandemente entre estratos
que s2 es una aproximación satisfactoria a S- para n > 50.
de tal manera que se pueden reemplazar por su promedio Sh2.
Las dos estimaciones s&2 (para la unidad grande) y S~- (para Las estimaciones de S,,2 se obtienen del análisis de varianza en la Tabla
la unidad pequeña) están en una base común y pueden sustituirse 9.6, el cual se realizó con base en una sola finca.
en el Teorema 9.1., Corolario 2.
T A B L A 9.6. A n á l is is de V a r ia n z a de la M uestra (N úmero de
Si la muestra es grande, las unidades menores pueden medirse T r a b a j a d o r e s P agados c o n Ba s e e n una so la F in c a )
dentro de una submuéstra aleatoria de las unidades mayores (d i
gamos 100 de cada 600). Alternativamente, podrían medirse dos g j. c.m.
unidades pequeñas tomadas al azar de cada unidad mayor. Simul Entre unidades dentro de estratos 825 6.218
táneamente pueden investigarse unidades pequeñas de más de un Entre fincas dentro de unidades 2768 2.918
tamaño, siempre que se tomen datos que provean una estimación
insesgada de S„2 para cada unidad pequeña. Entre fincas dentro de estratos 3593 3.676
M U E S TR E O PO R C O NGLOM ERAD O S, D E U N A E T A P A : 299
298 TE C N IC A S DE M U ESTB EO
Para e l grupo de tres fincas, el cuadrado medio sh32 = 6.218 sirve como Prueba. Supongamos que y¡ denota el total para el i-ésimo
estimación de Sk2 basado en una sola finca. Para las fincas individuales, usando
(9 .8 ) tenemos conglomerado y y =■ 2—4 y ^ n- P °r los Teoremas 2.1 y 2.2, y es una
i t = 6:218+ 2(2.918) = 40i8 estimación insesgada de Y con varianza,
a -/ )X (»-ñ 2
Por el Teorema 9.1, Corolario 2, las dos cifras 6.218 para e l grupo de tres
fincas y 4.018 para la finca individual, indican las varianzas relativas obte W n N- 1
nidas para un tamaño total de muestra fijo. E l grupo de fincas da cerca de dos
Pero y = My y Y = m Y. Por lo tanto, y es una estimación insesgada
tercios de la precisión de una sola finca. Consideraciones de costos probable
mente harían que el resultado fuera más favorable para la unidad de tres de Y con varianza
fincas.
iz f m z H (9.1D
nM N —1
9.4 V A R IA N Z A EN T E R M IN O S D E L A C O R R E L A C IO N
D E N T R O D E C O N G LO M E R A D O S Pero
Las fórmulas para las varianzas a menudo se expresan en tér (y¡ - Y ) = (y „ - Y ) + (y ¡2- Y ) + •••+ (y*, - í )
minos del coeficiente de correlación, p , entre elementos del mismo
conglomerado. Este procedimiento ya se usó para el muestreo sis Elevando al cuadrado y sumando sobre los N conglomerados,
temático (Sec. 8.3). N N M N M „ ,
Sea yn el valor observado para el ;-ésimo elemento de la t-ésima X (y¡ — Y )2= I X (y,,- - Y) + 2 £ I (y „ - Y )(y* - f)
unidad y sea yt el total de la unidad. En muestreo conglomerado no I i i i /<*
hay porque distinguir entre las dos clases de promedios: la media = (N M - 1 )S2+ (M - 1 )(N M - 1)pS 2
por unidad Y - ly ¡/ N y la media por elemento Y = Xy¡/NM =» Y/AÍ.
= ( N M - l ) S 2[ l + ( M - \ ) p ] (9.12)
La varianza entre elementos es
z< *-f)2 al usar la definición de p en (9 .9 ). Al sustituir en (9 .1 1 ) para
c2= lA_______ V ( y ), esto da
N M -1
El coeficiente de correlación intraconglomerados p se definió (Sec.
8 .3 ) como
Puede darse una expresión alternativa para P• Sea S62 la varianza M vista como una variable continua. Este problema requiere un
entre totales de conglomerados, con base en una sola unidad. En método para predecir la varianza S b2 entre unidades en la población,
tonces como función de M. Por el análisis de la varianza, S62 puede verse
que es ( a ) la varianza S2 entre todos los elementos de la población
Z ( y ¡ - Y ) 2 = (N -1 )M S „ 2
y ( b ) la varianza S,02 entre elementos que están en la misma unidad.
La Ec. 9.12 puede escribirse como Nuestro método es el de predecir Sw2 y S2 y encontrar S¡,2 por el
análisis de la varianza.
(TV- l)M Sb2= ( N M - 1)S2[ 1 + ( M - 1)p ]
Los datos de muestra producen estimaciones de S" y S»* para
de tal manera que el tamaño de unidad realmente usado. Como S2 es la varianza entre
elementos, no la afectará el tamaño de la unidad. Sin embargo,
(N - l)M S b2- (N M - 1)S2 Sb2- S 2
Sw5 sí se verá afectada. Podría esperarse que aumentara al aumentar
P (N M - 1 )(M - 1 )S 2 (M - l)5 2 { }
el tamaño de la unidad. Si las unidades grandes a examinar poco
cuando los términos en 1/N puedan ignorarse. difieren en tamaño de la unidad realmente usada, una primera
aproximación será considerar Sw2 constante, al usar la estimación
Es conveniente notar el valor del cuadrado medio intraconglo-
que proporcionan los datos de muestra. Una investigación realizada
merado
por McVay (1 9 4 7 ) sugiere que esta aproximación a menudo
puede ser satisfactoria.
S j = E I (y¡/ ~ y ¡) 2/ N ( M - 1) (9.14)
Como mejor aproximación, Jessen (1 9 4 2 ); Mahalanobis (1944)
Por el análisis simple de la varianza y Hendricks (1 9 4 4 ) intentaron desarrollar una ley general para
predecir como cambia S„2 con respecto al tamaño de la unidad. En
(N M - 1)S2= Z (y¡— f f / M + l l t y - y ,)2 muchas encuestas agrícolas, STO2 pareció estar relacionada con Ai
1 i i por la fórmula empírica
= ( N M - 1 )52Í 1+ ( M _ l )p ]+ N { M _ 1)Sw2 Sw2= A M s ( g > 0) (9.16)
log S„ 2- log A + g log M (9.18) Para determinar el tamaño óptimo de unidad, encontramos M
e incidentalmente n, que minimiza V para un C fijo. La solución
lo gS 2= log A + g log(íVM) (9.19) general es complicada, aunque su aplicación a un ejemplo numé
La fórmula para S»2 viene a ser, a partir de (9 .1 7 ) rico no presenta gran dificultad.
Mediante alguna manipulación podremos obtener la ecuación
Sb2 = A M * [M N S- ( M - 1)] (9.20) que da la M óptima. Primero se resuelve la ecuación de costo (9.21)
Este método no da una verificación de la corrección de (9 .1 6 ), como una cuadrática en s/ tT Esto da
que podría ser bastante válida para pequeños valores de M , pero
2 c ]M v /ñ / 4 C c ,M \ ,/2
errática para un valor tan alto como NM.
~ 7 T = \1 + — ) <9-23>
La fórmula 9.16 se presenta como ejemplo de la metodología y
La ecuación a minimizar es
no como regla general. Quien se enfrente a un problema similar,
deberá construir y probar cualquier tipo de fórmula que parezca la
C + A V = c¡Mn + c2^Ti + A V
más apropiada para su material. En algunos casos, log S¡2podría ser
una función lineal de M, como lo sugirió Fairfield Smith (1938) Al diferenciar y notar que dV/dn = — V/n, obtenemos las ecuacio
para datos de rendimiento. nes:
A dV AV
c \M+\c 2n ' x,z = “ ~ ~ = (9.24)
9.6 U N A F U N C IO N D E COSTOS Bn n
Si sustituimos por \ fñ de (9 .2 3 ), obtenemos, después de alguna porción en la clase C en el i-ésimo conglomerado. Se toma una simple
simplificación, muestra aleatoria simple de n conglomerados y se usa el promedio
p de las pi observadas en la muestra como la estimación de la pro
porción P en la población.
Se recordará (Sec. 3.12) que no podemos usar la teoría binomial
A l desarrollar completamente el lado izquierdo de esta ecuación y para encontrar V ( p ) sino que debemos aplicar la fórmula para las
cambiar de signo en ambos lados, encontramos variables continuas a las pi. Esto da
1)3, _ / 4C c M C ' » N
S 2- ( M - l ) A M g~l 1 c 22 ) (9'28)
Esta ecuación da la M óptima. El lado izquierdo no involucra nin (929>
guno de los factores de costo, y depende solamente de la forma Alternativamente, si tomamos una muestra aleatoria simple de nM
de la función de la varianza. Puede verse que ambos lados son elementos, la varianza de p se obtiene por teoría binomial (Teorema
funciones crecientes de M dentro de la región de interés, para g > 0, 3.2) como
M > 1. Supongamos que se encontró la solución para los valores
/x (N M - n M ) PQ N - n PQ
específicos de C, y c2, y queremos examinar el efecto de un au
v -M - (9-30)
mento en c, sobre la solución. El lado izquierdo no depende de
Ci, pero el lado derecho aumenta conforme c, aumenta. Consecuen si N es grande. Consecuentemente, el factor (efecto del diseño),
temente, el valor óptimo de Af disminuirán porque el término C,M
está a la derecha. Una disminución en c-, produce un efecto similar.
<N ^ nde) (9 '3 1 )
Ahora, c, aumenta si la duración de la entrevista aumenta, mien
tras que c-. disminuye si el viajar se hace más barato o si las fincas muestra el cambio relativo en la varianza debido al uso de conglo
en una área dada aumentan en densidad. Estos hechos conducen merados. Los valores numéricos de este factor son útiles en la ob
a la conclusión de que el tamaño óptimo de la unidad se hace más tención de estimaciones preliminares del tamaño de la muestra con
pequeño cuando muestreo de conglomerado. El tamaño de muestra requerido se estima
primero mediante la fórmula binomial y luego se multiplica por el
aumenta la duración de las entrevistas
factor paraindicar el tamaño que será necesario con muestreo
viajar se vuelve más barato
conglomerado. Para unailustración, véase Comfield (1951).
los elementos (fin ca s) aumentan en densidad
Si los tamaños M¡ de los conglomerados son variables, la estima
la cantidad total de dinero usada ( C ) aumenta
ción p = Zcii/lM i es una estimación de razón. Su varianza la da,
Esta conclusión es una consecuencia del tipo de función de costo aproximadamente, la fórmula (Sec. 3.12)
y requerirá se le reexamine con otra función diferente. La misma
ilustra el hecho de que la unidad óptima no es una característica I M 2( P i- P ) 2
fija de la población, sino que depende también del tipo de recono
cimiento y de los niveles de precios y salarios. N -1 (932>
Hansen, Hurwitz y Madow (1 9 5 3 ) dan un excelente análisis de donde M = z M í / N es el tamaño promedio del conglomerado.
la construcción de funciones de costo para encuestas que involucran
muestreo por conglomerados. Si este ejemplo se compara con una muestra aleatoria simple de
nM elementos, encontramos, como una generalización de (9 .3 1 )
9.7 M UESTREO C O N G L O M E R A D O P A R A PR O PO R CIO N ES
Las mismas técnicas se aplican al muestreo conglomerado para Vb¡Á p ) NMPQ
proporciones. Supongamos que M elementos en cualquier conglome Como con las variantes continuas, la relación entre el tamaño
rado se pueden clasificar en dos clases y que = a¡/M es la pro del conglomerado y la varianza entre conglomerados se puede in
306 TE C N IC A S DE M U E S TR E O
M U E S TR E O PO R C ONGLOM ERADOS. DE U N A ETAPA: . . . 307
vestigar, ya sea expresando el factor en (9 .3 1 ) y 9.33) como una S,s — cuadrado medio entre estratos
función de M, o buscando una relación entre la varianza dentro del S3J ■» cuadrado medio entre grandes unidades dentro de estratos
conglomerado y M . Si asignamos el valor 1 a cualquier unidad que S3- — cuadrado medio entre elementos dentro de estratos
cae en la clase C, y 0 a cualquier otra unidad, la ecuación funda
mental del análisis de la varianza para M es Si Ñ es elevada y se ignora la cp f, mostrar que la precisión relativa de la
unidad grande a la pequeña (e l elem ento) mejora gracias a la estratifica
ción, si
N M F (\- P ) = M l (p, - P )2+ M I A ( 1- Pi) (
(M - l) M 1
suma de cuadrados total = suma de cuadrados entre conglomerados
+ s.c. dentro de conglomerados V ** *»
9.5. En una encuesta rural, donde la unidad de muestreo es un conglome
A partir de esta relación se puede calcular el cuadrado medio rado de M granjas, el costo de tomar una muestra de n unidades es
dentro de conglomerados y se le puede graficar como una función
de M. McVay (1 9 4 7 ) describe el uso de este análisis en la investi C —4tMn + óO^ñ
gación del tamaño óptimo del conglomerado.
donde t es el tiempo en horas gastado para obtener las respuestas de un gran
jero. Si se gastan $2 000.00 en encuesta, los valores de n para M — 1, 5, 10;
t = 2 dan lo siguiente.
E J E R C I C I O S
M
9.1. Para los datos de la Tabla 9.1, comparar las precisiones netas rela
tivas de los 4 tipos de unidad, cuando el propósito es el de estimar el número 1 5 10
total de plántulas en la era con un error estándar de '200 plántulas (nótese
que se involucra la cp f). í= jh 400 131 74
9.2. Para los datos de la Tabla 3.5, estimar la precisión relativa de la i = 2h 156 40 21
unidad fam iliar comparada con el individuo para estimar la razón de los sexos
y la proporción de personas que hayan visto al doctor en los doce meses V erificar dos de estos valores para asegurarse de que ha entendido el uso
precedentes, suponiendo muestreo aleatorio simple. de la fórmula.
9.3. Una población que consiste en 2 500 elementos, se divide en 10 es
tratos , conteniendo cada uno cincuenta grandes unidades compuestas de cinco La varianza de la media de muestra (ignorando la c p f) es
elementos. El análisis de la variancia de la población para cierta caracterís
tica es el siguiente, con base en los elementos.
g.l. c.m. S i p = 0.1 para todo M enhre 1 y 10, ¿cuál es el tamaño de unidad más pre
ciso para ( a ) t = \'2 h, ( b ) t = 2 h? ¿Cómo explica la diferencia en los
Entre estratos 9 30.6 resultados?
Entre grandes unidades dentro de estratos 490 3.0 9.6. Si hubiera $5 000.00 para la encuesta, ¿esperaría que el tamaño óptimo
Entre elementos dentro de las grandes de la unidad creciera o decreciera (relativam ente a la que corresponde a
unidades 2 000 1.6 $2 000.00)? Dé sus razones. Puede, si lo desea, encontrar el tamaño óptimo
para verificar su argumento.
Muestreo Conglomerado de
una Etapa:
Conglomerados de Tam años
Desiguales
9A.1 U N ID A D E S C O N G LO M E R A D O S
DE T A M A Ñ O S D E S IG U A L E S
¡-i
el total de elementos para la i-ésima unidad conglomerado, Dada una
muestra aleatoria simple de n de las N unidades de la población,
una estimación insesgada de Y es (p or el Teorema 2.1, Corolario)
310 TE C N IC A S DE M U ESTRE O
M U ESTRE O C O N G LOM ERAD O DE U N A E T A P A ' C O N G L O M E R A D O S ... 31J
(9 A ‘2> Í = M 0 nMlt í * = M„
tr =—
" = media muestral por elemento
X Mi
donde Y - Y/N es la media de población por conglomerado.
Por lo tanto, exige solamente el conocimie!*to de *os 9ue caen
Suele descubrirse que la estimación Y' es de una precisión me en la muestra seleccionada.
diocre. Esto ocurre cuando las y¡ (medias por elemento) varían poco
entre las unidades y los varían considerablemente. En este caso,
las y, = M¡y¡ también varían considerablemente entre las unidades y 9A.2 M U E S T R E O C O N P R O B A B IL ID A D
la varianza (9 A .2 ) es graftdé. P R O P O R C IO N A L A L T A M ^ °
Muestreo aleatorio simple de conglomerados: Si todos los Mi son conocidos, Hansen y fturwttz (1943), han
estimación de razón a tamaño desarrollado otra técnica en donde se seleccioi*an *as unidades con
probabilidades proporcionales a sus tamaños Un método de elegir
Sea
una sola muestra es el que ilustra la pequeña población siguiente
N de N = 7 unidades.
M » = X M, = número total de elementos de la población.
Tamaño Gama
Si los Mi y, por tanto, M0 se conocen, una alternativa es la estima Unidad Af £ M¡ asignada
ción de razón en donde Aí¿ se toma como la variable auxiliar x t.
n 1 3 3 1-3
ly , 2 1 4 4
Y r - M 0-^ p — = M 0 (media muestral por elemento) 3 11 15 5-15
4 6 21 16-21
i Mi
i-i 5 4 25 22-25
6 2 27 26-27
En la notación de la estimación de razón, la razón de población 7 3 30 28-30
R = Y jX = Y/M0= Y, media de población por elemento. Por el Teo
rema 6.1, al suponer que el número de conglomerados de la muestra
es grande, Se forman las sumas cumulativas de los M ¡. Par¡3 elegir una unidad
se saca un número aleatorio entre 1 y M0 = 30. S11?011?*111108 9ue sea
el 19. En la suma, el número 19 cae en la uni¿ad 4 9ue cubre la
(9A.3) gama de números de 16 a 21 inclusive. Con este método de extrac
N- 1
ción, la probabilidad de seleccionar cualquier dnidad distinta, es
proporcional a su tamaño.
(9A.4) Este método de selección de una unidad r£SLdta conveniente
cuando N es tan sólo moderado, o en el muestreo estratificado, cuan
Como demuestra (9 A .4 ), la varianza de YR depende de la variabilidad do los N,, son pequeños o moderados, pero la acuñ*ulación- de los M,
entre las medias por elemento y a menudo se encuentra que es mucho puede consumir tiempo considerable para N grande ( como sería N =
más pequeña que V (V ). 20 000). Para este caso, Lahiri (1 95 1) ha dado ub método alterna
tivo que evita la acumulación. Sea M mix el mayor de los M¡. Extrái
M U E S TR E O CONGLOM ERAD O D E una ETAPA: CONGLOMERADOS . . . 313
312 TE C NIC AS DE M U ESTRE O
Para su comparación con métodos subsecuentes, denotaremos, esta Teorema 9A.1. Si una muestra de n unidades se extrae con las
probabilidades z¡ y con restitución, entonces
estimación por medio de Ypps. Además
(9A.6) Yppz ¿ “T
n i-i <9 A 1 °)
314 TE C N IC A S DE M U ES TRE O
M U ESTREO CONGLOM ERAD O DE U N A E T A P A : CONGLOMERADOS . . . 315
lo que se espera aproxime la relación vigente en muchas encuestas. Considérese primero a = 0, caso en el que y, no está relacionada
Es necesario hacer algún supuesto respecto a la varianza de e¡ en con M i. Es claro que
conglomerados de un tamaño dado. VR < V U
De (9 .1 2 ) en la Sec. 9.4 obtenemos, al dividir por (TV—1) = N , Si fi (que en este caso se convierte en f ) es grande, la superioridad
de la estimación de razón puede ser considerable. Con a = 0,
V (e,)=
VPPs<V u para g^l
Como unaaproximación esto sugiere que V ( e ¡ ) = cM ¡L donde
1 < g < 2 en la mayoría de las aplicaciones. Delmodelo(9 A .26 ) Estas desigualdades son válidas porque la covarianza de M ¡ y
es positiva si g > 1 y nula si g = 1, de modo que con g > 1.
se obtiene
E ( M ñ = E [(Af,)(Af*-*)] ^ M E ( M r ')
Y = a +p M + é„: * = (9 A-27>
Si p = 0 y a zjkQ, por lo tanto, el total de unidad y{ no está
relacionado con M¡, Yu siempre es superior a YR y también a Ym
Suponemos que aquí éN; esto se reduce a ignorar la cpf.
salvo, posiblemente, en el caso poco verosímil de que g = 2 con
Se infiere que, P - 0.
Cuando ni a ni p se anulan, los comportamientos relativos de
Yu Yr , Ypp, dependen de las magnitudes relativas de la| y \p\. Por
= E(y( - Y )2 = E[/3(Mi - M ) + e ,f
ejemplo, YR supera Yu si p- > a"/M2, como señalaron Foreman y
= p 2 V (M l)+ c E (M * ) (9A.28) Brewer (1971).
En lo que respecta a Vs contra Vr¡,„ los coeficientes de tP son
EM,2(y, - f )2= E(y¡ aproximadamente los mismos en V„ y V^,,. De los términos en c,
V„,s < V* en el caso g > 1 que es de esperarse se aplique en casi
todas las situaciones que tienen p diferente de 0, en tanto que
= E [ a ( l - M J M ) -f-e,]2= — + c E (M ') (9A.29) Vws > VK si g < 1.
Ai
Los resultados de este modelo concuerdan con las conclusiones
= MEM,K - t)> - +¿ -]J antes sugeridas en esta sección. Si y¡ no presenta o sólo presenta
una tendencia moderada al aumentar M ¡, el método de razón con
probabilidades iguales y el método pps (probabilidades proporcio
= C,2E{ {MMíÑ ~\ + v Ñ E { M r l ) - - 2^ T - + c M E ( M r ') (9A.30) nales al tamaño) son más precisos que la estimación insesgada
con probabilidades iguales, y de hecho, pueden ser mucho más pre
Por lo tanto, las varianzas aproximadamente comparables en cisos. í"u es superior si el total de unidad y¡ no se encuentra
este modelo son relacionado con Mi. Hay menos amplitud de elección entre las es
timaciones de la razón y las de pps como esperamos que g se encuen
^ = 0 2V(M ,) + cE(M;*) (9A.31) tre entre 1 y 2, la estimación pps suele ser más precisa y sus
resultados no se restringen a muestras grandes.
M U ESTREO CONG LO M ERAD O DE UNA ETAPA: CO NG LO M ERAD O S . . . 321
320 T E C N IC A S DE M U ESTREO
Las estimaciones Yu y YR se benefician con el término cpf, 0.3 y 0.4, se obtuvo que los z¡' valen 0.1173, 0.2206, 0.3042 y
cuando éste es apreciable. Anticipándonos a trabajos posteriores 0.3579.
(Sec. 9A.12), la evidencia sugiere que los mejores métodos j rps sin Se han usado tres métodos para tratar con esta distorsión de las
probabilidades de selección que se piensan usar. Uno de ellos con
restitución se benefician aproximadamente con la misma cantidad
siste en retener el método natural de selección de muestra prece
del término cpf, como lo que beneficia al muestreo equiprobabilista.
dente, pero con cambios apropiados en el método de estimación del
total de población. Otro es utilizar un método diferente al de selección
9A.6 M U E S T R E O C O N P R O B A B IL ID A D E S de muestra, que conserva ir¡ = nzt sujeto a ciertas restricciones en los
D E S IG U A L E S S IN R E S T IT U C IO N valores de nz,. Otro más, consiste en aceptar cierta distorsión de
las probabilidades, si esto presenta ventajas compensatorias (por
Una parte importante de este trabajo se realizó para extensas ejemplo, una mayor sencillez o generalidad). En la Sec. 9A.8 y
encuestas, en las que las unidades Conglomeradas se estratificaron sigs., se dan ejemplos de estos tres métodos.
según otro principio (p or ejemplo, situación geográfica) en un Primero, presentamos la estimación general del total de pobla
número sustancial de estratos relativamente pequeños, al haberse ción, más conocida, para muestreo con probabilidades desiguales sin
extraído, tan sólo un pequeño número de unidades conglomerados restitución.
de cada estrato. El caso nh = 2 que proporciona un grado de liber
tad de cada estrato para estimaciones de errores de muestreo, es de
9A.7 E L E ST IM A D O R DE H O R V IT Z-T H O M P S O N
particular interés.
Supongamos que se van a extraer dos unidades de un estrato.
Se selecciona una muestra de n unidades sin restitución por al
La primera se extrae con probabilidades z¡, proporcionales a alguna
gún método. Sea
medida del tamaño. Sea la i-ésima unidad la que se selecciona. Si
seguimos el método más natural en la segunda extracción, se selec tt¡ = probabilidad de que la i-ésima unidad esté en la muestra.
ciona una de las unidades restantes con probabilidades asignadas tu = probabilidad de que la i-ésima y j-ésima unidades estén
z ,/ (l — z¡). De modo que la probabilidad total tt¡ de elegir la i-ésima ambas en la muestra.
unidad, ya sea en la primera o en la segunda extracción es
Son válidas las relaciones siguientes:
m = z , +;>e ¡ (71 r- eZ ry ) r z( V 1 + £ t1 -^Z /) <9A-34) í tt¡ = n,Z •"//- ( n - l)ir¡, £ I irv = \n(n - 1) (9A.36)
■ i*¡ > i>¡
= z ,(l + (9A.35) Para establecer la segunda relación llamemos P ( s ) a la probabilidad
de una muestra que consiste en n unidades especificadas. Entonces
donde A = 2 z,/( 1 - z ¡) tomada sobre todas las N unidades. tÍ í ¡ = 2 P (s ) sobre todas las muestras que contienen las unidades
i-ésima y j-ésima, y tr* = 2 P ( s ) sobre todas las muestras que con
Supongamos que 7r¡ - 2z¡, al quedar proporcionales las proba
tienen la i-ésima unidad. Cuando tomamos para j i, cada
bilidades relativas de selección respecto a la medida de tamaño z¡.
P (s ), para una muestra que contenga la i-ésima unidad se cuenta
El estimador simple que introdujeron Horvitz y Thompson (1952),
(n - 1) veces en la suma, puesto que hay otros (n — 1 ) valores de
j en la muestra. Esto prueba la segunda relación. La tercera relación
/ rr¡ L ¡ z¡ se deduce de la segunda.
El estimador de Horvitz-Thcmpson (1 9 5 2 ) del total de pobla
tendrá entonces varianza nula si los z¡ son proporcionales a los y,,
dado que z¡ = y J Y y cada unidad seleccionada dará la estimación ción es
correcta y-JzK= Y. Sin embargo, en (9 A .35 ), las cantidades
Y ht = Í - (9A.37)
z¡' - tt¡/2 están siempre más cerca de la igualdad que los z¡ origi ¡ ni
nales, a causa del segundo factor en (9A.35). En el ejemplo que
donde y-, es la medición para la i-ésima unidad.
dieron Yates y Grundy (1 9 5 3 ), con N = 4, n = 2, z¡ = 0.1, 0.2,
322 TE C N IC A S DE M U ESTRE O
M U ESTRE O CO NGLOM ERAD O DE U N A E T A P A : CONGLOMERADOS . 323
V(V7rr) = Xi />,
X ( ^ / - ^ ) [L('77,/
~ ) 2+ ('77//
A )2-2~ A7/J
77/ 7 ]
« 77,
-
i IT i i y>í TTfTTjTT^j
Prueba. Sea U ( i =■ 1, 2, . . N ) una variable aleatoria que a condición de que ninguno de los ir,,- de la población sea nulo.
toma el valor 1 si se extrae la z-ésima unidad y el valor cero en el
Yates y Grundy (1 9 5 3 ) así como Sen (1 9 5 3 ) han dado un es
otro caso. Entonces, t, sigue una distribución binomial para una
timador de muestra diferente. De (9 A .4 2 ), este estimador es
muestra de tamaño 1 con probabilidad ^¡. Por lo tanto,
g fic a lr f- g i < »,,- ,,)(* )’ - ! i Para n - 2, este método de selección de muestra conserva
/ 7T, , '77,/ , />, LV77// '77}/ J
7r¡ = 2z, y utiliza el estimador de Horvitz-Thompson
324 TE C NIC AS DE M U ESTRE O M U ESTRE O CO NGLOM ERAD O DE U N A E T A P A : CONGLOMERADOS . . . 325
?„-a+zu Un+y¡\
Vi v¡ 2 \zi z¡J
En este caso, el divisor de las proporciones es
autor produjo un método de selección de unidades sucesivas que tam etc. para n > 3, luego,cuando sumamos 2 P (s ) YMsoore todas las
bién posee la propiedad de Durbin. Su método, basado en cálculos
muestras de tamaño n, el coeficiente de y i en la sumaes1, demodo
repetidos, es semejante al de Brewer-Durbin, pero tiene valores li
geramente diferentes de las ?riy-, que
E (Y M) = l P ( s ) Y M = l y ^ Y (9A.53)
i
9A.9 E L M E T O D O DE M U R T H Y
Murthy (1 95 7) ha dado expresiones generales para V (Y M) y v ( Y M)
Este método utiliza la primera técnica de selección sugerida para cualquier n.
(Sec. 9A.6) al extraer las unidades sucesivas con probabilidades
Cuando n = 2, la muestra que consiste en lasunidades i y j,
z ¡> z;/( 1 - z¡)> z* / (l - z¡ - Z j) y así sucesivamente. El estimador
deMurthy (1 95 7) se apoya en trabajos anteriores debidos a Des Raj
P M O -I r * ¿i
-; f í J l / ) “ 1T TZ¡7 <9 A 5 4 >
(1956a), que produjo estimaciones insesgadas de una manera in
geniosa, al basarse en el orden específico en que se extraen las n P(s) = 7Tij = ZiPislO + ZfPÜ li) = Z iZ j (2 —Zi —Z;)/(l - Z¡)( 1- z¡) (9A.55)
unidades de la muestra. Murthy mostró que correspondiendo a cual
quier estimación ordenada de esta clase, podemos construir una Por lo tanto, la estimación es, al usar (9 A .5 2 ), (9 A .54 ) y (9 A .55 ),
estimación no ordenada que también es insesgada y presenta
una varianza más baja. Ym = . ■ ~ - f ( l - z/ ) 7 + ( l - zi)^ 1 (9A.56)
Z — Z¡ — Zy L Z( Z¡ J
Su estimador propuesto es
Por definición V (V M) es (para n = 2 )
ÍW )y ,
I P(s)Y M2- y 2= I I Zn ,(2 ~ Z; ~ Z’l Ym2- Y2 (9A.57)
j ¡ ¡>¡ D —z ¡)(i z¡)
*M = ±1 W (9A'52)
Después de sustituir YM2 según (9 A .56 ) y Y- y rearreglando términos,
donde
encontramos
P (s ¡i) = probabilidad condicional de obtener el conjunto de uni
dades extraído, dado que se sacó la i-ésima unidad en V (V m ) = I I --^ -1- - 2‘ ~ Z/)( - - ^ ) 2 (9A.58)
i i> l l Zi~Zj \z¡ Zj/
prim er lugar
Al comparar con V (Y ppI) para muéstreos con restitución, Fórmula
P ( s ) = probabilidad incondicional de obtener el conjunto de
(9 A .15 ), claramente V {Y M) < V ( Y ppz).
unidades extraído.
Dado que para cualquier v(Y M) propuesta su promedio es 2 P ( s )
Ahora probamos que la estimación Ym es insesgada. Para cual v {Ym), la siguiente es una estimación muestral insesgada de la va
quier unidad i de la población, l P ( s } i ) = 1, suma tomada sobre rianza para n = 2
todas las muestras en las que se tiene la i-ésima unidad en primer lu
gar. Para mostrar esto en el caso n = 2, donde j es la otra unidad
de la muestra (9A-59>
N que siempre es positiva.
z lz >
P (,| i)= — Í - ; 2 p (í |,) = i ü _ =1 La fórmula correspondiente para muestras de tamaño n es
r i - z¡
Para n = 3 con j y fe siendo las unidades segunda y tercera, ¿ [P(^)P(5|¿,/)-P(5|/)P(5|/)]z,z/^-^)2) (9A.60)
[< t-rij 1 / ¡>¡ yz¡ z¡> >
donde P(s\ ij) es la probabilidad condicional de obtener la muestra,
dado que se eligieron las unidades i y j (en cualquier orden) en
328 TE C N IC A S DE M U ESTRE O
M U E S TR E O CO NGLOM ERAD O DE U N A E T A P A : C O N G L O M E R A D O S ... 329
las dos primeras extracciones. Bayless (1 9 6 8 ) ha dado un programa Si nzi < 1 (es decir, n M / < M 0' ) para todo i, cualquier unidad
para computadora que calcula las P ( s f i ) y las P(s\ ij). tiene probabilidad nz¡ de selección, y ninguna unidad se selecciona
dos veces o más. Por ejemplo, la unidad 5 es elegida si 4 < r < 15,
lo que da probabilidad 12/30 = 3z5. Si nz¡ > 1 para una o más
9A.10 M ETO DO S R E L A C IO N A D O S
unidades, tales unidades se pueden seleccionar inás de una vez en
CO N E L M U E ST R E O SIS T E M A T IC O
la muestra, pero la frecuencia ■promedio de selección es 7r{ = nzs.
Esto ocurre en el ejemplo para la unidad 3, ya que 3M/ = 33 >
En un método sugerido por Madow (1 9 4 9 ), que como señala
30 = Aí0'. La unidad 3 se elige una vez si 1 < r < 12 o 16 < r < 30
Murthy (1 96 7) se utilizó en encuestas en la India, tenemos una
(en todas las 27 elecciones) y dos veces si 13 < r < 15 (3 eleccio
extensión del muestreo sistemático. Sus ventajas son que la mues
nes). La frecuencia promedio de selección es ( I X 2 7 + 2 X 3 ) /
tra fácilmente se extrae para cualquier n, el método conserva ir¡ — nz¡,
30 = 33/30 = 3za.
y proporciona una estimación insesgada de Y. Además, la persona
que construye la muestra puede en ocasiones poseer un conocimiento Se deduce que
anticipado, que le permita arreglar aproximadamente las unidades
en un orden para el cual el muestreo sistemático da buenos resul <9 A -61>
sys 7 n¡ n 7 zf
tados. Una desventaja del método sistemático es, como de costumbre,
la ausencia de una u(í"lyJ) insesgada. es una estimación insesgada de Y.
Se puede extraer una muestra de tamaño n, al usar los z{ o las Hartley y Rao (1 9 6 2 ) examinaron este método con las unidades
medidas de tamaño M ¡' de las cuales se derivaron los z< = Aí¡7 en orden aleatorio. Con la restricción nz¡ < 1 , (todo i ) , obtuvieron
>:AÍ/ - M//M/. Si se usan los Ai/, se forma una columna de totales oxnresiones aDroximadas o ara Vi Y....) v u( Ysw).
cumulativos T , de las cantidades nM/. De esta columna, dentro del
Intervalo 1 a nM,/, se asigna un intervalo de tamaño nM/ a la unidad
i Para la selección de muestra, se extrae un número aleatorio r en- 9A.1I E L M E TO D O D E R A O , H A R T L E Y , CO C H R A N
iro I y M./ y se seleccionan las n unidades paralasque el intervalo
asignado incluye los números r, r + M 0', .. . , r + (n - 1)AÍ0'. Para una muestra de tamaño n , este método comienza al cons
Este método se ilustra con los datos de la Sec. 9A.2 y con N = 7. tituir n grupos aleatorios de unidades, se debe elegir una unidad
Estamos suponiendo n = 3. Al formar los T¡ y los intervalos asig de cada grupo. Los números de unidades N a, N 2, en los
nados, se saca un número aleatorio entre 1 y Aí0 =■ 30, digamos grupos respectivos se pueden elegir de antemano: veremos que esto
r - 17, Las unidades elegidas son las que tienen como intervalos es ventajoso para hacer los N , lo más iguales posible. Si Z„ es la
asignados los que incluyen los números 17, 47, 77, es decir, las uni medida total del tamaño para el grupo g, la i-ésima unidad del grupo
dades 3. 4, 6. recibe una probabilidad de selección Zi/Z,. La estimación del total
de población, Rao, Harüey y Cochran (1 96 2) es
Tamaño Intervalo Unidades
Unidad M/ T, = 3 v M/ Asignado Seleccionadas * r h c = 1 Z f ^ = Z ?s (9A.62)
g-l ZS 8=3
1 3 9 1-9 donde y,, z, se refieren a la unidad extraída del grupo g.
2 1 12 10-12
3 11 45 13-45 17 (unidad 3) Como los Z, no serán iguales, este método no conseiva las pro
4 6 63 46-63 47 (unidad 4) babilidades de selección proporcionales a los tamaños y hay eviden
5 4 75 64-75 cia parcial de que este estimador padece de una pequeña impre
6 2 81 76-81 77 (unidad 6) cisión. Sus ventajas estriban en su sencillez y generalidad.
7 3 90 82-90
Al desarrollar V 'C f W ) promediamos en dos etapas. La etapa
M0' = 30 1, es la aleatorización en grupos y la etapa 2, la selección de una
unidad dentro de cada grupo. Para cualquier división específica en
330 TE C N IC A S DE M U E S TR E O M U E S TR E O C O N GLOM ERAD O D E U N A E T A P A : CO N G LO M ER AD O S. 33 1
7. El método sistemático de Madow, con las unidades dispuestas /V (Y ppz), donde Y ^ denota muestreo con restitución es 0.8 en la Tabla
9A.2. Para los métodos con probabilidades desiguales, la razón varía
en orden creciente de y-JZi. Estimación: 'frJys= (l/w)I()'//ri). entre poblaciones. El promedio de las tres razones en A, B, C es 0.74
para el método de Brewer y 0.73 para el método de Murthy, más o
Para damos una idea de lo que se puede esperar de los compor
menos la misma razón que para los métodos equiprobabilistas. Los
tamientos relativos de los métodos de Brewer, Madow y RHC, contra
resultados para n = 3, 4 sobre pequeñas poblaciones naturales de
el muestreo aleatorio simple con probabilidades iguales, nótese que
bidas a Bayless y Rao (1 9 7 0 ) en general concuerdan con ( N - n )/
las varianzas relativas de los métodos más nuevos respecto a V ^ f ^ )
( N - 1).
son aproximadamente los coeficientes relativos de variación de las En las poblaciones A y B, otros métodos son mucho más exactos
cantidades y jz - x y y¡. Las razones cv(y¡/z¡)/cv(y¡) son 0.19 en la po
que Ysrs con muestreo aleatorio simple. La estimación de la razón al
blación A, 0.11 en B y 6.7 en C. De modo que los métodos de pro
tamaño con muestreo aleatorio simple, tiene un comportamiento
babilidad desigual deberían tener una eficiencia relativa aproximada
semejante a los de los métodos de probabilidades desiguales, aunque
de 5 en A, 9 en B, pero sólo 0.15 en C. Esta comparación es un poco
no tan bueno. En este último, no hay mucho que elegir entre los mé
injusta respecto a los métodos de probabilidad desigual, que ponde
todos de Brewer, Murthy o RHC. El método sistemático en su caso
ran los errores cuadrados en y'/z¡ por las medidas de tamaño. Los más favorable da muy buenos resultados.
ECM de Yr deberían estar no muy alejados de las varianzas de los En la población C, donde los totales de unidades poco tienen que
métodos de probabilidad desigual.
ver con los tamaños, el muestreo aleatorio simple con probabilidades
En la práctica, al elegir un método, las consideraciones más im iguales es el mejor. Como se señaló al final de la Sec. 9A.13, esta
portantes se refieren a la facilidad de estación de la muestra, la sen superioridad es probablemente debida al estimador Ny, y no al mues
cillez de la estimación, la exactitud de la estimación, y la existencia treo aleatorio simple.
de un estimador de la varianza de la estimación. Con n = 2, todos Rao y Bayless (1 9 6 9 ) compararon 10 métodos no equiprobabilis
los métodos son simples. Por lo que respecta a la exactitud, el mé tas en 20 poblaciones naturales que se encuentran en diversos libros
todo sistemático sólo se muestra en su caso más favorable y la infor y artículos sobre el muestreo con N entre 9 y 35. Se limitaron a los
mación que dispone el encuestador rara vez le permitirá usarlo. Todos métodos ( a ) que se sabe presentan varianzas más pequeñas que YPP,
los métodos, a excepción Ysys y YR> proporcionan estimaciones mués y ( b ) que proporcionan un estimador de varianza positivo insesgado.
trales insesgadas de la varianza de error. La Tabla 9A.2 presenta las Entre los métodos aquí presentados, compararon las eficiencias de
varianzas (con el ECM para YR). *
Ym, Yrh c, y Yppz con la de Ys. Para n = 2, casi no había elección posible
En selección equiprobabilista, la razón de V{ Y) en el muestreo sin
entre los tres métodos sin restitución, sin embargo, YM aventaja un
restitución ala varianza V ( Y) en muestreo con restitución es (N - n )/ poco y supera a Yrhc . siempre que los dos métodos difieren en pre
334 TE C N IC A S DE M U E S TR E O M UESTREO CO N G LO M ERAD O DE UNA ETAPA: CO NG LO M ERAD O S. . . 335
cisión. También hemos notado (Sec. 9A.7) que el estimador de va sola elección de los z¡ o zki para todas las variables que requieren
rianza puede ser inestable para métodos que usan la estimación de estimaciones. Así, por ejemplo, los z¡ o z»¡ pueden ser proporcionales
Horvitz-Thompson. Los resultados de Rao-Bayless comparan los coe a las ventas recientes totales de un tipo de negocio, cuando la en
ficientes de variación d e v(Y M), v(Y RHC), y v(Y B) en la forma de Yates- cuesta debe estimar las ventas del día de ciertas clases de artículos,
lo mismo que ventas totales del día. Para algunas clases de artícu
Grundy, con el de v (Y pp:}, como medidas de las estabilidades de los
los, las ventas pueden no ser ni aproximadamente proporcionales
estimadores de varianza. Con relación a v (Y B) como 100%, las
a los z,. En tales casos, el uso de la conocida “razón a la misma
eficiencias medianas, de los otros estimadores de varianza son:
variable en la última ocasión” puede producir aumentos sustanciales
v($'rhc) = 109%, u(YM) = Í04%, ü(Ypp-) = 97%, y los tres métodos pre
de la precisión.
sentan algunas ganancias individuales, considerables.
Con muestreo de probabilidades desiguales, el cambio en las
Bayless y Rao (1 97 0) dan comparaciones semejantes para n = 3
fórmulas a las de los estimadores de razón se efectúa fácilmente. En
(14 poblaciones) y n = 4 (10 poblaciones). Se usó la extensión de
una población no estratificada se reemplaza Y para cualquier método
Sampford del método de Brewer. Para n muy superior a 2, los mé - n
todos de Sampford y Murthy requieren cálculos de las probabilidades por X Y /X . Así, por ejemplo, con el estimador H T usamos X (£ y j
en conmutadora. Las varianzas de YM y Ys concordaban estrecha 7n)/¿ (x¡/ir¡) para la forma de razón, en lugar de X (y,/rr,). Para las
mente en casi todas las poblaciones, con Yrhc un poco superada, ya aproximaciones estándar al ECM y ECM estimado de una estimación
que su eficiencia mediana relativa respecto a Ys caía al 92% para de razón, reemplácese y i por di = (y i — R x ¡) en V (Y ) y por d ' =
rz = 4. Por otro lado, en la estabilidad de los estimadores de varianza (y i - Rx¡) en v(Y ).
la superioridad de YRHC y yM aumentaba con eficiencias medianas Así, por ejemplo, con la forma de razón del estimador de Horvitz-
relativas de 118% (n - 3 ) y 129% (n - 4 ) para v(Y RHC) y 110% Thompson, la aproximación a v2, la varianza estimada en la forma
(n = 3 ) y 120% (n = 4 ) para u{YM) con relación al 100% corres de Yates-Grundy, es a partir de (9 A.4 4), Pág. 323,
pondiente a v(Y s).
Rao y Bayless también compararon las eficiencias de Y y v (Y ) «b [ Í W > ] * X X (9A.71)
i />¡ ir¡j '1T¡ 77}/
para algunos de los estimadores en el modelo de regresión lineal de
En una población estratificada puede esperarse que con nh peque
la Sec. 9A.5 con a = 0. En tanto que los resultados comparativos
ño, la estimación de razón combinada( Sec. 6 . 11 ) será la utilizada [es
dependían de la potencia g, la tendencia general era semejante a la
to es, Y = X (Z h.)/(X^),)]- Para fórmulas de varianzaaproximada, se
que se presenta en poblaciones naturales.
reemplaza yhi por dhi = yhi- R x hi en V, y por dhi' = yhi - Rxhi en v.
Cuando las y¡ para un atributo no están relacionadas a los z¡ y
9A.13 E ST IM A C IO N E S E S T R A T IF IC A D A S Y D E R A Z O N no hay una estimación de razón adecuada factible para un atributo
semejante. Rao (1 9 6 6 ) investigó estimadores alternativos. Estos se
Las fórmulas precedentes se han presentado como se aplicarían obtienen de cualesquier estimadores de probabilidades desiguales
a un solo estrato, aunque la concentración en valores pequeños de (Horvitz-Thompson, Madow, Rao-Hartley-Cochran, etc.) al reempla
n implica estratificación previa, con base en otro principio (com o la zar y,/Zi por Ni/,, siempre que y i aparezca en elestimador.Entonces,
localización geográfica, la estratificación urbana-rural). La extensión por el estimador deHorvitz-Thompson, la forma alternativa es
de las fórmulas a esta estratificación se hace como de costumbre. Para
cualquier método, si nh, zhi, vh¡, yhh etc., se refieren al estrato h, YHT=-Xy, (9A.72)
n i
= Azlzl ( l - z ¡ - z l ) ¡ i "_ z ¡_ \
¿Concuerdan los resultados con la discusión en la Sec. 9A.5?
" ( l - 2 r i) ( l - 2 z /)/ V t i -2z )
9A.2. Hay que enviar un cuestionario a una muestra de escuelas secunda
rias para encontrar cuáles proveen ciertas facilidades, como por ejemplo, un ( a ) Mostrar que si cada z ¡ < 5,
curso de ruso o una alberca. Si M ¡ es el número de estudiantes en la i-éslma
escuela, la cantidad que hay que estimar para una facilidad dada es la pro 0 < vi,, < 4 z,z¡ (cada i j)
porción P de estudiantes que están en escuelas que tienen dicha facilidad, ( b ) Mostrar que este resultado hace positivo al estimador de varianza de
esto es, Yates- Grundy, para este método.
338 TE C N IC A S D E M U E S TR E O
rx
i (Y -tf
2 f-1 _= varianza entre medias de unidades primarias. U v 2( W] - ( í £ = ) £ l (1013)
sr =
N - 1
N M El teorema resulta de la Fórmula (1 0.10 ), al sumar (10.11) y
” 2
(10.13).
2 i? ,? , ^ varianza entre subunidades dentro de unidades
5z = N (M -l) = primarias. Si f, = n/N y f2 =» m/M son las fracciones del muestreo en la
primera y segunda etapas, otra forma del resultado es
Hay que observar que Y¡ denota el total sobre las subunidades de
la i-ésima unidad (que en los Cap. 9 y 9A se denotacony i ) . V(.y) = ^ 1S l2+^— ^ S 21 (10.14)
n mn
Teorema 10.1. Si las n unidades y m subunidadesde cada uni
dad elegida, se seleccionan por muestreo aleatorio simple, y es la 10.4 E S T IM A C IO N M U E S T R A L DE L A V A R IA N Z A
estimación insesgada de Y con varianza
Teorema 10.2. En las condiciones del Teorema 10.1, tenemos
como estimación insesgada de V(y)
I T.{y¡¡~y¡)2
Para V(y), usárnosla Fórmula (10.2).
D 2= ---- —
' 7— s 22 = — , 77- (10.16)
n —1 n (m -l)
m = Vl[£ ,(y -)]+ E ,[V 2(y)] (10.10)
Prueba.
n
Y\[Ez(y )] = (10.11)
344 TE C N IC A S DE M U ESTB EO SU B M U ESTREO CO N UNIDADES DE TA M A Ñ O S IG UALES 345
donde f"„ = ¿ Y jn . El último término de la derecha es válido, porque que n/N sea pequeña. Si n /N no es pequeña, (10.23) sobreestima
el submuestreo es independiente en diferentes unidades y y = £ y jn por la cantidad /,S;2/n, como se ve a partir de (10.20) y (10.14).
En consecuencia,
10.5 L A E S T IM A C IO N D E PR O PO R CIO N ES
(., - 1 )E 2(s ,2) - £ (Y ,~ {n ~ ^ (10.19)
Al multiplicar por (1 — f.)/ra(n - 1) y promediar sobre la primera Si las subunidades se clasifican en dos clases y estimamos la
etapa de muestreo aleatorio simple, proporción de ellas que pertenece a la primera clase, se pueden
aplicar las fórmulas precedentes por el artificio acostumbrado de
E (1 s,2= ^ ^ 5 , 2+ ■■■~ — — S22 (10.20) definir j/¡/ como 1, si la subunidad correspondiente está en esta
ri /i mn clase, y como cero en el caso contrario. Sea p¡ = a¡/m la proporción
Al comparar con (10.14) para V(y), nótese que el término en S/ que cae dentro de la primera clase en la submuestra de la i-ésima
está indefecto por la cantidad f , (1 — f 2)S 22/nm. Dado que E,E.. unidad. Las dos varianzas estimadas s,2 y s22 requeridas para el
(s .2) = S¡¡2, por lo tanto,“una estimación insesgada de V(y) es Teorema 10.2 son como sigue:
U (y )= — 5i 2+ ^ - ^ í 22 (10.21) I (p ¡ - p )2
n mn 2 _ (-1
Corolario. Un resultado utilizado más tarde es que a partir
de (10.20)
*
2\_ C 2 , ( l / 2 ) c 2_ C 2 . S22 Si*
£Ui ) -S i + - — S2 5, h í -¡yr (10.22) donde p = i p j n . En consecuencia, por el Teorema 10.2,
m m Ai
llOHulta que una estimación insesgada de S/ es
2 s 2 2 ( 1 - / 2)
Ejemplo. En un estudio sobre enfermedades de las plantas, éstas fueron
1 m plantadas en 160 pequeñas parcelas que contienen nueve plantas cada una.
Se escogió una muestra al azar de 40 parcelas y se examinaron tres plantas
Ñutas al Teorema 10.2. Si M = m o sea f2 = 1, la Fórmula
en cada parcela muestreada para ver si estaban enfermas. Se encontró que 22
(10.15) resulta apropiada para el muestreo aleatorio simple de las
parcelas no tuvieron plantas enfermas (de las tres), 11 tuvieron una, cuatro
unidades. Si n - N, la fórmula es la del muestreo aleatorio estrati tuvieron dos y tres tuvieron tres. Estime la proporción de plantas enfermas
ficado proporcional, puesto que las unidades primarias pueden y su e.e. El símbolo ^ denota las frecuencias 22, 11, 4, 3.
considerarse entonces como estratos, todos ellos muestreados. En Tenemos N = 160, M = 9, n = 40, m = 3. Para encontrar s,2 y s.,2, es
relación con esto, el muestreo en dos etapas es una clase de estra conveniente trabajar primero con los números de plantas enfermas (3 p ¡)
tificación incompleta, con las unidades como estratos. y los números de plantas sanas (3 <j¿). Los cálculos se plantean como sigue:
Cuando puede despreciarse f, = n/N, obtenemos el simple re Frecuencia
sultado, 3Pi 9M / 9ip ¡q ¡ 3l r ¡ Hp,
0 22 0 0 0 0
2 ¿ (y .-y )2
1 11 2 22 u 11
(10.23) 2 4 2 8 8 16
3 3 0 0 9 27
Por lo tanto, la varianza estimada podrá calcularse con sólo conocer
las medias de unidades. Este resultado es útil cuando el submues 40 30 28 54
treo es sistemático, porque en este caso no podemos calcular una
estimación insesgada de S22. Pero (10.23) es aún aplicable, siempre
346 T E C N IC A S DE M U ESTREO SU B M U ESTREO CON U NID AD ES DE T A M A Ñ O S IG UALES 347
Estas dependen del tipo de función de costos. Si los gastos de TTldpí = 1 ■3v/10 = 4 .1
viaje entre unidades son de poca importancia, una forma de la fun Consideraremos fijo el costo total y veremos cómo cambia la varianza de y
ción qué ha demostrado ser útil, es al cambiar m. Se supone que N es elevado. De (10.14)
C = c ¡n + c 2nm
v w - s : +£
n nm
La primera componente del costo, c,n es proporcional al número
de unidades primarias de la muestra, la segunda, c.nm es propor me2
cional al número total de unidades o elementos de la segunda etapa. m' C
Del Teorema 10.1 se ve que V{y) puede escribirse al elim inar n por medio de la ecuación de costo. Esto da
El último término de la derecha no depende de la elección de n y m. Al omitir el factor constante, la varianza relativa se puede calcular para dife
Al minimizar V para C fijo, o C para V fija, equivale a minimizar el rentes valores de m. La Tabla 10.1 muestra estas varianzas y las precisiones
producto relativas (tom ar como estándar la precisión m áxim a para m = 4 ).
Para cualquier valor de m entre 2 y 9, la pérdida de precisión relativa a la
óptima es inferior al 12% .
T A B L A 10.1. V a r ia n z a s R e l a t i v a s y P r e c i s i o n e s p a r a V a l o r e s
Por la desigualdad de Cauchy-Schwaxz
D if e r e n te s de m
rn = 1 2 3 4 5 6 7 8 9 10
(m 26)
Varianza relativa 29.59 22.14 20.32 19.92 20.07 20.51 21.10 21.80 22.56 23.38
siempre que S,2 > S2'/ M . Se redondea máp, al entero más cercano. 0.67 0.90 0.98 1.00 0.99 0.97 0.94 0.91 0.88 0.85
Precisión relativa
Si m es un entero tal que m < vn6pt < m + 1, la siguiente es una
regla más conveniente para m 6pt pequeña, (Cameron, 1951): re
348 TE C N IC A S DE M U ESTRE O SU B M U ESTREO C O N UNIDADES DE TA M A Ñ O S IG UALES 349
rías, con m ' elementos tomados de cada unidad. Esta sección trata S u s titu y e n d o e s to s v a lo re s d e F s e o b tie n e
de la elección de r í y m ’. Si sl2 es la varianza entre medias de las
lím it e in f e r io r m,ip, = 2.8; lím it e su p erio r m 6l„ = 9.0
unidades y s.2 es la varianza entre elementos dentro de las unidades,
según se definió en la Sec. 10.4, (1 0 .2 2 ) da C o m o se m u es tra e n la T a b la 10.1, c u a lq u ie r m e n e s ta g a m a d a u n g r a d o d e
p re c is ió n c e rc a n o al ó p tim o . A s í con n ’ = 10, m ' = 4, h a y 8 o p o rtu n id a d es
i!) (10.31)
d e 10 q u e la p é rd id a d e p re c is ió n s ea p e q u e ñ a c o n d a to s n o rm a le s .
\ MI m “ m Los límites del 80% y 95% para r í = 5, 10, 20 y m ' = 4 son los que
Para la función simple de costo c,n -F c2nm , teníamos aparecen en la Tabla 10.3. Con r í — 20 casi hay seguridad de que estimar
m &pt con precisión cercana al óptimo. Esto no es así con r í = 5.
S2
T A B L A 10.3. L í m i t e s S u p e r io r e s e I n f e r i o r e s p a r a m ÓJIt
" W = V F tl + (4 / 1 .6 9 )]- í_ 7 3 .3 6 7 F - l
donde F tiene 9 y 30 gl. Para encontrar los límites entre los cuales rhipt
Los cálculos suponen N , M elevadas: los diseños son conserva
se situará el 80% del tiempo, tenemos, considerando los valores de sign ifi
cación al 10% para F en un solo extremo, dores si los términos de cpf se toman en cuenta. Nótese que no más
de 10 unidades primarias son las requeridas y que los diseños no
F ,o (9 ,30) = 1.8490, F9o ( 9, 30) = 1/Fln(3 0 ,9 )= 1/2.2547 = 0.4435
presentan sensibilidad, relativamente, respecto a la razón c^/c2.
SU B M U ESTREO C O N UNIDADES DE TA M A Ñ O S IG U A LE S 353
352 TE C N IC A S DE M U E S T R E O
y E (s 3’ ) = S3-. Para obtener el primer resultado, sea yiK la media La extensión de los resultados en esta sección, a etapas adicionales
sobre todas las m unidades de segunda etapa en la i-ésima unidad de muestreo, debería ser clara a partir de la estructura de las
primaria, al suponer que todos los K elementos fueron enumerados fórmulas.
durante la tercera etapa. Sea yK la media de los n valores ylK. En
tonces, de ( 10.22 ) para el muestreo en dos etapas, se tiene que
10.9 M U E STR E O E S T R A T IF IC A D O D E L A S U N ID A D E S
IN M S h
9 * m I N*Aí* * (1045)
nm \ k / nmk *
donde Wh = es el tamaño relativo del estrato en térmi
= ± z L S * + l Z Í l S¿ + } z ! l s * = V(y) (10.41) nos de unidades de la secunda etapa y y* es la media de la muestra
n nm nmk
Lo mismoque con el muestreo en dos etapas, es claro a partir en e l estrato. A l aplicar el Teorema 10.1 dentro de cada estrato,
de (1 0 .3 6 ) que si es despreciable u(y) se reduce a tenemos
U (y„) = I (10.46)
, ( a - fn¿ - £n(n
y —- f1)f (10.42)
donde fih ~ nJ N,„ f 2h = m j M h.
Esta es una estimación conservadora si ft no es despreciable. A partir del Teorema 10.2, una estimación insesgada de la mues
Con una función de costo de la forma
tra es
C = c ln + c 2nm + c3nmk (10.43)
v(y„) = I VF*2[ — + /u( 1~ /2* W 1 (10.47)
los valores óptimos de k y m son a L nh nhm h J
La primera parte de este capítulo se dedica a la descripción de los 11.2 M ETODOS D E M UESTREO C U A N D O n = 1
métodos principales en uso. Empezaremos con una población que
consta de un solo estrato. La extensión al muestreo estratificado es Supongamos que la z-ésima unidad se seleccionó conteniendo
posible, como en los capítulos precedentes, al sumar las fórmulas Mi subunidades, de las cuales m¡ se escogen al azar. Consideramos
de varianza apropiadas sobre los estratos. Para simplificar las cosas, tres métodos de estimación de 9, la media por subunidad, o unidad
suponemos primero que sólo se eligió una unidad primaria, es decir,
de la segunda etapa, como suele llamarse.
que n — 1. Este caso no es tan impráctico como parece a primera
vista, porque cuando hay un gran número de estratos, se puede
I. Unidades elegidas con probabilidad igual
alcanzar una precisión satisfactoria en la estimación aunque nh - 1.
En las encuestas mensuales del U.S. Census Bureau para estimar los Estimación = y, = y¡.
números de personas empleadas, la unidad primaria es un munici
La estimación es la media de muestra por subunidad. Es sesgada
pio* o un grupo de municipios vecinos. Esta es una unidad grande,
porque en muestreo repetido de la misma unidad, el promedio de y,
pero tiene ventajas administrativas que disminuyen los costos. Como
los municipios están lejos de la uniformidad en cuanto a sus carac es Y¡, y como cada unidad tiene la misma oportunidad de selección,
terísticas, la estratificación se extiende hasta el punto en que sólo el promedio de Y¡ es
se selecciona uno de cada estrato. En consecuencia, la teoría que se
va a discutir sólo se aplica a un solo estrato en este plan de muestreo. ¿ I T ¡ = Y0 (digam os)
N i= l
Como en capítulos anteriores, las cantidades por estimar pueden
ser el total de población Y, la media de población (usualmente la Pero la media de población es
media por subunidad 9 ), o la razón de dos variables.
1HY,
Notación. La observación para la ;-ésima subunidad pertene
f = —, donde M = £
ciente a la i-ésima unidad, se denota con y¡¡. Los siguientes símbolos M 1=1
son referentes a la i-ésima unidad.
Por tanto, el sesgo es igual a (9 a- 9 ) . Dado que el método es sesgado,
Población Muestra vamos a calcular el error cuadrático medio (E C M ) respecto a 9.
Escribamos
Número de subunidades Mt m,
Media por subunidad Y, y. y¡ - 9 = (yi - Yi)+(,Y¡ - 9 a) + ( 9 a - 9 )
Al elevar al cuadrado y tomar la esperanza matemática sobre todas
Total Y,=M,Y, y, = m,y¡ las muestras posibles; todas las contribuciones de términos cruzados
se anulan. Las esperanzas de los términos cuadrados se obtienen
Los siguientes símbolos se refieren a la totalidad de la población fácilmente por los métodos dados en el Cap. 10. Encontramos
o de la muestra.
total de unidad Y¡. Por tanto, NM¡y¡ es una estimación insesgada y,i.- Y = ( y m - Yi) + ( Y ¡ - Y)
del total de población Y, al dividir por Aí0, el número total de subuni Promediemos primero sobre muestras en las cuales se selecciona la
dades en la población, obtenemos una estimación insesgada de Y. i-ésima unidad.
Para encontrar V<yu) que desde luego es igual a su ECM, tenemos
Ahora M ¡Y¡ = Y¡, el total para la unidad, y Y = NY/Mít, donde Y es V íym í-xrfs <1M1
M,¡ L¡=i m, ,=i J
la media de población por unidad. Esto da
Nótese que, como en el Método I, la componente entre-unidades
resulta de diferencias entre las medias Y 4 por elemento en las uni
dades sucesivas. Si estas medias por elemento son casi iguales, esta
Por lo tanto, componente es pequeña.
N
Ejemplo. Apliquemos estos resultados a una población pequeña, artificial-
U(j'ii) = TT2 * I ( Y , - Y )2 (11.2) mente construida. Los datos se presentan en la Tabla 11.1. Hay tres unida e
M „ ,=, m, Ma con 2, 4 y 6 elementos, respectivamente. Se pueden verificar las cifras
La componente entre unidades de esta varianza (segundo término para Y 4, S2¡2, y Y 4. La media Y de la población es 33/12, o 2.75. La media sin
ponderar de las Y es 2.167 = f a, de tal manera que el sesgo en el Método I reducciones en la contribución de la variación entre unidades, en
es — 0.583. Su cuadrado, la contribución al ECM, es 0.340. comparación con el Método sin sesgo II, y reducciones que prome
Una unidad se selecciona y dos elementos muestreados de ella. Conside diaron 30% en comparación con el Método I. (Ellos supusieron
raremos cuatro métodos, dos de los cuales son variantes del Método I. como despreciable la contribución de la variación dentro de unida
des.) En la estimación de características típicas de instalaciones
Método la.
Selección: unidad con probabilidad igual, = 2. agrícolas para el Estado de Carolina del Norte, Jebe (1 9 5 2 ) reportó
reducciones del orden del 15% en la varianza total en comparación
Estimación: y¡ (con sesgo). con métodos del tipo I. En ambos estudios la unidad primaria fue
Método Ib. un condado.
Selección: unidad con probabilidad igual = y2M ¡.
Estimación: y, (con sesgo).
Método II. 11.3 M UESTR EO C O N P R O B A B IL ID A D P R O P O R C IO N A L
Selección: unidad con probabilidad igual, m ¡ — 2. A L T A M A Ñ O ESTIM AD O
Estimación: N M ,y J M 0 (insesgada).
Método III. Como se mencionó en el Cap. 9, los tamaños M¡ de las unidades
Selección: unidad con probabilidad M J M 0, m¡ = 2. apenas se conocen aproximadamente con base en datos anteriores
Estimación: y, (insesgada). y en otras encuestas pueden tenerse varias otras medidas posibles
disponibles del tamaño de una unidad. Sea z¡ la probabilidad o
El Método Ib (submuestreo proporcional) no garantiza un tamaño de 2 tamaño relativo asignado a la i-ésima unidad, donde z¡ son cualquier
(éste puede ser 1, 2 o 3 ), pero el tamaño promedio de la muestra es 2.
conjunto de números positivos que suman la unidad. Todavía supo
Al aplicar las fórmulas para el error de muestreo (1 1 .1 ), (1 1 .2 ) y (1 1 -3 )
obtenemos los resultados de la Tabla 11.2. nemos Tt = 1.
Contribución al ECM de
ECM
( U '4)
Dentro de
Método unidades Entre unidades Sesgo Total Esto resulta porque, en muestreo repetido, la i-ésima unidad aparece
con frecuencia relativa z¡, de tal manera que
la 0.144 2.056 0.340 2.540
Ib 0.183 2.056 0.340 2.579 " ( M¡y,\ -
II 0.256 5.792 0.000 6.048 £ (y .v )= I 2\—r r ) = I ?
,-i \ZiM<y —i AdTo
III 0.189 1.813 0.000 2.002
La varianza de yEV se obtiene de la manera usual. Escríbase
Aunque el ejemplo es artificial, los resultados son característicos
[por (1 1 .4 )]
de los que se encuentran en comparaciones hechas en muchas po
blaciones. El Método III da el ECM más pequeño porque tiene la
contribución más pequeña de la variación entre unidades. El Método
II, aunque sin sesgo, es muy inferior. El Método la (tamaño igual
de la submuestra) es ligeramente mejor que el .Método Ib (sub En la varianza, cada cuadrado recibe una ponderación z¡. Por
muestreo proporcional). lo tanto
También se han hecho algunas comparaciones entre estos mé
v + £ 2, ( M S _ Mo?V 1 (1L5)
todos en poblaciones reales. Para seis características (total de tra M q L,-_x z¡ m¡ ¡-i V z¡ ' J
bajadores, total de trabajadores agrícolas, total de trabajadores no
agrícolas, estimados separadamente para hombres y mujeres). Han- Si z4 = M,/M0, (1 1 .5 ) se reduce a (1 1 .3 ) para V\y(II). Si z< = 1/N
sen y Hurwitz (1 9 4 3 ) encontraron que el Método III produjo grandes (probabilidades iniciales iguales), (1 1 .5 ) se reduce a (1 1 .2 ) para
E L SU B M U ESTREO C O N UNID AD ES DE D IFE R E N TE S T A M A Ñ O S 367
366 TE C N IC A S DE M U ESTRE O
1 Vi Con la : 2.541
Iguales
V. Unidades escogidas con probabilidad proporcional I¿>: 2.579
a tamaño estimado NM&t
11 Iguales Sin 6.048
M
Estimación = yv = y, = media de la muestra AL,
111 — ce Tamaño y, Sin 2.002
La estimación es sesgada ya que, por ejemplo, Mo
IV ¡ í « Tamaño estimado Sin 3.796
ztM 0
11.5 M ETO DO S D E M U E S T R E O C U A N D O n > 1 segunda etapa o2l2. El submuestreo es independiente en las diferen
tes unidades primarias. Se considera un estimador insesgado del
Para n > 1 los principales métodos de muestreo son extensiones total de población Y de la forma.
» naturales, tanto de los Métodos I a IV precedentes como de los mé
todos discutidos en el Cap. 9A para muestreo de una etapa con Y = Í w^Y, (11.7)
unidades que son conglomerados de tamaños desiguales. Las canti ¡-i
dades más a menudo estimadas son los totales de población, las donde el peso w¡, se conoce para cada muestra s, y puede depender
medias de población por subunidad y las medias o proporciones que de las otras unidades primarias contenidas en la muestra, así como de
tienen la estructura de estimaciones de razón. la unidad i.
En muchas aplicaciones, la cantidad M 0, número total de subuni Adoptaremos el artificio usado en la Sec. 2.9 al dejar vju' , como
dades de la población, es desconocida, y sólo se conocen los M¡ para una variable aleatoria, que es igual a w¡3 si la unidad i aparece en
las unidades primarias de la muestra, que se extraen dado que pueden la muestra, y cero en el caso contrario. Así obtenemos
contarse por medio de una lista. Por lo tanto, vale la pena observar
que los Métodos II y IV y sus extensiones a n > 1, no requieren el Y = I wJYi (11.8)
í-i
conocimiento de JVÍ„ para la estimación del total de población. El mé
todo I y sus extensiones no requieren que se conozca M0 para estimar Ahora bien
la media por subunidad. El Método III de probabilidad proporcional
E (Y ) = E 1E 2(Y ) = E 1I z w í¡' y ) = Y (11.9)
al tamaño, requiere el conocimiento de M 0. \ ,-= i /
Al investigar varianzas y estimaciones de muestra son útiles puesto que la covarianza de segunda etapa entre Y¡ y Y¡ es
ios dos siguientes resultados. Consisten en mostrar cómo se extien cero, porque el submuestreo es independiente. Por lo tanto,
den los resultados del muestreo de una etapa a resultados de muestreo
de dos etapas o muestreo de múltiples etapas. Primero los probó
v ( í ) = \Á i *vüy f) + z [ £ , ( * * ' W ] ( 11. 12)
Durbin (1 9 5 3 ) para estimadores que son sumas de estimadores '¡- i ' ¡-i
para las unidades primarias de la muestra y posteriormente, Des Con esto se completa la prueba.
R aj (1 96 6) los extendió a funciones lineales de los estimadores de El primer término en (11.12) es la varianza del estimador co
las unidades primarias, y nuevamente, Rao (1975b) los extendió rrespondiente, cuando cada unidad primaria de la muestra se enu
a casos más complejos. Seguiremos el estudio de Des Raj. mera totalmente y se obtiene a partir de resultados del muestreo
Las unidades primarias se eligen sin restitución con probabili en una etapa.
dades iguales o desiguales. En la i-ésima unidad primaria, sea f,
Ejemplo. Para el análogo de dos etapas del estimador de Horvitz-Thomp
un estimador insesgado del total de unidad Y¡, con varianza de
son, Yh t ~ ¿ f 'Jir„ el wi> = 1/2r> si la unidad * esta en la muestra y
370 TE C N IC A S DE M U E S TR E O E l. SIIB M U E STR E O C O N U NID AD ES DE D IF E R E N TE S T A M A Ñ O S 371
Teorema 11.2. Supóngase que tenemos una estimación insesga por (11.12), y así concluye la prueba.
da CT-2,2 de la varianza de segunda etapa de <r2i2de y¡, y una estimación Consideramos ahora algunos estimadores específicos del total de
población Y. En encuestas muy extensas la selección de las unidades
muestral insesgada de V (£ w í3Y í ) = V ^ v v ^ y ) del muestreo de una
primarias con probabilidades desiguales ha llegado a ser la técnica
etapa. Esta última será una forma cuadrática como más usada. Las Secs. 11.9 (muestreo con restitución) y 11.10
(muestreo sin restitución) tratan sobre estos dos métodos; la Sec.
t'(lv v ¡íY¡) = £ a uYj2+ 2 l (11.15) 11.13 presenta el estimador de razón en muestreo ppz. Otras Secs.
' ' i i ) >/
(1 1 .7 ) y (1 1 .8 ) dan los métodos correspondientes, cuando las uni
Entonces, un estimador muestral insesgado de y [¿ w^Y,) es dades primarias se eligen con probabilidades iguales.
V( Yu) = — (1 Zn (y i+ ? 2 + •••+>„)
n N - 1 n" m¡
En la sustitución, Y¡ = M¡Y¡ se convierten en M ¡ ( Y , - Y ) en tanto Esta estimación es autoponderante si m¡ = constante, como en el
que y = £ y J N se reemplaza por 0. También, S2,2= I (y,¡ - Y¡)2/(M, - 1) ejemplo que sigue. Cuando m¡ y Y¡ están no correlacionadas, esta
permanece inalterado cuando (y ¡ j - Y ) reemplaza a!y¡¡. Esto nos da estimación puede ser satisfactoria, pero es susceptible de un sesgo
el resultado que no se anula ni aun con n grande.
Ejemplo. Del volumen, Am erican M en o f Science, se tomaion 20 páginas
al azar. De cada página se registraron las edades de dos científicos, también
374 TE C N IC A S DE M U ESTRE O E L SUBM U EST8EO CON U N ID A D E S DE D E F E R E N T E S TAM AÑO S 375
elegidos aleatoriamente. El número total de biografías por página, varía en Como M „ = 359/20, estimado de la muestra, se obtiene,
general entre 14 y 21. Estimar la edad promedio y su error estándar de los
datos de la Tabla 11.6, usando el estimador de razón. ,1 » (20X571300)
(19)(359)*
De la columna extrema derecha,
s( Í r) = 2.16,años
* m 17 g ^ - 4 7 . 7 años
r* 2 Mi 359 11.9 U N ID A D E S S E L E C C IO N A D A S CO N P R O B A B IL ID A
DES D E S IG U A L E S Y C O N R E S T IT U C IO N : E ST IM A D O R
T A B L A 11.6. E d a d e s d e 40 C i e n t í f i c o s en Am erican Men o f Science
IN S E S G A D O
(n = 20, tíi = 2)
( I 1 '3 5 ) (1 ~f2i)S2l2
m¡
Estos resultados también son válidos para el muestreo de múl
P a ra e l m is m o co sto , T ara v e z p u e d e e s p e ra rs e q u e la s d ife re n c ia s
tiples etapas, siempre que Y¡ sea un estimador insesgado de Y¡, y
e n p re c is ió n e n tre estos m é to d o s s ea n su stan ciales.
que el submuestreo sea independiente cuando se extraiga una unidad
Si z¡ = Mj/Mo la estimación insesgada (11.31) se reduce a
primaria.
Para descubrir en qué ocasiones Yppz se hace autoponderante en
dl-39)
el muestreo de dos etapas, escribimos n i
Es claro que esta estimación se hace autoponderante, cuando m{ - m ,
(11-36) para que Ypp, = M 0y.
n i z¡m¡ ¡
Un estimador muestral insesgado es
Por lo tanto, la condición es
= constante = f 0 (11.37)
Ai
Esta expresión es la probabilidad de extraer cualquier unidad espe 11.10 SE LE C C IO N D E L A S U N ID A D E S SIN R E STITU C IO N
cífica de la "segunda etapa. A partir de (11.37), m J M i = f j n z {.
Si la probabilidad f0 se elige de antemano, se podrá decir al trabaja Para cualquiera de los métodos “sin restitución” estudiados en el
dor de campo qué fracción de la segunda etapa m 4/M¡ debe tomar Cap. 9A, se obtienen las fórmulas para la varianza, y varianza esti
de cualquier unidad primaria ele<J4a. Por ejemplo, supongamos f 0 = mada en muestreo de dos etapas, a partir de los Teoremas 11.1, 11.2.
1/50 = 0.02 y ?z = 60 unidades primarias elegidas. Si z¡ = 0.0026 Con los métodos de Brewer o Durbin,
para una unidad seleccionada, debemos tener m ¡ / M i = 0.02/(60)
(0.0026), o 1 en 7.8. Yf l = f — = (11.41)
Con una muestra autoponderante, el estimador de varianza 7r¡ n z¡ n z¡
con varianza
(11.35) toma la forma más simple
v tfc )- í ( 1 i .4 3 )
( u '3 8 )
i ¡> ¡ '77i T T j' i 771,71¡
donde y¡ = I y¡j es el total de muestra en la unidad i-ésima. La senci Para elestimador correspondiente Yppzen muestreo con restitución,
llez de las7 varianzas estimadas (11.35) y (11.38) es un rasgo tenemos, a partir de (1 1.33 ), con ^ = nzt,
atractivo del muestreo con restitución.
Con este método, hay otras maneras de extraer las submuestras. v ( ÚppJ = - Z Z ( ( - ~ y ) 2+ í M,2{1 ~ f2i)S2‘ (11.43)
ti \ Z ¡ / 771,77;
Si la unidad i-ésima se selecciona t¡ veces, una variante del método
Puesto que las contribuciones “dentro de unidades” a la varianza
es la extracción de una sola submuestra de tamaño ti7n¡ sin resti
son las mismas en (11.33) y (11.43), cualquier ganancia relativa
tución, a condición de que M¡ > m¡t¡. Sukhatme (1 95 4) ha mos-
N 2 en la precisión al seleccionar unidades sin restitución, se diluye en
trado que con este método, V(Yppz) se reduce en ( « - 1 ) T. M íS2¡ /«• Otro las muestras de dos etapas por la contribución intraunidades a la
método es el de extraer una sola submuestra de tamaño m-x sin im varianza. Por ejemplo, en un muestreo de varias etapas estratificado
portar cuántas veces se selecciona la unidad i-ésima. La estimación de ti = 44 provincias, entre N = 147 provincias, Des Raj (1964)
encontró que la razón V (Y WOR)/ V (Y WR) promediaba alrededor de 0.79
M ,y jz t de esta unidad recibe el peso t( (número de veces que se ha
378 T E C N IC A S DE MG’ E STRE O EL SUB M U ESTREO CON U N ID A D E S D E D IF E R E N T E S TAM AÑO S 379
sobre siete atributos para la componente entre unidades, pero el pro to, la estrategia consiste en usar métodos de selección que hacen
medio de la razón sobre ambas componentes era 0.92. (niTTfTrif1 — 1 ) igual a 1 o 0. Estas elecciones dan como resultado la
Con n = 2, una estimación muestral insesgada de V (Y B) es reducción de u(Yht) en (1 1 .4 4 ) al término
W - l ) i ( U 44;
' 7rl 7r2 ' ¡” 1 Wj-TT;
donde los subíndices 1, 2 denotan las unidades elegidas.
o al segundo término de (11.44). Brewer y Hanif (1 96 9) mejoraron
La extensión al estimador de Sampford para n > 2 es directa. y extendieron los métodos a estimadores diferentes de Yht-
El estimador alternativo de RHC
una buena elección respecto a algunos de los atributos, cuando Y, ta son el ingreso promedio de familias suscritas a una cierta revista, o
tuviera poca relación con z{. Si se puede encontrar una variable auxi la cantidad promedio de dinero para gastos menores que tiene un
liar x¡ tal que y¡/x* sea razonablemente constante, una posibilidad adolescente,
es la de cambiar a la estimación de razón (Sec. 11.13). Si no se dis Con cualquiera de los métodos precedentes de selección de uni
pone de tal Xi, la estimación alternativa que sugiere Rao (1 96 6) es dades (probabilidades iguales o desiguales, con o sin restitución),
de la forma
la fórmula aproximada estándar para el ECM de la varianza de YR
y R se obtiene fácilmente de la fórmula para V (Y ) para el mismo
Y-*P, = ^ Í H y , (11.47)
n i método de selección de muestra por la técnica que hemos usado
La evidencia preliminar mostrada por Rao, sugiere que si Y¡ y z¡ no repetidamente.
están relacionadas, Y*p. se puede comportar casi tan bien como lo Para obtener V (Y R), se reemplaza y {j por dii = y¡¡-Rx,l en V (Y )
haría Yu si el muestreo fuese con probabilidades iguales (com o se para el método de muestreo usado. Para V {R ), se divide también
ilustra en la Sec. 9A.13). Si se eligen las unidades primarias con por X2.
restitución, una estimación muestral insesgada de V (Y * « ) es Para el ECM estimado o varianza estimada v (Y R), se reemplaza
y¡¡ por d / = yi, - R x ij en v {Y ). Para v2(R ), también se divide por X 2.
0( f p =^ T T j i W i (11 -48) Esto resulta por el método usado en el Teorema 2.5. Para
número de empleados de sexo masculino de más de 16 años de edad ^ a = T r - r Z [(y¡/ - Rxq) - ( Y¡ - R X t)]2
M¡ - 1 ¡_1
número total de habitantes de sexo masculino, mayores de 16 años
Las condiciones en las cuales YR se reducen a un múltiplo de la
Si ya = 1 para cualquier empleado de sexo masculino, mayor de
razón de totales de muestra 1'lyíj/'XLxlj siempre son aquellas en las que
y y u - 0 en el caso contrario, y r ¡ j = l para cualquier habitante
la Y correspondiente se hace autoponderante, en este caso fu = m j
del sexo masculino mayor de 14 años y x¡, = 0 en el caso contrario, la
proporción de población es Y/X. Otros ejemplos de este tipo de encues Mi = constante.
382 T E C N IC A S DE M U ESTREO El. SU BM U ESTREO C O N UNID AD ES DE D IFERE N TES T A M A Ñ O S 383
Para la varianza estimada, la sustitución de d¡¡' = y ¡¡- Rx¡¡ para y¡,- La más simple de las funciones de costos contiene tres términos.
en (11.24) para v(Y u) da cu = costo fijo por unidad primaria
Cj ■= costo por subunidad
(11.52)
n n —1 n mt c¡ ■= costo de la lista por subunidades en una unidad seleccionada
De modo semejante, con selección ppz de probabilidades propor El tercer término se incluye porque generalmente se debe hacer una
cionales al tamaño z con restitución teníamos lista de los elementos de cualquier unidad seleccionada y se debe
verificar el número de ellos para extraer una submuestra. Por lo
Yppz = ~ l M y J z , tanto,
costo = cun + c 2 Í m¡ + c, £ M,
(de (11.33) en la Sec. 11.9)
Esta fórmula no es útil en la forma que aparece, pues el costo de
(H .53) pende del conjunto particular de unidades elegidas. En lugar de
n \z¡ J n z¡m¡ esto, se considera el costo promedio sobre n unidades, que es igual a
Por lo tanto, para YR = X Y j X en muestreo sin restitución,
E (C ) = cun + c2nm + c,nM = (cu + c¡M)n + c 2nm = c ln + c 2nm (11.58)
V( ) = - £ - ( Y, - R X f + - £ — ( 11. 54) donde c, incluye ahora el costo promedio de hacer la lista de una
Ti Zj H TTl¡ unidad.
D'e (1 1.35 ), una estimación de muestra v(YR) ligeramente ses Determinamos n y m = f .M para minimizar V(y) para un costo
gada es dado o viceversa. De (11.28) Sec. 11.8, al dividir por M02 = (MN)2,
z , = ^ o c M , ( a 2 - m / (Cu + (1 1 . 6 7 )
11.14 P R O B A B IL ID A D E S D E S E L E C C IO N O P T IM A
Y T A S A S DE M UESTREO Y S U B M U E ST R E O Como los valores individuales de {D ? -S ¿ 2J M ¡) no se conocen,
Un análisis antiguo, pero importante, de Hansen y Hurwitz podemos considerar la manera como el valor promedio puede de
( 1 9 4 9 ) determina simultáneamente las z, óptimas como funciones pender del tamaño de la unidad M¡, al usar el siguiente argumento
de los M¡ y las fracciones óptimas de muestreo y submuestreo. Las más o menos burdo. Supóngase que se dividiera una población
unidades se seleccionan con restitución. El análisis se presenta para en unidades de tamaño M. Como E (D ¡) = 0, la fórmula (9.10),
en la forma autoponderante, de modo que mi = f QM i/nzi = f 0M Jrri. Pág. 298 da
Como en la Sec. 11.13, la función de costos es
n n E & f t = Y ( A ) = ^ [ 1 + (M -D P w ]
C = c un + c 21 m, + c , I A Í
Aunque se conocen los M¡ se incluye un costo de lista para aquellas donde es la varianza de población de los d¡j y p¡¡ es la correlación
unidades que caen en la muestra, porque esta lista será necesaria intraunidad para unidades de tamaño M. También d e (9 .1 5), Pág.300,
para proporcionar un marco al submuestreo.
E (S 2d2¡)= S d2(l ~ P ^ )
El costo promedio de muestrear n unidades es
por lo tanto,
E (C ) = cun + C2f 0M ll-\-cl T,-rrM¡ (11.61)
de valores de tamaños en la población. Si \rp^i decrece notablemente, dentro de los estratos, si la probabilidad f„h = nnzKim hi/Mhi de selec
las probabilidades óptimas están entre z* « M* y z¡ ce VAÍi. ción de una subunidad en el estrato es constante dentro del estrato.
2. Si los costos de lista predominan, z{ caería entre V M ¡ y una En este caso, la estimación viene a ser
constante (probabilidades iguales).
3. Si los costos de lista y los fijos son del mismo orden de mag ? « = Z t - Í yu (11.73)
h JOh i
nitud, z¡ « puede ser un buen compromiso.
que es completamente autoponderante si es la misma en todos los
La derivación de (11.64) con respecto a la fracción de muestreo estratos como intuitivamente podría preverse.
global f0 da
Si las unidades dentro de un estrato dado son del mismo tamaño
(esto es Mu = A L ), en la Sec. 10.10 se mostró que la asignación
X W S ¡2¡
fa = muestral que conducía a una estimación completamente autoponde
Ac2M,> (11.69)
rante se acerca al óptimo a condición de que S2h/ V c¡¡¡ sea razonable
El valor de A se encuentra en términos de las t conocidas, al sumar mente constante. Cuando los M u varían dentro de los estratos, un
(1 1 .6 6 ) sobre todas las unidades. Este paso lleva al resultado resultado correspondiente para los estimadores como Y y Ye es el
1/2 siguiente. Supongamos que la función de costos es lineal, como
/o = en las Sec. 11.13 y 11.14, y que el estimador es autoponderante den
(11.70)
tro de los estratos (es decir, foi = n^Zumu/Mu)- Entonces, el óptimo
para un costo esperado dado, se puede mostrar que es de la forma
Al comparar con (1 1 .6 0 ), se verá que tiene la misma estruc
tura que en el muestreo con probabilidades iguales, si recordamos foh x - = / X (AL./M 0h)S\hi (11.74)
que en (11.60), - n m ^ / M * y c , «= c„ + CiM. vc 2/, ■'
El óptimo n se encuentra de la ecuación de costo promedio donde Aí0* - l M k¡. Así, la elección f„* = f„, que hace estos estimadores
(11.61).
completamente autoponderantes, será cercana al óptimo en cuanto
a precisión, a menos que S^. o bien, los c2h varíen mucho entre estra
11.15 M UESTR EO E S T R A T IF IC A D O . E ST IM A D O R E S tos, en especial porque esta elección sólo afecta la contribución de
IN S E S G A D O S segunda etapa a la varianza.
Yu = Í - ¿ — (11-72) = - r X (ñ - R Á j= X (n - R Á j
h nh ¡ mh,zh¿ -*3t
donde y¡,¡ es el total sobre las m hi subunidades de la i-ésima unidad Por lo tanto, sustituimos ¿Un = y¡,n — Rxkii en lugar de i/MJ para
en el estrato h. Estas estimaciones se ve que son autoponderantes obtener las fórmulas aproximadas de V (Y Rc) a partir de las corres
E L SU BM U ESTREO CO N UNIDADES DE D IFE R E N TE S T A M A Ñ O S 389
388 TE C N IC A S DE M U E S TR E O
pondientes para V (Y „ ) por el plan de muestreo usado. Para v(Y Rc) varianzas de estimadores insesgados lineales, como Ys„ Y^., o Y m -.
sustituimos d\u = yhi, - R exhii en v ( y j . A l suponer que la muestra es lo bastante grande para que estos
estimadores tengan distribuciones cercanas a la normalidad, las ta
Por ejemplo, con probabilidades desiguales con restitución (Sec.
blas normales darán los límites de confianza y las pruebas de signi
11.9) la Fórmula (11.33) lleva a
ficación. Quedan muchos problemas pendientes para estimadores
no lineales en encuestas complejas.
h nh ¡ \zh, ) zhimhi J Se han introducido tres métodos apropiados para la estimación
de los errores estándar de estimadores no lineales. Se describirán
donde
para muestras aleatorias estratificadas con n* -= 2 en todos los
D ju = Yh¡ - R X hi estratos, caso en el que se han estudiado más profusamente. Todos
los métodos dan las estimaciones insesgadas usuales de la varianza,
s l z k i = - ~ —^ l [ ( y k ¡r ^ i) - ( Y u - R X hí)]2 cuando el estimador es lineal. La muestra puede ser de varias etapas
con unidades primarias extraídas con probabilidades iguales o con
Para la varianza estimada, la Fórmula (11.35) da, después de la probabilidades desiguales con restitución.
sustitución,
11.18 D E S A R R O L L O E N SERIES D E T A Y L O R
I ( Z V - D , ’) 2
Este es el método que dio las fórmulas aproximadas para las
,í^ )4 ^ - i ) (1L76)
varianzas estimadas de R, y R c, R¡ en muestreo estratificado. La
donde
función que se va a estimar, f ( Y „ Y 2, . . . , Y * ) = f ( Y ) se expresa
como una función de los totales de población de ciertas variables, al
I Dhi'
r-, i Aly,,' d fu / I 7 , _ A - ser la estimación f ( Y ) la función correspondiente de las estima
Dhi — , D h ------ , ah¡ - yh¡ - Rcxh,
Zhi nh ciones insesgadas de muestra de Y. Para j variables con nh - 2,
cuando las unidades se eligen por e l método ppz con restitución, el
11.17 E ST IM A D O R E S N O L IN E A L E S E N E N C U E S T A S total de población y su estimador lineal son
C O M P LE JA S
son posibles con algunas funciones de interés. Consideremos un ejem l f ( H ) — f ( S ) ¡ t. McCarthy (1 9 6 6 ) observó que se puede encontrar
plo simple, el del muestreo aleatorio simple de una etapa con unidades un conjunto de medias muestras equilibradas en las que, para cada
primarias de tamaños iguales, donde debe ser estimada la correlación par de estratos, la mitad de los signos correspondientes a los pro
entre los totales de unidades de dos variables y U¡. El valor de ductos cruzados del conjunto son + y la otra mitad Si este
población f ( Y ) es conjunto contiene g diferentes medias muestras, los términos de
producto cruzado no deseados se cancelan al sumar sobre el conjun
X X í / J Í X X U 2k) to, lo que da
h ¡ / \h ¡ /
Í í u lu U u u - ' 'h '
h i N - X [/(«!)• - f ( S ) ? - X ( y M '- y , 2')2 = v (Y ) (11.82)
p = g ¡ *
r ÍX X U lh] 1/2 (X X í^ 2Ai) 1/ 2 Si Ci es la media muestra complementaria de Hi, tenemos como
segunda y tercera formas
incluyen la contribución correcta del sesgo al E C M [f(Y )]. Sin em restante de tamaño (2 L — 1 ). Una forma de la estimación Jacknife
bargo, hay que observar que si se extraen m muestras independientes, de V [ f ( S ) ] es entonces
Si, cada una con una complementaria H it C<> la cantidad
11.2. Para los Métodos II (probabilidades iguales, estimación insesgada) Nota. Y a que = Tn¡/mt , la componente entre unidades de v (p ') puede
y III (selección pps) volver a calcular las variancias de y para el ejem plo en calcularse como
la Tabla 11.1, cuando m i = 1. Mostrar que la precisión del Método III
relativamente al Método II es más baja para = 1 que para m ¡ = 2. ¿Cuál
es el resultado general que ilustra esto? m ü V 1)<ZQ,Í'~1P1 ' * 1 m'2)
11.3. Para la población de la Tabla 11.1, si los tamaños estimados z¡ son
y dado que las m i son bastante grandes, la componente dentro de unidades
0.1, 0.3 y 0.6 con m¡ = 2, mostrar que la estimación insesgada (M étodo IV )
se calcula como
da una varianza más pequeña que el muestreo pps. ¿Cómo se explica este
resultado?
11.4. Los elementos de la población que tienen tres unidades primarias, ata
(nm)
se clasifican en dos clases. Los tamaños de unidades M ¡ y las proporciones P¡
de elementos que pertenecen a la prim era clase son como sigu e: 11.7. Si se seleccionan unidades primarias con probabilidades iguales y
f 2 es constante, mostrar que en la notación del Ejercicio 11,5 la estimación
M, = 100, M 2= 200, Af3= 300, P, = 0.40, P2=0.45, P3= 0.35 insesgada de una proporción de población es p = Ny.a¡/nM„f.. y que si los
términos en 1/ m i pueden despreciarse, su varianza se puede calcular como
Para una muestra de 50 elementos de una unidad primaria, comparar el ECM
de los métodos la, II y I I I para estimación de la proporción de elementos de la
primera clase en la población. (E n las fórmulas de la variancia de la Sec.
11.2, S<- es aproximadamente P,Q¡.)
11.5. Una muestra de n unidades primarias es seleccionada con probabi calcular p y su error estándar para los datos del Ejercicio 11.6.
lidades iguales, de cada unidad elegida se toma una fracción constante de 11.8. Una muestra de n unidades primarias se elige con probabilidades
subunidades, f„. Si a¿ de las m ¡ subunidades en la unidad i-ésima caen en la proporcionales a los tamaños estimados z¡ (con restitución) y con una frac
clase C, muéstrese que la estimación razón al tamaño (Sec. 11.8) de la pro ción constante esperada global de muestreo, f0. Mostrar que las estimaciones
porción de'población en la clase C es p = 1 .a J lL m De la Fórmula 11.36, mostrar insesgadas v^de razón al tamaño del total de población son respectivamente
que la siguiente es una estimación de E C M (p ) es T/f0 y T M 0¡J,m ¡, donde T es el total de muestra. (S e sigue que si M 0 es des
conocida, puede usarse la estimación insesgada, pero no la de razón al tamaño.
1 I M ,2iP, - P)2 . /,(1 ~ h ) £ M,m, Para estim arla media de población por subunidad, se invierte la situación.)
V{P) = ~ ^ n - 1...... + ~ ñ ^ M Z ^ m 11.9. En un estudio de sobrepoblación en una gran ciudad un estrato
donde p.¡ = ai/m i. contenía 100 manzanas de las cuales se tomaron 10 con probabilidades pro
porcionales al tamaño estimado (con restitución). Se usó como fracción de
11.6. Una firm a que tiene 36 fábricas decide verificar la condición de
muestreo esperado global f0 = 2 % . Estimar el número total y el número
cierto tipo de equipo del cual hay Aí0 = 25 012 piezas en uso. Una muestra
promedio de personas por habitación, y sus errores estándar a partir de los
aleatoria de 12 fábricas es la que se toma y después se verifica una submuestra
datos que siguen.
del 10% en cada una de las fábricas seleccionadas. Los números de piezas
examinados ( n i j ) y los números encontrados de piezas con alguna deteriora
ción ( a ¡ ) son como sigue: Manzana 1 2 3 4 5 6 7 8 9 10
Cuartos 60 52 58 56 62 51 72 48 71 58
a, Personas 115 80 82 93 105 109 130 93 109 95
Fábrica nti a¡ Fábrica m¡ ai
P i~ ñ t m,
11.10. Para el método de Durbin (Sec. 11.10) en que se simplifica la esti
1 65 8 0.123 7 85 18 0.212 mación de varianza en muestreo con probabilidades proporcionales a z sin
2 82 21 0.256 8 73 11 0.151 restitución, un método simple de selección de muestra debido esencialmente
3 52 4 0.077 9 50 7 0.140 a Kish (1 9 6 5 ) es el siguiente. E l subíndice h que denota el estrato se omite
4 91 12 0.132 10 76 9 0.118 y el número de unidades primarias se supone que es par.
5 62 1 0.016 11 64 20 0.312 Se arreglan las unidades en orden de z¡ creciente y se marcan por pares.
6 69 3 0.043 12 50 2 0.040 El método es exacto solamente si zá — z¡ para miembros del mismo par; esto
es lo que se supondrá aquí. Se seleccionan dos unidades ppz con restitución.
Si se sacan dos unidades diferentes, se aceptan. Si se saca la misma unidad
Estimar el porcentaje y número total de piezas defectuosas en uso y esti
dos veces, se hace que la muestra consista en los dos miembros del par al
mar sus errores estándar.
que pertenece esta unidad. Muéstrese que para este método: ( a ) tt¡ = 2 z ¡, (b )
398 T E C N IC A S DE M U E STR E O
para unidades que no están en el mismo par, 7r,( = 2z,z¡ = 7r,jr;/2, de modo
que TTiTTj-irJ1—1 = 1, y ( c ) para unidades en el mismo par tt,¡ ~ 4 z ¡Z j = ir ^ , de
modo que iT|V(rr¡¡~1— 1 = 0 .
11.11. En la Sec. 11.9, la Fórmula (11.33) para V (Y PP¡) en muestreo con
restitución se probó con base en que siempre que se seleccione la i-ésima
CAPITULO 12
unidad, se extraiga de toda la muestra una submuestra aleatoria simple in
dependiente de tamaño m¡. Demostrar los siguientes resultados para dos planes
alternativos.
(a ) Cuando se selecciona la unidad t-ésima ts veces, se saca una sub
muestra aleatoria simple de tamaño de la misma (supóngase mit , ^ M í ').
N Muestreo Doble
En este plan, V iY ^ , ) en (11.4 1 ) se reduce en la cantidad( n - 1)£ M S -J/n
(Sukhatme, 1954).
(fc ) Cuando se selecciona la i-ésima unidad veces, se toma una muestra
aleatoria simple de tamaño m ¡. Entonces V('9'rft) en ( H . 4 1 ) aumenta en la
cantidad 12.1 DESCRIPCION DE LA TECNICA
vtíF.)-í "MR. -P)‘ Dado que los nh son variables aleatorias, minimizamos el costo es
h Xn A / n IV h n (12.13) perado para n ' y vh elegidas
Si la clasificación no es costosa, puede no ser razonable suponer E ( Q = C * = c 'n '+ n 'Z c hvhWh (12.18)
n'/N despreciable, dado que una proporción importante de la pobla
ción se puede clasificar. Sin embargo, para la mayoría de las aplica Para V = V(y„), la Fórmula (1 2 .3 ) conduce a
ciones, podrá ignorarse el término g'/n'N en (12.13). Y en este
n'(V + S 7 N ) = (S 2- I * l t f ) + z 3 á £ (12.19)
caso, (12.13) se simplifica a h vh
El producto C * (V + S2/ N ) no involucra n'. A l aplicar la desigual
V(yit) = Í Whs A - ± - - ~ ) + ^ Z Wh( Y h - Y ) 2 (1 2.14)
h i'h Ni n i, dad de Cauchy-Schvvarz a este producto, se muestra que el producto
Los resultados en el Teorema (1 2 .2 ) fueron dados por Rao (1973). se minimiza, si para cada h,
404 TE C N IC A S DE M U ESTRE O M U E STR E O D O BLE 405
El uso de la Fórmula (12.21) para asignación óptima exige, en 1. ¿Para qué valores de c'/c trae un aumento en la precisión el muestreo
la práctica, más conocimientos de la población del que se puede es doble?
perar que tenga el encuestador. Pero afortunadamente, los errores 2. ¿Cuál es el plan de muestreo doble óptimo si c' = c/100 y cuál la
debidos a conjeturas tienen aspectos de compensación. Así, si los V (y „) resultante?
v h de ( 12 .2 1 ) son demasiado elevados, los r í en (12.18) serán de
3. En el Prob. 2, ¿cómo cambia el plan y el valor de V (y „) si los vh se
masiado bajos y los pesos de estratos no estarán determinados tan conjeturan como el doble de las fracciones óptimas?
convenientemente como deberían. Sin embargo, en compensación
1. De los datos de población 2 WhS,, = 20.4, (S 2 — ’¿ W¡,Sh" ) = 177. En
parcial, las medias de estrato yh tendrán una determinación más consecuencia por (12.22)
precisa que en la solución óptima. Cuando casi no se conocen anti
V™ (y„) = 0.01 (20.4 + \13-Jc1)1
cipadamente los pesos de estratos W», Srinath (1 9 7 1 ) y Rao (1 97 3)
sugieren un método de selección de los n¡, ligeramente diferente, Si ésta debe ser menor que 6.20 para muestreo aleatorio simple, c’ <
que se piensa es más resistente a los efectos de conjeturas medio 0.11; esto es, c’ /c < 1/9.
cres de los W*. 2. Si c'/c = 1/100, entonces, con e l plan óptimo, (1 2.22) da
El caso que presenta el problema más fácil de asignación es
V ^ ,(y „ ) = 0.01(20.4 +1.3)* = 4.71
aquel en el cual c,, y Sh son constantes. Entonces (12.21), viene
a ser Nótese que si la clasificación por tamaño de la granja no cuesta nada,
tendríamos
■**>>-í S ? ^ !( ¿ - ¿ ) + £ ? ? *■<*■ - « ■ ] (1 2 . 3 2 )
EJEG.wky * ) = l W ^ + Y . s A — — ) ( 1 2 . 2 9 )
'v hn' N/
También,
E ( y l ) = Y 2+ V (y J (12.30)
M U E S TR E O DOBLE 409
408 T E C N IC A S DE M U E STR E O
(12.33) n, = n/ si n ,<
L ¡ n¡ £ a ¡)
M
II
M
n2'< -
3
3
(Z a,)
\ Ím * + 6 ? )¥ -= V (1 2 .3 4 ) i
2 ¡ j n,j
n2— n —n, —n2
donde los 6¡ y 9¡ son pesos que el investigador elige, y los símbolos
( i j ) denotan los 4 subgrupos.
donde Z a ¿ = Z ^ ¡_ «i-
En la discusión de la Sec. 5A.13 los subgrupos se podían mues- 1
trear directamente. El problema viene a ser un problema de muestreo
Estas reglas no son completas, pero cubrirán casi todos los v!
doble cuando los miembros de los subgrupos no se pueden identificar
que puede esperarse cercanos a los óptimos. El principio consiste en
de antemano, pero las unidades pueden clasificarse, a un costo re
no alejarse de la asignación n¡ a a¡. Para más detalles consúltese
lativamente bajo, en los subgrupos de una muestra aleatoria simple
Booth y Sedransk (1969).
inicial de tamaño n'. Si n'¡ de las muestras iniciales caen en el sub-
grupo i, los n¡ para la muestra final que se mide para proporcionar Ejemplo. Un ejemplo en donde el muestreo doble opera convenientemente
las comparaciones deseadas se extraen de los n ¡'. La función de es el siguiente: C = 2 000, c' = 1, c <= 10. Los tres subgrupos son de tamaños
relativos W , = 0.05, W, = 0.25, W , = 0.70, a,* = S¡* - 10 (i = 1, 2, 3 ).
costos más simple es
Considérese primero muestreo sencillo. Como el costo de selección, clasifica
C = c 'n '+ c L ni = c 'n '+ c n (12.35) ción y medida de una unidad de muestreo es de 11 unidades monetarias,
podemos perm itir n = 182 con muestreo sencillo.
donde suponemos ? < c.
410 T E C N IC A S DE M U ESTREO M U E S TR E O DO BLE 411
La asignación óptima requeriría Uj iguales, pero en promedio, los valores Al resolver (1 2 .4 2 ) para m u el valor de n ' en el que v, = 1, se
de n de muestreo sencillo con n = 182 son 9.1, 45.5, 127.4. A l suponer obtiene
E(l/ra¿) = 1 / E (« j) la V promedio de muestreo sencillo es aproximadamente
Con muestreo doble, los cálculos para los diferentes n ' muestran que el n'
Para examinar valores de n ' menores que m,, hágase v, “ 1 y
óptimo está cerca de 620, lo que da n = 138. Con n = 138 el n ¡ óptimo es úsese la desigualdad de Cauchy-Schwarz para obtener las restantes
46 en cada clase. Sin embargo, n ’ = 620 proporciona tan sólo 31 elementos vj. Encontramos, para i > 1,
esperados, en la clase 1. Por lo tanto, en promedio, la regla de asignación
(1 2.37) para muestreo doble da n l ~ E ( n \ ) (0 .0 5 )(6 2 0 ) ~ 31, n2 = n, =
53.5, lo que conduce a
i
donde£ a¡ = La. E ( V ) mínima resultante es ahora
£(V)"10(á+
,31 ¿ ) =°'
53.5/ --70
E( v , = ¿ 4 í ,1239>
m 2 = C * / [(c '+ c W 'l) + ---- ^ J (12.47)
Por la desigualdad de Cauchy-Schwarz, la fracción Ví óptima para For lo tanto, las expresiones (1 2 .4 5 ) y (12.46) sólo se aplican para
n ' fijo está dada por los valores m x > r í > m 2. Si d E (V )/ d n ' no se anula para n' > m 2,
debemos poner v,, v2 y así sucesivamente = 1 en tumo hasta encon
(12.40) trar el punto de vuelta de E (V ). Sin embargo en muchas situaciones
d a¡) c en las que es económico el muestreo doble, el punto de vuelta de
siempre que v¡ < 1. La sustitución de n 'W ¡*, a partir de (12.40) E ( V ) ocurre para mx > r í > vn2.
en (1 2 .3 9 ) da, para la E ( V ) mínima Ejemplo. Para el ejemplo desarrollado en esta sección, C * =■ 2 000, c' =
1, c - 10, a 4* = S¡= = 10, VV¡ = 0.05, 0.25. 0.70. De (1 2 .4 3 ) y (12.47) tenemos
£ (V )‘ é ^ v ? (12-41) 2000
= 800
1 [1 + (10)(0.05)(3)
Como E ( V ) en (12.41) decrece al decrecer n', el n' óptimo dis
minuirá cuando menos hasta alcanzar el valor n h digamos, en el 2000
que una de las v ¡, digamos v,, se hace 1. En este punto, (1 2 .4 0 ) y [1.5 + (10)(.25)2] 308
(12.41) ya no se aplican. De (12.40), v, es 1 cuando Además. d E (V )/ d n ' en la Fórmula (1 2 .4 6 ) se anula en
2000
n 'W l = a i(C * ~ n'C
--)- (12.42) r = 619
{1.5 + (2)[(0.5)( 1.5 )]l/2}
c d a,)
M U E S TR E O DOBLE 413
412 TE C N IC A S DE M U E S TR E O
Como este valor está entre 800 y 308, proporciona el mínimo requerido. La donde su' 2 es la varianza de u dentro de la muestra grande. Así, se
Fórmula (12.44) da = .346, rt = .124. Numéricamente, esta solución es, infiere que
en esencia, la que se encontró por el método de Sedransk con n ' = 620 y
valores semejantes de n i en los tres subgrupos.
V(y,r)= V(ylr) = v l(y ')+ B l( ~ ¿ j ) í ll'2 (12.50)
Ambos métodos se extienden fácilmente al caso de costos dife
renciales de medición en subgrupos diferentes. También se han dado
sugerencias (Rao, 1973) para el caso en donde E (l/ n ¿ ) es sustan
cialmente mayor que 1/E (n ¡).
ya que s u'2 es una estimación insesgada de Su2 = S „*(l - p2). Por lo
tanto
12.6 E ST IM A D O R E S D E R E G R ESIO N
(12.49)
En algunas aplicaciones del muestreo doble, la variable auxiliar
x ¡ se ha usado para obtener una estimación de regresión de Y. En Esto completa la prueba.
la primera (gran de) muestra de tamaño n', medimos tan sólo x¡;
en la segunda, una submuestra aleatoria de tamaño n = vn'=n'/k Como en la Sec. 7.8 se supone, con base en Royall (1 9 7 0 ), que
donde la fracción v se elige de antemano, medimos tanto x¡ como yt. la población finita es en sí misma una muestra aleatoria de una
La estimación de Y es suprapoblación infinita, en donde es válido un modelo de regresión
lineal. Entonces, y,r se hace insesgada según modelo y pueden ob
ylr = y + b ( x '- x ) (12.48) tenerse resultados exactos de muestras pequeñas para su varianza.
donde x', x- son las medias de las x¡ en las muestras primera y se Sea el modelo de regresión en la suprapoblación
gunda, y b es el coeficiente de regresión de mínimos cuadrados de
y = a+/3-t + e (12.52)
t/, respecto a x¡,, calculado de la segunda muestra.
Si no se hace un supuesto respecto a la presencia de una regre donde, para x dados, los c son independientes, con medias 0 y la
sión lineal en la población, yir será sesgada. T al como en el muestreo varianza <r„*( 1 - p2), donde % y p son ahora parámetros de la su
de una etapa (Cap. 7 ). Puede darse una aproximación a V{yt,) al prapoblación.
suponer muestreo aleatorio y 1/n y 1/ra despreciables respecto a 1 . Al sustituir para y, Y, y b a partir de (1 2.52 ), cálculos algebraicos
directos proporcionan
(12, 9)
n
tonas repetidas de la población finita y de las dos muestras, se Asi, para un costo especificado C,
obtiene y _ S 2( M 1 - P 2) + '/ ? ? ) 2 Sy2
'™ " y C N (12.61)
(1255) Si sededican todos los recursos a una sola muestra sin ajuste
de regresión, esta muestra tiene tamaño C/c y lavarianza de su
= ( 12.5ó)
n n N media es
Esta expresión tiene la misma forma que (12.49), excepto en cSy2 Sy2
que en (12.56) ay- y p se refieren a la suprapoblación. y) = _C ~N (1Z62)
El muestreo doble con regresión ha sido extendido por Khan y Por lo tanto, el uso óptimo del muestreo doble dará una varianza
Tripathi (1 96 7) al caso donde p de las variables auxiliares x se miden menor si
en la segunda muestra, al estimar Y por la regresión lineal múlti
ple de y en estas variables. Al ser la segunda muestra una submues c > ( V c ( l - p 2) + V X > V (12.63)
tra aleatoria de la primera, y con normalidad multivariada supuesta Esta desigualdad puede expresarse de dos maneras.
para y y las x, la extensión de (1 2 .5 4 ) para p > 1 da para la varianza
promedio c (lW T T V . (12 64)
c p
<12-57)
2. 4 (c/c') ti r\
donde R es el coeficiente de correlación múltiple entre y y las x.
p ■ (I2 -65)
El caso en que la segunda muestra se extrae independientemente
Las Ecs. (1 2.64) y (12.65) dan los intervalos críticos de c/c' para p
de la primera fue considerado por Chameli Bose (1943).
dada, y de p para c/c/ dada, que redundan en un muestreo doble ven
tajoso.
12.7 A S IG N A C IO N O P T IM A Y C O M P A R A C IO N La Fig. 12.1 gráfica los valores de la razón c/c/ (en una escala
C O N E L M U E STR E O S IM P LE logarítmica) contra p. La curva I es la relación cuando los muéstreos
sencillo y doble son de la misma precisión; la curva II es válida
De la fórmula de la varianza (1 2.49 ), donde se supone 1/n cuando V¿p, =0.8 V(y), es decir, cuando el muestreo doble da un
despreciable, el muestreo doble con estimación de regresión puede incremento de precisión del 2 5 % , y la curva III se refiere a un in
compararse con una sola muestra aleatoria simple sin ajuste de re cremento de precisión del 50% . Por ejemplo, cuando P = 0.8, el mues
gresión. Tenemos treo doble es igual al sencillo en precisión si c/c' es 4, da un in
cremento de precisión de 25% de c/c' es más o menos 7V2, y un
= C = c n + c 'n ' (12.58) incremento de 50% si el valor de c/c? es aproximadamente de 13.
N n n
Para usos prácticos, las curvas sobreestiman las ganancias al
Por la desigualdad de Cauchy-Schwarz, el producto VC se minimiza canzadas gracias al muestreo doble, porque los mejores valores de
cuando n y n ' deben ser estimados de datos previos o conjeturados. Hay cier
_ r . i ti — A to margen para los errores en las estimaciones que deberían fijarse
c'n , n fe ' (1 - p ) 11/2 .
r'^V)~7s}
•Sy (1 ~ P )
P^y asi^ue ^ Le ~~pr~\ (1259) antes de decidir adoptar el muestreo doble.
Para cualquier p , hay un límite superior a la ganancia en pre
A l sustituir en VC se tiene cisión por muestreo doble. Esto ocurre cuando la información sobre
CS 2 x' se obtiene gratuitamente (c 7 = 0 ). El límite superior a la pre
( V C ) min = 5 y2( v c ( l - p J) + J 7 ? ) 1 (1 2 . 6 0 ) cisión relativa es 1/(1 - p2).
416 TE C N IC A S D E M U E S T R E O M U ESTRE O DOBLE 417
c 2—s2
*yjc
Es una estimación insesgada de p2Sv2.
Por lo tanto, una estimación muestral de V (y(r) es
( l 2 .s 7 )
(12-68>
Esta es una híbrida de la varianza condicional y la varianza pro
medio.
12.9 E ST IM A D O R E S D E R A Z O N
A l separar los términos en 1/n y 1/n' obtenemos En la mayoría de las encuestas, se centra el interés sobre el
promedio actual (3 ), particularmente si se puede esperar que las
n Í K ) J ^ - 2 ? S^ S ^ R S „ - R ^ _ S ¿ características de la población cambien rápidamente con el tiempo.
n n N Por otro lado, con una población que sufre cambios lentos, un pro
medio anual ( 2 ) sobre 12 muestras mensuales o cuatro muestras
12.10 M UESTREO R E P E T ID O D E L A M IS M A P O B L A C IO N trimestrales sería adecuado para los usos principales. Esta sería la
situación en un estudio sobre la permanencia de ciertas enferme
La práctica de confiar en muestras para la recolección de series dades crónicas en un gran lapso de tiempo. Tratándose de una en
importantes de datos publicados a intervalos regulares, se ha hecho fermedad cuya permanencia presenta una marcada variación esta
común. Esto se debe en parte a que se ha comprendido que con una cional, los datos corrientes son de mayor interés, pero también son
población dinámica, un censo a intervalos no frecuentes es de poca útiles los promedios anuales para comparaciones entre diferentes re
utilidad. Una información muy precisa sobre las características de una giones y años. Las estimaciones del cambio ( 1 ) se desean principal
población en julio de 1960 y julio de 1970, puede no ser de mu mente al intentar estudiar los aspectos de las fuerzas que se sabe
cha ayuda en la planeación que requiere un conocimiento de la actúan sobre la población. Por ejemplo, si se acepta una moción que
población en 1976. Pueden resultar útiles una serie de pequeñas supuestamente estimula la construcción de viviendas, es interesante
muestras tomadas a intervalos de un año o menos. saber si la tasa de construcción de casas nuevas se ha incrementado
en el año siguiente (a l tener presente que este incremento no se debe
Cuando se muestrea repetidamente la misma población (salvo
enteramente á la nueva le y ).
los cambios debidos al paso del tiem po) el muestreador está en una
posición ideal para hacer estimaciones realistas, tanto de los costos Supóngase que estamos en libertad de alterar o retener la com
como de las varianzas, para aplicar las técnicas, que conducen a la posición de la muestra, y que su tamaño total debe ser el mismo en
eficiencia óptima del muestreo. Una pregunta importante es, ¿con todas las ocasiones. Si deseamos maximizar la precisión, se pueden
cuánta frecuencia y de qué manera debe cambiar la muestra con el hacer los siguientes enunciados respecto a las políticas de reemplazo:
transcurso del tiempo? Son muchas las consideraciones que afectan 1. Para estimar el cambio, lo mejor es conservar la misma
esta decisión. La gente puede estar poco dispuesta a dar el mismo muestra en todas las ocasiones.
tipo de información una y otra vez. Los entrevistados pueden estar
2. Para estimar el promedio sobre todas las ocasiones, lo mejor
influidos por la información que reciben en las entrevistas y esto es sacar una nueva muestra en cada ocasión.
puede hacerlos cada vez menos representativos con el paso del tiem
3. Para estimaciones actuales, se obtiene la misma precisión,
po. Sin embargo, en ocasiones la cooperación es mejor en una se
ya sea conservando la misma muestra o cambiándola en cada oca
gunda entrevista que en la primera y cuando la información es de
sión. El reemplazo de una parte de la muestra en cada ocasión puede
índole técnica o confidencial, la segunda visita puede producir datos
ser mejor que estas alternativas.
más exactos que la primera.
420 TE C N IC A S DE M U E S TR E O M U E S TR E O D O BLE 421
Los enunciados 1 y 2 son válidos porque casi siempre habrá una es la primera muestra y la variable auxiliar x+ es el valor de y¡ en la
correlación positiva entre mediciones de la misma unidad en dos primera ocasión. La varianza de y£m' viene de (12.49), Págs. 412
ocasiones sucesivas. El cambio estimado en una unidad tiene la y 413: nótese que las muestras m y n corresponden a n y nJ, res
• varianza S,*+S**—2PS,S¿, donde los subíndices denotan las dos oca pectivamente, en (12.49). La cpf es despreciable.
siones. Si el cambio se estima de dos unidades diferentes, la varian La mejor estimación combinada de Y 2 se encuentra ponderando
za es S,*+Sa*. Al estimar la media global para las dos ocasiones, la las dos estimaciones independientes inversamente a sus varianzas.
varianza es (S ,2 + S, 2 + 2pS,S2)/4 si se conserva la misma unidad Si W s„, W » son las varianzas inversas, esta estimación es
y (S i 2 + S.*)/4 si se elige una nueva unidad.
(12.73)
El enunciado 3, menos obvio, se investiga en las secciones si
guientes.
donde
, "2 u
92 — W2u+ W 2m
12.11 M UESTR EO E N D O S O C A S IO N E S
Supóngase que las muestras son del mismo tamaño n en ambas Según la teoría de los mínimos cuadrados, la varianza de y•/ es
ocasiones y que las estimaciones actuales son de interés primario.
La política del reemplazo ha sido examinada por Jessen (1942). V(y2')= - 1
W2u + W2m
Por simplicidad, suponemos que se usa muestreo aleatorio simple.
De la Tabla 12.1, esto resulta ser después de simplificar
La media de la primera muestra tiene varianza S¿/n, sin que
haya información previa que utilizar. Al seleccionar la segunda
muestra, se retienen m unidades de las de la primera muestra (m <12-74)
para apareadas). Las u unidades restantes (u para no apareadas)
Nótese que si u - 0 (apareamiento completo) o si u = n (n o
se descartan y reemplazan por una nueva selección de unidades
apareamiento) esta varianza tiene el mismo valor, S£‘/n.
no seleccionadas previamente.
El valor óptimo de u se encuentra al minimizar (12.79) con
Notación. respecto a variación en u. Esto da
]/a„ = media de la porción sin aparear en la ocasión h
ü . ‘ ü — ¡ L (12.75)
“ media de la porción apareada en la ocasión h n 1+ V l - p 2 n 1+ v l - p
yh - media de la muestra completa en la ocasión h
Cuando la u óptima se sustituye en (1 2.74 ), la varianza mínima
Las porciones apareadas y las sin aparear de la segunda muestra
resulta ser
proveen las estimaciones independientes y2J, yM’ de ? 2, como se
muestra en la Tabla 12.1. En la porción apareada usamos una esti
V * , Ü V > - ^ < 1+ V T ? ) (12.76)
mación de regresión de muestreo doble, donde la muestra “grande”
La Tabla 12.2 muestra, para una serie de valores de p, el por
T A B LA 12.1. E s t i m a c i o n e s d e l a s p o r c io n e s a p a r e a d a y no
APAREADA
centaje óptimo que se debe aparear y la ganancia relativa en pre
cisión comparada con no apareamiento. El mejor porcentaje a apa
Estimación Varianza
rear nunca excede 50% y disminuye constantemente conforme p
aumenta. Cuando p = 1, la fórmula sugiere m - 0, la cual cae fuera
N o apareada: S22 1
ii
u V^2„
nablemente grande. El procedimiento correcto en este caso es tomar
Apareada: t f d - P 2) , , s 22 1 m — 2. Las dos unidades apareadas son suficientes para determinar
y2n.'=y2», + b(y] - y Im)
m P n Wlm pY3rtarr\íir\tr¡ la Knpa de rePTesiÓn.
m u estreo d o ble 423
422 TE C N IC A S DE M U E S TR E O
" c o la
i v , ( i - p y 2f t - , y
- lRa f
N o ap a rea d o :
y j= y h u mh2 V mh n i
Esto da, al resolver para la mh, óptima, digamos,
A p area d o: Vi™' = + M y ¡,- 1 - j 'l.- l. m )
á ( 1 2 .8 1 )
n g h - ^ l+ V l- p )
En la /i-ésima ocasión, sean mh y uh los números de unidades
apareadas y no apareadas, respectivamente, con la ( f e - l)-ésim a Cuando se sustituye este valor en (12.80), la relación se con
vierte después de alguna manipulación algebraica en
ocasión. Las dos estimaciones de Yh que pueden obtenerse se dan en
la Tabla 12.3. El único cambio en procedimiento en la segunda oca 1 1- V l - p 2
sión (Tabla 12.1) es que en el ajuste de la estimación de la porción — = 1+ -----------t = = (12.82)
gh g h - i i l + 'J l - p )
apareada por la regresión, usamos la estimación mejorada y¡¡_¡ en
lugar de la media de la muestra yh-\- Esta relación puede escribirse
La varianza de la estimación apareada yhm‘ en la Tabla 12.3 rh = 1+ ¿r*_,
se deriva de (12.49) que está en Págs. 412 y 413. Nótese que ( a )
donde rh = l/gh y r , = l/ g x - 1. El uso repetido de esta relación de
nuestra m corresponde a la n en (1 2 .4 9 ) y (fe) el término P2S,-/n’
recurrencia da
en (12.49) que es igual a B 2V (x'), se reemplaza por p2V(y',,-l), como
B = P cuando S es constante en ocasiones sucesivas y y '_ , corres — = rh = 1+ b + b2+ • • • + bh~l =■V - T -
ponde a x ' en el análisis previo. gk l-o
Ahora examinamos la precisión obtenida si en toda ocasión se donde, de (1 2 .8 2 ), b = ( l - V l - p 2)/(l + V l - p 2). Dado que 0 < b < 1,
usan las óptimas mh y u,. y las ponderaciones óptimas. Se encontrará el factor límite de la varianza g « es
que la óptima m j n aumenta constantemente en ocasiones sucesi
2v l - "
vas, y se aproximan rápidamente a un valor límite de Vz-
A l ponderar inversamente con la varianza, la mejor estimación
de yh es Por lo tanto, la varianza de yh' tiende hacia
(12.79)
v'(yco') = - ( - ^ S ! ) (12.84)
donde <¡>h - 'WHJ ( W ha + W ^ ) . Esto da n '1 + v 1 —p l
Por lo tanto,
TABLA 12.4. P o rcentaje O p t im o A paread o v V a r ia n z a s
II
P
SO
0.7 0.8
O
h 0.7 0.8 0.9 0.95 0.95
gh = a+bgh-i
2 42 38 30 24 0.857 0.800 0.718 0.656 Por aplicación repetida, tenemos, dado que g¡ = 1,
3 49 47 42 36 0.837 0.762 0.646 0.556
4 50 49 47 43 0.834 0.753 0.622 0.515 a ( l - b h~')
5 50 50 49 46 0.833 0.751 0.613 0.495 **— \ = r ~ 'b
■CO 50 50 50 50 0.833 0.750 0.607 0.476
Como b = P2( 1 - es menor que 1, el valor límite es
V i —p 7[ V l —p 2+ 4 A ja p 2 —V i —p 2]
12.13 S IM P L IF IC A C IO N E S Y A D E L A N T O S U LTE R IO R ES
4>6P I = 2Ap2
En su aplicación práctica, el análisis precedente puede necesitar En la práctica, no se conocerá el valor exacto de p y diferirá de
una modificación. Hemos supuesto que todas las políticas de reem característica a característica. En general, se puede escoger un valor
plazo cuestan lo mismo y son igualmente factibles. Con poblaciones simple de transacción. Claramente, <£,>,„ será menor que = u/n,
humanas, los costos de campo probablemente sean más bajos si se ya que la parte apareada de la muestra da una precisión más alta
retienen las mismas unidades para un cierto número de ocasiones. por unidad que la parte no apareada. Por ejemplo, con p — 0.25, esto
Si las estimaciones del cambio en el total o en la media de la pobla es, V4 de la muestra sin aparear, <¡>ápt resulta ser 0.216, 0.198 y 0.164
ción son de interés, este factOT también apunta hacia el apareamien para P = 0.7, 0.8, 0.9. La elección de c¡> = 0.2 sería adecuada para
to de más de la mitad de las unidades de una ocasión a la siguiente. esta gama de valores de p.
También es conveniente conservar constantes las ponderaciones Para la estimación de cambio, tenemos
y las proporciones apareadas, en lugar de cambiarlas en cada oca
sión. Consecuentemente, investigaremos las varianzas de yh' y de la Y (y V - y Á - ,)= V'(yfc') + V ( y ; _ 1) - 2 c o v fo 'y í.- ,) (12.87)
estimación del cambio (yh'~ y 'h -i) cuando m , u y <¡> se mantienen Para encontrar el término de covarianza, nótese que si yh¡, ¡
constantes. Continuamos escribiendo V(yv) = ghS2/n, aunque el valor son los valores para la i-ésima unidad en el grupo apareado en las
actual de g¡, será diferente del de la sección precedente. ocasiones h y ( h — 1 ), nuestro modelo es
La estimación es ahora
y*, = Yk +p(yh- u ~ Yh- i ) + ehi
¿h =<t>yhu'+tt-<l>)yhm
donde los e„¡ son independientes de las y. A partir de este modelo se
Al sustituir las expresiones para las dos varianzas (de la Tabla
encuentra, por sustitución, que
12.3), tenemos
ñm ' = 9hm+ p(y'h-i-yh-i,m)= Yk+p(y'h-i- Yh-i)+ ehm
V(yh' ) = Í!f = < p 2V(y',u')+(l-<1 >)2V(yhm')
Por lo tanto, la covarianza de yhm' y yj,_, es p V (y¡,_i). Pero
, s y q -^ fa ,.,
cov (y,,'y¿-|) = cov {[</>yh„ +(1 -<A)y/,m']yÁ-i} = p (l —V>) V(y'h- 1)
Lu m n
428 TE C N IC A S DE M U ES TRE O
M U ES TRE O DOBLE 429
1
0.7 P= 0.9 P = 0.95 , ción fija de elementos apareados, a menos que P > 0.95.
i'
0 .8
Q. ~ks
II
h a 1 a 3 Si P excede 0.8, el coeficiente de regresión b = P puede sustituirse
4 2 i 4 i 4
con tan sólo una pequeña pérdida de precisión resultante. Esto da
2 14 10 22 14 33 19 41 22 una estimación yh" de la forma
3 16 14 30 20 52 32 67 39
4 17 15 32 24 59 40 79 52 ñ “= + (1 - <t>W-x+ 9hm- (12.89)
co 17 15 33 26 62 50 89 74
En la encuesta de población actual hecha mensualmente en los
RG a 15 10 27 18 56 40 Estados Unidos por la Oficina del Censo una cuarta parte de las uni
— —
dades de segunda etapa se reemplaza cada mes, de modo que un
h Estimación del cambio-, ganancia porciento = 100(2 - 3jl')/ domicilio particular permanece en la muestra durante cuatro meses
consecutivos. Ese domicilio se omite en la muestra por ocho meses-,
2 106 153 156 233 245 399 326 565 pero luego se reincluye por cuatro meses, incrementando así ligera
3 113 160 170 245 277 415 365 588 mente la precisión de las comparaciones entre años sucesivos.
4 115 160 174 251 285 424 388 603 La estimación compuesta usada en esta encuesta es de una forma
co 115 163 178 251 292 440 397 624 relacionada con (12.89) pero ligeramente diferente.
RG 101 163 166 269 381 605 — — yh" = (1 - K ) y h + + 9km - jfc-i.J (12-90)
"Descrito en la Pág. 430. donde K es un factor de ponderación constante. La diferencia es
que yh, la estimación actual para toda la muestra, toma el lugar de
dado que y^ es independiente de yÁ-i- De (12.87), esto da
y,men (1 2.89 ). Las cantidades yhm, yh en (12.90) son estima
S2 ciones de razón de un tipo bastante complejo.
v ( y » '- y ¡ , - i ) :=— { g h + g h - ili- 2 p (i-< f> )]i ( 1 2 .8 8 ) La varianza de % " (debida a Bershad) está dada en Hansen,
Hurwitz y Madow (1 9 5 3 ); véase también el apéndice en Hansen y
De (1 2.85 ) y (1 2.87 ), las varianzas de yh' y (yh'- y 'h-x) pueden cal
otros (1 95 5). El estimador del cambio de un mes a otro es
cularse para cualesquiera valores de m, <¡>, y P. La Tabla 12.5 muestra
las ganancias porciento en eficiencia que resultan para estas esti dk = yh" = y ;-1
maciones en relación a las estimaciones obtenidas a partir de mues
Como las unidades primarias permanecen inalteradas, sólo se afectan
tras independientes en cada ocasión. Las proporciones apareadas
las componentes dentro de unidades de V(yh") y V(dh) por la política
son A - m/n = /¿ y %. El peso <f> se tomó como 0.35 para X - % y
de rotación de muestra.
0.2 para A. = %.
Rao y Graham (1 96 4) han examinado el comportamiento de
N o es sorprendente que las características más importantes de las estimaciones compuestas en políticas de rotación de este tipo,
la Tabla 12.5 son las ganancias elevadas en eficiencia para las es en las que un entrevistado permanece en la muestra durante r meses,
timaciones del cambio cuando P es al menos 0.7. Además, el aumento y luego se le saca de la muestra durante m meses. Ellos usaron como
de la proporción apareada de % a %, da lugar a ganancias sustan modelos un correlograma exponencial y un correlograma lineal en
ciales en eficiencia de las estimaciones de cambio a costa de pérdidas el tiempo, que desciende a cero. Graham (1 97 3) ha estudiado un
menores en eficiencia para las estimaciones actuales. Los resultados correlograma más complejo, requerido cuando hay una elevada co
sugieren, que retener la proporción %, % o % de una ocasión a otra, rrelación entre los meses fe y (fe — 12 ).
430 T E C N IC A S DE M U ESTREO M U ESTREO DO BLE 431
Sus ganancias en eficiencia para r = 2, 4 y tn = co corresponden cuando los datos dependen de la memoria no registrada del entre
a los resultados para x = V2l % en la Tabla 12.5. Para un coxrelo- vistado, sin embargo, el método puede tener éxito si los datos son
grama exponencial en el que la correlación entre resultados de la del tipo que el entrevistado registra cuidadosamente por rutina.
misma unidad en las ocasiones fe, fe - i es P\ las líneas rotuladas
RG de la Tabla 12.5 muestran para p = 0.7, 0.8, 0.9 sus porcentajes
E J E R C I C I O S
ganancias en eficiencia. Para cada p utilizan en (12.90) el K óptimo
para las estimaciones actuales al tender h co. Como, se muestra 12.1. Se destinan $3 000 a una encuesta para estimar una proporción. La
en la Tabla 12.5 también encuentran que las ganancias de eficiencia encuesta principal costará $10 por unidad de muestreo. Se dispone de infor
con las estimaciones compuestas son mucho más grandes al estimar mación en registros, a un costo de $0.25 por unidad de muestreo, que permite
la clasificación de las unidades en dos estratos de tamaños casi iguales. Si la
el cambio que al estimar el nivel actual.
proporción verdadera es 0.2 en e l estrato 1 y 0.8 en el estrato 2, estime
En un contexto más general, Scott y Smith (1 9 7 4 ) han discutido n y n' óptimas y el valor resultante de ¿Produce el muestreo doble
el papel que desempeñan los métodos de series de tiempo en las alguna ganancia en precisión sobre el muestreo simple? (L as razones n '¡ ¡V,
estimaciones hechas en encuestas repetidas de varios tipos. nh/Nh se pueden ignorar.)
12.2. Para las W ht P,, en el ejercicio 12.1. encuentre las razones de costo
En otra política de rotación se extrae una nueva muestra en cada c j c n‘ para las cuales el muestreo doble es más económico que el simple.
ocasión, sin aparear. Con muestreo semanal o mensual, este plan es 12.3. Una población contiene L estratos de igual tamaño. Si V rnn denota
apropiado, cuando son primordiales las estimaciones anuales ( y en la varianza de la media de una muestra aleatoria simple y V , „ V son las
nienor medida las semestrales o trimestrales) como, por ejemplo, varianzas correspondientes para muestreo aleatorio estratificado con asigna
en una encuesta sanitaria con énfasis en las enfermedades crónicas. ción proporcional y para muestreo doble con estratificación, demuestre que,
aproximadamente,
Si el cuestionario obtiene para cada unidad los resultados del mes
anterior y los del mes en curso, podemos considerar las estimaciones
compuestas de la forma nVm = sKi + -— - -----
yh=yh+<t>h(y'k-i-yh-i.h) (12.91)
nV„ = 5, 2
donde yh «= estimación de datos actuales en la muestra actual." -
E (ñ -ñ 2
yh-i.ii = estimación hecha sobre datos del mes anterior en la
muestra actual.
yÁ_i = estimación compuesta para el mes anterior. donde Sh- es la varianza promedio dentro de estratos. ( N y n ' se pueden con
siderar ambas como grandes en relación con L y las nh en muestreo doble pue
La teoría es discutida por Hansert, Hurwitz y Madow (1 9 5 3 ), y den suponerse iguales a n / L .)
W oodruff (1 9 5 9 ), que la aplican a una encuesta de ventas al me Por lo tanto, si ( R P ) , ¡ denota la precisión relativa de la muestra estra
nudeo, y por Eckler (1 9 5 5 ). En la encuesta de ventas al menudeo, tificada con la muestra aleatoria simple, con una definición correspondiente
para ( R P ) is demuestre que
la estimación compuesta involucra una estimación de razón, que
es de la forma (RP)
l + (/ i/ n ')[(R P )„ - 1]
y V = (i- ^ )ñ + ^ ( ^ - W _ ,
'yh-i,hy Para ( R P ) „ = 2. trace (R P )«¡, contra n / n ‘. ¿Qué tan pequeña debe ser esta
razón para que ( R P ) Js = 1.9?
donde W es un factor ponderante. Como las correlaciones de mes-a
12.4. Si p = 0.8 en muestreo doble para regresión, ¿qué tan grande debe
mes son muy elevadas al promediar cerca de 0.98, las ganancias en ser n' con relación a n, si la pérdida en precisión debida a errores de mues
precisión serán sustanciales. Un mes más tarde se calcula una es treo en la media de la muestra grande se quiere menor al 10% ?
timación compuesta realizada para el mes fe, que usa los resultados 12.5. En una aplicación de muestreo doble para regresión, la muestra
para el mes fe de la nueva muestra tomada en el mes (fe + 1 ). pequeña fue de tamaño 87 y la grande de tamaño 300. Los siguientes cálculos
se aplican a la muestra pequeña:
Con este método es esencial que los datos obtenidos del mes pre-
ODÍ)n f.xact:os en \a muestra actual. Esto podría no ser así,
432 TE C N IC A S DE M U E S TR E O
M U E S TR E O DOBLE 433
Calcule el error estándar de la estimación de la regresión de Y. pondiente a y en muestreo doble con selección óptima de n/n‘ es (im órese
12.6. Para p = 0.95, verifique los datos que aparecen en la Tabla 12.4
1/N),
para el porcentaje óptimo que tendría que ser apareado y para la ganancia
en precisión en relación con no apareamiento. Calcule los correspondientes E* = e / ( \ + y f ^ J E - 1 )2
porcentajes de ganancias en precisión si se retiene una tercera parte de las
unidades de la primera a la segunda ocasión y la mitad de las unidades se Por lo tanto, debe observarse que con cualquiera de estos estimadores, el
retiene en cada ocasión subsiguiente. muestreo doble no será altamente efectivo a menos que c ’/c sea pequeño
12.7. En muestreo aleatorio simple en dos ocasiones, suponga ‘que la esti (com o < 1/10). Por ejemplo, con c'/ c = 1/10, E = 6 da = 2.1.
mación en la segunda ocasión es, en la notación de la Sec. 12.11,
12.11. En muestreo en dos ocasiones, supóngase que St = S„ = S y que
y2" = (r-<¿)(yI+y 2m -y 1J + tf,j'2u las muestras son grandes, de modo que los coeficientes de regresión de y.,¡
respecto a yu y de respecto a y2i en la parte apareada de las muestras
(a ) A l ignorar la cpf, muestre que en las dos ocasiones, son ambos efectivamente iguales a p. La estimación
V i' en !a Sec. 12.10 y una estimación análoga y ,' se construyen usando la
regresión de yu respecto a y2i. Demostrar que
“ U - P1) + + (P - donde P,, (P , 4- P2) son las proporciones de población que tienen los atribu
( c ) E l óptimo ^ = p/( 1 -f- y el óptimo resultante gh es tos 1, 2. Supóngase que 1/N(P, + P2) se puede ignorar.
13.1 IN T R O D U C C IO N
otros errores, así como desarrollar métodos para calcular errores TABLA 13.1. R e s p u e s ta s a T k e s S o lic it u d e s e n una
E n c u e s ta p o r C o rre o
estándar y límites de confianza que permanezcan válidos aun cuan
do estén presentes los otros errores. Número promedio
Número de % de la de árboles
productores población por productor
13.2 EFECTO S D E L A N O -R E S P U E S T A
Respuesta al primer envío 300 10 456
Respuesta al segundo envío 543 17 382
Usaremos el término no-respuesta, para referimos a la falla en
Respuesta a l tercer envío 434 14 340
la medición de algunas de las unidades en la muestra seleccionada.
Personas que no responden 1839 59 290
En el estudio de la no-respuesta es conveniente pensar en la pobla después de 3 envíos ------ __
ción como dividida en dos “estratos”, el primero consistente de Población total 3116 100 329
todas las unidades para las cuales serían obtenidas las mediciones
si las unidades llegaran a caer en la muestra y el segundo, de las
tres cartas. La respuesta total fue pobre, más de la mitad de la po
unidades para las cuales no se obtendrían mediciones. Las composi
blación no dio la información aun después de los tres intentos.
ciones de los dos estratos dependen íntimamente de los métodos que
Consideremos ahora los efectos de la no-respuesta sobre la esti
se usen para localizar las unidades y obtener los datos. Una encuesta
mación de muestra. Sean N „ N 2 los números de unidades en los
en la cual se hacen al menos tres llamadas, si fuera necesario, en
dos estratos y W , = N t/N, W 2 = N 2/N, de tal manera que W 3 es la
cada casa y en la que un supervisor con poderes excepcionales de
proporción de no-respuesta en la población. Supongamos que se toma
persuasión va a visitar a todas las personas que se rehúsan a dar
una muestra aleatoria simple de la población. Una vez que se com
datos, tendrá un estrato de “no-respuesta” mucho menor que una
pleta el trabajo de campo, tenemos datos de una muestra aleatoria
en la cual solamente se hace un solo intento por casa.
simple del estrato 1 pero no tenemos datos del estrato 2. Por lo tanto,
Esta división en dos estratos distintos es, desde luego, una sobre-
la cantidad de sesgo en la media de la muestra es
simplificación. La casualidad juega su parte en la determinación de
si una unidad se encuentra y se mide en un número dado de inten E iy J - Y = Y, - Y = Y ,- ( W t V, + W2? 2)
tos. En una especificación más completa dei problema, nosotros
= W2( Y l - Y 2) (13.1)
asignaríamos a cada unidad una probabilidad que representara la
oportunidad que tiene de ser medida por un método de campo dado, La cantidad de sesgo es el producto de la proporción de no-res
si cayera en la muestra. puesta y la diferencia entre las medias de los dos estratos. Dado
La muestra no provee información acerca del estrato 2 de que la muestra no provee información acerca de 7 2, el tamaño del
no-respuestas. Esto no importaría si se pudiera suponer que las ca sesgo es desconocido a menos que se puedan establecer límites para
racterísticas del estrato 2 son las mismas que las del 1. Sin embargo, Y 2 a partir de alguna fuente que no sean los datos de la muestra.
dondequiera que se han hecho comprobaciones se ha encontrado Con una variable continua, los únicos límites que se pueden asig
que las unidades en el estrato “no-respuesta” difieren de las unida nar con certeza a menudo son tan amplios que tienen poca utilidad.
des que son mensurables. Una ilustración aparece en la Tabla 13.1. Consecuentemente, con datos continuos, cualquier proporción
Los datos provienen de un muestreo experimental de huertos de apreciable de no-respuesta usualmente hace imposible la asignación
frutales en Carolina del Norte en 1946. Tres envíos sucesivos por de límites de confianza útiles a Y a parür de los resultados de la
correo del mismo cuestionario se hicieron a los productores. Para una muestra. Quedamos en la posición de tener que confiar en alguna
de las preguntas — número de árboles frutales— había datos com conjetura acerca del tamaño del sesgo, sin datos que apoyen seme
pletos para la población (Finkner, 1950). jante conjetura.
La declinación constante en el número de árboles frutales por En el muestreo para porporciones, la situación es un poco más
productor en las respuestas sucesivas es evidente, siendo estos nú fácil, ya que la proporción desconocida P 2 en el estrato 2 debe estar
meros 456 para las respuestas al primer envío, 382 en el segundo entre 0 y 1. Si W 2 es conocida, estos límites de P 2 nos capacitan
envío, 340 en el tercero y 290 para los que no respondieron a las para la construcción de límites de confianza para la proporción P
438 TE C NIC AS DE M U ESTRE O
F U E N T E S DE ERROR E N LA S ENCU ESTAS 439
T A B L A 13.3. V a l o r M í n im o d e n p a r a L í m i t e d a d o d e
son más difíciles de alcanzar, que las familias con niños muy peque
E r r o r d , c o n R i e s g o a = 0 .0 5 ños o con personas de edad confinadas en la casa.
% 3. Incapaz de contestar. El entrevistado puede no tener la infor
N o -re s p u e s ta d (% ) mación requerida para ciertas preguntas o puede mostrarse poco
lOOtK* 20 15 10 5 inclinado a darla. Una redacción hábil del cuestionario y su prueba
previa son una salvaguardia.
0 24 43 96 384
122 4. Los “hueso duro". Las personas que inexorablemente recha
2 27 50 653
4 31 60 166 2000 zan ser entrevistados, que están incapacitadas o que están fuera de
6 36 75 255 .... casa durante todo el tiempo disponible para el trabajo de campo, son
8 43 99 521 las que constituyen este sector. Esto representa una fuente de sesgo
10 53 142 que persiste, sin importar cuánto esfuerzo se ponga en la perfección
15 112 de las listas.
TABLA 13.4. In s t r u c c io n e s p a r a l a S e l e c c ió n d e u n S o l o
E n t r e v is t a d o
En encuestas en las cuales cualquier adulto de la familia podría
contestar las preguntas, la primera visita obtuvo cerca del 70% de
S i el número de adultos la muestra y las dos primeras visitas, 87% . El costo creciente del
en la fam ilia es muestreo cuando hay que entrevistar a un adulto escogido al azar
Tecuencia
Tabla es evidente, al producir la primera visita apenas 37% de las entre
relativa
número 1 2 3 4 5 6 vistas requeridas. El marcado éxito de la segunda visita refleja el
de uso
trabajo previo del entrevistador, al investigar con anterioridad cuándo
Seleccione el adulto numerado
el entrevistado estaría en casa y disponible.
1/6 A 1 1 1 1 1 1 Muy poco se ha publicado sobre los costos relativos de las visitas
1/12 B1 1 1 1 1 2 2 posteriores a la primera. Debe esperarse que estas visitas sean más
1/12 B2 1 1 1 2 2 2 costosas por entrevista completa, ya que las casas están más espar
1/6 C 1 1 2 2 3 3 cidas en el área asignada al entrevistador y dado que sus ocupantes
1/6 D 1 2 2 3 4 4 son presuntamente personas que pasan más que una cantidad pro
1/12 El 1 2 3 3 3 5
medio de su tiempo fuera de casa. Basado en experiencias británicas,
1/12 E2 1 2 3 4 5 5
2 3 4 5 6 Durbin (1 9 5 4 ) sugiere que las visitas ulteriores pueden ser menos
1/6 F 1
costosas de lo que podría anticiparse. Las cifras siguientes muestran
costos relativos estimados por entrevista completa (p or ejemplo: di
Cada persona elegible en una familia de un tamaño dado tiene
nero gastado en i-ésimas visitas dividido por el número de entrevistas
igual probabilidad de ser seleccionada, excepto que los adultos 3 y 5 en
obtenidas) para cada visita hasta la quinta, en un estudio especial
familias de tamaño 5 están ligeramente sobrerrepresentados. Dado
relatado por Durbin y Stuart (1954).
que los entrevistados masculinos están concentrados en las Tablas
A, B y C , el entrevistador puede dedicar las visitas vespertinas a las
TA B LA 13.6. C o s t o s R e l a t iv o s po r N u e v a E n t r e v is t a
familias así designadas. Co m p l e t a en la í -é s i m a V is it a
Visita 1 2 3 4 5
13.4 R E V IS IT A S
Costo relativo 100 112 127 151 250
Una técnica estándar es especificar el número de revisitas, o un
número mínimo, que deben hacerse en cualquier unidad antes de La estimación de estos costos requiere sumo cuidado. Si el entre
abandonarla como “ contacto imposible” . Stephan y McCarthy (1 95 8) vistado deseado no está en casa durante la primera visita, el entrevis
presentan los datos de un cierto número de encuestas sobre el por tador puede gastar algún tiempo inquiriendo cuándo estará en casa
centaje de la muestra total obtenido en cada visita. Los resultados y concertando una cita tentativa. Al costear ese tiempo se debe asig
promedio se muestran en la Tabla 13.5 nar a la segunda visita y no a una primera que no tuvo éxito.
Una medida más útil es el costo promedio por entrevista com
TA B LA 13.5. N ú m e r o d e V i s i t a s R e q u e r id a s p a r a pleta sobre todas las entrevistas obtenidas hasta la i-ésima visita.
E n t r e v is t a s Co m pletas Estas cifras dan los costos relativos de obtener n entrevistas com
% de la muestra con el cual se estableció contacto en la pletas cuando insistimos en i visitas, antes que el entrevistador se
Primera Segunda Tercera o Porcentaje de dé por vencido. Para calcular estas cifras, debemos saber cuántas
Entrevistado visita visita posterior visita No-respuesta Total entrevistas se obtienen en cada visita. En la Tabla 13.7 se hacen es
tos cálculos con base en dos tipos de suposiciones. El primero simula
Cualquier adulto* 70 17 8 5 100
encuestas en las que cualquier adulto puede contestar las preguntas,
Adulto al azar 37 32 23 8 100
el segundo tipo aquellas encuestas que demandan un adulto al azar.
• Dos encuestas en las cuales el entrevistado fue un ama de casa y un operarlo Los datos sobre los números de entrevistas obtenidas se tomaron
dé una finca, respectivamente, han sido incluidas en e l grupo '•cualquier adulto". de la Tabla 13.5.
444 TE C N IC A S DE M U E S TR E O F U E N T E S DE ERROR E N LA S E N C U ESTAS 445
T A B L A 13.7. Co s t o s R e l a t i v o s p o r E n t r e v i s t a Co m p l e t a H a s t a l a Por simplicidad, suponemos wtl > 0 para todas las clases, aunque
í -é s i m a V i s i t a el método se adapta fácilmente para incluir personas imposibles de
Entrevistado — Cualquier adulto alcanzar. Si y¡y es la media para aquellos en la clase j que fueron
alcanzados durante o antes de la i-ésima visita, también se supone
Adulto que E { % ) = p¡.
i-ésima visita Hasta i-ésima visita “ al azar” La media verdadera de la población para la característica es
No. Costo No. Costo No. Costo
total de Costo por de por
¿ = (13.7)
Costo de de i
Visita relativo ents.* ents. ents. total ent. ents. ent.
Considérese la composición de la muestra después de i visitas. Las
1 100 0.70//, 70//, 0.70/r, 70/i„ 100 0.37//, 100 personas en la muestra pueden clasificarse en ( r + 1 ) clases como
2 112 0.1 ln a 19.04/1, 0.87/r, 89.04n, 102 0.32/1, 106
sigue: en la primera clase y entrevistadas; en la segunda clase y
3 127 0.07no 8.89/1, 0.94/1, 97.93/1, 104 0.16//, 110
6.04/z, 0.98/1, 103.97/1, 106 0.09//, 114 entrevistadas; y así por el estilo. La ( r 4- l)-ésim a clase consiste de
4 151 0.04//,
5 250 0.02//, 5.00/1, 1.00//, 108.97/1, 109 0.06/1, 122 todos aquellos aún no entrevistados después de i visitas. Si se ignora
la cpf, los números que caen en estas ( r + 1 ) clases están distri
* Entrevistas. buidos de acuerdo con la multinomial
pero el método da estimaciones realistas del costo de la insistencia E (r ii) = número esperado de entrevistas en i visitas - n0 £ Wi¡p¡
en revisitas si se han recolectado datos sobre el costo necesario y * (1 3 .8 )
el tamaño de la muestra. También interviene el factor tiempo: las Para n± fijos, los números de entrevistas n if obtenidas ( j - 1,
revisitas retrasan los resultados finales. 2 ,. .., r ) siguen una multinomial con probabilidades w 4¿P//2Ws,p,-. Re
sulta que
13.5 U N M O D E LO M A T E M A T IC O D E LO S EFECTOS v-/ i \ niwnP¡
D E L A S R E V ISIT A S
Deming (1 95 3) desarrolló un modelo matemático útil y flexible Por lo tanto, si y, es la media de la muestra obtenida después de i
para el examen más detallado de las consecuencias de diferentes visitas,
políticas sobre revisitas. La población se divide en r clases, de acuer
do con la probabilidad de que el entrevistado se encuentre en casa. Sea
Wí i ■= probabilidad de que se encuentre un entrevistado en la j-ésima Dado que este resultado no depende de n¡, la media incondicional
clase antes de la i-ésima visita. de y¡ es también fL¡. El sesgo en la estimación y es, por lo tanto,
p, - proporción de la población que cae en la j-ésima clase. (£ - £ ).
ií¡ - media de la característica para la j-ésima clase. La varianza condicional de y¡ para n¡ dado, se encuentra en for
<t-;2 - varianza de la característica para la j-ésima clase. ma similar que es
446 T E C N IC A S D E M U E S T R E O FU EN TES DE ERROR E N LAS ENCUESTAS 447
TA B L A 1 3 .9 . N úmero de E n t r e v is t a s , C o s t o s por E n t r e v is t a y Se s g o s
í */;P;W +(M/-/Á)2]
V'(j',-|ni) = i ; (13.10) Número de Costo
Número requerido entrevistas promedio por Sesgo
í H'i/P, Sesgo
i de visitas obtenidas entrevista I II
La varianza incondicional, al ignorar los términos de orden l/n¡3,
1 0.425//, 100 + 1.118 + 2.235
está dada aproximadamente al reemplazar n¡ en (1 3 .1 0 ) por su 2 0.771/1, 105 +0.711 + 1.421
valor esperado de (1 3.8). 3 0.882/1, 108 +0.421 +0.842
Finalmente, el error cuadrático medio de la estimación obtenido 4 0.933/1, 110 +0.266 +0.532
5 0.960/1, 114 +0.180 +0.360
después de i visitas es
ECM (y i| i)~ V(y 4| « )+ (¿ - / í )2 (13.11)
En II, por ejemplo, la media verdadera de la población p es 54%. La media
Debe considerarse también el costo de hacer i visitas. El número p ¡ obtenida de la primera visita es 56.235%, lo que da un. sesgo de + 2.235%
esperado de entrevistas nuevas obtenidas en la fe-ésima visita es mostrado en la tabla. Una política que requiere tres visitas reduce este sesgo
a + 0.842%.
Y ,(W kj-wk-i,>)Pj- P °r lo tanto, si ck es el costo por entrevista completa
Los valores del ECM (y ) obtenidos de un gasto dado de dinero se compa
en la fe-ésima visita, el costo esperado de hacer i visitas es n 0C (i ) ,
raron para las diferentes políticas de revisita. En las primeras comparaciones
donde la cantidad de dinero es suficiente para tomar n ü = 500 si solamente se hace
una visita. De la Tabla 13.9 el número esperado de entrevistas obtenidas du
C ( j ) = C, I W1;P/+ C 2 Z (W lj ~ W\l)Pj + ' • ’ + Cl I Oty ~ Wi-\,¡)Pi
rante la primera visita es E (n .,) = (5 0 0 ) (0.4 2 5 ) = 212.5. Si se hacen dos
Ejemplo. Una población con tres clases aparece en la Tabla 13.8. Se visitas, este número esperado debe ser reducido a E (n 3) = 212.5/1.05 = 202.4
intenta que las p ¡ y w ¡j representen encuestas en las cuales se entrevista a para mantener el mismo costo, y en form a similar para 3, 4 y 5 revisitas.
Estos valores de E ( n ¡ ) se sustituyeron en la Ec. (13.10) para dar V (y ) y,
un adulto al azar. Durante la primera visita las probabilidades de obtener
por lo tanto, ECM (y).
una entrevista se toman como 0.6, 0.3 y 0.1 en las tres clases. Durante la
La Tabla 13.10 presenta los ECM que resultan para tres importes de
segunda y subsiguientes visitas, las probabilidades condicionales de entrevistar
desembolso, correspondientes a n0 = 500, 1 000, 2 000 para una sola visita.
una persona omitida anteriormente son 0.9, 0.5 y 0.2. Estas cifras se hicieron
Cuando n 0 = 500, también se dan los valores del ECM (y ) para la situación
mayores que las probabilidades correspondientes a la primera visita para re
"no-sesgo” en la cual toda = 50. Esta columna muestra el efecto de las
presentar el efecto de una investigación inteligente por parte del entrevistador.
revisitas cuando las mismas son innecesarias, ya que no resulta sesgo alguno
El dato que se está estimando es un porcentaje binomial cercano a 50% . de reducir la encuesta a una sola visita.
Se consideran dos grupos de ¡i¡ ( I , I I ) . Por simplicidad, las varianzas dentro-
de-clase o f = ¡ij( 100 — ¡¡¡) se tomaron todas como 2 500. Los costos rela
TA B L A 13.10. Valores del ECM ( y ) para D if e r e n t e s P o l ít ic a s de
tivos por entrevista completa en visitas sucesivas son los dados en la Tabla 13.6.
R e v is it a que Cu e sta n la M is m a Su m a
La Tabla 13.9 muestra ( a ) el número total esperado de entrevistas obte
nidas para un total de i visitas, ( b ) el costo promedio de estas visitas por n„ = 500
entrevista, y ( c ) el sesgo (f i ¡ ~ P ) en la estimación y bajo las suposiciones (sólo para primeras visitas) "o = 1000 n0 = 2000
1 y I I acerca de las /ij.
Número
requerido No
TA B LA 1 3 .8 . C a r a c t e r ís t ic a s de las T res Clases
de visitas I* II* 1 11 1 11
sesgo
Clase
1 11.8 13.0 16.9 7.1 10.9 4.2 8.0
3 2 I2..4 12.9 14.6 6.7 8.3 3.6 5.2
i 2
3 12.7 12.9 13.6 6.5 7.1 3.4 3.9
0.45 0.50 0.05 4 13.0 13.1 13.4 6.6 6.9 3.3 3.6
Pl
0.6 + C0.4)[l — (0.1)*-»] 0.3 4- (0.7)[1 -(0 .5 )'-'] 0.1 +(0.9)[1 -(0 .8 )'-'] 5 13.5 13.5 13.8 6.8 6.9 3.4 3.5
55 50 45
ii/q 60 50 40
* Esta» rnprcnenlnii poblaciones con la m ás pequeña ( I ) y la m ás grande ( I I > can
tidades do songo, scgiln «o definen en la T a b la 13.8.
F U E N T E S D E ERROR E N LA S E N C U E STAS 449
448 TE C NIC AS DE M U E S TR E O
Después'de hacer el primer intento para llegar a las personas de s2 + ( l c - l ) W 2S22 (1315)
la muestra, otro método debido a Hansen y Hurwitz (1946), consiste \n‘ N/ n1
en tomar una submuestra aleatoria de las personas no entrevistadas
Entonces, las cantidades n ' y k se eligen para minimizar el pro
y hacer un gran esfuerzo para entrevistar a todos en la submuestra.
ducto C (V + S2/N ). De (13.15) y (13.13) tenemos
Esta técnica se desarrolló primero para encuestas donde el intento
inicial se hizo por correo, una submuestra de las personas que no
v + s V N _ < £ l z l ^ +í * S i (13.16)
contestaron el cuestionario completo se trató de alcanzar por el n n
método más costoso que es la entrevista personal.
Este método se puede ver como una aplicación de la técnica del C = (c0+ c i Wl)n ' + C
- ^ ^ (13.17)
muestreo doble para estratificación, que se presentó en la Sec.
12.2. Se empieza por tomar una muestra aleatoria simple de nr Por la desigualdad de Cauchy, el óptimo k es
unidades. Sea ra/ el número de unidades de la muestra que propor , /c2(S2- W2S22)
cionan los datos buscados, y tu! el número en el grupo de no res * * - V s X c + c W .) <1318)
puestas. Mediante esfuerzos más intensos, los datos se obtienen más
El tamaño inicial de muestra n' se puede elegir ya sea para mi
tarde de una submuestra aleatoria tu = v2n2/ entre los n !. Hansen
nimizar C con V especificada o V con C especificado, al resolver para
y Hurwitz usan la notación v2 = 1/fe de modo que n2 = n2'/fe.
n ' de (1 3 .1 6 ) o (13.17). Si V es especificada,
En el contexto de la Sec. 12.2 hay dos estratos. El estrato 1 con
siste en aquellos que no responden al primer intento con una muestra , N [S 2+ ( k - l ) W 2S22]
medida de tamaño na = n ! , de modo que v-, - 1. El estrato 2 son ¿pl (N V + S2)
aquellos que responderían al segundo intento con tu = n!/k. donde V es el valor especificado para la varianza de la media de
El costo de tomar la muestra es población estimada.
Las soluciones exigen un conocimiento de W .: a menudo, este
c0n '+ c ln l' + ^ . (13.12)
puede estimarse de experiencias previas. Además de S2, cuyo valor
450 TE C N IC A S DE M U E S TR E O
F U E N T E S DE ERROR E N LA S E N C U ESTAS 451
debe estimarse de antemano en cualquier problema de “ tamaño de Nótese que hemos puesto S2/V = 1 000, o V = S2/1 000, ya que esta es la
muestra”, las soluciones también involucran S22 que es la varianza varianza que tendría la media de la muestra si se tomara una muestra de
en el estrato de no respuestas. El valor de S2= puede ser más difícil 1 000 y se obtuviera una respuesta completa.
de predecir; probablemente no sea el mismo que S"-. Por ejemplo, en Consecuentemente, deberían enviarse por correo 1870 cuestionarios. De
encuestas por con'eo en casi todos los tipos de empresa económica, los 935 que no son devueltos, entrevistamos una muestra al azar de 935/2.739
los que responden tienden a ser los grandes operadores, con varian o sea 341. El costo es $2 095.
zas mayores entre unidades que los que no responden. Como lo ha señalado Durbin (1 9 5 4 ), el submuestreo probable
Si W.. no se conoce bien, como una aproximación satisfactoria mente no muestre un beneficio marcado a menos que c. sea grande
se busca el valor de n 'ópl de (13.18) y (13.19) provisionalmente para en relación con (c 0 + c ,W ,). Las dos cantidades son comparables,
una cierta gama de valores supuestos de W 2 entre 0 y un límite dado que (c 0 + CiWx) es el costo esperado por unidad de hacer el
superior seguro. El n V máximo de esta serie se toma como tamaño primer intento y procesar los resultados y c.. tiene el mismo signi
inicial de muestra n'. Cuando se reciben las respuestas a la encuesta ficado para el segundo intento. De las ecuaciones puede mostrarse
por correo, se conoce el valor de n¡'. Al buscar el valor de k usado que la razón del costo de obtener una V prescrita con k = 1 (sin
con este método, utilizamos la varianza v,.(y') condicional a los valo submuestreo) al costo mínimo para k óptimo es
res conocidos de n 2 y n'. Esta se puede obtener de (1 2 .4 ) y (1 2 .7 )
como S 2(c0+ c, + c2W2)_______________ c 0+c, W, + c2 Wz____
[V(S 2- W2S22) ( c0+ c 1W 1)+ J T 2W2S2f +
V iO T = s . ( i . i ) + ~ !
si S- y SV son aproximadamente iguales. Si r es la razón de c2 a
(c 0 + CtWx) la razón de costo se convierte en
La Ec. (13.20) se resuelve para encontrar el k que da la varian
1 + rW2
za-condición al deseada. Generalmente, el costo para este método es
un poco más elevado que el costo óptimo para W 2 conocido. (V w l+ S rW J 2
Ejemplo. Este ejemplo es una condensación de la publicación por Hansen Por ejemplo, la razón de costo es 1.029 para W ¡ = 0.5 si r = 4, 1.146
y Hurwitz (1 9 4 6 ). La primera muestra se toma por correo y se espera que la si r = 10 y 1.228 si r - 16. Pero si S= es bastante más grande que
proporción de respuestas sea 50% . La precisión deseada es aquella que daría S2= hay más que ganar del submuestreo.
una muestra aleatoria simple de tamaño 1 000 si no hubiera no-respuesta. El
costo de enviar los cuestionarios por correo es 10 centavos y el costo de pro Con muestreo estratificado, los valores óptimos de los n\ y los
cesar el cuestionario completo es 40 centavos. Llevar a cabo una entrevista kh en los estratos individuales son más complejos. Una buena apro
personal cuesta $4.10. ximación consiste primero en estimar, por los métodos de las Secs.
¿Cuántos cuestionarios deberían enviarse y qué porcentaje de los que no 5.5 y 5.9, los tamaños de muestra n oh que se requerirían en los es
responden deberían ser entrevistados?
tratos si no hubiera no respuesta. Ahora, de (13.19) si W 2 - 0, te
En términos de la función de costo (1 3 .1 2 ) los costos por unidad en
dólares son los siguientes: nemos
wc 2
c0 = costo del primer intento = 0.1
c, = costo de procesar datos por respuesta = 0.4 <13'21)
c, = costo de obtener y procesar los datos por cada no-respuesta = 4.5
Luego (13.19) se puede escribir como
Los n y fe óptimos se pueden obtener de (1 3 .1 7 ) y (1 3 .1 8 ). S i las va
rianzas S- y S23 se suponen iguales y N se supone que es grande, entonces r. .(fc-nw^i
n ¿ p , - n 01^14 J ( 1 3 .2 2 )
(4.5)(0.5) r_
°p' V c0+c,l *'1 V 0.11+ (0.4)(0.5)
= v(7)5 = 2.739 Esta ecuación aplicada separadamente a cada estrato, da una
aproximación al óptimo n/. Los valores de kh se encuentran al aplicar
, S 2( l + ( * - l ) H A ]
=— ~ = 1000{1 +(1.739)(0.5)} (1 3 .1 8 ) en cada estrato.
Estas técnicas se pueden usar con estimaciones de razón o re
= 18 70 gresión. Con la estimación de razón, las cantidades S- y S22 se reem
452 TE C N IC A S DE M U E S TR E O F U E N T E S DE ERROR E N LA S ENCU ESTAS 453
X X 6ní,yí,/(/ + l ) N N
plazan por Sd2 y S«J;, donde d¡ = y¡ — Rx¡. Con una estimación de
regresión, S2 se convierten en S2( l — p2) y S22 en S2=( l — p2). yFS= + ~D (d,gamos) (1324)
13.8 U N M O D E LO M A T E M A T IC O P A R A ERRORES
Aunque esta expresión es difícil de evaluar sin aplicarla a po D E M E D IC IO N
blaciones específicas, se pueden hacer dos comentarios. Si las p.¡
Teóricamente, podemos imaginar que es posible un gran número
no difieren grandemente, esto es, si el sesgo de las primeras visitas
de repeticiones independientes de la medida en la i-ésima unidad.
es moderado, el término dominante es el primero:
Sea i/id el valor obtenido en la «-ésima repetición. Entonces
y¡a = + eia (13.29)
puede definir como el valor obtenido cuando se mide mediante cierto TA B LA 13.11. C o m p o n e n t e s d e l E r r o r d e M e d ic i ó n en la
instrumento estándar bajo condiciones cuidadosamente prescritas. i -é s i m a U n i d a d
Sin embargo, podemos ver que nuestro instrumento estándar está
Símbolo Naturaleza del componente
sujeto a errores de medición y podemos esperar que con el tiempo
se desarrollará un instrumento más preciso. Con otras característi
P Sesgo constante sobre todas las unidades.
cas, por ejemplo, algún aspecto de la actitud de un empleado con f¡¡ — f¡ Componente variable de sesgo, que sigue alguna dis
respecto a su patrón, o de habilidad de una persona para enfren tribución de frecuencia con media cero conforme
tarse a sus problemas diarios, nadie puede reclamar que tiene un i varía y puede estar correlacionada con el valor
método satisfactorio de medir el “valor correcto”. N o obstante, el correcto
d¡a = eia — P¡ Componente fluctuante del error, que sigue alguna
concepto es útil aun en tales casos.
distribución de frecuencia con media cero y va
En mediciones repetidas de la misma unidad, los errores e¡„ rianza j , ! conforme a varía para i fija.
seguirán una distribución de frecuencia. Para la i-ésima unidad, su
pongamos que eia tenga media p¡ y varianza a?. El término p { re
construidas hace algunos años, Hansen, Hurwitz y Bershad (1 96 1)
presenta un sesgo en la medición. Las magnitudes de p¡ y ad depen apuntan que si algunas casas en la muestra se han vendido reciente
derán, desde luego, de la naturaleza de la característica medida y
mente, sus precios establecen un nivel de guía al entrevistador y al
del instrumento de medición. Pueden depender también de muchos
dueño en la asignación de precios a las casas que no se han vendido
otros factores. Con poblaciones humanas, el clima político y econó
durante muchos años. De hecho, el precio promedio registrado para
mico prevalentes y la cantidad y tipo de publicidad que la encuesta la muestra puede dependeT del orden en el cual aparezcan en la
haya recibido con anterioridad, pueden influir las respuestas al muestra las casas vendidas recientemente.
cuestionario.
Para manejar estas correlaciones intramuestra en sus términos
El siguiente paso es considerar cómo cambian los errores de
más generales, se requiere un modelo más complejo que el que se
medición cuando nos movemos de una unidad a la otra. Pueden sur presentó aquí. En particular, las notaciones para e¡<* y /3¡ _tendrían
gir varias complicaciones.
que indicar que sus valores pueden depender de otras unidades pre
Para el componente del sesgo, puede haber uno constante, sentes en la muestra. Sin embargo, los tipos de correlación que se
digamos, E {¡3¡) = p, que afecta a todas las unidades de la población. cree son los más comunes, en la práctica se pueden representar por
También habrá otra componente ( p¡ - p ) que sigue una distribu el presente modelo o por extensiones simples del mismo.
ción de frecuencia sobre la población. Esta componente puede estar Los componentes del error de medición se resumen en la Tabla
correlacionada con el valor correcto por ejemplo, e l aparato de
13.11.
medición puede subestimar consistentemente los valores altos de ¡u¡
Hemos notado además que los valores de p, y d,<* en diferentes
y sobrestimar los bajos.
unidades en la misma muestra pueden estar correlacionados uno
Puede haber una correlación entre los valores de eia en diferentes con el otro, cuando d¡a - eta — pi.
unidades en la misma muestra. El ejemplo .más sencillo es el “sesgo
Hansen et al. (1 9 5 1 ), Sukhatme y Seth (1 9 5 2 ), Hansen, Hur
del entrevistador” . Algunas veces se encuentran grandes diferencias
witz y Bershad (1 9 6 1 ), han desarrollado modelos semejantes al que
entre los valores de y,a obtenidos por diferentes entrevistadores que
precede así como Hansen, Hurwitz y Pritzker (1 9 6 5 ). Fellegi (1 96 4)
están muestreando partes comparables de la misma población [véase
ha dado un modelo más extenso que incluye numerosas correlacio
Lineau (1 9 4 1 ), Mahalanobis (1 9 4 6 ) y Barr (1957)1.
nes cruzadas que puedan existir entre diferentes fuentes de errores
Un efecto similar apareció cuando se cortan muestras de una
de medición en las situaciones prácticas.
cosecha por diferentes equipos y cuando se hacen análisis químicos
En sus artículos de 1965 y 1961 Hansen y otros., expresaron nues
o biológicos en laboratorios diferentes. El factor humano no es la
tro modelo en terminología un poco diferente incluida la adición de
única causa de correlaciones entre unidades que se miden más o
un subíndice G a todas las variables como recordatorio de que los
menos al mismo tiempo. El tiempo afecta muchos procesos de me
errores y sus magnitudes en general dependen de las condiciones
dición, algunos hacen uso de materias primas cuya calidad varía
generales ( G ) de la encuesta. Ellos expresan sus resultados en tér
de lote a lote. En la estimación del precio de venta actual de casas
minos de dia y de
458 TE C N IC A S DE M U ESTRE O FUENTES D E ERROR E N LA S E N C U ESTAS 45 9
p/ = £(y«Jí') = M ,+A (13.30) la media y de una muestra aleatoria simple también está sujeta al
sesgo ti. En la varianza estimada del error que asignamos a la media
La cantidad ^ (que denotan Y< o P¡ con una proporción) es de la muestra, el sesgo se cancela, ya que esta estimación se de
conceptualmente el promedio obtenido de numerosas repeticiones riva de una suma de cuadrados de los términos (y¡ - y ) 2. Conse
del proceso de medición de la unidad i. Así es que cuentemente, el cálculo usual de los límites de confianza para Y
a partir de los datos de la muestra ignora el sesgo. Los mismos re
d¡a = e¡a- p ¡ = y , „ - / V (13.31)
sultados se aplican al muestreo aleatorio estratificado.
Llaman a dia, la desviación de la respuesta en la unidad i, en
tanto que nosotros la hemos llamado la componente fluctuante del La situación es esencialmente la misma con las estimaciones de
error de medición. Por lo tanto, razón y de regresión. Considérese la estimación de regresión
donde / es la media de población de los m'. donde tanto las y¡ como las x.¡ pueden estar sujetas a sesgos cons
tantes (3U y (3,., respectivamente. Dado que la estimación de mínimos
Promediando sobre la muestra tenemos, cuadrados b permanece inmutable y dado que el sesgo fix se cancela
ya- p = < ¡ a + (¿ L '- p ')+ (f j. '- p ) (13.33) en el término [ X — x ) , se obtiene que yu está sujeta a un sesgo ¡3y.
Es fácil verificar que la estimación de V(y,r) de la muestra no con
Esto conduce a la fórmula tiene ninguna contribución debida al sesgo.
P=^
Al encontrar las varianzas, primero promediamos sobre repeticio N
nes del proceso de medición sobre una muestra específica y después Como lo muestra (13.41), la suma de la varianza de respuesta
sobre diferentes muestras aleatorias simples. Ahora, V (d ¡« ) = <n2 y
y la varianza de muestreo tiene un límite superior N P Q / n (N — 1).
los errores no están correlacionados en unidades diferentes dentro
Este límite superior es también la varianza de la media de muestra
de la muestra. Por lo tanto, para el muestreo aleatorio simple, si S
de las mediciones correctas sobre las unidades, si la cpf se ignora
denota una muestra especifica
y no hay sesgo global. Ya que la medición correcta m en cualquier
unidad es entonces una variable binomial con media P, de modo que
E(.da2\S) = ~2 Z °V2 (13.37)
« .
Cuando promediamos subsecuentemente sobre todas las muestras % mi & k T ) P Q z y M
aleatorias simples, tenemos
Este resultado más bien inesperado es válido porque ( 1 ) la varianza
de muestreo que entra en (13.39) y (13.40) es la de n,' = (fi¡+l3¡)
l N j . I U ' - M ) 2
y ( 2 ) en la estimación de una proporción ¡n y p¡ son siempre nega
= -S t T I- ( 13.38) tivamente correlacionadas. Cuando /x, = 1, p¡ < 0, pues P,¡ = (j í ¡ + p¡) < 1,
y de manera semejante cuando /j.¡ =0, p¡ s=0. De modo que el
= -c r d2-r(- ^ - S Z (13.39) término
n n
donde a? denota el promedio de población de las varianzas de los s ¡¿
n
errores de medición. En la terminología de Hansen y otros, ap/n es
la varianza de respuesta de la estimación de muestra de ya. en (13.39) es siempre menor
Con errores no correlacionados, el mismo modelo se puede aplicar c2
al estimar una proporción de población P (Hansen, Hurwitz y Ber
n
shad, 1961). Para cualquier unidad, sea elvalorcorrecto p{ igual
a uno sila unidad está en la clase C y cero en el casocontrario. Si por una cantidad aproximada de la varianza de respuesta de ¡ja.
462 TE C N IC A S DE M U ESTRE O
F U E N T E S DE ERROR E N LA S E N C U ESTAS 463
Con errores no correlacionados, un resultado útil es que la donde los productos se promediaron sobre todos los pares de uni
fórmula usual para v (y a ) en muestreo aleatorio simple permanece dades en la misma muestra. Por analogía, con el muestreo conglo
sin sesgo si puede ignorarse la cpf. Del Teorema 2.4 corolario, esta merado, el coeficiente de correlación intramuestral promedio p w pue
fórmula desarrollada al suponer que no hay errores de medición es de definirse por la ecuación
E ( d,a dja) = pw<rd2 (13.49)
,13-43) Esto nos da, a partir de (1 3.48 ),
Ahora bien,
nos) de la asignación del entrevistador. También puede haber alguna que el progreso será lento y costoso. Una razón es que, como ya se
correlación entre los errores de mediciones para diferentes entrevis mencionó, los errores de medición dependen íntimamente tanto de
tadores (como, por ejemplo, cuando han sido entrenados o dirigidos las características como de los procedimientos de medición Los re
por el mismo supervisor). sultados acerca de los errores de medición hallados para una en
Este modelo sólo representa el tipo más simple de correlación cuesta rara vez pueden suponerse aplicables a otras.
intramuestral. Con muestreo estratificado, por ejemplo, un codifi Idealmente, el mejor método para estudiar los errores de medi
cador puede procesar resultados de varios estratos y por un mal ción es obtener los valores correctos de Pi. En la práctica, esta vía
entendido en las instrucciones puede introducir errores correlacio de acceso está limitada a características para las cuales existe un
nados que se extienden por sobre los estratos. El modelo matemá método factible para encontrar Pi y por problemas de ejecución y
tico se puede adaptar para aplicarlo a situaciones de este tipo. gasto. Algunos ejemplos son dados por Belloc (1 9 5 4 ), quien com
paró los datos sobre hospitalización declarados en entrevistas a do
13.12 R E S U M E N D E LO S EFECTOS DE micilio, con los registros del hospital para el individuo, y por Gray
ERRORES D E M E D IC IO N (1 9 5 5 ), quien comparó las declaraciones de los empleados respecto
a sus ausencias por enfermedad con los registros de la oficina de
En términos del modelo, la media y de una muestra aleatoria personal. Las comprobaciones de este tipo, algunas veces llamadas
simple sería insesgada, con varianza S ^ /n (ignorando c p f), si todas ''registro-verificación", son posibles con características tales como
las mediciones fueran perfectamente exactas. Como resultado de los edad, ocupación, número de años de escuela y precio pagado por
tipos de errores de medición aquí discutidos, la media puede estar automóvil. Una dificultad es que algunas veces los registros no con
sujeta a un sesgo de cantidad /?, y su error cuadrático medio es tienen un reflejo exacto de la persona entrevistada.
A l faltar un método para determinar el valor correcto, una alter
ECM(y„) = +crd2[ l + ( n - l)p w]} + 0 2 (13.54) nativa es volver a medir, mediante un método independiente que se
n
considera más exacto. Kish y Lansing (1 954) contrataron evalua
donde ¡x¡' = ¡n + j8|. dores profesionales para estimar los precios de venta de casas que
La Fórmula 13.54 contiene dos términos, S/*/n (1 - Pw)/n, ya habían sido declarados por su propietarios. En investigaciones
que disminuyen con 1/n. Los otros dos términos, Pw crd2 y /?=, a pri estadísticas sobre enfermedades, las contestaciones de los entrevis
tados se han comparado, sea con los registros de su médico o con
mera vista parecen independientes de n. Pero esto puede ser una
sobresimplificación. Cualquier cambio material en el tamaño de la los resultados de un examen médico completo [Sagen, Dunham y
Simmons (1 9 5 9 ), Trussell y Elinson (195 9)]. Los resultados de tales
muestra puede requerir un cambio de los métodos de campo de me
dición y esto puede afectar a y [i2. Sin embargo, estos dos términos comparaciones no son fáciles de interpretar en términos del modelo,
dado que el instrumento superior está en sí mismo sujeto a errores
deberían cambiar con relativa lentitud, si acaso, de acuerdo con n.
Ya que en muestras grandes el ECM parece estar dominado por estos de medición, pero las comparaciones indicarán, cuando menos, las
características para las cuales el instrumento de rutina concuerda
dos términos; la varianza ordinaria de muestreo se vuelve no impor
bien con el instrumento superior y aquellas con las cuales no con
tante y es engañosa como guía para la exactitud real de los resultados.
cuerda.
En encuestas por entrevistas a viviendas, un método con un pro
13.13 E L E ST U D IO D E LO S ERRORES D E M E D IC IO N pósito semejante consiste en volver a entrevistar una submuestra
de los entrevistados con entrevistadores más expertos y con un cues
En años recientes se ha investigado profusamente el estudio de tionario más detallado y exhaustivo. Después de la reentrevista, el
los errores de medición en las prácticas de muestreo. Los objetivos experto discutirá con el entrevistado las discrepancias entre las res
son descubrir los componentes que contribuyen principalmente al puestas originales y las repetidas, con objeto de determinar la
ECM y encontrar las maneras de disminuir estas contribuciones. respuesta más exacta y la razón de la discrepancia. Así puede ga
Algunos de los métodos principales se describen en ésta y en las narse mucha información útil. Al presentar algunos métodos para
secciones subsiguientes. En la actualidad está perfectamente claro la medición de errores de respuesta, Madow (1 965) discutió el uso
466 TE C N IC A S DE M U ESTRE O F U E N T E S D E ERROR E N LAS ENCU ESTAS 467
del muestreo doble con un estimador de diferencia de la forma Esta expresión estima o-ji2, que es la varianza simple de respuesta
[ y ' - ( y - 4 )J como medio para reducir el sesgo de las respuestas. para el agente 1 en la encuesta, si se cumplen dos condiciones ( A ) :
Aquí /í es la media de las mediciones no sesgadas o menos sesgadas no hay correlación entre errores de respuesta dn , di2, en la misma
hechas sobre la submuestra, en tanto que y' y y son medias de las unidad; y v¿,2 = a¿22. La Ec. (1 3 .5 6 ) se aplica a un solo par de
mediciones originales sobre la muestra y submuestra. agentes y se promedia sobre la submuestra de k pares de agentes.
Ocasionalmente, son factibles las comparaciones generales entre Las condiciones A pueden presentarse cuando la medición es una
los resultados de dos reconocimientos diferentes. Para un cierto nú codificación y los agentes son codificadores de habilidades seme
mero de características, los resultados del “Censo de los Estados jantes y están entrenados por supervisores diferentes, sin que un
Unidos" se pueden comparar con los dados por el “Reconocimiento codificador pueda ver el trabajo de otro. Al hacer la entrevista, se
de la Población Actual” que se tomaron al mismo tiempo. Dado que puede esperar una cov ( d u d ¡.) positiva porque algunos entrevis
el “Reconocimiento” se considera más exacto, particularmente para tados repiten una respuesta incorrecta de memoria. En este caso,
características difíciles de medir, se pueden obtener estimaciones I (y ,t-y ,z)ll 2m subestima od?. También subestima crdl2 si el segundo
imprecisas del sesgo de medición ,6 en los datos del “Censo” [Hansen, agente es más hábil que el primero como lo muestran para una me
Hurwitz y Bershad (196 1)]. Stephan y McCarthy (1 9 5 8 ), describen dición (0 ,1 ), Hansen, Hurwitz y Pritzker (1965). Aún más, se ha
un cierto número de comparaciones entre resultados de muestras de encontrado que £ {y u -y i-iP llm declina si el segundo entrevistador
cuota y muestras por probabilidad. obtiene las respuestas que obtiene el primero, aun cuando se le
En las secciones siguientes consideraremos algunos métodos di indique que no las vea hasta terminar la n entrevista repetida (Koons,
señados para producir estimaciones cuantitativas de las componen 1973). Estas complicaciones ilustran lo difícil del estudio realista
tes de la varianza total (varianza de respuesta más varianza de de los errores de medición.
muestreo) de una estimación muestral. Para la varianza total de respuesta, la estimación pertinente a
partir de (13.55) para un solo par de agentes es (y .i-y . 2) 2/2, donde
y.i, y .2 son las medias de las primeras y de las segundas m medicio
13.14 M E D IC IO N E S R E P E T ID A S D E S U B M U E S T R A S nes. En las condiciones (A ).
Pritzker y Hanson (1 96 2) han llamado a la razón La interpretación de estas comparaciones, a menudo se ve oscu
recida por las dudas que existen sobre la validez de las condiciones
A. Estimaciones más complejas basadas en supuestos más realistas
son las que da Fellegi (1964).
el índice de inconsistencia, que es análogo a la cantidad (1 — </>),
donde 4, es el coeficiente de contabilidad usado al estudiar errores
13.15 S U B M U E S T R A S IN TE R P E N E T R A N T E S
de medición en psicología. Si pu, es despreciable, 1 se puede estimar
a partir de la razón de (13.56) a (13.58). Esta técnica de particular utilidad en el estudio de errores correla
Con una variable (0 ,1 ), las Ec. (13.40) y (13.41) de la Sec. cionados fue propuesta por Mahalanobis (1946). Para presentarla
(13.10), al tener n = 1, muestran que para una sola medición de en los términos más simples, se divide una muestra aleatoria de
una sola unidad, la suma de la varianza simple de respuesta y la n unidades, al azar, en fe submuestras, donde cada submuestra con
varianza de muestreo es V{yla) = PQ, donde P = JJP J N , al supo tiene m = n/k unidades. El trabajo de campo y el procesamiento
ner que puede despreciarse f. El conjunto de valores por pares (y iu de la muestra se planean para que no exista correlación entre los
yi2) obtenido por ambos agentes se resume en la siguiente tabla errores de medición de 2 unidades en submuestras diferentes. Así,
2 X 2 de frecuencias. por ejemplo, supongamos que la correlación de la que nos ocupamos
se origina solamente en sesgos de los entrevistadores. Si cada uno
Núm ero de respuestas de los k entrevistadores se asigna a una submuestra diferente y si
Segundo agente no hay correlación entre errores de medición para entrevistadores
1 0 Total diferentes, tenemos un ejemplo de la técnica.
Con el mismo modelo matemático es conveniente rotular las
Primer 1 a b a +b unidades con subíndices dobles. Sea
agente 0 c d c+d
yiia = p'>i + di¡a (13.61)
a+c b+d m
donde i denota la submuestra (entrevistador) y j el miembro dentro
Así, b es el número de unidades sobre las que el primer agente re de la submuestra. Se ignora la cpf.
gistra 1, y el segundo agente registra 0. En las condiciones A Dado que la submuestra i-ésima es una submuestra aleatoria,
ella misma es una muestra aleatoria simple de tamaño m. De modo
K y u - j'iz )2 que, por (13.51), la varianza de su media es
- 2 ¡ ■= (b + c)/ 2 m (13.59)
o-d —
2m V (y J = ^ { S S + a d2[ l + ( m - l)p „]} (13.62)
Como estimación de 1 a partir de la submuestra, una elección es
donde pw es la correlación entre los di¡a obtenidos por el mismo en
I = Z 4 = --------------- m ( b + c ) ---------------- (13.60) trevistador.
PQ (a + b )(c + d ) + {a + c){b + d)
Como los errores son independientes en las diferentes submuestras,
que promedia las estimaciones PQ a partir de los dos conjuntos de
mediciones. Las estimaciones del índice han sido publicadas tanto y {ya ) » r V(yu, ) = 7 ( V + <rd\ 1 + (m - 1 )p w]} (13.63)
para el Censo como para la encuesta por muestreo por Pritzker y Han-
son (1962), Fellegi (1 9 6 4 ) y Koons (1973). Estas estimaciones son De los resultados de la muestra se puede calcular un análisis de
útiles al comparar la poca confiabilidad relativa de la medición para la varianza de las km observaciones en las componentes "Entre
diferentes atributos en censos sucesivos, o entre métodos diferentes entrevistadores (submuestras)” con (fe — 1) grados de libertad y
de medición, al proporcionar así una evaluación de los nuevos mé ‘‘Dentro de entrevistadores” con k (m — 1 ) grados de libertad. Es fácil
todos de medición. verificar que los valores esperados de los cuadrados medios prome-
470 T E C N IC A S D E M U ESTRE O F U E N T E S DE ERROR E N LA S E N C U ESTAS 471
T A B L A 13.12
de unidades últimas en la asignación de un entrevistador se conserva
en su nivel acostumbrado en la encuesta, aunque el entrevistador
Esperan zas de los Cuadrados M e d io s ( con Ba s e e n u na Un id a d )
tenga que viajar de una área dos veces mayor que la usual. Para un
gl cm E(cm) conglomerado, la Tabla 13.12 proporciona un grado de libertad entre
entrevistadores y 2 (m - 1 ) g.l. dentro de entrevistadorés: las me
Entre dias cuadradas correspondientes se promedian sobre los conglomera
entrevistadores dos elegidos para el estudio. Desde luego, la varianza de muestreo
(submuestras) que se mide es sólo aquella dentro de la última etapa de la conglo
V + aa2[ l + ( « - ! ) ? . , ]
k 1 b k -1 meración. Como recordatorio de este hecho, el término de la varianza
Dentro de del muestreo en E (c 7n ) a veces se escribe Suin (1 — P¡) en lugar de
entrevistadores S/P2, donde p, es la correlación intraconglomerados entre los errores
. . n , H .(y u a -? J 2 SS+cr¿2( l - p w)
k (m - 1) k ( ^ { ) de muestreo para subunidades diferentes.
En esta forma se usó el método de interpenetración en el estudio
______________________________________________________________— --------- ---
Response Variance Study 1 del U.S. Census Bureau (1968), diseña
diados sobre selecciones de los entrevistadores y de las muestras do para estimar las componentes correlacionadas de las varianzas tota
aleatorias y submuestras aleatorias vienen a ser como se muestra les de respuesta de atributos en el censo 1960. Las áreas en este
en la Tabla 13.12. estudio eran conglomerados compactos de viviendas, los conglomera
La Tabla 13.12 contiene 2 resultados importantes. Al comparar dos se dispersaron sobre todos los EE.UU. En un conglomerado de
con (13.63) vemos que sb3/n es una estimación insesgada de V(ya), muestra cualquiera se formaron dos submuestras interpenetrantes
si se ignora la cpf. Así es como las submuestras interpenetrantes y se asignó cada submuestra a un entrevistador diferente.
proporcionan una estimación de V(ya) que toma en cuenta apropia En la mitad de los conglomerados, los dos entrevistadores tenían
damente la varianza simple de respuesta y la componente correla diferentes jefes de equipo. En una mitad se supuso, como parece
cionada. razonable, que los errores de respuesta de los dos entrevistadores
El análisis también permite estimar la componente correlaciona no estaban correlacionados. Así ( s ¡,5 - suf)/m estima Pw <¡¿, donde
da, ya que Stf es ahora el cuadrado medio promedio entre entrevistadores en el
mismo conglomerado. En la otra mitad de los conglomerados, los
Ei l ¿ Z± ? ) =Pw(T2 (1364) dos entrevistadores tenían el mismo jefe de equipo. Aquí, el objetivo
m
era medir hasta donde “el efecto jefe de equipo” inducía una cova-
En consecuencia, al comparar (m - 1 ) (s 6= - sw2)/ m con sb2, rianza entre d., y d ». para los dos entrevistadores en un conglomera
se estima la cantidad relativa con que la componente correlacionada do. De ser así, sb- en la Tabla 13.12, ahora estima
de la varianza de respuesta contribuye a la varianza total de ya. Con
■V2( 1 - P.) + (r A 1+ ( " » - 1 )Pw] ~ mE cov (d ,<¿2)
mediciones en donde la componente correlacionada es mucho mayor
que la varianza simple de respuesta, la razón (m - 1 ) ( s f — s„! )/ y (si ,2 — Sa'^/m estima
msb'- se ha usado en forma alternativa como medida de la contribu
ción relativa de la varianza total de respuesta a la varianza total de pwa / - E (c o v d Ad 2) (13.65)
ya. Tepping y Boland (1 9 7 2 ) presentan estimaciones de esta razón A l comparar' los dos conjuntos de valores de (s*J — sw2)/ m se ve
para atributos que aparecen en el “Reconocimiento de la Población que existe un efecto “jefe de equipo” . Dado que las diferencias entre
Actual” . estimaciones de la varianza como sb- y sw5 son inestables, se necesita
Cuando el método de interpenetración se aplica en una muestra un gran número de conglomerados en las dos mitades de este tipo
de varias etapas que cubre una extensa área geográfica, la práctica de estudio para medir el efecto "jefe de equipo” con alguna precisión.
más común consiste en tener pares de entrevistadores que miden las La técnica de interpenetración se extiende al muestreo estratifi
submuestras interpenetrantes extraídas de los conglomerados más cado y al de varias etapas. Si el interés primario está en obtener una
;pequeños de entre las etapas sucesivas. De esta manera, el número estimación insesgada de V(ya) que tome en cuenta adecuadamente
F U E N T E S D E ERROR E N LA S E N C U ESTAS 473
472 T E C N IC A S DE M U ESTREO
una pregunta de la muestra es delicada o muy personal (com o, por. fácilmente encontramos
ejemplo, ¿suele el entrevistador robar objetos de las tiendas o usar
drogas?). Considérese primero la estimación de una proporción bi T/i (¡ , _ ^ a ( 1 -tta ) P (i- p )
V (* A„ ] (13.70)
nomial — la proporción vA de entrevistados que pertenecen a cierta
clase A o han cometido cierto acto— . A l utilizar ingeniosamente un
El primer término en V (ñ AW) es la varianza que tendría V(írA) si
artificio de aleatorización, Warner (1 9 6 5 ) mostró que se puede esti los n entrevistados contestaron verazmente a una pregunta directa
mar esta proporción sin que el entrevistado revele su posición per sobre su pertenencia a la dase A. Salvo cuando esté cerca de
sonal respecto a la pregunta. El objeto es ayudar a que se den res y P > 0.85 el segundo término es mayor que el primero, a menudo
puestas veraces y se conserve plenamente lo confidencial del asunto. mucho mayor. Por lo tanto, en general, el método es muy impreciso.
El artificio de aleatorización, como es la flecha giratoria o una Esto podría esperarse, ya que el entrevistador no sabe si una res
urna con bolas blancas y rojas, selecciona uno de dos enunciados o puesta “afirmativa” implica una pertenencia a la clase A o a su
preguntas, cada uno de los cuales requiere una respuesta “sí” o “no” opuesta. Sin embargo, como lo mostró Warner, su método puede
por parte del entrevistado. El entrevistador no sabe cuál es la res dar un ECM menor de lo que daría una pregunta directa delicada,
puesta dada por el entrevistado, pero sí sabe cuáles son las proba si esta última produjera numerosos rechazos o respuestas falsas.
bilidades relativas P y (1 - P ) con las que se han presentado los
dos enunciados. El éxito del método depende de que el entrevistado
13.18 L A S E G U N D A P R E G U N T A N O R E L A C IO N A D A
esté convencido de que su participación no revelará su posición
personal con respecto al asunto que se considera delicado o muy per
sonal. Como alternativa al método de Warner, Simmons sugirió (Hor-
vitz. Si ah y Simmons, 1967) que la cooperación de los entrevista
En la proposición original de W arner los dos enunciados son:
dos podría mejorar si el segundo enunciado no fuese delicado y no
“Soy miembro de la clase A.” (Presentada con probabilidad P ) tuviese relación con el primero. Por ejemplo,
“N o soy miembro de la clase A.”
“Yo nací en el mes de mayo”.
Con una muestra aleatoria de n entrevistados, el entrevistador
registra una estimación binomial $ = m/n de la proporción <f> de El primer enunciado no se ha alterado. Si todos responden veraz
respuestas “afirmativas” . Si las preguntas se contestan verazmente, el mente, la proporción de población de respuestas “afirmativas” es ahora
cociente entre <¡> y tt,, en la población es
4> =PrrA + (1 - P ) ttu (13.71)
<f>= P vA + ( l - P ) ( l - v A) = (.2 P - l)n A + ( l - P ) (13.66)
donde ttv es la proporción en la población muestreada de los que na
Con P conocida, esta relación sugiere la estimación cieron en mayo. Si se conoce la estimación obvia y de mayor
verosimilitud de t,, es
* [0 - q - f ) ] ( P A\
* Aw - \ P * 2) (13.67) [<í> - ( I - P ) ttu]
¿ a u ~'
ttau = p (13.72)
Esta estimación resulta ser la estimación de mayor veracidad de vA.
(E l subíndice W es por “Warner” .) La estimación es insesgada, con con varianza
varianza
V(ñAu) = ~ n ~ 'f* (13.73)
(13.68)
Murtón (Greenberg y otros., 1969, Pág. 532) ha sugerido cómo pue
Al escribir (1 - </>) en la forma de obtenerse siempre el caso irv conocida. Una urna contiene bolas
azules,blancas y rojas en proporciones conocidas Pu P2, P3. Al sacar
(1-<¿) = (2 P —l)(l- 7 r A) + (l —P) (13.69)
una bola rojase produce un enunciado delicado. Al sacar una bola
476 TE C N IC A S DE M U E S TR E O
F U E N T E S D E ERROR E N LA S ENCU ESTAS 477
azul o blanca se produce el enunciado: “El color de esta bola es blan preservar la confidencialidad, es útil tener trv aproximadamente igual
co” . Así itu = P-J ( Ps + Pj )• a 7ta.
Dovvling y Shachtman (1 9 7 5 ) han mostrado que V( ttau) < V(-irAW) Se han estudiado muchas variantes de estos métodos (como sería
para todas las ir*, wa siempre que P exceda %. (L a varianza de ttaw el uso de preguntas no relacionadas) así como los sesgos producidos
es simétrica alrededor de P — Vi, pero la de frAU no lo es, y una P en ¿ aw y ttau si una fracción de los entrevistados contesta falsa
pequeña da lugar a pocas respuestas a la pregunta delicada con este mente a la pregunta. Greenberg y otros (1971) han aplicado la técnica
método.) de dos muestras para estimar la media pA a una variable sensible
Si fuese necesario estimar t a y *0 podemos tener dos hnuestras discreta o continua, por métodos análogos a los que conducen a las
aleatorias de tamaños n¡, h2, con proporciones diferentes P lt P2 a la Ecs. (13.74) y (13.75). La pregunta no relacionada estima la media
pregunta delicada. A l denotar <t>u las proporciones de respuestas pv para una variable no sensible. Los subgrupos aleatorios de 72¡
“sí” en las poblaciones definidas por las selecciones P, y Px, sujetos ( i = 1 , 2 ) reciben la pregunta delicada con probabilidad P¡.
y la no delicada con probabilidad (1 - P ¡). La variable registrada z¡
«¿ ^ P .^ + O - P ,)^ (13.74) para unsujeto, sigue por tanto una mezcla de dos distribuciones en
<t>i = PiTrA + ( 1 - P 2)7Tu (13.75) las proporciones P¡, (1 — P ¡), una distribución con media p A, va
rianza crp, y la otra con media pv, varianza <rc2. Por lo tanto,
Estas relaciones sugieren la estimación
E (zl) = Pip A H l ~ P í)P v (13.80)
[¿ .(l- P iM U - P .)]
V<Z() = f W + (1 ■- P . W + P A 1 - P i)(M a - P u )2 (13.81)
(? F iy (1376)
Análogamente a (1 3.76 ), la estimación de pA es
con
- _ [(1 - P 2 )f,- (1 - P ,)¿ 2 ]
V (^ )- \ (13.77,
(P 1- P 2) 1 nx n2 J » AU [ P {~ P 2) (1382)
Para una eficiencia máxima se requieren las condiciones pv = pA,
Si P, > l/¡. Greenberg y otros, (1 9 6 9 ) mostraron que esta varianza
¡Tu3 = 0 , en tanto que para preservar el anonimato lo mejor es pv =
se minimiza cuando P 2 = 0 , o sea, cuando a todos los miembros de la
Pa, cu2 ~ va'-
segunda muestra (n s) ha hecho la pregunta ttv no relacionada. Moors
Warner (1 97 1) ha construido un contexto teórico para una gran
(1971) recomendó este procedimiento, pero Greenberg y otros (1969)
clase de modelos de respuestas aleatorizados. Como lo sugieren
sugieren P, + P, = 1 como regla de trabajo, cuando la elección P2 = 0
(13.74) y (13.75) el truco consiste en estimar ciertas funciones li
pudiera debilitar la cooperación de los entrevistados. Cuando, por
neales de las ir o p delicadas y no relacionadas con tantas ecuacio
ejemplo, P, = 0.8 en promedio el 80% de la muestra 1 y el 20% de
nes como parámetros a estimar.
la muestra 2 se verían confrontados con la pregunta delicada.
El método se ha aplicado a la obtención de estimaciones de las
Con las óptimas n „ n, para dada n - nt + n,, la desigualdad de proporciones de nacimientos ilegítimos, de abortos inducidos, de adic
Cauchy-Schwarz muestra que la varianza mínima resultante de ttau es tos a la heroína, de personas conectadas con el crimen organizado,
y del ingreso medio y número de abortos, como aplicaciones conti-
Vm!n(ñ AU) = * p ,2[ ( l - P 2) ^ . a - < f r i ) + a - P f r f t i o 3 ^ ) ] 2 (13.78) nuas-discretas. Como el método ha llamado mucho 1&. atención, se
n ( r , - P 2)
puede esperar que aparezcan más aplicaciones. Horvitz, Greenberg
La razón n,/n2 minimizante es y Abernathy (1 9 7 5 ) han hecho una excelente revisión.
«1 (1 - P 2
2))
Ultimamente se ha discutido el grado de privada que los entre
vistados tienen en las diferentes versiones de las entrevistas aleato-
n2 ( 1- P .,)) V
V ^ 2d(l-<
- ^^ 2) (13'79)
rizadas. En algunas versiones el entrevistador puede conjeturar la
Esta elección requiere estimaciones anticipadas de irx y *u, pero posición de algunos entrevistados sobre la pregunta delicada con
el óptimo es bastante plano. Greenberg y otros (1 9 6 9 ) hacen algunas
una probabilidad bastante alta de corrección, — lo que es un aspecto
recomendaciones respecto a las elecciones de P,, P2, n¡ y n-.. Para indeseable para este método.
F U E N T E S DE ERROR E N LA S ENCU ESTAS 479
478 T E C N IC A S DE M UESTREO
donde F = S2/S¡2. Sea c0 = c, — 1, c, = 16. ( a ) Si F =. 1, demuestre que Entre entrevistadores 4 22.3 <V2+ o/+ 3 5o-/s2+ 105cr,2
la razón de costo tiene un máximo de 1.25 cuando W 3 = 0.2 o 0.25. ( b ) Entrevistas X estratos 8 9.6 <V j + ^ 2+35<70 2
S i F — 1.5, demuestre que el máximo es 1.41 para W , = 0.3 o 0.35. Dentro de submuestras 510 9.9 cr^ + crdz
13.6. En una encuesta de aves de corral y cerdos mantenidos en patios y
ciertas instalaciones pequeñas (G ray, 1957), una encuesta por correo con
Si g ^ vshi, representan sesgos del entrevistador i, el modelo para una
varios recordatorios, se continuó con entrevistas de una submuestra de las
sola fam ilia es
personas que no contestaron. Por un juicio adelantado, se escogió fe = 2 (es
decir, tina submuestra del 50% ) . Para una característica importante se dis
y = i ¡ - k + gl + ^iü+(u'hii-p-h)+ ‘ilu^
puso de los siguientes datos después de la encuesta, en la notación del
Ejercicio 13.5. Varianzas: cr,2 crIS2 o / ad2
Bibliografía
tciuuie», i
496 T E C N IC A S DE M U ESTREO
Watson, D. J. (193 7 ). The estimation o f lea f areas. Jour. Agr. Sci., 27, 474.
West, Q. M. (1 9 5 1 ). The Results o f Applying a Simple Random Sampling
Process to Farm Management Data. Agrícultural Experiment Station, Cor-
nell Uitiversity.
William s, W . H. (1 963). T h e precisión o f some unbiased regression estimators.
Biometrika, '17, 267-274. Respuestas a los Ejercicios
Wishart, J. (1 9 5 2 ). Moment-coefficients o f the fe-statistics in samples from a
fin ite population. Biometrika, 39, 1-13.
Wold, H. O. A. (1 9 5 4 ). A Study in the Analysis o f Stationary Tim e Series.
Alm qvist and Wicksell, Stockholm, segunda edición.
W oodruff, R. S. (195 9 ). The use o f rotating samples in the Census Bureau’s
1.1. ( a ) Como ejemplos de problemas de definición, se tienen las deci
Monthly Surveys. Proc. Soc. Stat. Sect. Am er. Stat. Assoc., 130-138,
siones de contar las letras en e l prólogo o en el índice y de cómo tratar a los
W oodruff, R. S. (197 1 ). A simple method fo r approximating the variance
símbolos matemáticos como "palabras". Sin embargo, en un libro como éste,
o f a compíicated estímate. Jour. Am er. Stat. Assoc., 66, 411-414.
con muchos símbolos matemáticos, parece poco probable que se quiera contar
Woolsey, T . D. (1956). Sampling methods fo r a small household survey. las palabras, ya sea incluyendo u omitiendo los símbolos, ( b ) ( 1) Las páginas
Pub. Health Monographs, Núm. 40.
constituyen un marco conveniente. Una desventaja de una página como unidad
de muestreo en la que contamos todas las palabras en una página de muestra
Yates, F. (1 9 4 8 ). Systematic sampling. P hil. Trans. Roy. Soc. London, A241, es que con numerosas ilustraciones, el número de palabras por página puede
345-377. ser muy variable, debido a las páginas incompletas. Quizá valdría la pena
Yates, F. (196 0 ). Sampling Methods fo r Censuses and Surveys. Charles Griffin primero poner en lista todas las páginas incompletas y form ar dos subpobla-
and Co., London, tercera edición. ciones o estratos de páginas incompletas y uno de páginas completas, mues-
Yates, F., y Grundy, P. M. (1 953). Selection without replacement from within treadas separadamente por el método de muestreo estratificado descrito en
strata with probability proportional to size. Jour. Roy. Stat. Soc., B15, el Cap. 5. ( 2 ) Un problema con el renglón es que el obtener una lista de ren
253-261. glones para que se puedan muestrear directamente los renglones, consumiría
mucho tiempo. También hay renglones incompletos al final de los párrafos.
Zarkovic, S. S. (196 0 ). On the efficiency o f sampling with various probabilities Sin embargo, como las palabras por renglón son más o menos estables en
and the selection o f units with replacement. Metrika, 3, 53-60. números, la solución podría ser el usar un muestreo en dos etapas (Cap. 11)
Zukhovitsky, S. I., y Avdeyeva, L. I. (1 9 6 6 ). Linear and Convex Programming. en el que se extraiga primero una muestra de páginas, y después se cuente
W . B. Saunders, Philadelphia. el número de renglones en cada página seleccionada y se extraiga una sub
muestra de renglones en estas páginas.
1.2. La cuestión supone que primero debemos extraer una muestra de tar
jetas con probabilidad igual, ( a ) Si los nombres de muestra que no están
en la población objeto se descartan, el único problema es que el tamaño de la
muestra de nombres a partir de la población objeto será generalmente más
pequeña que el número de tarjetas y además, será una variable aleatoria que
depende de las tarjetas elegidas, ( b ) El problema es que los nombres que apa
recen en varias tarjetas tienen probabilidades de selección más elevadas. Una
manera de tratar esto es contar el número de tarjetas en las que aparece un
nombre seleccionado y usar este número al hacer la estimación por métodos
apropiados a la selección con probabilidades desiguales (Cap. 9 A ). Otra ma
nera que da a cada nombre la misma oportunidad, pero que puede involucrar
muchos rechazos, es la de retener una tarjeta sólo si es la primera del con
junto en el que aparece el nombre, ( c ) T a l como en ( b ) los nombres se
seleccionan con probabilidades desiguales. N o se conoce un método fácil de
dar a cada nombre la misma oportunidad. Si el número de tarjetas en las que
aparece cada nombre se registró en alguna parte, se puede utilizar un método
de probabilidad igual como en (b ).
1.3. Como sugerencias tenemos: ( a ) un directorio reciente de almacenes
y de tiendas de equipajes, ( b ) las oficinas de artículos perdidos que hay en
las compañías de trenes subterráneos y de autobuses, y ( c ) hospitales y mé
498 T E C N IC A S I>E M UESTREO
RESPUESTAS A LOS EJERCICIOS 499
1.5. $80 390 y $82 970. 3.9. Todos dan A v = 13. Por la hípergeométrica, la probabilidad de no
unidades en C en la muestra es 0.0601 para A c = 32 y 0.0434 para A r = 13.
1.6. La probabilidad de confianza es aproximadamente de 0.054 (se encon
Por la binomial, P „ = 0.4507 y V T - fP c = 0.4114, dando A c. = 12,3. El
tró a partir de t = — 1.67 con 25 grados de libertad). Esto supone que los Ejercicio 3 de la Pág. 90 da 0.061 para A,- = 12 y 0.044 para Ac- = 13.
recibos futuros siguen la misma distribución de frecuencia que la muestra
de 26 recibos y que esta distribución es normal. 3.11. La estimación ( b ) parece más precisa.
1.7. Cuando el E C M se debe enteramente al sesgo, la estimación siempre 3.12. E l valor más alto es PQ/n en comparación con PQ/mn por la fórmula
es incorrecta por una magnitud de 1 V~ECM. La probabilidad de un error ma binomial. Esto sucede cuando todo conglomerado consiste enteramente de
unos o enteramente de ceros. El valor más bajo puede ser cero si todo con
yor que 1 V~ETCM es, por tanto, la unidad, y la probabilidad de un error
glomerado da la misma proporción P. (E sto es posible solamente para ciertos
mayor que 1.96 V E C M o mayor que 2.576 V E C M es cero. valores de P y ira.)
2.4. f = 51 473. Probabilidad cerca de 0.9. 3.13. La varianza es 0.00184 por el método de la razón y 0.00160 por la
2.5. Sí. o-(Y) es 98.4. fórm ula binomial,
2.8. y =20 2 38. .5(10 =849. 3.14. Tamaño promedio de la muestra = m/P.
2.7. ( a ) Público: P = 15.46. Privado: R = 12.75. (b) Público: s(A) = 4.1. 735 casas. Se necesita este tamaño de muestra para casas con dos
coches si P = 10%.
0.761. Privado: s(JR) = 0.727. Para la cpf tomamos f = 100/468. (c) 14.2<
R < 16.7. 4.2. Aproximadamente 260 hojas.
2.8. E>if./e.e.mf = 2.71/1.186 = 2.28. P cerca de 0.023. Note que no se usa 4.3. ( a ) 2 475; ( b ) 4 950.
la cp f en el cálculo de e.e.drt.
4.4. n — 21 (tom ando t = 2 ).
2.9. (a) 9 408, e.e. = 780; (b) 9 472, e.e. = 1 104.
4.5. ii =■ 48-1. Para el número de sin empleo, el cv sería aproximadamente
2.10. E.e. (en 1 000'es) = (a) 14 800; (b) 3 900; (c ) 3 140. de 15%.
2.12. (a) n = 60, con 30 de cada grupo; (b) n = 80 será suficiente si el 4.7. (a ) n = 278; (b ) n = 2315; ( c ) n = 3046.
número de propietarios en la muestra está entre 20 y 60. Con n = 80, la
4.8. Si se supone una distribución rectangular dentro de cada clase, to
probabilidad de que esto pase es 0.54 (de las tablás binomiales). Con n =
mamos S2 - 0.083b2 o S = 0.29b. Esto da estimaciones de 230, 580, 2 030 y
500 TE C N IC A S BE M U ESTRE O RESPU ESTAS A LOS EJERCICIOS 50 1
11 600 en las cuatro clases. Si se usa la distribución de triángulo rectángulo 5A.7. W , = 0.728, W 2 = 0.272, S, = 1.806, S2 = 4.698 (en la escala codi
en la cuarta clase, tomamos S = 0.24H, lo que da 9 600 para esta clase. fica d a ). ( a ) Loo tamaños óptimos de muestra son re, = 0.507n, n„ = 0.493re.
/ UNS \ 2 /3 (b ) V(y) = 3 1 .9 5 /re, V¿p,(y„)= 6.72/re.
4 U' ' 5A.8. ( i ) J '//(y) dy = j V2(l - y )d i = 2v/2[l —(1 —a)3,2]/3. Por lo tanto, queremos
5.1. ( a ) L a asignación de Neym an da re, = 0.87, n2 — 13.13. ( b) Hay tres
posibles estimaciones bajo asignación óptima y nueve bajo asignación pro U - (1 - a y r.] „ l/2.
porcional. =¿=0.167: Vprop(y „)= £ = 0.583. (d ) Fórmula 5.27 da 5A.9. En el Ejercicio 5A.7, W , = 0.728, como en la regla de Dalenius-
0-159. Hodge, se acerca lo más a la regla de Ekman. En el Ejercicio 5A.8, la regla
de Ekman, da a = (3 — V 5 )/ 2 = 0.38.
5.2. ( a ) re, = 375, n2 = 625; ( b ) n , = 750, n2 = 250.
5A.10. Las óptimas son L = 7 para p = 0.95, L = 5 para p = 0.9 y
5.3. RP = 181% para asignación proporcional y 214% para asignación
L = 4 para p = 0.8. Y a sea L = 5 o L = 6 son un buen compromiso.
óptima.
5A.11. (a ) La ganancia en precisión es cerca de 110%. ( b ) La ganancia
5.5. Los aumentos relativos máximos ocunen cuando W , = W 2 e igual de estratificación proporcional sobre muestreo aleatorio simple es cerca de 90%.
0.029 para c2/c i = 2 y 0.111 para c2/c i =4.
5A.12. Aumentar re, como se sugiere, dejando n2 = 400. Requerimos n, —
5.6. ( a ) n,/n = l/3, n2/n = %; (b ) re = 264, n, = 88, n2 = 176; (c ) 140, dando n = 540.
$1 936.
6.1. Para la estimación de razón V (Y R) = y para la expansión
5.7. ( a ) $2 288 contra $1 936. ( b ) N o. El costo de campo mínimo para simple V (Y ) = N - ( l — f ) S ¿v/n, donde d = (y — R x ). Para la muestra de
21 familias las estimaciones de y Sp2 son las siguientes. Número de h i
reducir V a 1 es $2 230.
jos, sd* = 0.49, = 1.61; número de coches, sd2 = 0.41, s„2 = 0.39; núme
5.8. ( a ) re, = 384, re2 = 192; ( b ) re, = 400, re* = 1 600; ( c ) re, = 1200, ro de receptores de TV, slC- = 0.51, sy- = 0.45. La estimación de razón parece
re2 = 2 400. ser superior para los hijos.
5.14. ( a ) Si conjeturamos P, = 45% , P 2 = 25% , P, — 7.5% como un con 6.5. Los ECM son 46.5 para la estimación de razón separada y 40.6 para
venio, esto da re, = 268, re2 «= 116, re3 = 16; ( b ) e.e. = 0.0225; ( c ) e.e. = la estimación de razón combinada. E n ambos casos la contribución del sesgo al
0.0241. ECM es despreciable.
5A.6. ( a ) n = 1024. La asignación óptima para la segunda variable (can 7.2. N o, dado que b es muy cercano a 1.
tidad promedio invertida) satisface ambos requerimientos. 7.3. y lr = 28177 ± 570. La precisión relativa es 113%.
502 TE C N IC A S DÉ M U E S TR E O RE SPU ESTA S A XOS EJERCICIOS 503
7.4. 27 751 ± 694. 9A.4. ( b ) V{YnT) = 1.75, Vf,YM) = 0.27, V (YR„ C) = 0.33. En este proble
ma 1/,/Z; varía muy poco, pero Yht da resultados mediocres (relativam ente)
7.6. Para la estimación de la diferencia, V ( y ) = S3*/n; para la estimación porque con el método de selección de muestra 7r¡ 2 z4. E l estimador de Mur-
de la regresión lineal, V(yi,)= Se2S 2/n(S.2+Sy2). La estimación de la re thy se construye para este método de selección de muestra teniendo V (Y m )
gresión tiene la varianza menor, pero su superioridad no tiene importancia = 0 si i/j/Zj es constante, como lo muestra (9 A .6 0 ). ( c ) V ( rA1)/ V ( ) =
si S//S/ es pequeña. 0.54 en tanto que ( N — ? t)/ (N — 1 ) ' = y2.
7.7. E C M (Í '| „ ) = 34.5, Sesgo* = 9.7; E C M (Y lrc) = 11.9, Sesgo* = 1.2. 9A.5. E C M C ? * ,-^ ) = 7.06, (Sesgo)=/ECM = 0.065, V (Í"SS3) - 6.5
8.1. Las varianzas son 8.19 (sistem ático), 11.27 (aleatorio sim ple), 8.25 10.3. ( a ) 165/7!; (b)148.5/n; ( c ) 132/n.
(estratificado, 2 ), 7.46 (estratificado, 1). 10.4. ( a ) n = 660 campos; ( b ) n = 530 campos. La proteína requiere
8.2. V S,J3 = 0.00141, V rm = 0.00340. menos campos que rendimiento.
8.3. La muestra sistemática debería ser m ejor para la proporción de perso 10.5. Cj/c2 = 8.
nas de ascendencia polaca, dado que esta variable exhibe estratificación geo 10.7. ( a ) 0.93%; ( b ) 0.51% ; ( c ) 0.36%.
gráfica. Es probablemente inferior para la proporción de hijos porque el inter
valo de muestreo, 1 en 5, coincide con el tamaño promedio de una familia. Lo 10.8. ( a ) Cualquiera m 0 = 7 o m 0 = 8 es apropiado; ( b ) 89% para m 0
7 y 93% para m 0 = 8; ( c ) 86% para m0 — 7 y 89% para m a = 8.
mismo es cierto, aunque en menor medida, para la proporción de hombres.
11.2. La precisión relativa de I I I a 13 baja de 3.02 a 2.75. Si dos planes
8.4. Las varianzas son las siguientes. Hombres. V(rJ = 0.0204, V ajH =
de muestreo difieren principalmente en su contribución entre-unidades a la
0.0216; hijos, Vjrj = 0.0204, V a(/, = 0.0776; profesionales, V Jrl = 0.0192,
varianza, la precisión relativa del plan superior disminuirá en general con
V ,v, = 0.0016.
form e la razón de la varianza dentro-de-unidades con los aumentos de la
8.5. Varianza real *= 8.19. Método ( a ) da 11.29. Para el método ( b ) la varianza total.
varianza estimada de una sola muestra es (1 — f ) ( f it — y i ; ) 2/4, donde 11.3. La explicación es, dicho brevemente, que con estos datos las Y¡/z¡
y „,y (2 son las medias de las dos mitades. El promedio es 3.24. La subestima son más estables que las Y.¡/Mj. Si tomamos z¡ = y33, % 3, y 24/33, la contribu
ción seria es inesperada. ción entre-unidades en el método IV desaparecería.
8.7. Ambas varianzas son (fe* — l)/ 6 . 11.4. Varianza total: 0.00504 ( l a ) , 0.02358 ( I I ) , 0.00554 ( I I I ) .
8.8. E l muestreo aleatorio simple es mejor, a menos que n « 1 o fe = 1. 11.6. Porcentaje estimado 14.2 ± 2.16. Número estimado 3 540 ± 540.
8.9. Cada fc-ésima unidad, V ( Y ) = 362.2; Yates, E C M ( Y ) = 7 . 3 ; Sethi, 11.7. Porcentaje estimado 13.9 ± 2.49.
V ( Y ) = 21.0; Singh, y cois., V ( Y ) = 81.0. Los dos últimos estimadores son
insesgados en. este ejemplo. 11.9. ( a ) Total de habitaciones 29 400; total de personas 50 550; personas
por habitación 1.72; ( b ) e.e.: total de personas 2 440; personas por habita
9.1. Los costos relativos de usar los cuatro tipos de unidad son 100, 90.1, ción 0.066.
79.7 y 77.8 (tomando la primera unidad como estándar).
12.1. n = 267, n’ = 1 320 o n = 268, n' =■ 1 280. V (p 3t) con asignación
9.2. La precisión relativa de la fam ilia es 211% para la proporción de óptima es 6.67 cuando psl es en % . Con muestreo simple, V ( p ) = 8.33.
sexos y 38% para la proporción que ha visitado a un médico.
12.2. c,/cn' > 9.
9.3. La precisión relativa de la unidad grande es 0.566 con muestreo alea 12.3. n/n.' = 1/19.
torio simple y 0.625 con muestreo aleatorio estratificado.
12.4. n ' > 16n.
9.5. ( a ) M «= 5; (fc ) M = 1.
12.5. Por la fórmula (1 2 .6 7 ), e.e. = 1.25, al ignorar 1/N.
9.6. La M óptima debería disminuir porque el costo de viaje, el cual varía
con y 1n, se convierte relativamente en menos importante conforme jt aumenta. 12.6. Las ganancias en porcentaje de la segunda a la sexta ocasión son
50, 75, 91, 100 y 105, respectivamente.
9A.1. ( a ) 34 242; ( b ) 5 534; ( c ) 6 493.
12.8. Las valores de nV(y;")/ó2 y nV(y2')/S2 son los siguientes: p =
9A.3. ( a ) Si la d.e. entre unidades grandes en la ciase fe a M h. ( b ) Si la P - 0.8: 0.885, 0.875; p = % , p = 0.9: 0.843, 0.840; p = p = 0-8: 0.824,
probabilidad a 0.810; p = l/2, p = 0.9: 0.752, 0.746.
504 T E C N IC A S DE M U ESTREO
nTTTTTTA
Características uso al estimar fracciones óptimas en muestreo de tres etapas, 352-
referencias a las tablas, 84 de muestreo y submuestreo, 349- 355
cualitativas, 79 ver también Propor
uso erróneo en muestreo por con
ciones, estimación de 351 de la regresión en muestreo estra
glomerados, 95-99 tificado, 251-254
raras, método de Haldane, 109 Encuestas
condicional, de proporciones, 92 del total de dominio, 61
Censo descriptivas, 23
hipergeométrica, 85 por correo, 189, 437, 448 en muestreo estratificado, 187
de los E.U.A., uso del muestreo,
como distribución condicional, 92 Entrevistador, sesgo de, 456, 476 del total de población estimado de
21-22
límites de confianza, 87 una muestra aleatoria simple,
uso del muestreo en, 21 modelos matemáticos, 455-458
referencia a tablas y gráficas, 87 49
Coeficiente E promedio sobre todas las muestras
normal, 29 del total en una población que pa
de correlación: posibles, 33
como aproximación a la hiper see cierto atributo, 82
con una muestra sistemática, 261 Errores de medición, 455
geométrica, 88 de m edia de dominio, 59-60
en poblaciones finitas, 200 efectos de errores no correlaciona
* como distribución lím ite de me en muestreo estratificado, 189-
intraconglomerados, 264 dos dentro de la muestra, 460
dias de muestra, 65-66 192
de regresión en población finita, efectos de la correlación entre erro
su validez con medias de datos de proporción-:
242 res, 462
continuos, 66-72 en muestreo aleatorio simple, 81-
de variación, 83 efectos del sesgo constante, 458
A A Ai H A l i i i i r r
utilización en encuestas, 32 84
Consistencia modelo matemático, 455-458
Doble muestreo, 339 en muestren conglomerado, 95-
definición, 45 resumen de los efectos, 464
estimaciones de razón, 417-418 99
de la media de muestra aleatoria técnicas para estudio de, 464-473 en muestreo de dos etapas, 344
Dominios de estudio (subpoblaciones),
simple, 45 utilización de muestras interpene
60 en muestreo estratificado, 145-147
de una estimación de razón, 198 comparaciones entre medias, 65 trantes, 469-472 sobre un dominio, 93-94
de una estimación de regresión, comparaciones entre proporciones y Errores en encuestas, tipos de, 321 de una razón en muestreo de dos
241 totales, 94 Error estándar etapas, 380
Corrección por continuidad, 88, 95 dominios que cruzan varios estra ( aproximado) de estimadores no Estimación
Correcciones tos, 186-188 lineales, 388 autoponderante, 127
finales, 270 estimaciones de medias y totales comparación de los métodos, 393- en muestreo de dos etapas, 371-
por población finita, (c p f), 49 (variable continua), 60-61 395 372, 373, 376, 387
en muestreo aleatorio estratifica estimaciones de proporciones y to método de la serie de Taylor, 389 compuesta en muestreo repetido,
do, 128 tales (la variable 0-1), 93-94 método Jacknife, 392 429
en muestreo de dos etapas, 342 estratos como dominios, 184 replic aciones repetidas equilibra de razón combinada, 212
regla para ignorarla, 49 tamaño requerido de la muestra, al estimar medias de dominios,
das, 390
Correlación intraconglomerado, 262 115-117 187
de la desviación estándar de una
Correlograma, 273 Dos etapas, muestreo de, ver Mues asignación óptima para, 220
muestra, 70
Costos de viaje, fórmula, 133 treo doble comparada con la estimación de
de la diferencia entre dos razones,
Covariancia de medias de muestra, 50 razón separada, 214
Cuadrado latino del movimiento de 229
en muestreo estratificado de dos
un caballo del ajedrez, 284 — E— ^ d e la diferencia entre medias de
etapas, 387
Cuadrático error medio, definición, 37 dominios, 65 lím ite superior al sesgo relativo,
E j, E„, promedios sobre las etapas de la estimación de razón, 58, 198-
justificación del uso del, 37 213
prim era y segunda, 341
relación con la varianza y el sesgo,
Efecto del diseño (D e f f ) , 45
202 multivariada, 234 f
¥
38 en muestreo estratificado, 211- varianza„ 213
Elementos, 56
214 varianza estimada, 214
£1 método Jacknife, 222
— D— de la estimación de regresión, 241, de regresión combinada, 253
para estimar la varianza de una 4
Desigualdad de Cauchy Schwarz, 134 razón, 227 245, 246 comparada con la estimación de
Desviación para la varianza de una estima de la media: regresión separada, 254 4
de muestra aleatoria simple, 48, varianza, 253
de la respuesta, 458
estándar sn población finita, 47
ción de una función no lineal,
392 50-51 varianza estimada, 254 •
(1
OVO IN W IO J S A W M ftlW V » IN D IC E A LFA B E T IC O 509