Técnicas de Muestreo - William G. Cochran-FreeLibros - Me

TECNICAS
DE
MUESTREO
W IL L IA M G. COCHRAN
Professor o f Statistics, Emeritus-Harvard University
COM PAÑIA EDITORIAL C O N TIN E N TAL, S. A. MEXICO
DISTRIBUIDORES:
ESPAÑA - AR G E N TIN A - CHILE - VENEZUELA - COLOMBIA
B olivia — Brasil — Costa Rica — D om inicana — Ecuador — E l Salvador — Estados Unidos

Guatemala — Honduras — N icaragu a — Panam á — Paraguay — Perú — Portugal
Puerto Rico — Uruguay
1 h c ü iO '? - e le M a te r ia s
Cap. Pág.
P r e fa c io .......................................................................... 7
I*?I& 0Iíü C C íO N ........................................................... 19
1.1 Las Ventajas del Método de Muestreo ......... 19

1.2 Algunos Usos de las Encuestas por Muestreo . . . . 21
1.3 Etapas Principales en una Encuesta porMuestreo 24
1.4 El Papel de la Teoría del Muestreo .................. 28
1.5 Muestreo Probabilista ............................................ 29
1.6 Alternativas al Muestreo Probabilista.................... - 30
1.7 Uso de la Distribución N o r m a l .................... 32
1.8 El Sesgo y sus Efectos .......................................... 34
1.9 El Error Cuadrático Medio .................................... 37--
Ejercicios ................................................................ 38
MÜESTEEO ALE A TO R IO SIM PLE ............................ 41
2.1 Muestreo Aleatorio Simple .................................. 41

2.2 Selección de una Muestra Aleatoria Simple . . . . 42
2.3 Definiciones y Notación ...................................... 44
2.4 Propiedades de las Estimaciones ........................ 45
-2.5 Varianzas de las Estimaciones ............................ 47
2.6 La Corrección por Población F in ita ............... 49
• 2.7 Estimación del Error Estándar a Partir de una
Muestra .............................................................. 50
2.8 Límites de Confianza .......................................... 52
2.9 Un Método Alternativo de P ru e b a ............... 53
2.10 Muestreo Aleatorio con R estitu ción .............. 55
2.11 Estimación de una R a z ó n ............................. 56
2.12 Estimaciones de Medias en Subpoblaciones . . . . 60
2.13 Estimaciones de Totales en Subpoblaciones . . . . 62
2.14 Comparación Entre las Medias de los Dominios .. 65
2.15 Validez de la Aproximación N o r m a l........... 66
2.16 Estimadores Lineales de la Media de Población 72
Ejercicios .............................................................. 73
12 IN D IC E DE M A TE R IA S IN D IC E DE M A T E R IA S 13
Cap. Pág. Cap. Pág.

3 MUESTREO P A R A PROPORCIONES Y PORCENTAJES 79 5.5 La Asignación O p tim a ........................................... 133
3.1 Características C u alitativas.......................... 79 5.6 Precisiones Relativas del Muestreo Aleatorio Estra
3.2 Varianzas de las Estimaciones M uéstrales........ 80 tificado y del Muestreo Aleatorio S im p le 136
3.3 El Efecto de P en los Errores E stá n d a r....... 83 5.7 ¿En qué Casos Produce la Estratificación Consi
3.4 La Distribución Binomial .................................... 84 derables Ganancias de Precisión? ........................ 138
3.5 La Distribución H ipergeom étrica................ 85 5.8 Asignación que Requiere más del 100% del
3.6 Límites de Confianza .......................................... 87 Muestreo .............................................................. 142
3.7 Clasificación en más de dos Clases .............. 90 * 5.9 Estimación del Tamaño de la Muestra con Datos
3.8 Límites de Confianza Cuando Existen más de Continuos ............................................................ 143
dos Clases ............................................................ 91 5.10 Muestreo Estratificado para Proporciones 145
3.9 La Distribución Condicional de p ...................... 92 5.11 Ganancias en Precisión en el Muestreo Estrati
3.10 Proporciones y Totales Sobre Subpoblaciones . . 93 ficado para Proporciones .................................... 147
3.11 Comparaciones Entre Dominios D ife re n te s ...... 94 5.12 Estimación del Tamaño de Muestra con Propor
3.12 Estimación de Proporciones en el Muestreo por ciones .................................................................. 149
Conglomerados .................................................... 95 Ejercicios .............................................................. 149
Ejercicios .............................................................. 100 5A OTROS ASPECTOS DEL MUESTREO ESTSATIFI-
•I L A ESTIM ACION DEL TAM AÑ O DE L A MUESTRA .. 103 CADO ........................ 155
4.1 Un Ejemplo H ip otético ................................. 103 5A.1 Efectos de las Desviaciones a Partir de la Asig
4.2 Análisis del Problema ......................................... 105 nación Optima • 155
4.3 La Especificación de la P re c is ió n ................. 106 5A,2 Efectos de Errores en los Tamaños de los Es
4.4 La Fórmula para n al Hacer un Muestreo para tratos 157
Determinar una P rop orción ........................... 107 5A.3 El Problema de la Asignación con más de una
4.5 Atributos Raros-Muestreo In v e rs o ................. 108 Característica ...................................................... 160
4.6 La Fórmula para n con Datos Continuos .......... 109 5A.4 Otros Métodos de Asignación con más de un
4.7 Estimaciones Anticipadas de Varianzas de Po Atributo .............................................................. 161
blación 110 5A.5 Estratificación en dos Direcciones, con Muestras
4.8 Tamaño de la Muestra con más de una Carac Pequeñas .............................................................. 165
terística ................................................................ 124 5A.6 Selección Controlada ........................................... 167
4.9 Tamaño de la Muestra Cuando las Estimaciones 5A.7 La Construcción de los E stratos.............. 169-
se Quieren para Subdivisiones de la Población .. 115 5A.8 Número de Estratos ........................................... 174'
4.10 El Tamaño de la Muestra en Problemas de De 5A.9 Estratificación Después de la Selección de la
cisión .................................................................. 117 Muestra (P ostestratíficación )................. 177
4.11 El Efecto del Diseño ( Deff) ......................... 119 5A.1Q Muestreo por C u o ta .................................. 178
Ejercicios .............................................................. 120 5A.11 Estimación a Partir de una Muestra de la Ga
5 MUESTREO ALE A TO R IO E S T R A T IF IC A D O ................ 125 nancia Debida a la E stratificación....... 179
5A.12 Estimación de la Varianza con una Unidad por
5.1 Descripción ......................................................... 125 Estrato ............................................................. 181
5.2 Notación .............................................................. 126
5A. 13 Estratos como Dominios de E stu d io ........ 184
5.3 Propiedades de las Estim aciones.............. •......... 127 5A.14 Estimación de Totales y Medias Sobre Subpo
5.4 La Varianza Estimada y Límites de Confianza . . . 132 blaciones ....................................... 186
14 IN D IC E DE M A T E R IA S IN D IC E DE M A T E R IA S 15
Cap. Pág. Cap. Pág.
5A.15 Muestreo a Partir de dosMarcos ........................ 189 7.6 Exactitud de las Fórmulas de Muestras Grandes
Ejercicios ............................................................ 190 Para V ( ylr ) y n ( y t ) .......................................... 247
7.7 Sesgo de la Estimación de Regresión Lineal . . . . 249
G ESTIMADORES DE RAZO N ......................................... 195
7.8 El Estimador de Regresión Lineal en un Modelo
6.1 Métodos de Estimación ........................................ 195 de Regresión L in e a l ............................... 250
6.2 El Estimador de R a z ó n ........................................ 196 7.9 Estimáciones de Regresión en Muestreo Estra
6.3 Varianza Aproximada de la Estimación de Razón 198 tificado ................................................................. 251
6.4 Estimación de la Varianza a Partir de una Muestra 201 7.10 Coeficientes de Regresión Estimados de la Muestra 252
6.5 Límites de C o n fia n za ............................................ 202 7.11 Comparación de los dos Tipos de Estimaciones
de Regresión ........................................................ 254
6.6 Comparación de la Estimación de Razón con la
Ejercicios .............................................................. 255
Media por U n id a d ................................................ 203
6.7 Condiciones Bajo las Cuales el Estimador de Razón 8 MUESTREO S IS T E M A T IC O ........................... 257
es un Estimador Insesgado Lineal O p tim o ............ 204
6.8 Sesgo de la Estimación de R a z ó n ................ 207 8.1 Descripción .......................................................... 257
8.2 Relación con el Muestreo C onglom erado............ 259
6.9 Exactitud de las Fórmulas para la Varianza Es
8.3 Varianza de la Media E stim ad a............................ 260
timada .................................................................. 209
8.4 Comparación del Muestreo Sistemático con el
6.10 Estimaciones de Razón en Muestreo Aleatorio
Muestreo Aleatorio E stratificad o........................... 265
Estratificado ........................................................ 211/
8.5 Poblaciones en Orden A le a to rio ........................... 266
6.11 La Estimación de Razón Com binada.................... 212
8.6 Poblaciones con Tendencia L in e a l...................... 268
6.12 Comparación de las Estimaciones Separadas y
8.7 Métodos para Poblaciones que Presentan Tenden
Combinada .......................................................... 214
cias L in ea les .......................................................... 269
6.13 Cálculo Abreviado de la Varianza Estimada . . . . 217
8.8 Poblaciones con Variación P erió d ica .................. 271
6.14 Asignación Optima con una Estimación de Razón 220 8.9 Poblaciones Autocorrelacionadas......................... 273
6.15 Estimaciones Insesgadas del Tipo de Razón . . . . 222 8.10 Poblaciones N a tu ra le s........................... 276
6.16 Comparación de los Métodos .............................. 225 8.11 Estimación de la Varianza a Partir de una sola
6.17 Estimación Mejorada de la V a r ia n z a ................ . 227 Muestra ................................................................ 278
6.18 Comparación de dos R a zo n e s .............................. 229 8.12 Muestreo Sistemático E stratificado...................... 282
6.19 Razón de dos Razones .......................................... 232 8.13 Muestreo Sistemático en dos D im ensiones 283
6.20 Estimaciones de Razón M ultivariantes................ 234 8.14 Resumen .............................................................. 285
6.21 Estimadores Produ cto............................................ 235 Ejercicios ...................... 287
Ejercicios ............................................................ 236
9 MUESTREO PO R CONGLOMERADOS, DE UNA ETA-
7 ESTIMADORES DE REGRESION ................................. 239 PA: CONGLOMERADOS DEL MISMO TAM AÑO • •• 289
7.1 La Estimación de Regresión L in e a l .................... 239 9.1 Motivos del Muestreopor Conglom erados............. 289
7.2 Estimaciones de Regresión con b Preasignada . . 241 9.2 Una Regla S im p le .................................................. 290
7.3 Estimaciones de Regresión Cuando b se Calcula 9.3 Comparaciones de Precisión, Flechas a Partir de
a Partir de la M u estra.......................................... 243 Datos de E ncu estas................................................ 294
7.4 Estimación de Muestra de la V a ria n za ................ 245 9.4 Varianza en Términos de la Correlación Dentro
7.5 Comparación en Muestras Grandes con la Esti de Conglom erados.................................................. 298
mación de Razón y la Media por U n id a d ............ 246 9.5 Funciones de la V a r ia n z a ..................................... 300
16 IN D IC E DE M A T E R IA S IN D IC E DE M A TE R IA S 17
Cap. Pág- Cap. p ág.

9.6 Una Fundón de Costos ........................................ 302
11 EL SUBMUESTREO CON UNIDADES DE DIFEREN
9.7 Muestreo Conglomerado para Proporciones .......... 304 TES TAMAÑOS ............................................................ 359
Ejercicios ................................................................ 306
11.1 In t r o d u c c ió n . .. . , ......................................... 359
SA MUESTREO CONGLOMERADO DE U N A E TA PA : 11.2 Métodos de Muestreo Cuando n - 1 ................ 361
CONGLOMERADOS DE TAM AÑOS DESIGUALES • • • 309 11.3 Muestreo con Probabilidad Proporcional al Ta
maño Estimado .................................................... 365
9A.1 Unidades Conglomerados de Tamaños Desiguales 309
11.4 Resumen de los Métodos para re =■ 1 ................ 367
9A.2 Muestreo con Probabilidad Proporcional al T a
11.5 Métodos da Muestreo Cuando n > 1 ........... 368
maño ................................................................ 311
11.6 Dos Resultados U t ile s .................... .................. 368
9A.3 Selección con Probabilidades Desiguales y con
11.7 Unidades Seleccionadas con Probabilidades Igua
Restitución ............................ 312 les: Estimador In s es ga d o .................................... 371
9A.4 La Medida Optima del T a m a ñ o ........................ 316 11.8 Unidades Seleccionadas con Probabilidades Igua
9A.5 Exactitudes Relativas de las Tres Técnicas . . . . 316 les: Estimación de la Razón alT a m a ñ o 372
9A.6 Muestreo con Probabilidades Desiguales sin 11.9 Unidades Seleccionadas con Probabilidades Igua
Restitución ........................................................ 320 les y con Restitución: EstimadorInsesgado . .. 375
9A.7 El Estimador de Horvitz-Thompson.................... 321 11.10 Selección de las Unidades sin R estitución 377
9A.8 El Método de Brewer ........................................ 323 11.11 Comparación de los M é to d o s ........................ 379
9A.9 El Método de M u rth y ........................................ 326 11.12 Razones a Otra Variable .................................. 380
9A.10 Métodos Relacionados con el Muestreo Siste 11.13 Elección de Fracciones de Muestreo y Submues
mático ................................................................. 328 treo. Probabilidades Iguales................................... 382
9A.11 El Método de Rao, Hartley, C o c h ra n ................ 329 11.14 Probabilidades de Selección Optima y Tasas de
9A.12 Comparaciones N u m érica s ................................ 331 Muestreo y Submuestreo................................ 384
9A.13 Estimaciones Estratificadas y de R a z ó n ............ 334 11.15 Muestreo Estratificado. Estimadores Insesgados . 386
Ejercicios ............................................................ 336 11.16 Muestreo Estratificado. Estimaciones de Razón . 387
11.17 Estimadores no Lineales en Encuestas Complejas 388
10 SUBMUESTREO CON UNIDADES DE TAM AÑOS 11.18 Desarrollo en Series de T a y lo r ...................... 389
IGUALES .................................................. * .................. 339 11.19 Réplicas Repetidas Equilibradas ........................ 390
10.1 Muestreo en dos E tap as...................................... 339 11.20 El Método Jackknife ............................................ 392
10.2 Determinación de Medias y Varianzas en Mues 11.21 Comparación de los Tres M é to d o s ................ 393
treo de dos Etapas ............................................ 340 Ejercicios .............................................................. 395
10.3 Varianza de la Media Estimada en Muestreo de

12 MUESTREO DOBLE ........................................................ 399
dos E ta p a s .......................................................... 342
12.1 Descripción de la T é c n ic a .............................. 399
10.4 Estimación Muestral de la V a ria n za .................. 343
12.2 Muestreo Doble para E stratificación ............ 400
10.5 La Estimación de Proporciones.......................... 345
12.3 Asignación Optima .............................................. 403
10.6 Fracciones Optimas de Muestreo y Submuestreo 346
12.4 Varianza Estimada en Muestreo Doble para Es
10.7 Estimación de m áp, de un Reconocimiento Piloto 349
tratificación .......................................................... 406
10.8 Muestreo de Tres E ta p a s .................................. 352
12.5 Muestreo Doble para Comparaciones Analíticas . 408
10.9 Muestreo Estratificado de las Unidades .......... 355
12.6 Estimadores de R eg res ió n .............................. 412
10.10 Asignación Optima con Muestreo Estratificado 356
12.7 Asignación Optima y Comparación con el Mues
Ejercicios ............................................................ 357 treo Simple .......................................................... 414
18 IN D IC E DE M A T E R IA S
Cap. Pág.
12.8 Varianza Estimada en Muestreo Doble para Re
gresión ................................................................ 416 C A P IT U L O 1
12.9 Estimadores de Razón ........ .'...................... 417
12.10 Muestreo Repetido de la Misma P ob lación ....... 418
12.11 Muestreo en dos O casion es.......................... 420
12.12 Muestreo en más de dos Ocasiones .................. 423
12.13 Simplificaciones y Adelantos U lterio res...... 426 Introducción
Ejercicios .................................................................... 431
13 FUENTES DE ERROR EN LAS ENCUESTAS ............ 435

13.1 Introducción ...................................................... 435
13.2 Efectos de la no-Respuesta.......................... 436 1.1 L A S V E N T A J A S D E L M E TO D O D E M UESTREO
13.3 Tipos de no-Respuesta.................................. 440
13.4 Revisitas ............................................................ 442 Nuestros conocimientos, actitudes y acciones están basados en
13.5 Un Modelo Matemático de los Efectos de las gran parte sobre muestras. Esto es verdad real en la vida cotidiana
Revisitas ............................................................ 444 como en la investigación científica. Así, la opinión que tiene una
13.6 Fracción Optima de Muestreo Entre los que no persona de una institución que realiza miles de transacciones diarias,
Responden .......................................................... 448 a menudo se basa en uno o dos contactos ocurridos en el transcurso
13.7 Ajustes por Sesgo sin R e v is ita s ........................ 452 de muchos años. Es clásico (y cóm ico) el personaje que después de
13.8 Un Modelo Matemático para Errores de Medición 455 pasar diez días en un país extranjero, escribe un libro para enseñar
13.9 Efectos del Sesgo C on stan te.............................. 458 a sus habitantes cómo revitalizar su industria, reformar su sistema
13.10 Efectos de Errores no Correlacionados Dentro político, equilibrar su presupuesto y mejorar la comida de sus hote
de la Muestra .................................................... 460 les. Pero en realidad, la diferencia que existe entre este personaje
13.11 Efectos de la Correlación Intramuestral Entre y el estudioso de ciencias políticas que vive veinte años en ese país
Errores de Medición .......................................... 462 ■ dedicado a estudiarlo, es que el primero basa sus conclusiones en
13.12 Resumen de los Efectcs de Errores de Medición 464 una muestra mucho más pequeña y es menos consciente de su gran
13.13 El Estudio de los Errores de M e d ic ió n ............ 464 ignorancia. Tanto en la ciencia como en los asuntos humanos care
13.14 Mediciones Repetidas de Submuestras ............ 466 ceremos de los recursos necesarios para estudiar más de un frag
13.15 Submuestras Interpenetrantes .......................... 469 mento de los fenómenos que pueden ampliar nuestros conocimientos.
13.16 Combinación de la Interpenetración y la Medi En este libro se presenta la teoría en que se basan los buenos
ción Repetida .................................................... 472 métodos de muestreo. En la mayoría de las aplicaciones para las
13.17 Preguntas Delicadas: Respuestas Aleatorizadas 473 que se edificó esta teoría, el conjunto del que se desea obtener infor
13.18 La Segunda Pregunta no R elacionada................ 475 mación es finito y bien delimitado como sería por ejemplo el con
13.19 Resumen ............................................................ 478 junto de habitantes de una ciudad, las máquinas de una fábrica o
Ejercicios .................................................... 479 los peces de un lago. En ciertos casos, puede parecer factible el
Bib l io g r a f ía ............................................................. 483 obtener la información por medio de una enumeración completa o
censo del conjunto. Los administradores acostumbrados a tratar con
R e s p u e s t a s a l o s E j e r c ic io s ........................... 497
censos inicialmente desconfiaban de las muestras y se resistían a
I n d ic e A l f a b é t i c o ............................................. • .. 505
utilizarlas. Aunque esta actitud ha desaparecido, conviene revisar las
ventajas del muestreo en comparación con la enumeración completa.
UNIVERSIDAD CENTRAL
CONTROL DE BIENES
20 TE C N IC A S DE M U ESTRE O IN TR O D U C C IO N 21
IIIIIEIIIIIHIII
Costo reducido 4011627 1.2 A L G U N O S USO S D E L A S E N C U E S T A S
P O R M UESTR EO
Si los datos se obtienen únicamente de una pequeña fracción del
total, los gastos son menores que los que se realizarían si se llevara Para quien observa el desarrollo del muestreo y sus aplicaciones
a cabo un censo completo. En poblaciones muy grandes se pueden en los últimos 25 años, lo más sorprendente es el rápido aumento
obtener resultados lo suficientemente exactos cuando se analizan del número y tipos de encuestas realizadas por muestreo. La Oficina
muestras que representan sólo una pequeña fracción de la población. de Estadística de las Naciones Unidas publica ocasionalmente un
En los Estados Unidos las investigaciones periódicas más importan informe sobre las Encuestas por Muestreo de actualidad ( “Sample
tes las lleva a cabo el Gobierno, que usa muestras de alrededor de Surveys o f Current Interest” ) que llevan a cabo los países miembros.
105 000 personas o sea aproximadamente, una persona por cada El informe de 1968 incluye una lista de encuestas procedentes de
1 240. Las encuestas realizadas para obtener información en cone 46 países. Muchas de ellas contienen información de gran interés
xión con las ventas o campañas de publicidad en la investigación de sobre la planeación nacional en áreas tales como la producción agrí
mercados, pueden emplear muestras de sólo unos cuantos miles cola y la utilización de la tierra, el desempleo y la fuerza de trabajo
de observaciones. disponible, la producción industrial, los precios al mayoreo y menu
deo, las condiciones de salud de la población, y los ingresos y gastos
Mayor rapidez familiares. Pero también existen estudios más especializados, por
ejemplo, los arreglos para vacaciones anuales (Australia), las'cau
Por la misma razón, los datos pueden ser recolectados y resu sas de divorcio (H u n gría), la deuda e inversiones rurales (In d ia),
midos más rápidamente con una muestra que con una enumeración el consumo doméstico de agua (Is ra e l), los radioescuchas (M ala
completa. Esta es una consideración vital cuando se necesita la sia), los gastos de vacaciones (H olan d a), la estructura de edades
información con urgencia. en el ganado vacuno (Checoslovaquia), y los empleos vacantes (E.
U. A .).
Más posibilidades El muestreo ha venido a representar un papel muy importante
en los censos nacionales que se llevan a cabo cada 10 años. En los
Para obtener la información en ciertos tipos de encuestas, se
Estados Unidos, se incluyó en el censo de 1940 una muestra del
utilizan los servicios de personal altamente calificado o equipo muy 5 % . Que hace preguntas extra sobre la ocupación, tamaño de la
especializado de disponibilidad limitada. Por lo tanto, en estos casos familia, fertilidad, etc., a todas aquellas personas cuyos nombres
el censo completo es impracticable y como alternativa a la obtención estaban en 2 de los 40 renglones de cada página de la lista. El uso
de datos por muestreo, sólo existe la de no obtenerlos. De ahí que del muestreo se aumentó grandemente en 1950. De una muestra del
las encuestas basadas en el muestreo tienen más posibilidades y 20% (un nombre cada 5 renglones) se obtuvo información sobre el
flexibilidad respecto a la información que puede obtenerse. Por otra ingreso, la escolaridad, la migración y el servicio en las fuerzas
parte, se desea una información exacta de muchas subdivisiones de armadas. A l tomar una de cada 6 personas en la muestra del 20% ,
la población, el tamaño de la muestra requerida es en ocasiones tan se creó otra muestra del 3%% para obtener información sobre el
grande que la mejor opción es la enumeración completa. matrimonio y la fertilidad. Una serie de preguntas, sobre la condi
ción y edad de las viviendas, se dividió en 5 grupos, cada grupo
se contestó en una de cada cinco casas. También se empleó el
Mayor exactitud
muestreo para aumentar la rapidez de la publicación de los resulta
Debido a que al reducir el volumen de trabajo se puede emplear dos. Las tabulaciones preliminares para muchos atributos importan
personal más capacitado y someterlo a un entrenamiento intensivo tes, obtenidas por muestreo, se publicaron un año y medio antes que
y debido también a que en estas condiciones será factible la super los reportes finales.
visión cuidadosa del trabajo de campo y del procesamiento de los Este proceso se continuó en los censos de 1960 y 1970. Salvo
resultados, una muestra puede producir resultados más exactos que cierta información básica que se necesitaba obtener de cada persona
la enumeración completa. por razones constitucionales o legales, todo e l censo se cambió a
IN TR O D U C C IO N 23
22 TE C N IC A S DE M U E S TR E O
investigación de operaciones. Los libros de Deming (1 9 6 0 ) y Slonim

una base de muestreo. Este cambio acompañado de un aumento en
(1 9 6 0 ) contienen muchos ejemplos interesantes que muestran la
la mecanización utilizada para manejar la información, dio por re
gama de aplicaciones del método de muestreo en el comercio.
sultado una publicación mucho más rápida y ahorros sustanciales.
Además de utilizar las muestras continuadas para los censos, Los sondeos de opinión, de actitudes y electorales a los que se
las oficinas gubernamentales las emplean para obtener información debe en gran parte el primer contacto del muestreo con el gran
de actualidad requerida. En los E. U. A. se Uevan a cabo, por ejemplo, público, siguen siendo un rasgo popular en los periódicos. En el
la encuesta de población (Current Population Survey), que propor campo de la contabilidad y la auditoría, en donde durante años se
ha usado el muestreo, se palpa un nuevo interés por adaptar los
ciona datos mensuales sobre la magnitud y estructura de la fuerza
desarrollos modernos a los problemas particulares de dicho campo.
de trabajo y del número de desempleados, la Encuesta Nacional de
Por ejemplo Neter (1 97 2) describe cómo ahorran dinero las com
Salud, y la serie de muestras requeridas para el cálculo del índice
pañías aéreas y ferroviarias al utilizar muestras de registros para
mensual de precios al consumidor.
separar los ingresos procedentes del servicio de carga, de los que
En más pequeña escala, los gobiernos locales — ciudad, estado y
provienen del servicio de pasajeros. El papel del muestreo en los
condado— tienen uso cada vez más de encuestas por muestreo para
litigios ha sido objeto de acaloradas discusiones. Gallup (1 97 2) ha
obtener la información requerida para la planeación y solución de
recalcado la gran contribución que las encuestas por muestreo pue
problemas urgentes. En la planeación y en la solución de problemas
den aportar al proceso de información gubernamental, al determinar
urgentes. En la mayoría de las ciudades de los E. U. A. existen agen
rápidamente la opinión de la gente respecto a los nuevos programas
cias dedicadas a planear y dirigir encuestas por muestreo para sus
de gobierno y al demostrar su importancia como fuentes de infor
clientes.
mación en las ciencias sociales.
La investigación de mercados depende básicamente del método de
muestreo. Hay un escrutinio ininterrumpido de las áudiencias de di A grandes rasgos, las encuestas por muestreo pueden clasificarse
ferentes programas de radio y televisión, asi como del número de lec en dos categorías principales — descriptivas y analíticas. E r una en
tores de diversas publicaciones periódicas (incluyendo la publici cuesta descriptiva el único objetivo es obtener cierta información
dad que en ellas aparece). Los fabricantes y distribuidores quieren respecto a grandes grupos: por ejemplo, el número de hombres, mu
saber la reacción del público a nuevos productos, empaques o pre jeres y niños que acostumbran ver cierto programa de televisión.
sentaciones, así como sus quejas, y las razones por las que prefieren En una encuesta analítica se hacen comparaciones entre varios sub-
grupos de una población, para averiguar si existen ciertas diferencias
un producto y no otro.
entre ellos y formular o verificar hipótesis sobre sus causas. La
Los negocios y las industrias utilizan el muestreo para aumentar
encuesta de fertilidad en Indianápolis, por ejemplo, fue un intento
la eficiencia de sus operaciones internas. Las importantes áreas de
control de calidad y de muestreo de aceptación quedan fuera del para determinar hasta dónde los matrimonios planean el número
y espaciamiento de sus hijos, las actitudes de ambos cónyuges a esc
alcance de este libro. Pero obviamente, las decisiones que se tomen
respecto, las razones de dichas actitudes y el éxito que logran en su
respecto al nivel o cambio de calidad, o bien, la aceptación o rechazo
planeación familia (K iser y Whelpton, 1953).
de los lotes de producción, estarán bien fundadas sólo si los resul
tados obtenidos de la muestra son válidos para todo el lote (con un La distinción entre encuestas analíticas y descriptivas no es per
margen razonable de tolerancia). El muestreo de los registros de fectamente clara. Muchas encuestas proporcionan datos que sirven
transacciones comerciales (cuentas, nóminas, existencias y perso para ambos propósitos (e l descriptivo y el analítico). Junto con
n a l), usualmente mucho más fácil que el muestreo de personas, el aumento del número de encuestas descriptivas se ha notado un
puede proporcionar información de utilidad en forma rápida y eco aumento del número de encuestas realizadas con fines analíticos,
nómica. También, por medio del muestreo se pueden obtener ahorros particularmente, las relacionadas con el estudio del comportamiento
en la estimación de los inventarios, en los estudios de la condición humano y la salud. Podemos mencionar entre otras las encuestas
y el tiempo de vida de la maquinaria y el equipo, en la inspección sobre el estado dn los dientes de los niños antes y después de la
de la exactitud y rapidez del trabajo del empleado de oficina, al fluorización del agua, sobre las tasas de mortalidad y las causas de
investigar cómo el personal clave distribuye su tiempo entre diversas
muerte de fumadores en los diferentes niveles de consumo de tabaco
tareas y, más generalmente, en el nuevo campo conocido como
24 TE C N IC A S DE M U E S TR E O IN TR O D U C C IO N 25
y finalmente, la gigantesca encuesta sobre la efectividad de la va limitación exacta. Estas reglas deben ser aplicables a la práctica:
cuna Salk. El estudio que hizo Coleman (1 9 6 6 ) sobre la igualdad el enumerador debe ser capaz de decidir en el campo, sin demasiados
en las oportunidades de educación, realizado en una muestra nacio titubeos, si un caso dudoso pertenece o no a la población.
nal de escuelas, contenía numerosos análisis de regresión que esti L a población que se muestrea (la población muestreada) debe
maban las contribuciones relativas de las características de la escue coincidir con la población sobre la cual se desea información (la
la, el medio familiar, y la actitud del niño frente a los diferentes población objetivo). En ocasiones, por razones de factibilidad, o sim
resultados en los exámenes. ple conveniencia, la población muestreada es más restringida que
la población objetivo. De ser así, debe recordarse que las conclusio
1.3 E T A P A S P R IN C IP A L E S E N U N A E N C U E S T A nes extraídas de la muestra son aplicables a la población muestrea
P O R M UESTREO da, y habrá que recurrir a otras fuentes de información para decidir
hasta qué grado se aplican estas conclusiones a la población objetivo.
Como introducción a una discusión sobre el papel que desempeña Toda información que se obtenga respecto a las diferencias entre
la teoría en una encuesta por muestreo, es útil describir brevemente ambas poblaciones será de utilidad.
los pasos involucrados en la planeación y ejecución de una encuesta.
Las encuestas varían considerablemente en su complejidad. Es una Los datos recogidos
tarea fácil el tomar una muestra de 5 000 tarjetas cuidadosamente
Es conveniente cerciorarse que todos los datos son pertinentes a
arregladas y numeradas en un archivo. Pero la situación es otra si
la encuesta y que no se omiten datos esenciales. Particularmente en
se desea tomar una muestra de los residentes de una región donde se
presencia de poblaciones humanas, existe la tendencia a hacer un
usa un medio de transporte fluvial a través de la selva, donde
número excesivo de preguntas que no se analizan posteriormente.
no hay mapas, donde se hablan 15 dialectos diferentes y los habitan
Un cuestionario demasiado largo produce una baja general de la
tes desconfían de todo extranjero inquisitivo. Problemas que son
calidad de las respuestas, tanto a las preguntas importantes como
desconcertantes en una encuesta pueden ser triviales o inexistentes a las otras.
en otra.
Los pasos principales en una encuesta están agrupados más o Grado de precisión deseado
menos arbitrariamente bajo 11 encabezados y se citan a continua
Los resultados de una encuesta por muestreo están siempre su
ción.
jetos a cierta incertidumbre porque sólo se mide una parte de la
población, y por los errores en las mediciones realizadas. Esta falta
Objetivos de la encuesta '
de certeza se puede reducir al tomar muestras más grandes y em
Una exposición clara de los objetivos es lo más útil. Sin esto, plear mejores dispositivos de medición. Pero esto suele costar tiempo
es fácil olvidarlos en una encuesta compleja al preocuparse por los y dinero, en consecuencia, la especificación del grado de precisión
detalles de la planeación y por lo tanto tomar decisiones que varían deseado, es un paso importante en la preparación de la encuesta.
de los objetivos. Este paso es responsabilidad de la persona que va a utilizar los datos
y puede presentar dificultades, porque los administradores no están
Población bajo muestreo acostumbrados a pensar en términos de la magnitud del error tole
La palabra población se emplea para denominar el conjunto del rable en las estimaciones, compatible con una buena decisión. El
que se elige la muestra. La definición de población puede no pre estadístico puede ayudar en esta etapa.
sentar problema, por ejemplo, cuando se muestrea un grupo de focos
de luz eléctrica a fin de estimar su tiempo de vida promedio. Por Métodos de medición
otra parte, en el muestreo de una población de propiedades agrícolas, Puede existir la posibilidad de escoger el método de medición y
se deben fija r las reglas para definir lo que es por ejemplo, un rancho el método de inspección de la población. Los datos acerca del estado
o una hacienda, y surgen casos dudosos al tfatar de hacer una de de salud de una persona se pueden obtener de sus declaraciones,
26 TE C NIC AS DE M U E S TR E O
Selección de la muestra
O de un examen médico. La encuesta puede emplear un cuestionario
autoadministrado, o un proceso de entrevistas en las que los entre Existe, actualmente, una gran variedad de planes para seleccio
vistadores simplemente leen un cuestionario prescrito, o bien, un nar una muestra. Por cada plan considerado, se pueden hacer, gros-
proceso en el que se permite mucha libertad en la form a y el orden so modo, estimaciones del tamaño de la muestra, partiendo de un
de las preguntas. La inspección puede ser por correo, por visitas conocimiento del nivel de precisión deseado. Los costos relativos y
personales, por teléfono o por una combinación de los tres medios. el tiempo empleado para cada plan también se comparan antes de
Se ha estudiado mucho sobre los métodos de entrevista y sus pro tomar una decisión.
blemas (véase, por ejemplo, Hyman, 1954 y Payne, (1951).
Una parte importante del trabajo preliminar es la construcción de L a encuesta piloto
las formas de registro donde entrarán las preguntas y las respuestas.
En cuestionarios sencillos a veces es posible precodificar las respues Es de gran utilidad probar el cuestionario y los métodos de campo
tas, es decir, colocarlas de tal modo que puedan transferirse rutina en pequeña escala. Esto casi siempre da por resultado mejoras al
riamente a un equipo mecánico. De hecho para la construcción de cuestionario y puede evitar otros problemas que serían serios a ma
buenas formas de registro se necesita prever la estructura de las yor escala, por ejemplo, que el costo fuera mucho mayor que el
tablas de resúmenes finales que se utilizan para obtener las con esperado.
clusiones.
Organización del trabajo de campo
El marco
En encuestas extensas se encuentran muchos problemas de orden
Antes de seleccionar la muestra, la población debe ser dividida administrativo. El personal debe recibir un entrenamiento sobre
en partes llamadas unidades de muestreo o unidades. Estas deben el propósito de la encuesta y los métodos de medición que se em
cubrir la totalidad de la población y no traslaparse en el sentido de plearán. Además, se debe supervisar adecuadamente su trabajo. Un
que todo elemento de la población pertenezca a una y solamente a procedimiento de verificación anticipado sobre la calidad de las res
una unidad. Algunas veces, la unidad apropiada es obvia como en puestas es de incalculable valor. Se deben hacer planes para ma
el caso de la población de los focos donde la unidad es el foco. En nejar las no-respuestas, es decir, la falla del enumerador para obte
otras ocasiones, existe la posibilidad de escoger lo que será la unidad ner la información de ciertas unidades de la muestra.
de muestreo. En e l muestreo de los residentes de una ciudad, la
unidad puede ser una persona, los miembros de una familia, o las Resumen y análisis de los datos
personas que viven en una manzana. En el muestreo de una co
secha agrícola la unidad puede ser un lote, una granja, o una área El primer paso después de realizar la encuesta es el editar los
de terreno cuya forma y dimensiones quedan a nuestra discreción. cuestiónanos obtenidos, con la esperanza de corregir errores o cuan
Frecuentemente, la construcción de esta lista de unidades de do menos desechar los datos que obviamente están equivocados.
muestreo, llamada marco, es uno de los principales problemas prác Habrá necesidad de tomar ciertas decisiones respecto al procedimien
to de cálculo en los casos de omisión de respuestas de quienes res
ticos. Con base en amargas experiencias, los técnicos han adquirido
ponden o de eliminación de datos en el proceso de edición. Después
una actitud crítica frente a las listas que han sido recolectadas en
se realizarán los cálculos que conduzcan a las estimaciones. Puede
forma rutinaria y con algún propósito específico. Aunque se asegure
haber diferentes métodos de estimación para los mismos datos.
lo contrario estas listas suelen ser incompletas, parcialmente ilegi
bles, o contienen duplicaciones de magnitud desconocida. Será difícil Una práctica aconsejable en la presentación de los datos es in
encontrar un buen marco cuando la población es especializada, como formar la magnitud esperada de error en las estimaciones más im
por ejemplo, la población de editores de libros o de criadores de portantes. Una de las ventajas del muestreo de probabilidad es que
pavos. Jessen (1 95 5) presenta un método interesante para cons se pueden hacer tales enunciados (d e error esperado) aunque debe
truir un marco a partir de las ramas de un árbol frutal. rán ser muy calificados si la cantidad de no-respuestas es importante.
28 TE C N IC A S DE M U E S TR E O IN TR O D U C C IO N 29
Información conseguida para encuestas futuras Una simplificación adicional que podemos hacer, consiste en su
poner, lo que es razonable en la práctica si se trata de muestras
Cuanta más información de una población se tenga inicialmente,
de tamaño común, que las estimaciones de muestra tienen una dis
más fácil será e l diseño de una muestra que proporcione estimacio
nes exactas. Toda muestra obtenida es una guía potencial de futuros tribución aproximadamente normal. Con una estimación distribuida
en forma normal se conoce la distribución de frecuencias, si son
muéstreos, por los datos que revela sobre las medias, las desviacio
conocidas la media y la desviación estándar o la varianza. Una
nes estándar, y la naturaleza de la variabilidad de las medidas prin
parte considerable de la teoría del muestreo se ocupa de encontrar
cipales, así como sobre los costos de obtención de datos. La práctica
fórmulas para estas medias y varianzas.
de muestreo avanzará más rápidamente si se prevé lo necesario para
reunir y registrar este tipo de información. Hay dos diferencias entre la teoría estándar de encuestas por
Hay otro aspecto importante en el que una muestra completa muestreo y la teoría clásica del muestreo como aparece en los libros
facilita la obtención de otras posteriores Las cosas nunca resultan de estadística matemática. En la teoría clásica, las mediciones he
como se planearon para la obtención de una muestra compleja. Un chas sobre las unidades de muestreo de la población suele suponerse
muestxeador hábil aprende a reconocer los errores de ejecución y que siguen una distribución de frecuencia de fonna matemática co
a evitar que se repitan. nocida, como sería la distribución normal, cuyos parámetros, media
y varianza, por ejemplo, se estimarían a partir de los datos de las
muestras. Por otro lado, en la teoría de las encuestas por muestreo,
1.4 E L P A P E L D E L A T E O R IA D E L M UESTR EO se supone que sólo se dispone de una información muy limitada
El objeto de encontrar los pasos para una encuesta por muestreo sobre dicha distribución, y sobre todo, no se supone conocida su
es recalcar que el muestreo es un negocio práctico y exige muchas forma matemática, así que el enfoque se puede describir como in
y diversas habilidades. En algunos pasos, como por ejemplo en la dependiente de un modelo o de una distribución de frecuencia. Esta
definición de la población, en la determinación de los datos a reco es una actitud natural para encuestas muy grandes en las que se
ger y de los métodos de medición, y en la organización del trabajo efectúan numerosas mediciones diferentes de las unidades que si
de campo, poco o nada tiene que ver la teoría del muestreo. Aunque guen diversas distribuciones de frecuencia. Para las encuestas en
estos asuntos no se discutirán en el resto del libro, hay que tener las que sólo se realizan pocas mediciones en cada unidad, el estudio
presente su importancia. El muestreo requiere atención en todas las de sus distribuciones de frecuencia puede justificar la hipótesis de
fases de la actividad: un trabajo mediocre en una de ellas puede que son de forma matemática conocida, lo que permite la aplicación
de la teoría clásica.
arruinar tocTá'la encuesta.
El propósito de la teoría del muestreo es que éste sea más efi Otra diferencia es que las poblaciones en una encuesta tienen un
ciente. Su objetivo es desarrollar métodos de selección de muestras número finito de unidades. Los resultados son ligeramente más
y de estimación, que proporcionen, al menor costo posible, estima complicados cuando el muestreo es de una población finita y no
ciones con la suficiente exactitud para nuestros propósitos. Este de una infinita. Por razones prácticas, a menudo se ignoran estas
principio de exactitud específica a costo mínimo aparece una y otra diferencias en los resultados para poblaciones finitas e infinitas. Los
vez en la presentación de la teoría. casos en que no se ignoren, los indicaremos.
Para aplicar este principio, debemos ser capaces de predecir en
cualquier método de muestreo que se considere, la precisión y el
1.5 M U E STR E O P R O B A B IU S T A
costo esperados. Respecto a la precisión, no podremos predecir cuál
será el error de una estimación en una situación específica, porque
Los procedimientos de muestreo considerados en este libro com
esto implicaría el conocimiento del verdadero valor de la población. parten las siguientes propiedades matemáticas.
En lugar de ello, la precisión de un procedimiento de muestreo se
juzga al examinar la >distribución de frecuencia generada para las 1. Podemos definir el conjunto de muestras distintas S3>. . . ,
estimaciones, suponiendo que el proceso de muestreo se aplica va S„, que el procedimiento es capaz de elegir si se aplica a una pobla
rias veces a la misma población. Desde luego, ésta es la técnica ción específica. Esto significa que podemos decir con precisión cuá
estándar con la que se juzga la precisión en la teoría estadística. les son las unidades de muestreo que pertenecen a StI S-, etc.
Supongamos, por ejemplo, que la población consta de seis unidades, 1. La muestra es una parte de la población fácilmente accesible.
numeradas de 1 a 6 . Un procedimiento común para elegir una mues Una muestra de carbón en un vagón abierto se puede tomar a 15
tra de tamaño 2 ofrece tres posibilidades S , ~ ( l , 4 ) ; S..~(2. 5 ); S3 o 20 cm de la parte superior.
^ ( 3 , 6 ). Nótese que no se incluyen todas las posibles muestras de 2. La muestra se selecciona a la ventura. AI tomar diez conejos
tamaño 2 . de una jaula en un laboratorio, el investigador puede sacar aquellos
2. Cada muestra posible S¡ tiene asignada una probabilidad de que alcance con la mano, sin una planeación consciente.
selección r*. 3. Con una población pequeña pero heterogénea, el investigador
3. Se selecciona una de las S¡ por un proceso aleatorio, en el inspecciona la totalidad de ésta y selecciona una pequeña muestra
que cada S¿ tiene una probabilidad ir* de ser elegida. En el ejemplo de unidades “típicas”, es decir, unidades que a su parecer están cer
anterior, podríamos asignar la misma probabilidad a cada muestra. canas al promedio de la población. Este método algunas veces es
Posteriormente, la selección se podría realizar al elegir un número llamado de ju icio o de selección intencional.
aleatorio entre 1 y 3. Si el número es j, se toma la muestra S¡. 4. La muestra consta esencialmente de voluntarios, en estudios
4. El método para calcular la estimación a partir de la muestra en los cuales el proceso de medición es desagradable o penoso para
debe ser definido y debe conducir a una estimación única para cual la persona que está siendo investigada.
quier muestra específica. Podemos decir, por ejemplo, que la esti En condiciones adecuadas cualquiera de estos métodos puede
mación es el promedio de las mediciones correspondientes a las dar resultados útiles. Sin embargo, no son los indicados para el
unidades individuales de la muestra. desarrollo de una teoría de muestreo, ya que no involucran ningún
Para todo procedimiento de muestreo que satisfaga estas condi elemento aleatorio en el procedimiento de selección. Casi la única
ciones, podemos calcular la distribución de frecuencia de las esti manera de examinar qué tan bueno puede ser uno de los métodos
maciones que genera el proceso, si se aplica repetidamente a la es encontrar una situación en la cual los resultados sean conocidos,
misma población. Sabemos la frecuencia con que se elige cualquier ya sea para la población total o para una muestra basada en pro
muestra S¡, y sabemos cómo calcular la estimación a partir de los babilidades y posteriormente hacer una comparación. Pero aun así,
datos de S,. Por lo tanto, es claro que se puede desarrollar una si un método resulta adecuado en la comparación, puede ser inade
teoría de muestreo para cada procedimiento de este tipo, aunque los cuado al variar las condiciones.
detalles del desarrollo puedan ser intrincados. Un método de esta En relación con lo anterior (muéstreos probabilistas y no pro
clase se conoce con el nombre de muestreo probabilista. babilistas) señalamos que algunos de los primeros usos del mues
En la práctica, rara vez se extrae una muestra de probabilidad treo que hicieron los gobiernos a nivel urbano o nacional, desde
dando las S¡ y los números ir( como se esbozó anteriormente. Es 1850, tenían como finalidad reducir los costos de las estimacio
un trabajo muy laborioso paTa una gran población, en la cual un nes de los resultados de un censo. Para los tributos más impor
procedimiento de muestreo puede producir billones de muestras po tantes del censo, se calculaban los totales de la ciudad o el país,
sibles. Por lo general, la extracción se hace al especificar probabi aprovechando completamente la información obtenida del censo.
lidades de inclusión en la muestra para las unidades individuales Para las mediciones restantes se tomaba una muestra que variaba
y extraer unidades, una a la vez, o en grupos, hasta constituir la entre el 15 y el 25% de los formularios devueltos después del
muestra del tamaño y tipo deseado. Desde el punto de vista teórico, censo, con objeto de aligerar el trabajo de estimación de los totales
basta saber que si quisiéramos, podríamos especificar las subcolec- de la ciudad o el país para dichas mediciones. Se usaron dos métodos
ciones S¡ y las tt¡, siempre y cuando tuviéramos tiempo ilimitado diferentes para la selección de la muestra. El primero, llamado de
para hacerlo. selección aleatoria es una aplicación del muestreo de probabilidad
según el cual cada unidad de la población (cada formulario devuelto
después del censo) tiene la misma oportunidad de ser incluido en
1.6 A L T E R N A T IV A S A L M UESTR EO P R O B A B IL IS T A la muestra. Para este método se constató que, como se dijo anterior
mente, con ayuda de la teoría del muestreo y la distribución normal
A continuación veremos algunos tipos comunes de muestreo no es posible predecir, en forma aproximada y con los datos de la
probabilistas. muestra, la magnitud del error esperado en las estimaciones hechas
32 TE C N IC A S DE M U E S TR E O IN TRO D U C CIO N 33
a partir de la muestra. Más aún, en los ítems más importantes para donde pt es la estimación dada por la i-ésima muestra. El símbolo
los que se disponía de los datos completos que suministró el censo, E, que significa “valor esperado de” , es de uso común.
es posible, hasta cierto grado verificar la exactitud de las predic Como se mencionó en la Sec. 1.4, las muestras en algunas en
ciones. cuestas son tan grandes que siguen una distribución aproximada
El segundo método es la selección a -propósito. Esta no se definía mente normal. Además, con el muestreo probabilista, tenemos
en detalle, pero presentaba dos rasgos comunes. La unidad de mues fórmulas que dan la media y la varianza de las estimaciones. Su
treo consistía en grupos de formularios, a menudo relativamente pongamos que hemos tomado una muestra por un proceso que se
grandes. Por ejemplo, en el censo italiano de 1921, el país tenía sabe que proporciona un estimador insesgado y que hemos calculado
8 354 comunas, agrupadas en 214 distritos. Al extraer una muestra la estimación de muestra p y su desviación estándar <r¿ (que suele
del 14% , los estadísticos italianos Gini y Galvani seleccionaron a llamarse su error estándar). ¿Qué tan buena es esta estimación? No
propósito 29 distritos, en lugar de 1 250 comunas. En segundo podemos conocer el valor exacto del error de estimación (p — n )
lugar, los 29 distritos se eligieron de tal modo que la muestra pro pero por las propiedades de la curva normal, puede esperarse que
porcionara estimaciones exactas para 7 importantes variables de 0.32 (en 1 caso de 3 ) el error absoluto |/í - /t| excede a¡i
control, cuyos resultados eran conocidos para todo el país, y con
0.05 (en 1 caso de 2 0 ) el error absoluto |p - p\ excede 1.96ap - 2 ap.
esto se esperaba que la muestra diera buenas estimaciones de las
0.01 (e n 1 caso de 1 0 0 )el error absoluto |jl — excede 2.58o/i
otras variables altamente correlacionadas con las de control.
En la década de los 20, el Instituto Estadístico Internacional Por ejemplo, si una muestra probabilista de los registros de
nombró una comisión para estudiar las ventajas y desventajas de acumuladores de uso rutinario en una fábrica muestra una vida
los dos métodos. El informe de Jensen (1 92 6) pareció favorecer promedio p. - 394 días, con error estándar de a¿ - 4.6 días; se es
ol método de selección a propósito. Sin embargo, este método se pera que en 99 de 100 casos la vida promedio en la población de
abandonó relativamente pronto como técnica de muestreo para ob baterías se sitúe entre
tener estimaciones nacionales en las encuestas que medían muchas
/l =394-(2.58X4.6) = 382 días
variables, ya que carecía de la flexibilidad que ofrecían los métodos
y
de muestreo probabilista desarrollados posteriormente, no podía pre
P u = 394 + (2.58X4.6) = 406 días
decir a partir de la muestra la exactitud esperada en las estimaciones
y usaba unidades de muestreo demasiado grandes. Gini y Galvani Los límites, 382 días y 406 días, se llaman límites de confianza
concluyeron que el método de muestreo denominado muestreo alea inferior y superior. Con una sola estimación de una encuesta, la
torio estratificado (Cap. 5 ) que utiliza la comuna como unidad de afirmación “p. está entre 382 y 406 días" no es correcta con certeza.
muestreo, habría dado mejores resultados que su método. La magnitud “99% de confianza" implica que si se usara el mismo
plan de muestreo muchas veces en una población, haciendo un
enunciado de confianza a partir de cada muestra, el 99% (aprox.)
1.7 U S O D E L A D IS T R IB U C IO N N O R M A L
serían correctas y 1% estarían equivocados. Cuando el muestreo
En ocasiones es útil usar la palabra estimador para designar la ha sido introducido en una operación en la que previamente se haya
regla por la cual se calcula alguna característica n de la población, usado un censo completo, una demostración de esta propiedad algu
a partir de los resultados de la muestra, y la palabra estimación nas veces se hace sacando muestras repetidas del tipo propuesto de
para el valor obtenido de una muestra específica. Un estimador p una población para la cual exista un registro completo, de tal mane
de n dado por un plan de muestreo se llama insesgado si el valor ra que ¡i sea conocido (véase, por ejemplo, Trueblood y Cyert, 1957).
medio de p, tomado sobre todas las muestras posibles proporcionadas La verificación práctica de que aproximadamente la proporción es
por el plan, es igual a p. En la notación de la Sec. 1.5, puede es tablecida de aseveraciones es correcta, es útil para educar y tran
cribirse esta condición quilizar a los administradores respecto a la naturaleza del muestreo.
De modo semejante, cuando se toma una sola muestra de cada una
de una serie de poblaciones diferentes, cerca de un 95% de las ase
£ (£ )= X =M
/-i veraciones de confianza al 95% son correctas.
IN TR O O U C C IO N 35
La discusión precedente presupone que cr¿, según se calcula de

la muestra, es conocido exactamente. En realidad, tanto <r¿, como /i,
están sujetos a error de muestreo. Con una variable normalmente
distribuida, se usan las tablas de distribución t de Student, en lugar
de las tablas normales para calcular los límites de confianza para ¡i
cuando la muestra es pequeña. El reemplazo de la tabla normal por
la tabla de í casi no hace diferencia si e l número de grados de li
bertad en a¿ excede a 50. Con ciertos tipos de muestreo estratificado
y con el método de muestreo repetido (Sec. 11.19) los grados de
Libertad son pequeños y la tabla t es necesaria.
1.8 E L SESG O Y SUS EFECTOS
En la teoría de las encuestas por muestreo es necesario consi

derar los estimadores sesgados por 2 razones:
Fie. 1-1. Efecto del sesgo en los errores de estimación
1. En algunos de los problemas más comunes, particularmente
en la estimación de razones, se encuentra que los estimadores con tremo derecho, la probabilidad de un error de más de + 1.96a es el
venientes y apropiados son sesgados. área sombreada a partir de Q en la Fig. 1-1. Esta área está dada por
2. Aun con los estimadores que son insesgados en muestreo proba-
bilista, los errores de medición y las no-respuestas pueden pro 1
d/1
ducir sesgos en los números que se calculan a partir de los datos.
Esto sucede, por ejemplo, cuando casi todas las personas que se Sea ¡1 - m — <rt. El límite inferior del intervalo de integración para
niegan a ser entrevistadas se oponen a cierto gasto de los fondos
t es
públicos, en tanto que aquellas que han sido entrevistadas se dividen
igualmente en pro y en contra.
^——+ 1.96= 1.96——
Para examinar el efecto del sesgo, supóngase que la estimación
/2 está normalmente distribuida alrededor de una media m que está a Por lo que el área es:
una distancia B del verdadero valor de la población, como se ve
en la Fig. 1.1. La magnitud del sesgo es B - m — ¡i. Supongamos - d / 2
d:
que desconocemos la existencia del sesgo. Calculamos la desvia
ción estándar a de la distribución de frecuencias del estimador De manera semejante, el extremo izquierdo, es decir, el área som
— esto será, desde luego, la desviación estándar respecto a la media breada a la izquierda a partir de P, tiene una área de:
m de la distribución, no respecto a la verdadera media — . Esta
- 1 .9 6 —
mos usando a en lugar de cr-. Como una afirmación acerca de la -|J/2
exactitud de la estimación, declaramos que la probabilidad es de dt
0.05 de que el estimador fi. esté en error por más de 1.96<r.
Consideraremos ahora cómo la presencia del sesgo distorsiona A l observar las integrales, está claro que la perturbación depende
esta probabilidad. Para hacer esto calculamos la verdadera probabi únicamente de la razón del sesgo a la desviación estándar. Los re
lidad de que la estimación está en error por más de 1.96<r, en donde sultados se muestran en la Tabla 1.1.
el error es medido a partir de la verdadera media n. Ambos lados En el caso de considerar la probabilidad total de cometer un
de la distribución deben ser examinados separadamente. Para el ex- error de más de 1.96a, el sesgo tiene poco efecto, siempre y cuando
36 TE C NIC AS DE M U E S TR E O IN TR O D U C C IO N 37
TABLA 1.1. E f e c t o d e u n s e s g o B e n l a P r o b a b il i d a d de Co m e t e r un no excederá a 0.1. Por otro lado, con sesgos causados por errores
E r r o r M a y o r q u e 1.96a
de medición o de no-respuesta, generalmente es imposible encontrar
el límite superior para B/o que es pequeño. Este enfadoso proble
Probabilidad de error
ma se discute en el Cap. 13.
B/o < -1.96o > 1-96cr Total
0.02 0.0238 0.0262 0.0500

1.9 E L ERROR C U A D R A T IC O M E D IO
0.04 0.0228 0.0274 0.0502
0.06 0.0217 0.0287 0.0504
A fin de comparar un estimador sesgado, con un estimador in-
0.08 0.0207 0.0301 0.0508
0.10 0.0197 0.0314 0.0511 sesgado, o bien, dos estimadores que tienen cantidades diferentes
0.20 0.0154 0.0392 0.0546 de sesgo, un criterio útil es el del error cuadrático medio (E C M ) del
0.40 0.0091 0.0594 0.0685 estimador, medido a partir del valor de la población que se está es
0.60 0.0052 0.0869 0.0921 timando. Formalmente,
0.80 0.0029 0.1230 0.1259
1.00 0.0015 0.1685 0.1700 ECM(/Í) = E (fi - = E[(/2 - m)+<m - #» )]2
1.50 0.0003 0.3228 0.3231 = E (ji —m )2+ 2(m - - m )+ (m - n )2
= (variación de ¡1) + (sesgo ) 1
sea menor que una décima de la desviación estándar. En este punto, El doble producto desaparece, ya que E(jL — m ) — 0.
la probabilidad total es de 0.0511 en lugar de ser 0.05 que pensa
mos que es. Conforme aumenta más este sesgo, la perturbación se El uso del ECM, como un criterio de la exactitud de un estima
vuelve más seria. Para B — <r, la probabilidad de error es de 0.17, dor, equivale a considerar dos estimadores que tienen el mismo
más de 3 veces el valor supuesto. ECM como equivalentes. Esto no es estrictamente correcto porque
Los dos lados de la distribución se afectan de una manera dife- las distribuciones de frecuencia de los errores ( f i — /*), de tamaños
renle. Con un sesgo positivo, como en e l ejemplo, la probabilidad diferentes no serán las mismas para los dos estimadores si tienen
de una sobreestimación más allá de 1.96o- disminuye con rapidez del cantidades diferentes de sesgo. Sin embargo, ha sido demostrado por
valor supuesto de 0.025 para volverse despreciable cuando B = o. La Hansen, Hurwitz y Madow (1 9 5 3 ) que si B/o es aproximadamente
probabilidad de la sobreestimación correspondiente se eleva en for menor un medio, las dos distribuciones de frecuencia son casi
ma constante. En la mayoría de las aplicaciones el error total es de idénticas en relación con los errores absolutos \(L— de magnitu
Interés primordial, pero en ocasiones estamos particularmente inte des diferentes. La Tabla 1.2 ilustra este resultado.
resados en los errores cometidos en una sola dirección.
Como una regla de trabajo, el ‘efecto del sesgo en la exactitud
T A B L A 1.2. P r o b a b il i d a d d e u n E r r o r A b s o l u t o > 1 \ / E C M , 1 .9 6 ^ / E C M y
de un estimador es despreciable si el sesgo es menor que un déci
2 .5 7 6 v 'E C M '
mo de la desviación estándar de la estimación. Si tenemos un mé
todo de estimación que produce sesgo para el cual B/o < 0 .1 , en
donde B es el valor absoluto del sesgo, se puede argumentar que el Probabilidad
sesgo no es una desventaja del método. Aun con B/o- — 0.2, es mo
desta la perturbación en la probabilidad del error. Ble 1 v'ECM 1.96 V'ECM 2.576 v'ECM
En el uso de estos resultados se deben distinguir las dos fuen

0 0.317 0.0500 0.0100
tes de sesgo mencionadas al principio de esta sección. Con sesgos 0.2 0.317 0.0499 0.0100
que surgen en la estimación de proporciones, un límite superior a 0.4 0.319 0.0495 0.0095
la proporción B/o se puede determinar matemáticamente. Si la mues 0.6 0.324 0.0479 0.0083
tra es lo bastante grande, podemos tener la confianza de que B/o
38 TE C NIC AS DE M U ESTRE O IN TR O D U C C IO N 39
Aun si B/<T - 0.6, los cambios en las probabilidades al compa aproximadamente de una manera normal con un error estándar de 0.0082. Si
el valor del inventario según los libros de registro es de $80 000, calcule los
rarlas con los valores obtenidos para B/<r - 0 son ligeros.
límites de confianza del 95% para el valor real.
Debido a la dificultad de poder asegurar que ningún sesgo in
1.6. Frecuentemente los datos se deben tratar como una muestra, a pesar
sospechado se introduce en las estimaciones, generalmente hablare de que a primera vista parece que constituyen una enumeración completa.
mos de la p r e c i s i ó n de un estimador más que de su e x a c t it u d . La El propietario de un lote de estacionamiento encuentra que el negocio dismi
exactitud se refiere a la magnitud de las desviaciones respecto a la nuye los domingos por la mañana. Después de 26 domingos de operación, su
media verdadera mientras que precisión se refiere a la magnitud percepción promedio por dom ingo es exactamente $ 10.00. El error estándar
de esta cifra, calculado a partir de las variaciones de semana a semana, es de
de las desviaciones respecto a la media m obtenida por la aplicación
$1.20. Los costos del cuidador son de $7.00 cada domingo. El propietario quie
repetida del procedimiento de muestreo. re mantener abierto el lote los domingos por la mañana siempre y cuando su
utilidad esperada fuera de $5.00. ¿Cuál es la probabilidad de que la utilidad a
largo plazo sea de, al menos, $5.00? ¿Qué suposición se debe hacer para
E J E R C I C I O S responder a esta pregunta?
1.7. En la Tabla 1.2, ¿qué pasaría a la probabilidad de excederse en
1.1. Suponga que usa el muestreo para estimar el número total de pala
bras de un libro que contiene ilustraciones. 1 V E C M , 1.96 V’ECM y 2.576 y/ECM cuando B/a tiende a ser infinita, es decir,
cuando e l ECM es debido enteramente a sesgo? ¿Concuerdan sus resultados
( a ) ¿Hay algún problema para la definición de la población? ( b ) ¿Cuáles con la dirección de los cambios anotados en la Tabla 1.2 conforme B/a varíe
son los pros y los contras de: ( 1) la página, ( 2 ) el renglón, como unidad de de 0 a 0.6?
muestreo?
1.8. Cuando es necesario comparar dos estimaciones que tienen diferentes
1.2. Se va a tom ar una muestra de una lista de nombres que están en tar distribuciones de frecuencia de errores (#2 — ¡i), ocasionalmente es posible, en
jetas (u n nombre por tarjeta) numeradas consecutivamente, las cuales se
problemas especializados, calcular el costo o la pérdida que resultaría de
encuentran en un archivo. Cada nombre tendrá la misma oportunidad de ser
un error ( j l — /*) de cualquier tamaño dado. Se prefiere la estimación que
incluido en la muestra. ¿Qué problemas surgen de las siguientes situaciones da la pérdida esperada más pequeña, siendo el resto de las condiciones iguales.
comunes? ( a ) Algunos de los nombres no pertenecen a la pohlación-objeto, a Demuestre que si la pérdida es una función cuadrática \ ( f i — t i)- del error,
pesar de que este hecho no puede ser verificado para ningún nombre hasta debemos escoger la estimación con el error cuadrático medio menor.
que no se seleccione, ( b ) Algunos nombres aparecen en más de una tarjeta.
Todas las tarjetas con el mismo nombre llevan números consecutivos y, por
lo tanto, aparecen juntas en el archivo, ( c ) Algunos nombres aparecen en
más de una tarjeta, pero las que llevan el mismo nombre pueden estar colo
cadas en cualquier lugar dentro del archivo.
1.3. E l problema para encontrar un marco completo que permita la obten
ción de una muestra es frecuentemente un obstáculo. ¿Qué clase de marcos
pudieran ser convenientes para las siguientes encuestas? ¿Tienen los marcos
alguna deficiencia seria? ( a ) Una encuesta de tiendas que venden petacas
en una gran ciudad, ( b ) Una encuesta de artículos que se dejan en los trenes
subterráneos o autobuses, ( c ) Una encuesta de las personas mordidas por
víboras durante el último año.
1.4. Un directorio de la ciudad, de hace cuatro años, enlista las direccio
nes en orden a lo largo de cada calle, y da los nombres de las personas que
viven en cada dirección. Para una encuesta que se lleva a cabo actualmente
por medio de entrevistas a la gente de la ciudad, ¿cuáles son las deficiencias
de este marco? ¿Pueden ser remediadas por los entrevistadores durante el
desarrollo de la encuesta? Al usar el directorio, ¿sacaría usted una lista de
dilecciones (d om icilios) o una lista de personas?
1.5. En una estimación para muestreo del valor real de objetos pequeños
en el inventario de una gran firm a, el valor real y el registrado en los libros
se obtuvieron para cada objeto de la muestra. Para la muestra total, la razón
del valor real al registrado fue de 1.021; esta estimación está distribuida
C A P IT U L O 2
Muestreo Aleatorio Simple
2.1 M U E STR E O A L E A T O R IO S IM P LE
El muestreo aleatorio simple es un método de selección de n

unidades en un conjunto de iV de tal modo que cada una de las
.vC* muestras distintas tengan la misma oportunidad de ser elegidas.
En la práctica, un muestreo aleatorio se realiza unidad por uni
dad. Se numeran las unidades de 1 a N . Posteriormente se extrae
una serie de n números aleatorios entre 1 y N , ya sea utilizando una
tabla de números aleatorios o mediante un programa de computa
ción que produce una tabla semejante. En cada extracción, el pro
ceso debe otorgar la misma oportunidad de selección a todos y cada
uno de los números que no hayan salido. Las unidades que llevan
estos n números constituyen la muestra.
Fácilmente se verifica que todas las „C„ muestras distintas, tie
nen la misma oportunidad de ser extraídas por este método. Consi
dérese una muestra determinada, es decir, una colección de n uni
dades especificadas. En la primera extracción, la probabilidad de que
se seleccione una de estas n unidades es n/N. En la segunda, la pro
babilidad que se extraiga una de las restantes (n — 1 ) unidades
especificadas es (n — 1 )/ (N - 1 ), y así sucesivamente. Por lo tan
to, la probabilidad de que se extraigan las n unidades especificadas es
n_ ( n - 1) (n - 2 ) 1 _ n \ (N -n )\ ^ 1
N ( N —l ) ( N —2) " (JV-n + 1) <N)!
Como en todas las extracciones subsecuentes se descarta un núme
ro extraído, este método también se llama muestreo aleatorio sin
restitución. El muestreo aleatorio con restitución es perfectamente
M U E S TR E O A LE A TO R IO S IM P L E 43
TABLA 2.1. U n M i l l a r d e D íg it o s A l e a t o r io s
factible: en cada extracción todos los N miembros de la población
reciben la misma oportunidad de extracción, sin que importe el nú
mero de veces que se extrajeron antes. Las fórmulas de varianzas 00-04 05-09 10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49
y varianzas estimadas de las estimaciones realizadas a partir de la
muestra son a menudo más simples cuando el muestreo es con res 00 54463 22662 65905 70639 79365 67382 29085 69831 47058 08186
01 15389 85205 18850 39226 42249 90669 96325 23248 60933 26927
titución que en el caso contrario. Por esta razón, se utiliza el mues
02 85941 40756 82414 02015 13858 78030 16269 65978 01385 15345
treo con restitución en los planes de muestreo más complicados, 03 61149 69440 11286 88218 58925 03638 52862 62733 33451 77455
aunque a primera vista parece inútil tener dos o más veces la misma 04 05219 81619 10651 67079 92511 59888 84502 72095 83463 75577
unidad dentro de la muestra.
05 41417 98326 87719 92294 46614 50948 64886 20002 97365 30976
06 28357 94070 20652 35774 16249 75019 21145 05217 47286 76305
07 17783 00015 10806 83091 91530 36466 39981 62481 49177 75779
2.2 SE LE C C IO N D E U N A M U E S T R A A L E A T O R IA S IM P LE 08 40950 84820 29881 85966 62800 70326 84740 62660 77379 90279
09 82995 64157 66164 41180 10089 41757 78258 96488 88629 37231
Las tablas de números aleatorios son tablas de los dígitos 0, 1,
2 , . . . 9, donde cada dígito tiene la misma probabilidad de ser se 10 96754 17676 55659 44105 47361 34833 86679 23930 53249 27083
11 34357 88040 53364 71726 45690 66334 60332 '22554 90600 71113
leccionado en cada extracción. Entre las tablas más grandes están
12 06318 37403 49927 57715 50423 67372 63116 48888 21505 80182
las que publicó la Rand Corporation (1 9 5 5 ) con un millón de dígi 13 62111 52820 07243 79931 89292 84767 85693 73947 22278 11551
tos y las de Kendall y Smith (1 9 3 8 ) con 100 000 dígitos. En los 14 47534 09243 67879 00544 23410 12740 02540 54440 32949 13491
textos estándar de estadística se pueden encontrar muchas tablas.
15 98614 75993 84460 62846 59844 14922 48730 73443 4816"7 34770
La Tabla 2.1 muestra 1 000 dígitos aleatorios y para ilustración, de 18644 44104
16 24856 03648 44898 09351 98795 39765 71058 90368
Snedecor y Cochran (1967). 17 96887 12479 80621 66223 86085 78285 02432 53342 42846 94771
18 90801 21472 42815 77408 37390 76766 52615 32141 30268 18106
Cuando se usan estas tablas para seleccionar una muestra alea
19 55165 77312 83666 36028 28420 70219 81369 41943 47366 41067
toria simple, el primer paso es la enumeración de las unidades de la
población de 1 a N. Si el primer dígito de N es un número entre
5 y 9, el siguiente método de selección es el adecuado. Supóngase
N = 528 y queremos n - 10. Tómense tres columnas de la T a
números entre 801 y 999 y desde luego 000 de todos los números
bla 2.1, digamos la 25, 26 y 27. Recórrase hacia abajo cada columna
entre 000 y 200. Todos los residuos mayores que 129 y los números
seleccionando los 10 primeros números distintos, entre 001 y 528.
000, 200, etc., se desechan. A l utilizar las columnas 05 a 07 de la
Estos son 36, 509, 364, 417, 348, 127, 149, 186, 290 y 162. Para
Tabla 2.1 obtenemos 26, 52, 7, 94, 16, 48, 41, 80, 128 y 92, la ex
los dos últimos números saltamos a las columnas 30 a 32. En selec
tracción que requiere 15 números de tres dígitos para n - 10. En
ciones repetidas es aconsejable cambiar el punto de partida en
esta muestra la tasa de rechazo 5/15 = 33% es cercana a la pro
la tabla.
babilidad de rechazo 72/200 = 36% , para este método. Al usar este
La desventaja de este método es que los números de tres dígitos
método con número N como 384, nótese que uno substrae 400 de un
000 y todos los del 529 a 999 no se usan aunque al saltarse núme
número entre 401 y 800, pero automáticamente desecha todos ios
ros no se pierde mucho tiempo. Cuando el primer dígito de N es
números mayores a 800. La substracción de 800 de los números
menor que 5, algunos pueden preferir este método si n es pequeño
entre 801 y 999 daría una mayor probabilidad de aceptación de re
y se dispone de una tabla de números aleatorios bastante grande.
siduos entre 001 y 199 que de los residuos entre 200 y 384.
Con N - 128, por ejemplo, un segundo método con menos re
Hay otros método de muestreo que se prefieren al muestreo alea
chazos y de más fácil aplicación es el siguiente. En una serie de
números de tres dígitos se substrae 200 de todos los números que torio simple por razones de conveniencia o de mayor precisión. El
muestreo aleatorio simple es el más adecuado para una introduc
hay entre 201 y 400, se substrae 400 de todos los números entre 401
y 600, 600 de todos los números entre 601 y 800, 800 de todos los ción a la teoría de! muestreo.
44 TE C N IC A S DE M U ESTRE O
M U E S TR E O ALEA TO RIO S IM P L E 45
2.3 D E F IN IC IO N E S Y N O T A C IO N El símbolo * identifica una estimación muestral de una carac

terística de la población. En este capítulo sólo se consideran los
En una encuesta por muestreo elegimos ciertas propiedades que estimadores más simples:
intentamos medir y registrar para cada unidad que venga dentro de
la muestra. Estas propiedades de las unidades se llaman caracte Estimadores
rísticas o simplemente, atributos.
Los valores obtenidos para cualquier atributo específico en las
Media de la población Y Y = y = media muestral
N unidades que comprenden la población, se representan por yu
y2 yN- Los valores correspondientes para las unidades en mues Total de la población Y Y=Ny = N f.y,/n
treo se denotan por ylt y2, . . ., y„, o, si queremos referimos a un fn
Razón de la población R R = y/x = t y l/ t x i
miembro de la muestra en general, por y¡ ( i = 1 , 2, . . n) . Nótese
que la muestra no consistirá de las primeras n unidades en la po
blación, excepto en el caso, usualmente raro, en que se seleccionen
En y al factor N/n que multiplica al total muestral, algunas
precisamente estas unidades. Si este punto no se olvida, de acuerdo
veces se llama el factor de expansión, elevación o inflación. Su in
a mi experiencia, no habrá confusión.
verso n/N, la razón del tamaño de la muestra respecto a la pobla
Las letras mayúsculas se refieren a las características de la po ción, se llama fracción de muestreo y se identifica con la letra f.
blación y las minúsculas a las de la muestra. Para los totales y las
medias tenemos las siguientes definiciones:
2.4 P R O P IE D A D E S D E L A S E ST IM A C IO N E S
Población Muestra
La precisión de cualquier estimación basada en una muestra
N „
Total: Y = I y ( = y ,+ y 2+ - ' + y N I y. = y i + y 2+ -- ’ + y. depende del método por el cual se calcula la estimación a partir de
los datos de la muestra, y del plan de muestreo. Para ahorrar espa
cio nos hemos referido algunas veces a ‘l a precisión de la media
Media: Y = y ' * yi+ ‘ " +y*= IL b - y. + y2+ - •-+ y„ ¿y, muestral” o ‘l a precisión del muestreo aleatorio simple” , sin men
cionar específicamente el otro factor fundamental. Esto sólo ha
ocurrido en los casos donde es claro, en el contexto, cuál es el factor
Aun cuando el muestreo se realiza con muchos propósitos, el que falta. Al estudiar cualquier fórmula que se presenta, el lector
interés se centra, con frecuencia, en cuatro características de la debe asegurarse que conoce el método específico de muestreo y el
población. método de estimación para el cual se ha establecido la fórmula.
En este libro, un método de estimación se llama consistente si
1. Media = Y (por ejemplo, el número promedio de niños por
la estimación se vuelve exactamente igual al valor de la población
escuela).
cuando n - N, o sea, cuando la muestra está constituida por la
2. Total - Y (p or ejemplo, el número total de hectáreas de trigo
población total. Para el muestreo aleatorio simple, es obvio que y y
en una región).
Njf son estimaciones consistentes de la media de la población y del
3. La proporción de dos totales o medias R — Y/X = Y/X (por total, respectivamente. La consistencia es una propiedad deseable de
ejemplo, la razón del activo neto al activo total en un grupo de los estimadores. Por otro lado, un estimador inconsistente no nece
fam ilias). sariamente es inútil, ya que puede dar una precisión satisfactoria
4. La proporción de unidades que caen dentro de alguna clase cuando n, comparado con N, es pequeño. Es posible que su utilidad
definida (por ejemplo, proporción de personas con dientes postizos). esté confinada a esta situación Hansen, Hurwitz y Madow (1 95 3)
y Murthy (1 9 6 7 ) dan otra definición de la consistencia semejante a
En este capítulo se discute la estimación de las primeras tres la de la estadística clásica. Un estimador es consistente, si la proba
cantidades.
bilidad de que sea erróneo en una cantidad dada, o en una mayor
46 TE C NIC AS DE M U E S TR E O M U E S TR E O A LE A TO R IO S IM P L E 47
tiende a cero al crecer la muestra. Un enunciado exacto de esta de El multiplicador debe ser n/N, ya que la expresión de la izquierda
finición requiere cierto cuidado para planes de encuesta complejos. tiene n términos y la de la derecha tiene N términos. Esto conduce
Como hemos visto, un método de estimación es insesgado si el al resultado.
valor promedio de la estimación, que se toma sobre todas las mues
tras posibles de un tamaño n dado, es exactamente igual al valor
verdadero de la población. Si el método va a ser insesgado, este re 2.5 V A R IA N Z A S DE L A S E ST IM A C IO N E S
sultado debe ser cierto para cualquier población de valores finitos j/í
y para cualquier n. Para investigar si y es insesgado con e l mues La varianza de los valores y¿ en una población finita usualmen
treo aleatorio simple, calculamos el valor de y para todas las yC„ te se define como
muestras y buscamos el promedio de las estimaciones. Con el sím
bolo E se indica este promedio sobre todas las muestras posibles.
U y > -Y )2
Teorema 2.1. La media muestra! y es un estimador insesgado
- 2 =-L- ) 7 — <2'6>
de Y.
Prueba: Por definición, Por motivos de notación, los resultados se presentan en términos de
una expresión ligeramente diferente, en donde el divisor ( N — 1)
E 9 = L ± M y ± + y2+ - - - + y ¿ (2 2 ) se usa en lugar de N. Entonces tenemos:
y vC, n[JV!/n!(N-n)!j . (¿U)
En donde la suma se extiende sobre todas las jVC„ muestras. Para X (y .- y )2
evaluar esta suma, buscamos en cuántas muestras aparece un valor
específico cualquiera, y¡. Como están disponibles otras ( N - 1) uni s
2=V r (2
-
7)
dades para el resto de la muestra y otros (n — 1 ) lugares para com
Esta convención la usan quienes enfocan la teoría del muestreo por
pletar la muestra, el número de muestras que contienen y, es
medio del análisis de la varianza. Su ventaja es que la mayoría de
_ ( N - 1)! los resultados teman una forma ligeramente más simple. Siempre y
n - i L * -' (n _ 1)!(JV_ n)! (2-3) cuando se use consistentemente la misma notación, todos los resul
tados son equivalentes en ambas notaciones. Consideremos ahora la
De donde:
varianza de y. Por esto queremos decir E (y - Y ) 5 tomada sobre to
das las nC» muestras.
£ ( y , + y 2+ - ■ ' - + y~)
Teorema 2.2. La varianza de la media y de una muestra alea
Sustituyendo en (2 .2 ) tenemos:
toria simple es
( N - 1)! n l(N -n )\ ,
E ? = (n - m N - „ ) t nN\ iy' +y' + ' ’ ^
V(y) = E ( y - Y ) 2= - (- ^ ^ = - ( , l - f ) (2.8)
n /V n
, ( y, +y2+ - ( 24)
en donde f - n /N es la fracción de muestreo.
Corolario. Y = N y es un estimador insesgado del total de la Prueba:
población Y.
n ( y - Y ) = (y i- Y ) + {y2- Y ) + - - - + ( y n- Y } (2.9)
Una prueba menos complicada del Teorema 2.1 es como sigue:
como cada unidad aparece en el mismo número de muestras, está
Por el argumento de simetría usado en la relación (2 .5 ), se tiene que
claro que
£(y, + </2 4 - 1- y„) debe ser un múltiplo de yy + y2 + • • • + ys (2.5)
48 TE C NIC AS DE M U ESTRE O M U E S TR E O A LEA TO RIO S IM P L E 49
y también que Corolario 3. El error estándar de Y es
£ [ (y , - Y)(y 2 - Y ) + ( y . - v ) ( y 3- ? ) + • • • + < y . - i - *)(y« - ? ) ] NS

o-f = n )/N = - p V l - / (2.14)
v/i V/i
= ^ - ñ + (y. - v)<y3- ñ
+ - - - + (yN . l - y ) ( y N - Í Ó ] (2-11) 2.6 L A CO R R EC C IO N PO R P O B L A C IO N F IN IT A
En (2 .1 1 ) la suma de los productos se extiende sobre todas las pa Para una muestra al azar de tamaño n de una población infinita,
rejas de unidades en la muestra y en la población, respectivamente. se sabe que la varianza de la media es <r2/n. El único cambio en
La suma del lado izquierdo contiene n (n — l)/ 2 términos y la suma este resultado, cuando la población es finita, es la introducción del
de la derecha N ( N - l) / 2 términos. f actor ( N — w)/N. Los factores ( N - n )/ N para la varianza y
Ahora, elevando al cuadrado (2 .9 ) y promediando sobre todas V ( N — 7z) /N para e l error estándar se denominan correcciones de
las muestras aleatorias simples. Usando (2 .1 0 ) y (2 .1 1 ), obtenemos bidas a población finita o corrección por finitud (c p f). Algunos auto
res que presentan los resultados en términos de <r dan estas correc
ciones con un divisor ( N — 1 ) en lugar de N. Siempre y cuando la
n2E (y - Y)2= ^ {(y , - V>2+ • •' + - * )’ fracción n/N sea pequeña, estos factores toman valores cercanos a
la unidad y el tamaño de la población como tal no tiene un efecto
directo en el error estándar de la media de la muestra. Por ejemplo,
+ [ ( y 1- Wyz - ? ) + • • • + (y .v -i - iO (y N - * ) ] }
si S es la misma en dos poblaciones, una muestra de 500 de ima
Completando el cuadrado en el término que incluye el doble produc población de 200 000 da una estimación de la media de la población
casi tan preciso como una muestra de 500 de una población de
to, tenemos
10 000. Las personas que no están familiarizadas con el muestreo,
con frecuencia encuentran este resultado muy difícil de creer y,
n2£ (y - f )2 = ^ { (1 - ^ ) [ ( y , - Y )2 + ' •' + (y^ - ÍO2] desde luego es asombroso. Para ellas es obvio que, si la información
se obtuvo únicamente con una pequeña fracción de la población,
+ ^ [ ( y . - ' m - - - + ( y N - v O ] 2} la media de la muestra no puede ser exacta. Es conveniente que el
lector considere por qué este punto de vista es erróneo.
En la práctica, el cpf se puede ignorar siempre y cuando la frac
El segundo término dentro de la llave desaparece, ya que la suma de
ción de muestreo no exceda un 5 % y para muchos propósitos, aun
y¡ es igual a N Y. La división entre n 2 da si es tan alto como el 10% . El efecto de ignorar la corrección es
sobreestimar el error estándar de la estimación y.
El siguiente teorema, que es una extensión del Teorema 2.2, no
se necesita para la discusión de este capítulo, pero se prueba aquí
Corolario 1. El error estándar de y es para referencia posterior.
_________ 5___ Teorema 2.3. Si yit x, son dos variables definidas en toda unidad
era = —f d ( N —n )/ N = 1—f (2.12) de la población, y y, x son las medias derivadas de una muestra
vn Vn
aleatoria simple tamaño n, entonces su covarianza e s :
Corolario 2. La varianza de Y - Ni/, como un estimador del to
tal de la población Y, es £ (y - Y )(x - X ) = ^ ^ J f o - Y )(r ,- X ) (2.15)
* * !< ,- « (213) Este teorema se reduce al Teorema 2.2 si las variables y¡, x¡ son
n ¡y n iguales en cada unidad.
M U E S T R E O A L E A T O R IO S IM P L E 51
Prueba. Aplicando el Teorema 2.2_ a la variable u¡ = y¡ + x*. Prueba. Podemos escribir:

La media de la población de u¡ es ¿7 = T + A , y por el Teorema 2.2,
tenemos:
(2.17)
o sea, (2.18)
E [(y - f ) + ( x - X ) 3 2 = ^ ^ ¿I[(y ¿ - D + (*, - X ) ] 2 (2.16) S° ble Ias s o p le s al azar

de tamaño n. Por el argumento de simetría usado en el Teorema 2 .2 ,
Desarrollando los términos cuadráticos en ambos lados. Por el Teo
rema 2 .2 ,
por definición de S*. Además, por el Teorema 2 .2 ,
con una relación similar para E (x — X)=. Por lo tanto, estos dos tér E [ n ( y - Y ) 2] = ~ - S 2
minos se cancelan en ambos lados de la Ec. (2.16). El resultado del N
teorema (Ec. 2.15) se deriva de los dobles productos. Por lo tanto,
2.7. E S T IM A C IO N D E L ERROR E S T A N D A R (2.19)

A P A R T IR D E U N A M U E S T R A
f - ° N f son LaS estlmacimes “ seagadas de las rarianzas de y y
Las fórmulas para los errores estándar de la estimación de la
media y total de la población se usan principalmente para tres pro
pósitos: ( 1 ) para comparar la precisión obtenida por el muestreo
( 2 .2 0 ,
aleatorio simple con otros métodos de muestreo, ( 2 ) para estimar el
tamaño de la muestra que se necesita en una encuesta que esté
siendo planeada, ( 3 ) para estimar la precisión realmente obtenida
en una encuesta que se haya terminado. Las fórmulas involucran a
SJ, la varianza de la población. Esta no será conocida en la práctica Para los errores estándar tomamos
pero puede ser estimada de los datos de la muestra. El resultado
s
importante se establece en el Teorema 2.4.
( 2 .2 2 )
Teorema 2.4. En una muestra aleatoria simple,
Estas estimaciones son ligeramente sesgadas.- para la mayoría de
I ( y , - y )2 las aplicaciones, este sesgo no tiene importancia.
2 1________
ü ! le° t0r d6be fÍjarSe en l0S símbolos empleados para represen-
es una estimación insesgada de c in e s For
ones. p “ rlo, atanto,
ñ t TerdadeI-
para y Sescribimos
Y eSÜmadaS resí « a™ estima-
I(y ,- iÓ 2 varianza verdadera: V(y) = o--2

S 2= -——— -—
varianza estimada: v(y) = s/
M U E S TR E O A LEA TO RIO S IM P L E 53
Encontramos
2.8 L IM IT E S D E C O N F IA N Z A
n = Z f l -S 0 , y = Z f y , = 1471, l f y ? = 54497
Generalmente se presupone que las estimaciones y y Y se dis
tribuyen en forma normal alrededor del valor correspondiente de la Por lo tanto, la estimación del número total de firm as es
población. Las razones para esta suposición y sus limitaciones se
consideran en la Sec. 2.15. Si la suposición es verdadera, los límites (676X1471)
de confianza superior e inferior para la media y total de la pobla > = -----50---- 19 888
La varianza s* de la muestra es
ción son como sigue:
Media:
Yt; = y + VTi l y W ' <2-23>

- f ‘ 4 9 7 - < i i y £ ] - 229,0
49t54
= 49L~
Total: Utilizando la expresión ( 2.22) los límites de confianza al 80% son
tNs . tNs------
<Yl = Ny — % = Ny + t V H (2.24) 19 8 8 8 19 o c o ^ O-28)(676)(15.13)Vr-0.0740
vn vn
' /n V50
El símbolo t es el valor del desvío normal correspondiente a la pro
babilidad de confianza deseada. Los valores más comunes son: da T T Ulrad0 15107 y 21 669 Para los límites al 80% Una
numeración completa demostró que había 21 045 firmas.
Probabilidad de confianza ( % ) 50 80 90 95 99 T A B L A 2.2
0.67 1.28 1.64 1.96 2.58

TA B LA 2.2. RESULTADOS PAR A U N A MUESTRA DE 50 HOIAS T>F
Si el tamaño de la muestra es menor que 50, los puntos de por PE TÍC ÍO N y¡ = NUM ERO DE FIRM AS: f, = FRECUENCIA
centaje se pueden tomar de la tabla t de Student con ( t i — 1 ) grados
de libertad, siendo estos, los grados de libertad en la varianza esti y¡ 42 41 36 32 29 27 19
23 16 15
mada s*. La distribución t se ajusta exactamente sólo si las obser f 23 4 1 1 1 2 1 1 2 2
vaciones de y¡ están normalmente distribuidas y N es infinito. Dis
crepancias moderadas de la normalidad no afectan grandemente. y¡ 14 11 10 9 7 6 5 4 3 Total
Para muestras pequeñas con distribuciones muy asimétricas se nece f 1 1 1 1 1 3 2 1 1 50
sitan métodos especiales.
Ejemplo. Se recabaron firm as para una petición en 676 hojas. Cada hoja
tenía espacio suficiente para 42 firm as pero en muchas de las hojas se reca
2.9 U N M ETO D O A L T E R N A T IV O D E P R U E B A
bó un número menor. Se contó el número de firmas por hoja en una muestra
al azar de 50 hojas (muestra del 7% aproximadamente); los resultados se
muestran en la Tabla 2.2.
Cornffcdd (1 94 4) sugirió un método para comprobación de los
Estimar el número total de firmas para la petición y los límites de con resuítados obtenidos de un muestreo aleatorio simple sin restitución
fianza al 80% . que nos permite el uso de resultados estándar de la teoría de po-
La unidad de muestreo es una hoja y las observaciones, y {, son el número blacion ? infinitas. Sea a. una variable aleatoria que toma el valor
de firmas por hoja. Como aproximadamente la mitad de las hojas tenían el
número máximo de firm as (4 2 ), los datos se presentan como una distribu Í t á La.media
esta. n m1 dSUny- ae
UIfladad 6Stá 60
muestra se 13 mueStra
puede y el valOT de 0 * " o lo
escribir
ción de frecuencia. Nótese que la distribución original difiere bastante de la
normal, estando la frecuencia mayor en el extremo superior. N o obstante, hay
1 £
una razón para creer, basados en la experiencia, que las medias de muestras
de 50 observaciones se distribuyen aproximadamente conforme a la normal. y ~ n L a,y> (2-25)
54 TE C N IC A S DE M U ESTRE O M U E S TR E O A LEA TO RIO S IM P L E 55
donde la suma se extiende sobre todas las unidades N en la pobla 2.10 M UESTREO A L E A T O R IO C O N R E ST IT U C IO N
ción. En esta expresión, las a¡ son variables aleatorias y las y ¡ son
un conjunto de números fijos. Un enfoque semejante se aplica cuando el muestreo es con res
titución. En este caso la unidad t-ésima puede aparecer 0, 1, 2, . . . ,
Claramente, n veces en la muestra. Sea t¡ el número de veces que la i-ésima uni
dad aparece en la muestra, entonces;
Pr (a, = 1) = ^;, P r (« ,= 0 ) = l “
- 1 T
y = -rlXjm
'.|y . (2.32)
Por lo tanto, a¡ se distribuye como una variable binomial unita
ria con P - n/N. Por lo que Como la probabilidad de que la i-ésima unidad esté presente en la
muestra es 1/N para cada unidad muestreada, la variable U se dis
v w - «j- A (i- D (2.26) tribuye como un número binomial de éxitos en n experimentos con
P = 1/N. Por lo que:
Para encontrar V ( y ) necesitamos también la covarianza de a¡
y a¡. El producto a¡ a¡ es 1 si las unidades i-ésima y j-ésima están EM ' n V < í)- " ( ¿ ) ( 1- ¿ ) (2 33)
en la muestra y es 0 de otra manera. La probabilidad de que dos
unidades específicas estén ambas en la muestra es n (n - 1 )/ N (N Conjuntamente, las variables t¡ siguen una distribución multino-
mial, por lo tanto:
- 1 ) . Por lo tanto,
Cov (a,a¡) = E(a¡al) - E ( a i)E (a í) Cov (»/>) = — ( 2. 34)
n (n -l) Y « V - _______ 1 ( l- - ) (2.27)

Utilizando las Ecs. (2 .3 2 ), (2 .3 3 ) y (2 .3 4 ), tenemos para el
N ( N - 1) W / N ( N - 1)V N¡
muestreo con restitución,
Usando este enfoque para encontrar V ( y ), tenemos, de la ex
presión (2 .2 5),
V (y )= - ^ f Z y.-2V(Oi) + 2 1 y,y¡ Cov (a,a,)l (2.28)

n l/.| k ¡ J
Km
<2-29) En consecuencia, V(i/) en un muestreo sin restitución, es sola
usando (2 .2 6 ) y (2 .2 7 ). Completando el cuadrado en el término del mente ( N — n )/ (N — 1 ) veces su valor en el muestreo con resti
tución. Si en vez de y la media yd de las unidades diferentes o dis
doble producto, tenemos
tintas de la muestra se usa como estimación cuando el muestreo
sea con restitución, Murthy (1 9 6 7 ) ha mostrado que el término guía
(230) en la varianza promedio de yd es (1 - f / 2 ) S 2/n, con base en el
trabajo de Basu (1 9 6 8 ) y de Des Raj y Khamis (1958). En algunas
—n (N -l) n ( 231) aplicaciones, el costo de la medición de unidades distintas de la
muestra puede predominar, así que el costo de la muestra es pro
Este método ofrece un mecanismo para probar fácilmente los porcional al número de unidades distintas. En esta situación, Seth
Teoremas 2.3 y 2.4. Se puede usar para encontrar momentos de y J. N . K. Rao (1 9 6 4 ) mostraron que para un costo promedio dado,
orden superior en la distribución de y, aunque para este propósito V ( y ) en el muestreo sin restitución es menor que V (& ) en el mues^
un método dado por Tukey (1 9 5 0 ), con un desarrollo adicional por treo con restitución. También probaron que es válido el resultado
Wishaxt (1 9 5 2 ), es más poderoso. más general en el que si y j = f (v )f t / E f(p ), donde v es el número
56 TE C N IC A S DE M U ESTRE O M U E S TR E O A LEA TO RIO S IM P L E 57
de unidades distintas de la muestra y f ( » ) es una función de v, en normalidad y el sesgo se vuelve despreciable. Los siguientes resul
tonces V ( y ) < V ( 5/ ) si S2 < N Y\ condición que satisfacen casi tados aproximados servirán para la mayoría de las aplicaciones; la
todas las poblaciones encontradas en las encuestas por muestreo. distribución de R se estudia con mayor detalle en el Cap. 6 .
Teorema 2.5. Si las variables y¡, x, son medidas en cada unidad

2.11 E S T IM A C IO N D E U N A R A Z O N de una muestra aleatoria simple de tamaño n, supuestamente grande,
el (E C M ) y la varianza de R = y/x son, aproximadamente,
Frecuentemente la cantidad que va a ser estimada a partir de
una muestra aleatoria simple es la razón de dos variables, ambas y i-R x ,)2
variando de unidad a unidad. En una encuesta de familias podría ECMCR) = v ( á ) = í ^ ! ^ — ~ — (2J9)
mos obtener el número promedio de trajes por hombre adulto, el
promedio de gastos en cosméticos por mujer adulta y el promedio
de número de horas por semana que la televisión es vista por en donde ñ = Y/X es la razón de las medias de la población y f -
n /N 1
niños de edades entre 10 y 15 años. Con e l objeto de estimar la
primera de estas características, registraremos para la i-ésima fa Prueba:
milia ( i - 1 , 2 ,. . . , n ) el número de hombres adultos x¡ que viven
en la i-ésima unidad habitacional y el número total de trajes y¡ que R - R =l - R = lZ * *
x (2.40)
poseen estas personas. El parámetro de la población a ser estimado
es la razón.
Si n es grande, x no debe diferir mucho de X Para anular teniendo
N resuelta la distribución de la razón de dos aleatorias variables (y -
Número total de trajes yi
R x) y x aproximación consiste en reemplazar x por X en el de
(2.37) nominador de (2.40). Esto da
Número total de hombres adultos “ ¿T”
I*.
i
p p —
X~ (2-41)
la estimación correspondiente de muestreo es
Ahora, el promedio sobre todas las muestras aleatorias simples de
tamaño n es
* y
R =— =4 (2.38)
v x p ió ni E ( y - R x ) Y —R X „
■
E (R R ) , ---- = ~ X ~ = ° (2-42)
Ejemplos de este tipo ocurren frecuentemente cuando la unidad puesto que R ■= Y/X. Esto demuestra que para el orden de aproxi
de muestreo (la fam ilia) comprende un grupo o conglomerado de mación usado aquí R es un estimador insesgado de R.
elementos (hombres adultos) y nuestro interés está en la media
de la población por elemento. Las razones también aparecen en Utilizando la Ec. (2 .4 1 ) también obtenemos el resultado
otras aplicaciones, por ejemplo, la razón de préstamos para propó
sitos de construcción a los préstamos totales de un banco o la razón E C M (R )- E (R - R )2± j p E ( y - R i ) 2 ( 2.43)
de hectáreas de trigo en relación a las hectáreas totales en una
propiedad.
La cantidad y - R x es la media de la muestra de la variable d¡
La distribución derivada del muestreo de R es más complicada
= y, - R x í , cuya media de la población D = Y — R X = 0 Por lo que
que la de y porque ambos, el numerador y y el denominador x
podemos encontrar V ( R ) aplicando el teorema 2.2 para la varianza
varían de muestra a muestra. En muestras pequeñas la distribución
de la media de una muestra aleatoria simple utilizando la variable
de R es asimétrica y R por lo común es una estimación ligeramente
a-, y dividiendo por X3. Esto da
sesgada de R. En muestras grandes, la distribución de R tiende a la
V ( R ) = j p E ( y - R x ) 2= ~ (1 - / ) (2 .4 4 ) D o r ^ r r Y 6 eSÜma ( a ) ,el Pr0medi0 de gaSt0S sem M ales en alimentos

por familia, (fe ) el gasto semanal en alimentos por persona y ( c ) el porcentaje
estimaciones^116 " “ aUmen,° ' Cakule los errores «t á n d a r de estas

, f Z (d ,-D )2 I (yi- R x , ) 2
y coiT ien tcf"10110* ” alíment0S pOT famüia- Es ,a « e d i a muestral común
nX1 ( N - 1) nX2 N - 1
L o a n te rio r c o m p le ta la p ru eb a . . 907.2
=$27.49
33
V a le la p e n a e n fa t iz a r la m a n e r a c o m o se p r o b ó e l T e o r e m a 2.5.
Por e l Teorema 2.2 (ignorando el c p f), su error estándar es.-
E n e l T e o r e m a 2 .2 s e d e m o s tr ó q u e la fó r m u la p a r a la v a r ia n z a d e
La m e d ia m u e s tr a l y d a la fó r m u la p a ra l a v a r ia n z a a p r o x im a d a d e la
p r o p o r c ió n y/x, si la v a r ia b le yi se r e e m p la z a p o r la v a r ia b le
vn n-1 •/«(« - 1) n
( y ¡ — R x ¡ ) / X . E s te m is m o re s u lta d o , o su e x te n s ió n n a tu r a l, es c ie r to
ta m b ié n e n s itu a cio n es m á s c o m p le ja s y se u sa m á s a d e la n te y c o n
fr e c u e n c ia e n e s te lib ro . = 7( ¿ 32)'/^ 224-(907'2)2/33 = SL76
(L a suma de cuadrados sin corregir: 28 224 se muestra en la parte inferior
C o m o u n a e s tim a c ió n m u e s tr a l d e oe ía lab ia 2 .3 .)
i (yi - R x ¡ ) 2 T A B L A 2.3. T a m a ñ o , I ngreso S e m a n a l y C o s t o d e Al i m e n t o s

¡-i
de 33 F a m il ia s
JV- 1
Ta Costo de Ta
se a co s tu m b ra to m a r Núm. de Costo c
maño Ingreso alimentos Núm. de maño Ingreso aliment
fam ilia
*2 y fam ilia y
I (y ^ -R x,)2
i-l________ 1 2 62 14.3 18 4 83
ti — 1 36.0
2 3 62 20.8 19 2 85 20.6
3 3 87 22.7 20
Se p u e d e d e m o s tr a r q u e e s ta e s tim a c ió n tie n e u n s e s g o d e l o r 4 73 27.7
4 5 65 30.5
d en d e 1/n. 21 2 66 25.9
5 4 58 41.2 22 5 58 23.3
P a r a e l e r r o r e s tá n d a r e s tim a d o d e R , se tie n e : 6 7 92 28.2 23 3 77 39.8
7 2 88 24.2 24 4 69 16.8
8 4 79 30.0 25 7 65 37.8
9 2 83 24.2 26 3 77 34.8
(2-46) 10 5 62 44.4 27 3 69 28.7
S i X n o es c o n o c id a , l a a fir m a c ió n x d e la m u e s tr a se su stitu ye 11 3 63 13.4 28 6 95 63.0
e n e l d e n o m in a d o r. 12 62 19.8 29 2 77 19.5
13 4 60 29.4 30 2 69 21.6
U n a m a n e r a d e c a lc u la r s ( R ) c o n s is te e n e x p r e s a r la c o m o : 14 4 75 27.1 31 6 69 18.2
15 2 90 22.2 32 4 67 20.1
____ iTft ¿ r 2 ( 2 .4 7 )
16 5 75 37.7 33 2 63 20.7
17 3 69 22.6
■JnX V n -1
Total 123 2394 907.2
Ejemplo. La Tabla 2.3 muestra el número de personas ( * , ) , el ingreso
semanal de la fam ilia ( x 2~) y los gastos semanales en comida ( y ) , en una I * , 2 = 533, X * 22= 177 254, £ y 2 = 28 224
muestra aleatoria simple de 33 fam ilias de bajos ingresos. Como la muestra
I - r . y =3595.5, £ r 2y = 66 678
es pequeña, los datos sólo se proponen para ilustrar los cálculos.
Gasto semanal en alimento por persona. Como el tamaño de la fam ilia A primera vista, 9, parece ser una estimación de razón, descrita
varía, la estimación es una razón de dos variables,
en la Sec. 2.11, puesto que, a pesar de que n es fija, n, variará de
X y 907.2 una muestra de tamaño n a otra. Se puede evitar la complicación
R, = - — = — — = $7.38 por persona
Y.X, 123 de usar una estimación de razón al considerar la distribución de y,
Las sumas de cuadrados y de productos necesarios para calcular S ( R ) sobre muestras en donde tanto n como n, son constantes. Sea n¡ > 0.
según la Ec. (2 .4 7 ) se encuentran en la parte inferior de la Tabla (2 .3 ). En la totalidad de muestras con n y n, constantes, la probabi
Necesitamos, además,
lidad de sacar un conjunto específico de n, unidades de las N , uni
2 á ¡ = 14.7512, 6 t2= 54.3996. i , = 3.7273 dades en el dominio j está dada por
Los decimales extra en Á „ 2 R „ R , 2 se incluyen por exactitud. Entonces, uti N '- ’V.C’n— __________1
lizando la Ec. (2.47) N—Nj^n—nt * N¡Cn¡

1 /(28 224) - (14.7512)(3595.5) + (54.3996)(533) Como cada conjunto específico de n, unidades del y-ésimo do
’ T K IW v ñ minio puede aparecer con todas las selecciones de (n - n ,) unidades
= $0.534 obtenidas de las (N — n ¡j que no están en el dominio j, el numerador
Porcentaje del ingreso gastado en alimentos. Esto nuevamente es una ra de la expresión antes indicada es el número de muestras que con
zón de dos variables tienen un conjunto específico de n ¡ y el denominador es el número
total de muestras. Por lo tanto, los Teoremas 2.1, 2.2 y 2.4 se
pueden aplicar usando las observaciones y,*, si ponemos n, en lugar
de n y N , por N.
Utilizando la Ec. 12.47) el lector puede verificar que e l error estándar es
2.38%. Del Teorema 2.1: y¡ es una estimación insesgada de Y¡ (2.49)
2.12 E ST IM A C IO N E S D E M E D IA S EN S U B P O B L A C IO N E S
Del Teorema 2.2: el error estándar y, es - W l -(«,/ N ,) (2 .5 0 )
En muchas encuestas, la población se subdivide en clases dentro v «,
de las cuales se realizan estimaciones diferentes. En una encuesta de en donde

familias, se puede desear hacer estimaciones por separado para
familias con 0 , 1, 2 , . . . niños, para propietarios de casa e inquilinos
o para familias en grupos de ocupación diferente. El término domi s‘ ¿x N, - 1 (2-51)
nios de estudio ha sido dado a estas subpoblaciones por la subcomi
sión de muestreo de las Naciones Unidas (1 9 5 0 ). Del Teorema 2.4: una estimación del error estándar de y¡ es
En la situación más simple, cada unidad en la población cae si
-j=s/l-(n,/N t) (2.52)
dentro de uno de los dominios. Consideremos que el j-ésimo dominio V flj
contiene N ¡ unidades y que n, es el número de unidades, en una
en donde
muestra aleatoria simple de tamaño n, que pertenecen a este domi
nio. Si y¡k(.k » 1, 2......... n ¡ ) son las medidas u observaciones obte
nidas en estas unidades, la media de población Y¡ es estimada en "i CZ.53,
a - i n¡—l
el ;'-ésimo dominio por
Si no se conoce el yaJoi. de N h se puede usar la fracción n/N
en lugar den ,/ N it para calcular el cpf. (Con elmuestreo aleatorio
simple,Uj/N, esunaestimación insesgada den / N .)
62 TE C N IC A S DE M U E S TR E O M U E S TR E O A LEA TO RIO S IM P L E 63
2.13 E S T IM A C IO N E S D E T O T A LE S EN Este resultado demuestra que la estimación Y, como se define

S U B P O B L A C IO N E S en la Ec. (2 .5 4 ) es N veces la media de la muestra de las yV
En muestras repetidas de tamaño n podemos aplicar claramente
En una lista de facturas recuperables de una compañía, en don los Teoremas 2.1, 2.2 y 2.4 a la variable y/. Esto demuestra que Y,
de ciertas facturas han sido pagadas y otras 110, podríamos estimar es una estimación insesgada de f ) con un error estándar.
por muestreo la cantidad total, en dólares, de facturas no pagadas. N S' ,
Si N 1 (e l número de facturas no pagadas en la población) es cono 'l - ( n f N ) (2.57)
cido, no hay problema. La estimación muestral es N ,y; y su error
estándar condicional es N , veces la expresión (2.50). en donde S' es la desviación estándar de las y¡' en la población. A
Alternativamente, si la cantidad total recuperable es conocida, fin de.calcular S', visualizamos a la población como consistente de
se puede usar una estimación de razón. Con la muestra se puede los N ¡ valores y¡ que están en el ;-ésimo dominio y de N - N , valores
obtener una estimación de la razón (cantidad total de facturas no 0. De esta manera,
pagadas)/(cantidad total de las facturas). Esto se multiplica por la
cantidad total conocida de facturas recuperables en la lista. s ' 2= ) ¿ t ( £ y'2- ^ ) (2.58)
N 1 ' j - í . i m o d om . N /
Si no se conocen N , ni el total recuperable, estas estimaciones
no se pueden obtener. En su lugar, multiplicamos el total muestral Aplicando el Teorema 2.4, una estimación del error estándar de Y¡
de las y, de unidades que están en eí j-ésimo dominio, por el factor derivado de una muestra es
de expansión N/n. Esto da la estimación „ Ns' ------------
í ( Y ;) = - W l - ( n / N ) (2.59)
•Jn
Y , = - I y¡k (2.54)
n *=¡ Al calcular s', se le da un valor 0 a cualquier unidad que no está
en el j-éstmo dominio. Algunos estudiantes parecen tener una obje
Demostraremos que Y¡ es insesgada y obtendremos su error es
ción psicológica para hacer esto, pero el método es bueno.
tándar considerando muestras repetidas de tamaño n. El recurso de
Los métodos presentados en esta sección y la sección precedente,
mantener n¡ fijo, al igual que n, no ayuda en este problema.
también se aplican a encuestas en donde el marco usado contiene
En la presentación de la prueba regresamos a la notación ori
unidades que no pertenecen a la población definida. Un ejemplo
ginal, en donde y¡ representa la medida de la i-ésima unidad en la ilustra esta situación.
población. Definiendo una nueva variable y'¡ para cada unidad en
la población, en donde Ejemplo. De una lista de 2 422 gastos fam iliares menores, se sacó una
muestra aleatoria simple de 180 observaciones a fin de estimar el gasto total
y¡ si la unidad está en el j-ésimo dominio de operación de la casa. Ciertos tipos de gastos (ropa y mantenimiento del
autom óvil) no se consideraron pertinentes. De las 180 observaciones mués
y*' ”
0 si la unidad se encuentra fuera del 7-ésimo dominio trales, 152 fueron pertinentes. La suma y la suma de cuadrados sin corregir
de las cantidades pertinentes (e n dólares) fueron como sigue:
El total de la población de la y/ es
I y,' = 343.5, I y / 2= 1491.38
I y . '= I y. = Y, (2.55) E l gasto total de operación fam iliar estimado y el error estándar de la esti
i / - « t i m o dom .
mación son :
En una muestraaleatoria simple de tamaño n, yU = y¿ para cada
(2422X343.5)
una de las n, unidades que caen en el 7-ésimodominio; y/ ■= 0 para
— 14622
cada una de las n - n¡ unidades restantes. Si y es la medida ordi
naria de la muestra de las y-j, la cantidad De la Ec. (2 .5 9 ).
Ns'
s (Y l) = - = J l - ( n / N )
•Jn
64 TE C N IC A S DE M U ESTRE O M U E S TR E O ALEA TO RIO S IM P L E 65
A l calcular s' consideramos nuestra muestra de 180 observaciones con

28 ceros. Por lo tanto, V (Y t) = ^ W + P yQ f / ) ( l ~ ) (2.62)
Si se identifican las unidades no nulas, sacamos de ellas una

muestra de tamaño n,. La estimación del total del dominio es N yyy
con varianza
- ( i y i 49i '38 j T i f ] - 467°
Finalmente,
<z63)
Las varianzas comparables son (2 .6 2 ) y (2 .6 3 ). En la Ec. (2.62)
el número promedio de unidades diferentes de 0 en la muestra de
La estimación no es precisa, su coeficiente de variación, 375/4622, es apro .tamaño n es nP¡. Si tomamos n¡ ~ nP¡ en (2 .6 3 ), de tal manera
ximadamente 8 % .
que el número de unidades diferentes de 0 que va a ser medido
En este ejemplo, los gastos de mantenimiento del automóvil y es más o menos el mismo con ambos métodos, (2 .6 3 ) se vuelve
los gastos de ropa fueron considerados como no pertinentes y, por
lo tanto, con valor 0 en la muestra. En algunas aplicaciones se V m ) ~ P t í ( 1“ ) (2-64)
conoce por adelantado que ciertas unidades en la población no con
tribuyen en nada al total que está siendo estimado. Por ejemplo, La razón de varianzas (2 .6 4 ) a (2 .6 2 ) es
en una inspección de tiendas donde se trata de estimar la venta
total de petacas, algunas tiendas no venden petacas; en estudios V ( N , conocido) 5/ _ C2
de explotaciones agrícolas, ciertas unidades, en muestreo de áreas, V (N , no conocido) S,2 + O/V,2 C,2+ O,
no contienen explotaciones agrícolas en absoluto. Algunas veces es
posible, con un poco de esfuerzo, identificar y contar las unidades
en donde C¡ - S,/Vh es el coeficiente de variación entre las uni
que no contribuyen en nada, así en nuestra notación (N — N ¡ ) , y
dades diferentes de 0. Como podría esperarse, la reducción en la
por tanto, N , es conocido.
varianza debida a un conocimiento de N¡ es mayor cuando la pro
Por consiguiente, vale la pena examinar en cuánto se reduce V porción de unidades, con valor 0 es grande y cuando y¡ varía rela
(Y ¡) cuando N f es conocido. Si N y no es conocido, entonces, la Ec.
tivamente poco entre las unidades con valores diferentes de 0. Para
(2 .5 7 ) queda
un estudio más amplio de este problema, véase Jessen y Houseman
(1944).
2.14 C O M P A R A C IO N E N T R E L A S M E D IA S
Si Y, y S, son la media y la desviación estándar en el dominio
DE LO S D O M IN IO S
de interés (es decir, obtenidas con las unidades que no son cero)
el lector puede verificar que
Supongamos que yy, y* son los promedios de la muestra en el
/'-ésimo y fe-ésimo dominios de un grupo de ellos, en los que se han
( N - 1)S' 2 = (Nj - l)S /+N yy / ( l - j ¡ ) (2.60) clasificado las unidades de una muestra aleatoria simple. La va
rianza de sus diferencias es
Como los términos 1/Ny y 1/N son casi siempre despreciables,
V (S t- 7k ) - m ) + V<9 k) (2.66)
S '2 == PiSf+P/Q/Y* (2.61)
Esta fórmula se aplica también a la diferencia entre dos razones
en donde P, - N ,/ N y Q, - 1 - P,. Esto da R, y Rk.
M U E S TR E O ALEA TO RIO S IM P L E 67
JOebe observarse que rara vez es de interés científico preguntar N v). Para esta población, sea S„T el conjunto de unidades en la
si Y, ■= Yk porque estas medias no serán exactamente iguales en una población para la cual
población finita, excepto por casualidad, aun cuando los datos en
ambos dominios fueran sacados al azar de la misma población in |y«- - K l > T-Jnv( l - f y)S„
finita. En lugar de esto, probamos la hipótesis nula de que los dos
dominios se sacaron de poblaciones infinitas con la misma media. en donde Yv, S,, f„, son la media de la población, desviación están
Por consiguiente, omitimos el cpf cuando calculamos V ( y , ) y V dar y cpf, y r es un número > 0. Entonces, la condición tipo Lin-
( 5* ), usando la fórmula deberg
S? Sk2
y(y¡-yk)=~+—
n¡ nk
(2.67) S ( v . - ñ )2
Se obtiene una ecuación semejante a (2 .6 7 ) para pruebas de sig

nificación, si se formula la pregunta: ¿Podrían las muestras de los
es necesaria y suficiente para asegurar que yv tienda a la norma
dos dominios haber sido tomadas al azar de la misma población
finita? lidad con la media y la varianza dadas en los Teoremas 2.1 y 2.2.
Este conocimiento deja algo que desear. N o es fácil contestar
Con esta hipótesis nula puede probarse (E j. 2.16) que la pregunta directa: “ ¿Qué tan grande debe ser n en esta población
para que la aproximación normal sea suficientemente exacta?".
Las distribuciones que no son normales varían mucho, tanto en la
naturaleza como en el grado de su discrepancia de la normalidad.
donde S% es la varianza de la población finita que consiste de los Las distribuciones de muchos tipos de empresas (tiendas, plantas
dominios combinados. avícolas, ciudades) exhiben una marcada asimetría positiva con
pocas unidades grandes y muchas unidades pequeñas. La misma
clase de asimetría se observa en ciertas poblaciones biológicas (por
2.15 V A L ID E Z D E L A A P R O X IM A C IO N N O R M A L ejemplo, el número de ratas o moscas por cuadra en una ciudad).
Como una ilustración de una distribución positivamente asimé
La confianza de que la aproximación normal es adecuada en la trica, en la Fig. 2.1 se muestra la distribución de frecuencia del
mayoría de situaciones prácticas proviene de diferentes fuentes. Se número de habitantes en 196 ciudades grandes de los Estados Uni
han hecho muchos estudios en la teoría de probabilidades sobre la dos en 1920. (Las cuatro ciudades más grandes, Nueva York, Chica
distribución de las medias de muestras aleatorias. Se ha probado que go, Filadelfia y Detroit; fueron omitidas. Su inclusión hubiera ex
para cualquier población que tiene una desviación estándar finita, tendido la escala horizontal a más de cinco veces el tamaño que
la distribución de la media muestral tiende a la normalidad conforme se nota en la Fig. 2.1 y hubiera, desde luego, acentuado enorme
n aumenta (véase, por ejemplo, Feller, 1957). Este trabajo se re mente la asimetría.) En la Fig. 2.2 se muestra la distribución de
fiere a poblaciones infinitas. frecuencia del número total de residentes en cada una de las 200
Para el muestreo sin restitución de poblaciones finitas, Hájek muestras aleatorias simples con n = 49 sacadas de esta población.
(1 96 0) ha dado las condiciones necesarias y suficientes en las que La distribución de los totales de la muestra, e igualmente de las
la distribución de la media muestral tiende a la normalidad, con medias, es más similar a una curva normal, pero aún muestra algo
base en los trabajos de Erdós y Rényi (1 9 5 9 ) y Madow (1948). de asimetría positiva.
Hájek supone una secuencia de valores n,, N , que tienden a infinito
Del estudio de las distribuciones teóricas asimétricas y de los
de tal manera que (N „ — n „) también tiende a infinito. Las medi resultados de los experimentos de muestreo en poblaciones asimé
das de la u-ésima población se identifican por y,¡, (t = 1 , 2 ,
tricas reales, se pueden hacer algunas aseveraciones respecto a lo
68 TE C NIC AS DE M U ESTRE O
que sucede usualmente a los límites y probabilidades de confianza

cuando se muestrean dos poblaciones positivamente asimétricas co
mo sigue:
1. La frecuencia con la cual la aseveración
y — 1.96sji< Y < y + 1.96s¡,
está equivocada, es generalmente más alta que el 5% .

2. La frecuencia con la cual
Y > y + 1.96jf
es mayor que 2.5% .

3. L a frecuencia con la cual
f< y - 1 .9 6 jf
es m enor que 2.5%.
Como una ilustración, consideremos una variable y que la pode

mos suponer distribuida binomialmente, de tal forma que la distri
bución exacta de y se puede obtener de las tablas binomiales. La
variable y toma sólo dos valores — el valor h con probabilidad P y el
valor 0 con probabilidad Q— . La media de la población es Y = Ph.
Una muestra aleatoria simple de tamaño n contiene a unidades con
valor h y n — a unidades que tienen el valor 0. En la muestra,
F i g . 2.1. D is trib u c ió n d e fr e c u e n c ia s de ta m a ñ o s de 1 96 c iu d a d es de lo s v l
Z y = ah, -y = ah
Estados Unidos en 1920 n
0n -\ )s 2= l y 2- n f = ah2- —
n
a (n -a )
Sy n n2 n - \
Por lo tanto, los límites normales de confianza al 95% para Y son
y±1 .9 6 í, = - L ± 1 . 9 6 \ / ^ ^ l { 2 .68)
nL /t— 1 J
Sea n = 400, P - 0.1. Entonces Y ~ 0.1 Ji. Al probar encontra

mos que si a = 29 en la Ec. (2 .6 8 ) el límite de confianza superior
M illo n e s es 39.18^/400 - 0.098h, mientras que a = 30 da 40.34Ji/400 =
0.10 Ih. De aquí que cualquier valor de a < 29 da un límite de con
Fig. 2.2 Distribución de frecuencias de los totales de 200 muestras aleatorias fianza superior muy bajo. En forma similar, encontramos que si
simples con n = 49 a > 54 el límite inferior es muy alto.
Puesto que G1 - 1.9, tomamos como una n mínima

La variable a sigue una distribución binomial con n =*■ 400, P =
B - (25X1.9)*-90
0.1. Las tablas (Harvard Computation Laboratory, 1955) mues
tran que Para muestras de tamaño 100, West encontró en esta característica (acres
en cultivos) que ni la distribución de y n i la de t de Student dtfieren significa
Pr (lím ite superior establecido m uy b a jo) = Pr (a < 2 9) — 0.0357 tivamente de las correspondientes distribuciones normales teoncas.
Pr (lím ite inferior establecido m uy alto) = P r (a > 5 4) — 0.0217
T A B L A 2.4. D is t r ib u c ió n de F r e c u e n c ia s de Acres C u l t iv a d o s en
Px (postulado de confianza equivocado) = 0.0574
La probabilidad total de estar equivocado no está muy lejos de Intervalos Escala

de clase codificada Frecuencia fi'Ji fa ? fy ?
0.05. En más del 60% de los postulados equivocados, la verdadera
media es mayor que el límite superior establecido. (acres) y¡ u
No hay una regla general segura para establecer qué tan grande 47 -42.3 38.1 -34.3
0-29 -0 .9
debe ser n para poder usar la aproximación normal en el cálculo del 143 0 0 0
30-63 0
154 154 154
límite de confianza. Para poblaciones en las cuales la desviación 64-97 1 154
164 328 656
principal de normalidad consiste de una asimetría marcadamente po 98-131 2 82
62 186 558 1 674
sitiva, una regla burda que ha sido útil en ocasiones es 132-165 3
132 528 2 112
166-199 4 33
n >25G r (2.69) 13 65 325 1 625
200-233 5
6 36 216 1 296
234-267 6
donde es la medida de asimetría de Fisher (Fisher, 1932). 4 28 196 1 372
268-301 7
6 48 384 3 072
302-335 8
1 458
g .= £- ^
cr
-=-¿3 i (y- - Y )3
¡\cr ¡ - i
(2.70) 336-369 9 2 18 162
0 0 0 0
370-403 10
2 22 242 2 662
Esta regla está diseñada para que los enunciados probabilistas 404-437 11
0
12 0 0 0
al 95% de confianza no estén equivocados más del 6 % de las veces. 438-471
4 394
2 26 338
Lo anterior se obtiene matemáticamente, suponiendo que cualquier 472-505 13
perturbación debida a los momentos mayores al tercero de la distri 556 836.7 3 469.1 20 440.7
Totales
bución de y es despreciable. La regla sólo intenta controlar la fre
cuencia total de postulados equivocados, ignorando la dirección del
£ (y .)= Y = ^ = 150486
error de estimación.
Al calcular G t, o una estimación, para una población específica,
podemos obtener una idea aproximada del tamaño de muestra nece £(y'J) = ^ ‘ 6'23939
sario para la aplicación de la aproximación normal en el cálculo de
límites de confianza. El resultado se debe verificar experimentalmen £ ( y , 1) = 2 0 5^ 6° - = 36.76385
te siempre que sea posible.

o -3 = E ( y * ) - Y 1 = 3.97479
Ejemplo. L a inform ación en la Tabla 2.4 muestra el número de acres de
Ky= £(y, - Y)3= E(y,3) - 3£(y,3) ? + 2 Y3
dicados a cultivos en 556 propiedades en el Condado de Seneca, Nueva York.
La información proviene de una serie de estudios realizados por W est (1 951), = 15.411
quien obtuvo muestras repetidas de tamaño 100 de esta población y examinó
las distribuciones de frecuencias de y, s, y las t de Student, para varias ca Gi = í l « l l í i l = 1 .9
<rJ 7.925
racterísticas de interés en encuestas de administración de ranchos.
El cálculo de G, se muestra al pie de la Tabla. I d s cálculos se hacen uti
lizando la escala codificada, y, puesto que G, es un número puro, no hay lint, hnona oráctica de muestreo tiende a hacer la aproximación
necesidad de regresar a la escala original. Nótese que el intervalo de la pri
mera clase era ligeramente diferente de los otros.
72 TE C N IC A S DE M U ESTRE O M U E S TR E O A LE A TO R IO S IM P L E 73
cipaimente cuando la población contiene algunos individuos extre Hartley y J. N. K. Rao (1968-1969) han desarrollado otras pro
mos que dominan el promedio de muestra cuando están presentes. piedades de y, al igual que Royall (1 9 6 8 ) y C. R. Rao (1971). En
Sin embargo, estos extremos también tienen un efecto más serio al cualquier población finita habrá cuando mucho T < N valores dis
aumentar la varianza de la muestra y disminuir la precisión. Por lo tintos de los t/¡. En la muestra, sean n¡ valores iguales a y, donde
tanto, se aconseja segregarlos y hacer planes separados para su
Y.n, = n. Hartley y Rao (1 9 6 8 ) demuestran que y tiene varianza m í
control, tal vez enumerándolos completamente si no son muy nume
rosos. Esta eliminación de los individuos extremos de la población nima entre los estimadores insesgados de Y que sólo son funciones
reduce la asimetría y mejora la aproximación normal. Esta técnica de n t y t/i. Para muestreo aleatorio con restitución, prueban que la
es un ejemplo del muestreo estratificado que se discutirá en el Cap. 5. media de los valores distintos en la muestra es el estimador de máxi
ma verosimilitud de Y, aunque no tiene la varianza mínima en to
2.16 EST IM AD O R E S L IN E A L E S DE L A M E D IA das las poblaciones.
D E P O B L A C IO N C. R. Rao (1 9 7 1 ), siguiendo los trabajos de Kempthome (1 9 6 9 ),
En muestreo aleatorio simple nos preguntamos si la media mues consideró los estimadores insesgados 7 = £ Wt,y¡ discutidos por Godam
tral y es el mejor estimador de 7. Esto naturalmente ha dado lu be. Para representar el caso donde las etiquetas l no dan informa
gar a un buen número de trabajos. La respuesta depende del con ción respecto a los valores y¡, C. R. Rao calculó el promedio de V {Y )
junto de competidores permitidos para y, y de la definición de “el sobre todas las N ! permutaciones de las etiquetas asignadas a los
mejor”. Para el muestreo, las unidades de la población suelen nu valores y demostró que sobre estas permutaciones, y tiene varianza
merarse en alguna forma de 1 a N. Estos números suelen llamarse promedio mínima. Royall (1970b) dio un resultado más general.
las etiquetas que se ponen a las unidades.
El trabajo de Godambe (1 9 5 5 ) estimuló numerosas investiga
Los primeros resultados probados por Horvitz y Thompson (1952)
ciones en el diseño de muestras y la estimación incluyendo temas
para estimadores lineales en muestreo aleatorio simple son los si
como los criterios para juzgar los estimadores, el papel de la máxima
guientes. Si cualquier t/¡ recibe siempre el mismo peso u i siempre que
verosimilitud, el uso de la información auxiliar que las etiquetas
se extraiga la unidad rotulada con i, la media muestral y es el único
pueden contener respecto a les y¡, los estimadores bayesianos, y los
__ n
estimador insesgado de Y de forma £ w¡y¡. Dado que cada unidad métodos de estimación cuando se pueden hacer suposiciones sobre la
distribución de frecuencia de los y¡. La influencia dé este trabajo en
aparece en una fracción n/N de muestras aleatorias simples, la práctica del muestreo ha sido hasta ahora limitada, pero debe
aumentar constantemente. En ocasiones nos referiremos a dicho tra
E ( t wtfi) = W 'y ¡)jW m y sólo si cada - 1/n. Si, por otro lado, bajo. Para una revisión de estos trabajos, véase J. N. K. Rao* (1975a)
y Smith (1 9 7 6 )....
el peso dependiera sólo del orden con que se extrae la unidad para
la muestra, entonces y tiene varianza mínima entre los estimadores
n E J E R C I C I O S
lineales insesgados de la forma £ wdy(d), donde y(i, es el valor y en la
d
2.1. En una población con N — 6 los valores de y¡ son 8 , 3, 1, 11, 4 y 7.
unidad que se saca en la extracción d-ésima.
Calcular la media de muestra y para todas las posibles muestras aleatorias
n
simples de tamaño 2. Verificar que y es una estimación insesgada de Y y que
Una clase más amplia de competidores es el conjunto Y. w¡,y¡, don
su varianza es la expresada en el Teorem a 2.2.
de wu puede depender de las otras unidades que caen en la muestra, 2.2. Para la misma población, calcular s2 para todas las muestras aleato
así como de i. Godambe (1 9 5 5 ) demostró que en esta clase no exis rias simples de tamaño 3 y verificar que E (s ! ) = S’ .
te estimación insesgada de Y con varianza mínima para todas las • E n lo su ces ivo a l m e n c io n a r e l a p e llid o R a o , n os re fe r ir e m o s e x c lu s iv a m e n te a
poblaciones. J. N . K. R a o a m e n o s q u e e s p e c ifiq u e l o co n tra rio .
74 TE C N IC A S DE M U E S TR E O M U ESTRE O A LE A TO R IO S IM P L E 75
2.3. Si las muestras aleatorias de tamaño 2 se sacan con restitución de la 2.8. E n el ejemplo anterior pruebe al nivel del 5% si la razón de estudian
población, demuestre, buscando todas las muestras posibles, que V ( y ) satisface te/maestro es significativamente diferente en ambos tipos de instalaciones.
la ecuación
2.9. Para las instalaciones públicas, estimar el número total de maestros:
( a ) a sabiendas que el número total de instalaciones públicas en la población
V {y) -
n n N es 251, ( b ) sin conocer esta cifra. En cada caso calcule el error estándar de
su estimación.
2.4. Una muestra aleatoria simple cíe 30 fam ilias se obtuvo de una área de
2.10. La Tabla siguiente muestra el número de residentes en cada una
la ciudad que condene 14 848 familias. E l número de personas por fam ilia en la
de las 197 ciudades de Estados Unidos que tenían más de 50 000 habitantes en
muestra obtenida fue como sigue:
1940. Calcular el error estándar del número total de habitantes estimado en
5 ,6,3, 3,2,3, 3 ,3 ,4 .4 ,3 ,2 .7 ,4 , 3,5 ,4 ,4 ,3 ,3 ,4 ,3 , 3 ,1 ,2 ,4 ,3 ,4 ,2 ,4 las 197 ciudades utilizando los siguientes métodos de muestreo: ( a ) una mues
tra aleatoria simple de tamaño 50, ( b ) una muestra que incluya las 5 ciuda
Estime el número total de gente en el área y calcule la probabilidad de que
des más grandes y una muestra aleatoria simple de tamaño 45 para las 192
esta estimación esté dentro del ± 10% del valor verdadero.
ciudades restantes, ( c ) una muestra que incluya las 9 ciudades más grandes
2.5. En un estudio sobre el posible uso del muestreo para reducir e l trabajo y una muestra aleatoria simple de tamaño 41 para las ciudades restantes.
de inventario de existencias en una bodega, se hizo un conteo del valor de
2.11. Calcular el coeficiente de asimetría G, para la población original y
los artículos de cada uno de los 36 estantes en la bodega. Los valores aproxi
mados fueron: para la población restante después de elim inar: ( a ) las 5 ciudades más gran
des, ( b ) las 9 ciudades más grandes.
29,38,42,44,45,47,51,53,53,54,56,56,56,58,58,59,60,60,
D is t r ib u c ió n d e F r e c u e n c ia d e lo s T am años de las C iu d a d e s
60,60,61,61,61,62,64,65,65,67,67,68,69,71,74,77,82,85.
La estimación del valor total a partir de una muestra debe ser correcta
Clase del Clase del Clase del
módulo un error máximo de $200.00, excepto para una posibilidad en veinte.
tamaño tamaño tamaño
Un consultor sugiere que una muestra aleatoria simple de 12 estantes es sufi
(m ile s ) / (m iles) f (m iles) /
ciente para hacer la estimación. ¿Está usted de acuerdo?
Y. y = 2138, Z y : = 131682 50-100 105 550-600 2

100-150 36 600-650 1 1500-1550 1
2.6. Después de tomar la muestra en la Tabla 2.2 (Pág. 5 3 ), se contó el 150-200 13 650-700 2 .... ....
número de hojas llenas (co n 42 firm as cada u n a) y se encontró que eran 326, 200-250 6 700-750 0 1600-1650 1
Use esta inform ación para obtener una m ejor estimación del número total de 250-300 7 750-800 1 __
firm as y encuentre el error estándar de su estimación. 300-350 8 800-850 1 1900-1950 1
2.7- De una lista de 468 academias con cursos de 2 años se sacó una mues 350-400 4 850-900 2 .... ....
tra aleatoria simple de 100. La muestra contenía 54 instalaciones públicas y 400-450 1 900-950 0 3350-3400 1
46 privadas. Los datos para el número de estudiantes ( y ) y el número de pro 450-500 3 950-1000 0 ....
fesores ( x ) se muestran a continuación. 500-550 0 1000-1050 0 7450-7500 1
n I(y ) IC O
Las lagunas en los intervalos se indican con . . .
Pública 54 31 281 2 024
Privada 46 13 707 1 075
2.12. Se va a realizar una pequeña encuesta para comparar los propieta
W ) I< y *> IC O
rios de casas con los arrendatarios. En la población, cerca del 75% son propie
tarios y 25% son arrendatarios. Para una característica, se piensa que la
Pública 29 881 219 1 729 349 1U 090
Privada 6 366 785 431 041 33 119 varianza es aproximadamente de 15, tanto para propietarios como para arren
datarios. El error estándar de la diferencia entre las dos medias de los domi
( a ) Para cada tipo de instalación en la población, estimar la razón (núm e nios no debe exceder a 1. ¿Qué tan grande debe ser la muestra ( a ) si los
ro de estudiantes/número de profesores), ( b ) Calcular los errores estándar de propietarios y los arrendatarios se pueden identificar antes de obtener la
las estimaciones, ( c ) Para las instalaciones públicas, encontrar los limites muestra, ? ( b ) si no es así, (U n a respuesta aproximada será suficiente en ( b ) ;
de confianza al 90% para la razón de estudiante/maestro en la población total. una solución exacta requiere de tablas binomiales.)
76 TE C NIC AS DE M U E S TR E O M U E S TR E O A LE A TO R IO S IM P L E 77
2.13. Una muestra aleatoria simple de tamaño 3 se obtiene de una pobla estudio entre los empleados elegibles y Qy es la proporción de empleados no
ción de tamaño N con restitución. Demuestre que las probabilidades de que la elegibles de la compañía. Ignore la cpf.
muestra contenga unidades diferentes de 1, 2 y 3 (p o r ejemplo, aaa, aab, abe, 2.16. Se toma una muestra aleatoria simple de tamaño n = n, + n 2 con
respectivamente) son media y en una población fin ita y también una submuestxa aleatoria simple
de tamaño n, de la misma población y con m edia yl . Demostrar que ( a )
P = i_ P p J N -i)(N -2 ) V (S i — F j) — Sa[ ( 1 /nx) + ( l/n2)] donde y . es la media de las restantes n z
' N 7’ 2 N2 ' 3 N2 unidades de la muestra, ( b ) V (y , - g ) = S2[( l / n 1) — (1 / n )], ( c ) Cov {y ,
S¡ — U) = El muestreo repetido implica extracciones repetidas tanto de
Como una estimación de Y se toma y’, la media no ponderada sobre las
la muestra como de la submuestra.
diferentes unidades en la muestra. Demostrar que la varianza promedio de y’ es
2.17. El número de muestras aleatorias simples distintas de tamaño n
es desde luego N !/ n !(N — n )!. Es de interés encontrar conjuntos más pe
queños de muestras de tamaño t i que tengan las mismas propiedades que
el conjunto de muestras aleatorias simples. Un conjunto tal es el de los
Una manera de hacer esto es demostrar que diseños por bloques incompletos equilibrados ( b i b ) . Estas son muestras de
n distintas unidades tomadas entre N , tales que ( i ) cada unidad aparece en
el mismo número ( r ) de muestras, ( i i ) cada par de unidades aparece simul
táneamente en X muestras.
Por lo tanto, demostrar que V (y ’ ) < V ( y ), donde y es la media aritmética Verifiqúese que X = r (n — 1) / ( N — 1) y que el número de muestras dis
de las n observaciones en la muestra. E l resultado V (y‘) < V (y ) para cual tintas en el conjunto es rN/n. Sobre el conjunto de las muestras bib, demués
quier n > 2 fue probado por Raj y Khamis (1 958). trese en la notación usual que si y es la m edia de una muestra ( o ) V (i/ ) =
2.14. Dos dentistas A y B, hicieron una encuesta para investigar el estado (1 — f ) S 2/n y ( b ) v (y ) - (1 — f ) ¿ ( y , — y )»/ n (n — 1 ) es una estima
de los dientes de 200 niños en una colonia. E l Dr. A seleccionó una muestra ción insesgada de V ( y ) .
aleatoria simple de 20 niños y contó el número de dientes cariados de cada
niño, con los siguientes resultados: Notó. N o existe un método genera] para encontrar el más pequeño r para
el cual pueda construirse un bib. En ocasiones, el más pequeño r-conocido
Número de dientes 0 1 2 3 4 5 6 7 8 9 10 proporciona N !/ n !(N — n ) i muestras, lo que nos lleva a las muestras alea
cariados, por niño torias simples. Pero para N = 91, n = 10 el más pequeño conjunto bib tiene
Número de niños 8 4 2 2 1 1 0 0 0 1 1 91 muestras contra más de 6 trillones (E .U .) de muestras aleatorias simples.
Avadhani y Sukhatme (1 9 7 3 ) han mostrado cómo se pueden usar los diseños
E l Dr. B, usando las mismas técnicas dentales examinó a los 200 niños bib para tratar de reducir los gastos de viaje entre unidades de muestreo.
y sólo registró aquellos que no tenían los dientes cariados. Encontró que 2.18. La siguiente es una Ilustración debida a RoyaU (1 9 6 8 ), el hecho
60 niños no tenían dientes dañados. de que en el muestreo aleatorio simple la media de muestra y no presenta
Estimar el número total de dientes cariados en los niños de la colonia, varianza uniformemente mínima en la clase de los estimadores de la form a
( a ) usando sólo los resultados de A, ( b ) usando los resultados de A y B, ( c )
X H\*yi considerada por Godambe (1 9 5 5 ) donde el peso w puede depender
¿Son insesgadas las estimaciones? ( d ) ¿Qué estimación espera que sea más
de las otras unidades que caigan en la muestra. Para N = 3, n =» 2 consi
precisa?
derar el estimador
2.15. Una compañía intenta entrevistar una muestra aleatoria simple de
empleados asociados con ella por más de cinco años. La compañía tiene
? i 2= { y i + i y 2; fi3 - J y ,+ iy s ; Y 23 = iy2+ jy 3
$1 000 para este estudio y cada entrevista cuesta $10. N o hay una lista A
separada de empleados con más de 5 años de servicio, pero se puede com donde Y ¡¡ es el estimador para la muestra que tiene las unidades (i, ; ) . De
pilar una lista de los expedientes a un costo de $200. La compañía puede:
mostrar que en los resultados de Royall Yi f es insesgado y < V (y )
( a ) compilar la lista y entrevistar a las personas’ incluidas en una muestra
s‘ — 3y, — y3) > 0. La ilustración se toma de un ejemplo anterior
aleatoria simple sacada de los empleados elegidos o ( b ) sacar una mues
de Roy y Chakravarti (1960).
tra aleatoria simple de todos los empleados, y entrevistar sólo a los elegibles.
El costo de rechazar aquellos empleados incluidos en la muestra que no son 2.19. Este ejercicio es otro ejemplo de estimadores construidos con base
elegibles es despreciable. en ciertos rasgos particulares de las poblaciones. Después de decidir la toma
Demostrar que para estimar un total sobre la población de empleados de una muestra aleatoria simple se dieron cuenta de que y, sería inacostum-
elegibles, el plan ( a ) da una varianza más pequeña que el plan ( b ) sólo si bradamente bajo y y v inacostumbradamente alto. Para esta situación, Samdal
(197 2 ) examinó el siguiente estimador insesgado de Y.
C < 2J o , , donde C es el coeficiente de variación de la característica bajo
78 T E C N IC A S DE M U ESTBE O
Ys = y + c si la muestra contiene y ( pero no y v

= y —c si la muestra contiene y„ pero n o y ,
= y para todas las otras muestras.
C A P IT U L O 3
donde c es una constante. Demuestre el resultado de Sám dal en el que Ys
es insesgado con
de manera que V/( Y s) < V /(y ) si 0 < c < ( y v —y «)/ Muestreo para Proporciones
2.20. Para una población con N = 8 y valores y, = 1, 4, 5, 5, 6 ,6, 8, 13,
demostrar que con n = 4, V ( 5 ) - 1.5, en tanto que V ( f s) - 0.214cuando y Porcentajes
c = 1.5 (su m ejor v a lo r), y 0.357 cuando c = 1 o 2.
Con base en la información del E jercicio 2.19, otro plan de muestreo con
siste en incluir tanto y , como y, en cada muestra, y extraer una muestra
aleatoria simple de tamaño 2 de y 2 y , con m edia y,. La estimación de
Y es
3.1 C A R A C T E R IS T IC A S C U A L IT A T IV A S
Y „ = ( y , + 6y 2+ y8)/8 En algunas ocasiones deseamos estimar el número total, la pro

porción, o el porcentaje de unidades en la población, que poseen
Demostrar que Y „ es insesgado, con varianza 9 V (y ; )/16. Para esta pobla alguna característica o atributo, o que caen dentro de alguna clase
ción demostrar que V ( E „ ) = 0.350. Este estimador es un ejemplo de mues definida. Muchos de los resultados, que regularmente se publican,
treo estratificado (Cap. 5 ) con tres estratos: y, ; y2 . . . y, y y,. derivados de censos y encuestas, son de esta forma, por ejemplo,
el número de personas sin empleo, el porcentaje de la población
originaria de un lugar. La clasificación puede ser introducida en
forma directa en el cuestionario, en form a de preguntas que se
contestan con un “sí" o un “no". En otros casos las medidas origina
les son más o menos continuas y la clasificación se introduce al
tabular los resultados. Por consiguiente, podemos registrar la edad
de los entrevistados con aproximación al año y publicar el porcen
taje de la población que tiene 60 o más años cumplidos.
Notación. Suponemos que todas y cada una de las unidades en
la población caen dentro de una, de dos posibles clases C y C'. La
notación es como sigue:
Número de unidades en C en Proporción de unidades en C en

Población Muestra Población Muestra
A a P =* A / N p = a/n
La estimación muestral de P es p, y la estimación muestral de A es

N p o Na/n. En el trabajo estadístico, la distribución binomial se
aplica con frecuencia a estimaciones como a y p. Como se verá, la
80 TE C N IC A S DE M U E S TR E O M U E S TR E O P A R A PRO PO RCIO NES V PO R C EN TAJES 81
distribución correcta en poblaciones finitas es la hipergeométrica, Al aplicar los Teoremas 2.1, 2.2 y 2.4 a esta población se obtienen
aun cuando la binomiales una aproximación generalmente satis los siguientes resultados para un muestreo aleatorio simple de las
factoria. unidades clasificadas.
Teorema 3.1. La proporción en la muestra p ■= a/n es una es
timación insesgada de la proporción en la población P = A/N.
3.2 V A R IA N Z A S D E L A S E S T IM A C IO N E S M U E S T R A LE S
Teorema 3.2. La varianza de p es
Por medio de un artificio simple se pueden aplicar los teoremas
presentados en el Cap. 2 a esta situación. Para cualquier unidad en
la muestra o población, se define y¡ como 1 si la unidad está en C,
Al usar (3 .4 ).
y como 0 si la unidad está en C'. Para esta población de valores t/¡,
está claro que Corolario 1. Si p y P son los porcentajes de la muestra y de la
población respectivamente, que caen en la clase C, (3 .6 ) continúa
Y = T .y ¡= A (3.1) siendo la varianza de p.
1
Corolario 2. La varianza de Á - Np, la estimación del número
s total de unidades en la clase C, es
l y> .
=P (3.2)
N N
En la misma forma, para la muestra.
Teorema 3.3. Una estimación insesgada de la varianza de p, de
n
rivada de una muestra, es
Xy,
= fl_ (3.3) N -n
n n ®<P>“ * 2- :70“. - UÍUn3”*í <3-8)
De modo que, el problema de estimar A y P es similar a la esti
Prueba. En el corolario del Teorema 2.4 se demostró que para
mación del total y la media de una población en la cual, todos los una variable continua y¿ una estimación insesgada de la varianza
valores y{ son 1 o 0. Para usar los teoremas del Cap. 2, debemos pri de la media muestral y es
mero expresar Ss y s5 en términos de P y p. Nótese que
J2 ( N - n )
X y,2 = A = NP, X y,2= a = np ■w = ; n r <3-9>

i i Para proporciones, P toma el lugar de y, y en (3 .5 ) se demostró
Por lo tanto, que
X (y. - Y ) 2 Íy ? -N Y 2 (3.10)
s 2= ------------ = --------------- Por lo tanto:
N- 1 N —1
1 ( N P - N P 2)= -r ^ -r P Q (3.4) v (p )- s' 2 = ^ é ñ t3-1»

N- 1 N - 1
De lo anterior se tiene que si N es muy grande en relación a n, de
donde Q - 1 - P. En forma similar,
tal manera que el factor de corrección por finitud es muy pequeño,
una estimación insesgada de la varianza de p es:
f*7
n —1
M U ESTRE O P A R A PRO PO RCIO NES Y PO R C E N TA JE S 83
E ste re s u lta d o p u e d e p a r e c e r s in g u la r a a lg u n o s le c to re s , p u esto q u e

3.3 E L E r E L .it ) DE P EN L O S E R R O R E S E S T A N D A R
pq/n c a s i s ie m p r e se u s a e n la p r á c tic a c o m o u n a esti
la e x p r e s ió n
m a c ió n d e la v a r ia n z a . E l h e c h o e s q u e pq/n es, au n e n p o b la c io n e s La Ec. (3 .6 ) muestra cómo la varianza del porcentaje estimado
in fin ita s , sesga d a . cambia con P, para valores de n y N fijos. Si se ignora la (c p f),
C o ro la rio . U n a e s tim a c ió n in s e s g a d a d e la v a r ia n z a d e Á = N p ,
tenemos
e l n ú m e ro to ta l e s tim a d o d e u n id a d e s e n la cla se C en la p o b la c ió n , es
v w -S
n
,í, 2 N (N -n )
v (A ) = sNp = — pq (3.12)
n —i La función PQ y su raíz cuadrada se muestran en la Tabla 3.1. Es
Ejemplo. De una lista de 3 042 nombres y direcciones, una muestra alea
tas funciones se pueden considerar como la varianza y la desviación
toria simple de 200 nombres mostró, al revisarla, 38 direcciones equivocadas. estándar, respectivamente, para una muestra de tamaño 1.
Estime el número total de direcciones que se necesita corregir en la lista y
encuentre el error estándar de esta estimación. Tenemos TA B L A 3.1. V a lo r e s d e PQ y VPQ
A/= 3042, n — 200, a = 38, p = 0.19
P — Porcentaje de la población en la clase C
El número total estimado de direcciones equivocadas es
p 0 10 20 30 40 50 60 70 80 90 100
A =A/p = (3042)(0.19) = 578
PQ 0 900 1600 2100 2400 2500 2400 2100 1600 900 0
SÁ = v'[(3042)(2842)(0.19)(0.81)/199] = v'6686 = 81.8 '¿ P Q 0 30 40 46 49 50 49 46 40 30 0
Puesto que la fracción de muestreo es menor del 7 % , el factor de corrección
por finitud ( c p f ) no afecta. Para quitar el factor, se sustituye el término N —
Las funciones alcanzan sus valores más grandes cuando Ja po
n por N. Si además, sustituimos n — 1 por n, tenemos la fórm ula más simple
blación está igualmente dividida entre ias dos clases, y dichas fun
i * , = N J ^ f n = (3042>/(0.19)(0.81)/200 = 84.4 ciones son simétricas respecto a este punto. El error estándar de p
cambia relativamente poco cuando P está entre el 30% y el 70%.
Este resultado concuerda muy bien con el anterior de 81.8. Con el valor máximo de v'PQ, 50, se necesita una muestra de tamaño
Las fórmulas anteriores de varianza y varianza estimada de p, 100 para reducir el error estándar de la estimación al 5% . Para
son ciertas sólo si las unidades son clasificadas dentro de C o C'. de alcanzar un error estándar de 1% se requiere un tamaño de mues
tal manera que p es la razón del número de unidades en C en la tra de 2 500.
muestra, al número total de unidades en la muestra. En muchas Este enfoque no es el apropiado cuando el interés está en el
encuestas cada unidad está compuesta por un grupo de elementos número total de unidades en la población que se encuentran en la
y son éstos los que se clasifican. Como ejemplos tenemos: clase C. En este caso es más natural preguntar: ¿es posible qui
la estimación sea correcta módulo un error, digamos, del 7% del
Unidad de muestreo Elementos valor verdadero? Por lo tanto, tendemos a pensar en el error están
Familia Miembros de la familia dar, como una fracción o porcentaje del valor verdadero, NP.
Restaurante Empleados La fracción es
Canasta de huevos Huevos
Arbol de durazno Duraznos (tNp NsÍPQ [Ñ —ñ 1 fq ÍÑ Ñ t
Arp sfnNP V N —l v^VpVjV-i
Si se saca una muestra aleatoria simple de unidades para estimar Esta cantidad se llama normalmente el coeficiente de variación do
la producción P de elementos en la población que pertenecen a la
la estimación. Si la ( c p f ) se ignora, el coeficiente es VQ/nP. La
clase C, las fórmulas anteriores no se aplican. Los métodos ade
proporción -/Q/P, que se puede considerar como el coeficiente de
cuados aparecen en la Sec. 3.12.
variación para una muestra de tamaño 1, se exhibe en la Tabla 3.2.
84 TE C NIC AS DE M U E S TR E O m u estreo para p r o p o r c io n e s y porcentajes 85
TABLA 3 .2 . V a lo r e s de -J q /P P a ra D ife r e n te s V a lo r e s son grandes con respecto al tamaño de muestra n, o que el muestreo
de P es con restitución.
Con esta suposición, el proceso de obtención de individuos para
P - Porcentaje de la población en la clase C formar la muestra consiste de una serie de n ensayos, en cada uno
de los cuales, la probabilidad de que la unidad que se ánahza per
0.1 0.5 1 5 10 20
p 0 tenezca a C es P. Esta situación da lugar a la distribución de fre
Y q /p oo 3 1 .6 14.1 9.9 4.4 3.0 2 .0 cuencia conocida como binomial para el número de unidades en C
en la muestra. La probabilidad de que la muestra contenga a uni
p ____ 30 40 50 60 70 80 90
dades de C es:
Y q Tp 1.5 1.2 1.0 0.8 0.7 0.5 0.3
<314>
Para un tamaño fijo de muestra, el coeficiente de variación del
De esta expresión podemos tabular la distribución de frecuencia
total estimado en la clase C disminuye consistentemente conforme
de a, de p = a/n, o del total estimado Np.
aumenta el verdadero porcentaje en C. El coeficiente es alto cuando
Existen 3 conjuntos de tablas satisfactorias. Todas ellas dan a
P es menor que el 5% . Se necesitan muestras muy grandes para
P en intervalos de 0.01, La amplitud para n es como sigue:
obtener estimaciones precisas del número total de individuos que
poseen cualquier atributo que sea raro en la población. Para P = 1% , U.S. Bureau o f Standards (1 9 5 0 ).
debemos tener V~ñ = 99 con el fin de reducir el coeficiente de va n - 1 (1 )4 9 (es decir, varía de 1 a 49 con interva
riación de la estimación a 0.1 o 10% . Esto da un tamaño de muestra los de 1 ).
de 9 801. El muestreo aleatorio simple, o cualquier método de mues Rcmig (1 9 5 2 ): n - 50(5)100.
treo que se adapte para propósitos generales, resulta costoso en la
estimación del número total de unidades que posean un atributo Harvard Computation Laboratory (1 9 5 5 ):
raro y se encuentren en número reducido en la población. n - 1(1)50(2)100(10)200(20)500(50)1000
3.4 L A D IS T R IB U C IO N B IN O M IA L 3.5 L A D IS T R IB U C IO N H IPE R G E O M E T R IC A
Puesto que la población es de un tipo particularmente simple, La distribución de p puede encontrarse sin suponer que la pobla
en donde la y> toma los valores 1 o 0 , podemos encontrar la dis ción es grande en relación a la muestra. Los números de unidades
tribución real de frecuencias de la estimación p y no sólo su media en las dos clases C y C' en la población, son A y A', respectivamente.
y varianza. Calcularemos la probabilidad de que los números correspondientes
La población contiene A unidades que están en la clase C y N en la muestra sean a y a ' donde
- A unidades en C', en donde P - A/N. Si la primera unidad que
a + a ' = n, A+A'=N
se analiza sucede que pertenece a C, quedarán en la población A
- 1 unidades en C y N - A en C'. Por lo tanto, la proporción de
unidades en C, después de obtener la primera unidad, cambia lige En el muestreo aleatorio simple cada una de las ^ N ^ seleccio
ramente a ( A - 1 )/ (N - 1 ). Alternativamente, si la primera uni nes diferentes de n unidades obtenidas de N tienen igual probabili
dad analizada se encuentra en C , la proporción en C cambia a dad de obtenerse. Para encontrar la probabilidad deseada, contamos
A / (N — 1 ). En el muestreo sin restitución, la proporción cambia el número de muestras que contienen exactamente a unidades per
de esta manera a lo largo del proceso de obtención de unidades. En tenecientes a C y a' de C'. El número de selecciones diferentes de a
la presente sección, estas variaciones se ignoran, es decir, se pre
supone que P es constante. Esto equivale a suponer que A y N - A unidades entre las A que están en C es mientras que el nú
M U E S TR E O P A R A PRO PO RCIO NES Y PO R C EN TAJES 87
x a nA (4X3) 3
E(«p) = nP = — - — =-
mero de selecciones diferentes de a' entre las A' es ^ ^ ^ . Cada una
N -n 3 5 4 15
de las selecciones del primer tipo se puede combinar con cualquiera V in p ) = np Q - = A-—
del segundo para dar una muestra diferente del tipo requerido. El
número total de muestras de los tipos requeridos es, por lo tanto,
3.6 LIM IT E S D E C O N F IA N Z A
(X)
De aquí que, si se obtiene una muestra aleatoria simple de ta
Primero discutiremos el significado de los límites de confianza
para el caso de características cualitativas. En la muestra, a indivi
maño n la probabilidad de que sea del tipo requerido es duos de los n pertenecen a la clase C. Supóngase que las inferencias
se van a hacer respecto al número A en la población que pertenece
a la clase C. Para el límite de confianza superior respecto a A, calcu
0 <315> lamos un valor Á u tal, que para éste, la probabilidad de obtener a
Esta es la distribución de frecuencias de a o np, de la cual, la o menos individuos pertenecientes a C en la muestra es una peque
de p es inmediatamente derivable. La distribución se llama hiper-
ña cantidad ac, por ejemplo, 0.025. Formalmente, A y satisface la
geométñca. ecuación
Para propósitos de cálculo la probabilidad hipergeométrica (3 .1 5 )
puede escribirse como sigue: ¿ Pr(/, n - j \ Á v, N —Á u ) = av U (3.17)
i -o
ni A ( A - í ) . . . ( A - a + 1 ) ( A ' ) ( A ' - 1 ) ■ ( A '- a ’+ l )
donde Pr es la probabilidad para la distribución hipergeométrica,
a l(n - a ) l N ( N - l ) . . . ( N - n +1)
según se definió en (3.15).
E jem p lo . Una familia de 8 miembros está formada por 3 hombres y 5
Cuando av se escoge por adelantado (3 .1 7 ) requiere en general
mujeres. Encontrar la distribución de frecuencias del número de hombres en
una muestra aleatoria simple de tamaño 4. En este caso un valor no entero para satisfacerla, mientras que conceptualmente
A u debería ser un número entero. En la práctica elegimos Á y como el
A = 3; A ' = 5, N = 8; n= 4
valor entero más pequeño de A tal que el lado izquierdo de (3.17)
De la Ec. (3.16) la distribución del número de hombres, a. es la siguiente: es menor que, o igual a, av. En la misma forma ellímite de confian
za inferior A¡_ es el valor entero más grande tal que
a Probabilidad
4! 5.4.3.2 1 Í Pr(/, n -j\ Á L, N - Á L) * a L (3.18)
í-a
0!4! 8.7.6.5 14
Los límites de confianza para P se encuentran entonces al tomar
4! 3.5.4.3 6
P u = Á u/N ,P l = Á l/N.
1 !3! 8.7.6.5 14
Existen numerosos métodos disponibles para calcular los límites
4! 3.2.5.4 6
de confianza.
2 !2! 8.7.6.5 14
4! 3.2.1.5 1
Métodos exactos
3! 1! 8.7.6.5 14
4 Imposible =0 Chung y DeLury (1 9 5 0 ) presentan gráficas con los limites de

confianza para P al 90, 95 y 99% con N = 500, 2 500 y 10 000. Los
El lector puede verificar que el número medio de hombres % y que la valores para tamaños de población intermedia se obtienen por in
varianza es i%8. Estos resultados concuerdan con las fórmulas establecidas terpolación. Lieberman y Owen (1 9 6 1 ) presentan tablas para térmi
previamente en la Sec. 322, las cuales dan
M U E S TR E O PA R A PRO PO RCIO NES Y PO R C EN TAJES 89
nos individuales y acumulativos de la distribución hipergeométrica, entre 2.5 y 3.5% y la probabilidad de que el límite inferior exceda
pero N se extiende solamente hasta 100. a P está entre 2.5 y 1.5%.
Ejemplo 1. En una muestra aleatoria simple de tamaño 100, obtenida de

La aproximación normal
una población de tamaño 500, existen 37 unidades en la clase C. Encontrar
De la varianza estimada de p obtenida de la Ec. (3 .8 ), se deriva los límites de confianza al 95% para la proporción y para el número total en la
que una forma de la aproximación normal para obtener los límites clase C en la población. En este ejemplo:
de confianza para P es n = 100, N = 500, p = 0.37
p l ) + 2^ ] (3-19) E l ejem plo es del tipo para el cual se recomienda la aproximación normal. El
error estándar estimado de p es
donde f = n/N y t es el desvío normal correspondiente a la proba A l ~ f ) p q / ( n - l ) = '/(0.8)(0.37)(0.63)/99 = 0.0434

bilidad de confianza. El uso del término más familiar V pq/n raras
La corrección por continuidad, l/2n, es igual a 0.005. Por lo tanto, los límites
veces produce diferencias apreciables. El último término de la dere al 95% para P se estiman como
cha es una corrección por continuidad. Esto sólo da lugar a una li
gera mejora en la aproximación. Sin embargo, sin la corrección, la 0.37 ± (1.96 x 0.0434 +-0.005) = 0.37 ± 0.090
aproximación normal usualmente da un intervalo de confianza muy
P L =0.280, P u = 0.460
estrecho.
El error en la aproximación normal depende de todas las canti Los límites según las gráficas de Chung y DeLury son 0.285 y 0.462, respec
dades 7i, p, N, av y aL. La cantidad para la cual el error es más sen tivamente.
sible es np o más específicamente, el número observado en la clase Para encontrar los límites para el número tota] en la clase C en la pobla
más pequeña. La Tabla 3.3 presenta las reglas de trabajo para deci ción, multiplicamos por N y obtenemos 140 y 230, respectivamente.
dir cuándo se puede usar la aproximación normal (3 .1 9).
Aproximaciones binomiales
T A B L A 3.3. V a l o r e s m á s P e q u e ñ o s d e np P a r a u s o d e l a A p r o x i m a c i ó n
Cuando la aproximación normal no es aplicable, los límites para
N orm al
P pueden encontrarse utilizando las tablas binomiales (Sec. 3.4) y
n p ■= Núm. observado ajustarlas, si es necesario, para tomar en consideración la cpf. La
en la clase más n = Tamaño Tabla V IIIi en las tablas estadísticas de Fisher y Yates (1 95 7) da
pequeña de muestra los límites de confianza binomiales para P para cualquier valor de n
30
y es una alternativa útil para las tablas binomiales ordinarias. El
0.5 15
20 50 Ej. 2 muestra cómo se calcula la aproximación binomial.
0.4
0.3 24 80
Ejemplo 2. Para otro atributo en la muestra del E j. 1, nueve de las
0.2 40 200 100 unidades pertenecen a la clase C. De la tabla de Rom ig para n - 100, los
0.1 60 600 límites de confianza al 95% para P son 0.041 y 0.165. (Las tablas de Fisher-
0.05 70 1400 Yates dan 0.042 y 0.164.) Si f, la fracción de muestreo, es menor que el 5 % ,
~0* 80 co los límites que se encuentran por este procedimiento son lo suficientemente’
aproximados para la mayoría de los propósitos. En este ejemplo, f = 0.2 y es
• E sto s ig n ific a q u e p es e x tre m a d a m e n te p e q u e ñ a , d e t a l m a n e ra q u e np s ig u e la dis necesario un ajuste.
trib u c ió n de P o isson .
Para aplicar el ajuste, reducimos el intervalo entre p y cada uno de los lí
mites por el factor VI - f - V 0 8 - 0.894. Los límites ajustados son
Las reglas en la Tabla 3.3 están construidas de tal manera que entonces:
con los límites de confianza al 95% la verdadera frecuencia con la
que los límites no incluyen a P no es más grande que 5.5% . Ade P L = 0.090 - (0.894X0.090 - 0.041) = 0.046
más, la probabilidad de que el límite superior sea inferior a P está P „ = 0.090+(0.894)(0.165 - 0.090) = 0.157
90 TE C N IC A S DE M U ESTRE O M U E S TR E O PA R A PRO PO RCIO NES Y PO R C EN TAJES 91
Los límites que se obtienen de las gráficas de Chung y DeLury son 0.045 y
0.157, respectivamente.
^ h :x x ‘j/o
Ejemplo 3. En los registros de auditoría en los cuales se necesita una
Esta expresión es la extensión natural de (3 .1 5 ), Seo. 3.5, para la
tasa muy pequeña de error, el lím ite de confianza superior para A es de par
ticular importancia. Supongamos que se verifican 200 de 1 000 registros y que distribución hipergeométrica. El numerador es el número de mues
se acepta e l conjunto de 1 000 si no se encuentran errores. Se han creado tras distintas de tamaño n que se pueden formar con a, unidades en
tablas especiales que dan los lím ites de confianza superiores para el número la clase 1, a., en la clase 2 y a¡ en la clase 3.
de errores en un grupo de observaciones. Una buena aproximación resulta de
las siguientes relaciones. La probabilidad de no encontrar errores en n cuando
A errores están presentes en N es, de la distribución hipergeométrica, 3.8 LIM IT E S D E C O N F IA N Z A C U A N D O E X IS T E N M A S
( N - A ) ( S - A - l ) . . . ( N - A - n 4-1) ^ Z N - A - m V D E DO S C LA SE S
J V (iV - l)...(N - * + l) \ N -u I
Deben distinguirse dos casos diferentes.
donde u = (n — l)/ 2 . Por ejemplo, con n = 200, A = 10, N = 1 000, la aproxi
mación da (890.5/900.5 ) 20», la cual, por logaritmos resulta ser 0.107. Por lo Caso 1. Calculamos
tanto, A = 10 (una tasa de error del 1 % ) es aproximadamente el lím ite de
confianza superior al 90% para e l número de errores en el grupo. p _ Número en cualquier clase en la muestra a,
n n
3.7 C L A S IF IC A C IO N E N M A S D E DO S C LA S E S Número total en un grupo de clases _ ak + a, + a3
V=
n n
Frecuentemente, en la presentación de resultados, se clasifican
_ En cualquiera de estas situaciones, a pesar de que la clasifica
las unidades en más de dos clases. Así, una muestra de una pobla
ción original contiene más de dos clases, p misma se obtiene de una
ción humana se puede arreglar en 15 grupos correspondientes a in
subdivisión de las n unidades en solamente dos clases. La teoría an
tervalos de 5 años de edad. Aun cuando una pregunta se supone
tes presentada se aplica a este caso. Los limites de confianza se
que puede contestarse por un simple “sí” o “no” , el resultado realmen
calculan ccmo se describió en la Sec. 3.6.
te obtenido puede caer en cualquiera de las siguientes 4 clases: “sí” ,
“no” , “no sé” , y “ sin respuesta”. La extensión de la teoría a estos casos Caso 2. Algunas veces se omiten ciertas clases, al calcular p
la ilustra una situación en la que existen 3 clases. de una subdivisión en dos partes de las clases restantes. Por ejem
Supongamos que el número que cae en la i-ésima clase es en plo, podríamos omitir las personas que no saben, o no dieron, una
la población y a¡ en la muestra, donde respuesta y considerar la proporción del número de respuestas “sí”
respecto al número de respuestas “sí” “no”. Las proporciones que
N = £ A it n=Yah p¡ = —', p ¡= ^ estructuralmente son de este tipo, con frecuencia son de interés en
encuestas por muestreo. El denominador de una proporción tal no
Cuando la muestra de tamaño n es pequeña en relación al total es n sino un número n' más pequeño.
de A¡, las probabilidades P¡ se pueden considerar .efectivamente cons Aunque n ’ varía de muestra a muestra, pueden seguir usándo
tantes a lo largo de la obtención de la muestra. La probabilidad de se los resultados previos, al considerar la distribución condicional
obtener la muestra observada está dada por la expresión midti.nom.ial. de p y las muestras en las que tanto n como n‘ son fijas. Este re
curso ya se empleó en la Sec. 2.12. Supongamos que
Pr(a¿)= (3-20)
ai f
P —— —— , n - a ¡ + a2, n = a ¡ + a2+ a3
Esta es una extensión correcta de la distribución binomial y es una ü. i "T£?2
buena aproximación cuando la fracción de muestreo es pequeña. por lo que a¡ es el número en la muestra que cae en las clases
La expresión co rrecta de la probabilidad de obteneT la m u estra ob que, por el momento, no estamos interesados. Entonces, como se
servada es muestra en la siguiente sección, la distribución condicional de ay y
m u estreo para p r o p o r c io n e s y po r cen tajes 93
a, es la distribución hipergeométrica obtenida cuando la muestra

es de tamaño n' y el tamaño de la población es N ' - A-¡ + A z. Por lo Probabilidad
Muestra a, a2 p condicional ( p - P)
tanto, utilizando la Ec. (3 .1 9 ), la aproximación normal para los
límites de confianza condicionales de P = A ,/ (A , + A , ) es b' f 1 0 1 } 2
c e f o def 0 1 o j _i
'’ ± h / ( 1“ £ ) ( ^ V ¿ ] 022) Si las muestras se especifican por los valores alt a2, sólo son posibles dos ti-
Si el valor de N ' no es conocido, n/N se puede sustituir por P°s - ai . — 0; a, == 0, a, = 1. Sus probabilidades condicionales, 1/3 y 2/3
n'/N ' en el término cp f de la Ec. (3 .2 2 ). respectivamente, concuerdan con la expresión general (3 .2 4 ). Además,
E (p ) = i
3.9 LA DISTRIBUCION CONDICIONAL DE p
L a estimación p es insesgada y su varianza concuerda con la fórmula general

Para encontrar esta distribución, restringimos nuestra atención a
muestras de tamaño n en las que n ' = a, + a, cae en las clases 1 y
2. El número de muestras distintas de este tipo es
Para n2 = 2 hay seis posibles muestras que sólo dan 2 grupos de valores de
1» ***•
Dentro de estas muestras, el número que tiene o, en la clase1y

en la clase 2 ya ha sido dado como el numerador en ( 3 .2 1 ), Probabilidad
Sec. 3.7. A l dividir este numerador por (3 .2 3 ), tenemos Muestra a, p condicional (p -P )
bce, b c f bde, o bdf 1 i i 2 ,

cde o cd f 0 2 0 \ - \
Esta es una distribución hipergeométrica ordinaria para una mues

La estimación es nuevamente insesgada y su varianza
tra de tamaño n ' de una población de tamaño N ' = A, + A-,.
Ejemplo. Considere una población que consiste en 5 unidades b, c, d,

e, f, que pertenecen a tres clases. °p W W +U W ~ i 8
lo cual se pUede verificar utilizando la fórm ula general. Nótese que la va-
Unidades
Clase A¡ indicadas por ®0,^ n t e Ya parte de la obtenida cuando n' - 1. Con un enfoque
obtuvo V C3mbÍa C° n 13 COnfígUración <*e 1“ muestra que se
1 1 b
2 2 c,d n o h i^ ^ H' = 3' 6XÍSte Uaa Sola muestra Posible, bcd. Esto da la fracción de
3 2 e, f Z r a1 ó ‘ T Cta’ V ? VarÍr Za * P e s 0 . como e s f á n S a d o
por la fórm ula general, la cual s e reduce a 0 cuando N ' -
Con muestras aleatorias de tamaño 3, deseamos estimar P »= A ,/ (A + A ),

o en este caso 1/3. Entonces. N = 5 y N ' » 3. 3.10 PROPORCIONES Y TOTALES SOBRE
H ay diez posibles muestras de tamaño 3, todas ellas con iguales probabili SUBPOBLACIONES
dades iniciales. Estas se agrupan de acuerdo con el valor de n'.
n '= 1 n ú m e r r d ^ ^ ^ r 1 estimaîones separadas para cada una de un

numero de subpoblaciones o dominios de estudio, a las que se desti
94 TE C N IC A S DE M U E S TR E O M U E S TR E O P A R A PRO PO RCIO NES Y PO R CENTAJES 95
nan las unidades en la muestra, es posible aplicar los resultados en Dominio

las Secs. 3.8 y 3.9. Los datos de la muestra se pueden presentar 1 2
como sigue:
C a, ai
Dominio 1 Dominio 2 Dominio k Total c a ,' a 2'
Clase C C c c c c
Total «i n/
Núm. de unidades a, a/ Ú2 a2' ak a/ n
La prueba de x2 ordinaria (Fisher, 1958) o la aproximación nor
De las n unidades, se encuentra que (a , + a ¡') caen en el domi mal a la distribución de (p , - p ,) es apropiada. En forma seme
nio 1 y de éstas, a, pertenece a la clase C. La proporción que per jante, comparaciones entre proporciones para más de dos dominios
tenece a la clase C en el dominio 1 se estima por ps - o ,/ (a , + a/ ). se hacen utilizando los métodos correspondientes a la tabla de con
tingencia 2 X fe.
La distribución de frecuencia y los límites de confianza para p, se
discutieron en el Caso 2 de las Secs. 3.8 y 3.9. En ocasiones se desea probar si a, difiere significativamente de
Para estimar el número total de unidades A, pertenecientes a la a-; P °r ejemplo, si el número de republicanos que están a favor
de una proposición es mayor que el número de demócratas también
clase C en el dominio 1, hay dos posibilidades. Si N L, el número
a favor. Con base en la hipótesis nula de que estos dos números
total de unidades en el dominio 1 en la población, es conocido, po
son iguales en la población, el total n' = a, + a2 en las dos clases
demos usar la estimación condicional.
en cuestión, debe dividirse con igual probabilidad entre ellas. Conse
cuentemente, podemos considerar a a, como un número binomial de
<3 -2 5 > éxitos en n ' ensayos, con probabilidad de éxito - V2 en la hipótesis
¿2, + ítl
nula. Se puede verificar que el desvio normal (corregido por con
Su error estándar se calcula como sigue: tinuidad) es
s ( Á ,) = N i J l - ( n j N x ^ P x q x K n , - 1) (3.26)
2(|fli - jrt'l —;)
donde n¡. - a, + a/.
Si Ni no es conocido, la estimación es
3.12 E S T IM A C IO N D E P R O P O R C IO N E S EN
Á/ = — (3-27)
n E L M U E STR E O P O R C O N G L O M E R A D O S s )fr í
con un error estándar estimado
Como se mencionó en la Sec. 3.2, los métodos precedentes no
s ( Á ,') = N V 1 - ( n / N ) v p q / ( n - 1 ) (3.28) son válidos si cada unidad es un conglomerado de elementos y esta
mos estimando la proporción de estos que pertenecen a la clase C.
donde p = a jn . Si cada unidad contiene el mismo número de elementos m, sea
P¡ ~ a j m la proporción de elementos en la i-ésima unidad pertene
3.11 C O M P A R A C IO N E S E N TR E D O M IN IO S D IFER EN TES ciente a la clase C. La proporción de elementos que pertenecen a C
en la muestra es
Puesto que las proporciones son estimadas independientemente
en los diferentes dominios, las comparaciones entre dichas propor
ciones se hacen por métodos estándar elementales. Por ejemplo, para
probar si la proporción p, — a,/(a, + a / ) difiere significativamente es decir, la estimación p es la media no ponderada de las cantidades
Vi . En consecuencia, si se reemplaza por p¡, las fórmulas del Cap.
de la proporción p2 = cu/(a. + ), formamos una tabla 2 x 2
2 se pueden aplicar directamente para dar la varianza verdadera y
común y corriente, estimada de p.
96 TE C N IC A S DE M U E S TR E O M U E S TR E O PA R A PR O PO R CIO N ES Y PO RCENTAJES 97
Si el tamaño de un conglomerado no es constante, sea m ¡, el núme

ro de elementos en el t-ésimo conglomerado y sea p¡ = a jr a x. La
v (p )= V % - i " (329)
proporción de unidades pertenecientes a la clase C en la muestra es
Una estimación muestral insesgada de esta varianza es n
la ,
v (p )= l z í Í k í Z £ t (3.30) P = — (3.31)
n n -1 tm ,
Ejemplo 1. Un grupo de 61 pacientes leprosos fue tratado con una droga Estructuralmente, ésta es una estimación de razón típica discutida
durante 48 semanas. Para medir el efecto de la droga en el bacilo de la lepra, en la Sec. 2.11 y después en el Cap. 6 . Es ligeramente sesgada aun
se probó bacteriológicamente la presencia del bacilo en 6 lugares diferentes
cuando el sesgo rara vez tiene importancia práctica.
del cuerpo de cada paciente. De las 366 observaciones, 153, o sea el 41.8%
fueron negativas. ¿Cuál es el error estándar de este porcentaje? Si ponemos a. por y{ y m¡ por en la Ec. (2 .3 9), la varianza
Este ejemplo proviene de un experimento controlado, n o de una encues aproximada de p es
ta, pero ilustra qué tan errónea puede ser la fórmula binomial. Utilizando la
fórmula binomial tenemos n = 366 y 2
e.e. O ) = J p q / ( n - 1) = V(41.8)(58.2)/365 = 2.58% A '- l

Cada paciente es un conglomerado con m = 6 elementos (lu gares). Para donde P es la proporción de elementos en C en la población y M =
encontrar el error estándar con la fórm ula correcta, necesitamos la distribu
ción de frecuencia de los 61 valores de p,. Es más conveniente tabular la dis Irrii/ b l es el número promedio de elementos por conglomerado. Una
tribución de y x, el número de lugares negativos por paciente. Con p ( expresa expresión alternativa es
do en porcentaje, v¡, = 100^/6. De la distribución presentada en la Tabla 3.4
encontramos X/V" — 669 y ~ f v í m-\2(P‘
V(p}- — 1 I s ) ~Ñ =T <3 -3 3 >
... IZ í(y -y )2 . 1669-[<153)761] 0
ee(y)=v - ^ r r r - v - 6l j ^ — °-279 Esta form a muestra que la varianza aproximada involucra una
suma ponderada de cuadrados de desviaciones de p¡ respecto al valor
Por lo tanto,
de la población P.
e.e. (p ) = -^ -e .e . (y ) = 4.65% Para la varianza estimada tenemos
O
Esta cifra es aproximadamente 1.8 veces el valor dado por la fórmula bino- „ (p ) = W IfL Z M W ¿ T m L
mial. L a fórmula binomial requiere la suposición de que los resultados obte nm n —1 w - 3**;
nidos en los lugares diferentes en el mismo paciente sean independientes,
donde m = T m,/n es el número promedio de elementos por conglo
aun cuando en realidad presentan una fuerte correlación positiva. La última
linea en la Tabla 3.4 muestra los números esperados de pacientes con 0, 1, merado en la muestra.
2 , . . . lugares negativos, calculados con la binomial (0.58 4- 0.42)3. Nótese
Ejemplo 2. Una muestra aleatoria simple de 30 fam ilias se obtuvo de un
el marcado exceso de frecuencias f de pacientes con 0,5 y 6 lugares negativos.
censo hecho en 1947 en los Distritos 6 y 7 del Eastem Health District de Bal
timore. La población contiene aproximadamente 15 000 familias. En la Ta
bla 3.5 las personas en cada fam ilia se clasifican, ( a ) de acuerdo a si han
TA B LA 3.4. N úm ero de L ugares N e g a t iv o s por P a c ie n t e
consultado un médico en los últimos 12 meses, ( b ) de acuerdo a su sexo.
y, = 6^/100 0 1 2 1 4 5 6 Total
Nuestro propósito es comparar la fórmula de razón con la binomial que
es inapropiada. Considerando primero la proporción de personas que han con
17 11 4 4 7 14 4 61
/ sultado un doctor. Con la fórmula binomial, tendremos:
/y. 0 11 8 12 28 70 24 153
2.3 10.1 18.3 17.6 9.6 2.8 0.3 61.0
/exp
m uestreo para p r o p o r c io n e s y po rcentajes 99
Luego
TA B L A 3.5. I n f o r m a c ió n d e u n a M u e s t r a A l e a t o r ia Sim p l e
de 30 F a m il ia s H. o ,„0197
n 104
Médico visto
en el último Con la fórmula de razón, notamos que hay 30 conglomerados y tomamos
Núm ero de
año
i>um. ae n= 30
Familia personas Hombres Mujeres S í '7 No m, = número total en la i-ésima fam ilia
número m. a. ai
1 a, = número de personas en la t-ésima fam ilia que ha visto al doctor
1 5 1 4 5 0
p= 0.2885, como antes
2 6 3 3 0 6
3 3 1 2 2 1 104
m = — = 3.4667
4 3 1 2 3 0 30
5 2 1 1 0 2
£ a,2= 86; £ m,2 = 404; £ a,m¡ = 113
6 3 1 2 0 3
7 3 1 2 0 3 -f La cp f se puede ignorar. Por lo tanto (utilizando la Ec. 3.34),
8 3 1 2 0 3 (86) - 2(0.2885)(113) + (0.288S)2(404)
9 4 2 2 0 4
(3 0 ) ( 2 9 ) ( 3 . 4 6 6 7 ) 2
10 4 3 1 0 4
11 3 2 1 0 3 La varianza dada por el método de razón, 0.00520, es mucho más grande
12 1 1 0 2 que la obtenida con la fórm ula binomial, 0.00197. Por diversas razones, las
13 7 3 4 0 7 fam ilias difieren en la frecuencia en que susmiembros han consultado almé
14 4 3 1 4 0 dico. Para la muestra completa, la proporción dequienes lo consultaron es
15 3 2 1 1 2 solamente un poco más de uno en cuatro, pero hay varias familias en las
16 5 3 2 2 3 que cada miembro de ellas ha visto al médico. Se obtienen resultados simi
17 4 3 1 0 4 lares para cualquier característica en la cual los miembros de la misma fam i
18 4 3 1 0 4 lia tienden a actuar en la misma forma.
19 3 2 1 1 2
En la estimación de la proporción de hombres en la población, los resul
20 3 1 2 3 0
tados son diferentes. Por el mismo método de cálculo, encontramos
21 4 1 3 2 2
22 3 2 1 0 3
Fórmula binomial: v (p ) = 0.00240
23 3 2 1 0 3
Fórmula de razón: u(p) = 0.00114
24 0 1 0 1
25 2 1 1 2 0
En este caso, la fórmula binomial sobreestima la varianza. La razón por la
26 4 3 1 2 2
27 2 que ocurre esto es interesante. La mayoría de las familias se form an como
3 1 0 3
28 4 2 2 resultado de un matrimonio; por lo tanto, contienen cuando menos un hom
2 2
29 2 1 1 0 2 bre y una mujer. En consecuencia, la proporción de hombres por fam ilia se
30 4 2 2 1 3 separa menos de de lo que se podría esperar con la fórmula binomial.
Ninguna de las 30 familias, excepto una con un solo miembro, está compues
Totales 104 53 51 30 74 ta totalmente por hombres o por mujeres. S i la distribución binomial fuese
aplicable, con una verdadera P de aproximadamente Vá, las familias con todos
los miembros de un mismo sexo constituirían la cuarta parte de la fam ilia de
tamaño 3 y Va de las fam ilias de tamaño 4. Esta propiedad de la distribución
del sexo ha sido discutida por Hansen y Hurwitz (1 9 4 2 ). Kish (1 9 5 7 ) ha dado
otras ilustraciones del error cometido con el uso impropio de la fórm ula bino
mial en investigaciones sociológicas.
100 TE C N IC A S DE M U ESTRE O M U E S TR E O PA R A PRO PO RCIO NES Y PO R C EN TAJES 101
E J E R C I C I O S se encuentra en e l dominio 1, y P,, como en la Sec. 3.10, es la proporción de

unidades en e l dominio 1 que pertenecen a la clase C. Establezca las condi
3.1. En una población con N = 6, A = 4 y A ' = 2, calcular el valor de a ciones en las que el conocimiento de N , da lugar a reducciones grandes de
para todas las posibles muestras aleatorias simples de tamaño 3. Verificar los la varianza.
teoremas dados para la media y varianza de p » a/n. Verificar que 3.9. En una muestra aleatoria simple de tamaño 5 obtenida de una po
blación de tamaño 30, ninguna unidad en la muestra pertenecía a la clase C.
N -n Utilizando la distribución hipergeométrica, encuentre e l límite superior respec
(„ -l)N W to al número A de unidades pertenecientes a la clase C en la población, co
rrespondiente a una probabilidad de confianza del 95% sobre un lado de la
es una estimación insesgada de la varianza de p.
distribución. Encuentre también la aproximación respecto a AL. obtenida al
3.2. E n una muestra aleatoria simple de 200 obtenida de una población calcular el lim íte binomlal superior al 95% P b. y al acortar el intervalo como
de 2 000 colegios. 120 de éstos estuvieron a favor de una propuesta. 57 se se describió en la Sec. 3.6. Pruebe también el método descrito en la Pág.
opusieron y 23 se abstuvieron de opinar. Estimar los límites de confianza al
90, Ej. 3.
95% para e l número de colegios en la población, que favorecieron la propuesta.
3.10. Un servicio médico estudiantil tiene un registro del número total de
3.3. En los resultados de la muestra anterior, ¿se obtiene una evidencia
estudiantes elegibles N y del número total de visitas Y, que hicieron los es
contundente de que la m ayoría de los colegios en la población favorecieron
tudiantes durante un año. Algunos no hicieron visitas. El servicio médico de
la propuesta?
sea estimar el número promedio de visitas Y / N , realizadas por los N, estu
3.4. Una población con N = 7 consiste de los elementos C „ C2, Ca, D „
diantes que hicieron, por lo menos, una visita, pero no se conoce el valor de
Da y D3. Se toma una muestra aleatoria simple de tamaño 4 con el fin de
N ,. Se toma una muestra aleatoria simple de n estudiantes elegibles. En
estimar la proporción de C ', respecto a C ', + D 'a. Calcule las distribuciones con
ella, n , estudiantes de los n seleccionados hicieron por lo menos una visita y
dicionales de esta proporción, p, y verifique la fórm ula de su varianza condi
el número total de visitas fue y. Ignore la cp f en esta pregunta, (a.) de
cional.
muestre que y/7tj es una estimación insesgada de Y / N , y que su varianza
3.5. En el ejercicio anterior, ¿cuál es la probabilidad áe que una muestra
condicional es S2/?»,, donde S* es la varianza del núm. ro de visitas entre los
de tamaño 4 contenga B,? Encuentre la varianza promedio de p en el Ejerc.
estudiantes que por lo menos hicieron una. ( b ) Un segundo método para es
3.4 en todas las muestras aleatorias simples de tamaño 4. Es 0.0393 contraria
timar Y/N , es usar = Nn,/n como una estimación de N , y, por lo tanto,
mente a 0.025 con N = 6, n = 4 y B, ausente.
Yn/N n, como una estimación de Y/N,. Demuestre que esta estimación es ses
3.6. Se eligió una muestra aleatoria simple de 290 familias de una área de
gada y que la razón del sesgo respecto al valor verdadei o Y / N , es aproxima
la ciudad conteniendo 14 82S familias. A cada fam ilia se le preguntó si la
damente ( N — N ,)/ n N ,. Encuentre una expresión aproximada para la va
casa era suya o rentada y también si tenían el uso exclusivo de un baño in
rianza de la estimación Y n/Nn, y demuestre que la estimación en ( a ) tiene
terior. Los resultados fueron como sigue:
una varianza mayor si
Propia Rentada Total 52> ( N - N , ) « , / r v

N¡rt iw j
Uso exclusivo de un baño Sí No Sí N o
Nota. Si p es una estimación binomial de P, basado en n ensayos, enton
141 6 109 34 290
ces aproximadamente,
( a ) para las familias que rentan, estimar el porcentaje en el área de familias
que cuentan con un baño interior de uso exclusivo y dar e l error estándar de
su estimación; ( b ) estim ar el número total de familias que rentan casa en el
área y que no tienen un baño interior para uso exclusivo y dar el error están 3.11. ¿Cuál de las dos estimaciones previas parece más precisa en las cir
dar de esta estimación. cunstancias siguientes? N — 2 004, Y = 3 011. La muestra con n = 100 de
3.7. Si en el Ej. 3.6,el número totalde fam ilias que rentan casa en el mostró que 73 estudiantes hicieron cuando menos una visita. E l número total
área de la ciudad es de7 526, construya una nueva estimación delnúmero de visitas fue de 152 y la varianza estimada s2 fue 1.55.
de arrendatarios que no cuentan con la facilidad de un baño exclusivo y del 3.12. Una muestra aleatoria simple de n unidades conglomeradas, cada
error estándar de esta estimación. una con m elementos, se obtiene de una población en la cual la proporción
3.8. Para estimar e l número total de unidades en la clase C en e l domi de elementos en la clase C es P. Conforme varia la correlación intraeonglo-
nio 1 (Sec. 3.10), la estimación Á , = N,p., se recomendó si se conocía N ,, merada, ¿cuáles son los posibles valores más altos y más bajos de la verda
contra A ,' -= N a,/n si N , no era conocido. Ignorando la cpf, demostrar que en dera varianza de p (la estimación muestra! de P ) y cómo se comparan con la
varianza binomial? Ignore la cpf.
muestras grandes, Ja razón de la varianza de Á , respecto a la de Á ,'e s , aproxi
3.13. En la muestra de 30 familias de la Tabla 3.5, la información pre
madamente, Q ,/ (Q i + P ,ir ), donde ir es la proporción de la población que no sentada a continuación se refiere al número de visitas al dentista realizadas
en el último año. Estimar la varianza de la proporción de personas que vieron

a un dentista y comparar ésta con la estimación de la varianza binomial.
3.14. En e l muestreo de una característica no común, un métode consiste
en seguir sacando una muestra aleatoria simple hasta que se encuentren m
unidades que poseen esta característica no común (Haldane, 1945) en donde
m se elige por adelantado. Si se ignora la cpf, probar que la probabilidad de C A P IT U L O 4
que la muestra total requerida sea de tamaño n es
(/ t-D ! pmQH-m (n ^ m)
(m —l)!(n -m)\
donde P es la frecuencia de la característica rara. Encontrar el tamaño pro
medio de la muestra total y demostrar que si m > 1, p = (m — 1 )/ (n — 1)
L a Estimación del Tam año
es una estimación insesgada de P. (P a ra una m ayor discusión véase Finney,
1949, y Sandelius, 1951, quienes consideran un plan en el cual el muestreo
continúa hasta que se encuentren m individuos o el tamaño total de la mues
de la Muestra
tra alcance un lím ite n„ predeterminado.) Véase también la Sec. 4.5.
Dentista visto Dentista visto

Núm. de Núm. de
personas Sí No personas Si No 4.1 U N E JE M P LO H IPO TE TIC O
1 4 5 1 4 Al planear una encuesta por muestreo, siempre se alcanza una

0 6 4 4 0 etapa en donde hay que tomar una decisión respecto al tamaño
1 2 4 1 3 de la muestra. Esta decisión es importante. Una muestra demasia
2 1 3 1 2
do grande implica un despilfarro de recursos y una muy pequeña
0 2 3 0 3
0 3 4
disminuye la utilidad de los resultados. La decisión no siempre
1 3
1 2 3 0 3 puede tomarse satisfactoriamente; a menudo no disponemos de la
1 2 3 1 2 suficiente información para saber si el tamaño de la muestra selec
1 3 1 0 1 cionada, es el óptimo. La teoría del muestreo proporciona un mar
0 4 0 2 co dentro del cual se puede pensar inteligentemente respecto a es
1 2 4 0 4 te problema.
0 2 3 1 2
2 5 4
A continuación veremos un ejemplo hipotético en el que se
1 3
1 3 2 0 2 resaltan los pasos necesarios para llegar a una solución. Un antro
0 3 4 0 4 pólogo está preparando un estudio sobre los habitantes de cierta
isla. Entre otras cosas, desea estimar el porcentaje de habitantes
que pertenecen al grupo sanguíneo O. Le han asegurado la coope
ración necesaria para extraer una muestra aleatoria simple. ¿Qué
tan grande debe ser la muestra?
Este asunto no se puede discutir sin antes contestar a otra pre
gunta. ¿Qué tan exactamente desea el antropólogo conocer el por
centaje de personas del grupo sanguíneo O? A lo anterior, nuestro
amigo contesta que estará satisfecho si el porcentaje no contiene
un error mayor del ± 5 % , o sea que si la muestra indica que el 43%
de la población es del grupo sanguíneo O, el porcentaje para toda
la isla se encontrará con certeza entre el 38 y el 48%.
LA E S T IM A C IO N D EL T A M A Ñ O DE L A M U E S TR A 105
Para evitar malentendidos, es aconsejable aclarar al antropólogo El método para aplicar el reajuste en caso necesario, se discutirá
que no le podemos asegurar una exactitud dentro de un 5% , a en la Sec. 4.4.
menos que se analice el tipo sanguíneo de todos los habitantes, Por
muy grande que se tome n, existe la posibilidad de una muestra 4.2 A N A L IS IS D E L P R O B L E M A
desafortunada que presente un error mayor al 5% deseado. El an
tropólogo contesta fríamente que lo sabe, que acepta el riesgo de Los pasos principales involucrados en la elección del tamaño
una posibilidad en veinte de obtener una muestra poco afortunada de la muestra son los siguientes:
y que todo lo que pide es un valor de n y no una clase de estadística.
Ahora estamos en posición de estimar en términos generales 1. Debe existir algún enunciado respecto a lo que se espera de
el valor de n. Para simplificar las cosas se ignora la cp f y el por la muestra. Este puede darse en términos de límites de error desea
centaje de muestra p se supone normalmente distribuido. Si estas dos, como en el ejemplo anterior, o bien en términos de alguna deci
hipótesis son razonables, puede verificarse cuando se conoce el sión o acción que debe tomarse una vez que se conocen los resulta
valor n inicial. dos de la muestra. La responsabilidad de este enunciado es pri
En términos técnicos, p debe encontrarse en el intervalo ( P ± 5 ), mordialmente de las personas que van a usar los resultados de la en
excepto para un caso en 20. Dado que p se supone normalmente cuesta, aunque con frecuencia, dichas personas necesitan de una
distribuida alrededor de P, se encontrará en el intervalo ( P ± 2<rp), guía para expresar sus deseos en términos numéricos.
salvo para una posibilidad en 20. Además, 2. Se debe encontrar una ecuación que relacione n con la pre
cisión deseada de la muestra. L a ecuación variará según el conteni
Op =-Jp Q/n do del enunciado de precisión y el tipo de muestreo propuesto. Una
de las ventajas del muestreo probabilista es que permite la elabo
De modo que podemos escribir
ración de esta ecuación.
, 4PQ 3. Esta ecuación tendrá como parámetros ciertas propiedades
2v PQ/ n = 5 o n=
desconocidas de la población, que deben estimarse para obtener
resultados específicos,
En este momento aparece una dificultad común a todos los pro
4. Con frecuencia sucede que los datos estipulan para ciertas
blemas para la estimación del tamaño de la muestra. Se obtuvo
subdivisiones mayores de la población y que los límites de error de
una fórmula para n, pero n depende de una propiedad de la pobla
ción sujeta al muestreo. En este caso, la propiedad es la cantidad seados se establecen para cada subdivisión. De ser- así, se hace un
P que desearíamos medir. Por lo tanto, preguntamos al antropólogo cálculo separado para el valor n en cada subdivisión y el n total se
si nos puede dar una idea del valor que se espera de P. El contesta encuentra por adición.
que con base en datos obtenidos previamente con otros grupos étni 5. Generalmente se mide más de un atributo o característica en
cos, y de acuerdo a sus especulaciones sobre la historia racial de una encuesta por muestreo: en ocasiones, el número de atributos
la isla, le sorprendería que P estuviera fuera del intervalo del 30 es grande. Si se estipula un grado de precisión para cada atributo,
al 60% . los cálculos conducirán a una serie de valores conflictivos de n uno
Esta información será suficiente para proporcionar una res para cada atributo. Por lo tanto, debe encontrarse un método para
puesta útil. Para cualquier valor de P entre 30 y 60, el producto reconciliar estos valores.
PQ está entre 2 100 y un máximo de 2 500 con P - 50. El valor co 6 . Finalmente, debe apreciarse e l valor elegido de n, para que
rrespondiente de ti está entre 336 y 400. Para no correr riesgos se sea consistente con los recursos de muestreo disponibles. Esto exige
toma 400 como estimación inicial de n. una estimación del costo, trabajo, tiempo y materiales que se ne
Ahora pueden reexaminarse las hipótesis hechas en este análisis. cesitan para obtener la muestra del tamaño propuesto. En ocasio
Con n — 400 y p entre 30 y 60, la distribución de p debería estar nes es claro que n debe reducirse drásticamente, y entonces es
cerca de la normal. Si se requiere o no la cpf, dependen del núme necesario tomar una decisión difícil, que es la de proceder con una
ro de habitantes de la isla. Si la población excede a 8 000, la frac muestra mucho más pequeña, lo que reduce la precisión, o bien,
ción de muestreo es menor al 5% y no se necesita ajuste para la cpf. abandonar los esfuerzos hasta contar con mayores recursos.
lUt> TE C N IC A S DE M U E S TR E O LA E S T IM A C IO N D E L T A M A Ñ O DE L A M U E S T R A 107
En secciones subsecuentes se examinarán en detalle estas di que se va a gastar en alguna empresa), entonces, la precisión re
ficultades. querida se puede enunciar usualmente de una manera más especí
fica, en términos de las consecuencias de los errores de decisión.
Un enfoque general a los problemas de esta índole se presenta en
4.3 L A E S P E C IF IC A C IO N D E L A P R E C IS IO N
la Sec. 4.10, que ofrece un punto de partida lógico para la solución.
La precisión deseada se puede establecer, al definir la cantidad
de error tolerable en las estimaciones muéstrales. Esta cantidad se
4.4 L A F O R M U L A P A R A n A L H A C E R U N M UESTREO
determina mejor a la luz de los usos a que se destinan los resulta
P A R A D E T E R M IN A R U N A P R O P O R C IO N
dos de la muestra. En ocasiones, es difícil saber qué tanto error
debería tolerarse, particularmente cuando los resultados se desti
Las unidades se clasifican en dos clases, C y C'. Se ha conve
nan a varios fines. Supongamos que preguntamos al antropólogo
nido en algún margen de error d de la proporción estimada p de las
por qué desea que el porcentaje del conjunto de personas en el
unidades en la clase C, y existe un pequeño riesgo a, que estamos
grupo sanguíneo O tenga una corrección de un 5% en lugar de 4
dispuestos a correr, de que el error real supere a d; es decir, quere
o 6 % . Su respuesta podría ser que los datos sobre el grupo sanguí
mos que
neo se destinan principalmente a la clasificación facial y sospecha
que los isleños pertenecen a un grupo racial con un valor de P apro Pr(|p-/>|>d) = «
ximado al 35% , o a un tipo racial con un valor de P cercano al 50% .
Se supone un muestreo aleatorio simple y p se toma con dis
Un límite de error de 5% en la estimación le parece lo suficientemen
tribución normal. A partir del Teorema 3.2, Sec. 3.2,
te pequeño para permitir la clasificación en uno de estos dos tipos.
Sin embargo, se opondría en forma violenta a límites de error en [N -n ÍP O
tre 4 o 6 % . ’ V jV - 1 * „
De modo que el límite de error de 5% que escogió el antropólogo,
Por lo tanto, la fórmula que relaciona n con el grado de pre
es en cierta medida arbitrario. A este respecto, el ejemplo muestra
cisión deseado es
cómo se suelen decidir los límites de error. De hecho el antropó
logo, estaba más seguro de lo que quería, en comparación con ¡PQ
muchos científicos y administradores. Cuando por primera vez se n
pregunta a estas personas el grado de precisión deseado, a menudo
donde t es la abscisa de la curva normal que corta un área de « en
confiesan que nunca han considerado el asunto y no tienen idea de
la respuesta. Me he percatado, gracias a la experiencia, que des las colas de la distribución. Al resolver para n encontramos
pués de discutir el asunto, son capaces de indicar, al menos apro t2PQ
ximadamente, el tamaño del límite de error que les parece razonable.
En muchas situaciones prácticas no podemos ir más adelante.
Parte de la dificultad es que no se sabe lo suficiente sobre las con
secuencias que producirían errores de diferentes magnitudes en las
decisiones prácticas que se toman con base en los resultados de la Para fines prácticos, se sustituye una estimación anticipada p
encuesta. Aun cuando estas consecuencias se conozcan, los resul de P en esta fórmula. Si N es grande, una primera aproximación es
tados de muchas encuestas importantes, los utilizan diferentes
personas con diversos propósitos, y algunos de ellos no se han pre
=™ (4.2)
visto al planear la encuesta. Por lo tanto, es de esperarse que exista
un cierto elemento de adivinanza en la especificación de la precisión donde
para un futuro más o menos inmediato.
Si la muestra se toma con un propósito bien definido (com o sería pq
V = — - varianza deseada de la proporción de muestra
una decisión entre “sí" o “no” , o bien, sobre la cantidad de dinero
108 TE C N IC A S DE M U E S TR E O LA E S T IM A C IO N D EL T A M A Ñ O DE L A M U E S TR A 109
En la práctica, primero calculamos n„. Si n,/N es despreciable, necesario de n, para un error relativo r específico es 11 veces más
una aproximación satisfactoria a n de (4 .1 ) será n 0. De no ser grande cuando P - 1% que cuando P = 10%. En esta situación
así, es claro, al comparar con 4.1 y 4.2 que n se obtiene como (un valor pequeño de P pero no muy bien conocido de antemano), el
método de Haldane (1 9 4 5 ) del muestreo continuo hasta que m de los
= n° = n° (A 3)
" l + (n 0- l ) / N 1 + («o / A 0 ' ’ atributos raros se hayan encontrado en la muestra, tiene una gran
ventaja. El método suele llamarse muestreo inverso.
Ejemplo. En e l ejemplo hipotético de los grupos sanguíneos teníamos Si n es el tamaño de la muestra en el que aparece el m-ésimo
d = 0 .0 5 , p = 0 .5 , a = 0 .0 5 , t=2 atributo raro, (m > 1 ), una estimación insesgada de P es p - ( rn
- . l ) / ( n - 1 ). Para N muy grande, P pequeña y m > 10, una bue
Luego na aproximación de V ( p ) es mPsQ /(m — l ) 2. Luego, c t / ( p ) -
( 4 )(0 .5 )< 0 .5 ) (m Q )'r-/ (m - 1) < y jlñ / {m — 1), que será un límite superior
167o
"fl= ói?
r=400 bastante ceñido si P es pequeño. De modo que al fijar m de
Supongamos que sólo hay 3 200 isleños. La cp f será necesaria y encontramos antemano, podemos controlar el valor de c v (p ) sin conocer anticipa
damente P. El valor m = 27 da c v (p ) < 2 0 % , pero el valor m -
rt„ 400
=356 102 se necesita para c v ( p ) < 10%. El valor de n con este método
es una variable aleatoria, pero será grande si P es pequeña.
La fórmula para también se aplica si d, p y q se expresan como p o r
centajes en lugar de proporciones. Dado que e l producto pq crece al tender
p a Vt o 5 0 % , una estimación conservadora de n es la que se obtiene al 4.6 L A F O R M U L A P A R A n CO N D A T O S C O N T IN U O S
seleccionar como p el valor más cercano a Vít en el intervalo en que se espera
esté p. Si por ejemplo, p parece estar entre 5 y 9 % , tomamos 9% para la Generalmente se desea controlar el error relativo r en la estimación
estimación de n. del total o la media de la población. Con una muestra aleatoria sim
Algunas veces, particularmente al estimar el número total NP ple de media y, queremos que
de unidades en la clase C, deseamos controlar en N P el error rela
tivo r en lugar del error absoluto, así, por ejemplo, podríamos desear
estimar N P con un error no mayor al 10%, o sea, queremos que
donde a es una pequeña probabilidad. Suponemos que y sigue una
pr > r) = pr (|p _ p \a rp) = a distribución normal: del Teorema 2.2. Corolario 1, sabemos que
el error estándar es
Para esta especificación, sustituimos rP por r p en vez de d en
•las Fórmulas (4 .1 ) y (4 .2 ). A partir de (4 .2 ) obtenemos lN -n S
(4.2)' Así que

r p r p
La Fórmula (4 .3 ) permanece inalterada. / Ñ -n 5

rY = U r, = t J — -r (4.4)
N -Jn
4.5 A T R IB U T O S R A R O S— M UESTREO INV ER SO Al resolver para n
Al estimar n a partir de las Fórmulas (4 .1 ), (4 .2 ) y (4 .2 )', el

muestreador introduce su mejor estimación anticipada de la pro
porción de población P. Si se sabe que P está entre el 30 y el 70%, Obsérvese que la característica de población de la que depende
como en e l ejemplo de la Sec. 4.1, una estimación exacta de P no es n es su coeficiente de variación S/Y. Esto a menudo es más estable
crucial. Pero con un atributo raro (por ejemplo, P < 10% ), el valor y fácil de conjeturar de antemano que el valor mismo de S.
L A E S T IM A C IO N D E L T A M A Ñ O DE L A M U E S TR A 111
estimar las varianzas de población en determinaciones de tamaños

Como primera aproximación tomamos
de muestra: ( 1 ) Al tomar la muestra en dos pasos, siendo el pri
mero una muestra aleatoria simple de tamaño n, de donde se estima
- (i)H (ir s,! o p, de S 1 o P y se obtiene el valor requerido de n; ( 2 ) por los
al sustituir una estimación anticipada de (S / Y ). La cantidad C resultados de una encuesta piloto; ( 3 ) por muestreo previo de la
es el ( c v ) 1 deseado de la estimación muestral. misma población o una semejante; y ( 4 ) al conjeturar respecto a
Si n0/N es aprecíable, calculamos n como en (4 .3 ) la estructura de la población y ayudarse con algunos resultados ma-
tem áticos.
< «> El método 1 proporciona las estimaciones más confiables de S"-
o P, pero no se usa frecuentemente porque retarda la consumación
Si en lugar del error relativo r queremos controlar el error absoluto
de la encuesta. Cuando el método es factible, Cox (1 95 2) con base
d en y, tomamos n* = t2S*/d* - S'2/V, donde V es la varianza de
en un trabajo de Stein (1 9 4 5 ) muestra cómo calcular n a partir de
seada de Y.
A r opi de modo que la estimación final de y o p tenga una varianza
Ejemplo. E n viveros que producen arbolitos para venta es aconsejable preasignada V, un límite de error preasignado d, o un coeficiente
estimar, al final del invierno o al principio de la primavera, el número de
de variación preasignado. La primera muestra se supone lo sufi
arbolitos en buen estado que probablemente se dispondrán puesto que con
base en esto se determina la demanda y aceptación de las órdenes. Johnson cientemente grande para despreciar los términos de orden 1/n,2. A
(1 9 4 3 ) llevó a cabo un estudio de los métodos de muestreo para la esti continuación se mencionan algunos resultados.
mación del número tota! de plántulas. La información que se indica a con Los resultados dados aquí suponen n, < n, el tamaño de la
tinuación se obtuvo de una almáciga de arces plateados de u n pie de an
cho y 430 pies de largo. La unidad de muestreo fue un pie de longitud de muestra final. De no ser así, véase Cox (1 9 5 2 ).
la almáciga, de tal manera que N — 430. Mediante una enumeración com
pleta de la almáciga se encontró que Y = 19, S1 = 85.6, siendo éstos los Estimación de Y dado cv =\/C
verdaderos valores de la población.
Con un muestreo aleatorio simple, ¿cuántas unidades se deben tomar para Los resultados suponen una distribución normal de t/¡. Si s¡s
estimar Y dentro del 10% con probabilidades de 1 en 20? De la Ec. (4 .5 ) es la varianza estimada a partir de la primera muestra, se toman
obtenemos
unidades adicionales para que el tamaño de la muestra final sea
t 2S 2 ( 4 X 8 5 .6 )
no = ~ T ^ = ~ =95
(1 . 9 ) a= ( l + 8 C-I— r-y+ — ) (4.6)
Cyi \ n iy f n j '
Puesto que n ,/N no es despreciable, tomamos
95 La media y de la muestra final está ligeramente sesgada. Tómese
=78
' ! + « ' f= y (l- 2 C ).
Casi e l 20% de la almáciga se debe contar para alcanzar la precisión
deseada. Estimación de Y con Varianza V
Las fórmulas para n dadas aquí se aplican sólo al muestreo aleatorio
Se toman unidades adicionales hasta que el tamaño de la mues
simple en el que se usa la media muestral como estimación de Y. Las fórmulas
apropiadas para otros métodos de muestreo y estimación se presentan al
tra total sea
discutir estas técnicas.
4.7 E S T IM A C IO N E S A N T IC IP A D A S DE
V A R IA N Z A S D E P O B L A C IO N Si S se conociera exactamente, el tamaño requerido de la muestra
sería S2/V. El efecto de no conocer S es incrementar el tamaño pro
El ejemplo del vivero no es típico en cuanto a que la varianza
medio por un factor (1 + 2 /nx).
de población S2 se conocía. En la práctica, hay cuatro caminos para
112 TE C N IC A S DE M U E S TR E O L A E S T IM A C IO N D EL T A M A Ñ O DE L A M U E S TR A 113
Estimación de P con Varianza V conglomerados de unidades. Así, el valor s2 calculado, mide prin
Sea P i la estimación de P a partir de la primera muestra. El ta cipalmente la variación dentro de un conglomerado y puede ser una
maño combinado de las dos primeras muestras debería ser subestimación del valor pertinente S2. La relación entre las varia
ciones intra e interconglomerados se discutirá en el Cap. 9. El mis
mo problema surge en el muestreo por conglomerados para pro
V ."¡i, Vn¡ porciones, en donde la fórmula pq/n puede subestimar el efecto de
El primer término de la derecha es el tamaño requerido si se sabe la variación entre conglomerados. Cornfield (1 95 1) ilustra ade
que P es igual a p,. Con este método, la estimación binomial ordi cuadamente la estimación del tamaño de la muestra en muestreo
naria p hecha a partir de la muestra completa, de tamaño n, es li por conglomerados para proporciones.
geramente sesgada. Para corregir el sesgo, tómese El tercer método — uso de los resultados de encuestas previas — ,
p V 0 -2 p ) señala el valor que tiene el poner a disposición, o al menos mante
ner accesible, cualquier dato sobre la desviaciones estándar obte
PQ
nidas en encuestas previas. Infortunadamente, el costo de computa
ción de las desviaciones estándar en encuestas complejas es elevado,
Estimación de P con cv = V C dado
aun con máquinas electrónicas, y es frecuente que sólo aquellas
Tómese desviaciones estándar requeridas para dar una vaga idea de la pre
cisión de las estimaciones principales, se computen y registren. Si
n = y r -+ — +77— (4.9) se encuentran datos anteriores apropiados, el valor de S2 puede re
t-Pi p ¡<Ji Cpiti\
A querir un ajuste, para actualizarlo. Con datos asimétricos en los
La estimación es P = p — Cp/q. En todos los resultados anteriores
que Y cambia con el tiempo, frecuentemente se encuentra que S2
se ignora la cpf.
varía de acuerdo a una razón comprendida entre kY y kY2 donde
Ejemplo. Un muestreador desea estimar P con un coeficiente de varia
ción de 0.1 (1 0 % ) y conjetura que P se encontrará entre 5 y 20% . Este in k es una constante. Por lo tanto, si se cree que Y ha aumentado en
tervalo es demasiado amplio para dar una buena estimación inicial del n 10% en el intervalo de tiempo transcurrido desde la encuesta pre
requerido. Como el cv de P es V Q / n P , fácilm ente se verifica que n — 400 via, podríamos incrementar nuestra estimación inicial de S2 entre
es adecuado para P ■= 20% , pero n = 1900 se requerirá si P es sólo 5% . un 10 y un 20 % .
De acuerdo con esto, el muestreador toma una muestra inicial con w, Por último, en ocasiones es posible hacer una estimación útil de
396 y encuentra p, — 0.101. Dado que V c= 0.1, C = 0.01. La Ele. 4.9 con S2 a partir de una información relativamente escasa respecto a la
duce a
naturaleza de la población. En estudios previos sobre el número de
(0.899) 3 1 gusanos en suelos, se utilizó un instrumento para tomar una mues
" (0.01)(0 .101) + (0.0908)+ (0.01 )<40) tra de ( 9 X 9 X 5 p lg) de la capa superficial. Para estimar n, el
La muestra combinada da np = 88; p = 88/926 = 0.0950. La corrección por muestreador necesitaba conocer la desviación estándar del número
sesgo, Cp/q, viene a ser 0.0011, lo que da una estimación fin al de 0.094 o de gusanos encontrados en una extracción con ayuda del instrumen
9.4%. to. Si los gusanos se distribuyeran al azar en la capa superficial, el
En el segundo método, una pequeña encuesta piloto sirve para número encontrado en un pequeño volumen se apegaría a una dis
varios tiñes, especialmente si se duda de la posibilidad de la encues tribución de Poisson para la cual S2 = Y. Como los gusanos pueden
ta principal. Si la encuesta piloto es en sí una encuesta aleatoria
tender a congregarse se decidió suponer S2 - 1.27, donde el factor
simple, se aplican los métodos precedentes. Pero con frecuencia,
1.2 es un factor arbitrario de seguridad. Aunque se desconocía Y,
el trabajo piloto se limita a una parte de la población que se puede
manejar convenientemente, o que revelará la magnitud de ciertos sus valores de importancia económica respecto al daño en la cose
problemas. Se debe tener en cuenta la opción selectiva de la encues cha se pudieron delinear. Estas dos informaciones hicieron posible
ta piloto al usar sus resultados para estimar S2 o P. Por ejemplo, la determinación de los tamaños de muestra que resultaron satis
es una práctica común la de confinar el trabajo piloto a algunos factorios.
LA E S T IM A C IO N DEL T A M A Ñ O D E L A M U E S T R A 11 5
Deming ( 1 9 6 0 ) muestra cómo algunas distribuciones matemá puede no deberse exclusivamente al tamaño de la muestra. Algunas
ticas simples son útiles en la estimación de S2, a partir de cierto características requerirán tipos diferentes de muestreo en compa
conocimiento del intervalo donde se encuentre y de una idea general ración con otras. Con poblaciones que se muestran repetidamente
de la forma de la distribución. Si la distribución es como una bino es útil reunir información respecto a las características que se pue
mial, con una proporción p de las observaciones en un extremo den combinar económicamente en una encuesta general y las que
del intervalo y una proporción q en el otro, S= = pqhr donde h es la requieren métodos especiales. Como ejemplo, en la Tabla 4.1 pre
longitud del intervalo cubierto por la distribución. Cuando p — q = sentamos una clasificación de características en 4 tipos, sugerida
!4 el valor de S- - 0.25h* es el máximo posible para una longitud h por la experiencia en encuestas agrícolas regionales. En esta cla
dada. Otras relaciones útiles son S* = 0.083h- para una distribución sificación, una encuesta general quiere decir una en Ja cual las uni
rectangular, S2 = 0.056b2 para una distribución que tiene forma de dades están más o menos uniformemente distribuidas en alguna
triángulo rectángulo y S! = 0.042h- para un triángulo isósceles. región, como sucede, por ejemplo con una muestra aleatoria simple.
Estas relaciones no son de mucha ayuda si h es grande o poco
conocida. Sin embargo, si h es grande, es conveniente estratificar T A B L A 4.1. Un E j e m p l o de T ip o s D if e r e n t e s de C a r a c t e r ís t ic a s en
la población (Cap. 5 ) de'm odo que dentro de un estrato, el inter E ncuestas R e g io n a l e s

valo se reduzca considerablemente. Es usual que dentro de un es T ip o Descripción de las Características Tipo de Muestreo Requerido
trato, la forma también se simplifique (más cercana a rectangular).
En consecuencia, estas relaciones son efectivas en la predicción de
1 Bien distribuido a través de la región Una encuesta general con baja
S-, y , por lo tanto de n, dentro de estratos individuales. y ocurriendo con frecuencia razonable razón de muestreo.
en todas partes.
2 Bien distribuida a través de la región Una encuesta general, pero con
4.8 T A M A Ñ O D E L A M U E S T R A CO N M AS pero con baja frecuencia. una razón de muestreo más ele
D E U N A C A R A C T E R IS T IC A vada.
3 Ocurre con una frecuencia razonable Para obtener mejores resultados
En la mayoría de las encuestas se recoge información sobre en la mayoría de las partes de la re se hace una muestra estratifi
gión, pero con una distribución más cada con diferentes intensida
más de una característica. Un método para determinar el tamaño de
esporádica, estando ausente en algunas des. en partes diferentes de la
la muestra es la especificación de los márgenes de error para las partes y altamente concentrada en región (Cap. 5 ). Puede a veces
características que se consideran vitales en la encuesta. Una esti otras. incluirse en una encuesta ge
mación inicial del tamaño requerido de la muestra se hace sepa neral con muestreo suplemen
radamente para cada una de estas características importantes. tario.
4 Distribución muy esporádica o concen N o adecuada para una encuesta
Al completar la estimación de n para cada característica, se
trada en una pequeña parte de la general. Requiere una muestra
concreta la situación. Puede ser que los n requeridos estén bastante región. especialmente construida para
próximos. Si el valor más grande de n está dentro de los límites su distribución.
del presupuesto, se'tom a este valor. Pero con frecuencia, hay su
ficiente variación entre los n y, por lo tanto, no se selecciona el
más grande, ya sea por consideraciones presupuéstales o porque
este valor dará una precisión global sustancialmente más elevada 4.9 T A M A Ñ O DE L A M UESTRA C U A N D O LA S
que la considerada en un principio. En este caso, el estándar de E S T IM A C IO N E S SE Q U IE R E N P A R A S U B D IV ISIO N E S
precisión deseado puede relajarse un poco para algunas caracterís D E L A P O B L A C IO N
ticas, lo que permite utilizar un valor más pequeño de n.
Se planea a menudo para presentar estimaciones no sólo de la
Hay casos en que los n requeridos, para diferentes características,
población como un todo, sino también para ciertas subdivisiones.
son tan discordantes que algunos se deben abandonar en la in
Si éstas pueden identificarse por adelantado, como es el caso de las
vestigación; con los recursos disponibles, la precisión esperada pa
regiones geográficas se hace un cálculo separado de n para cada
ra estas características es totalmente inadecuada. La dificultad
región. Supóngase que la media de cada subdivisión se debe esti
L A E S T IM A C IO N D EL T A M A Ñ O DE L A M U E S T R A 117
mar con una varianza específica V. Para la z-ésima subdivisión, para cada par de subdivisiones (dominios). En este caso
tenemos n, = S */V, por lo tanto, el tamaño de la muestra total
( 4 .1 3 )
n - £ S ¡7 V . Las S¡2 individuales serán en promedio más pequeñas U V \ir, 77; /
que S2, la varianza de la población, pero a menudo sólo un poco
Si las S¡2 no son muy diferentes de S‘, n será 2kS2/V 'cuando los
más pequeñas. De modo que si existen k subdivisiones, n = feSVV,
k dominios son del mismo tamaño, y aún mayores en el otro caso.
en tanto que si sólo se desea obtener la estimación para la pobla
El efecto de los términos de cpf, despreciados en esta discusión,
ción como un todo, se toma n = S"/V.
es la reducción en cierta medida de los n requeridos.
Por lo tanto, si queremos estimaciones con varianza V para ca
da una de las k subdivisiones, el tamaño de la muestra puede apro
ximarse a k veces el n necesario para una estimación global de la 4.10 E L T A M A Ñ O D E L A M U E S T R A EN
misma precisión. E-ste aspecto tiende a ignorarse en los cálculos P R O B L E M A S D E D E C ISIO N
del tamaño de la muestra, y le ocurre especialmente a las personas
sin experiencia en métodos de encuesta. En ocasiones, puede desarrollarse un enfoque más lógico para
determinar el tamaño de la muestra, cuando se va a tomar una de
Si las subdivisiones representan clasificaciones por variables tales
cisión práctica, basada en los resultados de la muestra. Se puede
como la edad, el sexo, el ingreso, los años de educación, etc., la
presuponer que la decisión estará más sólidamente fundamentada,
subdivisión a la que una persona pertenece no se conoce sino hasta
si la estimación muestral tiene un error, pequeño, en lugar de uno
después de haber tomado la muestra. Incluso se pueden hacer esti
elevado. Podemos calcular en términos monetarios la pérdida l ( z )
maciones anticipadas del tamaño de la muestra, si se conocen las
que ocurrirá al tomar una decisión que presente un error correspon
proporciones tt¡ de las unidades que pertenecen a las diferentes sub
diente de z en la estimación. Aunque el valor real de z no se puede
divisiones. Si se selecciona una muestra aleatoria simple de tama
predecir de antemano, la teoría del muestreo nos permite encontrar
ño n, el tamaño esperado de la muestra a partir de la i-ésima sub
la distribución de frecuencia f ( z , n ) de z, que para un método de
división es riTTi. La varianza promedio de la media a partir de esta
muestreo específico, dependerá del tamaño de la muestra n. Por lo
subdivisión es
tanto, la pérdida esperada para un tamaño de muestra dado es
V(yt) = E ¡ f - (4.10)
\n¡ 1 rnr¡ I ( n ) = | / (z)/ (z, 7i)d z (4.14)
si 7i 7ri es grande. Por lo tanto, requerimos ti = SiYn-jV para hacer
El propósito de tomar la muestra es disminuir esta pérdida. Si
V (y.) = V. Si esto es válido para cada subdivisión, C ( n ) es el costo de una muestra de tamaño n es razonable elegir
7? para minimizar.
C (n )+ L (n ) (4.15)
Si las subdivisiones están hechas en clases como la edad o el ingre puesto que éste es el costo total involucrado al tomar la muestra y
so, Si-/v( puede ser menor que S2 para las clases centrales, pero pue las decisiones a partir de sus resultados. La elección de n deter
de ser grande para una clase extrema con v¡ pequeña. En este ca mina tanto el tamaño óptimo de la muestra, como el grado de pre
so, tendremos que incrementar el valor de V en esta subdivisión, o cisión más ventajoso.
bien, encontrar alguna manera de identificar de antemano unidades Alternativamente puede presentarse el mismo enfoque en tér
en esta subdivisión para que se puedan muestrear a una mayor tasa. minos de la ganancia monetaria que ocurre al tener la información
En ocasiones, el método del muestreo doble (Cap. 12) es útil para muestral en lugar dela pérdida derivadade los errores en dicha
este propósito. información. Si se usala ganancia monetaria, construimosuna ga
Las exigencias en el tamaño de la muestra son aún mayores en nancia esperada G (n ) a partir de un tamaño de muestra n, donde
estudios analíticos, donde las especificaciones son G ( 77) es cero si no se toma muestra alguna. Maximizamos
Y (y t - y , ) ^ V (4.12) G (n )- C ( n )
118 TE C N IC A S DE M U E S TR E O LA E S T IM A C IO N D E L T A M A Ñ O DE LA M U E S TR A 119
En esta forma, el principio es equivalente a la regla de la economía como cuantitativos. Se puede ver una relación bastante completa
clásica de la maximización de la utilidad. del método en el trabajo de R aiffa y Schlaifer (1961). Aunque to
La aplicación más simple se presenta cuando la función pérdida davía no es evidente la frecuencia con que podrán llevarse a una
Z(z), es Az5, donde A es una constante. Lo que da como resultado solución completa los problemas de decisión con ayuda de este mé
que todo, puede afirmarse que es valioso ya que estimula las reflexiones
respecto a los factores importantes de una buena decisión. Una área
L (n ) = X E (z2) (4.16) que parece adaptarse convenientemente a las aplicaciones es la del
* — — —
Por ejemplo, si Y es la estimación muestralde Y, y z = Y — Y, muestreo de los lotes de artículos en un proceso de producción en
masa, para decidir si se acepta o se rechaza el lote con base en su
L (n ) = \ V ( ? ) = — ~ (4.17) calidad estimada. Sittig {1 951) considera la economía de la deter
n N
minación del tamaño de muestra, al tomar en cuenta costos de
si se usa muestreo aleatorio simple. inspección y de aceptación de artículos defectuosos, así como costos
El tipo más simple de función costo para la muestra es ligados a la existencia de artículos reglamentarios en lotes recha
zados.
C(rt) = c0+ c l n (4.18)
donde c, es el costo fijo. Al derivar, el valor de n que minimiza costo 4.11 E L EFECTO D E L D ISE Ñ O (D eff)
más pérdida es
Con los planes de muestreo más complejos que se describen pos
n = V Á 5 I /c¡‘ (4.19)
teriormente, una cantidad útil es el llamado efecto del diseño ( def f )
Yates (1 9 6 0 ) da una form a más general de este resultado. El mis del plan de muestreo (Kish, 1965). Este autor describe dicha can
mo análisis se aplica a cualquier método de muestreo y de esti tidad como la razón de la varianza de la estimación obtenida a partir
mación en el que la varianza de la estimación es inversamente de la muestra más compleja a la varianza de la estimación obteni
proporcional a n y el costo es una función lineal de n.
da a partir de una muestra aleatoria simple del mismo número de
Blythe (1 94 5) describe la aplicación de este principio a la esti unidades. El efecto del diseño tiene dos usos primordiales — en la
mación del volumen de madera en un lote con fines de venta (ver estimación del tamaño de muestra y en la apreciación de la efi
Ejercicio 4.11). Nordin (1 9 4 4 ) discute el tamaño óptimo de la
ciencia de planes más complejos— . Por ejemplo, al estimar la pro
muestra para estimar las ventas potenciales de un mercado al que
porción de personas que presentan cierto atributo, a menudo es
desea entrar un fabricante. Si las ventas pueden pronosticarse exac
conveniente usar la casa en vez de la persona, como unidad de mues
tamente, la cantidad de equipo fijo y de producción por unidad de
treo. Como se notó en el Cap. 3, la fórmula PQ/n no se puede usar en
tiempo se podrá asignar de tal manera que maximice la utilidad
estos planes. Para estimar la proporción de los que han visto a un
esperada por el fabricante. Grundy y otros (1954-1956) consideran
médico (Sec. 3.12) una muestra aleatoria simple de casas, dio
el tamaño óptimo de una segunda muestra, cuando se conocen los
v ( p ) = 0.00520 contra pq jn -= 0.00197 para una muestra aleatoria
resultados de una muestra inicial.
simple del mismo tamaño constituida por personas. Una estimación
Este enfoque ha sido desarrollado sustancialmeníe en trabajos
del deff para esta muestra por conglomerados y esta variable es
sobre la teoría de decisión estadística. Las generalizaciones inclu
520/197 - 2.6. Cuando las fracciones de muestreo son pequeñas,
yen la sustitución de la utilidad por el valor monetario como una
escala en la que se miden costos o pérdidas, el uso explícito de in podemos, por lo tanto, estimar el tamaño de la muestra al calcular el
formación anterior subjetiva respecto a parámetros desconocidos, n (número de personas) requerido con una muestra aleatoria sim
al expresar esta información como distribuciones de probabilidad a ple de personas y multiplicar por 2.6. Al observar las razones deff
priori de los parámetros desconocidos, y la investigación de diferentes de esta manera para las variantes importantes con un plan comple
tipos de funciones de costo y pérdida, y de datos tanto cualitativos jo, podemos usar las fórmulas simples de este capítulo para estimar el
120 TE C N IC A S DE M U ESTRE O L A E S T IM A C IO N D EL T A M A Ñ O DE L A M U E S T R A 121
tamaño de la muestra con el plan complejo y también juzgar si Coeficiente de

dicho plan es ventajoso en eficiencia, en relación a su costo y com variación estimado
Característica (% )
plejidad.
Para estimar el deff a partir de los resultados de una muestra
compleja, se requiere algo de álgebra. Necesitamos mostrar en qué Acres en predios agrícolas 38
Acres de maíz 39
forma estos resultados proporcionan, de ser posible, estimaciones
Acres de avena 44
insesgadas de S2 o de PQ. Se dan ejemplos de estos cálculos para Número de trabajadores de la fam ilia 100
muestreo aleatorio estratificado en la Sec. 5A.11 y para muestreo Núm ero de trabajadores contratados 110
por conglomerados en la Sec. 9.3, cuando los conglomerados son del Número de desempleados 317
mismo tamaño.
Se planea una encuesta para estimar características de área con un coefi

E J E R C I C I O S ciente de variación de 2.5% y número de trabajadores (excluyendo a los
desempleados) con un coeficiente de variación del 5 % . Con una muestra
4.1. En un distrito en donde hay 4 000 casas, el porcentaje de propietarios aleatoria simple, ¿cuántas unidades se necesitan? ¿Qué tan bien se supone
que esta muestra estime e l número de desempleados?
va a ser estimado con una muestra no m ayor al 2% y el porcentaje de pro
4.6. Por muestreo experimental, el valor medio de una variable aleatoria
pietarios de 2 autos con una de no mayor al 1 % . (L as cifras 2 y 1% son los
se va a estimar con una varianza V = 0.0005. Los valores de la variable
valores absolutos, y no los c v .) E l porcentaje verdadero de propietarios se
aleatoria para las primeras 20 muestras se proporcionan a continuación. ¿Cuán
piensa que está entre 45 y 65% y el porcentaje de propietarios de dos autos
tas muestras adicionales se necesitan?
entre 5 y 10% . ¿Qué tan grande debe ser una muestra para satisfacer las
dos finalidades? N c. de Valor de la varia No. de ValOT de la varia
4.2. En la población de 676 hojas de solicitud (T ab la 2.2 Pág. 53 ) ¿qué muestra ble aleatoria muestra ble aleatoria
tan grande debe ser la muestra si se va a estimar el número total de firmas
con un margen de error de 1 000 con probabilidad de 95% ? Suponga que e l 1 0.0725 11 0.0712
valor de s ¡ dado en la Pág. 5 3 es el valor de S2 en la población. 2 0.0755 12 0.0748
4.3. Se va a realizar una encuesta para determinar la existencia de en 3 0.0759 13 0.0878
fermedades comunes en una población grande. Para cualquier enfermedad que 4 0.0739 14 0.0710
afecte cuando menos al 1% de los individuos en la población, se desea es 5 0.0732 15 0.0754
timar el número total de casos, con un coeficiente de variación de no más 6 0.0843 16 0.0712
del 20% . ( a ) ¿Qué tamaño de muestra aleatoria simple es necesario al su 7 0.0727 17 0.0757
poner que la presencia de la enfermedad puede ser reconocida sin equivo 8 0.0769 18 0.0737
cación? ( b ) ¿Qué tamaño de muestra se necesita si 6e desea obtener el nú 9 0.0730 19 0.0704
m ero total de casos separadamente para hombres y mujeres, con la misma 10 0.0727 20 0.0723
precisión?
4.4. En un muestreo de insectos se va a estimar e! número de gusanos
por acre con un lím ite de error del 30% al nivel de probabilidad del 95% , 4.7. Se diseña una encuesta fam iliar para estimar la proporción de
en cualquier campo en donde la cantidad de gusanos exceda a 200 000 por fam ilias que poseen ciertos atributos. Para las principales características de
acre en la capa superior de 5 p lg del suelo. La barrena para muestrear interés, el valor de P se espera que oscile entre el 30 y el 70% . Con una
mide 9 X 9 X 5 p lg de alto. Suponiendo que el número de gusanos en un.- muestra aleatoria simple, ¿qué tan grande debe ser el valor de n para es
muestra sigue una distribución ligeramente más variable que la de Poisson, timar los siguientes promedios con un error estándar que no exceda de 3% ?
( a ) la m edia P global. ( b ) las medias individuales P t para las clases de in
tomamos S- = 1.2Y. ¿Qué tamaño de muestra aleatoria simple es necesaria?
gresos — menores de $5 000, $5 000 a $10 000; mayores a $10 000. ( i = 1, 2,
(U n acre = 43 560 pies2.)
3 )— . ( c ) las diferencias entre medias (P ¡ — P ¡ ) para cada una de las pare
4.5. Los siguientes coeficientes de variación se obtuvieron en una en jas de clases en ( b ). Dar una respuesta separada para (ct), ( b ) y ( c ) . Las es
cuesta de predios agrícolas en Iowa, la unidad fue u n i área de una m illa cua tadísticas de ingresos indican que las proporciones de fam ilias con ingresos
drada (inform ación de R. J. Jessen): en las tres clases anteriores son 50, 38 y 12%.
122 TE C N IC A S DE M U ESTRE O L A E S T IM A C IO N D E L T A M A Ñ O DE L A M U E S TR A 123
4.8. Los colegios con programas de estudio de cuatro años, en los Es ( h ) Suponga que en ( a ) el diente opina que las características están po
tados Unidos se dividieron en clases de 4 tamaños diferentes de acuerdo con sitivamente correlacionadas, pero no conoce la correlación, si se sugiere
sus inscripciones de 1952-1953. Las desviaciones estándar dentro de cada una muestra inicial de 200, con los siguientes resultados.
clase se muestran a continuación.
Características
Clase 1 2 Número de unidades
1 2 3 4 Sí Sí 72
Sí No 44
Número de estudiantes <1000 1000-3000 3000-10 000 más de 10 000 No Sí 14
S, 236 625 2008 10 023 No No 70
200
Si conoce los limites de clase pero no los valores de S¡, ¿qué tan bien
puede estimar los valores de los S¡ usando cifras matemáticas simples (Sec. ¿Qué tamaño de muestra se recomienda para estimar (P . — P2) con un
4.7)? Ningún colegio tiene menos de 200 estudiantes y el más grande tiene error estándar < 2 % ?
cerca de 50 000 estudiantes. 4.13. ( a ) Suponga que se está estimando la razón de sexos, que es cer
4.9. Con una función cuadrática de pérdida y una función lineal de cos cana a la unidad, y que se pueden muestrear domicilios donde viven 4
tos como en la Sec. 4.10, Sa se reduce a S'! mediante un plan de muestreo personas, padre, madre y dos hijos. Al ignorar la pequeña proporción de fa m i
lias con gemelos idénticos, encontrar e l factor deff para una muestra alea
más eficiente, c0, c, y X permanecen sin cambio. Si n', V ' denotan un nuevo
toria simple de re casas contra una muestra de las 4n personas, ( b ) Las fa
tamaño óptimo de muestra y V (Y ), demostrar que n ' <; n y que V' < V. milias donde hubiese gemelos idénticos, ¿ elevarían o redudrían el factor deff?
4.10. Si la función de pérdida debida a un error en y es \ ¡y — Y| y
si el costo C = c„ + c,n, demuestre que con un muestreo aleatorio simple,
ignorando la cpf, e l valor más económico de n es
t í= T
4.11. (Adaptado de Blythe, 1945.) El precio de venta de un lote de
madera en pie es LTW, en donde U es el precio por unidad de volumen y
W es el volumen de la madera en e l lote. Se cuenta el número N de tron
cos en el lote, y mediante una muestra aleatoria simple de n troncos, se
estima el volumen promedio por tronco. Se hace una estimación pagada por
el vendedor y ésta es provisionalmente aceptada por el comprador. Después,, el
comprador determina el volumen exacto comprado, y el vendedor le reembol
sa, en caso de que el comprador haya pagado más de lo que le fue entregado.
Si el comprador ha pagado menos de lo recibido, no menciona e l hecho.
Construya la función de pérdida del vendedor, A l suponer que e l costo
de la medición de n troncos es en, encuentre e l valor óptimo de n. La des
viación estándar del volumen por tronco se puede indicar por S y la cpf se
puede ignorar.
4.12. ( a ) La presencia o la ausencia de dos características se debe medir
en cada unidad de una muestra aleatoria simple de una población grande.
Si P „ P2 son los porcentajes de unidades de la población que tienen las ca
racterísticas 1 y 2, un cliente desea estimar (P , — P 2) con un error estándar
que no exceda dos puntos por ciento. ¿Cuál es el tamaño de la muestra,
que debe sugerirse sí el cliente piensa que tanto P, como P. están entre
el 40 y el 60% , y que las características se distribuyen independientemente
en las unidades?
C A P IT U L O 5
Muestreo Aleatorio Estratificado
5.1 D E S C R IP C IO N
En el muestreo estratificado, la población de N unidades se di

vide primero en subpoblaciones de N „ N a, . . . , N L unidades, respec
tivamente. Estas subpoblaciones, no se traslapan y en su conjunto
comprenden a toda la población, por lo tanto,
n , + n 2+ - ■•+ nl = n
Las subpoblaciones se denominan estrato¿ Para obtener todo el bene

ficio de la estratificación, los valores de los N\ deben ser conocidos.
Una vez determinados los estratos, se extrae una muestra de cada
uno, las extracciones deben hacerse independientemente en los di
ferentes estratos. Los tamaños de muestras dentro de los estratos
se denotan con n.u n*, .. ., n,„ respectivamente.
t
Si se toma una muestra aleatoria simple en cada estrato, el pro
cedimiento total se describe como un muestreo aleatorio estratificado.
La estratificación es una técnica común. Para esto hay muchas
razones; las principales son las siguientes.
l_I.Í Si los datos deseados deben tener una precisión conocida en

algunas subdivisiones de la población, es aconsejable tratar cada
subdivisión como una “población" por derecho propio.
2. Por conveniencia administrativa, puede ser necesario el uso
1 de la estratificación; así, por ejemplo, la agencia que realiza una en
cuesta, podría tener sucursales en el campo, cada una de las cua
les supervisaría la encuesta de una parte de la población.
¡3.' Los problemas de muestreo pueden tener marcadas diferen
cias en diversas partes de la población. Con poblaciones humanas,
las peisonas que viven en instituciones (com o hoteles, hospitales,
M U E S TR E O A LE A TO R IO E S TRATIFIC AD O 127
cárceles) se colocan en un estrato diferente de las que viven en

casas ordinarias, ya que otro método de muestreo es el apropiado I yu
para cada una de estas dos situaciones. A l muestrear negocios, po Yh = media verdadera
dríamos tener una lista de las grandes firmas que se deben colocar Nk
en un estrato diferente. Quizá algún tipo de muestreo por áreas
debe usarse para las firmas más pequeñas. t yu
|4. ,La estratificación puede dar lugar a una ganancia en la yh = —---- media de muestra
nh
precisión de las estimaciones de características de la población to
tal. Quizá sea posible dividir una población heterogénea en subpo-
I (y/u- vi.)2
"blaciones, en las que cada una sea internamente homogénea. Esto es
Sh2= 1-1 ..— varianza verdadera
lo que sugiere .el nombre de estratos, con su implicación de una N „-l
división en capas. Si cada estrato es homogéneo, en cuanto a que
las medidas varíen ligeramente de una unidad a otra, una estimación Nótese que el divisor en la varianza es (N * — 1).
precisa de cualquier media de estrato se puede obtener a partir de
una pequeña muestra en dicho estrato. Y posteriormente podrán com-
5.3 P R O P IE D A D E S D E L A S E ST IM A C IO N E S
binarse estas estimaciones en una estimación precisa para toda la
población. Para la media de población por unidad, la estimación usada en
La teoría del muestreo estratificado se ocupa de las propiedades muestreo estratificado es ytí ( st significa estratificado), donde
de las estimaciones de una muestra estratificaba y de la mejor elec-
ción para los tamaños de muestras'n*,que deben dar la precisión I N „y * L
máxima. En este desarrollo se presupone que ya se construyeron los y , , = ~ ^ ~ = l whñ (5.1)
h-1
estratos. Los problemas de construcción de los estratos y de la de
terminación del número de estratos se verán posteriormente (Sec. donde N - N i + + ■• ■ + N L.
5A.7). La estimación yat en general no es la misma que la media mues
tral. La media muestral y puede escribirse como
L
5.2 N O T A C IO N
I nhyh
f—1 l~1
El subíndice h denota el estrato, e i la unidad dentro del estrato. '■ V <5-2>
La notación es una extensión natural de la usada anteriormente.
Todos los símbolos siguientes se refieren al estrato h. La diferencia es que en y,t las estimaciones a partir de estratos in
dividualesreciben sus ponderaciones correctas N*/N. Es evidente
N, número total de unidades que ycoincide con y „ cuandoen cada estrato
nh N h n„ _ n
nh número de unidades en la muestra
~n = N ° TNTh w
N ° fh = J
y* valor obtenido para la i-ésima unidad Esto significa que la fracción de muestreo es la misma en todos los
estratos. Esta estratificación se describe como estratificación con
ponderación del estrato
*-3 asignación proporcional de los números n h y da lugar a una muestra
autoponderada. Si se hacen numerosas estimaciones, este tipo de
muestra ahorrará tiempo.
fh ~ tt " fracción de muestreo en el estrato Las propiedades principales de la estimación y,t se bosquejan
en los siguientes teoremas. Los dos primeros, se aplican al mués-
128 TE C N IC A S DE M U E S TR E O M U E S TR E O A LE A TO R IO E S TRATIFIC AD O 129
treo estratificado en general y no se restringen al muestreo aleato pendiente en los diferentes estratos, entonces y3t es una estimación
rio estratificado; es decir, que la muestra en un estrato cualquiera insesgada de Y con varianza IW V 'V (y *).
no es necesariamente una muestra aleatoria simple. Lo importante con respecto a este resultado es que la varianza de
y,t sólo depende de las varianzas de las estimaciones de las medias Y*
Teorema 5.1. Si en cada estrato la estimación muestral es in de los estratos individuales. Si fuese posible dividir una población
sesgada, entonces y,t es una estimación insesgada de la media de altamente variable en estratos de un modo tal que todos los atributos
población Y. tuviesen el mismo valor dentro de un estrato, podríamos estimar Y
sin error alguno. La Ec. 5.4 muestra que el uso de las ponderacio
Prueba. nes de estratos correctos N h/N al hacer la estimación y „ es el que
conduce a este resultado.
E(yu) = E Í Whyh = £ WhY„
ft-i (i-i Teorema 5.3. Para el muestreo aleatorio estratificado, la varian
puesto que las estimaciones son insesgadas en los estratos individua za de la estimación y,t es
les. Pero la media de población Y puede escribirse
L N» L
• V U . ) - ¿ I Nh(Nh - n h) ^ - = Í Wh2— ( l - f h ) (5.6)
r» (i-i nh (.-i nh
I I yu I N,,Yh
y _ (. —M—1 —(i -1_______ yw y Prueba. Puesto que yh es una estimación insesgada de Y* pue
Y N ~ N hYh de aplicarse el Teorema 5.2. Además, por el Teorema 2.2, aplicado
lo que completa la demostración. a un estrato individual
Teorema 5.2. Si las muestras se extraen independientemente en

los diferentes estratos, nh Nh
Por sustitución en el resultado del Teorema 5.2, obtenemos
V/(y „ )= I W„2V(yh) (5.3)
(i-i
I r f V W - X i N h (N h- n h) ^ = l W h 2^ ( l - f h)
N h-¡ N h-i nh nh
donde V (jf*) es la varianza de yh sobre muestras repetidas del estra
to h. En los siguientes corolarios se dan algunos casos particulares de
esta fórmula.
Prueba. Dado que
Corolario 1. Si las fracciones de muestreo n*/N» son despre
> „ = I Whyh (5.4) ciables en todos los estratos,
h- 1
V{v- ) = J _ v ^ V = y i ^
yít es una función lineal de loo yh con ponderaciones fijas W*. Por lo N nh 1 nh (5 J)
tanto, podemos citar el resultado en estadísticas para la varianza
de una función lineal. Esta es la fórmula apropiada cuando las correcciones por población
finita se pueden ignorar.
V(y„) = I Wh V(yh) + 2 1 1 W„W< Cov (yhyj) (5.5) Corolario 2. Con asignación proporcional, sustituimos
íi-l »l-l ¡>h
nNh
Pero como las muestras se extraen independientemente en los dife
nk=~ Ñ
rentesestratos, se anulan todos los términos de covaxianza. Esto
da el resultado (5 .3 ). en (5 .6 ). La varianza se reduce a
Para resumir los Teoremas 5.1 y 5.2: si y* es una estimación
insesgada de Y» en cada estrato, y la selección de muestras es inde
130 TE C N IC A S DE M U E S TR E O M U E S TR E O A LE A TO R IO E STRATIFIC AD O 131
Corolario 3. Si el muestreo es proporcional y las varianzas en tenidos tomando entre la 5a. y la 68a. ciudades de los Estados Unidos del total
ordenado respecto al número total de habitantes en 1920. Las ciudades se co
todos los estratos tienen el mismo valor, Su,2, obtenemos el siguiente
locaron en dos estratos, el primero contiene las 16 ciudades más grandes y el
resultado segundo las 48 restantes.
El número total de habitantes del total de 64 ciudades en 1930 se va a
estimar de una muestra de tamaño 24. Encontrar el error estándar del error
<s « estimado por: ( 1 ) una muestra aleatoria simple, ( 2 ) una muestra aleatoria
Teorema 5.4. Si Y,¡ = N y „ es la estimación del total de la po estratificada con asignación proporcional, ( 3 ) una muestra aleatoria estratifi
blación Y, entonces cada con 12 unidades obtenidas de cada estrato.
Esta población se asemeja a las poblaciones de muchos tipos de nego
cios en que algunas unidades — las ciudades grandes— contribuyen sustan
V t f u ) = 2 K ( N h- n h)^ ~ (5.10) cialmente al total y presentan una variabilidad mucho mayor que las restantes.
Los totales por estrato y las sumas de cuadrados se muestran abajo de la
Lo anterior es inmediato, considerando el Teorema 5.3. Tabla 5.1. En este ejemplo sólo se utiliza la información de 1930: la in for
Ejemplo. La Tabla 5.1 muestra e l número de habitantes en 1920 y 1930, mación de 1920 aparece en un ejemplo posterior.
en miles, en 64 grandes ciudades de los Estados Unidos. Los datos fueron ob- Para la población completa en 1930, encontramos
T A B LA 5 .1 . T a m a ñ o s d e 6 4 C iu d a d e s (e n M ile s ) e n 1920 y 1930 y = 19 568 S2= 52 448
Tamaño en Tam año en Las tres estimaciones de Y se representan por Y „ „ , Yprgp, y Y ¡gutl.
1920 (* H ) 1930 (jfc j) 1. Con muestreo aleatorio simple
Estrato Estrato . 5 594 453

h = 1 2 n N 24 '64/
1 2
797 314 172 121 900 364 209 113 del Teorem a 2.2, Corolario 2. E l error estándar es
773 298 172 120 822 317 183 115 < r ( £ j = 2365
748 296 163 119 781 328 163 123
734 258' 162 118 805 302 253 154 2. Las varianzas para los estratos individuales son
588 256 161 118 670 288 232 140
S t2= 53 843, S22= 5581
577- 243 159 116 1238 291 260 119
507 238 153 116 573 253 201 130 Nótese que el estrato con las ciudades más grandes tiene una varianza apro
507 237 144 113 634 291 147 127 ximadamente 10 veces mayor que la del otro estrato.
457 235 138 113 578 303 292 100 Con asignación proporcional, tenemos n ¡ — 6, n , = 18. De la Ec. (5 .7 )
438 235, 138 110 487 272 164 107 multiplicando por N~, tenemos
415 216 138 110 442 284 143 114
401 208 138 108 451 255 169 111
387 201 136 106 459 270 139 163
381 192 132 104 464 214 170 116 = ! t [(16)(S3 843) + (48)(5581)]= 1 882 293
324 180 130 101 400 195 150 122
< 7 (^ 1 = 1 3 7 2
315 179 126 100 366 260 143 134
3. Para n , — = 12 utilizamos la fórmula general (5 .9 ):
Nota: Las ciudades están clasificadas en e l mismo orden en ambos años.
Totales y sumas de cuadrados

1920 1930
(I6 )(4 )(5 3 843) (48)(36)(5581)
Estrato - - 4- - - 1 090 827
2 (*»,) 2 (**<*) 2 (y sí ) 2 0b»*)
1 8 349 4 756 619 10 070 7 145 450 *■( * ;,„ ,)= 1044
2 7 941 1 474 871 9 498 2 141 720
132 TE C N IC A S DE M U ESTRE O M U E S TR E O A LEA TO RIO E S TR A T IF IC A D O 133
En este ejemplo las muestras de igual tamaño en ambos estratos son más cación estricta de este método. El siguiente es un método aproxi
precisas que la asignación proporcional. Ambas son superiores al muestreo mado de asignación de un número efectivo de grados de libertad a
aleatorio simple.
s (y aí) (Satterthwaite, 1946).
Podemos escribir
5.4 L A V A R I A N Z A E S T IM A D A Y LIM ITES 2/- \ 1 £ r2 . , Nfc(yvh-iz„)
D E C O N F IA N Z A S (y«) = 772 I ShSh , donde g* -------------
N h-\ nh
Si se toma una muestra aleatoria simple dentro de cada estrato, E! número efectivo de grados de libertad ne es
una estimación insesgada de S*5 (d el Teorema 2.4) es
1
n,
M a
-------- 3— 4- (5.16)
v = - — 7 l ( y M- y k )2 (5.11)
nh~ 1 .-i
L nh - 1
Por lo tanto, obtenemos el siguiente.
El valor de n e siempre está entre el más pequeño de los valores
Teorema 5.5. Con muestreo aleatorio estratificado, una estima
( 71» — 1 ) y su suma. La aproximación toma en cuenta el hecho de
ción insesgada de la varianza de y.t es que Sh* puede variar de un estrato al otro y supone que y¡,¡ sea nor
mal, pues depende del resultado de que la varianza de s„2 sea 2<^4/
» ( 7 J - « * ( f c » ) - ¿ l N h(N h - n h) — (5.12) (72,, — 1). Si la distribución de y*; tiene una curtosis positiva, la va
H h -t nh
rianza de Si,- será mayor que esto y la Fórmula 5.16 sobreestima los
Una forma alternativa para propósitos de cálculo es grados efectivos de libertad.
¿ JS& L | «£ ! (5 . 13 )
h- i nh i N
5.5 L A A S IG N A C IO N O P T IM A
El segundo término del lado derecho de la expresión anterior repre
senta la reducción debida a la cpf. En el muestreo estratificado, los valores de los tamaños de mues
Para calcular esta estimación, debe haber cuando menos dos tras n* en los respectivos estratos, los elige quien hace el muestreo.
unidades provenientes de todos y cada uno de los estratos. La esti Se pueden seleccionar para minimizar V ( y 3t) para un costo especí
mación de la varianza cuando la estratificación se lleva al punto en fico de tomar la muestra, o bien, para minimizar el costo para un
el cual sólo se escoge una unidad por estrato, se discute en la Sec. valor específico de V ( y „ ) .
5A.12. La función de costo más simple es de la forma
Las fórmulas para los limites de confianza son:
costo = C = c0+ £ <vyi (5.17)
Media de la población: y„ ± ts{y„) (5.14)
Total de la población: Ny„±tNs(y„) (5.15) Dentro de cualquier estrato, el costo es proporcional al tamaño de
la muestra, pero el costo por unidad c* puede variar entre estratos.
Estas fórmulas suponen que está normalmente distribuida y El término c0 representa un costo fijo.
que s ( y „ ) está bien determinada, de modo que el multiplicador t pue Esta función de costo es apropiada cuando la parte principal del
da encontrarse en las tablas de la distribución normal. costo es la de tomar las medidas en cada unidad. Si los costos de
Si sólo se dan algunos grados de libertad para cada estrato, el viaje entre las unidades son importantes, los estudios empíricos y
procedimiento usual para tomar en cuenta el error de muestreo in matemáticos sugieren que los costos de viaje se representen mejor
herente a una cantidad como s ( y „ ) consiste en leer el valor t en las por medio de la expresión 1th donde th es el costo de viaje por
tablas de la í de Student, en lugar de la tabla normal. La distribución unidad (Beardwood y otros, 1959). Aquí sólo se considera la función
de s(yít ) es en general demasiado compleja, para permitir una apli de costo lineal (5 .1 7).
M U ESTRE O A LE A TO R IO E S TRATIFIC AD O 13 5
Teorema 5.6. En el muestreo aleatorio estratificado, con una Por lo tanto, ninguna elección de los nh puede hacer V'C' menor que
función de costo lineal de la forma (5 .1 7 ), la varianza de la media
estimada y3t es un mínimo para un costo específico C y el costo es
(i
un mínimo para una varianza específica V ( y ,t) donde nh es propor
cional a W;,SWc/,. El valor mínimo ocurre cuando
Prueba. Tenemos
— = T Trir = constante (5.22)
üh
C - c 0+ Z chnh (5.17) como se afirma en el teorema.
a» i
En términos del tamaño total de muestra n* en un estrato, te
L W,2(>,2 r W,2C.2 r W.2C,2 nemos
V = V (y „ ) = 1 - ^ ( 1 - / * ) = I (5.18)
fc-i Hit h -i nh i
n*= WkSJ'G. N&/JZ
Nuestros problemas son ya sea ( 1 ) elegir los nhparaminimizar V
con C especificada, o bien, ( 2 ) elegir los nkparaminimizar C con * L ( V W ^ ) l ( N hS J ^ 7h)
V especificada. Lo que ocurre es que a excepción de los pasos finales, Este teorema da lugar a las siguientes reglas de conducta. En un
estos problemas tienen la misma solución. A l elegir los nh para mi estrato dado, se toma una muestra más grande si
nimizar V con C fija o C con V fija, ambos son equivalentes a mini
mizar el producto, 1. El estrato es más grande.
2. El estrato es más variable internamente.
V 'C = ( v + l ^ ^ y c - c J
3. El muestreo es más barato en el estrato.
Se necesita un paso más para completar la asignación. La Ec.
(5.19) (5 .2 3 ) da el nh en términos de n, pero todavía no conocemos qué
Stuart (1 95 4) observó que (5 .1 9 ) se puede minimizar “limpia valor tiene rt. La solución depende de si la muestra se escoge para
mente” usando la desigualdad de Cauchy-Schwarz. Si ah, h* son dos satisfacer un costo total especificado C o para dar una varianza
conjuntos de L números positivos, esta desigualdad proviene de la especificada V para y„. Si el costo es fijo, se sustituyen los valo
identidad res óptimos de nh en la función de costo (5 .1 7 ) y se resuelven para
ti. Esto da
( i a*2) ( l V ) - ( l ü/A) = 1 1 (a¡b, - a fitf (5.20) „ _ ( C - c 0) I ( N A / v ^ )
' ' ' i i>¡
De (5 .2 0 ) vemos que K A V J .v Q (5‘24)
Si V es fija, se sustituye la nk óptima en la fórmula para V ( y „ ) .
(S ah :) ( l ó fc2) s ( x a A ) ' (5.21) Encontramos
y la igualdad ocurrirá si y solamente si bh/a* es constante para todo ( i WhSh^ ) l WhS j J 7 h

h. En (5 .1 9 ) tómese
n= V + (l/ jV )I w*s„2 (5-25)
WkSh ----
an ~ /— > "h ~ vcknh, ahbh — WhSh~Jch donde W» - N h/N.
V«L
<nh Un caso especial importante surge si Ca = c, esto es, si el costo
La desigualdad (5 .2 1 ) da por unidad es el mismo en todos los estratos. El costo se convierte
en C - c0 4- en y la asignación óptima para un costo fijo se reduce
Wh2S¡2
a la asignación óptima para un tamaño de muestra fijo. El resul
tado de este caso especial es como sigue.
M U E S TR E O ALEA TO RIO ESTRATIFIC AD O 137
donde la asignación óptima es para n fijo, o sea, con nh « N hS,„

Teorema 5.7. En el muestreo aleatorio estratificado la V ( y „ )
se minimiza para un tamaño de muestra total fijo n si Prueba.
Vnn = ( \ - f ) ^ (5.29)
nh=nr é k =ni (5-26)
Esta asignación se llama a veces asignación de Neyman, por Ney-
V „ - ^ l W A ' - l ^ ¿ Z S Í (5.30)
man (1 9 3 4 ) cuya prueba dio prominencia al resultado. Más tarde
se descubrió una prueba anterior de Tschuprow (1923).
[de la Ec. (5 .8 ), Sec. 5.3.]
Una fórmula para la varianza mínima con n fija se obtiene al
sustituir el valor de n en (5 .2 6 ) en la fórmula general para V (y J().
'2
El resultado es V a=- _ _ L & (531)
^ n N C5,31)
[de la Ec. (5 .2 7 ), Sec. 5.5.]
Vmín(y «) = - --- — — ( 5. 27) Tenemos, usando la identidad algebraica estándar para el análisis
de la varianza de una población estratificada
El segundo término de la derecha representa la cpf.
(N -D S *-lZ (y u- f )*
h i
5.6 PR E C IS IO N E S R E L A T IV A S D E L M U E STR E O
A L E A T O R IO E S T R A T IF IC A D O Y D E L = Z I (y* - Y h)2+ 1 N h( ñ - Y)2
h i h
M U E ST R E O A L E A T O R IO S IM P LE
=S - 1)5*2+I Nfc(Y* - f ) 2 (5.32)
Si se usa la estratificación de manera inteligente, casi siempre
da como resultado una varianza más pequeña para la media esti Si los términos 1/N* son despreciables y, por tanto, también lo es
mada o para el total, que la dada por un muestreo aleatorio simple 1/ÍV, (5 .3 2 ) obtenemos
comparable. Sin embargo, no es verdad que cualquier muestreo alea
S2= l WhSk2+ l V ^ ( ñ - Y )2 (5.33)
torio estratificado dé una varianza menor que un muestreo aleato
rio simple. Si los valores de los n, están lejos del óptimo, el mues Por lo tanto
treo estratificado puede tener una varianza más alta. De hecho, aun
la estratificación con asignación óptima para un tamaño de mues V „n = ( l - / ) ^ = ^ I Wh(Y h- Y ) 2 (5.34)
n n n
tra total fijo puede dar una varianza más alta, aunque esto es más
bien una curiosidad académica y no algo que sucede en la práctica. = V ^+— I ^ (ñ - ñ J (5.35)
En esta sección se comparan el muestreo aleatorio simple y el
muestreo aleatorio estratificado con asignación proporcional y ópti por la definición de V¿pl debemos tener Vprov > V^,. Por (5 .3 0 ) y
ma. Esta comparación demuestra cómo se logTa una ganancia (5 .3 1 ) su diferencia es
gracias a la estratificación.
Las varianzas de las medias estimadas se denotan con Vro„, V „ op whs„2-(i u;s*)2]
y Vtpt respectivamente.
Teorema 5.8. Si se ignoran los términos en 1/N,„ relativamente = ^ E ^ ( S (l- 5 ) 2] (5.36)

a la unidad,
donde S = £ WhSh es una media ponderada de las S*.
(5.28)
138 TE C N IC A S DE M U E S TR E O M U E S TR E O A LE A TO R IO E S TR A TIFIC AD O 139
A partir de (5 .3 5 ) y (5 .3 6 ) con los términos en l / N h despre estratificar por los valores de y, no habría traslape entre los estratos
ciables, y la varianza dentro de ellos, sería mucho menor que la varianza glo
bal, particularmente si hay muchos estratos. Esta situación se ilus
% (S „ - S ) 2+ ^ - ~ X Wh(Y h - Y ) 2 (5.37) tra mediante el ejemplo de la Sec. 5.3, Pág. 130. La población con
sistía en los tamaños (números de habitantes) de 64 ciudades en
Para resumir, en la Ec. (5 .3 7 ) hay dos componentes de la dis 1930, estratificadas por tamaños. Aunque sólo había dos estratos
minución en la varianza cuando pasamos del muestreo aleatorio sim la estratificación proporcional reducía la estimación muestral ( Y )
ple a la asignación óptima. La primera componente (término a la ex de 2365 a 1372. Al estratificar con n, = n2 = 12, que es el óptimo en
trema derecha) proviene de la eliminación de las diferencias en la asignación de Neyman, se obtenía una nueva reducción a 1044
tre las medias de estratos, la segunda (término medio a la derecha)
En la práctica desde luego, no podemos estratificar por valores
proviene de la eliminación del efecto de las diferencias entre las
de y. Pero algunas aplicaciones importantes se acercan a esta situa
desviaciones estándar de estratos. La segunda componente represen
ción, y dan lugar a una mejora considerable en la precisión, si se sa
ta la diferencia en varianza entre la asignación óptima y la propor
tisfacen las siguientes condiciones.
cional.
Si los términos en l/N* no son despreciables, el sustituir por S= 1. La población consta de instituciones que varían mucho en
de (5 .3 2 ) se obtiene tamaño.
2. Las principales variables a medir están íntimamente relacio
Vra„ = v u + ; ^ r j j [ I N * ( ñ - Y )2~ Z ( N - N „ ) s h2] (5.38) nadas con los tamaños de las instituciones.
en lugar de (5.35). 3. Se cuenta con una buena medida de tamaño para establecer
Por lo tanto, la estratificación proporcional da una varianza más los estratos.
elevada que el muestreo aleatorio simple si Como ejemplos tenemos los negocios de un tipo específico, por
ejemplo, tiendas de alimentos (en las encuestas que tratan sobre
Z N h( Yh - Y ) * < ± U N - N h)S„2 (5.39) el volumen de los negocios o el número de empleados), escuelas (en
encuestas relacionadas con el número de alumnos), hospitales (e n es
Matemáticamente, esto puede ocurrir. Supóngase que las S*3 son igua
tudios sobre la cantidad de pacientes), y formas de impuestos (pa
les a Sw2de modo que la asignación proporcional es óptima en el sen
ra características altamente correlacionadas con el ingreso suscepti
tido de Neyman. Entonces (5 .3 9 ), viene a ser
ble de impuesto). En los Estados Unidos, las granjas varían mucho
X N , ( ñ - Y ) 2< ( L - l ) 5 w2 en tamaño, al medirlas según su extensión total o su ingreso bruto,
o pero las características comunes, como son la producción de cier
tas cosechas o tipos de ganado, con frecuencia muestran solamen
Z N h( ? „ - Y ) 2 2
<SW (5.40) te una correlación moderada con respecto al tamaño de la granja,
por lo tanto, no se puede ganar mucho al estratificar los tamaños
Los lectores familiarizados con el análisis de la varianza, reconocerán de las granjas.
esta relación, que implica que el cuadro de la media entre estratos Si el tamaño de la institución permanece estable a través del tiem
es más pequeña que dentro de los estratos, es decir, que la razón F po, o al menos en periodos cortos, generalmente, su mejor medida
es menor que 1. práctica es el tamaño de la institución tomado en un censo reciente.
El ejemplo de la Sec. 5.3, ilustra la situación en la que se disponía
5.7 ¿E N Q U E C A S O S P R O D U C E L A E S T R A T IF IC A C IO N de buenos datos previos. La Tabla 5.2 muestra las S,. y los óptimos
C O N S ID E R A B L E S G A N A N C IA S D E P R E C IS IO N ? nÁ <x N*Si, resultantes, cuando la asignación se hace de datos de
1920 y de 1930. respectivamente.
La variable ideal para la estratificación, es el valor de y en sí. Los datos de 1920 indican un n, de 11.56 contra un óptimo “ver
o sea, la cantidad que se va a medir en la encuesta. Si pudiésemos dadero" de 12.21 para los datos de 1930. Se redondea a enteros,
140 TE C N IC A S DE M U ESTRE O M U E S TR E O a l e a t o r io e s t r a t if ic a d o 141
T A B L A 5.2. Cá l c u l o de la A s ig n a c ió n O p t i m a TABLA 5.3. Pr e c is ió n R e l a t iv a de las D if e r e n t e s Cla se s

de E s t r a t if ic a c ió n G e o g r á f ic a e n Po rc en taje
1920 Datos 1930 Datos
Estrato
Estrato N\ Sk NA nh s* NA
No. de Pobla Area
1 16 163.30 2612.80 11.56 232.04 3712.64 12.21 Estado atributos ción Municipio agrícola Estado
2 48 58.55 2810.40 12.44 74.71 3586.08 11.79
Iowa, 1938 18 115 100 96 91
Iowa, 1939 19 121 100 97 91
Totales 64 5423.20 24.00 7298.72 24.00
Florida, 1942
Area de cítricos 14 144 100
Area de hortalizas 15 111 100
ambos conjuntos de datos dan la misma asignación — un tamaño de California, 1942 17 113 100 97
muestra de 12 para cada estrato.
Nótese que la fracción óptima de muestreo es 75% en el estrato
1, pero sólo 25% en el estrato 2. Con frecuencia se encuentra que Por lo tanto, la precisión relativa del método 1 respecto al 2 es la ra
debido a la gran variabilidad del estrato que consiste en las insti zón V2(y í t )/Vl (y ,t ), expresada como porcentaje. Los datos mostra
tuciones grandes, la fórmula requiere un muestreo del 100% en di dos son promedios sobre los números de atributos de la segunda
cho estrato. De hecho, la asignación puede requerir más del 100% columna. El municipio se toma como estándar en cada caso. Como
de muestreo (v e r Sec. 5.8). Nótese también que las S* son menores se indicó, las ganancias en precisión son moderadas. En Iowa, el uso
en 1920 que en 1930. Los datos de 1920 dan una impresión dema de 1 600 estratos (poblaciones) comparado con la no estratificación
siado optimista de la precisión que se obtendrá de una encuesta en (e l estado) aumenta la precisión en 30% más o menos; es decir, re
1930. Como se mencionó en la Sec. 4.7, la posibilidad de un cambio duce la varianza en un 25% aproximadamente.
en los niveles de las S* siempre debería considerarse al usar datos En lo que respecta a la estratificación proporcional, en contra
anteriores, aunque una consideración del cambio debe contener de la estratificación óptima, hay dos situaciones en que la estrati
algo de adivinanza. ficación óptima gana gallardamente. El primero es el caso ya discu
La estratificación geográfica en la que los estratos son áreas com tido en donde la población consiste en instituciones grandes y pe
pactas, como municipios o colonias de una ciudad, es común — a me queñas estratificadas por alguna medida del tamaño. Las varianzas
nudo por conveniencia administrativa o porque se quieren datos se SV son usualmente mucho mayores para las instituciones grandes
parados para cada estrato— y generalmente viene acompañada con que para las pequeñas, lo que hace ineficiente la estratificación pro
un incremento en la precisión porque operan muchos factores para porcional. La segunda situación se encuentra en encuestas donde al
lograr que las personas que viven o las cosechas que se cultivan en gunos estratos son mucho más costosos de muestrear que otros. La
una misma área muestren semejanzas en sus principales caracterís influencia de los factores \ZcT puede hacer que la asignación resulte
ticas. Sin embargo, las ganancias debidas a la estratificación geográ mediocre.
fica, en general son modestas así, por ejemplo, la Tabla 5.3 muestra Al planear una asignación en donde el n* estimado no difiere
datos publicados por Jessen (1 9 4 2 ) y Jessen y Houseman (1944) mucho de la proporcionalidad, vale la pena estimar qué tanto más
sobre la efectividad de la estratificación geográfica para cierto nú grandes se convierten V ( y „ ) o V (Y S<) si se usa la asignación pro
mero de atributos económicos típicos de las granjas. porcional. Los óptimos en el problema de asignación son más bien
Se representan cuatro tamaños de estratos — la ciudad, el muni bajos (v e r la Sec. 5A.2) y el incremento de la varianza puede resul
cipio, el área típica de granja y el estado— . Para dar una idea de los tar sorprendentemente pequeño. Además, la superioridad del óptimo
tamaños relativos de los estratos, hay alrededor de 1 600 poblaciones, calculado aquí a partir de los valores estimados de los S* es siempre
100 municipios y 5 áreas en Iowa. exagerado por los errores en los SA estimados. La sencillez y autopon-
En la tabla se toma la precisión de un método de estratificación deración de la asignación proporcional valen probablemente de un
como inversamente proporcional al valor de V ( y „ ) que da el método. 10 a un 20 % de incremento en la varianza.
M U E S TR E O A LE A TO R IO E S TRATIFIC AD O 143
5.9 E S T IM A C IO N D E L T A M A Ñ O DE L A M U E S T R A
5.8 A S IG N A C IO N Q U E R E Q U IE R E M A S D E L 100%
CO N D A T O S C O N T IN U O S
D E L M U E STR E O
Como se mencionó en la Sec. 5.7, la fórmula para el óptimo pue Las fórmulas para la determinación del valor de n en una asig
de producir en cierto estrato un nh que sea mayor que el correspon nación óptima estimada son las que se dieron en la Sec. 5.5. Esta
diente N k. Considérese el ejemplo de los tamaños de las ciudades en sección presenta las fórmulas para cualquier asignación con algunos
la Sec. 5.3. Una muestra de 24 ciudades distribuidas entre los es casos especiales de utilidad. Se supone que la estimación se ha es
tratos, requería 12 ciudades de 16 en el primero y 12 de 48 en el pecificado con varianza V. Si en lugar de ello, se especifica el margen
segundo. Si la muestra hubiese sido de tamaño 48, la asignación de error d (Sec. 4.4 ), V - ( d/t ) 2 donde t es el desvío correspon
hubiera requerido 24 ciudades de 16 en el primer estrato. Lo más diente a la probabilidad que podemos conceder de que el error exce
que se puede hacer es tomar todas las ciudades en el estrato, y dejar da el margen deseado.
32 ciudades para el segundo estrato en lugar de las 24 postuladas
por la fórmula. Este problema sólo surge cuando la fracción global
Estimación de la M edia de Población F
de muestreo es importante, y algunos estratos son mucho más varia
bles que otros. Esto ocurre en la práctica con mucha frecuencia. Sea sh la estimación de S» y sea = w„n donde los wk han sido
Si la estimación original da n, > N, cuando hay más de dos estra elegidos. En estos términos, la V ( y „ ) anticipada (p or el Teorema 5.3,
tos, la asignación óptima revisada es: Sec. 5.3.) es
« i = N ,; ñh = ( n - N i ) ~ — (/i s 2) (5.41)
i w hsh <5 « >
2
con W* - Nj,/N. Esto da como fórmula general para n
siempre que ñ» < N* para h > 2 . Si ocurriese que ñ 2 > N 2, cambia
ríamos la asignación a r w „W
ñx= N ú ñ2= N 2- ñh = ( n - N l - ^ - r ^ ~ , ( h > 3 ) (5.41)' n- (5.44)

I whs„ i w
3
Siempre y cuando ñh < N h para h > 3. Continuamos con este si se ignora la cpf tenemos, como primera aproximación
proceso hasta que cada ñk < N k. La asignación resultante puede
demostrarse que es óptima para un valor de n dado, como era de
esperarse.
Hay que tener cuidado al usar la fórmula correcta para V ( y , t). Si n,,/N no es despreciable, podemos calcular n como
La fórmula general (5 .6 ) de la Sec. 5.3 es correcta si se sustituyen *0
los ñ,, dados por la asignación óptima revisada. La Fórmula (5.27) n =■ (5.46)
para VMÍB( y , t).
, ( X ^ S * )2 En casos particulares, las fórmulas toman varias formas que pue
vm,-„(y„) = ----------------- —— (5.27)
n N den ser convenientes para el cálculo. Algunas son:
no vale ya. Si X' denota suma en los estratos para los cuales ñh < N k,
Asignación óptima supuesta (para n f i jo ) : wh <* W As„.
una fórmula alternativa correcta es
v (. v (X'WhS„)2 T WhS„2
n =■
(X WfA)1
----------- - — (5.42) (5.47)
donde n ' es el tamaño total revisadode la muestra en estos estratos.

144 TE C NIC AS DE M U ESTRE O M U E S TR E O A LEA TO RIO E S TR A T IF IC A D O 145
Asignación proporcional: wh = W* = N*/N. TA B LA 5 .4 . D ato s Para l a E s t im a c ió n d e l T am año de M uestra
I Whsh2 «o Estrato N„ s„ „h
n = -^ - (5.48)
1 13 325 4 225 9
2 18 190 3 420 7
3 26 189 4914 10
Estimación del Total de Población 4 42 82 3 444 7
5 73 86 6 278 13
Si V es la V ( Y „ ) deseada, las fórmulas principales son 6 24 190 4 560 10
En general:
Totales 196 26 841 56
y N fc V
(5.49) La Tabla 5.4 muestra los valores de Nk, sh y N ;,Sj, que se conocían antes
V + IN .V
de determinar n.
Optimo supuesto (para n f ijo ): La fórmula apropiada para n es (5 .5 0 ) que se aplica a una asignación
"óptim a” para estimar un total. Con sólo 196 unidades en esta población no
es probable que la cp f sea despreciable. Sin embargo, para propósitos de ilus
( 5 '5 0 ) tración, una primera aproximación que ignora la cp f será la que se busque.
Esto es:
Proporcional:
(S / V J 2 (26 841)~
n0= ^ l N hsh\ (5-51) 0 V 7 974 976
Obviamente es necesario un ajuste. Para la n correcta en (5 .5 0 ), tenemos
1+ N
—------ = - * ° - 34 ,5 7 1
Ejemplo. Este ejem plo proviene de un artículo de Comell (1 9 4 7 ) que , , 1 V- , 4 640 387
describe una muestra de universidades y colegios de los Estados Unidos to V hSh + 7 974 976
mada en 1946 por la oficina de educación con objeto de estimar las inscrip
ciones para el año académico 1946-1947. La ilustración es para la población Se escogió un tamaño de muestra de 56 unidades.* La n-n para estratos in
de 196 colegios de maestros y escuelas normales. Se les dispuso en siete es dividuales aparece en la columna del lado derecho de la Tabla 5.4.
tratos, de los cuales se ignorará uno pequeño. Los cinco primeros estratos se
construyeron por tamaño de la institución: el sexto sólo contenía colegios
para mujeres. Se calcularon las estimaciones sh de las Sh a partir de los re 5.10 M UESTREO E S T R A T IF IC A D O P A R A PR O PO R CIO N ES
sultados obtenidos para el año académico 1943-1944. Se usó una estratifi
cación "óptima" basada en estos valores s*. Si queremos estimar la proporción de unidades en la población
E1 objetivo era un coeficiente de variación de 5% en el total de inscrip que pertenecen a una clase definida C, la estratificación ideal se ob
ciones estimado. En 1943 el número total de inscripciones para este grupo de tiene si colocamos en el primer estrato toda unidad que pertenezca
colegios fue de 56 472. De modo que el error estándar deseado es a C y en el segundo toda unidad que no pertenezca a C. Si esto falla,
tratamos de construir estratos tales que la proporción en la clase C
(0.05)(56 472) = 2824
varíe tanto como sea posible de estrato a estrato.
y, por lo tanto, la varianza deseada es Sea
V = (2824)2= 7 974 976
Se puede objetar que el número de inscripciones será m ayor en 1946 que

en 1943 y que la asignación debería hacerse para este incremento. En reali la proporción de unidades en C en e l h-ésimo estrato y en la mues
dad el cálculo supone solamente que e l cv por colegio es igual en 1943 que tra de ese estrato, respectivamente. Para la proporción en la pobla
en 1946, — lo que parece razonable.
• Los resu lta d o s a ritm é tic o s d ifie r e n lig e r a m e n t e d e los o b ten id o s por C o m e ll (1 9 4 7 ).
146 TE C N IC A S DE M U ESTRE O M U E S TR E O A LE A TO R IO E S TR A TIFIC AD O 147
ción total, la estimación apropiada en el muestreo aleatorio estrati Varianza mínima para un tamaño de muestra total fijo.
ficado es
nhce NhM / ( N h - l h ^ Q h = Nh'ÍPhQh
P« = 1
a. ^ N
7* <5.52)
Por lo que
Teorema 5.9. Con el muestreo aleatorio estratificado, la va N ^ ^

nh — n— := ■ - ■ (5.60)
rianza de es l N hsíPÔh
1 N 2(Nh - n h) PhQh
v ( p„ )-^ 1 — “ Varianza mínima con un costo fijo, donde costo = c 0 +XC»n*.
Prueba. Este es un caso particular del teorema general para la

„ „ . N jP „ Q J c h
varianza de la media estimada. Del Teorema 5.3
" l N hJ K o J 7 h (5<51)
V (y ,)» iZ A fc (A fc - n * )“ (5.54) El valor de n se encuentra como en la Sec. 5.5.
iv nk
Sea yhi una variable que toma el valor de uno cuando la unidad
está en C y 0 en otro caso. En la Sec. 3.2, Ec. 3.4, se demos 5.11 G A N A N C IA S EN P R E C IS IO N E N E L M UESTR EO
tró que para esta variable E S T R A T IF IC A D O P A R A PR O PO R CIO N ES
Si los costos por unidad son los mismos en todos los estratos,
Nh- l dos reglas de trabajo úüles son: ( a ) la ganancia en precisión del
Esto da el resultado. muestreo aleatorio estratificado sobre el muestreo aleatorio simple
N ota : Prácticamente en todas las aplicaciones, aun si la cpf es pequeña o modesta a menos que la P* varíe mucho de estrato a
no es despreciable, lostérminos en 1/N* serán despreciables y se estrato; ( b ) la asignación óptima con una n fija gana poco sobre
puede usar la siguiente fórmula ligeramente más simple. la asignación proporcional si todas las P* caen entre 0,1 /0.9.
Para ilustrar el primer resultado, en la Tabla 5.5 se muestra la
V (p J = ^ Z N h(Nh- n H) ^ = Z y £ ^ ( l - f h) (5.56) comparación del muestreo aleatorio estratificado (asignación pro
N nh nh
porcional) con el muestreo aleatorio simple en 3 estratos de igual ta
Corolario 1. Cuando pueda ignorarse la cpf maño (W * = y3). Están incluidos 4 casos, el primero con P¡, - 0.4,
0.5 y 0.6 en los tres estratos y el último ( y más extremo) con P» -
V(p„) = XVP„2^ (5.57) 0 . 1 , 0.5 y 0.9. Las siguientes dos columnas muestran las varianzas
«a
Corolario 2. Con asignación proporcional T A B L A 5.5. P r e c is ió n R e l a t iv a d e l M uestreo E s t r a t if ic a d o
y el M uestreo A l e a t o r io S im p l e
N -n 1 N„2PHQh
(5’58) Simple Estratificado
=— I T O * (5.59) n V (p )l(l - / ) n V (p ,t)l(\ - / ) Precisión

n
PK = pQ = é J P kQ k relativa ( % )
Para la estimación muestra! de la varianza, se sustituye p ^ q j
(ni, - 1 ) por la incógnita P*Q*/n* en cualquiera de las fórmulas 0.4.0.5,0.6 2500 2433 103
indicadas anteriormente. 0.3,0.5.0.7 2500 2233 112
0.2,0.5,0.8 2500 1900 132
La mejor elección de nh para minimizar V (p at) se desprende de
0.1, 0.5,0.9 2500 1433 174
la teoría general en la Sec. 5.5.
M U E S TR E O A LE A TO R IO E S TR A TIFIC AD O 149
148 TE C N IC A S DE M UESTREO
de la proporción estimada, multiplicada por n / ( 1 — f ) y la última 5.12 E S T IM A C IO N D E L T A M A Ñ O D E M U E S T R A

columna está formada por las precisiones relativas del muestreo es C O N PR O PO R C IO N ES
tratificado respecto al muestreo aleatorio simple. La ganancia en
precisión es grande solamente en los últimos dos casos. Las fórmulas pueden deducirse de las más generales en la Sec.
5.9. Sea V la varianza deseada én la estimación de la proporción P
Para comparar la asignación proporcional con la asignación óp
en la población total. Las fórmulas para los dos tipos principales de
tima con n fijo, se encontrará que si se ignora la cpf
asignación son las siguientes.
„ (X ttW O J 2 . £ W„PhOh Proporcional:
y ópi n . Vpm p ~ n p .O Z J
„ I Whphqh n0
Por lo tanto, la precisión relativa de la asignación proporcional res n° ~ 7/ ’ — (5.65)
pecto a la asignación óptima es,
y** <i W H 'fp ja ? Optimo supuesto:

I WhPhQh
(I «O
«o - y , n ------------- (5.66)
Si todas las Ph se encuentran entre los dos valores P 0 y (1 —
estamos interesados en el valor más pequeño que tomará la 1 + jvv?£ WhPhq>'
precisión relativa. Por simplicidad, consideremos dos estratos de igual
donde nn es la primera aproximación, la cual ignora la cpf, y n es el
tamaño (W , - W 5). La precisión relativa mínima se obtiene cuan
valor corregido tomando en consideración las cpf. En el desarrollo
do P, - V* y P-j - Pe Entonces, la precisión relativa es de estas fórmulas, los factores N k/(Nk - 1) se han considerado como
la unidad.
V * ... (0.5+V f ^ ) 2
Estos resultados son aplicables a la estimación de una proporción.
Vprop 2(0.25 + P 0Q 0) i ;
Si es preferible pensar en términos porcentuales, las mismas fórmu
Algunos valores de esta función se presentan en la Tabla 5.6. Aun las se aplican si Ph, Qh, V, etc., se expresan como porcentajes. Para
con P„ - 0.1 o tan alto como 0.9, la precisión relativa es 94% . En la la estimación del número total de unidades en la población que per
mayoría de los casos, la simplicidad y la característica de autopondera- tenecen a la clase C, es decir, de NP, todas las varianzas se multipli
elón de la estratificación proporcional hace más que compensar la lige can por N 2.
ra pérdida en precisión.
E J E R C I C I O S
T A B L A 5.6. P r e c is ió n R e l a t iv a d e l a A s ig n a c ió n P r o p o r c io n a l
R especto a l a A s ig n a c ió n O p t im a
5.1. En una población con N «= 6 y L = 2 los valores de Jim son 0, 1, 2 en

el estrato 1 y 4, 6, 11 en el estrato 2. Se va a tomar una muestra con ti — 4.
Po 0.4 o 0.6 0.3 o 0.7 0.2 o 0.8 0.1 o 0.9 0.05 o 0.95 ( a ) Demostrar que las nh óptimas bajo la asignación de Neyman, aproximando
a números enteros, son 7i„ = 1 en el estrato 1 y % - 3 en el estrato 2. ( b )
R l’(% ) 100.0 99.8 98.8 94.1 86.6 Calcular la estimación yst para todas las muestras posibles que pueden deri
varse bajo la asignación óptima y bajo la asignación proporcional. Verificar
que las estimaciones son insesgadas. Por lo tanto, encontrar directamente
Deben notarse las limitaciones de este ejemplo. No toma en con y it ) y Vpro?( y . t ) - ( O V erificar que Vrfp(( y „ ) concuerda con la fórmula
dada en la Ec. 5.6 y que Vpro„ ( y , ¡ ) concuerda con la fórmula dada en la Ec.
sideración los costos diferenciales debidos al muestreo en los diferen
5.8, Fág. 129. ( d ) El uso de la fórmula 5.27, Pág. 136, para calcular Vrf„ ( y „ ) es
tes estratos. En algunas encuestas las Ph son muy pequeñas, pero
ligeramente incorrecto porque no considera el hecho de que las nh fueron
varían de, digamos, 0.001 a 0.05 en diferentes estratos. Aquí habrá aproximadas a enteros. ¿Qué tan bien concuerda este resultado con el valor
una ganancia más sustancial respecto a la estratificación óptima. corregido?
150 TE C N IC A S DE M U ESTRE O M U E S TR E O A LE A TO R IO E S TR A TIFIC AD O 151
5.2. Las fam ilias de un pueblo se van a muestrear para estimar la canti 5.6. Un muestreador propone tom ar una muestra aleatoria estratificada.
dad promedio de bienes por fam ilia que se pueden convertir en dinero en efectivo Espera que sus costos de campo serán de la form a £cj,nv Sus estimaciones
rápidamente. Las familias se estratifican en un estrato de renta alta y otro adelantadas de las cantidades relevantes para los dos estratos son como sigue:
de renta baja. Se piensa que una casa en el estrato de renta alta tiene cerca
de 9 veces más bienes que los existentes en una casa en el estrato de renta
Estrato W„ Sh Ck
baja, y se espera que Sh sea proporcional a la raíz cuadrada de la media del
estrato.
1 0.4 10 14
Existen 4 OOO fam ilias en el estrato de renta alta y 20 000 fam ilias en el
2 0.6 20 S9
estrato de renta baja, ( a ) ¿Cómo distribuiría una muestra de 1 000 familias
entre los dos estratos? ( b ) Si el objetivo es estimar la diferencia entre los
bienes por fam ilia en ambos estratos, ¿cóm o debe estar distribuida la muestra?
(a ) Encuentre ios valores de n j t i y n .J n que minimizan los costos de
5.3. La información que aparece a continuación, representa la estratifica
campo totales para un valor dado de V ( h „ ) . ( b ) Encontrar el tamaño de mues
ción de todas las propiedades agrícolas en un condado, clasificadas por tamaño
tra requerido bajo esta asignación óptima, para hacer V (y J() = 1. Ignore la
promedio de acres de maíz por propiedad en cada estrato. Para una muestra
cpf- ( c ) ¿Cuál será el costo total de campo?
de 100 propiedades, calcule los tamaños de muestras en cada estrato bajo
5.7. Después de haber tomado la muestra en el Ejercicio 5.6, el muestreador
( a ) asignación proporcional,» ( b ) asignación óptima. Compare las precisiones
encuentra que sus costos de campo fueron, en realidad, de $2.00 por unidad
de estos métodos con la del muestreo aleatorio simple.
en el estrato 1 y de $12.00 en e l estrato 2. ( a ) ¿Qué tanto más alto es el
costo de campo en comparación con lo que se había previsto? ( b ) Si hubiesen
Promedio de
conocido los costos correctos de campo por adelantado, ¿podría haber obtenido
Tam año de la Número de acres de Desviación
la V C y ,¡) «» 1 para el costo de campo estimado originalmente en el Ejercicio
propiedad propiedades maíz estándar
5.6? (N ota . La desigualdad Cauchy-Schwarz, en la Pág. 134, con V ' = 1, da la
(a cres) N* 7, s*
respuesta a esta pregunta sin encontrar la nueva asignación.)
5.8. En una estratificación con 2 estratos, los valores de W¿, y Sk son
0-40 394 5.4 8.3
como sigue:
41-80 461 16.3 13.3
81-120 391 24.3 15.1 Estrato Wh Sh
121-160 334 34.5 19.8
161-200 169 42.1 24.5 1 0 .8 2
201-240 113 50.1 26.0 2 0.2 4
241- 148 63.8 35.2
Calcule los tamaños de muestra n „ « . necesarios en ambos estratos para
Total o media 2010 26.3 satisfacer las siguientes condiciones. Cada caso requiere un cálculo separado.
(Ign ore la c p f.) ( a ) El error estándar de estimación de la media de la po
blación y „ debe ser 0.1 y el tamaño de muestra total n =* n2 + n., debe ser
5.4. Verifique el resultado establecido en la fórm ula 5.38, Sec. 5.6: minimizado, ( b ) E l error estándar de la medía estimada de cada estrato debe
ser 0.1. ( c ) E l error estándar de la diferencia entre 2 medias estimadas de los
estratos debe ser 0.1, nuevamente minimizando el tamaño de muestra total.
5.9. Con dos estratos, a un muestrador le gustaría tener n, =» n.. por conve
5.5 Un muestreador tiene dos estratos con tamaños relativos W t, W r El
niencia administrativa, en lugar de usar los valores dados por la asignación de
cree que S,, S2 pueden ser consideradas iguales pero piensa que c t puede
Neym an, Si V (v ,( ) , V ^ .fy ^ ,) representan las varianzas dadas por la asignación
estar entre 2 veces ct y 4 veces cr Preferiría usar la asignación proporcional
ni = nt y Ia asignación de Neym an, respectivamente, demuestre que el aumen
pero no quiere incurrir en un aumento sustancial en la varianza comparada
to fraccionario en la varianza es
con la asignación óptima. Para un costo dado C == + Cjttj, ignorando
la cpf, demostrar que
(r-iy
V W (y » ) W :c 2 vmy m) W i/
VV(y„) (W ^ + W ^ f
en donde r — 71,/n, de acuerdo con la asignación de Neyman. Para los estratos
Si W , » W e, calcule e l aumento relativo en la varianza al usar la asigna en el Ejercicio 5.8, caso a. ¿ cuál sería el aumento fraccionario de la varianza
ción proporcional cuando c,/c, = 2, 4. al usar n l — n , en lugar de la asignación óptima?
M U ESTRE O A LEA TO RIO E S TRATIFIC AD O 153
5.10. Si la función de costos es de la form a C = c0 - f £ t j V 7th, en donde

e0 y la th son números conocidos, demuestre que con el fin de minimizar 5.13. Demuestre que en la estimación de proporciones los resultados corres
pondientes al Teorema 5.8 son como sigue:
V(i/a<) Para un costo total fijo nh debe ser proporcional a
2
Kan = K^n W„(Ph - P )
, £ wh( J w k-/ p ¿> ;r

Encontrar los nh para una muestra de tamaño 1 000 bajo las siguientes Vt-vr
P'op = Vv<*x"
"y
condiciones:
en donde
Estrato 14; s„ ' / ^ = i Máv'Áa;.

5.14. En una compañía, el 62% de los empleados son hombres experimen
1 0.4 4 1 tados o sin experiencia, el 31% son mujeres oficinistas y el 7% son superviso
2 0.3 5 2 res. De una muestra de 400 empleados la compañía desea estimar la propor
3 0.2 6 4 ción que utiliza ciertos servicios de diversión. Las conjeturas son de que los
servicios son utilizados por el 40 o 50% de los hombres, 20 o 30% de las mu
jeres y 5 o 10% de los supervisores, ( a ) ¿Cómo asignaría la muestra dentro
5.11. Si es la varianza de la media estimada de una muestra de estos tres grupos? ( b ) Si las verdaderas proporciones de los usuarios fueran
48, 21 y 4 % , respectivamente, ¿cuál sería e l error estándar de la proporción
ulcutorla estratificada de tamaño n con asignación proporcional y V (T j) es la p 3l estimada? ( c ) ¿Cuál sería el error estándar de p derivado de una muestra
varianza de la media de una muestra aleatoria simple de tamaño n, de aleatoria simple con n = 400?
muestre que la razón
5.15. La Fórmula (5 .2 7 ) para la varianza mínima de yJt bajo la asignación
de Neym an es la siguiente.
V(y)
v - e u - tta a c - ia s :
no depende del tamaño de muestra, en tanto que la razón
Un estudiante comenta: “Dado que £ W^Sj,* > ( £ WKSh)* a menos que todas
K-, las S;, sean iguales, la fórmula debe estar equivocada porque cuando n se
aproxima a N dará un valor negativo para V (y t l ) " . ¿Quién tiene la razón, el
estudiante o la fórmula?
disminuye conforme rt aumenta. (E sto implica que la asignación óptima para 5.16. Por la Fórmula (5 .2 6 ) para la asignación de Neym an, la fracción
n fijo se vuelve más efectiva en relación a la asignación proporcional con
de muestreo en el estrato h es fh = nh/igh = nSh/N £ WyS,-. Las situaciones
forme a aumenta ) (U tilice las fórmulas 5.8 y 5.27.)
en que la fórmula requiere más del 100% del muestreo en un estrato ( f * > 1)
5.12. Compare los valores obtenidos para V ( p „ ) bajo la asignación propor es de esperarse que sean aquellas en las que la fracción global del muestreo
cional y ia asignación óptima para un tamaño de muestra fijo en las dos n/N sea importante y uno de los estratos presente una variabilidad excepcio
poblaciones siguientes. Cada estrato es de igual tamaño. La c p f se puede nalmente alta: El siguiente es un ejemplo para una población pequeña con
Ignorar. N - 100, n - 40.
Optimo
Población 1 Población 2 Estrato s„
Estrato A Estrato P, 1 60 2 15
2 30 4 15
1 0.1 1 0.01 3 10 15 10
2 0.5 2 0.05
3 0.9 3 0.10 100 40
(a ) V erificar que los óptimos nh son como se muestran en la columna de

¿Qué resultado general se ilustra con estas dos poblaciones? la derecha. ( b ) calcular V (y l t ) por la Fórmula (5 .6 ) y por la Fórmula (5.42)
y mostrar que ambas dan V (5rs() = 0.12.
C A P IT U L O 5 A
Otros Aspectos del

Muestreo Estratificado
5A.1 EFECTOS D E L A S D E S V IA C IO N E S A P A R T IR
D E L A A S IG N A C IO N O P T IM A
En este capítulo se discuten varios temas especiales del uso

práctico del muestreo estratificado. Las Secs. 5A.1 a 5A.8, 5A.10 y
5A.15 tratan sobre problemas que pueden surgir en la planeación de
una muestra; las secciones restantes tratan sobre las técnicas
del análisis de los resultados. La presente sección considera la pér
dida de precisión al no lograr la asignación óptima de la muestra.
Supóngase que se pretende usar la asignación óptima para un n
dado. El tamaño de la muestra nfh en el estrato h debería ser
k z WhSh
A partir de la Ec. (5 .2 7 ) la varianza mínima es
Vm!n(y„> = £ ( I WhS„ ) 1- ¿ X H W (5A.2)
En la práctica, como no se conocen las S», sólo podemos aproximar

esta asignación. Si ñh es el tamaño usado en el estrato h de la mues
tra, la varianza que de hecho se alcanza, a partir de la Ec. (5 .6 ) es
u/ 2C 2 1
V (y„) = X - * A - ^ I WhS * (5A.3)
nh /v
El aumento en varianza que origina la asignación imperfecta es
156 TE C N IC A S DE M U ESTRE O OTROS ASPECTO S D EL M U E S TR E O E STRATIFIC AD O 157
En el primer término de la derecha, sustitúyase W*S* por su expre T A B L A 5A.1. Efecto s de las D e s v ia c io n e s d e i .a A s ig n a c ió n O p t im a
sión en términos de nk' a partir de (5 A .1 ). Esto da el siguiente re K “ « a'| (>»A ~ "*')*
sultado interesante Estrato
(ó p t.) (r e a l)
l 200 150 0.33 16.7

n \ nh / 2 100 120 0.17 3.3
tt.W„Sh)2 ( ñ „ - n h’) 2 3 40 70 0.43 12.9
—2 1 i (5A.5)
n nh Total 340 340 — 32.9
Regresando a la Ec. (5 A .2 ), si la cpf (últim o término a la derecha;
es despreciable, tenemos que
vw „(y„) ( I v^s,,)2 de la derecha, sabemos que el incremento real es de 32.9/340

n “ n2 (5 A '6)
= 9.7%.
Evans (1 9 7 1 ) examinó la misma cuestión en términos de los
Por lo tanto, el incremento proporcional en la varianza que resulta efectos de los errores en las Sj, estimadas y desarrolló una regla apro
a partir de desviaciones de la asignación óptima es ximada que muestra si un óptimo estimado es de esperarse que
V ( y „ ) - V mh( y „ ) 1 £. (ñh - nh')2 sea más preciso que una asignación proporcional. Este autor supo
ne que el coeficiente de variación de la S* estimada es el mismo
T„ (5 A J )
en todos los estratos. Este supuesto es apropiado cuando las S* fue
donde ñk es eltamaño muestral real y nh' eltamañomuestral ópti ron estimadas de una muestra preliminar del mismo tamaño en cada
mo en el estratoh.La cpf no esdespreciable,entonceselsigno de estrato. Evans nos dice cómo calcular el tamaño de una muestra
igualdal en (5 A .7 ) se convierte en signo de desigualdad > . preliminar requerida para hacer una asignación “óptima” en pro
Sea gk = |ft:, — n h'|/ñ¡, la diferencia absoluta en los tamaños de la medio mejor que la asignación proporcional. Sukhatme mostró an
muestra en el estrato h expresada como una fracción del tamaño teriormente (1 9 5 3 ) que una muestra inicial pequeña da usualmen
real ti,,. Entonces (5 A .7 ) viene a ser te una probabilidad elevada que la asignación “ óptima” será superior
a la proporcional. Ver Sukhatme y Sukhatme (1970), Pág. 87.
i (5A.8)
•m in Ji " l H
5A.2 EFECTOS D E ERRORES EN LO S T A M A Ñ O S
una media ponderada de los gh". Un limite superior conservador pa
D E LO S ESTRATOS
ra ( V — VMÍn)/V Mj, es, por tanto, g 3 donde g es la diferencia propor
cional más grande en cualquier estrato. De modo que si g = 0.2 o Para un tipo de estratificación deseada, los totales de estratos N h
20 % , el incremento proporcional en la varianza no podrá exceder pueden no conocerse con exactitud, al ser obtenidos de datos de cen
(0 .2 ) 3 o 4% .S i <? - 30% el incremento proporcional en la varianza sos anticuados. En vez de las verdaderas proporciones de estratos w h,
es cuando más 9% . En este sentido puede decirse que el óptimo
tenemos estimaciones iv». La estimación de Y de la muestra es Izí/jJ/*.
es bajo.
En términos generales, las consecuencias de usar ponderacio
Además, (5 A .8 ) sugiere que el límite superior con frecuen nes que están en error son las siguientes:
cia estimará en exceso el incremento proporcional en la varianza en
una cantidad sustancial. La Tabla 5A.1 da un ejemplo con tres estra 1. La estimación de la muestra tiene sesgo. Debido al sesgo,
tos para n - 340. La asignación óptima requiere tamaños de mues medimos la exactitud de la estimación mediante su error cuadrático
tra de 200, 100 y 40 en tanto que los tamaños reales usados son medio respecto a Y, en lugar de medirla por su varianza respecto a
150, 120 y 70. su propia media (véase la Sec. 1.9).
Como el valor de g es 0.43 (estrato 3 ), la regla aproximada da 2. El sesgo permanece constante conforme aumenta el tamaño
18% como el incremento proporcional en la varianza. De la columna de la muestra. Consecuentemente, siempre se alcanza mi tamaño de
OTROS ASPECTOS D EL M U E S TR E O E S TR A TIFIC AD O 159
muestra para el cual la estimación es menos precisa que el mues y 0.06 en ( b ) . Por lo tanto, tenemos los siguientes ECM comparables para
treo aleatorio simple y se pierde toda ganancia en precisión debido a una muestra de tamaño n:
los estratos.
Muestreo aleatorio sim ple: V (y ') = -
3. La estimación usual s (y ,( ) subestima el verdadero error n
de y„, ya que no contiene la contribución del sesgo al error. Muestreo aleatorio estratificado:
0.91
Para justificar estas declaraciones, nótese que en muestreo re ( a ) : ECMCí/,( ) + 0.0004
n
petido, el valor medio de la estimación es /hYh. El sesgo alcanza,
0 .1 9
por lo tanto, una cantidad igual a ( b ) : ECMC j/j, ) ------- + 0.0036
n
E K - H 'J ñ Como se ve en la Tabla 5A.2, con relación a ( a ) , el muestreo aleatorio
simple comienza a ganar con n *= 300. Hay, sin embargo, poco qué escoger
Esto es independiente del tamaño de muestra. Para encontrar el entre los dos métodos hasta n = 1 000.
error cuadrático medio ( E C M ) de la estimación, es fácil verificar En ( b ) , con más en juego, la estratificación es superior hasta n = 200,
que el término de la varianza está dado por la fórmula usual, con aunque la mayor parte de la ganancia potencial ya se ha perdido con este
wh en lugar de W*. Por lo tanto, tamaño de muestra. Más allá de n = 300 la estratificación se vuelve mar
cadamente inferior al muestreo aleatorio simple. Una estimación exacta de
las W h es en particular importante cuando la estratificación es altamente
ECM (y„) = I l - f „ ) + [ l ( w h- W h) Yh]2 (5 A.9) efectiva o cuando e l tamaño de muestra es grande.
Esta expresión fue dada por Stephan (1941). Finalmente, la En algunas encuestas puede tomarse una muestra preliminar gran
de de tamaño n ’ para estimar W k. Esta técnica, conocida como mues
fórmula usual para s*(ys, ) es claramente una estimación sin sesgo
treo doble, o muestreo en dos fases, tiene numerosas aplicaciones y se
del primer término en (5 A .9 ) pero no toma en cuenta el segundo
término. discute en el Cap. 12. Se mostrará que con muestreo doble el error
cuadrático medio de ya, es aproximadamente
Ejemplo. Este ilustra la pérdida en precisión debida a ponderaciones in
correctas cuando la estratificación es: ( a ) poco efectiva, ( b ) altamente efec I ^ S h2 T W h(Y h - Y ) 2
(5A.11)
tiva. Considérese una población grande con S5 = 1, divisible en dos estratos
con W , = 0.9, W , = 0.1. Supongamos S, = S2 = Si . Entonces, despreciando
los términos en 1/iV*, Comparando este ECM con SVn, como lo da la Ec. (5 A. 10), ve
mos que la mayor parte de la ganancia de la estratificación se retie
•sJ - I w ;s *2+ v w ; ( ñ - y )2 (5a . i o ) ne, siempre que n ' sea mucho más grande que n. Para ponerlo en
= s„2+ w, iv2( ? , - y 2)2 forma más general, un grupo de ponderaciones estimadas preserva
la mayor parte de la ganancia potencial con estratificación, si las
esto es,
TAB LA 5 A .2 . V alo res C o m p a r a b l e s d e l E C M (y ")

1 = V + o . 0 9 ( ? , - y 2)2
Aleatorio estratificado
En ( a ) tome Y, — Y s = 1. Entonces Sh- «= 0.91 y la estratificación pro
A le a to r io
porcional reduce la varianza en 9 % , comparada con muestreo aleatorio simple.
n simple («> (b )
En ( b ) tome Y , — Y„ « 3, dando Sk' = 0.19, una reducción en varianza
de más de 80% . 50 0.0200 0.0186 0.0074
Con dos estratos y ponderaciones incorrectas el sesgo puede escribirse 100 0.0100 0.0095 0.0055
200 0.0050 0.0049 0-0045
K - » ', ) ( ? , - ? , ) 300 0.0033 0.0034 0.0042
400 0.0025 0.0027 0.0041
ya que (w l — VV,) *= — (u/., — W , ). Suponga que las ponderaciones esti
1000 0.0010 0.0013 0.0038
madas son vjí = 0.92 y i » , = 0.08. E l sesgo alcanza < 0 .0 2 )(1 ) = 0.02 en ( a )
160 TE C N IC A S DE M U ESTRE O OTROS ASPECTO S D EL M U E S TR E O E S TR A TIFIC AD O 161
ponderaciones son más exactamente estimadas de lo que lo serían TA B LA 5 A .4 . T a m a ñ o s de M u e str a D e n tr o de E strato s
con una muestra aleatoria de tamaño n. (n = 1 000)

Asignación
5A.3 E L P R O B L E M A D E L A A S IG N A C IO N C O N M A S Optima para

D E U N A C A R A C T E R IS T IC A --------------------------------- Promedio
Estrato Proporciona] Vacas Galones Entradas m»
Dado que generalmente, la mejor asignación para una caracte
rística no será la mejor para otra, debe llegarse a algún compromiso Lechería noreste 197 254 258 236 250
en un reconocimiento con características numerosas. El primer paso Existencias de grano 191 182 209 246 212
Ganado occidental 219 203 171 194 189
es reducir las características consideradas en la asignación a un nú
Pastizal del sur 184 145 134 115 131
mero relativamente pequeño donde se consideran las más impor
Ganado oriental 208 216 228 209 218
tantes. Si se dispone de buenos datos anteriores, podemos entonces
calcular la asignación óptima para cada característica separada
mente y ver hasta qué punto existe desacuerdo. En una encuesta
TABLA 5 A .5 . V a r ia n z a s E speradas de las M e d ia s E s t im a d a s
de un tipo especializado las correlaciones entre las características
pueden ser altas y las asignaciones pueden diferir relativamente poco. Tipo de asignación Vacas Galones Entradas
Ejemplo. Los datos dados por Jessen (1 9 4 2 ) ilustran una encuesta de Optima 0.0127 0.0800 76.9
este tipo con fincas. El Estado de Iowa se dividió en cinco regiones geográ Compromiso 0.0128 0.0802 77.6
ficas, cada una designada de acuerdo con su principal actividad agrícola. Su Proporcional 0.0131 0.0837 80.9
póngase que estas regiones serán usadas como estratos en una encuesta de
explotaciones lecheras. Las tres características de mayor interés son el número
de vacas ordeñadas por día, el número de galones de leche por día y las entradas óptimos para las tres características, mostrado en la columna de la derecha,
totales anuales en efectivo por productos lácteos. De un reconocimiento he provee una asignación de compromiso satisfactoria.
cho en 1938, las desviaciones estándar estimadas s,, dentro de estratos se La Tabla 5A.5 muestra las varianzas de muestreo esperadas de ylt, co
muestran en la Tabla 5A.3. En la Tabla 5A.4 se dan las asignaciones óptimas m o las dan las asignaciones óptimas individuales, la de compromiso y la
de Neyman, basadas en estas sh para las características individuales en una proporcional. Las fórmulas son:
muestra de 1 000 fincas.
Las asignaciones óptimas individuales difieren una de la otra sólo mo (I H V *)2 «.(H tfJ 1
V o f = Vco m p = l — -------- . « V * = -----------------
deradamente. Con una excepción, las tres se desvian en la misma dirección n , n
en comparación con la asignación proporcional. Así, en el primer estrato, la
La asignación de compromiso da resultados casi tan precisos como cuando
asignación proporcional sugiere 197 fincas y las asignaciones individuales con
fuese posible unas asignaciones óptimas separadas para cada ítem. Más no
ducen a números entre 236 y 258. El promedio de los tamaños de muestra
table aún es el hecho dé que la asignación proporcional es tan sólo un
poco menos precisa que la de compromiso o los óptimos individuales. Además
TA B LA 5 A .3 . D e s v ia c io n e s E stándar Dentro de E strato s la Tabla 5A.5 sobreestima la precisión de las asignaciones de óptimas y de
compromiso porque éstos fueron a partir de varianzas estimadas. Este re
Entradas sultado es otra ilustración de que el óptimo es plano, lo que se mencionó en
por la Sec. 5A.1.
í» productos
Vacas Galones lácteos
W *
Estrato w* m H ordeñadas de leche ($ ) • 5A.4 OTROS M ETODOS D E A S IG N A C IO N CO N M A S
Lechería noreste 0.197 4.6 11.7 332 D E U N A T R IB U T O
Existencias de grano 0.191 3.4 9.8 357
Ganado occidental 0.219 3.3 7.0 246 Una asignación alternativa de compromiso es la que sugiere
Pastizal del sur 0.184 2.8 6.5 173 Chatterjee (1 9 6 7 ), en ella se eligen los n* que minimizan el pro
Ganado oriental 0.208 3.7 9.8 279 medio de los incrementos proporcionales en varianza a partir de
OTROS ASPECTO S D EL M U ESTRE O E S TR A TIFIC AD O 163
(5 A .7 ) al tomarlos sobre las variables. Si j denota una variable, ejemplo supóngase que el valor de L se ha especificado y que el
esto nos lleva a elegir término cpf puede ignorarse. Tenemos
„ ( l ( 5A17)
n h = n J z n lh'2/ Z \ J lH jh '2 (5A.12) £ (K W v Q
i • h Y ¡
donde Ah = >/£ a,S¡h. El tamaño de la muestra total es, por (5 A .14 )

donde n ’lh es el tamaño ópümo de la muestra en el estrato te para i
la variable Para los datos de la Tabla 5A.4, donde los óptimos
individuales sólo difieren poco, los nh de Chatterjee varían a partir (5A.18)
L ' h -Jch '
del promedio m h de la Tabla 5A.4 en cuando mucho en una unidad
en cualquier estrato. En la segunda sugerencia se especifica la varianza deseada de V,-
En algunas encuestas, las asignaciones óptimas para variables para cada variable. Para medias de población esto significa que
individuales difieren tanto, que no hay una solución de compromiso
obvia. Se necesita algún principio para determinar la asignación (/ = 1 ,2 ,..., te) (5A.19)
A=1 h-l N
a usar y Yates (1 9 6 0 ) sugirió dos de ellos, que veremos a conti
nuación. Se usan signos de desigualdad porque la asignación más econó
mica puede proporcionar varianzas más pequeñas que las V, para
El primero se aplica a encuestas con un objetivo específico en
algunas características.
donde la pérdida debida a un error de una magnitud dada en una
En esta sugerencia, el costo C [Ec. (5 A .1 5 )] se minimiza de
estimación, se puede medir en términos de dinero o utilidad, como
acuerdo a las tolerancias V¡ y las condiciones 0 < nh < NY El pro
se vio en la Sec. 4.10. Con te variables y funciones cuadráticas de
blema es de programación no lineal. Hartley y Hocking (1963),
pérdida, esrazonable expresar la pérdidaesperada total, como una
Chatterjee (1 9 6 6 ), Zukhovitsky y Avdeyeva (1 9 6 6 ), Huddleston y
función lineal delasvarianzas de las medias o totalesestimadas de
otros (1 9 7 0 ) han dado logaritmos para su solución. Anteriormente
población. Para las medias
Dalenius (1 95 7) dio una solución gráfica ingeniosa, mientras que
Yates (1 96 0) y Kokan (1 9 6 3 ) desarrollaron métodos de aproxima
L = £ a,V(y,sl) = £ a¡ £ Wh2s Ú — (5A.13) ción sucesiva ilustrados en la segunda edición de este libro.
i i * Xnh
Un primer paso útil es encontrar la asignación óptima separa
donde S'jh es la varianza de la pésima variable en el estrato te. El damente para cada variable así como el costo que satisface su to
intercambio del orden de la suma da lerancia. Tómese la variable, digamos y, para la cual el costo Ci es
el más elevado, y examínese si los valores óptimos nh para y¡ satis
facen todas las otras (te — 1 ) tolerancias. De ser así, se usa esta
<5A-14) asignación y el problema está resuelto, ya que ninguna otra asigna
ción, satisfará la tolerancia V! para y, a un costo tan bajo como C,.
Con una función lineal para los costos de muestreo, tenemos
Al estudiar una serie de ejemplos en un problema relacionado,
C = c0Jt-'[.chnh (5A. 15) Booth y Sedransk (1 9 6 9 ) han señalado que, a falta de un programa
de cálculo, se puede obtener una buena solución al segundo problema
Al minimizar el producto de (C - c0) y el primer término en L (e l de Yates, al resolver el primer problema que es más fácil. Debemos
término que depende de nh) llegamos a, especificar que L en (5 A .13 ) tendrá el valor V * =- £ a¡V, donde las
V; son las tolerancias individuales deseadas y las a¡ se hacen in
a,Sfh (5A.16) versamente proporcionales a las V,. Así, con dos variables a, = V*/
<ch
(V , + V ,), a, = V ,/ (V i + V2) y
por la desigualdad de Cauchy-Schwaxz. La constante de proporcio
nalidad se encuentra al satisfacer la restricción dada para L o C , Por
164 TE C N IC A S DE M U E S TR E O OTROS ASPECTO S D EL M U E S TR E O E S TRATIFIC AD O 165
Ejemplo. (Para cuatro estratos, dos variables.) Los datos y la Como lo hacen notar Booth y Sedransk n < ñ en todos los pro
aplicación aproximada del método se demuestran en las columnas blemas de este tipo, ya que n satisface la restricción L - V*, pero
( 1 ) a ( 6 ) de la Tabla 5A.6. El problema es encontrar el n más pe no es necesario que satisfaga la restricción sobre cada variable, en
queño para que tanto que la asignación ñ satisface L, al igual que las restricciones
individuales.
U (y ,J 50.04, V (v 2„)< 0 .0 1
5A.5 E S T R A T IF IC A C IO N EN DO S DIR ECCIO NES,

TA B LA 5A.6. D ato s A r t if ic ia l e s Para Cu atro Estrato s, dos V a r ia b l e s CO N M U E S T R A S P E Q U E Ñ A S
Columna (1) (2) (3) (4) (5) Supongamos que hay dos criterios de estratificación, digamos por
(6) (7)
R filas y C columnas, lo que da RC celdas. Si n > RC cada celda se
Estrato W„ s i s i WkA„ nh
puede representar en la muestra. Un problema surge cuando n < RC
ñh
l y desearíamos que la muestra nos diera la representación proporcional
de cada criterio de estratificación. En un método simple desarrollado
1 0.4 25 1 5.8 0.963 206 194
2 0.3 25 4 por Bryant, Hartley y Jessen (1 9 6 0 ), la técnica sólo requiere que n
8.2 0.859 183 180
3 0.2 25 16 17.8 0.844
exceda al más grande de R y C.
180 187
4 0.1 25 64 56.2 0.750 160 171 Para ilustrar este método, supongamos que se estratificó una
pequeña población de 165 escuelas, según el tamaño de la localidad,
Totales 3.416 729 732 en cinco clases y, según el costo promedio por alumno, en cuatro cla
ses. Los números de escuelas y las proporciones de escuelas
Fu = 7n¡;/165 en cada una de las 20 celdas se muestran en la T a
A l encontrar la asignación óptima para cada variable en forma
bla 5A.7. ,
independiente, fácilmente se verifica que n = 625 es el requerido para
satisfacer la primera restricción, y n = 676 para satisfacer la se T A B L A 5A.7. N úm ero y P r o p o r c ió n de Escuelas e n Cada Ce l d a
gunda. Sin embargo, n = 676 con su asignación no satisface la pri Tamaño Gasto por alumno
mera restricción al obtenerse 0.0589 en lugar de 0.04 para V,. Una de la
solución de iteración para satisfacer ambas restricciones (que presen ciudad A B C D Totales »f.
tamos en la segunda edición) dio ñ - 732, con el ñ h que aparece
en la columna ( 7 ) de la Tabla 5A.6. f
1
mu 15 21 17 9 «i 62
Pu 0.091 0.127 0.103 0.055 pi. 0.376 4
Para usar el método de Booth y Sedransk con V, = 0.04 y
Vs = 0.01, especificamos ir
u
m2¡ 10 8 13 7 «2 . 38
pzi 0.061 0.049 0.079 0.042 Pz. 0.231 2
L = 0.2 V(y,„) + 0.8 K(y,„) = — °' 01) = 0.016
n
n ii m3i 6 9 5 8 «3 . 28
P » 0.036 0.055 0.030 0.049 P3. 0.170 2
A partir de (5 A .1 8 ) con Ch = 1, tenemos
«41 4 3 6 6 «1 19
( i WhAhJ 1IV
v
(3.416)2 P,< 0.024 0.018 0.036 0.036 P i. 0.114 1
= 729
0.016
vV m¡i 3 2 5 8 «5 18
A l usar la columna ( 5 ) de la Tabla 5A.6. De (5 A .1 7 ), la columna Pu 0.018 0.012 0.030 0.049 P 5- 0.109 1
( 5 ) también conduce a los valores nk que aparecen en la colum
Totales «J 38 43 46 38 165
na ( 6 ) de la Tabla 5A.6. Como se ve en las columnas ( 6 ) y (7 ),
Pj 0.230 0.261 0.278 0.231 1.000
las dos soluciones n k y ñh concuerdan satisfactoriamente. 2 3 3 2
n.l
166 TE C N IC A S DE M U ESTRE O o tro s aspecto s del m u estreo e s t r a t if ic a d o 167
El objetivo de dar a cada escuela una oportunidad igual de selec TA B LA 5A.9. A s ic n a c ió n de l a M uestra a las 20 C eld as
ción, en tanto que se da a cada clase marginal su representación

proporcional. En esta ilustración n - 10. Calcule los números n¡. = A B C D Total
nP¡. y n.j = nP.f, donde estos productos se redondean al entero más
1 2 1 1 0 4
próximo (con un ajuste menor posterior, si se necesita, de tal ma 2
U 0 0 0 2
nera que los Tii. y los n., ambas sumen n ). Estos números se muestran III 0 1 0 1 2
en la Tabla 5A.7. IV 0 1 0 0 1
El siguiente paso es extraer n = 10 celdas con probabilidad V 0 0 0 l I
n¡.n.f/n* para la t;-ésima celda. Esto se hace al construir un cuadra
Total 2 3 3 2 10
do n X n (Tabla 5A.8). En la hilera 1 se extrae una columna al azar.
En la hilera 2 se extrae al azar una de las columnas restantes, y así
sucesivamente. Al final, cada hilera y cada columna contienen una entre las 15 escuelas en la celda IA y así las demás. La probabilidad
unidad. (Esta extracción se hace más rápidamente mediante una per de que se extraiga una escuela en la hilera i, columna ) es proporcional
mutación al azar de los números 1 a 10.) Los resultados de una a w¡.n.j/Pi>. Así, las probabilidades no son iguales, aunque lo serán
extracción se indican con X en la Tabla 5A.8. aproximadamente si P i; = n t.nf/n2.
Una estimación sin sesgo de la media por escuela es
T A B LA 5A.8. C uadrado 10 X 10 p a r a Extraer l a M uestra
. 1 v n2P„
y u = - l — y,¡
n tii.fi.f
Columna
donde y¡, es el total de la muestra en la ij-ésima celda. Sin embargo,
1 2 3 4 5 6 7 8 9 10
si Pa = ni.n.j/n2, la media de la muestra y es probablemente preferi
Hilera A B C D
ble, ya que su sesgo debería ser despreciable. Una estimación de la
1 X varianza de la muestra está disponible tanto para la estimación ses
X gada como para la no sesgada, puesto que n es cuando menos dos
2 1
3 X veces el más grande de R y C y cuando menos se extraen dos unida
4 X des en cada hilera y en cada columna.
Si en algunas celdas P¡, difiere marcadamente de ni.n.j/n-, un
X
paso extra conserva las probabilidades de selección de las escuelas
l “ X
casi constantes. Después de calcular las n¡. y n.,, examine las canti
X
dades D i, - nP¡) — ni.n.j/n, después de redondearlas a enteros. Si en
; ” X cualquier celda, Di, es un entero positivo, automáticamente asigne
Di, unidades a dicha celda. Reduzca n, los n¡, los n, en las cantida
9 IV X des requeridas par esta asignación fija y siga con la asignación res
tante como antes.
10 V X
5A.6 S E L E C C IO N C O N T R O L A D A
Nótese que las columnas 1 y 2 se asignan al estrato marginal A Goodman y Kish (1 9 5 0 ) nos dan otra técnica para este pro
ya que n¡ — 2. Similarmente, las hileras 1 hasta 4 se asignan al estado
blema con muestras pequeñas, llamada selección controlada. Existe
marginal I, ya que n, = 4 y así las demás. Esto completa la asignación
una Ilustración simple debida a Hess, Riedel y Fitzpatrick (1 96 6)
de la muestra a las 20 celdas. La asignación aparece en una forma
que aplicaron el método a un muestreo de hospitales, donde se ilustra
más compacta en la Tabla 5A.9. Dos escuelas se extraen al azar de la idea básica. La estratificación principal es por el tamaño del hos
o tro s aspecto s del m u estreo e s t r a t if ic a d o 16 9
pital (dos estratos). También es deseable la representación de dos < r < 40 selecciona 4', y así sucesivamente. De modo que 1 < r <
tipos de propietarios de hospital, pero sólo se va a extraer una unidad 20 selecciona (1 .3 '), 20 < r < 25 selecciona (1 ,4 ') y así sucesiva
(hospital) de cada estrato principal. A l numerar las unidades dentro mente. Las selecciones conjuntas y sus probabilidades son como sigue.
de los estratos se usa una prima ( ' ) que indica un tipo de propie
dad, la ausencia de este símbolo indica el otro tipo de propiedad. La Par: (1,3') (1,4') (2,4*) (2,5') (3', 5') (3', 1) (4', 1) (4', 2)
Tabla 5A.10 (lado izquierdo) muestra las unidades en ambos estratos. Probabilidad .20 .05 .15 .10 .10 .15 .05 .20
La única combinación no deseada es (3 ', 5 '). Por tanto, la

TA B LA 5A.10. Or d e n a m ie n t o d e las U n id a d e s D entro de lo s E strato s
probabilidad total de las combinaciones deseadas es .90.
P ara Se l e c c ió n Contro lad a
Como el muestreo no es independiente en los dos estratos, las
Estrato del orden Estrato del orden fórmulas para V ( y „ ) y v ( y „ ) no se aplican. Hess, Riedel y Fitzpatrick
original revisado
(1 9 7 6 ), dan fórmulas aproximadas. En esta monografía, también
I Gran hospital I I Pequeño hospital
se da un algoritmo para la apbcación de la selección controlada en
Gran hospital Pequeño hospital
problemas con más estratos, con un n mayor, y con controles más
1 1 1 3' complejos.
2 2 2 4' Para otro método que usa diseños por bloques incomplejos ba
3' 3' 3' 5'
4' 4'
lanceados, véase Avadhani y Sukhatme (1 973).
4' 1
5' 2
5A.7 L A C O N S T R U C C IO N D E LO S ESTR ATO S
Si se extrae la unidad 1 o 2 del estrato I, desearíamos extraer Este asunto presenta varios problemas. ¿Cuál es la mejor carac
las unidades 3', 4' o 5' del estrato II, de modo que ambos tipos de terística para la construcción de los estratos? ¿Cómo se determinan
estratificación se encuentren presentes con n = 2. De manera seme los límites entre estratos? ¿Cuántos estratos debería haber? Para
jante, 3' o 4' (estrato I ) es la unidad deseada con 1 o 2 (estrato II ). una sola característica o variable y, la mejor característica es, por
La selección controlada hace tan alta como es matemáticamente supuesto, la distribución de frecuencia de y. La siguiente mejor es
posible la probabilidad de estas combinaciones deseadas, al conservar probablemente la distribución de frecuencia de alguna otra cantidad
l.i misma probabilidad de selección dentro de los estratos y, por tanto, altamente correlacionada con y. Dado el número de estratos, las
las estimaciones insesgadas por medio de las fórmulas usuales para ecuaciones para determinar los mejores límites entre ellos bajo
el muestreo estratificado. El propósito es una mayor exactitud para un asignación proporcional y de Neyman, han sido obtenidas por Dale-
ti dado o bien, un ahorro en costos de campo. nius (1 9 5 7 ), otros investigadores han encontrado algunos métodos
Con el muestreo aleatorio estratificado, la probabilidad de una de aproximación más rápidos. Consideraremos la asignación de Ney
combinación deseada es ( . 5 ) ( . 6 ) 4- ( . 5 ) ( . 4 ) - .5. Esta probabilidad man, puesto que generalmente es superior a la asignación propor
puede incrementarse a .9 por dos cambios simples en la selección de cional en poblaciones donde se gana más al estratificar.
la muestra. Se reacomodan las unidades del estrato II, de modo que Se supone primero que los estratos se establecen al usar el va
las combinaciones deseadas (3 ', 4', 5 ') con 1 y 2 en el estrato 1 lor en sí de y.
aparezcan primero, como se ve a la derecha de la Tabla 5A.10. Pos- Sean y„, yL el valor menor y mayor de y en la población. El pro
leriormente se extrae un número aleatorio r entre 1 y 100 y se usa para blema es encontrar límites intermedios entre estratos yu y2, . . . . y¿,-j
seleccionar las unidades de ambos estratos. En el estrato I, 1 < r < tales que
25 selecciona la unidad 2, etc., de modo que cada unidad recibe un
cuarto de probabilidad de ser elegida. De manera semejante, en el
(5A.21)
estrato II, la condición 1 < r < 20, selecciona 3', la condición 21
170 TE C N IC A S DE M U ESTRE O OTROS ASPECTOS D EL M U E S TR E O E S TR A TIFIC AD O 171
sea un mínimo. Si se ignora la cpf, es suficiente con minimizar £ Si los estratos son numerosos y estrechos, f ( y ) debería ser aproxima
W»S». Dado que y* aparece en esta suma solamente en los términos damente constante (rectangular) dentro de un estrato dado. Por
W»S,, y W htlSu*i, tenemos lo tanto.
/ - ( I ^ 5 a ) = - ^ - ( W ^ ) + / - ( Í V , +1S,+1) Wh = [ " f ( l ) d í = f h(yh - y „_,)

dyh ¿yt. 5yh (5 A. 29)
Jyti-i
Ahora, si f ( y ) es la función de frecuencia de y,
= y = (y ». - y*-i) (5A.30)
= P ^ = f(y „ ) (5A.22)
J»h-i oy*
Z h - Z h- , = v'Tírj dr = V ^ y * —y*-i) (5A.31)
Además, •'vi •
donde f* es el valor "constante” de f ( y ) en el estrato h. Al sustituir

| m d ]
estas aproximaciones, encontramos
t2f i t ) d t *=* (5A.23)
í f(t)d t ^12 I W,Sh = 1 fh(yH- y k- xf = X (Z „ - Z h_ ,)2 (5A.32)
■'Vh-i h-1 ;>-l h=l
Al derivar (5 A .23 ) obtenemos Ya que ( Z c — Z.,) es fija, es fácil verificar que la suma en la dere
cha se minimiza al hacer (Z * - Z *.,) constante.
S„2^ + 2 WhSh^ = y„2f(yh) - 2yh» hf(yh) + ,2/( y„) (5 A. 24) Dada f ( y ) , la regla es formar la cumulativa de V f ( y ) y escoger
dy>. oyh las yK de tal manera que éstas formen intervalos iguales en la escala
cum V f ( y ) - La Tabla 5A.11 ilustra el uso de esta regla.
donde es la media de y en el estrato h. Súmese SfdWk/dy^ al lado
izquierdo y la cantidad igual SAIf(i/j,) al lado derecho. Esto da, al di Ejemplo. Los datos muestran la distribución de frecuencia del porcen
vidir por 2 S,, taje de préstamos bancarios dedicados a préstamos industriales en una
TA B LA 5 A .1 1 . Cálculo de los L ím it e s de E strato co n la Reg la Cum

( 5A25)
dy* dy* óyh ¿ Vñy)
Similarmente encontramos Préstamos Préstamos
industriales „ Cum industriales Cum
(5A26) ¿ / (y ) % /(y)
Préstamos v 7 cP) Préstamos v'/oíj
totales totales
Por lo tanto, las ecuaciones de cálculo para y» son
0-5 3464 58.9 50-55 126 340.3
(yh - ^ h)2+ S h2 ( y , - ^ ) 2+ S U 5-10 2516 109.1 55-60 107 350.6
(ft - 1 ,2 , (5A.27) 10-15 2157 155.5 60-65 82 359.7
S/i+¡
15-20 1581 195.3 65-70 50 366.8
Desafortunadamente, estas ecuaciones están mal adaptadas para cál 20-25 1142 229.1 70-75 39 373.0
culos prácticos, ya que tanto /a* como S* dependen de */*. Un método 25-30 746 256.4 75-80 25 378.0
rápido aproximado, debido a Dalenius y Hodges (1 95 9) se presen 30-35 512 279.0 80-85 16 382.0
35-40 376 298.4 85-90 19 386.4
ta para minimizar £ W»S*. Sea
40-45 265 314.7 90-95 2 387.8
45-50 207 329.1 95-100 3 389.5
Z (y )= f vTW df (5A.28)
172 TE C N IC A S DE M U ESTRE O OTROS ASPECTO S D EL M U E S TR E O E S TR A TIFIC AD O 173
población de 13 435 bancos de los Estadose Unidos de Norteamérica (1 96 6) encontraron que el método de Ekman es ligeramente supe
(M cEvoy, 1956). La distribución es oblicua, con su moda en el extremo inferior. rior al método cum V f y al de Sethi para L > 2, también Murthy
En la columna cum y/f, 58.9 ■= x/3 436, 109.1 = y/Z 464 + y j2 516, y así (1 9 6 7 ) obtiene buenos resultados con el método de Ekman.
sucesivamente. __ Las relaciones (5A . 32) tienen una consecuencia interesante. Si
Supóngase que se quieren cinco estratos. Dado que el total de cum y/f W»S* es constante, la asignación de Neyman, da un tamaño de mues
es 389.5, los puntos de división deberían estar a 77.9, 155.8, 233.7 y 311.6 en
tra constante nh - n/L en todos los estratos. Para los métodos apro
esta escala. Los puntos disponibles más cercanos son los siguientes:
ximados, las comparaciones realizadas sugieren que la regla simple
Estrato re» - n/L es satisfactoria.
Hasta áquí, hemos supuesto en forma poco realista que la estra
1 2 3 4 5 tificación se puede basar en los valores de y. En la práctica, se utiliza
alguna otra variable x (tal vez el valor de y en un censo reciente).
Límites _ 0-5 % 5-15% 15-25% 25-45% 45-100% Dalenius (1 9 5 7 ) desarrolla ecuaciones para límites de x que mini
Intervalo en cum .'S f 58.9 96.6 73.6 85.6 74.8 mizan Y. Sy,„ siempre y cuando se tenga cierto conocimiento de
la regresión de y sobre x. Si esta regresión es no lineal, estos lím i
tes pueden diferir considerablemente de los óptimos, cuando x es
Los dos primeros intervalos, 58.9 y 96.6, son bastante desiguales, pero no la variable que se mide. Sin embargo, las ecuaciones significan
se pueden mejorar sin una subdivisión más fina de las clases originales.
que si la regresión de y sobre x es lineal, y la correlación entre y y
Si los intervalos de clase en la distribución original de y son de x es alta, dentro de todos los estratos, los dos conjuntos de límites
longitudes desiguales, se necesita un ligero cambio. Cuando el in deberían ser casi los mismos. Sea
tervalo cambia de uno de longitud d a uno de longitud ud. el valor y = a + füx + e
de y / f para el segundo intervalo se multiplica por y/u al formar cum
donde E ( e ) = 0 para todo x y e, las x no son correlacionadas. La
VT-
varianza de e dentro del estrato h es S ^ . Entonces, los límites de x
Otro método propuesto por Sethi (1 9 6 3 ) consiste en encontrar
que minimizan V (y At) satisfacen las ecuaciones (Dalenius 1957).
los límites dados por las ecuaciones de cálculo (5 A .2 7 ) para una dis
tribución continua estándar, parecida a la población de estudio. P 2[(xh ~Hxh)2+ Sih2]+2Sth2 0 2[(xh - fix h * i)2+ S 2
. k^,]+2S2L^,
Para las distribuciones normales y varias distribuciones x2 Sethi ta eSxhJ H -S '„ 2/f}2Slh2
buló los límites óptimos para asignaciones de Neyman, iguales y
Si S'S/p-S,** es pequeño para todo h, estas ecuaciones se reducen a
proporcionales para L < 6 . Si una de estas distribuciones parece apro la forma (5 A .2 7 ) que da los limites óptimos para x. Pero S)h/p2S x
2h =
ximarse a la población de estudio, los límites se pueden encontrar en (l~Pii )/Ph donde ph es la correlación entre y y x dentro del es
las tablas de Sethi. trato h.
Otros dos métodos aproximados requieren algo de prueba y error. Aunque es necesario continuar la investigación, este resultado
A partir de las relaciones (5 A .3 2 ) la regla de Dalenius-Hodges es más sugiere que la regla de cum y / f aplicada a x debería dar una estrati
o menos equivalente a hacer W hSh constante, como lo conjeturó an- ficación eficiente para otra variable y que tiene una regresión lineal
les Dalenius y Gumey (1 9 5 1 ). Una regla semejante es la de Ekman de x con correlación elevada. Algunos resultados numéricos por
(1959), en la que W „ (yu - yh_t) se hace igual a una constante. Cochran (1 9 6 1 ) corroboran esta conjetura. Además, si las p* son
Al comparar ciertas poblaciones teóricas y ocho poblaciones de apenas moderadas, como sucederá cuando aumenta el número de es
estudio. Cochran (1 9 6 1 ) encontró que la regla cum y / f y la regla tratos, la falla, al usar los límites óptimos de x, debería tener un
de Ekman tenían resultados consistentemente buenos (n o intentó el efecto menor en y.
método de Sethi). En un estudio sobre capacidad (cam as) de hospi La discusión anterior es desde luego, principalmente pertinente
tales en los Estados Unidos, cuya distribución se asemeja a una distri al muestreo de instituciones estratificadas por alguna medida de
bución x5 con un grado de libertad, Hess, Sethi y Balakrishnan tamaño. La situación es diferente cuando un grupo de variables está
OTROS ASPECTO S D EL M U E S TR E O E S TR A TIFIC AD O 175
V (y „ )/ V (y ) fueron 0.232, 0.098 y 0.053 para L = 2, 3, 4, en com

estrechamente relacionado con y, y otro grupo está relacionado con
paración con 0.250, 0.111 y 0.062 para la distribución rectangular
y, con una distribución de frecuencia marcadamente distinta. Una
Estos resultados, que sugieren que la multiplicación de estratos
posibilidad es buscar límites de estratos de compromiso que satisfa
es provechosa, presentan un cuadro engañador respecto a lo que pa
gan las tolerancias deseables en V (yu,) y V'(y2„), siguiendo el enfoque
sa cuando alguna otra variable x se usa para construir los estratos
general dado en la Sec. 5A.4, pero no se han desarrollado los méto
Si <f>(x) = E ( y j x ) es la regresión de y respecto a x, podemos
dos de cálculo. escribir
En la estratificación geográfica el problema es menos tratable
matemáticamente porque existen muchas maneras diferentes de y = </>(•*) + * (5A. 34)
formar los límites de estratos. El procedimiento usual es estimar al donde <p y e no están correlacionados. Por lo tanto
gunas variables de alta correlación con las características principales
de la encuesta y usar una combinación de sentido común y prueba y Sy2= SA2+Se2 (5A.35).
error para construir buenos límites para estas variables seleccio De acuerdo con los resultados anteriores, la creación de L estratos
nadas. Dado que las ganancias en precisión con la estratificación es para x puede reducir a Sp2/L2 si </>(x) es lineal o en un grado
probable que sean modestas, no vale la pena hacer un gran esfuerzo menor si <¡>(x) no es lineal. Pero el término S«2 no se reduce por la
para mejorar los límites. Las bases de la estratificación para ítems estratificación según x. Conforme L aumenta, tarde o temprano
económicos han sido discutidas por Stephan (1 9 4 1 ) y Hagood y se alcanza un valor en el cual domina el término St!- Aumentos pos
Bemert (1 9 4 5 ) y para ítems agrarios por King y McCaxty (1 941). teriores en L producirán solamente una reducción trivial proporcional
en V (y ,i).
5A.8 N U M E R O DE E S T R A T O S Cuan pronto se alcance el punto de retomos decrecientes de
pende de un número de factores — particularmente los tamaños
Las dos preguntas pertinentes a una decisión sobre el número relativos de Sr2 y S,= y la naturaleza de <¿>(x)— . Sólo unos pocos ejem
de estratos L son ( a ) ¿en qué proporción decrece la varianza de y„ plos con datos actuales se encuentran en la literatura. Para suple
conforme aumenta L? ( b ) ¿Cómo se afecta el costo del reconocimien mentarios, se usa aquí un procedimiento teórico simple. Supóngase
to al aumentar L? que la selección óptima de límites de estrato por medio de x, con
Con respecto a: ( a ) , supóngase primero que los estratos se muestras de igual tamaño n/L en cada estrato, reduce V ( x „ ) en
construyen con los valores de y. Para tomar el caso más simple una relación proporcional a 1/L2. Entonces
sea rectangular la distribución de y en el intervalo ( a, a + d). En
tonces, S„2, antes de la estratificación, es d2/ 12, de tal manera que V ( x - „ )= - I Wh2S2
xh= K (5A.36)
n nL
con una muestra aleatoria simple de tamaño n, V(]/) = d*/12n. Si
se crean L estratos de igual tamaño, la varianza dentro de cualquier Supóngase también que la regresión de y en x es lineal, esto es,
estrato es S,Jh2 = dr-/l2L2. Por lo tanto, para una muestra estratifi y=a+0x+e (5A.37)
cada, con W„ ■= 1/L y nh « n/L,
donde S,s es constante. Entonces,
h m -í( i "w O ’ - K Ü ■ T É t ó - T ? <5A33)

V(?',) = - i W Â=— i i W„2 (5A.38)
n h- i n i n h*i
Entonces, con una distribución rectangular la varianza de Xf,t decre
ce inversamente con el cuadrado del número de estratos. Es notable Para cualquier grupo de L estratos, £ A l usar (5A.36)
que esta relación se mantiene, aproximadamente, cuando se estra tenemos ^
tifican distribuciones oblicuas con extensión finita mediante la
v w ,) a A ( ^ + V ).£ [£ l+ (lV )] ( 5 A . 3 9 )
selección de límites óptimos para la asignación de Neyman. En
ocho distribuciones de datos del tipo que puede que ocurra en la
donde p es la correlación entre y y x en la población por estratificar.
«>4 «Hro Cnchran (1 9 6 1 ) encontró que los valores promedio de
176 TE C N IC A S DE M U E S TR E O o tro s aspecto s del m u estreo e s t r a t if ic a d o 177
Con este modelo, la Tabla 5A.12 muestra V (y el) / V ( y ) para si no se requiere cambio alguno en la organización del trabajo de cam
P = 0.99, 0.95, 0.90 y 0.85 y L = 2 a 6 , suponiendo que la rela po; en otras, se establece una unidad de campo separada en cada
ción (5 A .39 ) es una igualdad. Las columnas del lado derecho de estrato. Cualquiera que sea la forma de la función de costo, los
la tabla dan V (y J{) / V ( y ) para tres conjuntos de datos actuales, resultados en la Tabla 5A.12 sugieren que si un aumento en L más
descritos abajo de la tabla en donde x es el valor de y en alguna allá de 6 necesita cualquier reducción en n para mantener el costo
ocasión anterior. constante, el aumento es rara vez provechoso.
Los resultados para el modelo de regresión indican que a me La discusión en esta sección está confinada a encuestas en las
nos que p exceda 0.95, deberá esperarse poca reducción de la va cuales se van a hacer estimaciones globales. Si también se desean
rianza más allá de L *=> 6 . Los conjuntos de datos 2 y 3 apoyan esta estimaciones para subdivisiones de la población, es más fuerte el
conclusión, aunque un nuevo incremento de L puede ser provecho argumento en favor de un número mayor de estratos.
so en el caso del registro en colegios (grupo ). En dos comparaciones
sobre datos de encuesta, Hess, Sethi y Balakrishnan (1 9 6 6 ) encon
traron que V ( i ) „ ) decrecía más rápidamente con L de lo que(5A.39) 5A.9 E S T R A T IF IC A C IO N D E S P U E S D E L A SE LE C C IO N
predice, lo que sugiere que el modelo (5 A .37 ) es una sobresimpli- D E L A M U E S T R A (P O S T E S T R A T IF IC A C IO N )
fícación.
Con algunas variables adecuadas para la estratificación, el es
Para completar este análisis, requerimos una función de costo que
trato al que pertenece una unidad no se conoce sino hasta después
muestre cómo éste depende de L. Dalenius (1 9 5 7 ) sugiere la rela
de recoger los datos. Ejemplos comunes son las características
ción C - L C , + toC„. La razón de costo C,/Cn variará con el tipo
personales como la edad, el sexo, estatura, etc., y el nivel de educa
de encuesta. Un aumento en el número de estratos implica trabajo
ción. Los tamaños de los estratos N h se pueden obtener de ma
extra en la planificación y extracción de la muestra y aumenta el
nera bastante exacta a partir de las estadísticas oficiales, pero
número de ponderaciones usadas en el cálculo de los estimados, a
las unidades se pueden clasificar en estratos, solamente después de
menos que los mismos sean autoponderados. En algunas encuestas ca-
conocer los datos de la muestra. Aquí suponemos que W* y los N h son
conocidos.
T A B L A 5 A .12 . V (5 ),)/ V (? ) Como una F u n c ió n de L Para el M odelo
Un procedimiento consiste en tomar una muestra aleatoria sim
de R e g r e s ió n L i n e a l y A lg unos D ato s Reales
ple de tamaño n y clasificar las unidades. En lugar de la media
Modelo de regresión lineal Datos, grupo muestral y usamos la estimación y w = £ Whyh, donde yh es la media de
las unidades de la muestra que caen en el estrato h y W h = N»/N.
P =
Este método es casi tan preciso como el muestreo estratificado pro
L 0.99 0.95 0.90 0.85 1 2 3
porcional siempre y cuando: ( a ) la muestra sea razonablemente
0.323 0.392 0.458 0.197 0.295 0.500 grande, digamos mayor que 20 en cada estrato, y ( b ) los efectos
2 0.265
3 0.129 0.198 0.280 0.358 0.108 0.178 0.375 de los errores en las ponderaciones W h puedan ignorarse (v e r la
4 0.081 0.154 0.241 0.323 0.075 0.142 0.244 Sec. 5A.2).
5 0.059 0.134 0.222 0.306 0.065 0.105 0.241 Para demostrarlo, sea ttc* el número de unidades de la muestra
6 0.047 0.123 0.212 0.298 0.050 0.104 0.212 que se encuentran en el estrato h donde mHvariará de una muestra
oo 0.020 0.098 0.190 0.277 — — —
a otra. Para muestras en donde m* son números fijos que exceden
todos a cero,
Tipos de Datos
11/ 2o 2 1
Grupo Datos * V Fuente V(yw) = l ^ - ~ l W,Sh2 (5A.40)
1 Inscripciones a colegios 1952 1958 Cochran (1961) El valor promedio de V (y lc) en muestras repetidas de tamaño n
2 Tamaño de las ciudades 1940 1950 Cochran (1961) debe calcularse ahora. Esto requiere un poco de cuidado porque uno
3 Ingresos familiares 1929 1933 Dalenius y Gumey (1951)
o más de los m h podrían ser nulos. Si esto ocurriera, habría que com
178 TE C N IC A S DE M U ESTRE O OTROS A S rE C TO S D EL M U E S TR E O E S TR A TIFIC AD O 179
binar dos o más estratos antes de hacer la estimación, y se lograría dor elige personas al azar, dentro de las áreas geográficas, y asig
una estimación menos precisa. A l incrementar n, la probabilidad nase a cada una su estrato apropiado, el método coincidiría con el
de que cualquier mk sea nulo se hace tan pequeña, que la contri muestreo aleatorio estratificado. Se requiere una cantidad conside
bución a la varianza de esta fuente es despreciable. rable de trabajo de campo para completar las cuotas, porque en
En el caso en que m„ sea nulo, se ignora, Stephan (1 9 4 5 ) ha las últimas etapas, la mayoría de las personas examinadas, corres
demostrado que para los términos de orden ir* ponden a cuotas ya saturadas.
Para hacer más expédito el llenado de las cuotas, se permite
cierta flexibilidad al encuestador, en lo que respecta a las personas
£'(-“ ) (5A.4 i)
\mhJ nWh n Wh o domicilios por incluirse. El grado de flexibilidad en general es
Por tanto, variable, pero en general el muestreo por cuota puede describirse
como muestreo estratificado con una selección más o menos no alea
toria dentro de los estratos. Por esta razón, las fórmulas de error de
E [ V(yw)] = \VhSh2+ - 7£ (1 - Wh)Sh2 (5A.42)
n n muestreo no podrán aplicarse con confianza a los resultados de mues
tras por cuota. Cierto número de comparaciones entre los resultados
Eí primer término es el valor de V ( y „ ) para estratificación pro de muestras por cuota y por probabilidad han sido resumidos por
porcional. El segundo, representa el incremento en varianza que Stephan y McCarthy (1 9 5 8 ), quienes dan una crítica excelente so
surge ya que los m» no se distribuyen proporcionaimente. Pero bre el comportamiento de ambos tipos de reconocimiento. El mé
todo de cuota es probable que produzca muestras que contienen
- ^ 1 ( 1 - WJSh’ = - ( - ) s , 2— !r l WfcS„2= ^ r 5 * 2— Í j I WhSh2 (5A.43) sesgo en características tales como: ingresos, educación y ocupa
n n 'M/ n n n n
ción, aunque a menudo concuerda bien con las muestras por pro
donde §*= es el promedio de las S*s, y ñ» = n/L es el número prome babilidad en cuestiones de opinión y actitud.
dio de unidades por estrato. Así que, si las Si,- no difieren mucho,
el incremento es aproximadamente de (L — 1 )/Lñk veces la varian
5A.11 E S T IM A C IO N A P A R T IR D E U N A M U E S T R A
za para estratificación proporcional, al ignorar la cpf. El incremen
DE L A G A N A N C IA D E B ID A A L A
to será pequeño si ñ h es razonablemente grande.
E S T R A T IF IC A C IO N
Este método también puede aplicarse a una muestra ya estrati
ficada por otro factor, por ejemplo, en cinco regiones geográ Cuando se tomó una muestra aleatoria estratificada, puede ser
ficas, a condición de que los W * se conozcan separadamente en
de interés como una guía en la conducción de futuras encuestas,
cada región. Esta estratificación doble se emplea mucho en las en
estimar la ganancia en precisión en relación con muestreo aleato
cuestas nacionales de los Estados Unidos: véase Bean (1 97 0) para
rio simple.
una descripción de las fórmulas de estimación de la encuesta de
Los datos disponibles de la muestra son los valores de N h, nh,
salud por entrevistas, realizada por el National Center for Health
y,, y si,1. De la Sec. 5.4, la varianza estimada de la media ponderada
Statistics.
a partir de una muestra estratificada es, por la Fórmula (5 .1 3 ),
^ w „W
5A.10 M U E ST R E O PO R C U O T A
f < y « ) = I ---------- 1 -
nh N
En otro método usado para sondeos de opinión y en las in El problema es comparar esta varianza con una estimación de
vestigaciones de mercados, los n h requeridos en cada estrato se la varianza de la media que se hubiera obtenido de una muestra
calculan por adelantado, de modo que la estratificación sea pro aleatoria simple. Un procedimiento usado algunas veces calcula la
porcional. El enumerador tiene instrucciones de seguir muestreando
desviación cuadrática media de la media de la muestra.
hasta obtener la cuota necesaria en cada estrato. Las variables más
comunes para estratificación son el área geográfica, la edad, el Z (y/..-y )2
í 2=
sexo, la raza y alguna medida del nivel económico. Si el enumera- n- 1
180 TE C N IC A S DE M U ESTRE O OTROS ASPECTO S D E L M U E S TR E O E S TRATIFIC AD O 181
donde se ignoran los estratos. Esta se toma como estimación de s*, de Si n es grande, (n — 1 ) = n, ( N — 1 ) = N, y el término en
tal modo que Vran = ( N - n ) s 2/Nn‘ para la media de una muestra es de orden 1/n relativamente al término en s* en (5A.49).
aleatoria simple. Este método funciona bastante bien, si la asignación
es proporcional, ya que una muestra aleatoria simple está distri Luego, ' vran (5A.50)
buida en sí misma, aproximadamente en proporción, entre los es
tratos. Pero, si se ha adoptado una asignación alejada de la propor para asignación proporcional. En el caso general la simplificación
cional, la muestra tomada realmente no se parece a una muestra alea correspondiente (n grande) es
toria simple, y este ss puede ser un estimador mediocre. Damos un . (N - n )f 1
procedimiento general cuya prueba se debe a J. N. K. Rao (1962). V.an =
nN I N nh
Teorema 5A.1. Dados los resultados de una muestra aleatoria Ejemplo. Los cálculos se ilustran a partir de los tres primeros estratos
estratificada, un estimador insesgado de V,an, varianza de la media en la muestra de los colegios para maestros (Sec. 5.9). Los datos de la T a
de una muestra aleatoria simple de la misma población, es bla 5A.13 son para la muestra posterior de 1946. Las medias representan ins
cripciones por colegio en miles. Los valores s,2 son un poco mayores que
en la segunda edición, debido a una corrección.
v,an = 1 ( N —i ) [ ñ ? ^ ? y l - y l + ^ y s , ) ] (sa.44)
TA B LA 5A.13. D atos B á s ic o s de u n a M u estra E st r a t if ic a d a de
C o l e g io s de M aestros
donde v ( y „ ) es el estimador insesgado usual de V ( y sl).
Prueba. Estrato Nh n,, 9h i*2
( N —n)
V
* rart =■ . r
n¡\ ’ 5 y J (5 A -45) 1 13 9 2.200 1.8173 83.920
2 18 7 1.638 0.0735 49.429
Ahora bien
3 26 10 0.992 0.0859 27.596
i /l \r, "h \ i l Nh
(5A.46) 57 26 160.945
A \h nh i / J'i h i
También como v ( y . t ) y y „ son estimadores insesgados de V ( y ,t) y
Y, respectivamente, Si n es pequeña usamos la Fórmula (5 A .4 4 ). Encontramos y „ = 1.4715.
Los valores de las yñ, para la muestra no se reportaron, pero e l número en
£ v(y „) = V(y„) = E ( f „ ) - Y 2 (5A.47) la columnas de la derecha puede obtenerse de las precedentes de la Tabla 5A.13.
Las fórmulas dan
y luego un estimador insesgado de Y 5 en (5 A .4 5 ) es
v(y„)-4l— =0.00497
y l~ v (y ¡t) (5A.48) /v
De (5 A .46 ) y (5 A .4 8 ) se infiere que un estimador muestral inses
gado de Vraa en (5 A .4 5 ) es - d ¡ k F ^ , i '4 7 i 5 > , + o o ° 4 9 7 ] - 0 0 , 4 1 2
La estratificación parece haber reducido la varianza a (aprox.) un tercio

(5A.44) del valor para una muestra aleatoria simple, siendo e l factor por efecto de
diseño, estimado, (Sec. 4.11), igual a 0.00497/0.01412 - 0.35.
Así se demuestra el Teorema 5A.1.
Con asignación proporcional, (N '/n * = N / n ), los dos prime
5A. 12 E S T IM A C IO N D E L A V A R IA N Z A C O N U N A
ros términos dentro de los corchetes cuadrados vienen a ser ( 1/n)
U N ID A D P O R E STR A TO
veces la suma de cuadrados dentro de muestra = ( n — 1 )s*/n. La
Fórmula (5 A .44 ) se reduce entonces a Si la población es altamente variable y se conocen numerosos
(N-n) r(n-l) , ,1 criterios efectivos por estratificación ésta se puede llevar a cabo
n (iV - 1) L „ 5 +t,(yn)J (5A49) hasta el punto en que la muestra contenga sólo una unidad por es
182 TE C N IC A S DE M U ESTRE O OTROS ASPECTOS D EL M U E S TR E O E S TRATIFIC AD O 183
trato. En este caso, las fórmulas dadas anteriormente para estimar Si A* es un buen pronóstico, el sesgo positivo del término v2 que
V ( Y , i ) y V ( y „ ) no podrán usarse. Con L par, se puede intentar una proviene de las desviaciones (Y/* — Ay*Y,/A, ) 2 es de esperarse
estimación al agrupar los estratos en pares que de antemano se que sea menor al término correspondiente en v,, aunque difiriera de
cree que tienen aproximadamente los mismos totales de estrato. La Vi, Vi también da una estimación sesgada del término en la SY que
asignación en pares deberá hacerse antes de ver los resultados de aparece en V ( Y „ ) . Hartley, Rao y G. Kiefer (1 96 9) encontraron
la muestra por razones que veremos en lo sucesivo. que Vi es menos sesgado que v2 en dos de tres poblaciones, con poca
Sean y „ , y¡-> las observaciones de la muestra, en un par típico, diferencia en la tercera.
donde j recorre los valores de 1 a L/2. Sea Y ¡ t - N n y,u Y¡2= Ni2yn Estos autores desarrollaron un método que no involucra la con
los totales estimados de estratos. Ahora tracción de estratos. Este método usa una o más variables auxiliares
Y}, - Y l2 = (Y n - Yn ) + (Y „ - Y n ) - ( f l2- Y¡2) (5A.52) xIk, x n y así_sucesivamente, sobre las cuales las verdaderas medias
de estratos Y* se cree que tienen una regresión lineal. Si y¡> es el
Luego, al promediar en todas las muestras de este par
valor muestral en el estrato h, el método usa las desviaciones
E ( Y n - Yrf = ( Yn - Yj2)2+ N n (Nn - l ) S 2i + N,2(N¡2- 1 )Sj2 (5A.53)
d h = y h -y - X b ¡( x ¡ h - x ¡ ) (5A. 58)
Para V ( Y „ ) considérese la estimación i
La matriz de varianza y covarianza de las dh puede expresarse
v A Y , . ) = l (Y'/í-Y/z)2 (5A.54) como una función lineal de las <n,2 más ciertos términos de sesgo.
/-i A l invertir esta relación, se obtienen estimaciones <Y donde o-,,2 =
Por (5 A .5 3 ) el valor esperado de esta cantidad es (N h- l ) S 2/Nh, lo queda
r , U2
E v i (Y„)*= £ N h(N h- í ) S h2+ I ( Y/i — Yj2) (5A.55)
h=l i- 1 v3( Y „ ) = £ N h2áh2 (5A.59)
El primer término de la derecha es la varianza correcta (p or el
El método parece prometedor y se extiende aestimaciones de razón,
Teorema 5.4 con n h ** 1 ). El segundo, representa un sesgo positivo
pero losautoresprevienen que se necesitan métodosadicionales de
cuyo tamaño depende del éxito alcanzado al seleccionar pares de
comparación con “estratos contraídos” .
estratos cuyos verdaderos totales difieren un poco. La forma de la
A l utilizar otro enfoque, Fuller (1 9 7 0 ) desarrolló un método de
estimación (5 A .54 ) nos dice que la construcción de pares al hacer
construcción de estratos que proporciona una estimación muestral
que los totales estimados de muestra difieran lo menos posible,
insesgada de V (Y al) con una unidad por estrato. Por sencillez, su
puede conducir a una seria subestimación. La técnica se llama mé
pongamos que N/n = N / L = fe (un entero). Elíjase un número
todo de los “estratos contraídos".
aleatorio r entre 1 y fe. El primer estrato consiste en las unidades nu
Con L impar, cuando menos un grupo debe ser de tamaño dife
meradas de ( r + 1 ) hasta ( r + fe), el segundo, de las unidades
rente de 2. La extensión de la estimación (5 A .5 4 ) a G gTupos de
numeradas de ( r + fe + 1 ) hasta (r + 2 fe) y así sucesivamente, el
cualesquier tamaños elegidos L, > 2 es
último estrato (L-ésimo, n-ésimo) de las unidades numeradas de
S T^T I (Y * - Yí/L,)2 (5A.56) r + (-n — 1 )fe + 1 hasta N = ufe y aquellas de 1 a r. A primera
í - l L ¡ ~ í ic = t vista, este último estrato parece ser una elección mediocre. Pero co
donde Y¡ es el total estimado para el grupo ;. Para L¡ = 2, cuando mo Fuller lo hace notar, el método da resultados en la estratifica
Y, - Y n + Y¡2, esta forma concuerda con (5 A .5 4 ). Como ocurre con ción geográfica con unidades de área. Aquí, la estratificación suele
(5 A .5 4 ), la esperanza de esta v x{ Y „ ') da la varianza correcta V ( Y „ ) basarse en la noción de que las unidades cercanas entre sí tienden
más un sesgo positivo que sustituye Y,* y Y, por Y,* y Y, en (5 A .56 ) a ser semejantes. Al numerar las unidades como serpentina, podemos
Cuando se conoce una variable auxiliar A,-, para cada estrato, tener y,v cerca de y, de modo que el estrato que contiene yy y y, tam
que pronostica el total de estrato Y*, Hansen, Hurwitz y Madow (1953) bién puede ser internamente homogéneo. La estimación x>(Y,i) es
sugirieron el estimador de varianza alternativo una suma ponderada de las diferencias (y* -
El método circular sería menos efectivo para una población con
Vi{Yv) = £ ~r~L~\ í ( % - A i k Y M i ) 2 (5A.57) tendencia creciente de y, a y.v en donde el estrato que incluye y, y
(=1 L, —I k=\
184 TE C N IC A S DE M U E S TR E O OTROS ASPECTOS D E L M U E S TR E O E S TRATIFIC AD O 185
i/y tendría una considerable variabilidad interna. Para esta situa Esta regla puede dar como resultado una comparación más
ción, Fuller da un segundo plan, un poco más complejo, que debería precisa en algunos pares de estratos y en otros una compara
proporcionar una buena precisión con tendencia creciente y también ción menos precisa de los apropiado. Como alternativa tenemos la
proporciona una estimación insesgada de V ( Y „ ) . selección de nh de modo que la desviación estándar de la diferencia
sea la misma, digamos y/Vpara cada par de estratos. Esto equivale
5A.13 ESTRATOS C O M O D O M IN IO S DE E S T U D IO a hacer S*Vm = V/2 para cada estrato. Para un costo fijo, este
método proporciona menos precisión global que el primero. Se pue
En esta sección veremos las encuestas cuyo propósito primordial de verificar que las dos asignaciones óptimas dan
es el de comparar entre diferentes estratos, supuestamente identi-
ficables de antemano. Las reglas para asignar los tamaños de mues V -2 g S !& l (5A.65)
tra para los estratos, son diferentes a las que se aplican cuando el L ( C —c o) \C Co)
objetivo es estimar globales de población. Si sólo hay dos estratos, Se infiere de la desigualdad de Cauchy-Schwarz que V es siempre
podríamos elegir n „ n 2 para minimizar la varianza de la diferencia
mayor que V excepto cuando Sj,Vcj. = constante. Si V es bastan
(y, — y2) entre las medias estimadas de estratos. A l omitir la cpf
te mayor que V en ocasiones se puede encontrar una asignación de
por razones que vimos en la Sec. 2.14, tendremos
compromiso, con un poco de prueba y error, que dará una varianza
promedio cercana a V y conserve V (y k - y>) razonablemente cons
V ( y i - y 2) = — ■+■— (5 A . 60)
«i n2 tante.
Con una función costo lineal Si el objetivo es obtener estimaciones para cada estrato, así co
C = c0 + c 1/i1+ c 2n2 (5A.61) mo estimaciones globales para toda la población, al planear una en
cuesta podríamos especificar las siguientes condiciones
V se minimiza cuando
nS 1 nS2
F(yfc) = — (1 - A ) s Vh, V (y J = I (l-A )sV
nh nh
n 1= ------ .—ÍCl-- j= , n2= -------¿ 2 .---- (5A.62)
S ¡I C\+ S2f v c2 •5i/vCi + 52/Vc2
Se incluyen ahora los términos cp f porque el propósito es especi
Con L estratos, L > 2, la asignación óptima depende de la precisión ficar la precisión con la que deben estimarse las medias en la po
deseada en las diferentes comparaciones. Por ejemplo, el costo po blación finita. Las condiciones sobre las V (ifr) determinan límites
dría minimizar siempre y cuando el conjunto de L ( L - l)/ 2 haga inferiores a los valores de los n*. Si estos límites inferiores satisfacen
que V (y h - y ¡) < Vhi, donde los valores de Vhi se eligen según la la condición sobre V (y 3¡), se ha resuelto el problema de asignación.
precisión que se considere necesaria para una comparación satisfac Cuando la condición impuesta a V ( y „ ) no se satisface, tenemos un
toria de los estratos h e i. método gráfico elaborado por Dalenius (1957).
Con frecuencia hay un método de asignación, más simple pero
Cuando los L = 2* estratos representan todas las combinaciones
adecuado, especialmente si las Sh y c* no difieren mucho. Un en
de k factores en dos niveles, surgen problemas más complejos y el
foque es el de minimizar la varianza promedio de la diferencia entre
objetivo es estimar los efectos promedio de los factores. Si el estrato
todos los L ( L — l)/ 2 pares de estratos, o sea minimizar
o celda al que pertenece cualquier miembro de la población, se co
noce de antemano (antes del muestreo) podrá sacarse del estrato
(5 A .63)
L\n 1 n2 nL J h una muestra de tamaño deseado. n h Para 2, 3 o 4 factores, Sedransk
(1 96 7) ha dado métodos para determinar los nh que minimizan el
V se minimiza, para C fija, por medio de la regla de (5 A .62 )
costo en diferentes especificaciones respecto a las varianzas de los
nhcc-^= (5A.64) efectos promedio estimados de los factores, y la potencia deseada
ve* de una prueba para interacciones.
186 TE C N IC A S DE M U ESTRE O OTROS A SPE CTO S D E L M U E S TR E O E STRATIFIC AD O 187
5A.14 E S T IM A C IO N D E T O T A L E S Y M E D IA S SOBRE donde las S**, es la varianza entre unidades en el dominio j, dentro
S U B P O B L A C IO N E S del estrato h. Pero en la práctica rara vez se conocen los N-H¡.
Con frecuencia sucede que las subpoblaciones o dominios de es Estimación de Totales de Dominios
tudio estén representados en todos los estratos. Si la estratificación
es geográfica, por ejemplo, pueden desearse estimaciones separa A falta de los N h¡ cada total de estrato del dominio se estima co
das de toda la población, para hombres y mujeres, para diferentes mo en la Sec. 2.13. Estos totales se suman para obtener un total de
grupos de edades, para usuarios y no usuarios de equis pasta den dominio estimado, o sea
tal y cosas semejantes. El problema presenta algunas complicacio Ni. "*»
nes. Las fórmulas básicas las dio Yates (1 9 5 3 ), y Durbin (1 9 5 8 ) y yi = /1— 1 y*/
. nh i
(5A.67)
Hartley (1 9 5 9 ) aportaron discusiones y pruebas. En las Secs. 2.10
y 2.11 se vieron los métodos aplicables a un solo estrato. La varianza verdadera y estimada de Y) se encuentra por medio
La notación siguiente se aplica a las unidades del estrato h que del artificio usado en la Sec. 2.13. Se introduce una variable yU que
se encuentran en el dominio j. es iguala y para todas las unidades deldominio j e igual a cero
Notación. paratodas las otras unidades de la población. Como se demostró en
la Sec. 2.13, esto da para la varianza estimada
Número de unidades: Nh„ Y N h¡ = N h
i v{Yi) = lh- nh(nh
f f - \n) ( w 4 L"¿f ( 5A. 68)
, nh J
Número en la muestra: nh„ Y nh¡ = nh
i
Medición en la unidad individual: y^ Estimación de Medias de Dominio
Para estimar la media de dominio Yf/Nj se requiere una esti

Media muestral: yh¡ = Y —
i-i nhj mación muestral de N,. La siguiente es una estimación insesgada
N
Media de dominio: Yh, = Y T T Ñ, = l — nHi (5A.69)
i - 1 N i„ i- nh
El total y la media de la población para el dominio j sobre todos los De modo que tomamos
estratos, es respectivamente:
Y ( N J n k) Y y mí
Y , = i N , , ñ y, y ,= -£
h N¡ w Nj- v,v/ v
Y ( N J n H)nhi (5A-7°)
donde N) = Y N*,-. h
h
Las cosas se complican porque los n h¡ son variables aleatorias. Con estratificación proporcional, Y, se reduce a la media de la mues
Si los N.kj se conociesen, el problema sería simple. Como estimacio tra ordinaria de las unidades que caen en el dominio j. En general
nes de Y¡ y Yh podríamos usar esta estimación se conoce como una estimación de razón combinada,
que discutiremos más tarde en la Sec. 6.11. Para demostrarlo, se
introduce otra variable muda x?hi que es igual a 1 para cada unidad
en el dominio ; y cero para todas las otras unidades, donde ahora,
Por el método descrito en la Sec. 2.12 la fórmula ordinaria para i va de 1 a N*. Claramente,
Y(!Á/) sigue siendo válida, siempre que todos los nK¡ > 0. Así
v (y / )= S ^ ^ (i-_ M (5A66)
188 TE C N IC A S DE M U ESTRE O OTROS A SPE CTO S D EL M U E S TR E O E S TRATIFIC AD O 189
De modo que la media de dominio estimada puede escribirse

5A.15 M U E S T R E O A P A R T IR D E DO S M A R C O S
I (V h/nh) I yhil Y.Nhyh'
ó —h__________' —_*_______ = LÜ (u 72) Uno de los primeros ejemplos del uso de una muestra tomada de
' I ( N J n h)n hj l N hx h' x'„ una lista B de grandes negocios, en combinación con una muestra
h h
de un marco A por áreas, que cubre la población completa, es la en
Esta es la fórmula para la estimación combinada de razón para las cuesta por muestreo en 1949 de las tiendas al menudeo, que tomó
dos variables yu' y Xm'. En la Sec. 6.11 vemos que la varianza esti la oficina de censos, y que describen Hansen, Hurwitz y Madow
mada puede expresarse aproximadamente como (1 9 5 3 ) (Pág. 516 y siguientes). Los objetivos del uso combinado
de una lista marco incompleta y un marco por áreas completo, eran
v(V,) = I [yM* - t x v ' - W - y ^ f (5A.73) ganar exactitud y ahorrar dinero. Los grandes negocios en ocasiones
se pueden muestrear a bajo costo gracias a una combinación de
La segunda suma puede escribirse correo y teléfono: además, al ser negocios grandes también tienen
la varianza más grande para las variables y que se miden. AI co
I (y ./ " (ywy - Y,)2- ^ ( y bj- Y , ) 2 (5A.74) locarlos en un estrato separado con asignación óptima (o con mues
i i "h treo del 100-% si esto parece ser lo más cercano al óptimo) se pro
Al usarlo (5A.71). Además, el primer término de (5 A .7 4 ) puede ducen incrementos importantes de exactitud. En la encuesta de las
expresarse alternativamente como tiendas al menudeo, los negocios de la lista marco que caían en
la muestra de áreas se identificaron y retiraron del área de muestreo,
I (y h i t - y h ¡ Y + n hí( j h¡ - Y,)2 para que la población muestreada cayera en dos estratos distintos.
i Este proceso llamado dedu-plicación lo llevó a cabo el supervisor de
liiNertnndo estos resultados en (5 A .73 ) finalmente se tiene para la campo antes del muestreo. La deduplicación se complica a veces y
vurlanzu estimada presenta errores. Algunas de las dificultades prácticas las discu
ten Hansen, Hurwitz y Jabine (1 9 6 3 ) al igual que discuten la ma
nera como se pueden utilizar las bstas incompletas.
■l f c (5 A -75) La identificación de los miembros de la muestra a partir de la
El término a la derecha representa una contribución entre estra muestra del marco A que pertenecen a la bsta marco B, en oca
tos a la varianza. Las diferencias entre las medias de estratos no siones requiere que se midan las variables y para estos miembros.
su «llminan totalmente de la varianza de la media estimada de cual Entonces el muestreador tiene tres muestras a su disposición en las
quier subpoblación. La contribución entre estratos es pequeña si los que se ha medido y — una muestra del estrato a (la parte de A que
términos 1 - n»>/n* son pequeños, es decir si la subpoblación es no pertenece a B ) y dos muestras independientes del estrato B. Una
casi tan grande como la población total. de ellas se denota con el subíndice ab y es la muestra obtenida de A
que se identifica como perteneciente a B, y la otra se obtiene por
Como ha señalado Durbin (1 9 5 8 ), (5 A .7 5 ) se apbca también
muestreo directo del marco B. Con el marco A completo y muestreo
a las medias estimadas para toda la población, si la muestra fuera
aleatorio simple de ambos marcos, Hartley (1 96 2) propuso que
Incompleta por razones tales como: no-respuestas, siempre y cuan
ambas muestras B se usaran en la estimación postestratificada.
do, se use la estimación Y¡. En este caso se interpreta como la
inedia estimada para la parte de la población que daría una res ? = Naya + Nab(pyab +qyB) (5A.76)
puesta con los métodos empleados de recolección de datos. Pero donde ya, y^, yB denotan las medias de muestra respectivas. Los fac
oxlstc una complicación adicional ya que la parte no-respuesta de tores de ponderación p y q para las dos muestras que pertenecen
la |K)blación suele tener una media diferente de la parte que sí res al marco B, con p + q - 1 se eligen para minimizar V (V ') con una
pondo. Por lo tanto, Y, es una estimación sesgada de la media de función costo de la forma
«oda la población y esta contribución sesgada no aparece en (5 A .75 ).
C = cAnA + c Bn B (5A.77)
190 TE C N IC A S DE M U E S TR E O OTROS ASPECTO S D EL M U E S TR E O E STRATIFIC AD O 191
En (5 A .76 ) los tamaños de estratos N ,i4 - N a y N„ - ( N Á - N B) Verdadera Estimada s*

serán conocidos. Estrato wh s„ (a ) (ó)
Con Ss* > S«* y c , < c¿, Hartley demostró que este método pue
1 0.3 . 30 30 30
de dar grandes reducciones en V ( Y ) al compararlas con el mues 2 0.6 20 20 20
treo de solamente el marco A , aunque la muestra del marco A esté 3 0.1 10 5 20
postes tratificada en los dos estratos a y B = ab.
El problema es más difícil si el marco A también es incomple 5A.2. Muestre que si todas las Sk, excepto SL, se estiman correctamente
to, requiriéndose entonces dos marcos A y B con alguna duplica y SL se estima como SL = St ( 1 - f X ), e l aumento proporcional en Vri(1((i7st),
ción para cubrir totalmente a la población. Para postestratificación al usar SL en lugar de la verdadera St para la asignación de Neym an, es
hay tres estratos distintos: a (unidades en A solamente); ab (uni Á ¡ n'L( n - n ' [ )

dades en A y B a la vez.); y b (unidades en B solamente). Los tres (1 + \ ) n 2
estratos no podrán muestrearse en form a directa y habrá que sacar donde » ' t es e l tamaño de muestra en el estrato L bajo la verdadera asigna
muestras de tamaños n^, n B de los marcos A y B. Además, los ta ción de Neyman. Verifique que esta fórmula concuerda con los resultados
maños N a, Nab, Nb de los estratos por lo general no se conocen. del ejercicio 5A.1. (L a concordancia no es exacta debido al redondeo de las
nk a enteros.) De aquí, muestre que una subestimación de 50% de S L tiene el
Para muestreo aleatorio simple, a partir de dos marcos A y B, Hartley
mismo efecto que una sobreestimación del 100%.
(1 9 6 2 ) sugirió la estimación 5A.3. Si hay dos estratos y si 0 es la razón n,/n„ real al n,/n2 óptimo de
Neyman demuestre que cualesquiera que sean los valores de N x, N t, S, y S2,
Y = — ya + p— yab + q — yba+ — yb (5 A .7 8 ) la razón V mí„(J at)/ V (F ¡, ) nunca es menor que 4^(1 + cuando las cpf
nA nA nB nB
pueden ignorarse.
donde, al igual que antes, p +- q - 1 y los y son totales de muestra 5A.4. Los resultados de una muestra altamente simple con n = 1 000
en los estratos. Los subíndices ab y ba denotan las muestras en el pueden clasificarse en tres “ estratos”, con yk = 10.2, 12.6 y 17.1; sk- «= 10.82
(la misma en cada estrato) y s2 = 17.66. Las ponderaciones estimadas para
estrato duplicado que se encontraron n A y n B. Hartley determinó p
los estratos son vjk = 0.5, 0.3 y 0.2, respectivamente. Se sabe que estas pon
y q para minimizar V ( Y ) con costo fijo. Lund (1 9 6 8 ) y Fuller y deraciones son inexactas, pero se piensa que todas son correctas dentro de
Burmeister (1 9 7 2 ) dieron mejores estimaciones que las de Hartley un 5 % , de tal manera que en e l peor de los casos son o W i = 0.525, 0.285 y
0.190 o VVj = 0 475, 0 315 y 0.210. Mediante los métodos de la Sec. 5A.2,
(5 A .7 8 ) esencialmente por utilizar mejores estimaciones de N a, ¿recomendaría usted la estratificación? (Donde se necesite, suponga que
Nab, N» que las empleadas por Hartley en su estimación Fuller y y\ - ?a y h - = V 0
Burmeister (1 9 7 2 ) también trataron el caso en que el marco A 5A.5. En una muestra aleatoria estratificada con dos variables, el objetivo
es de áreas con submuestreo de unidades de área. Hartley (1 9 7 4 ) es satisfacer las especificaciones
da un método general al muestreo de dos marcos, aplicable a cual V 'í y . J s v t-, v & js v ,
quier diseño de muestras en ambos marcos.
para el costo mínimo C = ^ . c hnh. La cpf puede ignorarse, ( a ) Demostrar
el resultado de Chatterjee (197 2 ) en el que una asignación de compromiso
será necesaria si
E J E R C I C I O S
l w hs2>J7h j . w h( s y s lh)Jrh
5A.1. AI planear una encuesta de ventas en cierto tipo de tienda, con
IW b & J S »,)^ V,
n = 550, se dispone de buenas estimaciones de Sv provenientes de una en
cuesta anterior, en dos de los tres estratos. E l tercer estrato consiste de tiendas (fc ) Si V„/V, es igual o excede al lím ite superior, la asignación óptima
nuevas y tiendas que no tuvieron ventas en la encuesta anterior, de tal para y, satisface ambas tolerancias con un resultado correspondiente cerca
manera que se tiene que conjeturar un valor para S v Si S3, es actualmente 10, no al límite inferior.
5A.6. Una encuesta con tres estratos se ha planeado para estimar el por
calcule V ( j ? „ ) según una asignación estimada de Neym an cuando S3 se con
centaje de fam ilias que tienen cuentas de ahorros en el banco y la cantidad
jetura como ( a ) 5, ( b ) 20. Muestre que en ambos casos el aumento pro
promedio invertida por familia. Los siguientes son estimaciones de los por
porcional en varianza sobre el óptimo verdadero es ligeramente mayor al 2 % . centajes Ph y las Intraestratos para la cantidad invertida.
192 TE C NIC AS DE M U ESTRE O OTROS ASPECTO S D EL M U E S TR E O E S TRATIFIC AD O 193
Estrato Wh />,(%) sA($)
1 0.6 20 90
2 0.3 40 180 22- 32 6 i. 5.7 663 65.3 192
3 0.1 70 520 24- 30 7 5.5 693 70.8 210
26- 27 8 5.2 720 76.0 216
28- 18 9 4.2 738 80.2 162
Calcular los tamaños más pequeños de muestra y los n* que satisfagan am
30- 22 10 4.7 760 84.9 220
bos requisitos: ( a ) el porcentaje de fam ilias debe estimarse con desviación
estándar igual a 2 y la cantidad promedio invertida con error estándar igual 32- 21 11 4.6 781 89.5 231
a $5. ( b ) El porcentaje de familias debe estimarse con un error estándar de 1.5 34- 19 12 4.4 800 93.9 228
y la cantidad invertida promedio con un error estándar de $5. 36- 16 13 4.0 816 97.9 208
La parte ( b ) requiere una asignación de compromiso, ya sea por medio 38- 14 14 3.7 830 101.6 196
de un programa de cálculo o bien, por el método de la segunda edición (P á g 40- 17 15 4.1 847 105.7 255
164). La asignación - 371 344 315, con n - 1030 satisface las dos tole 42- 9 16 3.0 856 108.7 144
rancias. Demostrar que el método de Booth-Sedransk, (Sec. 5 A .4 ) da nh/n = 44- 8 17 2.8 864 111.5 136
0.431, 0.326, 0.243. Esta asignación requerirla n = 1 073 para satisfacer 46- 11 18 3.3 875 114.8 198
ambas tolerancias. 19 3.0 884 117.8 171
48- 9
5A.7. La tabla de la parte superior de la Pág. 192, es de la distribución 2.6 891 120.4 140
50- 7 20
de frecuencia de una población de 911 tamaños de ciudades, para ciudades 2.0 895 122.4 84
52- 4 21
entre 10 000 y 60 000, dispuestas en clases de 2 000. Para abreviar los cálcu 124.6 110
54- 5 22 2.2 900
los, se da una y ' codificada y los valores de V f cum yff, cum f f y ', y X/y'2.
56- 5 23 2.2 905 126.8 115
Aplicar la regla de Dalenius-Hodges para crear dos estratos con asignación
58- 6 24 2.4 911 129.2 144
óptima en el sentido de Neyman. Encontrar los valores de W A y S. para
cada uno de los estratos. Verificar ( a ) que los tamaños óptimos de muestra
non casi -los mismos en ambos estratos y ( b ) al encontrar S2 para toda la po Totales 911 129.2
blación, que
V (y )
7TT = 4.8 J yj/ 'í = 50 395
5A.8. La distribución en triángulo rectángulo f ( y ) = 2 ( 1 — 1/), 0 < y <

1, so divide en dos estratos en el punto a. ( a ) Mostrar que 5A.10. Se dispone de una suma de S5 000 para una muestra estratificada.
Wt = a(2-a), En la notación de la Sec. 5A.8, la función de costo se piensa que es aproxi
madamente, C = 200L + lOn y
t _ a 2(6 - 6n +a2)
1 18(2- a ) 2 ’ 2
v ü u - e g * 1- , ’)]
(b ) Muestre que bajo la regla cum. y f f la mejor elección de a es 1 -
1 / -$ T = 0.37 y que con este lím ite, la óptima n j t u es cerca de 27/25 y V (? >()
es cerca del 27% del valor dado por muestreo aleatorio simple. donde p es la correlación entre la variable empleada para construir los estra
5A.9. En los Ejercicios 5A.7 y 5A.8, demostrar que la regla de Ekman tos y la variable a m edir en la encuesta. Calcule la L óptima para p = 0.95.
Wk(-Vh ~ 3/a-j) = constante concuerda muy bien con la regla cum \ T f al 0.9 y 0.8. ¿Cuál es un buen número de compromiso para los estratos a usar
determinar los límites de estratos.
para los tres valores de p?
5A.11. Los siguientes datos están tomados de una muestra estratificada

/ y' V1 Cum / Cum V f Jy' . de vendedores de llantas en marzo de 1945 (D em ing y Simmons, 1946). Los
10- 205 0 14.3 vendedores se asignaron a los estratos según el número de llantas nuevas
205 14.3 0
12- 135 i 11.6 340 25.9 135 en existencia durante un censo previo. Las medias de muestra y¡, son e l nú
14- 106 2 10.3 446 36.2 212 mero medio de llantas nuevas por vendedor ( a ) estimar la ganancia en pre
16- 82 3 9.1 528 45.3 246 cisión debida a la estratificación, ( b ) comparar este resultado con lo que se
18- 61 4 7.8 589 53.1 244
gana al usar la asignación proporcional.
20- 42 5 6.5 631 59.6 210
19 4 TE C N IC A S DE M U ESTRE O
Límites de
estratos N„ yk Sh*
1-9 19 850 0.8032 4.1 34.8 3 000

10-19 3 250 0.1315 13.0 92.2 600 C A P IT U L O 6
20-29 1 007 0.0407 25.0 174.2 340
30-39 606 0.0245 38.2 320.4 230
Totales 24 713 0.9999 4 170
Estimadores de Razón
5A.12. Una población tiene dos estratos de tamaños realtivos VV1 = 0.8,
W.. = 0.2 y varianzas dentro de estratos = 100, S * - 400. Se to
ma una muestra aleatoria estratificada que satisface las siguientes condi
ciones: ( i ) las medias de cada estrato deben estimarse con varianza < 1 ; ( t i )
V (y > i) s 0.5. A l ignorar la cp f encontrar los valores de rel( n2 que satisfacen
las tres condiciones para el m ínim o n = n 1 -f- n,. 6.1 M E TO D O S D E E S T IM A C IO N
Sugerencia. Nótese que -d V (y „)/ d n , > -d V (y „ )/ d n 2 si n t < 2rc.. Fuller
(1 9 6 6 ) ha discutido varios métodos para tratar este problema. Uno de los rasgos de la estadística teórica es la creación de una
5A.13. En un ejemplo de Nordbotten (3 9 5 6 ) que estudió Kokan (1 9 6 3 ) se vasta teoría que discute los métodos de obtención de buenas estima
planea una encuesta para estimar el empleo total YJ y el valor de la pro ciones a partir de los datos. En el desarrollo de la teoría, específica
ducción Y., en fábricas de muebles. Cuando las fábricas se estratifican por mente para encuestas de muestreo, se han utilizado poco estos cono
tamaños, los Nh y las Sfh estimadas burdamente son como sigue:
cimientos, por dos causas principales. Primero, en las encuestas que
Estrato Nh S2
lh S f* contienen un gran número de atributos, es una gran ventaja, aunque
se disponga de máquinas computadoras, el poder utilizar procedi
Grande 600 200 500 000 mientos de estimación que requieran poco más que simples sumas,
Pequeña l 000 10 4 000 en tanto que los métodos superiores de estimación de la estadística
teórica, como son la máxima verosimilitud, podrían necesitar una
1600 serie de aproximaciones sucesivas antes de encontrar la estimación.
La condición de que las estimaciones de Y t y Y„ no estén equivocadas en En segundo lugar, como se dijo en la Sec. 1.4, son diferentes las
más del 6% (P — 0.95) equivale a las tolerancias
actitudes tomadas en estas dos divisiones de investigación. La ma
V , = V (y ljt)s 0 .0 3 5 1 : V2 = V ( f r J <56.25 yoría de los métodos de investigación de la estadística teórica supo
nen que se conoce la forma funcional de la distribución de frecuencia
Demostrar que la asignación óptima para y , con ra¡ = 450, m, ■= 167, satisface
que sigue a los datos de la muestra, y el método de estimación está
las dos tolerancias. Obsérvese que en este problema no puede Ignorarse la
cpf. cuidadosamente engranado de acuerdo a este tipo de distribución.
5A.14. En muestreo aleatorio estratificado con una unidad por estrato, se En la teoría de encuestas por muestreo se ha preferido hacer, cuando
supone que los estratos pueden agruparse en pares con N jl = N¡„ » N ¡ más, algunos supuestos respecto a esta distribución de frecuencia
( j = 1 , 2 , . . . , L / 2 ). Un método alternativo de muestreo saca dos unidades (que es muy asimétrica, o que es bastante simétrica) y dejar fuera
al azar de cada par de estratos. Demostrar que para este método de la discusión su forma funcional específica. Esta preferencia con
(\r _ n i/2 r 2 -i duce a la utilización de métodos simples de estimación que dan bue
V ( h (N' - X), 5 5^+( y- - * w ] nos resultados en cierta gama de tipos de distribuciones de frecuen
Por lo tanto, demostrar que el valor esperado de la estimación v . ( Y „ ) de es cia. Esta actitud resulta razonable para tratar encuestas en las que
tratos contraídos en la Fórmula (5 A .5 4 ), Sec. 5A.12. sobreestima V (Y 1¡;), el tipo de distribución puede variar de un atributo a otro, y cuando
la varianza que se aplicaría si se usaran estratos dos veces más grandes. no deseamos detenemos a examinarlas todas, antes de decidir cómo
hacer cada estimación.
196 TE C NIC AS DE M U ESTRE O ESTIM AD O RES DE R A Z O N 197
En consecuencia, actualmente, las técnicas de estimación para nocer X. El uso de estimaciones de razón para este propósito ya se
el trabajo de encuestas por muestreo~son de alcances restringidos. discutió en la Sec. 2.11 y (con muestreo por conglomerados para
Ahora consideraremos dos técnicas, el método de razón en este capí proporciones) en la Sec. 3.12.
tulo y el método de regresión lineal en el Cap. 7.
Ejemplo. La Tabla 6.1 muestra el número de habitantes (e n m iles) en
cada una de las 49 ciudades extraídas en una muestra aleatoria simple de la
población de 196 grandes ciudades discutidas en la Sec. 2.15. El problema es
6.2 E L E S T IM A D O R D E R A Z O N
estimar e l número total de habitantes en las 196 ciudades en 1930. Se supone
que se conoce el verdadero total para 1920, X, su valor es 22 919.
En el método de razón se obtiene una variable auxiliar x¡, corre
El ejemplo es conveniente para una estimación de razón. La mayoría de
lacionada con y¡, para cada unidad de la muestra. El total de pobla las ciudades en la muestra presentan un aumento en tamaño de 1920 a 1930
ción X de las x t debe conocerse. En la práctica, x¡ suele ser el valor del orden de 20% . De los datos de la muestra tenemos
de yi en alguna ocasión anterior cuando se tomó un censo completo.
La finalidad de este método es obtener un incremento de precisión, al y = Z y, =6 262, r = X r, = 5054
utilizar la correlación entre y x¡. Por el momento, suponemos Consecuentementela estimación de razón del total de 1930 para todas las
muestreo aleatorio simple. 196 ciudades es
La estimación de razón de Y, el total de la población para los
V¡, es Y„ = - * = 7^7(22 919) =28 397
x 5 054
La estimación correspondiente basada en la media de la muestra por ciudad es
Y * = - AT= | * (6.1)
x x
O96X6262) = 25 048
donde y, x son los totales de muestra de y¡ y x* respectivamente. 49
Si x¡ es el valor de i/¡ en una ocasión anterior, el método de la El total correcto en 1930 es 29 351.
razón utiliza la muestra para estimar el cambio relativo Y / X ocurrido
desde la ocasión anterior. El cambio relativo estimado y j x se mul
T A B L A 6.1. Tam años de 49 G r a n d e s C iu d a d e s de E sta d o s
tiplica por el total de población X conocido anteriormente, para pro U n id o s (e n m ile s ) e n 1 920 ( x ¡ ) y 1 930 ( y t )
porcionar una estimación del total de la población actual. Si la razón
yjx, es casi la misma en todas las unidades del muestreo, los valores x¡ y¡ xt Vi xi Vi
de y/x varían poco entre las muestras y la estimación de razón es
76 80 2 50 243 291
altamente precisa. En otra aplicación, x¡ puede ser el número total
138 143 507 634 87 105
de acres de una finca y t/¡ el número total de acres dedicados a cierto 30 111
67 67 179 260
cultivo. La estimación de razón será exitosa en este caso si todos los 121 113 71 79
29 50
agricultores dedican más o menos el mismo porcentaje de su propie 381 464 50 64 256 288
dad a dicho cultivo. 23 48 44 58 43 61
37 63 77 89 25 57
Si la cantidad que se ha de estimar es Y, el valor de la media de 64 63 94 85
120 115
la población de yit la estimación de razón es 69 64 77 43 50
61
387 459 56 142 298 317
fc -* * 93 104 40 60 36 46
x 40 64 161 232
172 183
A menudo se deseará estimar una razón y no un total o una 78 ' 106 38 52 74 93
66 86 136 139 45 53
media, por ejemplo, la razón de acres de maíz al de acres de trigo,
60 57 116 130 36 54
la razón de los gastos debidos a la fuerza de trabajo, a los gastos
46 65 46 53 50 58
totales, o la razón de activos corrientes a la de activos totales. La 48 75
estimación muestral es R = y/x. En este caso no es necesario co-
ESTIM AD O RES DE RA ZO N 199
más a menudo. N o poseemos fórmulas exactas para el sesgo y la

varianza de muestreo de la estimación sino sólo aproximaciones que
son válidas en muestras grandes.
Estos resultados equivalen a decir que no hay dificultad si la
muestra es lo suficientemente grande para que ( a ) la razón sea casi
normalmente distribuida y ( b ) sea válida la fórmula de la muestra
grande para su varianza. Como una regla de operación, los resulta
dos de la muestra gyandc pueden usarse si el tamaño de la muestra
excede a 30 y es también lo suficientemente grande de tal manera
que los coeficientes de variación de x y y sean ambos menores que
el 10% .
Teorema G.l. Las estimaciones de razón del total Y de la pobla

ción, la media Y de la población y la razón Y/X de la población, son,
respectivamente
18 20 22 24 26 28 30 32 34 36 38 40 42 44
P o b la c ió n to ta l ( m i l l o n e s ) y r = 4 a, Yr ^ . X ,
X Xx X
F ig . 6.1. Comparación experimental de la estimación de razón con la esti
mación basada en la inedia de la muestra En una muestra aleatoria simple de tamaño n ( n grande)
La Fig. 6.1 muestra la estimación de razón y la estimación basada en la I { y .-R x ,)2

media de la muestra por ciudad para cada una de 200 muestras aleatorias i- 1
v A ) ^ = H ( 6 .2 )
simples de tamaño 49, extraídas de esta población. Es evidente un aumento N - 1
sustancial en precisión con el método de razón.
i ( y t - R x if
i-i
6.3 V A R I A N Z A A P R O X IM A D A D E L A (6.3)
—
►
1
n
1
E S T IM A C IO N D E R A Z O N
“ .V
I (yt - R x ¡ ) 2
La distribución de la estimación de razón ha sido siempre un w i-i
problema porque tanto y como x varían de muestra a muestra. Los V (R )= - (6.4)
nX1 N - 1
resultados teóricos conocidos no corresponden a lo que quisiéramos
saber para aplicaciones prácticas. Los resultados principales se ex donde f = n/N es la fracción de muestreo. El método que se usa en
ponen primero sin prueba. el Teorema 2.5 muestra que (6 .2 ), (6 .3 ) y (6 .4 ) también son aproxi
La estimación de razón es consistente (esto es obvio). Tiene ses maciones a los errores cuadrados medios del estimador en estas
go, excepto para algunos tipos especiales de poblaciones, aunque el fórmulas.
sesgo es despreciable en muestras grandes. La distribución límite
El argumento que conduce al resultado aproximado (6 .4 ) se dio
de la estimación de razón, conforme n se hace muy grande, es nor
en el teorema 2.5. Dado que Y* = XR, Y K - N X R , los otros dos
mal, sujeta a algunas restricciones menores sobre el tipo de población
resultados vienen como consecuencia inmediata.
de la cual estamos muestreando. En muestras de tamaño mode
rado la distribución presenta una tendencia hacia asimetría posi Corolario 1. Hay varias formas alternativas del resultado. Dado
tiva en las clases de poblaciones para las cuales se usa el método
que Y - RX, podemos escribir
200 TE C N IC A S DE M U ESTRE O ESTIM AD O RES DE R A ZO N 201
6.4 E S T IM A C IO N D E L A V A R IA N Z A A
N 2( l - f ) "
V (Y R = ' z [(y ,-Y )-R (x -X )r P A R T IR D E U N A M U E S T R A
» { N - 1 ).- ,'
Ar De la Ec. (6 .2 )
= ^ r i y [ I (yi - i Ó 2+ i? 2Z U - ^ )2
v í v v /v2u - / ) £ ( y . - * * ) 2
-2 R E (y ,-Y )(x ,-X )\ n N - 1
El coeficiente de correlación P entre y, y x¡ en la población finita Como ya se mencionó en la Sec. 2.11, tomamos
está definido por la ecuación
Í (y . - - R ^ )2
E (y ,-Y )(x , - X ) I (y/ “ Y)(x¡ - X ) (n-D
p -JE( y , - Y )2E ( x , —X ) 2 ( N - 1)5,5, como estimación muestral de la varianza de población. Esta estima
ción presenta un sesgo del orden de 1/n.
Esto conduce al resultado
Para la varianza estimada, i’( Y s), esto da
_ N 2( l - / ) , „ 2
V( Yr ) =
n
-'-Hs/ + R 2S 2- 2RpSySx) (6.5)
v (Y * ) = Vn <
( nr- n z (y‘ ~ Rx¡)2
l ) ,_i (6-9)
Una forma equivalente es Este resultado puede expresarse de muchas maneras diferentes.
Por ejemplo,
v { Y r ) = (1 y,z+* 21 *2~ 2* 1 ViXi) (6l0)

donde S „ - PS,S, es la covarianza entre y¡ y x 4. Esta relación tam
bién puede escribirse como
=— - — (sy2+ A W - 2 á s yx) ( 6 . 11)
Y2
Y (Y R) = ( l - f ) — (Cyy+ Cxx- 2 C yz) (6.7) donde - I ( y ¡ - y ) ( x ¡ - x ) / ( n - / ) es la covarianza de muestra
n
entre y¡ y x¡.
donde Cm,. C „ son los cuadrados de los coeficientes de variación ( c v ) Existen dos fórmulas alternativas para la estimación^de muestra
de y, y x t, respectivamente, y Cvx es la covarianza relativa. de la varianza. Dado que Y* - N X É, una forma para R es
Corolario 2. Dado que Ys, t j y R difieren solamente por mul

Vi (R ) = ^ ^ ( s 2+ R 2s 2- 2 R s rt) (6.12)
tiplicadores conocidos, el coeficiente de variación (por ejemplo, el
error estándar dividido entre la cantidad que se está estimando) Sin embargo, dado que R = y/x, la cantidad X no es necesaria
es el mismo para las tres estimaciones. De (6 .7 ) el cuadrado de mente conocida y a veces tampoco se conoce al estimar R. Esto su
este cv es giere la forma alternativa
(cv)2= — ( Cy y + Cxx - 2Cyx) (6 .8 ) v2(R ) = ^ f i ( s 2+ R \ 2- 2 R s yx) (6.13)

nx
La cantidad ( c v ) 1 se ha llamado la varianza relativa en Hansen y Esta forma también podría usarse para v ( Y K), al tomar v ¡ ( Y K) =
otros (1 9 5 3 ). Su uso evita la repetición de las fórmulas de varianza X*v 2( R ) .
para cantidades relacionadas como la media o el total de población Esto plantea la siguiente pregunta: Si se conoce X, ¿es preferi
estimados. ble vl a v}? La respuesta no la sabemos claramente aún. P.S.R.S.
E S T IM A D O R E S DE R AZO N 203
Rao y J.N.K. Rao (1 97 1) estudiaron analíticamente los sesgos en

vx y v2 en una población infinita por medio del modelo de regre N o se conoce el valor de R, pero cualquier considerado valor de
sión lineal R que haga este desvío normal lo suficientemente grande puede
considerarse como descartado por los datos de la muestra. Conse
y, = a+(3x¡ +e¡
cuentemente, tos límites de confianza para R se encuentran al hacer
con (6 .1 6 ) igual a ± z y despejar R de la ecuación cuadrática resultante.
E(e,U¡) = 0, V(e¡\x¡) = Sx', E(e,e,\xrx,) = 0, Los límites de confianza son aproximados, porque, si tratamos de
comprobarlos al muestrear repetidamente una población fija con R
donde 0 < t < 2 y x> tiene un rango de distribución ax*-x e **. conocida, resultan algunos valores de y y x para los cuales las dos
Se estudió el intervalo 0 < t < 2 porque en las aplicaciones, la
raíces de la ecuación son imaginarias. Tales casos se vuelven raros
varianza residual de y, se cree que aumenta con x, a tasas diferentes,
si los cv de y y x son menores de 0.3.
en diversas poblaciones. Ellos encontraron que v2 es menos sesgada
para 0 < i 3/2, pero también, menos estable para t = 0 o t = 1. Después de algunas transformaciones, las dos raíces pueden ex
presarse como
Jl ~ ¡Í ^ ~ Z Cy f ) ± Z Y ( C y y + C e i — 2 l ' y j ) — Z ; (C j|^¿,- ~ C y ¡ )
6.5 LIM IT E S D E C O N F IA N Z A
1 - z cu
Si la muestra es lo suficientemente grande, de modo que se apli donde
que la aproximación normal, se pueden obtener límites de confianza . N -n S y 2
para Y y R.
Y :Y r ± z ^ v (Y r ) (6.14)
es el cuadrado del cv estimado de y, con definiciones análogas de ci5
y c¿¡r. Si z"c¡¡,j, ¿‘c u y z!Cj» son todas relativamente pequeñas compa
R : R ± z-J 'v(R ) (6.15)
radas con 1, los límites se reducen a
donde z es el desvío normal correspondiente a la probabilidad de
confianza elegida. R = R ± z/C yy + Cu - ZCyx
Eji la Sec. 6.3 se sugirió que la aproximación normal se aplica
razonablemente bien si el tamaño de la muestra es al menos de Esta expresión es la misma que la aproximación normal (6 1 5 ), Aun
30 y si es lo suficientemente grande para que los c v de y y x sean con normahdad bivariada, los limites de Fieller han sido criticados
ambos menores que 0.1. Cuando no se reúnen estas condiciones, la por no ser lo suficientemente conservadores. Wilkinson, James y Ve
fórmula para v ( R ) tiende a dar valores que son demasiado bajos y nables (1 9 7 5 ) explican la dificultad y dan un método alternativo.
puede volverse notoria la asimetría positiva en la distribución de R.
Un métodoalternativo para calcular límitesde confianza se ha
usado en ensayos biológicos (Fieller, 1932; Paulson, 1942). El mé
6.6 C O M P A R A C IO N D E L A E S T IM A C IO N D E R A Z O N
todo requiere que y y x sigan una distribución normal bivariable, de
C O N L A M E D IA PO R U N ID A D
tal forma que (y — R x ) esté normalmente distribuida. Resulta en
tonces que en una muestra aleatoria simple la cantidad
El tipo de estimación de Y que se estudió en capítulos anteriores
y -R x es Ny, donde y es la media por unidad para la muestra (en mues
(6.16)
v '[(N - n ) / N n ]>/fy2+ /? 2Rsyx treo aleatorio simple) o una media ponderada por unidad (en
muestreo aleatorio estratificado). Estimaciones de esta clase son lla
está casi normalmente distribuida con media cero y desviación es
madas estimaciones basadas en la media por unidad o estimaciones
tándar unitaria.
obtenidas por expansión simple.
204 TE C N IC A S DE M U ESTRE O E S T IM ADORES D E R A Z O N 205
Teorema 6.2. En muestras grandes, con muestreo aleatorio sim cionan una estimación insesgada de Y. El estimador con la varianza
ple, la estimación de razón tiene una varianza menor que la esti más pequeña se llama el mejor estimador lineal insesgado (BLUE
mación ? = Ny obtenida por expansión simple, si - best linear unbiased estimator).
Formalmente, Brewer y Royall, suponen que los N valores de
_ coeficiente de variación x¡
p > :2 \ X J / \ y ) población (y ¡ x ¡) son una muestra aleatoria de una suprapoblación
2(coeficiente de variación de y ,)
J
en la que
Prueba. Para Y tenemos y¡= Px,+ e¡ (6.19)
V ( t ) . ! í * = ñ s; donde los ei son independientes de los x¡ y x¡ > 0. En arreglos

n en donde x f es fijo, el tiene media cero y varianza \x¡. Los x { ( i - 1,
Para la estimación de razón tenemos de (6 .5 ) 2, . . . . N ) son conocidos.
En la teoría de la aleatorización utilizada en este libro hasta aho
ra, el total de la población finita Y se ha considerado como una
V ( Yr ) = ^ (5 y2 + R 2S 2- IR p S y S ,)
n cantidad fija. Por otro lado, según el modelo (6 .1 9 ) tenemos que
N
Por lo tanto, la estimación de razón tiene una varianza más pe Y = J3X+V e, es una variable aleatoria. A l definir un estimador
queña si insesgado de acuerdo a este modelo, Brewer y Royall, utilizan un
concepto de insesgado que difiere del de la teoría. Ellos consideran
Sy2 + R 2SX2—2R pS ySX <Sy2
que un estimador Y es insesgado si E ( Y) = E (Y ) en selecciones re
Si fí - Y / X es positivo, la condición se convierte en petidas de la población finita y la muestra en el modelo. Un estimador
tal puede llamarse insesgado según modelo.
RSX 1(SX\/(S ,\ lc v (x )
p > 2s ; ~ v 5 t ) / \ 7 r i ^ w (618) Teorema 6.3. En el modelo (6 .1 9 ) el estimador de razón YR =
Xy/x es un estimador insesgado lineal óptimo para cualquier mues
tra aleatoria o no, elegida exclusivamente de acuerdo con los valo
«¡.7 C O N D IC IO N E S BAJO L A S C U A L E S E L E ST IM A D O R
res de x¡.
D E R A Z O N ES U N E S T IM A D O R IN S E SG A D O
L IN E A L O PTIM O Prueba. Como E(e¡|Xi) - 0 en muestreo repetido, de (6 .1 9 )
tenemos que
Un resultado bien conocido de la teoría de la regresión indica el
tipo de población en el cual la estimación de razón puede conside Y = p X + f e , : £ ( Y) = p X (6.20)
rarse la mejor dentro de una amplia clase de estimaciones. El re
sultado fue demostrado primero para poblaciones infinitas. Brewer Además, con el modelo (6 .1 9 ) cualquier estimador lineal Y es de la
(1963b) y Royall (1970a) ampliaron los resultados a poblaciones forma
finitas. El resultado es válido si se satisfacen dos condiciones.
Y = ¿ l¡y, = £ I l,Xi + ¿ l,e, (6.2Í)
1. La relación entre y¡ y es una recta que pasa por el origen.
2. La varianza de y i alrededor de esta recta es proporcional a x (. Si conservamos fijos los n valores de muestra x¡ al repetir el mues
treo en el modelo (6 .1 9 ),
Se definirá ahora “un estimador óptimo insesgado lineal”. Con
sidérense todos los estimadores Y de Y como funciones lineales de £ (Y ) = /3 £ l¡x¡: V (Y ) = A ¿ l 2x¡ '(6.22)
los valores de muestra y¡, es decir, son de la forma De (6 .2 0 ) y (6 .2 2 ), Y es claramente insesgado según modelo si
l\y\+hyi*— + 4 yn X l,x¡ = X. Al minimizar V (Y ) en estas condicionespor un multiplica
donde los l no dependen de y¡ aunque pueden ser funciones de los x t. dor de Lagrange se obtiene
La elección de los números l se restringe a aquellos que propor 2Z¡ Xj - cxí : i, — constante = X/nX (6 .2 3 )
ESTIM AD O RES DE RAZO N 207
206 T E C N IC A S DE M U ESTREO
más o menos como x ¡s. Esto sugiere una regresión ponderada con
La constante del ser el valor X/nx para satisfacer la condición del wi - 1/Xi* que da
insesgado / £ x¡ = X. Por tanto el estimador BLUE, Y es nyX/nx =
X ( t ",y,x,) „ , .
Xy/x = Y r, el estimador de razón usual. Esto termina la prueba.
Y = - = -£ 0 ) (6.29)
Además, de (6 .2 0 ) y (6 .2 1 ) con l=X/nx,
E ( w 2)
Yr - Y = Z /,£( - I e/ = (X/nx)Ct e ¡ ) ~ Z e¡ (6.24) Para una población y n dadas, V (Y R) en (6 .2 6 ) está claramente

minimizada, para cada x¡ > 0, cuando la muestra consiste de los n
{X -n x )¿ 'V /z. „ ex más grandes x¡ de la población. En 16 pequeñas poblaciones natura
= -----1— £ r i ~ 2. e¡ (6-25) les del tipo al que se han aplicado las estimaciones de razón, Royall
nx
S —n (1 9 7 0 ) encontró que para muestras con n *= 2 hasta 12, la selección
donde £ denota la suma sobre los ( N - n ) valores de población de los n más grandes x¡ generalmente incrementaba la exacti
ajenos a la muestra. Por tanto tud de Yr .
M jL- j g g ( 6 .2 6 )
En resumen los resultados de Brewer-Royall muestran que la su
(nx)* nx posición de un cierto tipo de modelo, conduce a un estimador de
razón insesgado y a las fórmulas para V (Y R) y v(Y R) que resultan
Fácilmente se ve que un estimador insesgado según modelo de X para
simples y exactas para n > 1. Los resultados podrían usarse en la
esta muestra es
práctica en los casos donde el examen de los pares y, x a partir de
los datos disponibles sugieren que el modelo es razonablemente co
Á = Í - ( y i - i t r i)2/ ( n - l ) (6.27)
Xi rrecto. Las fórmulas de la varianza (6 .2 6 ) y (6 .2 7 ) parecen ser
sensibles a la inexactitud en este modelo, aunque esto requiere más
donde R = y/x, como de costumbre. Este valor se puede sustituir en
estudio.
(6 .2 6 ) para dar una estimación muestral insesgada según modelo
de V (Y r ). En trabajos posteriores de Royall y Herson (1 97 3) se discute el
tipo de distribución muestral requerido con respecto a los x¿, para
La importancia práctica de estos resultados es que sugieren las
que Yr se mantenga insesgado cuando hay una regresión polinomial
condiciones en las que el estimador de razón es superior no sólo a y
de y i respecto a x¡.
sino que además, es el m ejor de toda una clase de estimadores. Cuan
do tratamos de decidir la clase de estimación a usarse, puede ser
útil una gráfica en donde se marquen los valores de y, contra los 6.8 SESG O D E L A E S T IM A C IO N D E R A Z O N
de x¡. Si esta gráfica muestra una relación rectilínea que pase por
el origen y si la varianza de los puntos y, alrededor de la línea pare En general, la estimación de razón tiene un sesgo de orden 1/n.
cen ser más o menos proporcionales a x¡, será difícil obtener algo Como el error estándar de la estimación es del orden 1 / Vñ, la can
mejor que el estimador de razón. tidad (sesgo/error estándar) también es del orden 1/ -fn y se vuelve
En ocasiones, la varianza de los y, en arreglos donde x¡ es fijo, despreciable al crecer considerablemente n. En la práctica, esta can
no es proporcional a x¡. Si esta varianza residual es de la forma tidad es de poca importancia para muestras de tamaño moderado.
Xv ( X j ) , donde se conoce u (x ¡), Brewer y Royall demostraron que Sin embargo, su valor en pequeñas muestras es interesante en el
el estimador BLUE se convierte en muestreo estratificado con muchos estratos, en donde quisiéramos
n
calcular y examinar las estimaciones de razón en estratos indivi
duales con pequeñas muestras en los estratos. A continuación, pre
Y=X ^ ^ (6.28) sentamos dos resultados útiles respecto al sesgo.
I w *2 El primero proporciona el término guía del sesgo, cuando se le
donde w¡ = 1/ v (x ¡). En una muestra de población tomada en Grecia, desarrolla en una serie de Taylor.
Jessen y otros (1 94 7) juzgaron que la varianza residual aumentaba
ron los valores (sesgo/error estándar) para muchos atributos de va

rios estudios nacionales y más localizados. En los estudios nacionales,
casi todos los valores (sesgo/error estándar) eran <0.03, y casi los
escriba únicos valores >0.10 en sus estudios provienen de un solo estrato
-i con nh = 6 pequeños hospitales.
x X + (x -X ) El segundo resultado de Hartley y Ross (1 9 5 4 ), da una respuesta
exacta para el sesgo y un límite superior de la relación sesgo a error
De modo que, estándar. Consideremos la covarianza en muestras aleatorias sim
- „ J y -R x ples de tamaño n, de las cantidades R y x. Tenemos
R -R = — (6.31)
Ahora cov( / Í x ) = e (J-x) -£(-**)£(*) (637)
E (y -R x ) = Y - R X = O = Y -X E (R ) (6.38)
por lo tanto, el término guía del sesgo proviene del segundo término Así que
entre corchetes. Además,
E ( R ) r * X - j . c° v (R, x ) = R - ^ cov (R, x) (6.39)
E y ( x - X ) = E ( y - Y ) ( x - X ) = — pSyS, (6.32)
n De modo que el sesgo en R es — cov (R, x)fX. A diferencia de la
por el Teorema 2.3 (Pág. 4 9 ) y la definición de P. También, aproximación de Taylor al sesgo (6 .3 3 ), esta expresión es exacta,
además,
E x ( x - X ) = E ( x - X ) 2= — St2 , ¿i \pk.¡crncrl \
n |sesgo en R |=------ -----
l.n consecuencia, el término guía del sesgo es
V r (J!
E ( R - R ) = ^ l ( R S x2- p S ySx) (6.33)
aía
puesto que R y x no pueden tener una correlación mayor que 1.
= — (C ^ -C J R (6.34) Por lo tanto,
n
¡Sesgo_=nKls 3 = c v d = . (640)
Para una justificación rigurosa de (G .34) véase David y Sukhatme
(1 9 7 4 ). (X A X
Ahora, el término guía en V (R ) es Desde luego, se aplica la misma cuota al sesgo en YR y YR. De modo
que si el cv de x es menor que 0.1 se puede considerar despreciable
Y (R ) = + R 2SX2-2RpSySx) (6.35) el sesgo al compararlo con el error estándar.
nX
ii partir de (6 .5 ) al sustituir R = Y r/NX.
6.9 E X A C T IT U D D E L A S F O R M U L A S P A R A L A
De (6 .3 3 ) y (6 .3 5 ) el término guía de la cantidad (sesgo/error V A R IA N Z A Y L A V A R IA N Z A
estándar), que es el mismo para R. YR, y YR, puede expresarse como E S T IM A D A
( sesg ° ) (R S * -p S y) Con pequeñas muestras, digamos n < 30 y Clt grande, se ha

e.e. V ( R ZSX2- 2RpS,St + Sy2)1' 2 ( J sospechado durante mucho tiempo que las fórmulas de muestras
donde cv ( i ) = Vi -fSJ-JnX. Al sustituir estimaciones muéstrales de grandes dadas para V (R ) y v (R ) son subestimaciones. Por una ex
los términos de (6 .3 6 ), Kish, Namboodiri y Pilla! (1 96 2) calcula pansión en serie de Taylor, Sukhatme (195 4) expresó el error en
V (R ) en términos de los momentos bivariados de y y x. Desafortu

TA B LA 6.2. P o r ce n ta je P r o m e d io de la
nadamente, el resultado es demasiado complicado para conducir a S u b e s t im a c ió n de ECM (R )
un método práctico en las aplicaciones.
n
Si y y x siguen una distribución normal bivariada, los resultados Estimador 4 6 8 12
de Sukhatme se simplifican en forma considerable. Sea
E(J?)en(6.4) '14 14 14 12
V ¡ = ( C yy + C I X- 2 Cyt )/n i>i(i?)en(6.12) 31 23 21 18
una notación para la primera aproximación a la varianza relativa de

A, al ignorar la cpf. Para los términos de orden 1/n5, En estos datos, el porcentaje de subestimación en V (A ) declina
escasamente al crecer n. Esto se explica en parte por la circunstancia
de que en una población V{A) dio una sobreestimación que declinó
M .,
con n. Las indicaciones a partir de estos resultados son que los ses
Como el término entre paréntesis de la derecha es menor que 6Czz/n, gos en Ui(R) son mucho más serios en muestras pequeñas que los
esto da que hay en R misma, y son insatisfactorios cuando menos hasta
n = 12. Para n •= 4, Koop (1 9 6 8 ) encontró subestimaciones en
que promediaban 25% en tres poblaciones con N *= 20.
£( ^ ) ¡<v‘(1+27;) <6“2> Un estimador alternativo de u^/Oque parece prometedor en cuan
para los términos de orden 1/tz2. Ahora bien, C„/n es el cuadrado to a la reducción del sesgo se discutirá en la Sec. 6.17.
del coeficiente de variación x. De modo que si n es suficientemente
grande para que el cv de x sea menor que 0.1, el uso de V, no debe
6.10 E S T IM A C IO N E S DE R A Z O N EN M U E S T R E O
ría subestimar en más del 9% . En la práctica, el multiplicador 9
de (6 .4 2 ) aparece indebidamente alto comparado con (6 .4 1 ), por A L E A T O R IO E S T R A T IF IC A D O
ejemplo, si Czz = Cm, (6 .4 1 ) se reduce a
Hay dos maneras de hacer una estimación de razón del total de
población Y. Una de ellas es una estimación de razón separada del
£( ^ ) ^ V'1[ 1+7 i (6 " 3p)] (6’43) total de cada estrato y la suma de estos totales. Si y,„ xh son los tota
les de muestra en el estrato /t-ésimo y Xh es el total de estrato de los
Como P es casi siempre positivo en las aplicaciones del método de xh¡, esta estimación YRs (s por separada) es
razón, resultará más representativo un multiplicador entre 3 y 6.
Sin embargo, los efectos de la no normalidad en y y x también en
YKs = l ^ X „ = l ^ X h (6.44)
tran en el término de orden l/n*. h %h h
A partir de un estudio con el método de Montecarlo efectuado N o se supone que la verdadera razón permanece constante al pasar
por Rao (1 96 8) en pequeñas poblaciones naturales, se mencionarán de un estrato al otro. La estimación requiere del conocimiento de los
algunos resultados ilustrativos de los sesgos de las fórmulas para totales separados X*.
grandes muestras para V(A) y v¡(A) y para pequeñas muestras alea
Teorema 6.4. Si una muestra aleatoria simple se saca en cada
torias de ocho poblaciones, cada una con N > 30. Las poblaciones
estrato y los tamaños de la muestra son grandes en todos los estratos,
están descritas en Rao (1969). Las fórmulas para V(A) y v¡(R), dadas
en (6 .4 ) y (6 .1 2 ) se apreciarán como estimadores del verdadero
V( YRs) = I fh](Syh2+ R h2Szh2- 2RhPkSyhSxh) (6.45)
ECM (A) h nh
Para una población dada, las cantidades 100 [ E C M ( R ) — V(i?)]/ donde R* - Y/,/X;, es la razón verdadera en el estrato h., y ph se define
E C M (R ) y 100 [ E C M ( R ) — Ev,(R)]/ECM (A) son el porcentaje de sub como antes en cada estrato.
estimación del verdadero ECM (A). Los promedios de estos porcenta
jes en las ocho poblaciones son las que aparecen en la Tabla 6.2. Prueba. Al aplicar la Fórmula (6 .2 ) Sec. 6.3 para una muestra
aleatoria simple, se obtiene en el estrato h,
212 TE C N IC A S DE M U E S TR E O ESTIM AD O RES DE R A Z O N 213
Estas son las estimaciones estándar de los totales de población Y y X

V( Y r h ) = N "2(X fh) (S,S + R / S j - 2 R hPkSyhSxh) (6.46)
respectivamente, obtenidas de una muestra estratificada. La esti
mación combinada, YRc (c indica combinado) es
Como ^ - 1 Y rh y el muestreo es independiente en cada estrato,
^ h
V(yR 5) = E V(.YRh)y se obtiene el resultado (6.45). Yrc = £ x = ^ X (6.48)
Esta fórmula es válida sólo si la muestra en cada estrato es lo Xt,
bastante grande para que la fórmula de la varianza se aplique a

donde y„ = Y J N , xs, = X J N son las medias de población estimadas
cada estrato. Hay que recordar esta limitación en las aplicaciones
de una muestra estratificada.
prácticas.
Además, cuando los nh son pequeños y el número de estratos L La estimación YRc no requiere un conocimiento de las Xh, sino
es grande, el sesgo en YR, puede no ser despreciable en relación a solamente de X.
su error estándar, como lo sugiere a grandes rasgos el siguiente
La estimación combinada está menos sujeta alriesgo de sesgo
argumento.
que la estimación separada. Usando el procedimientode Hartley y
En un solo estrato hemos visto que
Ross en la Sec. 6.8, tenemos, al escribir Rx = y,Jxtn
|seSg o _ e n ^ l s
co v (Rc, x„) = - E ( R c)E (x„)
<x(YRh)
Si el sesgo tiene el mismo signo en todos los estratos, lo que puede = Y - X E ( R C) (6.49)
ocurrir, el sesgo en Yr, será aproximadamente L veces el de YRh. Por lo tanto.
Pero el error estándar de Í'r, es tan sólo del orden de -fL veces el
de Yrh. Luego la razón E ( R C) = R - ^ cov (i?c, f „ )
¡sesgo en YRí\
<r( Vrj)
[sesgo en i?J |pa \
es de orden ■ - ¡SSr V V -scvde x „ . (6.50)
&R. vA
-/Zfcvdeii,) Así, los sesgos en R c, y YRc son despreciables en relación a sus erro
Por ejemplo, con 50 estratos y el cv de xh aproximadamente 0.1 res estándar siempre que el cv de x„ sea menor que 0.1.
en cada estrato, el sesgo en YRs podría ser tan alto como 0.7 veces
Teorema 6.5. Si el tamaño total de la muestra n es grande,
su error es estándar. La contribución del sesgo al error cuadrático me
dio de YRs seria entonces como de un tercio. v ( K ) - i t ¿ i í z M iSyh^ R ^ _ 2 R n S A ) (651)
Aunqueen la práctica, el sesgo es mucho máspequeño que su h rlh
cota superior, hay que tener presente el peligro del sesgocon esti
Prueba. Esta sigue el mismo argumento que el Teorema 2.5.
mación de razón separada si vX (c v de xh ) excede, digamos, a 0.3.
En el caso presente la ecuación clave es
6.11 L A E S T IM A C IO N D E R A Z O N C O M B IN A D A NX
( YRc - Y ) = — (yu - Rxu)= N (y „ - Rx„) (6.52)
X St
Puede derivarse una estimación alternativa a partir de una sola

razón combinada (Hansen, Hurwitz y Gumey, 1946). De los datos Ahora,considérese la variable auxiliar uhi = yhl - Rxk¡. Ellado de
de muestras calculamos recho de(6 .5 2 ) es Nü„, donde ü„ es la media ponderada de la va
riable en una muestra estratificada. Además, la media de po
Y„ = £ Nh9h. X „ = l N hxh. (6.47) blación Ü de uhi es cero, ya que R = Y/X.
h h
ESTIMADORES DE R A ZO N 215
Para las estimaciones muéstrales de estas varianzas sustituimos

Por lo tanto, podemos aplicar el Teorema 5.3 a üs¡ para la va en los lugares apropiados las estimaciones de las muestras de R h
rianza de la media estimada de una muestra aleatoria estratificada. y R. Los cuadrados medios de muestra Sy,,2 y SIh- se sustituyen por
Esto da las varianzas correspondientes, y la covarianza de la muestra se
sustituye por el término El cuadrado medio y la covarianza
;/( YRc) = N 2V(ü„) = l Nh[Nh~ n--S j (6.53)
i, Hit de la muestra se deben calcular separadamente para cada estrato.
donde Ejemplo. Los datos provienen de un censo de todas las fincas en el

Condado de Jefferson, Iowa. En este ejemplo yhi representa acres de m aíz y
xk¡ acres de la finca. La población se divide en dos estratos, el primero contiene
fincas hasta de 160 acres. Se considera una muestra de 100 fincas. Cuando
se usa muestreo estratificado, supondremos que se toman 70 fincas del estrato
= r I [(yu ~ Y h) - R ( x h¡ - X h) f 1 y 30 del estrato 2, siendo esta distribución casi óptima. Los datos se muestran
AT;, 1i- í
en la Tabla 6.3. Las últimas tres cantidades , Q*. V ,' y V h" , son cantidades
Cuando se expande la ecuación cuadrática, se obtiene el resulta auxiliares a usar en los cálculos, las dos últimas se definirán más tarde.
do (6 .5 1 ).
A partir de las Ecs. (6 .4 5 ) y (6 .5 1 ) es interesante notar que las TA B LA 6 .3 . D atos del C ondado de Je f f e r son , Io w a
varianzas aproximadas de YR, y YRe tomen la misma forma general,
siendo la diferencia que las razones de población R¡> en los estratos Tamaño
(acres de
individuales en (6 .4 5 ) se reemplazan por R en (6.51). V 2
Estratos la fin c a ) ■Syxh Rh
6.12 C O M P A R A C IO N DE L A S E ST IM A C IO N E S 1 0-160 1580 312 494 2055 0.2350

2 Más de 160 430 922 858 7357 0.2109
S E P A R A D A Y C O M B IN A D A
Para pob. completa 2010 620 1453 7619 0.2242
Podemos escribir
Estratos y* xk nn Q k = WV/n* v* Vh
V iY ^ -V iY * ,) 1 19.40 82.56 70 0.008828 193 194

2 51.63 244.85 30 0.001525 887 907
= v 'V>,~(1.? A ) [(R - - Rh>)SJ - 2 ( R - R M M Para pob. completa 26.30 117.28 100
h nh
=i _ Rh f Sxh2+ 2(Rh - R ){pkSyhSxR- RhSxh2)] Consideramos cinco métodos para estimar la media de población de acres
«/. de maíz por finca. Las cpf se ignoran.
1. Muestra aleatoria simple: estimación de la media por finca.

En situaciones en las cuales es apropiada la estimación de razón,
el último término de la derecha es usualmente pequeño. (Desaparece
V ,-£ -^ -6 .2 0
si dentro de cada estrato la relación entre yhi y xhi es una linea recta n 100
que pasa por el origen.) Entonces, a menos que Rh sea constante 2. Muestra aleatoria simple: estimación de razón.
entre estratos, el uso de una estimación de razón separada en cada
estrato, la muestra en cada estrato es suficientemente grande de mo V2- - (5 1,2+ R 2S„2—2RS„)
n
do que la fórmula aproximada para V( es válida y el sesgo acu
mulado que puede afectar YRs (Sec. 6.10) puede ignorarse. Con sólo = y ¡ ^ [ 6 2 0 + ( 0 .2 2 4 2 ) 2( 7 6 1 9 ) - 2 ( 0 .2 2 4 2 ) ( 1 4 5 3 ) ]
una pequeña muestra en cada estrato, se debe recomendar la estima
ción combinada, a menos que exista una buena evidencia empírica = 3 .5 1
de lo contrario.
ESTXMADORES DE R A Z O N 217
3. Muestra aleatoria estratificada: estimación de la media por finca.

madamente proporcionales a otra variable z¡, es mejor usar x¡ y z¡
W2 como denominadores en las estimaciones de razón que estratificar
Y3= S — V = X < W = 4.16
rt* de acuerdo a una de ellas.
4. Muestra aleatoria estratificada: estimación de razón usando una razón
separada en cada estrato.
6.13 C A L C U L O A B R E V IA D O D E L A
V4= XO„(V + R,2S j - 2R„Sr,h) = X O,V„' = 3.06 V A R IA N Z A E S T IM A D A
5. Muestreo aleatorio estratificado: estimación de razón usando una razón
combinada.
Si nh = 2 en todos los estratos, Keyfitz (1 9 5 7 ) proporcionó mé
todos simples para el cálculo de aproximaciones a las varianzas es
V 5 = X O ,(S yh2+ R 2S j - 2RSV„ .) = X C*„ V ," = 3.10 timadas de Yr c o R c o más generalmente, de funciones de una o
Las precisiones relativas de los diferentes métodos pueden resumirse como más variables de la forma Ys¡. Para R c tenemos
sigue:
Método de muestreo Método de Precisión L Yh 1.~y(yM+~yh2)

estimación relativa Rc = Z £ = | _ = 2 l2 (6 .54)
L x h z * í (Xai+X)i2)
1. Aleatorio simple Media por finca 100 h l
2. Aleatorio simple Razón 177
3. Aleatorio estratificado Media por finca 149 El método de Keyfitz utiliza la identidad para nh = 2,
4. Aleatorio estratificado Razón separada 203
5. Aleatorio estratificado Razón combinada 200 2syh2= 2 £ (ya, —ya)2= (y#.i —Yaz) 2= (dyh)2 (6.55)
i—1
Los resultados muestran un punto interesante de amplia aplica donde dyh = (yhi - yh3) . Por lo tanto
ción. La estratificación por tamaño de las fincas cumple el mismo
propósito general que una estimación de razón en la cual, el deno v ( Yh) = ( y ) *2(1 —fh)syh = (1 - A ) ( y * i '- J ’hz')2 = (1 - U ) ( d y h')2 (6.56)
minador es el tamaño de la finca. Ambos planes disminuyen el efec
to de las variaciones en tamaño de las fincas sobre el error de mues donde y'^ = N* yhi/2. De igual forma, para la estimación mues-
treo de la media estimada de acres de maíz por finca. Por ejemplo, la tral de la covarianza,
ganancia en precisión de una estimación de razón es 77% cuando se
cov ( YhX h) = (1 - f h)(dyh’){dxh') (6.57)
usa muestreo aleatorio simple, pero es solamente 36% (203 contra
149) cuando se usa muestreo estratificado. Ahora
En el diseño de encuestas, puede haber una elección entre in
troducir un factor dentro de la estratificación o utilizarlo en el mé R P. — P — ^ / Y„ XjA
todo de estimación. La mejor decisión depende de las circunstan R• R ~ X , R V x Ky - K ) <658)
cias. Los puntos relevantes son: ( a ) algunos factores, por ejemplo, Como el muestreo es independiente en estratos diferentes
localización geográfica, que se pueden introducir más fácilmente en
la estratificación que en el método de estimación; ( b ) el asunto
depende de la naturaleza de la relación entre y¡ y x4. Todos los
métodos simples de estimación trabajan en forma más efectiva con
una relación lineal. Con una relación compleja o discontinua, la es
tratificación puede ser más efectiva, ya que, si hay suficientes
Keyfitz (1 9 5 7 ) ha extendido este método a los estimadores post-
estratos, la estratificación eliminará los efectos de casi cualquier
estratificados, al muestreo de varias etapas y a la obtención de va
clase de relación entre y¡ y x 4. ( c ) Si algunas variables importantes
rianzas de las diferencias de las estimaciones, a partir de encuestas
son aproximadamente proporcionales a x 4, pero otras son aproxi
sucesivas en muestras periódicas. W oodruff (1 97 1) da un enfoque
ESTIM AD O RES DE R A Z O N 219
Su varianza estimada se aproxima como en (6.64).

genera] para los estimadores no lineales, las probabilidades de se El método de Keyfitz se usa, por ejemplo, en la encuesta de salud
lección. desiguales y las muestras de tamaño n„ en los estratos. Como por medio de entrevistas del National Center for Health Statistics.
ilustración del método de W oodruff, considérese una función /(Y) La unidad de muestra es del tipo conglomerado, un condado o grupo
donde Y representa el vector, o conjunto, de m variables Y , = Z Y llt. de condados vecinos. Cada unidad se divide en segmentos de apro
h
Con muestreo aleatorio simple en el estrato h, las Y¡h son de la ximadamente 9 domicilios, se eligen un promedio de 13 segmentos
forma (Nh/nh) £ y¡hi, y la suma se extiende a todas las nh unidades de una unidad muestreada. Las variables yhu yh-, podrían ser los nú
meros de personas que padecen una enfermedad específica y x hu xh->
de muestra del estrato h. Por la aproximación de Taylor,
los números totales de personas en las muestras de las dos unidades
del estrato h.
(6.6D
Además de la estratificación geográfica inicial de los condados,
se postestratiíican las personas de la muestra por edad, sexo y color.
El artificio consiste en invertir el orden de la suma y escribir
Así, en lugar del estimador YRc - X R Cdel número total de enfermos,
f ( Y ) - f ( r ) ^ Z l ^ ( Y lh- Y j h) = Z ( Ú h - U k) (6.62) el estimador es
h j dY, h
YPS= Z X j a = Z X a£ (6.68)
donde a a y\a
Úh = I £ Y,„ = ^ £ (£ £ yA = £ Um (6.63) donde a representa una clase de edad-sexo y color y X« es el total

i o Yi nh i \¡ ó Yi J i
de población conocido en esta clase. Aquí tenemos una función de
Al evaluar las ( df/dYj) en las estimaciones Y,, los números uM se cal dos conjuntos de variables aleatorias - Ya y X„. Además, por mu
culan a partir de (6 .6 3 ) para cada unidad de muestra en el estrato chas razones ya¡,i y ya-n pueden estar correlacionadas para dos clases
h. Con muestreo aleatorio simple en los estratos, se aplica la fórmula diferentes a y a' en una unidad conglomerada; así, por ejemplo, para
usual para la varianza estimada de la suma ÚH. Por lo tanto, de una enfermedad infecciosa, el número de casos puede ser elevado
(6 .6 2), una estimación de muestra aproximada de la varianza para todas las clases de la unidad. A l aplicar (6.63) e ignorar la
de /(Y) es cpf, tenemos con nh = 2,
nh _ ,
... , I (u¡u-uh)-
(6.69)
v [ f ( Y ) ] - £ — N nh)nh ‘ -~ rr- (6.64)
h i^ h - 1)
La ventaja de este método es que las covaxianzas de las Y}* no (6.70)

necesitan calcularse.
Para ilustrar los uhi para el estimador R c = Y/X, es útil escribir donde d y j = N h(y„>„ - y„/,-.)/2.
Re = Y J Y 2, así que
En esa aplicación, el método de Keyfitz también trata otras com
fr = JL =± . J L = .X l rf, plejidades de la encuesta como son: la selección de unidades prima
/( } Y2‘ dY2 Y 2 dY2 Y2 ( rias con probabilidades desiguales, los ajustes para no respuestas y
Por lo tanto, a partir de (6 .6 3 ) con rz¡, = 2, el uso del método de estratos contraídos. Además, como el tiempo
de cálculo, aun con este método simple, sólo permite cálculos de
N h (yih ¡ Y\ \ N/, — R , :y 2i,¡) varianza para un número limitado de atributos, se dan gráficas de la
U* = ÍnTl t\' Y‘ 2~ ~ Y
' 2^ y2U)' = ~¿----- Y
nh ‘ 2
(666) relación entre la desviación estándar de ( Y ) / Y y Y para diferentes
en términos de los yhi, x,l4 originales tipos de atributo lo que ayuda en la predicción de la d.e. (Y ) para
atributos de los que aún no se ba calculado. Bean (1 9 7 0 ) presenta
A), (yhi-RcXh¡) claramente estos métodos y resultados.
220 T E C N IC A S D E M U E S TR E O ESTIM AD O RES DE R A Z O N 221
6.14 A S IG N A C IO N O P T IM A C O N U N A Para esta ilustración, se divide el área geográficamente en tres estratos.

El número de árboles (duraznos) en una huerta se denota por xH y la pro
E S T IM A C IO N D E R A Z O N
ducción estimada en bushels por yhi. Se considera solamente la primera esti
mación de razón Y r, ( basada en una razón separada en cada estrato), ya
La asignación óptima de los n h puede ser diferente con una es que el principio es el mismo para ambos. tipos de estimaciones de razón
timación de razón que con una media por unidad. Considérese pri estratificadas.
mero la variante Yr,. Del Teorema 6.4, su varianza es Se comparan cuatro m é t o d o s de asignación, ( a ) nh proporcional a N h,
( b ) n h proporcional a N jS ^ , ( c ) n h proporcional a N fi V X j, y ( d ) nh propor
V( YRs) = I (S y„2+ R fS j-lR ^ S A ) cional a NhXk = X,,. E l tamaño de muestra es 100. Los datos para e s ta s com
h nh paraciones se T e s u m e n en la Tabla 6.4.
_ Nh (Nh ~ fth) - 2 „ 2_ I Y J 2 IA11\

-L Sdh > con Sjh K7 di,, (6.71) TA B LA 6.4. D ato s de l a E n c u e s t a de P r o d u c c ió n d e Du r azn o s en
h
C a r o lin a d e l N o rte
donde dhi = yH - es la desviación de yki desde Rhx A¡. Mediante
Estratos S** óyjA ó,»1 5.» s„ 7, A Su*
los métodos dados en el Cap. 5 para encontrar la distribución óptima,
se deduce que (6 .7 1 ) es mínima respecto a un costo total de la for 1 5186 6462 8699 72.01 93.27 53.80 69.48 1.29133 658
ma ZCj,n», cuando 2 2367 3100 4614 48.65 67.93 31.07 43.64 1.40475 573
3 4877 4817 7311 69.83 85.51 56.97 66.39 1.16547 2706
„n,, / A
oc—^
VCf, Pob. 3898 4434 6409 62.43 80.06 44.45 56.47 1.27053 1433
Se recordará que para una varianza mínima con una media por uni Estratos N, («) N ,S „ (6) VW , N ,Y Y , (c) N ,Y, (d)
dad se escoge n h proporciona] a N kSvi/Vc¡¿
1 47 18 4384 22 7.33 344.5 20 2529 22
En el planeamiento de una muestra, la distribución con una es
2 118 46 8016 40 5.57 657.3 39 3666 32
timación de razón puede ser un poco complicada, porque parece 3 91 36 7781 38 7.55 687.1 41 5184 46
difícil especular sobre los valores probables de Sdh. Hay dos reglas
útiles. Con una población en la cual la estimación de razón es la Pob. 256 100 20181 100 20.45 1688.9 100 11379 100
mejor estimación lineal sin sesgo, S® será aproximadamente pro
porcional a (según el Teorema 6.3). En este caso, los n h deberían La parte superior de la tabla muestra los datos básicos. E l método empleado
ser proporcionales a N hsfxh/ V ch. Algunas veces, la varianza de dM para calcular las cuatro varianzas fue encontrar primero los n h para cada tipo
puede ser más aproximadamente proporcional a Xhs. Esto conduce de asignación. Estos valores aparecen en las columnas encabezadas ( a ) hasta
( d ) en la parte inferior del cuadro. Así, con asignación (®)> nh - n N h/N -
a la distribución de nh proporcional a N hXh/ V cT, o sea, al total’ de de tal manera que en el primer estrato.
xM por estrato, dividido entre la raíz cuadrada del costo por unidad.
Un ejemplo de este tipo lo discute Hansen, Hurwitz y Gumey (1 94 6) (100)(47) ,n
con una muestra diseñada para estimar las ventas de tiendas al = 256 ~~
menudeo.
Cuando se han obtenido los tih, se encuentra la V ( Y r, ) correspondiente
Si se usa la estimación, YRc se aplica mismo el razonamiento sustituyendo en la fórmula
general.
V(YRl) = Z Nh(Nh~ nh)S ^
Ejemplo. Los diferentes métodos de asignación pueden compararse con i, nh
los datos recolectados en una lista completa de 257 huertos comerciales de
duramos en Carolina del Norte, en junio de 1946 (Finkner, 1950). E l propósito donde
fue determinar el procedimiento de muestreo más eficiente para estimar la
Sdh = S,h2+ R¡,2S,h2—2RhS.lxh
producción comercial de duraznos en esta área. Se obtuvo información sobre
el número de árboles de durazno y la producción total estimada en cada Las cantidades S s o n las mismas para todas las cuatro asignaciones y se
huerto. La alta correlación entre estas dos variables sugirió el uso de una dan en el extremo derecho de la mitad superior de la Tabla 6.4.
estimación de razón. Se omitió un huerto m uy grande. En la Tabla 6.5 se muestran las varianzas y precisiones relativas.
ESTIM ADORES DE R A Z O N 223
TA B LA 6 .5 . C o m p a r a c ió n de Cuatro M étod os de A s ig n a c ió n
Pero en muestreo aleatorio simple E ( r ) ■= E ( r ¡ ) . Por lo tanto,
Varianza
Método d e ---- sesgo en r = E ( r ) - R = - J - £ r f a - X ) (6.73)
asignación: n-„ Estrato j\IW /-1
proporcional a Precisión
Total relativa Por el Teorema 2.3, una estimación insesgada de muestra de
1 N
4 9 824 105 833 376215 5 3 ! 872 100 £ r.(x .-X )
1. Nk N - 1. =,
35 144 131 847 343 44 6 510 437 104
2.
41 750 136 964 3 0 0 312 4 7 9 026 111 es
3. N^Xk
4. N\Xh 35 144 181 7 1 0 2 4 0 888 457 742 116
——r £ r i ( x ¡ - x ) = —^— ( y - r x )
n - 1 (-i n -1
N o hay mucho que escoger entre las diferentes asignaciones, como se
esperaría, ya que los nu no difieren grandemente en los cuatro métodos. El A l sustituir en (6 .7 3 ), la estimación F, corregida por sesgo, se vuelve
método 4, en el cual la asignación es proporcional al número total de árboles
en el estrato, parece ser ligeramente superior a los otros.
(6 ' 7 4 )
6.15 E S T IM A C IO N E S IN S E S G A D A S D E L T IP O DE R A Z O N La estimación insesgada correspondiente del total de población

Y es
Como hemos señalado, las estimaciones insesgadas o menos ses
gadas que R o YR del tipo de razón pueden ser útiles en encuestas RHRX = F X + n { N ~ l \ y - r x ) (6.75)
n —i
de numerosos estratos y pequeñas muestras de cada estrato, si
parece apropiada la estimación de razón separada. Discutiremos rá Por argumentos semejantes, se deriva otra estimación insesgada
pidamente tres métodos que proporcionan estimaciones insesgadas (Mickey, 1959) a partir de las n razones R¡ que se obtienen al re
y tres métodos que eliminan el término de orden 1/n [ver (6 .3 3 )]. tirar cada unidad en turno de la muestra, de modo que R¡ = £ y/£ x
En la comparación de estos métodos son importantes las siguien sobre los restantes (n - 1) miembros. Si R_ denota la medía de las
tes preguntas: ( a ) ¿El ECM se compara favorablemente con el de R¡, la estimación de Mickey es
la estimación ordinaria de razón? ( b ) ¿Proporciona el método una
estimación muestral satisfactoria de la varianza? Como hemos visto,
R M = ñ - + n('N ]^ +1\ y - R - x ) . (6.76)
ésta es una dificultad con R . Comenzamos por describir los méto
dos. Los del tipo insesgado requieren el conocimiento de X. En un tercer método, Lahiri (1 9 5 1 ) demostró que la estimación
ordinaria de razón R es insesgada si se saca la muestra con pro
Métodos Insesgados babilidad proporcional a £ x¡. Tal vez, el método más simple para
Una estimación, debida a Hartley y Ross (1 9 5 4 ), puede deri hacer esto (Midzuno, 1951) es el de extraer el primer miembro de
varse partiendo de la media F de las razones y¡/r¡ y corrigiéndola la muestra con probabilidad proporcional a Xi- Los restantes (n — 1)
por sesgo. miembros de la muestra se sacan con probabilidad iguales. Es fácil
probar (Ejercicio 6.10) que con este método, la probabilidad de sacar
. l A 1 A yi
r = ~ L ri - ~ L ~ _ „ n n
n n x¡ una muestra específica es proporcional a £ x,. y que R = £ y j £ x¡ es in
Ahora sesgada para este método de selección de muestra.
1 -v _ 1 n v. /1 N \_
Métodos con un sesgo del orden 1/n3
N ¡-i N ¡-ix ¡ W i= i /
Estos métodos consisten en hacer un ajuste a R. El primero,
= Y - X E ( r i) = X [ R - E ( r i)-\ (6.72)
debido a Quenouille (1 9 5 6 ), se aplica a una vasta clase de proble
E S T IM A D O R E S DE R A Z O N 225
R0 = w R - (w - l)R - (6.82)
mas estadísticos en los que la estimación propuesta tiene un sesgo
de orden 1/n. Se ha llamado jackknife porque se trata de un instru donde xu = g [1 — (n — m ) / N ] , o con m = 1, g = n, vj — n [1 —
mento de múltiples usos. La utilidad de este método para estimacio (n —1 )/N ].
nes de razón la señaló Durbin (1959). El estimador de Beale (1 9 6 2 ) es
Al ignorar la cpf por el momento, el sesgo de estimaciones como ó y + [(l-/ )/ n ](s y,/-f) .__ a l + [(l-/ynJCy.t o.x
R se puede desarrollar en una serie del tipo B x + [ ( l - f ) l n \ s x2/x) 1 + [(1 ~ f ) / n ] c xx
E (R ) = R + ~ + ^ + - - - (6.77) en tanto que el de Tin (1 96 5) es la cantidad estrechamente rela

n n cionada
Si n = mg, dividamos la muestra al azar en g grupos de tamaño m.
A partir de (6.77) Rr = R
(6'84>
E (g R ) = g R + — + — !+ • • • (6.78)
m gm donde syx = ¿ ( y ¡ - y ) { x ¡ - x ) / ( n -1 ), sx2 = I(r ,- - x f / ( n -1 ), de modo que
cvx, c „ son la covarianza relativa y la varianza relativa de la mues
Ahora, sea R¿ la razón ordinaria £ y/'Zx, calculada de la muestra,
tra de x.
después de omitir el grupo j-ésimo. Como R¡¡ se obtiene de una
La estructura de RT se puede ver al notar que por (6 .3 4 ), el
muestra aleatoria simple de tamaño m ( g - 1 ), tenemos
término guía en el valor esperado de R puede escribirse
E (R ,) = R + . bl- ■+■— ^ 5 - 2 + - •• (6-79)
(g - l)m (g - 1 ) m * [ i + í i i £ (c „ - c w )]
Por lo tanto Evidentemente, /?r es el-ajuste de R por una estimación de mues
tra de la corrección del sesgo requerida. 2?s y R T son idénticas a los
(680) términos de orden 1/n, y en general se comportan en forma similar.
Al sustraer de (6 .7 8 ) se obtiene, hasta el orden rr-.

6.16 C O M P A R A C IO N DE L O S METODOS
E^ - » á' > R - ^ w - R - ^ i r i5 Ejemplo. La población artificial de la Tabla 6.6 contiene tres estratos
con N,, = 4, n h = 2 en cada estrato. La población se construyó deliberada
Ahora el sesgo es de orden 1/n2. Podemos construir g estimaciones mente de modo que ( a ) R h varíe marcadamente de un estrato al otro, lo que
de estetipo, una para cada grupo. El estimador deQuenouille (el
jackknife) es el promedio de estas g estimaciones, o sea TA B L A 6.6. U n a P e q u e ñ a P o b l a c ió n A r t if ic ia l
R o = g R -(g -l)R - (6.81) Estrato
donde R - es el promedio de las g cantidades R, C o m o lo muestra I II III

Quenouille, la varianza de R 0 difiere de la de R por términos de
orden 1/n2. Cualquier incremento en la varianza debido a este ajus y x y X y x
te por sesgo, debería, por lo tanto, ser despreciable en muestras 2 2 2 1 3 1
3 4 5 4 7 3
moderadamente grandes. La elección m = 1, g = n parece la mejor
4 6 9 8 9 4
con el método Jackknife en muestras pequeñas. 11 20 24 23 25 12
Si no puede ignorarse la cpf, el término guía en el sesgo de R ,
como en (6 .3 3 ) es de la forma b i ( l — f)/ n . Puede demostrarse Totales 20 32 40 36 44 20
(Ejercicio 6.10) que para quitar ambos términos en 1/n y en 1/N 0.625 1.111 2.200
necesitamos
2.9.9. t t /'rtta . „ —
22.6 TE C NIC AS DE M U ESTRE O

E S T IM A D O R E S DE R A ZO N 227
favorece una estimación de razón separada YR„ Y ( b ) R,, sobreestima en

n — 2, la prueba más severa, las medias y cuartiles superiores de
cada estrato, con la amenaza de un sesgo importante cumulativo en YR¡.
Se compararon los siguientes métodos de estimación del total de pobla las cantidades ¡sesgo|/VECM fueron: RQ, 3 % , 7% ; Ra, 8 % , 12%;
ción Y.
Rt , 8 % , 19%; en contraposición a 15%, 20% para R. Los méto
Expansión simple: Y N hyh dos más complejos parecen ser útiles en lo que respecta al sesgo en
Razón combinada: (y J x „ )X estas muestras muy pequeñas.
El mismo estudio comparaba los ECM de cinco de las estimacio
Razón separada; £ ( y j x . )X h = £ R „X h
nes de esta sección con el de R. (Se omitió el método de Lahiri,
Las estimaciones restantes, la separadla de Hartley y Ross, la de Lahiri y la porque el estudio estaba confinado a las muestras aleatorias simples.)
de Quenouille, los métodos de Beale y de Tin, tienen la misma forma que
Para cada método se calculó la razón 100 ECM ( R0 ) ECM ( R ).
la estimación de razón separada, salvo que R (HR)h, R ruh, etc., reemplazan Rh.
(Para nh = 2, los métodos de Hartley-Ross y de Mickey, son idénticas). Hay y así sucesivamente para cada población.
6-1 ■= 216 muestras posibles. Los resultados son exactos salvo errores de re Para n = 4, las estimaciones de Quenouille y Mickey, fueron
dondeo. Por su ayuda en algunos de los cálculos estoy en deuda con el doc un poco inferiores a R en estas poblaciones, pero para n > 6 todos
tor Joseph Sedransk. los métodos tenían un promedio de ECM muy cercano a los de R.
Los resultados de la Tabla 6.7 exhiben algunos aspectos interesantes. Para
Para una muestra muy pequeña en una sola población, este estudio
la estimación de razón combinada, la contribución del cuadrado del sesgo al
error cuadrático medio es trivial, a pesar de las condiciones extremas, pero sugiere que estos métodos más complejos no presentan ventaja ma
esta estimación es mediocre en lo que respecta la varianza, por la amplia terial en exactitud sobre R . Pero el hecho de que reducen el sesgo
variación de los R h. A l juzgar por el ECM, la estimación de razón separada con un incremento pequeño o nulo del ECM en un estrato, debería
es mucho más exacta que la estimación combinada, pero está fuertemente darles ventaja en una estimación de razón separada con numerosos
sesgada. De los métodos insesgados, el de Hartley-Ross muestra una varianza
relativamente alta, como se ha encontrado para n* = 2 en algunos estudios estratos, que tienen muestras pequeñas.
sobre poblaciones naturales. El método de Lahiri se comporta particularmente En modelo de regresión lineal, comparaciones de los ECM de
bien. Esta población se adapta al método de Lahiri porque una unidad en estos métodos para n, efectuadas por P.S.R.S. Pvao y J.N.K. Rao
cada estrato tiene valores excepcionalmente altos de y. así como de rc¡, con (1971), Hutchinson (1 97 1) y J.N.K. Rao y Iíuzik (1 97 4) dieron re
la consecuencia de que esta unidad tiene una probabilidad elevada de salir sultados que en general concuerdan con los de poblaciones naturales.
y las muestras que contienen esta unidad dan buenas estimaciones de Rh.
Los métodos de Quenouille, Beale y Tin, produjeron disminuciones impor
tantes del sesgo, en comparación con la estimación de razón separada, y
6.17 ESTIMACION MEJORADA DE LA VARIANZA
todos tuvieron menores ECM, de modo que en este ejemplo, lograron sus pro
pósitos principales.
Un estimador que vale la pena considerar para muestras peque
TA B LA 6.7. R e s u lta d o s p a ra D ife r e n te s E s tim a c io n e s de Y ñas o moderadas es el que sugirió Tukey (1 95 8) para la estimación
Método
de jackknife (Quenouille) R 9. Con g grupos, n = mg, y f despre
Varianza (S e s g o )2 ECM
ciable, R9 es el promedio de las g cantidades.
Expansión simple 820.3 0.0 820.3
Razón combinada 262.8 6.5 269.3 A ¡= g ñ -(g -i)ñ ,
Razón separada 35.9 24.1 60.0
Razón separada de donde R¡ = £ y/£ x, se calcula después de omitir el grupo j. Si las R'¡
Hartley-Ross 153.6 0.0 153.6 pudieran considerarse como g estimaciones independientes de R,
Separada de Lahiri 19.6 0.0 19.6
Separada de Quenouille 42.9
entonces, con muestreo aleatorio simple, la siguiente sería una esti
1.1 44.0
Separada de Beale 28.9 8.0 36.9 mación insesgada de V (R Q)
Separada de Tin 28.6 5.7 34.3
„(« o ). < w > í i f z M (M 5 )
El estudio de J. N. K. Rao (1 96 9) de poblaciones naturales, que g (g - 1 )
se mencionó en la Sec. 6.9, comparaba los métodos de Quenouille, Dado que R ' - R Q = - ( g - l)(R ¡ -/?_), (6.85) se calcula más fácil
- - o d 6 8 en 15 de dichas poblaciones. Para mente como
228 T E C N IC A S DE M U E S T R E O
ESTIMADORES DE R A Z O N 229
lineal de y respecto a x en una población infinita con x normal, sin

» ( ¿ o ) = ( 1- ^ 1]t ( R , - R - ) 2 (6.86)
o embargo, v ( R q) y v , ( R ) resultaron más o menos igualmente esta
donde R . es la media de las g cantidades R¡. bles para 71 = 4 hasta n = 12.
Con una estimación de razón separada y numerosos estratos,
Por supuesto, las R'¡ o R para diferentes j no son independientes
estos resultados sugieren que £ X h2v(R 0h)es superior a £ A „2i>i(R,,)como
y la Fórmula (6 .8 6 ) es^ una aproximación. Hasta aquí, las propie
estimador de V ( Y R¡). Puede esperarse que el primero tenga menos
dades analíticas de v ( R q) se han establecido sólo para muestras
sesgo y ambos sean adecuadamente estables. Pero con pocos estra
grandes. Arvesen (1 96 9) mostró que para una amplia clase de
tos, estas afirmaciones son cuestionables antes de tener información
estimaciones que incluyen Rq y que son simétricas en los elementos
de la muestra [estimaciones que se conocen como las [/-estadísti suficiente a nuevas comparaciones.
cas de Hoeffding (1 9 4 8 )], la Fórmula v(R0 ) se hace insesgada
cuando se fija g o para g = n al crecer n lo suficiente. 6.18 C O M P A R A C IO N DE DOS R A Z O N E S
Del estudio de Rao (1 9 6 9 ) de ocho poblaciones naturales, se
reportaron en la Sec. 6.9 para n = 4, 6, 8, 12, porcentajes de sub En muéstreos analíticos frecuentemente es necesario estimar la
estimaciones por promedio de muestras pequeñas en la v ¡ ( R ) es diferencia R —R ' entre dos razones y calcular el error estándar de
tándar, como estimación del verdadero E C M (R ). Los correspon R — R'. Las fórmulas que se dan aquí, son para la varianza estimada
dientes porcentajes de sesgo promedio en v ( R 9) se muestran cor. de R — R', ya que éstas son las que se requieren más frecuente
fines comparativos en la Tabla 6.8; éstos son los promedios de los mente. Las cpf se omiten por las razones dadas en la Sec. 2.14.
ocho números: 100 [t/(Rg) - E C M (fíg)]/ E C M (ñ Q).
Primero se supone muestreo aleatorio simple. Se pueden dis
tinguir tres casos.
TA B L A 6 .8 . Po rcentaje de S e s g o P r o m e d io en E s t im a c io n e s
de V A R IA N Z A Las Dos Razones son Independientes

n= Esto ocurre cuando las unidades se clasifican en dos clases dis
Promedio de 4 6 8 12
tintas y queremos comparar las razones estimadas separadamente
100[u(Ro )-E C M (R o)]/ECM(Ro ) + 11% + 10% +6% + 1% en ambas clases. Por ejemplo, en un estudio sobre gastos domésti
cos una muestra aleatoria simple de familias se puede subdividir
100[u(Ro )-ECM (R)]/ ECM (R) + 11% + 10% +6% +1%
en casas propias y alquiladas, para comparar las proporciones de
100[u,(R) -E C M (R)]/ ECM (R) -31% -23% -21% -18%
gasto en el mantenimiento de la casa en las dos clases. Si las razones
estimadas se denotan por R = y/x, R ' = y/x', entonces
La Tabla 6.8_ también da los promedios de las cantidades 100
[u (R g) — E C M (R )]/ E C M (R ). Estos promedios son de interés para v ( R - R ) = v ( R ) + v (R ') 6.87)
el investigador que usa R, peroêstá dispuesto a reemplazar u ,(R )
por v ( R q) como estimador de V ( R ) si parece menos sesgado. En vista Las Dos Razones Tienen el Mismo Denominador
de los sesgos en R y R q, las comparaciones más apropiadas de V (R g)
Cuando la unidad es un conglomerado de familias, puede querer
se hacen con los ECM.
se comparar la proporción de adultos del sexo masculino que usan
En estas poblaciones, v ( R q) es una ligera sobreestimación de
rasuradoras eléctricas con la proporción de quienes usan navajas.
ECM (R g ) y E C M (R ), en tanto que v ^ R ) tiene sesgos negativos
En cualquier unidad, y = número de hombres adultos que usan ra
sustanciales en estas muestras pequeñas.
suradoras eléctricas, y' = número de hombres adultos que usan
La estabilidad de v ( R g) con relación a la de v ¡ ( R ) juzgada por
navajas y x = número total de hombres adultos.
los cuadrados de los coeficientes de variación de estas estimaciones
de varianza, resultó bastante pobre en estas muestras. En estudios de
Rao y Beegle (1 9 6 8 ) de v ( R q) y i>l ( R ) en un modelo de regresión
X
E S T IM A D O R E S DE R A ZO N 231
TABLA 6.9. N ú m e r o d e N iñ o s ( x , x ' ) y C a sos d e P a r a lít ic o s

Si di = y i — y/ , la varianza estimada de R - R ' puede calcularse (y, y ') p o r C ondado
como X ar'
x' yt y' y y'
V(É (6-88) 4.1 2.4 0 0 13.8 25.6 3 3

3.5 8.0 i 6 10.5 8.1 2 0
4.1 6.1 7 2 21.6 25.9 10 7
Las Dos Razones T ien en Denom inadores D iferentes 2.6 4.6 2 1 3.5 6.7 2 2
pero Pueden Estar Correlacionadas 2.4 1.5 2 1 6.8 7.3 3 8
2.2 1.9 0 2.3 3.7 0 1
Un ejemplo es la comparación de la proporciónde hombres que 2.6 2.9 2 0
1.1 4.0 1 1
fuman, con la proporción de mujeres que fuman,en una encuesta 1.6 4.0 1 2 6.0 11.1 3 1
en la cual la unidad es un conglomerado de casas. Matemática 5.7 7.8 1 11.0 14.8 7 11
mente, éste es el caso más general. 3.3 11.0 3 7 19.4 42.5 11 14
1.0 3.8 0 1 6.8 13.7 6 2
v(R - R ') = v ( R ) + v ( R ' ) - 2 co v (RR' ) (6 .89)
2.0 5.2 1 1.2 4.0 3 1
El único término que no es familiar es cov ( R R ' ) . Al escribir, en la 8.3 19.0 4 4 5.4 9.3 11 6
1.0 3.7 1 5 1.7 2.6 0 2
forma usual
1.1 4.2 0 1 2.1 2.3 0 0
- „ y-R x A, y ' —R ' x ' 2.3 6.8 1 2 1.5 2.6 0 0
R - R ^ ^ — R ' - R ' = y
X' 1.9 3.5 0 2 3.0 4.0 0 2
tenemos
Totales 167.4 284.6 88 99
cov cov (y, - R x , )(y i' - R ' x l')
* x, x’ = números de niños "placebo" y “no inoculados" (en miles),
t y, y' = números de casos de polio con parálisis en los grupos placebo y no inoculados.
Una estimación de la muestra puede calcularse como sigue:
99 284.6
cov (JÚ?0=w(n i -1^ Í (y¡y ' - R y ’xi - R ‘yixi'+ R R 'x lx - ) (6.90) N o inoculado: R ' = ^ = 0.347857, x ' = —^ y = 8.3706
Ejemplo. E l experimento de campo de la vacuna Salk contra la polio Para v ( R ) , v ( R ') y co v (R R '), se requieren todas las sumas de cuadrados
se condujo entre niños en ios primeros tres grados en todas las escuelas de y productos sin corregir entre las cuatro variantes.
cierto número de condados. Los condados no fueron seleccionados al azar,
ya que se favoreció a aquellos con una historia de polio previa, pero para v (R )= . 1 -- i ( X y 2- 2 R X y x + Á ; I ^ )
esta ilustración se supondrá que fueron una muestra aleatoria de alguna n(n - I)*
población.
Los niños cuyos padres no les dieron permiso para participar en la prueba, = i ----------[(564) - (1.05137)(822.2) + (0.27635)(1661.92)]
(34)(33)(4.9235)
se llamaron el grupo de los “no inoculados” y, desde luego, no recibieron
inyecciones. La mitad de los niños que sí tenían permiso, recibieron tres inyec = 0.00584
ciones de un líquido inerte y se llamaron el grupo “placebo” . De los datos en
la Tabla 6.9, compare las frecuencias R, R ' de polio con parálisis en los gru Similacmente, encontramos v ( R ') = 0.00240.
pos "n o inoculado” y “placebo”. Para reducir la cantidad de datos, la com
paración se restringe a 34 condados, cada uno con más de 4 000 niños en co v ( R R ') = l ,._-_-l( I y y ' - R l . y ' x - R , Y y x ’ + R R 'Z x x ')
n (n - \ )x x
ambos grupos combinados.
En estos datos cualquier variación en el grado de ataque de polio de (497) - (0.52569)(844.6) —(0.34786)(1397.4)
condado a condado produciría una correlación positiva entre R y R'. Las ____________________ + (0.52569)(0.34786)(2690.8)
siguientes cantidades se derivan de los totales.
( 3 4 ) ( 3 3 ) ( 4 . 9 2 3 5 ) ( 8 .3 7 0 6 )
QQ 1Z**T A
Placebo: / ? = — — -=0.525687, x = — ^- = 4.9235 = 0.00127
167.4 34

Por lo tanto,
'ocasiones estimación de razón doble. Como para la razón simple, el
e.e.(R ~ R ') = /0.00584 + 0.00240- 0.00254 = 0.0754
término guía del sesgo de R/R' es del orden de 1/n, pero más com
Dado que R — R ' = 0.1778, la diferencia alcanza importancia al nivel de 5% plejo que el de R o R ' . Podemos escribir
(la distribución de R — R' puede ser un tanto asimétrica para este tamaño
de muestra). Una posible explicación es que los niños no inoculados pueden R / R '= (R/R')(\ + S y )(l + S x ' ) / ( l + S m +Sy') (6.94)
haber tenido más protección natural contra la polio que los niños placebo.
donde s y denota (y - Y ) / Y, y así sucesivamente. Cuando se desarro
Puede darse el mismo problema en muestras estratificadas en las
lla esta expresión, hay seis términos cuadrárteos de orden 1/n que
cuales los dominios del estudio atraviesan los estratos. Si Ri„ Rh'
aparecen en el sesgo de R/R'. Rao y Pereira (1 9 6 8 ) dan una expre
parecen variar de estrato a estrato, la comparación sebasará proba
sión exacta para este sesgo.
blemente enun examen de los valores de Rn — R / enlosestratos in
dividuales. Al encontrar los errores estándar de R-„ - Rh', es posible La fórmula (6 .8 ) para la varianza relativa V (R )/ R 2= CAA de
determinar si estas diferencias varían de estrato a estrato y, si no, una razón, se puede escribir
calcular una diferencia global eficiente. C&R = Cyy T T- 2 Cyf
Si las R/,, R h' no exhiben una variación real de estrato a estrato,
puede ser suficiente con comparar las estimaciones combinadas De aquí que el término guia en V(R/R') sea
Re y Rc' . Como anteriormente
V ( á / f t * ( j p ) \ c Mm + C A.A. - 2 C M -) (6.95)
u(/?c - K ’) = v(Rc) + v(R c' ) - 2 cov ( R cRc') (6.91)
donde, al poner dhi = (yhi- y h) - R c{xhi- x h), donde
C RR- = Oyy'+C-cx-—Cfg —Cyl (6.96)

v(Ac) = 4 i l ~ (6.92)
x„ h n h(n h — i ) i para la estimación de muestra correspondiente v(R/R') sustituimos
estimaciones muéstrales de los términos en (6.95).
cov (RCRC') = ^ 4 -7 1 Nh* I dudu' (6.93)
x,¿„ h n,,(nh- 1) , , Ejemplo. Para la razón de las tasas de placebo y casos no inoculados
R/R = 0.52569/0.34786 = 1.511. Estimar el error estándar de esta razón. Los
Una discusión más prolija sobre la comparación de razones, que cálculos del ejemplo precedente, proporcionan
incluye fórmulas abreviadas de cálculo cuando las muestras las per
a 0.00584 „ „ . 0.00240
miten, ha sido dada por Kish y Hess (1959b).
¿ " - ( ó l 2 W - 00211; ^ * 0 5 4 7 9 ? " a ° 198:
A 0.00127
6.19 R A Z O N DE DOS R A Z O N E S * * ’ “ (0.5257X0.3479) ~ ° ' 00694
En algunas aplicaciones deseamos estimar la razón R/R' de dos v (R / R ‘) = (1.511)2(0.0211 +0.0198) -0.0139) = 0.0617
razones. Así, en el ejemplo precedente, podríamos interesarnos en e.e. (R / R ') = 0.248
la razón R/R' de las tasas de niños paralíticos que recibieron un "pla
_ La_ estimación de razón doble se ha utilizado ocasionalmente en lugar de
cebo” y de los niños no inoculados, o la razón de las proporciones Y„ = R X , para estimar un total de población Y. como lo sugirió Keyfitz (Ya
de hombres y mujeres que trabajan, tomados de una muestra con tes, 1960). Supóngase que R '~ (y'/x') se conoce para la misma muestra en
glomerada. Si los datos (y, x ) están a la disposición en la misma un periodo previo y que también se conoce R '= Y '/ X '. Si R'/R' se encon
muestra para dos periodos de tiempo, la cantidad podría ser la razón tró que es, digamos un poco superior a > 1, podríamos argüir intuitivamente
de gastos semanales alimenticios por cada casa en los dos tiempos que R también es de esperarse que dé una sobreestimación de R que debería
diferentes. ajustarse hacia abajo, al dividirla entre la razón R'/R'. Esto conduce a la
estimación de razón doble YDR.
Con una muestra aleatoria simple (es decir de conglomerados)
la estimación muestral de R/R' es R/R’ = {y/x)/(y'/x'), llamada en
Yd r = j , ( R X ) = ^ , ( R 'X ) (6.97)
Como la varianza relativa de YR es C&,j , en tanto que la de YDR es

En la práctica, las ponderaciones se determinan a partir de va
rianzas y covarianzas u¡, estimadas. De (6 .7 ) en la Sec. 6.3,
C&tt + C frA -lC uñ - (6.98)
(1 - f ) Y 2
la razón doble dará una estimación más precisa en muestras grandes si la vu = (cyy+ c11-2 c yl)
correlación entre R y i? ' es bastante alta.
(1 - f ) Y :
Vzz = (c yy + C2 2 - 2cv2)
/i
6.20 E S T IM A C IO N E S D E R A Z O N M U L T IV A R IA N T E S
donde c„„ = sy2/y*, etc. La covarianza puede expresarse como
Olkin (1 9 5 8 ) ha extendido la estimación de razón a la situación
(1 -/ ) Y 2
en la cual p variables auxiliares x (x ¡, x2, . . ,xP) están disponibles. La fl2 — \Cyy + C i2 — Cy ! - Cy2)
estimación propuesta para el total de la población, digamos YMR n
para la razón multivariable, es Un método conveniente de cálculo es obtener primero la matriz
Y v « = Wl Í r X l + vy21 -X 2+ • - -+ Wp~~Xp cyy Cyi cy2

X\ x2 xp C= Cy 1 C 11 C l2
Cy2 C i2 c 22
= Wl f'Rl + W2f Jtl + - - - + W,YRp
Si Vi/ = nv¡¡/( 1 - f)Y - , la matriz v,/ se obtiene fácilmente al to
donde las W ¡ son ponderaciones por determinarse para maximizar la
mar contrastes diagonales en C, esto es,
precisión de YMR, respecto a s W j = 1. Este tipo de estimación pa
rece conveniente cuando la regresión de y en xe, x 2, . .. x„ es lineal an = cyy+Ci i - cyi —cyx
y pasa por el origen. Deben conocerse los totales de población X¡. t ' i 2' = cyy + ci2- c v, - c y2 etc.
El método se describe para dos variables x, ya que esta seria la
aplicación más frecuente. Tenemos El factor (1 — f)Y-/n no se necesita para calcular w¡, pero debe ser
insertado cuando se calcula la varianza mínima. Entonces
Ym r - Y = Wí (Y r - Y ) + W2(Y r , ~ Y) ■
¡y
Vmm( * MR)
( t’n 't’2
,
2, ~t-1
i ,
i2'~)' o >\
(61011
(O .lU l)
Por lo tanto, al suponer que el sesgo es despreciable, n (vn +1722 -2t7l2)-
V (Ym r ) = W l W ( Y Ri) + 2 W l W2cov ( ÉR, Yr ¡ ) + VY22V( YK¡) En vista de la cantidad de cálculos involucrados, esta estimación
probablemente se restringirá a encuestas pequeñas de alcance espe
= WS Vu + 2 W 2 Y 12+ VU22 U22 (6.99)
cializado. El método es capaz de dar un marcado aumento en preci
donde Vn = V (Y R,), etc. Los valores de W 1( W 2, los cuales minimi sión sobre Y r¡ o Y*s solas.
zan la varianza, respecto a W , + W , = 1, se encuentra que son
Y22- Yi2 w _ Yu~V\2 6.21 E ST IM A D O R E S P R O D U C T O

1 V n + V22- 2 V l2’ 2 V n -hV22- 2 V , 2
y la varianza mínima es Si una variable auxiliar x tiene correlación negativa con y donde
x y yson variables que sólo toman valores positivos, unanálogo
natural del estimador de razón es el estimador producto, para el cual
( YMr ) = v - ~ Vo í (6-100)
V ll+ »22_ ¿ n 2
Con p variante, es necesario calcular la inversa Vi¡ de la matriz ñ=^y; n = N i? y ( 6 .102)
Yíj-, Entonces, la óptima 1Y-X./X-. donde 2 ¡ es la suma de los
i*
elementos en la i-ésima columna de V iy y 2 es la suma de todos Por la expansión usual en serie de Taylor, el análogo de (6 .8 ) para
ios elementos p- de V ' 1. La varianza mínima es 1/2. el estimador producto en una muestra aleatoria simple grande, es
236 T E C N IC A S DE M U E STR E O
ESTIM ADORES D E RA ZO N 237
6.5. Los datos siguientes son de una pequeña población artificial con
(cu)2= — ~ ( C yy+ Cxx + 2Cvx)
(6.103) N ■= 8 y dos estratos de mismo tamaño.
n
A
donde ( c v ) 2 es el cuadrado del coeficiente de variación de Yp o de Estrato 1 Estrato 2
Yp. P.S.R.S. Rao y Mudholkar (1 9 6 7 ) han extendido el estimador
Vu x2i Va
de razón multivariante de Olkin a ¡una combinación ponderada de es
2 0 10 7
timadores de razón (para x¡ positivamente correlacionados con y)
5 3 18 15
y estimadores producto (para .r¡ negativamente correlacionados
9 7 21 10
con y). 15 10 25 16
E J E R C I C I O S
Para una muestra aleatoria estratificada en la cual 7^ = n2 — 2, compare
los ECM de YKs y Y *c encontrando los resultados para todas las muestras po
6.1. Una encuesta piloto de 21 hogares dio los siguientes datos para nú sibles. ¿Hasta qué punto es la diferencia en el ECM debida a sesgos en las
mero de miembros ( x ) , hijos ( y , ) , automóviles ( y 2) y receptores de T V (j/3). estimaciones?
6.6. En el Ejercicio 6.5 calcule la varianza dada usando el método de Lahiri
X Vi Vi 1/3 X ¿6 V i V3 X y2 y3
de selección de la muestra dentro de cada estrato y una estimación de razón
separada.
5 3 1 3 2 0 0 1 6 3 0
3 1 1 4 2 1 1 6.7. Cuarenta y cinco estados de los Estados Unidos (excluyendo los 5
2 0 1 1 1
a más grandes) fueron colocados en 9 estratos con cinco estados cada uno, los
4 1 2 0 0 2 0 4 2 1 1
estados dentro del mismo estrato tienen aproximadamente la misma razón
4 2 1 1 6 4 2 1 3 1 0 1
de población de 1950 a 1940. Una muestra aleatoria estratificada con nh = 2
6 4 1 1 3 1 0 0 2 0 2 1 dio los siguientes resultados para la población en 1960 (¡/) y 1950 ( x ) , en
3 1 1 2 4 2 1 1 4 ¿- 1 1 millones.
5 3 1 1 5 3 1 1 3 1 i 1
Estrato
Suponiendo que se conoce el total de población X, ¿recomendaría usted 1 2 3 4 5 6 7 8 9
que se usaran estimaciones de razón en lugar de expansiones simples para
estimar el total de hijos, automóviles y receptores de TV? Vu 0.23 0.63 0.97 2.54 4.67 4.32 4.56 1.79 2.18
6.2. En un campo de cebada se pesaron el grano, y¡, y el grano más *A1 0.13 0.50 0.91 2.01 3.93 3.96 4.06 1.91 1.90
la paja, x¡, en cada una de un gran número de unidades de muestreo locali y»2 4.95 2.85 0.61 6.07 3.96 1.41 3.57' 1.86 1.75
zadas al azar por todo el campo. También se pesó la cosecha total (grano 2.78 2.38 0.53 4.84 3.44 1.33 3.29 2.01 1.32
más p a ja ) del campo completo. Se obtuvieron los siguientes datos: cn = 1.13,
c ■= 0.78, cXI = 1.11. Calcule la ganancia en precisión obtenida al estimar
el rendimiento en grano del campo, de la razón grano a cosecha total en Dado que el total de población en 1950, X, es 97.94, estime la población
lugar de usar el rendimiento medio de grano por unidad. en 1960 mediante la estimación de razón combinada. Encuentre el error están
Se necesitan 20 min para cortar, trillar y pesar e l grano en cada unidad, dar de su estimación mediante el método abreviado de Keyfitz (Sec. 6.13).
El total con-ecto para 1960 fue 114.99. ¿Coincide su estimación con esta cifra
2 min para pesar la paja en cada unidad y 2 horas para recolectar y pesar
dentro de los errores de muestreo?
toda la cosecha del campo. ¿Cuántas unidades se deben tomar por campo
para que la estimación de razón sea más económico que la media por unidad? 6.8. En el ejem plo de una razón bivariante dado por Olkin, se tomó una
6.3. Para los datos en el Tabla 6.1, YR = 28,367 y cw = 0.0142068, cft = muestra de 50 ciudades de una población de 200 ciudades. Las variables
0.0146541, Cu = 0.0156830. Calcule los límites cuadráticos de confianza al y. x,, x„ son número de habitantes por ciudad en 1950, 1940 y 1930, respec
95% para Y y compárelos con los límites encontrados mediante la aproxima tivamente. Para la población, y = 1699, X , = 1482,X , = 1420 (en cientos) y,
ción normal. para la muestra y = 1896,x, = 1 6 9 3 , = 1643. La matriz C según se define
en la Sec. 6.20 es
6.4. Los valores de y y x se miden para cada unidad en una muestra alea
toria simple de una población. Si se conoce X , la media de población de x,
y x¡ *2
¿cuál de los procedimientos siguientes recomienda, para estimar Y/X? ( a ) 1.213
y 1.241 1.256
Usar siempre y/X. ( b ) Usar algunas veces y/X y otras veces y/x. ( c ) Siempre 1.241
X, 1.302 1.335
usar y/x. Dé sus razones.
*2 1.256 1.335 1.381
Estime Y mediante ( a ) la media de la muestra, ( b ) la razón del número

de habitantes de 1950 a 1940 y ( c ) la estimación bivariante. Calcule el error
estándar estimado de cada estimación.
6.9. Pruebe que con el método de Midzuno de selección de muestras (Sec.
6.15) la probabilidad de que se extraiga cualquier muestra específica es
C A P IT U L O 7
(n - l)!(A f- n )!¿ (x ,)
(IV — 1)! X
6.10. En poblaciones pequeñas, el término guía del sesgo de R en mues
tras aleatorias simples de tamaño n es de la forma
Estimadores de Regresión
n n A
donde b, no depende de n, N. Si n = mg y la muestra se divide al azar en g

grupos de tamaño m, sea R, = £ y/ £ x tomados entre los ( n — m ) miembros
restantes de la muestra cuando se omite de ésta el grupo j. Demuestre que
7.1 L A E S T IM A C IO N D E R E G R ESIO N L IN E A L
en el sesgo de la estimación
w R - (w - l)R , A l igual que la estimación de razón de regresión lineal se ha

ambos términos en b, se anulan si w = g [ l - ( « - m ) [ N ] . diseñado para aumentar la precisión con el uso de una variable
auxiliar x, correlacionada con y i. Cuando se examine la relación en
tre y¡ y x,, podrá encontrarse que aunque se trata de una relación
aproximadamente lineal, la línea no pasa por el origen. Esto sugiere
una estimación basada sobre la regresión lineal de y¡ respecto a x¡
y no sobre la razón de ambas variables.
Supongamos que cada y, y x¡ se obtienen para todas y cada una
de las unidades de la muestra y que se conoce la media de población
X de los valores x¡. La estimación de regresión lineal de Y, media de
población de los y, es
y,, = y + b ( X - x ) (7.1)
donde el subíndice Ir denota regresión lineal y b es una estimación
del cambio en y por incremento unitario de x. El fundamento de esta
estimación es que si x está por debajo del promedio, también debe
ríamos esperar que y lo estuviera por una cantidad b { X - x ) debido
a la regresión de y^ sobre x¡. Para una estimación del total de pobla
ción y, tomamos Y,r - Nylr.
Watson (1 93 7) utilizó una regresión del área foliar respecto al
peso foliar, para estimar el área promedio de las hojas de una planta.
El procedimiento consistía en pesar todas las hojas de la planta. Se
determinó el área y el peso de cada hoja, para una pequeña muestra
de hojas. Posteriormente se ajustó la media muestral del área por
medio de la regresión respecto al peso de las hojas. La cuestión es
desde luego que es fácil pesar una hoja, pero determinar su área
es laborioso.
240 T E C N IC A S DE M U ESTREO E S T IM A D O R E S D E R E G R E S IO N 241
Este ejemplo ilustra una situación general en que la estimación 7.2 E ST IM A C IO N E S D E R E G R E S IO N CO N b P R E A S IG N A D A

de regresión es útil. Supóngase que podemos estimar rápidamente
el x¡ de cierta característica para cada unidad y que también pode Aunque en la mayoría de las aplicaciones se estima b a partir
mos, por un método más costoso, determinar el valor correcto de y i de los resultados de la muestra, en ocasiones es razonable elegir
de la característica para una muestra aleatoria simple de las uni previamente el valor de b. En encuestas repetidas, cálculos anterio
dades. Un experto en ratas podría efectuar una rápida estimación res pueden mostrar que los valores de muestra de b permanecen
visual del número de ratas en cada manzana de una parte de la razonablemente constantes; o si x es el valor de y e n un censo re
ciudad y después por medio de trampas determinar el número real ciente, un conocimiento g eneral de la población podría sugerir que
en cada una de las manzanas de una muestra aleatoria simple. En b~5o~se~áÍcja mucho de la unidad, de modo que se elige b = 1. Como
otra aplicación que describe Yates (1960), se hizo una estimación la teoría del muestreo de estimaciones de regresión con b preasigna-
visual del volumen de madera en cada lote de una población de lotes da es simple e instructiva, consideraremos este caso para empezar.
de un décimo de acre, y después se midió el volumen real para una Teorema 7.1. En el muestreo aleatorio simple, donde b„ es una
muestra de los lotes. La estimación de regresión constante asignada, la estimación de regresión lineal
y+ b (X -x ) ylr = y + b0( X - x ) Sy* Ccl/ar/aniir,
ajusta la media de muestra de las mediciones reales por la regresión es insesgada, con varianza
de las mediciones reales efectuadas respecto a las estimaciones rá
pidas, que no necesariamente carecerán de sesgo. Si x¡ - y¡ = D, , f í U y ,-f)-iH Á n -X )?
de modo que la estimación rápida sea perfecta, excepto por un sesgo
ÑTT <7-3>
constante D, entonces con b = 1 la estimación de regresión viene
a ser
= — A s y2- 2b0Syx+ b02Sxz) (7.4)
y + (X-x) = X+{y-x) n
Nótese que no se necesitó supuesto alguno sobre la relación entre
= (media de población de la estimación rápida)
y y x en la población finita
+ (ajuste por sesgo)
Prueba. Dado que ba es constante en muestreo repetido
Si no se supone un modelo de regresión lineal, nuestro conoci
miento de las propiedades de la estimación de regresión tiene los E(ylr) = E(y) + b0E ( x - X ) = Y (7.5)
mismos alcances que el de la estimación de razón. La estimación por el Teorema 2.1. Además, 9ir es la media de muestra de las can
de regresión es consistente, en el sentido trivial de que cuando la tidades y ¡ - b0( x ¡ - X ) , cuya media de población es Y Así pues, por el
muestra comprende a toda la población, x = X , y la estimación de Teorema 2.2,
regresión se reduce a Y. Como se mostrará, la estimación suele es
tar sesgada, pero la razón del sesgo al error estándar se reduce w I [(y i-Y )-b o (x -X )]2
cuando la muestra es grande. Estamos frente a una fórmula para
V W - V • “ -------Ñ = i a6)
la varianza de la estimación en el caso de una muestra grande, pero
será necesaria más información respecto a la distribución de la es
= — (Sy2- 2 b 0Syx + b0zSx2) (7-7)
timación en muestras pequeñas y respecto al valor de n que se nece n
sita para utilizar prácticamente los resultados de grandes muestras.
Corolario. Una estimación de muestra insesgada de V(y[r) es
Por una elección adecuada de h, la estimación de regresión in
cluye, como casos particulares, la media por unidad y la esümación
, _ f Í [ ( y ¡ - y ) - ó 0U - í ) ] 2
de razón. Es obvio que si b se toma como igual a cero, y¡, se reduce
viyu)— - 1 - ------- — ¡------------ (7.8)
a y. Si b = y/x, n n —1
=— (5v2- 2 6 05y i +A0V ) (7.9)

242 T E C N IC A S DE M UESTREO E S T IM A D O R E S D E R E G R E S IO N 243
Esto resulta de inmediato al aplicar el Teorema 2.4 a la variable Dado que BSX = PSy, esto se puede escribir
auxiliar y, - b0(x, - X ) .
En este momento podemos preguntar: ¿Cuál es el mejor valor + (7.17)
de ¿o? La respuesta la da el Teorema 7.2.
Por lo tanto, si el incremento proporcional en la varianza debe
Teorema 7.2. El valor de b0 que minimiza V(y¡r) es ser menor que «, tendremos
.. I (y -Y ){x ,-X ) <\/a(l —p 2)/ p 2 (7.18)

bo = = (7.10)
Por ejemplo, si p - 0.7, el incremento en la varianza es inferior al
I (x í- X ) 2
i- 1 10%, ( « = 0.1), siempre que
que podría llamarse el coeficiente de regresiónlineal de y respecto
a x en la población finita. Notar que B no depende delaspropiedades < 7(0. l)(0.51)/(0.49) = 0.32
de ninguna muestra extraída, por lo cual, teóricamente podría pre-
asignarse. La varianza mínima resultante es La expresión (7 .1 8 ) nos dice que para asegurar un incremento pro
porcional pequeño en la varianza, b0/B deberá estar cerca de 1, si p
Vmin(?ir) = ^ S y\ l - p 2) es muy elevado; pero puede alejarse bastante de 1, si p es solamente
moderado.
donde es el coeficiente de correlación de la población entre y y x.
Prueba. En la expresión (7 .4 ) para V(ylr), hagamos 7.3 E S T IM A C IO N E S DE R E G R E S IO N C U A N D O b SE

C A L C U L A A P A R T IR D E L A M U E S T R A
h0= B + d A +d (7.12)
. El Teorema 7.2 sugiere que si b debe calcularse a partir de la
Esto da muestra, la ya conocida estimación por mínimos cuadrados de B
será una estimación efectiva, esto es
I (y¡-y)(Xi-x)
b=— n--------------- (7.19)
I
(=i
Es claro que ésta se minimiza cuando d = 0. Como P2 *= S^/S/S*2, La teoría de la regresión lineal desempeña un papel prominente
en la metodología estadística. Los resultados estándar de esta teoría
Vn,¡n(yir) = — Sy2( l - p 2) (7.14) no son enteramente adecuados a las encuestas por muestreo, porque
n
se necesita suponer que la regresión de población de y respecto a x
Puede usarse el mismo análisis para ver qué tanto se aleja bode
sea lineal, que la varianza residual de y alrededor de la línea de regre
B sin incurrir en una pérdida importante de precisión. De (7 .1 3 )
sión sea constante y que la población sea infinita. Si los dos primeros
y (7 .1 4 ),
supuestos son demasiado incorrectos, probablemente no se use una
estimación de regresión lineal. Pero en encuestas en donde la regre
sión de y respecto a x se cree que es aproximadamente lineal, es
útil poder usar yi, sin necesidad de suponer linealidad exacta o va
rianza residual constante.
244 T E C N IC A S DE M U ESTREO E S T IM A D O R E S DE R E G R E S IO N 245
En consecuencia, presentamos un método que no supone ninguna entonces, en muestras aleatorias simples de tamaño n, con n grande,
relación específica entre y-, y x¡. Como en la teoría análoga para la
estimación de razón, sólo se obtienen resultados de muestras grandes. V(yir) = ^ - ^ - S , 2( l - p 2) (7.25)
n
Con b como en (7 .1 9 ), el estimador de regresión lineal de Y
donde P = S^/SjS* es la correlación de población entre y y x.
en muestras aleatorias simples es
Prueba. El error de muestreo de y,, surge de la cantidad
yir = y + b ( X - x ) = y - b { x - X ) (7.20)
ylr- Y = y - Y + b ( X - x ) (7.26)
En la Sec. 7.7 veremos que el estimador y¡„ al igual que yR. tiene
un sesgo del orden de 1Jn. Al encontrar el error de muestreo de y¡n Como aproximación, reemplacemos y,, por
se reemplaza el valor de b de la muestra, en (7 .2 0 ) por el coeficiente yfr = y + B ( X - x ) (7.27)
de regresión de ia población B, en (7 .1 0 ). En el Teorema 7.3, el
error cometido en esta aproximación se verá que es del orden 1/Vñ donde B es el coeficiente de regresión lineal en la población de y
respecto a x. El error en que incurre esta aproximación es (B - b )
relativo a los términos retenidos. En primer lugar examinaremos
la relación entre b y B. • ( X - x ) . Esta cantidad es de orden 1/n en una muestra aleatoria sim
ple d£ tamaño n, ya que tanto ( b — B ) corno ( x - X ) son de orden
Se introduce la variable auxiliar e¡ definida por la relación
1/Vn. Pero el error de muestreo en yir es del orden 1/Vrc dado que
ei = yi - Y - B { x i - X ) (7.21) es el error en la media muestral de la variable auxiliar (i/¡ — Bx¡).
N Por lo tanto, el término guía en E(yir - Y ) 2 es V(y¡,). Por (7 .1 1 ) en
Dos propiedades de los e¡ son que £e,- = 0 y muestras grandes,
T . e ¡ (x i-X ) = £ (> • ,-Y ) ( x , - X ) - B Z ( x , - X ) 2= 0 (7.22) E ( y „ - Y ) 2= V ( y „ ) = -( ^ S 2( 1- p 2) (7.28)

n
Por definición de B. Ahora
b = £ y¡{x¡ - x ) / t U, - x)2 7.4 E S T IM A C IO N DE M U E S T R A DE L A V A R IA N Z A
Como estimación de muestra de V(ylr), válida para muestras

= t [ ? + B ( x , - X ) + e ,](x ,-x )J £ ( x , - x ) 2 grandes, podemos usar
1 [(y t-V -b ^ -x )]2 (7.29)

= B + Íe ,(x l - x )/ Í (x t- x ) 2 (7.23) n (n —¿) ¡>i
Un resultado necesario en el Teorema 7.3 es que (b — B ) sea

del orden de 1/Vra. Portel Teorema 2.3, £ > , (* ; - * )/ (« - 1 ) es una es
timación insesgada de ¿ > ,(x ,-,Y )/ (/ V -1)que por (7 .2 2 ) es cero. Así
esta última es la fórmula de cálculo abreviada usual. Se deduce
T\ e ¡ ( x ¡ - x ) / { n - l ) se distribuye alrededor de una media cero en mues como a continuación.
tras repetidas. Como el error estándar de una covarianza de muestra En el Teorema 7.3, Ec. (7 .2 8 ), teníamos, dado que S„2( l -
se sabe que es de orden 1/Vñ, T . e ¡ ( x ¡ - x ) / ( n - l ) es de orden 1/Vñ7 />*) - St\
Pero £ ( x ¡ - x ) :/(n - 1 ) = í x2 es de orden unitario. Por lo tanto, ( b —
B ), que a partir de (7 .2 3 ) es la razón de estas dos cantidades, es V (y - ,)= ^ 5 ,2
n
de orden 1/Vn.
Del Teorema 2.4 tenemos como estimación insesgada de St-
Teorema 7.3. Si b es la estimación por mínimos cuadrados de B y
r.1- - — Í
y,r = y + b ( X - x ) (7.24) n ~ i i-i
ESTIM ADORES DE REGRESION 247
Ahora bien, la Ec. (7.21) se infiere que

Ejemplo. La precisión de las estimaciones de regresión, razón y media
e ¡ - e = ( y ¡ - y ) - B ( x , - x ) = [(y, - y) - b ( x ¡ - x ) ] + (b - B)(x¡ - x) (7.31) por unidad de una muestra aleatoria simple se pueden comparar usando los
datos reunidos en la lista completa de huertos de durazno descrita en la Pág.
El segundo término de la derecha, de orden l/ V jfp u e d e despre 220. Eneste ejemplo, yt es la producción estimada de duraznos en una huer
ciarse en relación al primero que es de orden unitario. De modo que ta. y x ‘ el número de árboles de durazno en la huerta. Compararemos las
en muestras grandes podemos usar estimaciones de la producción total de los 256 huertos, a partir de una mues
tra de 100 huertos. Es' dudoso que la muestra sea lo bastante grande para
que las fórmulas de la varianza sean completamente válidas, ya que los cv
—“ 7 1 [ ( y / - y ) - 6 f e - i ) ] 2 (7 .3 2 ) de y y x son ambos algo más altos de 10% , pero el ejemplo servirá para
r t - i ,=i
ilustrar los cálculos. Los datos básicos son los siguientes:
como estimación de Sc=. El divisor (n — 2 ) en lugar de (n — 1) se
Sy2= 6 409 S „ = 4434 5,2= 3 898
sugirió en (7 .2 9 ) y (7 .3 0 ), porque se usa en la teoría estándar de la
regresión y sabemos que da una estimación insesgada de Se% si la po R = 1.270 />= 0.887 « = 100 N = 256
blación es infinita y la regresión lineal.
n
7.5 C O M P A R A C IO N EN M U E S T R A S G R A N D E S C O N L A (256X156)
(6 409)(1-0.787) =545 000
E S T IM A C IO N DE R A Z O N Y L A M E D IA P O R U N ID A D 100
Para estas comparaciones, el tamaño de la muestra n deberá ser V (Y r ) = ~ - ~ n \ s 2+ R 2S 2- 2R St, )

n
lo suficientemente grande de modo que las fórmulas aproximadas
para las varianzas de las estimaciones de razón y regresión sean
= ^ 5 j^ [ 6 4 0 9 + (l.ól3)(3898)-2(1.270>(4434)]
válidas. Las tres varianzas comparables para la media de población lUv
estimada Y son = 573 000
y (yir) = ^ j ¡ j ^ S ? ( l - p 2) (regresión) V(Y) = N [N ~ n)S/-= 2 559 000

n
Hay poco que escoger entre las estimaciones de regresión y de razón, como
V(yR) = ( S 2+ R 2S 2- 2RpSySx) ( razón) puede esperarse de la naturaleza de las variables. Ambas técnicas son muy
superiores a la media por unidad.
V ( y ) - ~ —- S » 2 (m edia por unidad) El resultado precedente sobre la superioridad de la estimación de

Nn regresión lineal es sólo para muestras grandes. En pequeñas mues
Es claro que la varianza de la estimación de regresión es más tras de poblaciones naturales, los resultados de la estimación de
pequeña que la de la media por unidad, a menos que p = 0, y en regresión son desilusionantes. En ocho poblaciones naturales del tipo
este caso las dos varianzas son iguales. en el que se ha usado la estimación de razón, Rao (1969), con estudio
La varianza de la estimación de regresión es menor que la de apoyado en Montecarlo, encontró que el promedio de las razones
la estimada de razón si ECM ( Y lr)/ECM ( Y e ) era de 1.15 para n = 12, 1.36 para n = 8 y
1.51 para n = 6. Estas bajas eficiencias de Y lr no se debían a sesgos
- p 2S 2< R 2S 2-2 R p S ySx (7.33)
más grandes en las estimaciones de regresión, porque las correspon
Esto es equivalente a las desigualdades dientes razones de varianzas eran casi las mismas.
( p S y - R S x)2 > 0 o ( B - R ) 2> 0 (7.34)

7.6 E X A C T IT U D D E L A S F O R M U L A S D E M UESTR AS
De este modo, la estimación de regresión es más precisa que la GRANDES P A R A V ( f i r ) y v($u)
estimación de razón a menos que B = R. Esto ocurre cuando la re
lación entre t/¡ y .r¡ es una línea recta que pasa por el origen. N o se tienen resultados analíticos generales sobre la exactitud
de las fórmulas aproximadas (7 .2 5 ) para V(yu) y (7 .2 9 ) para v(y,r)
E S T IM A D O R E S D E R E G R E S IO N 249
parar con la Tabla 6.2, Pág. 211. que se aplica a la estimación de ra
en muestras pequeñas o moderadas. Los estimadores aproximados en zón en las mismas ocho poblaciones, se ve que el porcentaje de las
(7 .2 5 ) y (7 .2 9 ) son subestimaciones en V y v para y¡, son, cuando menos, el doble de
las de y« en muestras del mismo tamaño.
V(yir) = ^ Sv2( 1—p 2) (7.25)
n
7.7 SESG O DE L A E S T IM A C IO N DE R E G R E S IO N L IN E A L
V( h ) = - ^ T 7 x [(y, - y ) - b ( Xi- x ) f (7.29)
n(n ~ ¿) i
El estimador y¡r tiene un sesgo de 1/n en muestreo aleatorio sim
Supongamos que los y¡ para i = 1, 2, . . . N son una muestra alea
ple. Tenemos
toria de una población infinita en el modelo
y ¡= a + P x ,+ £ ¡ (7.35) E(ylr) = Y - E b ( x - X ) (7.37)

de modo que como expresión del sesgo, tenemos - E b ( x - X ) = —oov
donde, para x¡ fijo, las «¡ están distribuidas independientemente con
media nula, varianza <r£2 = <t„2(1 — />-); con este modelo, Cochran (b,x). El término guía del sesgo, resulta ser
(1 9 4 2 ) dio el resultado para los términos de orden l/n\
- (1 ~ n * • < * - & (7 38)
n Sx
E V (% ) = 1 - p 2) (1 + - ^ - r + (7.36)
n \ n —5 n / Este término representa una contribución de la componente cuadrá
donde G, = k^/a/ es la medida de Fisher de la asimetría relativa tica de la regresión de y respecto a x. De modo que si una gráfica
de la distribución de x. Dado que S„'-(l — p- ) en (7 .2 5 ) es una esti de muestra de y¡ contra x, aparece aproximadamente lineal,no exis
mación insesgada de o-„s( l — p-) en este modelo, (7 .3 6 ) sugiere que te riesgo de un sesgo importante en y,r
con x simétricamente distribuida, el porcentaje de subestimación Para mostrar la validez de (7 .3 8 ), habrá que efectuar algunos
mediante V(yu) es 100¡ ( n - 2 ) con este modelo. desarrollos algebraicos. Por (7 .2 3 ), Pág. 244,
De estudios con el método de Montecarlo, en ocho poblaciones n
naturales pequeñas, (Rao, 1968), la Tabla 7.1 muestra para n = 6, X e¡(x¡ —x)
8, 12, el porcentaje de subestimación promedio de la varianza de y,r b —B + —---------- (7.39)
por las aproximaciones de V(y,r) y v(y¡r). X (Xi - x ) 2
n
Para x, simétrica, la Fórmula (7 .3 6 ) sugiere porcentaje de sub Reemplacemos Z ( x¡ ~ * ) Por su término guía, nS/ y escribamos
estimaciones, mediante V(y,r) iguales a 25, 17 y 10% para 7t = 6,
8, 12. Los porcentajes para V{y,r) en la Tabla 7.1 son sustancialmente ( x , - f ) = X ei ( x , - X ) + né( X - x ) (7.40)
más elevados por cantidades que difícilmente se deben a la simetría
de x en estas poblaciones, sino más bien se atribuyen a las deficien Por lo tanto, el término guía del sesgo - E b ( x - X ) de y,r es el pro
cias en el modelo lineal. Las subestimaciones son aún mayores para medio de
las estimaciones de muestra de la varianza u(y,r). Además, al com-
-Íe ,(x t- X )(x - X ) é (x -X )2 rn
TA B LA 7.1. P o r c e n t a j e d e S u b e s t im a c ió n P r o m e d io d e l a 7s?--------------------------------------------<7-41)
V a r ia n z a d e y¡ ,
Sea «i = e ¡(x ¡-X ). Por (7 .2 2 ) su media de población ¿7=0. Por lo
n tanto, el valor promedio del primer término en (7 .4 1 ) puede escri
Estimador 6 8 12 birse
V (y je n (7 .2 5 ) 38 34 28
v(y¡,)en (7.29) 48 42 33
ESTIM AD O RES DE REGRESION 251
por el Teorema (2 .3 ) (Pág. 199) para el valor promedio de una co-

También, para cualquier muestra elegida exclusivamente según
varíanza de muestra en muestreo aleatorio simple. Esto a su vez es
igual a (7 .3 8 ), o sea los valores de x¡, el estimador de mínimos cuadrados usual
(1 -/)£<?,(*,- X ) 2 2 = X [(y, - 9) - b ( X¡ - x) ] 2/(n - 2) (7.47)

n S2 es un estimador insesgado según modelo de <r£- para n > 2.
En el segundo término de (7 .4 1 ), e es 0 ( 1 / V n ) y ( x - X ) 2 es 0 (1 / Por lo tanto, en problemas en los que se aplica este modelo, se
n ), de modo que este término es de un orden menor que (7.38). pueden establecer resultados simples y exactos para la varianza y
En consecuencia, (7 .3 8 ) es el término guía del sesgo de y,,. la media de y¡, válidos para cualquier muestra de tamaño mayor
a 2 y que sólo requieran una selección de muestra, según los valores
de x¡; el elemento aleatorio lo proporciona gratis la distribución de
7.8 E L E S T IM A D O R D E R E G R E S IO N L IN E A L EN los e supuesta en el modelo.
U N M O D E LO D E R E G R E S IO N L IN E A L
Supongamos que los valores de la población finita i/i(t = 1, 2, 7.9 E S T IM A C IO N E S D E R E G R ESIO N EN

. . . N ) se extraen aleatoriamente de una superpoblación infinita en M UESTR EO E S T R A T IF IC A D O
la que
Al igual que para la estimación de razón, se pueden hacer dos
y = a - i-p x + s (7.43) tipos de estimación de regresión en el muestreo aleatorio estratifi
donde los e son independientes, con media O y varianza ov para x cado. En la primera estimación y,„ (s significa separado) se calcula
fijo. Al sustituir directamente a partir del modelo encontramos que una estimación de la regresión separada para cada media de estrato,
o sea,
( 7 .4 4 ) y„h = ñ + b h(X h- x h) (7.48)
E (Xi - x ) 2 I(x , - x )2 Entonces, con W h = N h/N,
n
y £ .(X :-x) yir, = I whylrh (7.49)

y,r - Y = ( é n - é N) + ( X - x ) - n (7.45) h
i(x ¡-x )2 Esta estimación es apropiada cuando se piensa que los verdaderos
coeficientes de regresión B,, varían entre los estratos.
donde £„ y é,v son las medias sobre la muestra y sobre la población La segunda estimación de regresión y/rc ( c significa combinado)
finita. De (7 .4 5 ) vemos que en este modelo, E(y,r - Y ) = O, de modo es apropiada cuando se ha supuesto que los B,, son pequeños en todos
que y¡r es insesgada según modelo, para cualquier tamaño de muestra. los estratos. Para calcular yi,c, encontramos primero
En lo que respecta a la varianza, de (7 .4 5 ) vemos que para un
conjunto de a: dado, y* = E Whyh xs, = E W,,xh
h h
Entonces
V(y„) = E(ylr- Y ) 2= cr2
E ( x í - x )- y,rc=ya + b ( X - x sl) (7.50)
Este resultado es válido para todo n > 1 y cualquier muestra seleccio Las dos estimaciones se considerarán inicíalmente en el caso en
nada únicamente por valores de x. Este método y su generalización que los bhy b se eligen de antemano, pues suspropiedades son ex
al caso de varianzas residuales fueron dados por Royall (1970). En cepcionalmentesimples en esta situación. De la Sec. 7.2, se sabe
este modelo, un plan de muestreo determinado que tuviera éxito que y(,/, es una estimación insesgada de Yh, de modo que y^ es una
estimación insesgada de Y. Como el muestreo es independiente en
en hacer x = X minimizará V(y,r) para un n dado.
estratos diferentes, vemos por el Teorema 7.1 que
252 T E C N IC A S DE M UESTREO E S T IM A D O R E S DE R E G R E S IO N 253
Z (yh¡-yh)(.xhi- x h)
V((yln, = I - 2(1 f ~ (Syh2- 2bhSyxh +bh2S j ) (7.51)
h nh
(7'56)
El Teorema 7.2 muestra que V(y,rs) es mínima cuando bh = Bk, el i
verdadero coeficiente de regresión en el estrato h. El valor mínimo la estimación de mínimos cuadrados dentro de estrato de B,,.
de la varianza se puede escribir
Al aplicar el Teorema 7.3 a cada estrato, tenemos
Vm-n(y¡r,) = I ^ L Í l z A ) U S (7.52)
i< nh \ ¿>xh / V (y á = Z ~P h ) (7.57)
h n¡,
Volviendo la estimación combinada con b preasignado, (7.50)
muestra que yuc es también una estimación insesgada de Y. Dado siempre que el tamaño de muestra n-„ sea grande en todos los estra
tos. Para obtener una estimación de varianza de la muestra, se
que y,rc es la estimación usual de una muestra estratificada para la
sustituye
variable yh¡ + b ( X - x h¡), podemos aplicar el Teorema 5.3 a esta va
riable, lo que da como resultado
s ; *h = — ^ [ Z (y u ~ h ) 2~ b 2 Z (xu ~ x h)2"] (7 .58 )
H it — ¿ i ¡ ¡ J
V(y,rc) = I Wh- i l ~ fh) (Syh2- 2bSyxh + b 2SX2) (7.53)
h nh en lugar de SBr ( l - p*2) en (7.57).
El valor de b que hace mínima esta varianza es La estimación yirs presenta la misma dificultad que la corres
pondiente estimación de razón, o sea que la razón del sesgo al error
estándar puede llegar a ser apreciable. De la Sec. 7.7 resulta que
h ni, / h nh las estimaciones de regresión y¡,h en los estratos individuales pue
La cantidad Bc es una media ponderada de los coeficientes de re dentener sesgos de orden 1Jnh y los sesgos pueden ser del mismo
gresión de los estratos Bh = S ^ / S rft2. Si escribimos signo entodos los estratos, de tal manera que el sesgo general en
yin también puede ser de orden l/nh. Dado que el término principal
ah = W" { l ~ fh)Sx, 2 ; entonces Bc = 2 ,aAB„/2 a;,. en el sesgo viene de la regresión cuadrática de yh¡ en xH, como se
nh mostró en la Sec. 7.7, este peligro es más agudo cuando la relación
De (7 .5 2 ) y (7 .5 3 ), con Br en lugar de b, encontramos entre las variables se aproxima más bien al tipo cuadrático que al
lineal.
Kr.m(yv) - Vmin (ñ J = Z ahB , 2- (Z a h) V 2
Con la estimación combinada vimos que la varianza es mínima
= Z ah(Bh - B c) 2 (7.55) cuando b = Bc, según se define en (7 .5 4 ). Esto sugiere que tomemos
Este resultado muestra que con las elecciones óptimas,la estima r- WV(1 -/ „) v. , _ , /r Wh2( l - f h ) ^ ,
ción separada tiene una varianza menor que la estimacióncombina bc Y. , Z (yu yh)(xh¡ Xh) Y , ,, Z ( xm x ¡,)
h nh(.nh- \) ¡ / h nh(nh- 1) ,
da, a menos que Bh sea el mismo en todos los estratos.
como una estimación de Bc. Si la estratificación es proporcional y si
Estas elecciones óptimas serían, desde luego, un conocimiento
podemos reemplazar (n ;, - 1 ) en be por nh, bc se reduce a la conocida
avanzado de los valores de Sl/rh y Sxh2.
estimación combinada de mínimos cuadrados
7.10 CO EFICIENTES D E R E G R E S IO N E ST IM A D O S bc' = Y Y (Yu - 9h)(xu ~ x h) ] Y Y (xh¡ - x lt)2

DE L A M U E S T R A h i r i, i
En ciertas circunstancias se prefieren otras estimaciones que
El análisis precedente e$ útil al indicar el tipo de estimaciones bc o b/. Por ejemplo, si los verdaderos coeficientes de regresión Bh
h y b de la muestra que pueden ser eficientes cuando se buscan son los mismos en todos los estratos, pero las varianzas residuales
estimaciones de regresión. Con la estimación separada, el análisis alrededor de la línea de regresión difieren sustancialmente de un
sugiere que tomemos estrato al otro, puede ser más precisa una media ponderada diferente
ESTIM AD O RE S DE REGRESION 255
timador llamado de jackknifed también puede construirse en esta si

de los b}„ ponderada inversamente con la varianza estimada. Sin
tuación. Con n = m g sea y[ir)¡ la estimación de regresión estándar,
embargo, la ganancia en precisión por lo que respecta a y,K es po
calculada a partir de la muestra en donde se omitió el grupo j,
sible que sea pequeña. (7 = 1 , 2 , . . . g ). Entonces, la forma jackknifed es
Dado que
y u c - Y = y „ - Y + b c( X - x „ ) yuña = gyir - (g - 1) (x y (V)/)j g (7.62)
= [y„ - Y +B e( Á - x „ ) ] + ( ¿ c - £ e) ( * - í „ ) (7.59)
resulta que si los errores de muestreo de bc son despreciables E J E R C I C I O S
7.1. Un agricultor experimentado hace una estimación ocular del peso x {

V(yirc) = £ Wk2(--~— (Syh2- 2 BcSyxk + Bc2S J ) (7.60)
h nh de los duraznos en cada árbol en un huerto de N = 200 árboles. Encuentra
un peso total de X = 11 600 Ib. Los duraznos en una muestra aleatoria sim
Como estimación de V(ylrc), podemos tomar ple de 10 árboles se cosechan y pesan, con los siguientes resultados:
Número de árbol
viyuc) = X X [(y,, - y j - bAxkc - xh)]2 (7.61)
h nk{nh —1) ¡
1 2 3 4 5 6 7 8 9 10 Total
7.11 C O M P A R A C IO N D E LO S DOS T IP O S DE Peso real yt 61 42 50 58 67 45 39 57 71 53 543

E S T IM A C IO N E S D E REG R ESIO N Peso estimado 59 47 52 60 67 48 44 58 76 58 569
N o se pueden dar reglas absolutas para decidir si la estimación Como una estimación del peso total real Y, tomamos
separada o combinada es mejor en una situación específica: se re Y = N [X + (y -x )]
quiere ejercer buen juicio para hacer la elección. Los defectos de la
estimación separada son que está más expuesta a sesgos cuando Calcule la estimación y encuentre su error estándar.
las muestras son pequeñas dentro de los estratos individuales y que 7.2. ¿Daría la estimación de regresión lineal, con el b de mínimos cua
su varianza tiene una mayor contribución debida a los errores de drados de la muestra, una estimación más precisa en 7.1?
muestreo en los coeficientes de regresión. El defecto de la estima 7.3. De los datos de la muestra en la Tabla 6.1 (Pág. 197 ) calcule la
ción combinada es que su variancia es inflada si los coeficientes estimación de regresión del número total de habitantes en 1930 en las 196
ciudades grandes. Encuentre el error estándar aproximado de esta estimación
de regresión de la población difieren de estrato a estrato. y compare su precisión con la de la estimación de razón.
Si tenemos confianza en que las regresiones son lineales y si Bh 7.4. En el Ejercicio 7.3 encuentre el número total estimado de habitantes
parece ser el mismo en todos los estratos, hasta donde pueda juz y su error estándar si se toma b como 1.
garse, debe preferirse la estimación combinada. Si las regresiones 7.5. En la siguiente población con N = 5, verifique ( a ) que la regre
sión de y en x es lineal y ( b ) que la estimación de regresión lineal no tiene
parecen lineales (en tal forma que el peligro de sesgo parece peque sesgo en muestras aleatorias con n = 3. Los pares (y, x ) son (3 , 0 ), (5 , 0).
ñ o) pero Bh parece variar de estrato a estrato, es recomendable la (8 , 2 ), (8, 3 ), (12, 3).
estimación separada. Si hay alguna curvilinealidad en las regresiones 7.6. Una medición burda x , hecha en cada unidad, está relacionada a la
cuando se usa una estimación de regresión lineal, la estimación verdadera medida y en la unidad por la ecuación
combinada es probablemente más segura a menos que las muestras x =y +e+d
sean grandes en todos los estratos.
donde d es un sesgo constante y e es un error de medición, no correlacionado
Mickey (1 95 9) y Williams (1 96 3) han desarrollado estimadores con y, el cual tiene media cero y varianza Se2 en la población, que se supone
del tipo de regresión que son insesgados, pero aún no se han probado infinita. En muestras aleatorias simples de tamaño n, compare las varianzas
lo suficiente. Rao (1 96 9) encontró que el estimador de Mickey ge de ( a ) la estimación de “diferencia'’ [y + ( X —x)J de la media Y y ( b ) la
neralmente es inferior a los estimadores de regresión estándar, y a los estimación de regresión lineal, usando el valor de b que da la varianza míni
ma. (L as varianzas pueden depender de S,*.)
estimadores de razón en poblaciones naturales. Una versión del es
7.7. Al desarrollar todos los casos posibles compare los ECM de las esti
maciones de regresión separada y combinada del total Y de la siguiente po
blación. cuando se extraen muestras aleatorias simples de tamaño 2 de cada
estrato. Para cada estimación, ¿cuánto es el sesgo de contribución para ECM?
Estrato 1 Estrato 2 C A P IT U L O 8
*1. 2>u x2¡ Va
4 0 5 7
6 3 6 12
7 5 8 13 Muestreo Sistemático
Use las estimaciones de mínimos cuadrados ordinarios de los B, bh y bc en
la Pág. 253.
7.8. En la población del Ejercicio 7.7 mostrar que si el B óptimo preasig-
nado pudiese usarse en cada caso, V (Y U, ) = 4.39, V '(Y lre) =4.43, = 4.43 siendo
ambas estimaciones insesgadas. 8.1 DESCRIPCION
7.9. Por el mismo método, comparar el ECM de las estimaciones de razón
separada y combinada en la población del Ejercicio 7.7. Dado que la razón A primera vista, este método de muestreo es muy diferente al
Y/X es 8/17 = 0.47 en el estrato 1, y 32/19 = 1.68 en el estrato 2, la teoría muestreo aleatorio simple. Supongamos que las N unidades de la po
de muestras grandes sugeriría que Y ^ fuese mayor que YRc. Sin embargo, blación se numeran de 1 a N en cierto orden. Para elegir una mues
se encontrará que en estas muestras muy pequeñas, Y Rc tiene el menor
tra de n unidades, tomamos una unidad al azar entre las fe primeras
ECM. Su superioridad no se debe a que tenga un sesgo menor, ni a que YR, o
y luego tomamos las subsecuentes a intervalos de fe. Así, por ejem
YKc estén materialmente sesgadas. Otra discordancia con respecto a la teoría
de las muestras grandes es, como se verá, que y * , y tienen ECM menores plo, si fe es 15 y la primera unidad que se extrae es la número 13,
que las estimaciones de regresión correspondientes. entonces las subsecuentes se numeran 28, 43, 58, etc. La selección
de la primera unidad determina toda la muestra, que se denomina
muestra de todas las fe-ésimas unidades.
A continuación veremos las ventajas aparentes de este método
respecto al muestreo aleatorio simple.
1. Es más fácil sacar una muestra y a menudo, más fácil ha

cerlo sin cometer errores. Esta es una ventaja particular cuando
la extracción se hace en el área. Aunque la extracción se haga en
una oficina, este método puede ahorrar mucho tiempo. Por ejemplo,
si las unidades se describen en tarjetas del mismo tamaño y se
colocan en un archivero, se pueden extraerlas tarjetas que están sepa
radas por una pulgada a lo largo del archivero. Esta operación es
rápida mientras que el muestreo aleatorio simple será laborioso. Cla
ro está que el método descrito anteriormente se aparta un tanto de
la regla de “cada fe-ésima” .
2. Intuitivamente, el muestreo sistemático parece ser más pre
ciso que el aleatorio simple. En efecto, estratifica la población en n
estratos, que consisten de las primeras fe unidades, las segundas fe
unidades, etc. Por lo tanto, podemos esperar que la muestra siste
mática sea tan preciso como la muestra aleatoria estratificada co-
M U E S T R E O S IS T E M A T I C O 259
258 T E C N IC A S DE M U E S TR E O
T A B L A 8,1. L a s P o s ib l e s M u e s t r a s S i s t e m á t i c a s p a r a N *= 2 3 , fe = 5
Muestreo Aleatorio
Núm ero de la muestra sistemática
x = muestra sistemática o = muestra aleatoria estratificada
*-* O-UoO--------L-X— o-J-x-------oJ-x— o— bx--------- 1 II III IV V
k 2k ' 3* 4* 5k 6k I
Núm ero de unidad
1 2 3 4 5
Fie. 8.1. Muestreo aleatorio estratificado y sistemático 6 7 8 9 10
11 12 13 14 15
rrespondiente con una unidad por estrato. La diferencia es que con 16 17 18 19 20
la muestra sistemática, las unidades ocurren en la misma posición 21 22 23
relativa del estrato, mientras que con el muestreo aleatorio estrati
ficado, la posición dentro del estrato se determina separadamente
lecciónese un número al azar entre 1 y N y tómese cada fe-ésima
por aleatorización dentro de cada estrato (véase la Fig. 8.1). La
unidad a partir de ahí y siguiendo el círculo, hasta alcanzar las n uni
muestra sistemática se reparte más uniformemente sobre la pobla
dades deseadas. Supongamos que se desea n = 5 con N - 23. En
ción, y este hecho, algunas veces ha dado al muestreo sistemático
tonces fe = 5. Si el número aleatorio es 19, tomamos las unidades
una precisión considerablemente mayor que la del muestreo alea
torio estratificado. 19, 1 ,6 , 11, 16. Con este método es fácil verificar que cada unidad
tiene la misma probabilidad de selección. Si se desean n = 4 unida
Una modificación al muestreo sistemático consiste en elegir cada des con N *= 23, tomamos fe = 6.
unidad en el centro o cerca del centro de cada estrato. O sea que
en lugar de empezar la sucesión con un número aleatorio elegido
entre 1 y fe, tomamos el número inicial como (fe + l)/ 2 si fe es 8.2 R E L A C IO N C O N E L M UESTR EO C O N G L O M E R A D O
impar y como fe/2 o (fe + 2 )/ 2 si fe es par (Madow, 1953). Este
procedimiento lleva el propósito del muestreo sistemático a su con Existe otra manera de considerar el muestreo sistemático. Con
clusión lógica. Si y, puede considerarse como una función continua N = ;:fe las fe muestras sistemáticas posibles aparecen en las colum
de una variable continua i, hay razones para esperar que esta mues nas de la Tabla 8.2. En él es evidente que la población se ha dividido
tra localizada al centro será más precisa que una localizada aleato en fe grandes unidades de muestra, cada una de las cuales cuenta
riamente. Algunas investigaciones en poblaciones naturales apoyan con n unidades originales. La operación de elegir una muestra sis
esta opinión, aunque las muestras localizadas al centro tienden a temática aleatoriamente localizada, es sólo la de elegir una de estas
comportarse erráticamente. Aquí nos ocuparemos en forma exclusiva grandes unidades de muestreo al azar. Por lo tanto, el muestreo sis
de muestras en donde existe algún elemento aleatorio. temático viene a ser la elección de una sola unidad de muestreo
Como en general, N no es un múltiplo entero de fe, las diferentes compleja, que constituye la muestra total. Una muestra sistemática
muestras sistemáticas de la misma población finita podrán variar su
tamaño en una unidad. Así, con N = 23, fe = 5, los números de uni TA B LA 8.2. C o m p o s ic ió n d e l a s k M u e s t r a s S is t e m á t ic a s
dades en las cinco muestras sistemáticas aparecen en la Tabla 8.1.

Núm ero de muestra
Las tres primeras muestras tienen n = 5 y las últimas dos n = 4.
Este hecho introduce una perturbación en la teoría del muestreo 1 2 i k
sistemático, que probablemente sea despreciable si n excede a 50, y
se le ignorará para simplificar la presentación de la teoría. N o es Vi Vi Vi y*
de esperarse que sea grande aun cuando n sea pequeña. 2/ic+i J/Ef.2 yî y2»
Otro método, sugerido por Lahiri en 1952 (véase Murthy, 1967,
y(jt_n*ti y(n_I)*+2 y(n_l)fcTÍ y »k
Pág. 139) proporciona un tamaño constante de muestra y una me
dia de muestra insesgada. Considérense las N unidades dispuestas Medias y, Si Si Sk
alrededor de un círculo, y sea fe el entero más cercano a N/n. Se-
260 TE C N IC A S DE M U ESTB EO M U E S TB E O S IST E M A TIC O 261
es una muestra aleatoria simple de una unidad conglomerada, tomada Corolario. La media de una muestra sistemática es más precisa
en una población de fe unidades conglomeradas. que la media de una muestra aleatoria simple si y solamente si
S2
W,y > S 2
8.3 V A R IA N Z A D E L A M E D IA E S T IM A D A Prueba. Si y es la media de una muestra aleatoria simple de
tamaño n,
Se han desarrollado numerosas fórmulas para la varianza de yjy,
media de una muestra sistemática. Las tres que se dan a continua
ción se aplican a cualquier clase de muestreo conglomerado en donde
éstos contienen n elementos y la muestra consiste en un conglome De (8 .1 ), V ( yjy) < V ( y ) si y solamente si
rado. En estas fórmulas suponemos N = nk.
N - 1 2 k (n - \ ) n2 , N - n S 2
Si N = nk, es fácil verificar que y!v es una estimación insesgada
de Y para una muestra sistemática aleatoriamente localizada. ~ ñ ~s Ñ ~ s^ < i r 7 (8-3)
En el análisis que sigue, el símbolo y¡, denota el j-ésimo miembro esto es, si
de la z-ésima muestra sistemática, por lo tanto, j = 1 ,2 , . . . n,
i = 1 , 2 , . . . fe. La media de la z-ésima muestra se denota con y¡. fe(w —1)S tv > ( n - 1 - ~ ~ j S2= k ( n - 1)52 (8.4)
Teorema 8.1. La varianza de la media de una muestra siste
mática es Este resultado importante que en general se aplica al muestreo
conglomerado, enuncia que el muestreo sistemático es más preciso
Y(y k (n - 1) 2 . que el muestreo aleatorio simple si la varianza dentro de las mues
N ¿ N 81
( . )
tras sistemáticas es mayor que la varianza de la población total. El
donde muestreo sistemático es preciso cuando las unidades dentro de una
misma muestra son heterogéneas y es impreciso cuando son homo
géneas. El resultado es intuitivamente obvio. Si hay poca variación
dentro de una muestra sistemática en relación con la de la pobla
es la varianza entre las unidades que se encuentran dentro de la mis ción, las unidades sucesivas en la muestra repiten más o menos la
ma muestra sistemática. El denominador de esta varianza, fe(n - 1), misma información.
se construye por medio de las reglas usuales en el análisis de la Otra forma para la varianza se da en el Teorema 8.2.
varianza: cada una de las fe muestras contribuye con (n — 1 ) grados
de libertad a la suma de cuadrados del numerador. T e o re m a 8.2.
Prueba. Por la identidad usual del análisis de la varianza V Ü V) +<" - (8-5)

( N - 1)S2= £ E (y¡¡— Y )2
i / donde Pl0es el coeficiente de correlación entrepares de unidades
que están en la misma muestra sistemática. Sedefine como
= " I ( A - V ) 2+ Z I ( y * - y , ) 2
■' i i E (y „ - V )(y ,u- V ) ,Rfiv
Pero la varianza de ysy es por definición 9- E iy .-Y )2
donde el numerador es promediado sobre todos los k n (n — l)/ 2
V (J W -r Z (9 ,-Y )2 pares distintos y el denominador sobre todos los N valores de ya-
de aquí Como el denominador es ( N — 1)S2/N, esto da
( N - l ) S 2 = nkV(yjy) + lc(n - 1 ) 5 ( 8 . 2 )
El resultado prosigue. Pw = ( n - l ) ( N- l ) S 2 ^ ^ (8'?)
M U E S TR E O S IS T E M A T IC O 263
Prueba
Esta cantidad es la correlación entre las desviaciones de los pares
n2* V (y „ ) = n2 ¿ ( y , - Y)2 de características de las medias de los estratos que están en la misma
¡=i muestra sistemática.
2 v- y (ya~yí)(yíu~y.u) l9 ,,v
= I í ( y n - r ) + ( y i2 - Y ) + - - - + ( y ¡n - y ) ] 2
í-1 =«(„-!)(*-!) (8- 14)
Los términos al cuadrado constituyen la suma total de cuadrados de La prueba es similar a la del Teorema 8.2.
las desviaciones de Y, es decir, ( N — l ) ^ . Esto da
Corolario. Una muestra sistemática tiene la misma precisión
n2kV(yn ) = ( N - l ) S 2 + 2£ I (yíy- Y(yiu- Y) (8.8) que la correspondiente muestra aleatoria estratificada con una uni
i ¡< u
dad por estrato, si = 0. Esto es así porque para este tipo de
= ( H - l ) S 2+ ( n - l ) ( N - l ) S 2pw (8.9) muestra, V (y aI) es (Teorem a 5.3, Corolario 3 )
Por lo tanto,
* < « - ( * = #
V(9sy) = 7 ( ^ ) [ l + (" “ 1 K ] (810)
Otras fórmulas para V (y ,„), apropiadas para una población auto
Este resultado muestra que la correlación positivaentre unida correlacionada, fueron presentadas por W. G. y L. H. Madow (1944)
des en la misma muestra, in fla la varianza de la media de la mues quienes hicieron el primer estudio teórico sobre la precisión de
tra. Aun una pequeña correlación positiva puede tener un gran muestreo sistemático.
efecto, debido al multiplicador (n — 1). Ejemplo. Los datos en la Tabla 8.3 son para una pequeña población art:
Los dos teoremas anteriores expresan V ( yJy) en términos de S-, ficial que exhibe una clara y constante tendencia ascendente. Tenemo
por lo tanto, la relacionan con la varianza de una muestra aleatoria N = 40, fe, = 10, n = 4. Cada columna representa una muestra sistemática
las hileras son los estratos. E l ejem plo ilustra la situación en la cual la com
simple. Existe un teorema similar al 8.2 que expresa V (y sy') en tér
lación "dentro de estratos” es positiva. Por ejemplo, en la primera muestr
minos de la varianza de una muestra aleatoria estratificada, en la cada u n o'de los cuatro números 0, 6, 18 y 26 están abajo de la media di
cual, los estratos se componen de las primeras k unidades, las se estrato al que pertenecen. Esto es consistentemente cierto, con unas poca
gundas fe, etc. En nuestra notación, el suscrito j en í/¡,- denota el excepciones, en las primeras cinco muestras sistemáticas. En las últimas cint
estrato. La media del estrato se escribe y ,y. muestras, las desviaciones de la m edia del estrato, son en su mayoría posit
vas. En consecuencia, los términos de los productos cruzados en p lM( son pi
Teorema 8.3. dominantemente positivos. Del Teorema 8.3 esperamos que el muestreo sist.
mático sea menos preciso que el muestreo aleatorio estratificado con ur
unidad por estrato.
V U y) = V - ' ( ^ ) [1 + (n " 1)P~ ] (811)
T A B LA 8 .3 . D atos de 10 M uestras Sis t e m á t ic a s con n = 4,
donde N = fen = 40
Número de muestras sistemáticas Medias de

# * = 3n i( K
T—"ñ I Í=(iy „ - y . i ) 2 (8 . 1 2 )
Estratos 1 2 3 4 5 6 7 8 9 10 estratos
Esta es la varianza entre unidades comprendidas en el mismo es 1 0 1 1 2 5 4 7 7 8 6 4.1

trato. El divisor n (k — 1 ) se usa porque cada uno de los n estratos II 6 8 9 10 13 12 15 16 16 17 12.2
contribuyeron (fe — 1 ) grados de libertad. Además, III 18 19 20 20 24 23 25 28 29 27 23.3
IV 26 30 31 31 33 32 35 37 38 38 33.1
Totales 50 58 61 63 75 71 82 88 91 88 72.7
r
TABLA. 8.4. A n á l is is de V a r ia n z a
cruzados entre las desviaciones desde las medias de estratos sean
negativos para pares de observaciones que están en la misma mues
g.l. s.c. c.m tra sistemática. Por ejemplo, en la primera muestra sistemática, las
desviaciones a partir de las medias de estratos son ahora —4.1,
Entre hileras
(estratos) 3 4828.3 + 4.8, —5.3, +4.9. De los seis productos de pares de desviaciones,
Dentro de estratos 36 485.5 13.49 = £ 2 cuatro son negativos. A grandes rasgos, la misma situación se aplica
totales 39 5313.8 136.25 = S * ‘ en cada muestra sistemática.
Este cambio no afecta Vra„ y V,¡. Con muestreo sistemático se
obtiene un incremento dramático en la precisión, como se ve al com
La varianza V(_y¡y ) se encuentra directamente a partir de los totales de las
muestras sistemáticas como parar los totales de muestra sistemática de la Tabla 8.5 con los de
la Tabla 8.3. Ahora tenemos
V-y= T £ ( f l - ' ñ J= 4 r Í(n y L- n ? ) '
a í- i n K. (- 1
V v = i ? ¿ (73)2+(74)2+■■' + (65) 2- í 7 ? ~ l ='°-46
= ^ [ ( 5 0 ) 2+ (58)’ + •• •+ (88)2- = 11.63
En ocasiones es posible explotar este resultado al numerar las
Para el muestreo aleatorio estratificado necesitamos un análisis de varianza unidades para crear correlaciones negativas dentro de los estratos.
de la población "entre hileras” y "dentro de hileras” . Este se presenta en la Para ello se requiere un conocimiento aproximado de las tendencias
Tabla 8.4. Por lo tanto, las varianzas de las medias estimadas a partir de dentro de la población. Sin embargo, como veremos más adelante, la
muestras aleatorias simples y estratificadas será
situación de la Tabla 8.5 es una en la que resulta difícil obtener una
.. (N -n \ S 2 9 136.25 buena estimación del error estándar de yv a partir de la muestra.
■ai
” V ¿V ) n 10 4 8.4 COMPARACION DEL MUESTREO SISTEMATICO
CON EL MUESTREO ALEATORIO ESTRATIFICADO
Tanto el muestreo aleatorio estratificado como el sistemático son
mucho más efectivos que el muestreo aleatorio simple, pero como se
El éxito del muestreo sistemático con relación al muestreo alea
anticipó, el sistemático tiene menos precisión que el aleatorio estra torio simple o aleatorio estratificado, depende mucho de las propie
tificado.
dades de la población. En algunas poblaciones, el muestreo siste
La Tabla 8.5 muestra los mismos datos, con el orden de las mático es extremadamente preciso y en otras resulta menos preciso
observaciones invertido en los estratos segundo y cuarto. Esto hace que el muestreo aleatorio simple. Para algunas poblaciones y algu
que put, sea negativa, porque logra que la mayoría de los productos nos valores de n, V (y,y ) aun puede incrementarse al tomar una
muestra grande, lo que constituye una desviación sorprendente del
TA B LA 8.5. D a t o s d e l a T a b l a 8 .3 c o n e l O r d e n I n v e r t id o
buen comportamiento. Por lo tanto, es difícil dar un consejo general
en lo s E s t r a t o s I I y IV
respecto a las situaciones donde se aconseja el muestreo sistemá
Números de la muestra sistemática
tico. Es necesario conocer algo sobre la estructura de la población
Medias de
Estratos 1 2 3 4 5 6 7 8 9 10 estratos
para usarlo de manera efectiva.
Se han seguido dos lineamientos en la investigación de este pro
I 0 I I 2 5 4 7 7 8 6 4.1
II
blema. Uno de ellos es comparar los diferentes tipos de muestreo en
17 16 16 15 12 13 10 9 8 6 12.2
III 18 19 20 20 24 23 25 28
poblaciones artificiales, en donde j/t es una función simple de i. El
29 27 23.3
IV 38 38 37 35 32 33 31 31 30 26 33.1 otro es hacer las comparaciones para poblaciones naturales. Algunos
de los resultados principales los presentaremos en las secciones sub
Totales 73 74 74 72 73 73 73 75 75 65 72.7 secuentes.
8.5 P O B L A C IO N E S E N O R D E N A L E A T O R IO
entonces
El muestreo sistemático se usa en algunos casos, por su conve rtV,y = W'an
niencia, en poblaciones en las cuales la numeración de las unidades
es efectivamente aleatoria. Esto es así en el muestreo a partir de Las condiciones cruciales son que todos los y t tienen la misma me
un archivo arreglado alfabéticamente por apellidos, si la caracterís dia n, esto es, no hay tendencia y no existe correlación lineal entre los
tica que se rriide no tiene relación con el apellido del individuo. No valores de i/¡ y y¡ en dos puntos diferentes. La varianza a," puede cam
habrá entonces tendencia o estratificación en y¿ conforme procede biar de punto a punto en la serie.
mos a lo largo del archivo ni tampoco correlación entre valores ve
Prueba. Para cualquier población finita específica
cinos.
' En esta situación, se esperaría que el muestreo sistemático fuera
v £ (y ,- v )2
esencialmente equivalente al muestreo aleatorio simple y que tuviera
r ra n
la misma varianza. Para cualquier población finita simple, con valo Nn N- 1
res dados de n y k, esto no es exactamente cierto, porque Vn , que se
basa en k grados de libertad, es más bien errática cuando k es pe ahora
queña y puede resultar mayor o menor que Vmn. Hay dos resultados
que muestran, que en promedio, las dos varianzas son iguales. I (y i - Y ) 2= í [ ( . y - p ) - ( Y - n ) ] 2
¡- i ¡=i
Teorema 8.4. Considérense todas las N ! poblaciones finitas las JV
\2 kt /\ s \2
cuales están formadas por las N I permutaciones de cualquier con i-i
junto de números yu y2, .. ., y*. Entonces el promedio sobre estas po
blaciones finitas, Como y i y y ¡, no tienen correlación
B {V „ )= V m (8.16) 1 N
N £ ¡-i
Nótese que Vnn es la misma para todas las permutaciones.
Este resultado, probado por W . G. y L. H. Madow (1 9 4 4 ), mues Por lo tanto,

tra que, si el orden de las características en una población finita
%y =_ J ÍZ !L J t (8.18)
específica puede considerarse como sacado al azar de entre las N I * "■" N n (N -l)\ .x ' N -/
permutaciones, el muestreo sistemático es, en promedio, equivalente
al muestreo aleatorio simple. El resultado es
El segundo tratamiento es considerar la población finita como N -n £
tomada al azar de una superpoblación infinita que tiene ciertas ..a .
propiedades. El resultado que se prueba no se aplica a ninguna po

blación finita sola (es decir, a ningún conjunto específico de valores Volviendo a V^, dejemos que yu denote la media de la u-ésima
y¡, 1/2. • • •, !/.v) sino al promedio de todas las poblaciones finitas que muestra sistemática. Para cualquier población finita específica,
pueden sacarse de la población infinita.
El símbolo % denota los promedios sobre todas las poblaciones V,y = r i (y .- ÍÓ 2 ( 8 .20)
K.
finitas que se pueden sacar de esta superpoblación.
Teorema 8.5. Si las varianzas y ¡ ( i = 1, 2, . . . , N ) se sacan al = ^ [ l (yB-M )2- * ( y - íi )2] (8.21)

azar de una superpoblación en la cual
Por el teorema para la varianza de la media de una muestra no
£ (y ¡-# *)(y j-/ t) = 0 (i?4/), S?(y,- /u)2 = <t¡2
correlacionada de una población infinita,
268 TE C NIC AS DE M U ESTRE O M U E S TR E O S IST E M A TIC O 269
1N N De aquí, la varianza de la media de una muestra aleatoria simple es

I (X, k X cr,2'
i-l _ N -n S 2 fi(fc-l) N (N + 1) (k - l ) ( N + 1)
( 8 .22 )
i= l
«V .-J
n¿ N N n N 12n 12 1 ^
N -n & , Para encontrar la varianza dentro de estratos, S„2, sólo necesitamos
(8.23) reemplazar N por fe en (8 .2 4 ). Esto da
O * * 0' - 91' "
N -n Sw2 n(k —1) fc(* + l ) <fe2- l ) _____
V- ’ ~ Ñ ~ S T = ~ k W n------ Í B T (S-26)
8.6 P O B L A C IO N E S CO N T E N D E N C IA L IN E A L
Para muestreo sistemático, la media de la segunda muestra
Si la población consiste únicamente de una tendencia lineal, como excede la de la primera en 1; la media de la tercera excede la de la
se ilustra en la Fig. 8.2, es muy fácil adivinar la naturaleza de los segunda en 1, y así sucesivamente. Entonces, las medias yu pueden
resultados. De la Fig. 8.2 parece como si Vsy y V8l (con una unidad reemplazarse por los números 1, 2 ,. . ., fe. Así, por una aplicación
por estrato) fueran ambas menores que V ran. Además, V„„ será mayor
posterior de (8 .2 4 ), /*\. * 4\
que V „, porque si la muestra sistemática es muy baja en un estrato,
es muy baja en todos los estratos, mientras que la muestra aleatoria
estratificada provee una oportunidad para que los errores dentro de u-l iz ,•
los estratos se cancelen.
Esto da
Para examinar los resultados matemáticamente podemos suponer
que y¡ *= i. Tenemos
V „ = - l ( y u- Y ) 2= — (8.27)
g N (N + \ ) g .2_ N (N + 1 )(2 N + 1 )
.- i 2 ’ < t' 6 A partir d éla s Fórmulas (8 .2 5 ), (8 .2 6 ) y (8 .2 7 ) deducimos, como
ya se anticipó,
La varianza de la población, S-, está dada por
y - k 2- ^ k 2~ l ^ _ (fe ~ l)(N -f 1)
” 12n ,y 12 "" 12 ( ’
La igualdad solamente se da cuando n = 1. Por lo tanto, para
_ 1 [ N(N+1)(2N+1) N ( N + 1)21 N (N + l) eliminar el efecto de una tendencia Lineal, sospechada o insospe
N- ll 6 4 J 12 (824) chada, el muestreo sistemático resulta mucho más efectivo que el
x. muestreo aleatorio simple, pero menos efectivo que el aleatorio es
tratificado.
8.7 M E TO D O S P A R A P O B L A C IO N E S QUE
P R E S E N T A N T E N D E N C IA S L IN E A L E S
El comportamiento del muestreo sistemático en presencia de una

tendencia lineal podrá mejorarse de varias maneras. Una de ellas
es utilizar una muestra centralmente localizada. Otra es la de cam
biar la estimación de una media no ponderada a una media pon
derada en donde todos los miembros internos de la muestra tendrán
F i g . 8.2. M u e s tre o s is te m á tic o de una p o b la c ió n con te n d e n c ia lin e a l peso la unidad (antes de dividir por n ) pero pesos diferentes asig-
M U ESTREO S IS T E M A T IC O 271
Esta selección elimina el efecto de una tendencia lineal en cual

nados al primero y último miembros. Si el número aleatorio sacado quier estrato de 2fe unidades, aunque la pendiente lineal varíe de
entre 1 y fe es i, estos pesos son un estrato a otro. Murthy (1 9 6 7 ) denominó este método muestreo
n (2 i- * - l) sistemático equilibrado.
2 0 .- 1 )* (8'29) El método modificado de Singh y otros (1 9 6 8 ) elige pares de
unidades equidistantes de los extremos de la población. Con n par,
Se usa el signo 4- para el primer miembro, y el signo — para el
los n /2 pares equidistantes que empiezan con la unidad ¿(i - 1,
último. Para todo i, los dos pesos obviamente suman 2. Se puede
2, . . . fe) son
verificar que si la población consiste en una tendencia lineal y
N = nh, la media de muestra ponderada da la media de población [i+ jk , ( N - j k ) - i +1], / = 0, 1 ,2 ,... 1 (8.33)
correcta. El efecto de estas correcciones extremas lo examinó Yates
Cuando n es im par en estos métodos, j llega a ^ ( n — 1 ) - 1 en
(1 9 4 8 ) y se deben a él.
(8 .3 2 ) y (8 .3 3 ). El método equilibrado (8 .3 2 ) suma el miembro
Bellhouse y Rao (1 9 7 5 ) extendieron las correcciones de Yates al
restante de la muestra cerca del extremo en [¿ + ( t i — l)fe ]; el mé
caso N ¥= nfe, cuando el muestreo sistemático se obtiene por el método
todo modificado lo hace cerca del medio centro en [¿ + % (tí — l)fe].
circular de Lahiri (Sec. 8.1 ), que garantiza n constante. Como an
El efecto de una tendencia lineal no se elimina completamente en
tes, los pesos que difieren de 1 se aplican a los números de muestra
y para n impar.
primero y último en el orden secuencial original de la población. Por
Bellhouse y Rao (1 9 7 5 ) han efectuado comparaciones de la ac
ejemplo, si el número aleatorio inicial para extraer la muestra es 19
tuación de estos dos métodos con las correcciones de Yates y con
con N = 23,?2 = 5, las unidades 19, 1, 6, 11, 16 constituyen la
el muestreo sistemático ordinario en modelos de suprapoblaciones
muestra, el primero y último miembro son yx y yl3. Surgen dos casos.
que representan tendencias lineales y parabólicas, y variación pe
Caso 1. i pequeño para el que i + (n - l)fe < N de modo que riódica y autocorrelacionada, también en algunas pequeñas poblacio
las n unidades se obtienen sin pasar sobre yx. Los pesos para el pri nes naturales las han efectuado estos autores y Singh (comunicación
mero ( + ) y último ( —) miembros son personal). En general, los tres métodos (Yates, equilibrado, modi
ficado) se comportan similarmente y resultan superiores al muestreo
sistemático ordinario en presencia de una tendencia lineal o para
bólica.
Caso 2. i + (n — l)fe > N. Sea n 2 el número de unidades de
La población de la Tabla 8.3 por ejemplo, es un caso donde estos
la muestra que se obtienen al pasar sobre yx. Así, con i = 19, n 2 = 4.
métodos se comportarían muy bien. El muestreo sistemático ordina
Los pesos para el primero ( - f ) y el último ( - ) miembros son
rio, dio V3y = 11.63. Para los otros métodos se tienen varianzas com
parables (ti = 4, fe = 1 0): Yates, 1.29; Sethi (equilibrado) 0.46;
1 ± 2 ( j V —"* j [ 2< + ( " ~ 1)k ~ i N + 1 } ~ 2 " 2£ ] (8 3 1) Singh (m odificado) 0.34. El método equilibrado es el que se tiene
En ambos casos, los miembros internos de la muestra reciben el peso en la Tabla 8.5 al hacer la inversión en los estratos II y IV de la
1 en el total de muestra. Con N = 23, 72 = fe = 5, ¿ = 1 9 , 72;. = 4 Tabla 8.3.
los pesos primero y último son 1 ± ( — 7/18). De modo que y, re
cibe un peso de 11/18 mientras que y l0 recibe 25/18.
8.8 P O B L A C IO N E S C O N V A R IA C IO N P E R IO D IC A
Dos métodos alternativos intentan cambiar el método de selec
ción de la muestra de modo que la media de muestra no la afecte Si la población consiste en una tendencia periódica, como sería,
una tendencia lineal. Con N = nk y n par, un método que sugiere por ejemplo, una curva sinusoidal simple, la efectividad del mues
Sethi (1 96 5) divide la población en n/2 estratos de tamaño 2fe, al treo sistemático depende del valor de fe. Esto se puede ver gráfica
elegir dos unidades equidistantes del extremo de cada estrato. Si el mente en la Fig. 8.3. En esta representación, la altura de la curva
número aleatorio inicial es i los n /2 pares de unidades son los nu es la observación y¡. Los puntos de muestra A representan el caso
merados menos favorable al muestreo sistemático, este caso se da siempre
272 TE C N IC A S DE M U E S TR E O M U E S TR E O S IS T E M A TIC O 273
da, cuando se sospecha, pero no se conoce con seguridad, la exis

tencia de un efecto periódico.
En algunas poblaciones naturales puede darse una variación casi
periódica, difícil de anticipar. L. H. Madow (1 9 4 6 ) encontró evi
dencia en este sentido en un lote de arbolillos en una población más
bien pequeña ( N = 420). Finney (1 9 5 0 ) discutió un fenómeno se
que fe es igual al periodo de la curva sinusoidal o es un múltiplo mejante respecto al volumen de madera por franja de terreno en
entero del periodo. Todas las observaciones dentro del muestreo sis el bosque Dehra Dun, aunque reexaminando los datos Milne (1 9 5 9 )
temático son exactamente iguales, de modo que la muestra no ofrece sugirió que la periodicidad aparente podía ser resultado del proceso
más precisión que una sola observación tomada al azar de la po de medición. El efecto de la casi periodicidad es que el muestreo
blación. sistemático tendrá un comportamiento mediocre en ciertos valores
de n, y un buen comportamiento en otros. N o se sabe si este efecto
El caso más favorable (muestra B ) se da cuando fe es un múl
es frecuente. Matérn (1 9 6 0 ) cita ejemplos en los que las fuerzas
tiplo impar del semiperiodo. Cada muestra sistemática tiene una
naturales, como serían las mareas, podrían producir variación pe
media exactamente igual a la media verdadera de población dado
riódica espacial, pero en su opinión no se han encontrado casos lo
que las desviaciones sucesivas arriba y abajo de la línea media se suficientemente claros en las encuestas forestales.
cancelan. La varianza muestral de la media es por lo tanto nula.
Entre estos dos casos, la muestra tiene varios grados de efectividad
que dependen de la relación entre fe y la longitud de onda. 8.9 P O B L A C IO N E S A U T O C O R R E L A C IO N A D A S
Las poblaciones que exhiben una curva sinusoidal exacta no se
Con muchas poblaciones naturales hay razón para esperar que
espera que se den en la práctica. Las poblaciones con una tendencia
dos observaciones y¡, y¡ serán más semejantes cuando i y ; sean
periódica definida sí son bastante comunes. Ejemplos de ellas son
cercanos en la serie, que cuando ocupen posiciones distantes entre
el flujo de tráfico que pasa por un punto dado de una carretera las
sí. Esto ocurrirá siempre que haya fuerzas naturales que induzcan
24 horas del día y las ventas de un almacén en un periodo de siete
un cambio lento al recorrer la serie. En un modelo matemático para
días. Para estimar un promedio sobre un cierto periodo de tiempo,
este efecto podemos suponer que y¡ y y¡ están positivamente corre
no es aconsejable tomar la observación de la muestra todos los días
lacionadas, siendo su correlación función solamente de su separa
a las 4 p.m., o cada martes; en lugar de esto, la estrategia apropiada
ción, i — j, que disminuye al crecer la distancia. Aunque este modelo
sería la de espaciar la muestra a todo lo largo de la curva periódica,
está sobresimplificado, puede representar uno de los rasgos sobre
asegurándose que cada día de la semana recibe ia misma represen
salientes de muchas poblaciones naturales.
tación, en el caso de las ventas.
Para investigar si este modelo se aplica a una población, pode
Algunas poblaciones tienen una clase de efecto periódico menos
mos calcular el conjunto de correlaciones para pares de atributos
obvio. Las nóminas semanales en un pequeño sector de una fábrica
que distan u unidades, y graficar esta correlación respecto a u. Esta
pueden siempre listar a los trabajadores en el mismo orden y con
curva, o la función que representa, se llama un correlograma. Aun
tener de 19 a 23 nombres cada semana. Una muestra sistemática que el modelo sea válido, el correlograma, no será una función suave
de uno de 20 nombres durante un periodo de semanas consta princi para una población finita cualquiera, debido a las irregularidades que
palmente de los registros de un trabajador, o los registros de dos o causa la finitud de la población. En una comparación de muestreo
tres trabajadores. De modo semejante, una muestra sistemática de aleatorio estratificado con sistemático para este modelo, estas irre
nombre de un registro civil, podría contener demasiados nombres de gularidades dificultan la deducción de resultados para una población
cabezas de familia o demasiados niños. Si hay tiempo suficiente finita cualquiera. La comparación puede hacerse sobre el promedio
para estudiar la estructura periódica, usualmente se puede diseñar de toda una serie de poblaciones finitas tomadas al azar de una
una muestra sistemática para capitalizar sobre esta estructura. De suprapoblación infinita a la que se aplica el modelo. Esta técnica ya
otro modo, es preferible una muestra aleatoria simple o estratifica se usó en el Teorema 8.5 y en las Secs. 6.7 y 7.8.
274 T E C N IC A S DE M U ESTB E O
M U E S T R E O S IS T E M A T I C O 275
Por lo tanto, suponemos que las observaciones y¡ ( i = 1 ,2 ,..., N )

se sacan de una suprapoblación en donde Distancia 1 2 . . . (fe —1) fe (fe + 1 )... (2fe -1 ) Total
% (y t-n )2= cr2, V(y¡ - p K y i+u- p ) = P ¿ r 2
es
v—^
Número
*—<
»—
& (* ) = /*, (8.34) fe (f e - 1 ). . . 1 fe2
1
«
con
De aquí, el valor promedio de V(yJf), tomado sobre las fe2 combi
pu > pv > 0, siempre que u < v naciones, puede escribirse
El trazo de un conjunto de a partir de esta suprapoblación crea

una sola población finita de tamaño N. %V(U ) - iu ( 2 + Pu + P2k - u ) + k ( 1 + pk ) J (8.39)
La varianza promedio para el muestreo sistemático se denota con Del mismo modo, %V(yv ) puede expresarse como
9Vv = »£ ()> „ - Y )2
t u ( 2 + 2 pk ) + k ( l + p k )J (8.40)
Para esta clase de poblaciones es fácil mostrar que el muestreo
aleatorio estratificado supera al aleatorio simple, pero no se puede De aquí,
establecer un resultado general respecto al sistemático. Dentro de la
clase hay suprapoblaciones en donde el muestreo sistemático supera SV(jJ„) -m u) = ¿ [ I ' u ( p u +p 2k_u- 2pk) ] (8.41)
al aleatorio estratificado, pero también hay suprapoblaciones en don
de el muestreo sistemático es inferior al aleatorio simple para al Pero si
gunos valores de fe.
P u + i + P u -i—2pu (u = 2 , 3 , . . . )
Puede obtenerse un teorema general al suponer además, que el
correlograma es cóncavo hacia arriba. es fácil demostrar que todos los términos dentro del paréntesis son
positivos. Esto completa la prueba. Brevemente, la separación pro
Teorema 8.6. Si además de las condiciones (8 .3 4 ) tenemos medio es fe, tanto para la muestra sistemática como para la estrati
$u2—Pu*i+ Pu-\ —2pu —0 [ « = 2 ,3 ,. . . ,(fen —2)] (8.35) ficada, pero debido a la concavidad, la muestra estratificada pierde
más en precisión, cuando la distancia es menor que fe, de lo que
entonces gana, cuando la distancia excede a fe.
9 v v s w v „ ¿ ¡fs v m (8.36) Quenouille (1 9 4 9 ) ha demostrado que las desigualdades en el
Teorema 8.6 permanecen válidas cuando se relajan dos de las con
para cualquier tamaño de muestra. Además, a menos que 8U2 = 0,
diciones de tal manera que
v. = 2, 3, . . ( fcñ — 2 ),
%Vjy< % V „ (8.37) £(y¡) = P„ %(y¡ ~ p ¡ f = cr2 (8.42)
Cochran (1 94 6) ha demostrado este teorema. En este caso cada una de las tres varianzas promedio se aumenta
en la misma cantidad.
Un bosquejo del argumento para n = 2 ilustra el papel desem
peñado por la condición “cóncava hacia arriba” . En la muestra sis En lo que se refiere a aplicaciones prácticas, varios autores han
temática, los miembros del par distan siempre fe unidades. Por esto, propuesto correlogramas cóncavos hacia arriba, como modelos para
poblaciones naturales específicas. La función pu = tanh (u~vs) la
m U ) = ¡i * 2+ cr2+ 2pkcr2) = ¡<r2( l + pk) (8.38) sugirió Fisher y Mackenzie (1 9 2 2 ) para la correlación entre lluvia
Con la muestra estratificada, hay k posiciones posibles para la uni semanal en dos estaciones meteorológicas las cuales distan una dis
dad tomada de cada estrato, al hacer fe- combinaciones de posiciones. tancia u, la función pu =e~*u por Osbome (1 9 4 2 ) y Matém (1 94 7)
Los números de combinaciones 1, 2, . . (2fe — 1 ) unidades distan para reconocimientos de bosques y uso de la tierra, y la función
tes son como sigue Pu = ( l — u )/ l por Wold (1 93 8) para ciertos tipos de series de tiem
po económicas.
M U E S TR E O S IS T E M A TIC O 277
8.9 P O B L A C IO N E S N A T U R A L E S Los tres estudios siguientes se basaron en las temperaturas du

rante 192 días consecutivos: ( a ) 12 plg bajo suelo, ( b ) 4 plg bajo
Se realizaron investigaciones en una variedad de poblaciones na suelo, ( c ) en el aire. Este trío representa una gradación en dirección
turales. Los datos se describen en la Tabla 8.6. Los primeros tres de mayor influencia de los cambios erráticos de día a día en el
estudios se hicieron a partir de mapas. En el primero, la población tiempo, en comparación con la lenta influencia de las estaciones.
finita consiste de 288 altitudes a distancias sucesivas de 0.1 millas Los estudios restantes se refieren a los rendimientos de plantas
en una región ondulada. En los siguientes dos, los datos son frac o árboles en secuencias que yacen a lo largo de una línea. En el
ciones de las longitudes de líneas trazadas sobre un mapa en el estudio sobre las papas, que es típico del grupo, la población finita
que se encuentra un cierto tipo de cobertura (p or ejemplo, hierba). consiste en los rendimientos totales de 96 hileras en el campo. Como
Estos ejemplos se pueden considerar como muy cercanos a la va no se ha hecho aquí una revisión exhaustiva de la literatura, pue
riación continua en el sentido matemático. den encontrarse más datos.
En algunos de los estudios Va„ se compara con la varianza
T A B L A 8.6. P o b l a c io n e s N a t u r a l e s U s a d a s e n E s t u d io s d e para una muestra aleatoria estratificada con estratos de tamaño
M u e s t r e o Si s t e m á t i c o 2k y dos unidades por estrato. Esta comparación es interesante por
que de los datos de la muestra se puede obtener un estimador inses-
Referencia N Tipo de Datos
gado de V.,(2. Esto no es posible para V ,n (con estratos de tamaño k
Yates (1 9 4 8 ) 288 Altitudes leídas a intervalos de 0.1 m illas en un y una unidad po-r estrato) o para VSI/. Otros autores reportan compa
tabla 13 mapa de reconocimiento militar. raciones entre V,v con V a¡, y V,t2. La mayoría de estas fuentes no
Osbome (1942) Porcentaje de área en ( a ) tierra cultivada, ( b ) presentan comparaciones con V ran en una forma fácilmente utiliza-
matorral, ( c ) hierba, ( d ) bosques, en líneas ble, pero parece que en general VJ(2 dio ganancias en precisión
paralelas trazadas en un mapa.
sobre V nn.
Osbome (194 2 ) Porcentaje de área en abeto Douglas en líneas
En las publicaciones de Yates y Finney se han dado compara
Temperatura del suelo (1 2 plg bajo la hierba) ciones para una gama de valores de n y de k dentro de cada pobla
Yates (1 9 4 8 ) 192
durante 192 días consecutivos. ción finita. En esos casos, los datos en la Tabla 8.7 son las medias
Yutos (1 9 4 8 ) 192 Temperatura del suelo ( 4 plg bajo suelo des geométricas de las razones de varianzas para los valores individuales
nudo) durante 192 días. de k. Los otros autores hicieron cálculos solamente para un valor de
Yutos (1 9 4 8 ) 192 Temperatura del aire durante 192 días. k por población, pero pueden dar datos para diferentes caracterís
Yulos (1948.) 96 Rendimientos de 96 hileras de papas. ticas o para varias poblaciones del mismo tipo natural. Aquí, de
Flnney ( 1948) 160 Volumen de madera negociable por fran ja de
3 cadenas de ancho y de longitud variable
nuevo, se tomaron las medias geométricas de las razones de va
(Bosque Monte Stuart). rianzas.
Flnney ( 1948) 288 Volumen de madera virgen por fran ja de 2.5 Aunque los datos son limitados en extensión, los resultados son
cadenas de ancho y 80 cadenas de largo (Bos impresionantes. En los estudios que permiten comparación con V,,,
que Monte Black). el muestreo sistemático presenta una ganancia consistente en preci
Finney (1950 ) 292 Volumen de madera por fran ja de 2 cadenas
sión la cual, aunque modesta, es buena. La mediana de las razones
de ancho y largo variable (Bosque Dehra
V ,(l/Vsv es 1.4. Las ganancias en comparación con Vs¡2 son sustan
D un).
Núm ero de plántulas por pie de era en 4 almá- ciales al ser la razón mediana 1.9.
Johnson (194 3 ) 400f
cigos de árboles de madera dura. La tendencia interna de los resultados concuerda con lo espe
Johnson (1 9 4 3 ) 400t Número de plántulas por pie de era en 3 almá- rado, aunque no debería hacerse mucho caso de este hecho, en vista
cigos de coniferas. del pequeño número de estudios. Las ganancias son mayores para
Johnson (1 9 4 3 ) 400t Núm ero de plántulas por pie de era en 6 almá- los tipos de datos en los cuales podríamos suponer que la variación
cigos de coniferas trasplantadas.
sería cercana a la continua. El descenso en Va„/ V 3v de la tempera
tura del suelo a la del aire podría también anticiparse con baje
* Teóricamente, N es infinito, si se pueden concebir líneas infinitamente delgada»,
t Aproximadamente. El número varió de era a era.
en este mismo punto de vista. En las últimas tres características
274 T E C N IC A S DE M UESTBEO
M U ESTREO S IS T E M A T IC O 275
Por lo tanto, suponemos que las observaciones y¡ ( i = 1 ,2 ,..., N )

se sacan de una suprapoblación en donde Distancia 1 2. . ( f e - 1) fe (fe + 1 ). . . (2fe - 1 ) Total
W = £ (y .-M )2 = o-2, fr(y( -/r)(yi+u-/A )=p u<r2 (8.34) Número 1 2. . ( f e - 1) fe (f e - 1 ). . . 1 fe2

con
De aquí, el valor promedio de V fo ,), tomado sobre las fea combi
pu> p v > 0, siempre que u < v naciones, puede escribirse
El trazo de un conjunto de y i a partir de esta suprapoblación crea

una sola población finita de tamaño N. '") = 9 p [ 2 “ (2 + Pu +P2*-J + fe(l+PA:)J (8.39)
La varianza promedio para el muestreo sistemático se denota con Del mismo modo, íS V iy ^ ) puede expresarse como
%V)y = m y » - Y ) 2
g,'/(ySy) = ^ p [ Y, u{2 + 2pk) + k (l+ p k)^ (8.40)
Para esta clase de poblaciones es fácil mostrar que el muestreo
aleatorio estratificado supera al aleatorio simple, pero no se puede De aquí,
establecer un resultado general respecto al sistemático. Dentro de la
clase hay suprapoblaciones en donde el muestreo sistemático supera W ( y „ ) - m y „ ) - ¿ [ ‘i 1u(pu - 2f t ) ] (8.41)
al aleatorio estratificado, pero también hay suprapoblaciones en don
de el muestreo sistemático es inferior al aleatorio simple para al Pero si
gunos valores de fe.
Pu+1 "tpu-i —2p„ ( k = 2 ,3 ,...)
Puede obtenerse un teorema general al suponer además, que el
correlograma es cóncavo hacia arriba. es fácil demostrar que todos los términos dentro del paréntesis son
positivos. Esto completa la prueba. Brevemente, la separación 'pro
Teorema 8.6. Si además de las condiciones (8 .3 4 ) tenemos
medio es fe, tanto para la muestra sistemática como para la estrati
5u2=Pu+i+pu- i “ 2pu^ 0 [ h = 2 ,3 .........(fcn—2)] (8.35) ficada, pero debido a la concavidad, la muestra estratificada pierde
más en precisión, cuando la distancia es menor que fe, de lo que
entonces gana, cuando la distancia excede a fe.
(8.36) Quenouille (1 9 4 9 ) ha demostrado que las desigualdades en el
Teorema 8.6 permanecen válidas cuando se relajan dos de las con
para cualquier tamaño de muestra. Además, a menos que = 0,
diciones de tal manera que
u = 2, 3, . . ., (k ii - 2 ),
< %V„ (8.37) %{y¡) = M., %(y¡ ~ M¡)2 = o-,2 (8.42)
Cochran (1 94 6) ha demostrado este teorema. En este caso cada una de las tres varianzas promedio se aumenta
en la misma cantidad.
Un bosquejo del argumento para n = 2 ilustra el papel desem
peñado por la condición “cóncava hacia arriba” . En la muestra sis En lo que se refiere a aplicaciones prácticas, varios autores han
temática, los miembros del par distan siempre fe unidades. Por esto, propuesto correlogramas cóncavos hacia arriba, como modelos para
poblaciones naturales específicas. La función pu = tanh (u~3/5) la
%V(y,y) = 3(cr2+ <r2+ 2pk<r2) = |cr2( l + pk) (8.38) sugirió Fislier y Mackenzie (1 9 2 2 ) para la correlación entre lluvia
Con la muestra estratificada, hay fe posiciones posibles para la uni semanal en dos estaciones meteorológicas las cuales distan una dis
dad tomada de cada estrato, al hacer fe- combinaciones de posiciones. tancia u, la función pu =e~ÁU por Osbome (1 94 2) y Matérn (1947)
Los números de combinaciones 1, 2, . . ., (2fe — 1) unidades distan para reconocimientos de bosques y uso de la tierra, y la función
tes son como sigue Pu = ( i — u )/ l por Wold (1 9 3 8 ) para ciertos tipos de series de tiem
po económicas.
276 TE C N IC A S DE M U ESTRE O M U E S TB E O S IST E M A TIC O 277
8.9 P O B L A C IO N E S N A T U R A L E S Los tres estudios siguientes se basaron en las temperaturas du

rante 192 días consecutivos: ( a ) 12 plg bajo suelo, ( b ) 4 plg bajo
Se realizaron investigaciones en una variedad de poblaciones na suelo, ( c ) en el aire. Este trío representa una gradación en dirección
turales. Los datos se describen en la Tabla 8.6. Los primeros tres de mayor influencia de los cambios erráticos de día a día en el
estudios se hicieron a partir de mapas. En el primero, la población tiempo, en comparación con la .lenta influencia de las estaciones.
finita consiste de 288 altitudes a distancias sucesivas de 0.1 millas Los estudios restantes se refieren a los rendimientos de plantas
en una región ondulada. En los siguientes dos, los datos son frac o árboles en secuencias que yacen a lo largo de una línea. En el
ciones de las longitudes de líneas trazadas sobre un mapa en el estudio sobre las papas, que es típico del grupo, la población finita
que se encuentra un cierto tipo de cobertura (p or ejemplo, hierba). consiste en los rendimientos totales de 96 hileras en el campo. Como
Estos ejemplos se pueden considerar como muy cercanos a la va no se ha hecho aquí una revisión exhaustiva de la literatura, pue
riación continua en el sentido matemático. den encontrarse más datos.
En algunos de los estudios V3„ se compara con la varianza V ,„
TA B LA 8.6. P o b l a c io n e s N atu rales U sadas en E s t u d io s de para una muestra aleatoria estratificada con estratos de tamaño
M uestreo S is t e m á t ic o 2k y dos unidades por estrato. Esta comparación es interesante por
que de los datos de la muestra se puede obtener un estimador inses
Referencia N Tipo de Datos
gado de VJ|3. Esto no es posible para V ,(l (con estratos de tamaño k
Yates (1 948) 288 Altitudes leídas a intervalos de 0.1 millas en un y una unidad por estrato) o para V,v. Otros autores reportan compa
tabla 13 mapa de reconocimiento militar. raciones entre V sy con V „ , y V,t2. La mayoría de estas fuentes no
Ottbome (194 2 ) * Porcentaje de área en ( a ) tierra cultivada, ( b ) presentan comparaciones con V ran en una forma fácilmente utiliza-
matorral, ( c ) hierba, ( d ) bosques, en líneas ble, pero parece que en general Vll2 dio ganancias en precisión
sobre V rorc.
Onbome (1942) * Porcentaje de área en abeto Douglas en líneas
paralelas trazadas en un mapa. En las publicaciones de Yates y Finney se han dado compara
Yute* (194 8 ) 192 Temperatura del suelo (1 2 plg bajo la hierba) ciones para una gama de valores de n y de k dentro de cada pobla
durante 192 días consecutivos. ción finita. En esos casos, los datos en la Tabla 8.7 son las medias
YatO» (1948) 192 Temperatura del suelo (4 plg bajo suelo des geométricas de las razones de varianzas para los valores individuales
nudo) durante 192 días. de k. Los otros autores hicieron cálculos solamente para un valor de
Yulos (194 8 ) 192 Temperatura del aire durante 192 días. k por población, pero pueden dar datos para diferentes caracterís
Yutos (1 9 4 8 ) 96 Rendimientos de 96 hileras de papas.
ticas o para varias poblaciones del mismo tipo natural. Aquí, de
Finney (194 8 ) 160 Volumen de madera negociable por fran ja de
3 cadenas de ancho y de longitud variable
nuevo, se tomaron las medias geométricas de las razones de va
(Bosque Monte Stuart). rianzas.
Finney (1948) 288 Volumen de madera virgen por franja de 2.5 Aunque los datos son limitados en extensión, los resultados son
cadenas de ancho y 80 cadenas de largo (Bos impresionantes. En los estudios que permiten comparación con V,¡,
que Monte Black). el muestreo sistemático presenta una ganancia consistente en preci
Finney (195 0 ) 292 Volumen de madera por franja de 2 cadenas
sión la cual, aunque modesta, es buena. La mediana de las razones
de ancho y largo variable (Bosque Dehra
D un). es 1.4. Las ganancias en comparación con VJ(2 son sustan
johnsoñ (1943) 400f Número de plántulas por pie de era en 4 almá- ciales al ser la razón mediana 1.9.
cigos de árboles de madera dura. La tendencia interna de los resultados concuerda con lo espe
Johnson (1 943) 400t Número de plántulas por pie de era en 3 alma rado, aunque no debería hacerse mucho caso de este hecho, en vista
cigos de coniferas. del pequeño número de estudios. Las ganancias son mayores para
Johnson (194 3 ) 40Qt Número de plántulas por pie de era en 6 almá-
los tipos de datos en los cuales podríamos suponer que la variación
cigos de coniferas trasplantadas.
sería cercana a la continua. El descenso en V ,n/Vsv de la tempera
tura del suelo a la del aire podría también anticiparse con baje
• Teóricamente, N es infinito, si se pueden concebir lineas infinitamente delgadas,
t Aproximadamente- El número varió de era a era. en este mismo punto de vista. En las últimas tres características
m u estreo s is t e m á t ic o 279
donde f c - 4 e i = 1, 2 .......... 4n. Las observaciones sucesivas en la
TABLA 8.7. P r e c is ió n R e la tiv a d e M u e s tre o A le a t o r io E s t r a t ific a d o población son
y S is t e m á t ic o
("i +a ), m, ( m - a ) , m, (m + a ), m, ( m - a ), m,. . .
Precisión relativa de
Si i - 1 se escoge como el primer miembro, todos los miembros de
sistemático a estratificado
la muestra sistemática tienen el valor (m + a ). Para cada una
Datos Intervalo
de k v ,jv ,y de las otras tres posibles elecciones de i, todos los miembros tienen
V J V,y
los valores m, (m — a ), o m , respectivamente. Entonces, a partir
2-20 2.99 5.68 de una sola muestra no tenemos manera de estimar el valor de a
Altitudes
Porcentaje de área pero el valor real de la varianza de muestreo de la media de la mues
(4 tipos de cubierta) --- 4.42
tra sistemática es a-/2. La ilustración muestra que es imposible
1.83
Porcentaje de área (abeto Douglas) construir una varianza estimada que no tenga sesgo si hay variación
2-24 2.42 4.23 periódica.
Temperatura del suelo (1 2 p lg )
Temperatura del suelo (4 p lg ) 4-24 1.45 2.07 Estos resultados no significan que nada pueda hacerse. Exclu
Temperatura del aire 4-24 1.26 1.65 yendo el caso de la variación periódica, podemos saber bastante so
bre la estructura de la población como para poder desarrollar un
3-16 1.37 1.90
Papas modelo matemático que represente adecuadamente el tipo de varia
Volumen de madera ción presente. Podremos entonces desarrollar una fórmula para la
(M onte Stuart) 2-32 1.07 1.35
varianza estimada que es aproximadamente sin sesgo para este mo
Volumen de madera
2-24 1.19 1.44 delo, aunque pudiera ser muy sesgada para otros modelos. La deci
(M onte Black)
Volumen de madera
sión de usar uno de estos modelos queda a juicio del muestreador.
(Dehra D un) 2-32 1.39 1.89 A continuación se presentan algunos modelos simples junto con
Plántulas de madera dura 14 --- 1.89 sus varianzas estimadas correspondientes. N o se ofrecen pruebas.
L4-24 --- 2.22
Plántulas de coniferas Los modelos más simples se aplican a poblaciones en las cuales
12-22 0.93
Coniferas trasplantadas y¡ se compone de una tendencia más una componente “ aleatoria”.
Entonces
(datos de los almácigos forestales), el único que no muestra ganan y¡ =p.' + e,
cia alguna es e l de las coniferas trasplantadas, las cuales son más donde m es alguna función de i. Para la componente aleatoria, su
viejas y más uniformes que las plántulas. ponemos que hay una superpoblación en la cual
£ (*,) = 0, %(€?) = *?, ’¡S(e¡ej) = 0 (i* j)
8.11 E S T IM A C IO N D E L A V A R IA N Z A A P A R T IR Una fórmula S,¥* propuesta para la varianza estimada se denomina
DE U N A S O L A M U E S T R A insesgada si
A partir de los resultados de una muestra aleatoria simple con m s , y2) = w ¡y
n > 1, podemos calcular una estimación insesgada de la varianza esto es, si es sin sesgo para todas las poblaciones finitas que se pue
de la media de la muestra, siendo esta estimación insesgada cual
den extraer de la superpoblación.
quiera que sea la form a de la población. Dado que una muestra sis
temática puede considerarse como una muestra simple aleatoria con
Población en Orden “Aleatorio”
n = 1, esta útil propiedad no prevalece en el caso de una muestra
sistemática. Como ilustración considérese el ejemplo de la “curva /inconstante (/ = 1 , 2 ,..., N )
sinusoidal”. Sea
iri
y¡ = m +a sen —
M U E S TR E O S IST E M A TIC O 281
Este caso es aplicable cuando estamos seguros de que el orden es

T A B L A 8.8. V a r i a n z a s d e l a s M e d ia s d e M u e s t r a s d e N ú m e r o s d e
esencialmente aleatorio con respecto a las características que se están
P lántu las (D a to s d e Jo h n s o n )
midiendo. La fórmula para la varianza es la misma que para una
Real
muestra aleatoria simple y no tiene sesgo si el modelo es correcto. Era K, 4vs 4,3
Arce plateado 1 0.91 2.8 2.5

Solamente Efectos de la Estratificación
2 0.74 3.6 2.9
/i; constante (rk + 1^ ¿< rk + k) Olmo americano 1 4.8 28.4 12.6
2 15.5 22.6 18.6
s2 N z u lh 'iZ lllh l (844) Pinabete blanco 1 5.5 17.2 11.2
Nn 2(i. - 1 ) 2 2.0 11.6 6.4
En este caso, la media es constante dentro de cada estrato de fe Pino blanco 1 8.2 21.0 21.9
unidades. La estimación s2,y2, que se basa en la diferencia sucesiva
del cuadrado medio, no in sesgada. Con tiene una contribución indesea Cochran (1 9 4 6 ) y Matérn (1 9 4 7 ). Si las observaciones sucesivas en
ble de la diferencia entre las u. en estratos vecinos y el primero y muestras sistemáticas se indican por y y ¿ y así sucesivamente,
último estrato tienen muy poca influencia en la estimación de la Yates (1 9 4 9 ) ha sugerido un estimador basado en diferencias du
componente aleatoria de la varianza. Con una muestra razonable de las cuales la primera es
mente grande, esta estimación sería en general demasiado alta supo
¿1 = (2y 1' + y3' + y5' + y / + b * ') ~ (y i + ya + y6' + y8')
(8.46)
niendo que el modelo es correcto.
La diferencia siguiente, d2, puede empezar con y/, y así sucesiva
mente. Para la varianza estimada de tomamos
Tendencia Lineal
H ;= H + P ¡
2 _ N - n n' Y .(y i-2 y „ k +y ^ 2k)2
El factor 7.5 es la suma de los cuadrados de los coeficientes en cual
N n2 6(n - 2 ) (1 S ' ~ " 2) {8AS) quier d*, y g es el número de diferencias que da la muestra (g =
La estimación se basa en términos cuadráticos sucesivos en la se n/9). En las poblaciones naturales examinadas por Yates, una
cuencia y i. La suma de cuadrados contiene (n — 2 ) términos. Con fórmula de este tipo resultó superior a s"-,n basada en diferencias
una tendencia lineal hemos visto (Sec. 8.7) que la misma puede sucesivas, pero todavía sobreestimada
ser eliminada al usar correcciones terminales. El término n'/n 2 es Resumiendo, hay escasez de fórmulas para la varianza estimada,
la suma de cuadrados de las ponderaciones en ywsy. A menos que n pero todas son de aplicabilidad limitada.
sea pequeña, n'/n 2 se puede reemplazar por el factor usual 1Jn. De Con N = nfe, supongamos que n es divisible por un entero m,
bido a que los estratos en los extremos reciben ponderaciones dema (digamos 10). El método siguiente utiliza parcialmente muestreo
siado pequeñas, la estimación contiene sesgo a menos que <r¡2 sea sistemático y proporciona una estimación muestral insesgada de
constante, pero será satisfactoria si n es grande y el modelo es co V(ysy) basada en (m - 1) grados de libertad. Extráigase una mues
rrecto. tra aleatoria simple de tamaño m a partir de las unidades numera
Si está presente una variación continua de tipo más complejo, la das de 1 a mk. Para cada unidad de esta muestra, tómese también
fórmula precedente puede arrojar resultados pobres. En la Tabla 8.8 cada unidad en una posición (mfe-ésima) posterior. De hecho, este
la segunda y tercera fórmulas se aplican a seis eras de almácigo método divide la población en mk conglomerados, cada uno de tamaño
forestal (Johnson, 1943). La fórmula cuadrática es ligeramente N /m k = n/m, y elige m conglomerados al azar, de modo que tenemos
mejor que la basada en diferencias sucesivas, pero ambas producen una muestra aleatoria simple de m conglomerados. Por ejemplo,
serias sobreestimaciones. supongamos que queremos una muestra del 20% de una población
Fórmulas desarrolladas a partir de suposiciones simples acerca con N «= 2 400 de modo que n = 480 fe »= 5, tómese una muestra
de la naturaleza del correlograma las han discutido Osbome (1942), aleatoria simple de tamaño m = 10 entre las unidades numeradas
de 1 a mk ■= 50, y tómese cada quincuagésima unidad de ahí en
muestras tales en una submuestra aleatoria de estratos con el pro

adelante. Entonces tenemos 10 muestras conglomeradas, cada una pósito de estimar el error.
de tamaño 2 400/50 = 48.
Gautschi (1 9 5 7 ) ha examinado la exactitud de este método en
8.13 M UESTREO S IS T E M A T IC O E N DO S D IM E N SIO N E S
las estructuras de población consideradas en este capítulo. Como
podría anticiparse, la exactitud está entre la del muestreo aleatorio
Al muestrear una área, la extensión más simple del muestreo
simple y la del muestreo sistemático con m = 1.
sistemático unidimensional es el método de la “rejilla cuadrada” que
aparece en la Fig. 8.4a. La muestra queda completamente determi
8.12 M UESTR EO S IS T E M A T IC O E S T R A T IF IC A D O nada al elegir un par de números aleatorios para fijar las coorde
nadas de la unidad superior izquierda. El comportamiento de la reji
Hemos visto que si las unidades se ordenan apropiadamente, el lla cuadrada se ha estudiado en poblaciones teóricas y en poblaciones
muestreo sistemático proporciona una clase de estratificación con naturales. M etém (1 96 0) investigó el mejor tipo de muestra cuando
fracciones de muestreo iguales. Si estratificamos según otro criterio, la correlación entre cualesquiera dos puntos del área es una función
podríamos sacar una muestra sistemática separada dentro de cada cóncava hacia arriba y monótona decreciente de su separación d.
estrato con puntos iniciales determinados independientemente. Esto Para correlogramas tales como e~^ la rejilla da buenos resultados,
es recomendable si se quieren estimaciones separadas para cada es y es superior al muestreo aleatorio simple o estratificado con una
trato o si se usan fracciones de muestreo desiguales. Este método unidad por estrato, aunque Matém da razones para esperar que lo
es más preciso que el muestreo aleatorio estratificado si el muestreo mejor en esta situación es una red triangular en la que los puntos
sistemático dentro de los estratos es más preciso que el aleatorio se encuentran en vértices de triángulos equiláteros.
simple dentro de los estratos. Si ysyh es Ja media de la muestra sis En 14 experimentos de uniformidad agrícola Haynes (1 9 4 8 ) en
temática en el estrato k, la estimación Y de la media de población contró que la rejilla cuadrada tenía aproximadamente la misma pre
y su varianza son cisión que el muestreo aleatorio simple en dos dimensiones. Milne
(1 95 9) examinó en 50 ensayos de uniformidad la rejilla cuadrada
> w = Z Why*yh, V (9 s «y ) = I W h2 V (y syh) central, en la que el punto está en el centro del cuadrado. Dio mejo
res resultados que el muestreo aleatorio simple y tal vez un poco me
Con tan sólo unos pocos estratos, el problema de encontrar una jores que el muestreo aleatorio estratificado, aunque esta diferencia
estimación de muestra de esta cantidad equivale al problema ya dis no fuese estadísticamente significativa. Estos resultados sugieren
cutido de encontrar una estimación muestral satisfactoria de V ( 9¡yh) que cuando menos para datos de este tipo, los efectos de autocorre-
en cada estrato. lación son débiles. Para estimar el área cubierta por bosque o agua
Cuando los estratos son más numerosos puede ser preferible una sobre un mapa, Matém encontró en dos ejemplos que la rejilla cua
estimación basada en el método de estratos contraídos (Sec. 5A.12) drada es mejor que el método aleatorio.
De los resultados de esa sección se sigue que la estimación La Fig. 8.4b exhibe una muestra sistemática alternativa llamada
muestra no alineada. Las coordenadas de la unidad superior izquier
v(9,ay) = T Wh2(y¡yh- y lyi)2 (8.48) da se seleccionan primero, mediante un par de números aleatorios.
donde la suma se extiende sobre los pares de estratos, es en pro Otros dos números aleatorios determinarán las coordenadas horizon
medio una sobreestimación, aunque haya variación periódica dentro tales de las dos unidades restantes en la primera columna de los es
tratos. Se requieren otros dos para fija r las coordenadas verticales
de los estratos.
de las unidades restantes en la primera fila de estratos. El intervalo
Se puede obtener una estimación insesgada de la varianza del
constante k (igual a los lados de los cuadrados) fija entonces las
error si se sacan dos muestras sistemáticas con diferente punto ini posiciones de todos los puntos. Las investigaciones de Quenouille
cial aleatorio e intervalo 2 k dentro de cada estrato, al proporcionar (1 94 9) y Das (1 95 0) para correlogramas simples de dos dimensio
cada estrato un grado de libertad. Se perderá algo de precisión si el nes indican que el diseño no alineado a menudo es superior a la
muestreo sistemático resulta efectivo. Si hay muchos estratos, podrá rejilla cuadrada y al muestreo aleatorio estratificado.
usarse una muestra sistemática en la mayoría de ellos al sacar dos
M U E S TR E O S IS T E M A TIC O 285
la propiedad del cuadrado latino, pues cada letra aparece tres veces
en una columna y dos veces en las otras columnas, pero se acerca
a esta propiedad tanto como es posible.
Yates (1 96 0) que denomina estos arreglos muestreo reticular,
discute su uso en muestreo de dos y tres dimensiones. En tres di
mensiones, cada fila, columna y nivel vertical, puede representarse
en la muestra al elegir p unidades de entre las p3 de la población.
Con p2 unidades en la muestra, cada una de las p= combinaciones
de niveles, filas y columnas, de filas y alturas verticales, y de co
lumnas y alturas verticales, se podrá representar. Patterson (1954)
(b ) M u e s tra n o a lin e a d a
ha investigado los arreglos que dan una estimación insesgada del
error.
F ig . 8.4. Dos tipos de muestra sistemática bidimensional
8.14 RESUM EN
Nueva evidencia de la superioridad de una muestra no alineada
se obtiene de la experiencia en un diseño experimental en el que se Las muestras sistemáticas son de extracción y ejecución conve
encontró que el cuadrado latino es un método preciso para disponer niente. En la mayoría de los estudios que hemos reportado en este
tratamientos en un campo rectangular. El cuadrado latino de 5 X 5 capítulo, sobre poblaciones artificiales y poblaciones naturales pu
de la Fig. 8.5a puede verse como una división del campo en cinco dieron compararse favorablemente en lo que a la precisión respecta
muestras sistemáticas, una para cada letra. Existe evidencia de que con las muestras aleatorias estratificadas. Sus desventajas son que
este cuadrado particular llamado el cuadrado latino del “movimiento pueden dar una precisión mediocre cuando se presente una perio
del rey" es un tanto más preciso que un cuadrado elegido al azar, de dicidad insospechada, y que no se conoce aún un método confiable
5 X 5 , probablemente porque no hay alineación en las diagonales, para la estimación de V(yíy) a partir de los datos de muestra.
ni en las filas, ni en las columnas. A la luz de estos resultados podemos recomendar el muestreo
El principio del cuadrado latino lo utilizó Homeyer y Black sistemático en las situaciones siguientes.
(1 94 6) al muestrear campos de avena rectangulares. Cada campo
1. Cuando el ordenamiento de la población es esencialmente alea
contenía 21 lotes. Las tres muestras sistemáticas posibles se denotan torio o contiene a lo más una estratificación débil. Aquí, el muestreo
con A ,B y C, respectivamente, en la Fig. 8.5b. Este arreglo con una
sistemático se usa por conveniencia y se esperan pocas ganancias
de las letras elegidas al azar en cada campo dio un incremento en de precisión. Se cuenta con estimaciones muéstrales del error que
precisión aproximado al 25% , sobre el muestreo aleatorio estratifi son razonablemente insesgadas (Sec. 8.11).
cado con dos filas como estratos. El arreglo no satisface exactamente
2. Cuando se emplea una estratificación con numerosos estratos
y se toma una muestra sistemática independiente en cada estrato.
A B C D E A B C Los efectos de las periodicidades ocultas tienen tendencia a neutra
D E A B C B C A lizarse en esta situación y puede obtenerse una estimación del error
B C D E A C A B que se sabe es una sobreestimación (Sec. 8.12). En forma alterna
E A B C D A B C
C D E A B B C A tiva, podemos usar la mitad de los estratos y tomar dos muestras
C A B sistemáticas, con inicios aleatorios independientes en cada estrato.
A B C Este método da una estimación insesgada del error.
( O C u a d ra d o la tin o d e ( b ) D iseñ o s istem á tic o
3. Para unidades conglomeradas de submuestreo (Cap. 10). En
•‘ m o v im ie n to d e l r e y " p a ra u n c a m p o re c ta n g u la r
3X7 este caso puede obtenerse una estimación casi insesgada o insesgada
del error de muestreo en la mayoría de las situaciones prácticas. Es
Fie. 8.5. Dos diseños sistemáticos basados en el cuadrado latino te es un uso bastante común del muestreo sistemático.
286 TE C N IC A S DE M U E S TR E O M U E S TR E O S IS T E M A T IC O 287
4. Para muestrear poblaciones que tienen una variación de tipo

el continuo a condición de que no se requiera regularmente una esti
O mación del error de muestreo. Si se hace una serie de encuestas de
Mr vi
s a CN «n S 2 tf v\ M Qn ^ I • *o ese tipo, será suficiente una verificación ocasional de los errores
■a 8 sV 2 ” í S S - (N 2: 2 2 S¡Q S •V
de muestreo. Yates (1 9 4 8 ) ha mostrado cómo puede hacerse esto,
.a
S i al tomar observaciones adicionales.
VI E J E R C I C I O S
o ^ r - o v ^ r ~ ' 0 ^ , s 'rtOOTl' ' í o ' QOOO£7' 2 ' 0 " O
<N
8.1. Los datos en la Tabla (Pág. 2 8 6 ) son los números de plántulas por
cada pie de era, en una era de 200 pies de largo.
rl Encuentre la varianza de la media de una muestra sistemática de cada
'l-
vigésimo pie. Compare ésta con las varianzas para ( a ) una muestra aleatoria
simple, ( b ) una muestra aleatoria estratificada con dos unidades por estrato,
( c ) una muestra aleatoria estratificada con una unidad por estrato. Todas
las muestras tienen n = 10. [!({/ ; — Y ) 2 = 23 601.]
s 8.2. Una población de 360 viviendas (numeradas de 1 a 360) en Baltimore
se ordena alfabéticamente en un archivo de acuerdo con el apellido del jefe
de familia. Viviendas en las cuales el je fe no es blanco ocurren en los nú
meros siguientes: 28, 31-33, 36-41, 44 , 45, 47, 55, 56, 58, 68, 69, 82, 83, 85,
o 86, 89-94, 98, 99, 101, 107-110, 114, 154, 156, 178, 223, 224, 296 , 298-300,
1-
302-304, 306-323, 325-331, 333, 335-339, 341, 342. (L as viviendas de no
1 blancos muestran algún "agrupamiento'' debido a la asociación entre apellido
5 y color.)
Compare la precisión de una muestra sistemática l-en-8 con una muestra
cu O
T3 P- 2 aleatoria simple del mismo tamaño para estimar la proporción de viviendas
O I o en las cuales el jefe de fam ilia no es blanco.
s 8.3. Un vecindario tiene tres comunidades compactas, que consisten res
pectivamente, de personas de descendencia anglosajona, polaca e italiana.
£ H ay un directorio actualizado. En él, las personas de una casa están enlistadas
en el siguiente orden: marido, esposa, hijos (p o r edades), otros. Las casas
son enlistadas en orden a lo largo de las calles. El número promedio de per
sonas por casa es de cinco.
o
30
¡
La elección es entre una muestra sistemática de cada quinta persona en
el directorio y una muestra aleatoria simple del 20% . ¿Para cuáles de las
siguientes variables espera usted que la muestra sistemática sea más precisa?
s ( a ) Proporción de personas de descendencia polaca, ( b ) proporción de varones,
i ( c ) proporción de hijos. Dé sus razones.
TT 8.4. En un directorio de 13 casas en una calle, las personas están en
listadas como sigue: Ai = varón adulto, F — m ujer adulta, m = hijo varón,
o 2 S : = 8 8 2 2 S 2 ^ 8 2 S ñ 2 ^ f = hija.
Vivienda
o
o — ® ' c ' ° ! q S 2 “ Ñ r l 2 S S = 2 r' a ? H So. ■e- 1 2 3 4 5 6 7 8 9 10 11 12 13
r'.1
4) M M M M M M M M M M M M M M
13 O
F F F F F F F F F F F F F
f f m m f í m m m f f
m /ti ! m m í f f m
288 TE C NIC AS DÉ M U E S TR E O
Compare las varianzas dadas por una muestra sistemática de una de cada
cinco personas y una muestra aleatoria simple del 20% para la estimación
de ( a ) la proporción de varones, ( b ) la proporción de hijos, ( c ) la propor
ción de personas en hogares de profesionales (viviendas 1, 2, 3, 12 y 13 se
describen/como profesionales). ¿Respaldan estos resultados sus respuestas
C A P IT U L O 9
del Ejercicio 8.3? Para la muestra sistemática numere cada columna hacia
abajo y luego vaya hacia la parte superior de la siguiente columna.
8.5. En el Ejercicio 8.1 podemos estimar V (y,y) ( a ) al considerar cada
muestra sistemática como una muestra aleatoria simple, ( b ) al pretender que
cada muestra sistemática l-en-20 está compuesta de dos muestras sistemá
ticas l-en-40 con inicios al azar separados. Para cada método compare el
promedio de las varianzas estimadas con la varianza real de y,r
Muestreo por Conglomerados,
8.6. En una población que consiste de una tendencia lineal (Sec. 8.6)
demuestre que una muestra sistemática es menos precisa que una muestra de una Etapa:
aleatoria estratificada con estratos de tamaño 2fe y dos unidades por estrato
si n > (4b + 2 )/(fe + 1).
8.7. Una población bidimensional con una tendencia lineal se puede Conglomerados del Mismo Tam año
representar por la relación
y,, = ‘ + ) (¿,/'= 1,2,,.. .,nk)

donde ytl es el valor de la característica en la i-ésima hilera y la j-ésima co
lumna. La población contiene N - — n-k2 unidades.
Una muestra sistemática en red cuadrada se selecciona al sacar al azar
don coordenadas iniciales independientes i 0, j0, cada una entre 1 y fe. La mues 9.1 M O T IV O S D E L M U E STR E O PO R C O N G LO M E R A D O S
tra, de tamaño n-, contiene todas las unidades cuyas coordenadas son de la
forma En los capítulos precedentes, se han hecho numerosas referen
í'0+yfc,;'o+ófc cias a encuestas en las que la unidad consiste en un grupo o conglo
merado de unidades más pequeñas que hemos llamado elementos o
donde y, i son dos enteros cualesquiera entre 0 y ( n — 1 ), inclusive. Muestre subunidades. Hay dos razones principales para la muy generalizada
que la media de esta muestra tiene la misma precisión que la media de una
aplicación del muestreo por conglomerados. Aunque la primera in
muestra aleatoria simple de tamaño n s.
8.8. Si la comparación en el Ejercicio 8.7 se hiciera para una población tención sea la de usar los elementos como unidades de muestreo,
tridimensional con tendencia lineal, ¿qué resultado esperaría usted? se ha encontrado que para muchas encuestas no se tiene una lista
8.9. En una población con y ¡ = t2( t = 1 , 2 , . . . , 1 6) comparar los valores confiable de los elementos de la población y además sería demasiado
de £ ( f - Y ) 2 dados por cada fe-ésimo muestreo sistemático y por los métodos costoso formular dicha lista. En muchos países no existen listas
de Yates, Sethi y Singh, y otios, para n = 4, k = 4, N = 16. completas y actualizadas de la gente, las viviendas, o las granjas
en grandes reglones geográficas. Sin embargo, a partir de los mapas
de la región, se puede dividirla en unidades de área, como serían
las manzanas de una ciudad y los terrenos con fronteras identifica-
bles rápidamente en las zonas rurales. En los Estados Unidos suelen
elegirse estos conglomerados porque resuelven el problema de la
construcción de una lista de unidades de muestreo.
Aunque se cuente con una lista de viviendas, puede ocurrir que
por consideraciones económicas se recomiende una unidad conglo
merada mayor. Para un tamaño de muestra dado, una unidad de
muestreo pequeña suele ser más precisa que una unidad grande.
Así, por ejemplo, una muestra aleatoria simple de 600 viviendas
290 TE C N IC A S DE M U ESTRE O M U E S TR E O PO R CONGLOM ERADOS, D E U N A E T A P A : . . . 291
cubre una ciudad más uniformemente que una muestra de 20 m an V' 2_i¡¡_;
v = /v¡L C2 N 2S 2 (9.1)
zanas con un promedio de 30 viviendas por manzana. Pero se ten nu V
drán mayores costos de campo para localizar 600 viviendas y des
El costo de tomar n« unidades Cunu = CUNU2S 2/ V. Como N J4 U- cons
plazarse entre ellas que para localizar 20 manzanas y visitar todas
tante para los diferentes tipos de unidad, el costo es proporcional a
las casas de dichas manzanas. A l cotejar costo contra precisión, la
unidad mayor puede resultar más conveniente. CuS 2/ M 2. Por otro lado, si se especifica el costo C, n„ = C/C„ y en
(9 .1 ), V c c CUS 2/ M 2. Esto termina la demostración.
Se puede seleccionar racionalmente entre los dos tipos o tama
ños de unidades mediante el conocido principio de elegir la unidad Corolario 1. Si definimos la precisión neta relativa de una uni
que da la varianza más pequeña para un costo dado, o el menor
dad, como inversamente proporcional a la varianza obtenida para
costo para una varianza prefijada. Como en muchas decisiones
costo fijo, el Teorema 9.1 se puede enunciar como
prácticas, puede haber factores imponderables: un tipo de unidad
puede ofrecer alguna conveniencia especial o desventaja que es M 2
precisión neta relativa ce- ~ 2 (9-2)
difícil incluir en el cálculo de los costos. A l muestrear un cultivo CU3U
en crecimiento, algunas experiencias han sugerido que una unidad
Corolario 2. En el análisis de la varianza, las varianzas por uni
pequeña puede dar estimaciones sesgadas debido a la incertidumbre
entre las fronteras exactas de la unidad. Homeyer y Black (1 9 4 6 ) dades de diferentes tamaños suelen calcularse en lo que se llama
encontraron que las unidades de 2 X 2 pies, daban un rendimiento una base común, que usuaimente es la aplicable a la unidad más
de avena superior en 8% a las unidades de 3 x 3 pies, posiblemente pequeña. Para poner las varianzas sobre una base común, la varianza
porque los muestreadores tendían a situar en los casos dudosos las Su2 entre los totales de unidades de tamaño M u se divide por Aí„. Sean
plantas de la frontera dentro de la unidad. Sukhatme (1 94 7) cita S2
resultados semejantes para cultivos de trigo y arroz. Sli'2= ~ = varianza entre totales de unidades ( sobre una base común)
Mu
En este capítulo se trata el caso en e l que cada unidad conglo C
merada contiene el mismo número de elementos o subunidades. C Jcc- —■= costo relativo para tomar un determinado volumen de
“ muestra
9.2 U N A R E G L A S IM P LE Entonces, el Teorema 9.1 y el Corolario 1 se pueden enunciar como

sigue:
Cuando el problema es comparar unos cuantos tipos de unidad
o tamaños específicos, es útil el resultado siguiente: CS2
costo relativo para la misma precisión ce - f -^- cc CU'S U'2 (9.3)
Teorema 9.1. Esto se aplica al muestreo aleatorio simple en el que
la cpf es despreciable. La cantidad por estimar es el total de pobla precisión neta relativa ce---/- ;i (9.4)
ción. Para la unidad de tipo tí-ésimo sean
Mu = tamaño relativo de la unidad Si las diferencias en los costos para tomar la muestra se ignoran,
o sea si Cu' es constante, la precisión neta relativa con la u-ésima
Su- = varianza entre los totales de unidades
unidad a 1/S„'5. Los factores deff de Kish para las unidades diferen
C„ = costo relativo para medir una unidad. tes (Sec. 4.11) son, por tanto, proporcionales a las S,/- = suz/Mu-
Entonces, el costo relativo para varianza especificada o la varianza Ejemplo. Los datos de Johnson (1 9 4 1 ) para una era de plántulas de pino
relativa para costo especificado azcuS 2/ M 2. blanco proveen un ejemplo simple. La era tenía seis hileras de 434 pies de
largo cada una. Hay muchas maneras de dividir la era en unidades de mues
Prueba. Supóngase que V es la varianza especificada del total treo. Los datos para cuatro tipos de unidades se muestran en la Tabla 9.1.
estimado de población. Para el tipo u-ésimo de unidad la estimación Dado que la era se contó completamente, los datos son correctos en lo que se
es Nuyu con varianza refiere a valores de población.
292 TE C N IC A S DE M U E S T llE O m u estreo por c o ng lo m er ad o s, de u n a etapa : ... 293
TA B LA 9.1. D a t o s p a r a C u a t r o T i p o s d e U n id a d e s d e M u e s t r e o T A B L A 9.2. P r e c is io n e s N etas R e l a t iv a s d e l a s Cu a t r o U n id a d e s
Tipo de unidad 1 pie de 2 pies de 1 pie de 2 pies de

hilera hilera era era
1 pie 2 pies 1 pie 2 pies
Datos preliminares hilera hilera era era (4>(62) 1B„ (36X78) (144X10S) 18Q„
---------- — — ZU.Z/
- ü - = ,7.34 —-------- --- 18.38 (6X23.094)
(2X6.746) (12X68.558)
M „ — tamaño relativo de la unidad 1 2 6 C .S.' 2.537
12
N u = número de unidades en la población 2604 1302 434 100 106 117 109
217
V = varianza de la pobl. por unidad 2.537 ' 6.746 23.094 68.558
Número de pies de hilera que se pueden
contar en 15 min. debe decrecer con lasunidades más grandes si es que las mismas prueban
44 62 78 108
ser económicas.
Las unidades fueron El Teorema 9.1 y sus corolarios siguen siendo válidos para mues
treo estratificado con asignación proporcional si todos los estratos
un pie de una sola hilera
son del mismo tamaño y si S„J, Su'3 representan varianzas promedio
dos pies de una sola hilera
dentro de los estratos. Esto es así, en las condiciones enunciadas
un pie del ancho de la era
porque la varianza del total de población estimado ignorando la cpf
dos pies del ancho de la era
es N-S^/n y, por lo tanto, toma la misma forma que en el muestreo
aleatorio simple. El Teorema 9.1 no es válido para tipos de mues
Con las primeras dos unidades se supuso muestreo estratificado por hile
ras. de tal manera que S„J representa las varianzas dentro de hileras. Para treo más complicados.
las dos últimas unidades se supuso muestreo aleatorio simple. Los resultados anteriores se dan para ilustrar el procedimiento
Ya que el costo principal es el de localizar y contar las unidades, los general. Las comparaciones entre unidades deben hacerse siempre
costos se estimaron mediante un estudio de tiempo (ú ltim a hilera de la Ta para la clase de muestreo que se usa en la práctica o bien, si esto
bla 9.1). Con las unidades mayores, se puede contar una muestra más grande aún no se ha decidido, para las clases de muestreo que se consideren.
en 15 mln. por gastarse menos tiempo para ir de una unidad a la otra. Los cambios en el método de muestreo o de estimación alterarán las
La cantidad a estimar es e l número total de plántulas por era. En la precisiones netas relativas de las diferentes unidades. Aun con un
notación del Teorema 9.1, la Tabla 9.1 da los valores de M u y Sus. Los valores
método fijo de muestreo y de estimación, las precisiones netas rela
relativos do Cu, expresados como el tiempo requerido para contar una unidad,
son como sigue: tivas varían con e l tamaño de la muestra si el costo no es una
función lineal del tamaño, o si el tamaño es tal que no se puedan
1 pie 2 pies 1 pie 2 pies
ignorar las cpf.
hilera hilera era era Generalmente hay más de una característica a considerar. Un
(en tiempos de 15 minutos) ¿ t é fg iS posible enfoque es fija r e l costo total y encontrar las precisiones
netas relativas para cada tipo de unidad y cada característica. A
menos que un tipo sea uniformemente superior, se necesitará tomar
Según el Teorema 9.1, Corolario 1, las precisiones netas relativas se calcu una decisión de compromiso que dé la ponderación principal a las
lan en la Tabla 9.2.
características más importantes.
La última línea de la Tabla 9.2 da las precisiones relativas cuando se toma En vista de los numerosos factores que influyen los resultados,
la de la unidad más pequeña como 100. La unidad de 1 pie de era parece
ser la mejor. el estudio de un tamaño óptimo de unidad en una encuesta muy
extensa es una gran tarea. Jessen (1 9 4 2 ) describe un buen ejemplo
Las varianzas entre unidades, expresadas en una base común. También
es conveniente observar. Los valores de Su'~- — S * / M u, aplicables a un solo de muestreo agrícola. Un resumen de sus resultados es el que apa
pie de hilera son, respectivamente, 2.537, 3.373, 3.849, 5.713. Note que estas rece en la Tabla 9.3. En él se comparan cuatro tamaños de unida
varianzas aumentan consistentemente al aumentar el tamaño de la unidad. des, que son un cuarto de sección, una media sección, una sección,
Este resultado frecuentemente (aunque puede haber excepciones). Dado que y un bloque que consiste en dos secciones contiguas. Las secciones
la precisión relativa neta e c l/CU'SU'2, el costo de tomar una muestra dada
en una área de una milla cuadrada, contienen en promedio un poco
M U E S TR E O PO R CONGLOM ERADOS, DE U N A ETAPA: 295
TA B L A 9.3. E r r o r e s E s t á n d a r E s t im a d o s ( % ) p a ra C u a tro
de la población. Sin embargo, a excepción de poblaciones pequeñas,
T a m a ñ o s d e U n id a d , c o n M u e s t r e o A le a t o r io S im p le raramente se puede efectuar un reconocimiento sólo con propósitos
comparativos. La información sobre la unidad óptima usualmente se
Unidades
Items 5/4 5/2 5 25 obtiene como un ingenioso subproducto de una encuesta cuyo pro
mejores
pósito principal es obtener estimaciones.
Número de cerdos 5.0 4.9 5.3 6.2 5/2
Núm ero de caballos
Suponga que en una encuesta, cada unidad se puede dividir
3.4 3.3 3.6 4.2 5/2
Número de borregos 17.4
en Ai unidades menores. En lugar de registrar solamente los totales
15.7 14.9 14.3 25
Número de pollos 3.0 3.0 3.3 3.8 5/4,5/2
para cada unidad “ grande” en la muestra, registramos los datos
Número de huevos producidos ayer 5.7 5.2 4.9 4.7 25 por separado para cada una de las M unidades menores. Entonces,
puede hacerse una comparación entre las precisiones de las unida
Número de ganado 4.7 4.6 4.8 5.5 5/2 des grandes y las pequeñas. Primero se supondrá una muestra
Número de vacas ordeñadas 3.7 3.6 3.8 4.4 5/2 aleatoria simple de tamaño n.
Número de galones de leche 4.4 4.2 4.4 4.9 5/2
Ingresos por productos lecheros 5.5 5.2
El análisis de la varianza en la Tabla 9.4 se puede calcular a
5.4 6.0 5/2
Número de acres de las granjas 2.9 2.8 3.0 3.5 5/2 partir de la muestra.
La varianza estimada de una unidad grande (con base en una
Número de acres de m aíz 3.7 3.5 3.8 4.4 5/2 unidad m enor) es Sb'. Podría pensarse que una estimación apro
Número de acres de avena 4.6 4.8 5.6 7.0 5/4
Rendimiento de maíz
piada de la varianza de una unidad menor sería el cuadrado medio
1.6 1.7 2.0 2.5 5/4
Rendimiento de avena 1.6 1.5
entre todas las unidades menores en la muestra, esto es,
1.6 1.8 5/2
Gastes por alimentos comerciales 12.6 13.6 16.7 21.8 5/4 , (n -lW + n W -D s J
Gastos totales, operador ’ ¡s ím (9-5)
7.8 8.1 9.6 12.0 5/4
Ingresos totales, operador 6.2 6.5 7.7 9.8 5/4 Esta estimación, aunque a menudo satisfactoria, está ligeramente
Ingreso neto líquido, operador 6.8 6.9 7.8 9.5 5/4 sesgada porque la muestra no es una muestra aleatoria simple de
menos que cuatro granjas. En esta comparación se especificaron el unidades menores, dado que éstas se muestran en grupos contiguos
costo de campo total SI 000, la extensión del cuestionario (60 de Ai unidades.
min para llenarlo) y el costo de viaje [5 cts. ( U S A ) por milla], Una estimación insesgada se obtiene a partir de la muestra, al
porque las precisiones netas relativas cambian al alterar cualquiera construir un análisis de la varianza como en la Tabla 9.5 para la
de estas variables. I-os costos están al nivel de 1939. población total, la cual contiene N unidades mayores y NAÍ unida
Los datos de la Tabla son los errores estándar relativos (en por des menores.
centaje) de las medias estimadas por granja para 18 ítems. N o hay
mejor unidad para todos los artículos. La media sección y cuarto T A B L A 9.4. A n á l is is de l a V a r ia n z a d e l o s D ato s de l a M uestra ( con
de sección, sin embargo, son superiores a las unidades más grandes Base e n una U n id a d P e q u e ñ a )
para todas las características, excepto dos de ellas, al haber poco
que elegir entre las secciones medias y cuartas. La media sección g l. c.m.
probablemente sería preferible porque el problema de identificar con
exactitud las fronteras es más fácil. Entre unidades grandes (« - O *b
Entre unidades pequeñas

9.3 C O M P A R A C IO N E S D E P R E C IS IO N , H E C H A S dentro de grandes n {M - 1) s*
A P A R T IR D E D A T O S D E E N C U E S T A S
Entre unidades pequeñas , (n - \ W + rt(M - \\s¿
en la muestra nM - 1
En el ejemplo de la era de plántulas, las varianzas para los di nM — 1
ferentes tipos de unidad se obtuvieron a partir de un recuento total

296 TE C N IC A S DE M U E S TR E O M U E S TR E O PO R CONGLOM ERADOS, DE U N A E T A P A : . . . 297
TABLA 9.5. A n á l i s i s d e ¡l a V a r i a n z a p a r a l a P o b l a c i ó n T o t a l Con muestreo estratificado, las varianzas para las unidades
( c o n B a s e e n u n a U n id a d P e q u e ñ a )
grandes y pequeñas se pueden estimar separadamente en cada es
trato al usar estos métodos y luego sustituirse en la fórmula
g l- c.m. apropiada para la varianza de la estimación a partir de una mues
tra estratificada.
Entre unidades grandes N - 1 ■V
Ejemplo. Los datos son de una muestra de fincas tomada en Carolina
Entre unidades pequeñas
del Norte en 1942 para estimar los empleos rurales (Finkner, Morgan, y
dentro de unidades grandes N (M - 1) SJ
Monroe, 1943). E l método de extracción de la muestra fue localizar puntos
al azar en el mapa y escoger como unidades de muestreo las tres fincas más
Entre unidades pequeñas M (N — 1)S„2 + N (M - \ )S ¿ cercanas a cada punto. El método n o se recomienda ya que una finca grande
NM - 1
en la población NM - 1 tiene una probabilidad mayor de inclusión en una muestra que una finca
pequeña y una finca aislada tiene una probabilidad mayor que otra en una
área densamente explotada. Cualesquiera efectos de este sesgo serán igno
De acuerdo con su definición, la varianza de la población entre rados.
A partir de los datos de las muestras correspondientes a fincas indivi
unidades pequeñas es dada por la última linea de la Tabla, esto es, duales, el grupo de tres fincas se puede comparar con la finca individual
como unidad de muestreo. La característica escogida es e l número de tra
„ 2_ ( N - l ) S b2+ N ( M - l ) S w2
bajadores asalariados. La muestra se estratificó, siendo el estrato un grupo
s ------------ 1W = 1 (9’6) de territorios similares en la densidad de su población de fincas y la razón
tierra de pastoreo a tierra de labranza. Dado que la fracción de muestreo
Con el muestreo aleatorio simple, S¡,2 en la Tabla 9.4, es una esti
fue de 1.9% , puede ignorarse la cpf.
mación insesgada de S¡,2 (sacado de la Sec. 2.3). Puede mostrarse
Ai 2c 2
fácilmente que Sw- es una estimación insesgada de S,/. De esta
manera, una estimación insesgada de la varianza S2 entre todas las h nh
unidades pequeñas en la población es El procedimiento correcto es calcular N 42Ss2/n¡, separadamente dentro de
cada estrato para los dos tipos de unidad, usando un análisis de varianza
(N - \ )s b2+ N ( M - l ) s w2 y la expresión (9 .8 ). Usaremos un procedimiento má6 simple como una
aproximación.
N M -l V - '’ Los estratos conteníán en general entre 300 y 450 fincas y ya sea dos o
Claramente, esta expresión es casi la misma que la expresión tres unidades de tres fincas se tomaron dentro de cada estrato, para hacer
el muestreo aproximadamente proporcional. Asumiendo proporcionalidad, esto
más simple
es, rLh/N k = n/N, podemos escribir
v ( y j = - i N A 2 i — s„2
Si t i > 50, (9 .5 ) para s2 también se reduce a (9 .8 ), de tal manera Y si suponemos además, que las Sh: no varían grandemente entre estratos
que s2 es una aproximación satisfactoria a S- para n > 50.
de tal manera que se pueden reemplazar por su promedio Sh2.
Las dos estimaciones s&2 (para la unidad grande) y S~- (para Las estimaciones de S,,2 se obtienen del análisis de varianza en la Tabla
la unidad pequeña) están en una base común y pueden sustituirse 9.6, el cual se realizó con base en una sola finca.
en el Teorema 9.1., Corolario 2.
T A B L A 9.6. A n á l is is de V a r ia n z a de la M uestra (N úmero de
Si la muestra es grande, las unidades menores pueden medirse T r a b a j a d o r e s P agados c o n Ba s e e n una so la F in c a )
dentro de una submuéstra aleatoria de las unidades mayores (d i
gamos 100 de cada 600). Alternativamente, podrían medirse dos g j. c.m.
unidades pequeñas tomadas al azar de cada unidad mayor. Simul Entre unidades dentro de estratos 825 6.218
táneamente pueden investigarse unidades pequeñas de más de un Entre fincas dentro de unidades 2768 2.918
tamaño, siempre que se tomen datos que provean una estimación
insesgada de S„2 para cada unidad pequeña. Entre fincas dentro de estratos 3593 3.676
M U E S TR E O PO R C O NGLOM ERAD O S, D E U N A E T A P A : 299
298 TE C N IC A S DE M U ESTB EO
Para e l grupo de tres fincas, el cuadrado medio sh32 = 6.218 sirve como Prueba. Supongamos que y¡ denota el total para el i-ésimo
estimación de Sk2 basado en una sola finca. Para las fincas individuales, usando
(9 .8 ) tenemos conglomerado y y =■ 2—4 y ^ n- P °r los Teoremas 2.1 y 2.2, y es una
i t = 6:218+ 2(2.918) = 40i8 estimación insesgada de Y con varianza,
a -/ )X (»-ñ 2
Por el Teorema 9.1, Corolario 2, las dos cifras 6.218 para e l grupo de tres
fincas y 4.018 para la finca individual, indican las varianzas relativas obte W n N- 1
nidas para un tamaño total de muestra fijo. E l grupo de fincas da cerca de dos
Pero y = My y Y = m Y. Por lo tanto, y es una estimación insesgada
tercios de la precisión de una sola finca. Consideraciones de costos probable
mente harían que el resultado fuera más favorable para la unidad de tres de Y con varianza
fincas.
iz f m z H (9.1D
nM N —1
9.4 V A R IA N Z A EN T E R M IN O S D E L A C O R R E L A C IO N
D E N T R O D E C O N G LO M E R A D O S Pero
Las fórmulas para las varianzas a menudo se expresan en tér (y¡ - Y ) = (y „ - Y ) + (y ¡2- Y ) + •••+ (y*, - í )
minos del coeficiente de correlación, p , entre elementos del mismo
conglomerado. Este procedimiento ya se usó para el muestreo sis Elevando al cuadrado y sumando sobre los N conglomerados,
temático (Sec. 8.3). N N M N M „ ,
Sea yn el valor observado para el ;-ésimo elemento de la t-ésima X (y¡ — Y )2= I X (y,,- - Y) + 2 £ I (y „ - Y )(y* - f)
unidad y sea yt el total de la unidad. En muestreo conglomerado no I i i i /<*
hay porque distinguir entre las dos clases de promedios: la media = (N M - 1 )S2+ (M - 1 )(N M - 1)pS 2
por unidad Y - ly ¡/ N y la media por elemento Y = Xy¡/NM =» Y/AÍ.
= ( N M - l ) S 2[ l + ( M - \ ) p ] (9.12)
La varianza entre elementos es
z< *-f)2 al usar la definición de p en (9 .9 ). Al sustituir en (9 .1 1 ) para
c2= lA_______ V ( y ), esto da
N M -1
El coeficiente de correlación intraconglomerados p se definió (Sec.
8 .3 ) como
£ 7 y .. _ f ) ( y - f ) ^ ^ ‘i ~ Esto completa la prueba.

¥ E(ytj- Y )2 (M - 1 ) ( N M - 1 ) S 2 K ) Si se toma una muestra aleatoria simple de nM elementos, la
El número de los términos (productos cruzados) en el numerador fórmula para V ( y ) es la misma que en (9 .1 0 ), excepto por el tér
E es N M (M — l)/ 2 y en el denominador E es (N M — 1 )S -/N M . mino dentro del paréntesis cuadrado. El factor
Teorema 9.2. Una muestra aleatoria simple de n conglomera 1+ ( M - í)p
dos, cada uno con Ai elementos, se extrae de entre los N conglo
merados de la población. Entonces, la media de muestra por ele muestra la magnitud del cambio de la varianza al usar un conglo
mento y es una estimación insesgada de Y con varianza merado en lugar de un elemento como unidad de muestreo. Este
factor es, por tanto, el efecto del diseño de Kish para conglomerados
de tamaño Al (Sec. 4.11). Si P > 0, el conglomerado es menos
preciso para un cierto volumen de muestra. Si P < 9, como a veces
= ~ S 2[ \ + ( M - \ ) p ] (9.10) ocurre, el conglómerado es más preciso. El Teorema (9 .2 ) es una
simple extensión del Teorema 8.2. (Pág. 261.)
donde p es el coeficiente de correlación dentro del conglomerado.
300 TE C N IC A S DE M U E S TR E O M U E S TR E O PO R C O NGLOM ERAD O S, DE U N A E T A P A : 301
Puede darse una expresión alternativa para P• Sea S62 la varianza M vista como una variable continua. Este problema requiere un
entre totales de conglomerados, con base en una sola unidad. En método para predecir la varianza S b2 entre unidades en la población,
tonces como función de M. Por el análisis de la varianza, S62 puede verse
que es ( a ) la varianza S2 entre todos los elementos de la población
Z ( y ¡ - Y ) 2 = (N -1 )M S „ 2
y ( b ) la varianza S,02 entre elementos que están en la misma unidad.
La Ec. 9.12 puede escribirse como Nuestro método es el de predecir Sw2 y S2 y encontrar S¡,2 por el
análisis de la varianza.
(TV- l)M Sb2= ( N M - 1)S2[ 1 + ( M - 1)p ]
Los datos de muestra producen estimaciones de S" y S»* para
de tal manera que el tamaño de unidad realmente usado. Como S2 es la varianza entre
elementos, no la afectará el tamaño de la unidad. Sin embargo,
(N - l)M S b2- (N M - 1)S2 Sb2- S 2
Sw5 sí se verá afectada. Podría esperarse que aumentara al aumentar
P (N M - 1 )(M - 1 )S 2 (M - l)5 2 { }
el tamaño de la unidad. Si las unidades grandes a examinar poco
cuando los términos en 1/N puedan ignorarse. difieren en tamaño de la unidad realmente usada, una primera
aproximación será considerar Sw2 constante, al usar la estimación
Es conveniente notar el valor del cuadrado medio intraconglo-
que proporcionan los datos de muestra. Una investigación realizada
merado
por McVay (1 9 4 7 ) sugiere que esta aproximación a menudo
puede ser satisfactoria.
S j = E I (y¡/ ~ y ¡) 2/ N ( M - 1) (9.14)
Como mejor aproximación, Jessen (1 9 4 2 ); Mahalanobis (1944)
Por el análisis simple de la varianza y Hendricks (1 9 4 4 ) intentaron desarrollar una ley general para
predecir como cambia S„2 con respecto al tamaño de la unidad. En
(N M - 1)S2= Z (y¡— f f / M + l l t y - y ,)2 muchas encuestas agrícolas, STO2 pareció estar relacionada con Ai
1 i i por la fórmula empírica
= ( N M - 1 )52Í 1+ ( M _ l )p ]+ N { M _ 1)Sw2 Sw2= A M s ( g > 0) (9.16)
donde A y g son constantes no dependientes de M. En esta fórmula,

por (9 .1 2 ). Luego, Sw2 aumenta constantemente al aumentar M. Generalmente g es
pequeña. Podría esperarse una curva de este tipo cuándo hay fuerzas
s^ = ^ ^ S 2( l - p ) = S \ l - p ) (9.15) que ejercen influencias semejantes en elementos cercanos. El clima,
el tipo de suelo, la topografía, y e l anexo a los mercados tienden a
Una buena discusión sobre los valores numéricos de p para di asemejar las características de las explotaciones agrícolas.
ferentes características y diferentes tamaños de conglomerados En teoría, la fórmula es objetable, porque hace que Sw- aumente
la dan Hansen, Hurwitz y Madow (1 9 5 3 ), quienes consideran p ilimitadamente al aumentar Ai. Si suponemos, como parece razo
como una “medida de homogeneidad” del conglomerado. nable, que no hay relación entre elementos muy distantes, una
fórmula en la que S«.2 se acerca a una cota superior con una M
9.5 F U N C IO N E S D E L A V A R IA N Z A grande será más apropiada. Sin embargo, una fórmula que dé un
buen ajuste sobre la gama de valores de M que se investiga será
En algunos tipos de encuestas, comG son: el muestreo de suelos, suficiente.
el corte de cosechas y las encuestas de granjas que utilizan una Si esta fórmula ajusta bien log Sw" aparecería como una recta
unidad de muestreo de área, el tamaño de la unidad conglomerada al graficarla contra log Ai. Se necesitarán los valores de Sw2, para
puede admitir una variación casi continua. En la búsqueda de la me cuando menos dos valores de M, con el fin de estirar las constantes
jor unidad, el problema no consiste en elegir entre dos o tres tamaños log A y g. Son cuando menos necesarios tres valores de M para la
específicos que se han probado, sino encontrar el valor óptimo de apreciación de la linealidad del ajuste.
M U E S TR E O PO R CONGLOM ERADOS, DE U N A E T A P A : 303
el costo de la entrevista y el costo de desplazamiento entre las gran

En el análisis de la varianza de la Tabla 9.5 encontramos que
jas del conglomerado.
„ 2 ( N M - l ) S 2- N ( M - l ) S w2
La segunda componente, c »V ñ , mide el costo de desplazamiento
Sb ~ Ñ =1 entre conglomerados. Se ha mostrado, por medio de pruebas sobre un
(N M —l)S 2- N ( M - \ ) A M * mapa para una población fija, que este costo varía aproximadamente
N- 1 como la raíz cuadrada del número de conglomerados. Por lo tanto,
el costo total del campo será
= M*>2- (M - 1 ) A M * (9.17)
Hendricks (1 94 4) ha señalado que la población completa podría C = C \ M n + c z' fn (9.21)

considerarse como una sola gran unidad de muestreo que contuviera al suponer un muestreo aleatorio simple e ignorar la cpf, la va
N M elementos. Si (9 .1 6 ) es válida, entonces S2 = A (Ñ M )". La ven rianza de la media por elemento y es Sb2/nM. De (9 .1 7), esto es
taja de este artificio es que los valores de A y g ahora pueden esti igual a
marse de los datos para una encuesta en la que sólo se ha usado
un valor de M. Las dos ecuaciones que conducen a las estimaciones ..... S2- ( M - l ) A M * - '
V (y) = i i----------- (9 2 2 )
son n
log S„ 2- log A + g log M (9.18) Para determinar el tamaño óptimo de unidad, encontramos M
e incidentalmente n, que minimiza V para un C fijo. La solución
lo gS 2= log A + g log(íVM) (9.19) general es complicada, aunque su aplicación a un ejemplo numé
La fórmula para S»2 viene a ser, a partir de (9 .1 7 ) rico no presenta gran dificultad.
Mediante alguna manipulación podremos obtener la ecuación
Sb2 = A M * [M N S- ( M - 1)] (9.20) que da la M óptima. Primero se resuelve la ecuación de costo (9.21)
Este método no da una verificación de la corrección de (9 .1 6 ), como una cuadrática en s/ tT Esto da
que podría ser bastante válida para pequeños valores de M , pero
2 c ]M v /ñ / 4 C c ,M \ ,/2
errática para un valor tan alto como NM.
~ 7 T = \1 + — ) <9-23>
La fórmula 9.16 se presenta como ejemplo de la metodología y
La ecuación a minimizar es
no como regla general. Quien se enfrente a un problema similar,
deberá construir y probar cualquier tipo de fórmula que parezca la
C + A V = c¡Mn + c2^Ti + A V
más apropiada para su material. En algunos casos, log S¡2podría ser
una función lineal de M, como lo sugirió Fairfield Smith (1938) Al diferenciar y notar que dV/dn = — V/n, obtenemos las ecuacio
para datos de rendimiento. nes:
A dV AV
c \M+\c 2n ' x,z = “ ~ ~ = (9.24)
9.6 U N A F U N C IO N D E COSTOS Bn n
En una encuesta muy vasta, la naturaleza de los cestos de campo A av

M: c' n = “ l BM
tr (9-25)
desempeña un papel importante para determinar la unidad óptima.
Como ilustración del papel cjue juegan los factores de costo, vamos Al dividir (9 .2 5 ) por (9 .2 4 ) se elimina A, Esto conduce a
a describir una función de costo desarrollada por Jessen (1 94 2) n BV__ CjU
para encuestas agrícolas en donde las grandes unidades son con
V B M ~ ~ c 1M + ¡c2n - '/1
glomerados de granjas vecinas.
o
Se distinguen dos componentes de la función de costo de campo.
La componente cJAn comprende los costos que directamente varían M B V ________ 1
con el número total de elementos (gran jas). Por lo tanto, c, contiene V BM 1+c2/2CxM'fñ ^ ^
M U E S TR E O PO R C O NGLOM ERAD O S, DE U N A E T A P A : . . . 305
Si sustituimos por \ fñ de (9 .2 3 ), obtenemos, después de alguna porción en la clase C en el i-ésimo conglomerado. Se toma una simple
simplificación, muestra aleatoria simple de n conglomerados y se usa el promedio
p de las pi observadas en la muestra como la estimación de la pro
porción P en la población.
Se recordará (Sec. 3.12) que no podemos usar la teoría binomial
A l desarrollar completamente el lado izquierdo de esta ecuación y para encontrar V ( p ) sino que debemos aplicar la fórmula para las
cambiar de signo en ambos lados, encontramos variables continuas a las pi. Esto da
1)3, _ / 4C c M C ' » N
S 2- ( M - l ) A M g~l 1 c 22 ) (9'28)
Esta ecuación da la M óptima. El lado izquierdo no involucra nin (929>
guno de los factores de costo, y depende solamente de la forma Alternativamente, si tomamos una muestra aleatoria simple de nM
de la función de la varianza. Puede verse que ambos lados son elementos, la varianza de p se obtiene por teoría binomial (Teorema
funciones crecientes de M dentro de la región de interés, para g > 0, 3.2) como
M > 1. Supongamos que se encontró la solución para los valores
/x (N M - n M ) PQ N - n PQ
específicos de C, y c2, y queremos examinar el efecto de un au
v -M - (9-30)
mento en c, sobre la solución. El lado izquierdo no depende de
Ci, pero el lado derecho aumenta conforme c, aumenta. Consecuen si N es grande. Consecuentemente, el factor (efecto del diseño),
temente, el valor óptimo de Af disminuirán porque el término C,M
está a la derecha. Una disminución en c-, produce un efecto similar.
<N ^ nde) (9 '3 1 )
Ahora, c, aumenta si la duración de la entrevista aumenta, mien
tras que c-. disminuye si el viajar se hace más barato o si las fincas muestra el cambio relativo en la varianza debido al uso de conglo
en una área dada aumentan en densidad. Estos hechos conducen merados. Los valores numéricos de este factor son útiles en la ob
a la conclusión de que el tamaño óptimo de la unidad se hace más tención de estimaciones preliminares del tamaño de la muestra con
pequeño cuando muestreo de conglomerado. El tamaño de muestra requerido se estima
primero mediante la fórmula binomial y luego se multiplica por el
aumenta la duración de las entrevistas
factor paraindicar el tamaño que será necesario con muestreo
viajar se vuelve más barato
conglomerado. Para unailustración, véase Comfield (1951).
los elementos (fin ca s) aumentan en densidad
Si los tamaños M¡ de los conglomerados son variables, la estima
la cantidad total de dinero usada ( C ) aumenta
ción p = Zcii/lM i es una estimación de razón. Su varianza la da,
Esta conclusión es una consecuencia del tipo de función de costo aproximadamente, la fórmula (Sec. 3.12)
y requerirá se le reexamine con otra función diferente. La misma
ilustra el hecho de que la unidad óptima no es una característica I M 2( P i- P ) 2
fija de la población, sino que depende también del tipo de recono
cimiento y de los niveles de precios y salarios. N -1 (932>
Hansen, Hurwitz y Madow (1 9 5 3 ) dan un excelente análisis de donde M = z M í / N es el tamaño promedio del conglomerado.
la construcción de funciones de costo para encuestas que involucran
muestreo por conglomerados. Si este ejemplo se compara con una muestra aleatoria simple de
nM elementos, encontramos, como una generalización de (9 .3 1 )
9.7 M UESTREO C O N G L O M E R A D O P A R A PR O PO R CIO N ES
Las mismas técnicas se aplican al muestreo conglomerado para Vb¡Á p ) NMPQ
proporciones. Supongamos que M elementos en cualquier conglome Como con las variantes continuas, la relación entre el tamaño
rado se pueden clasificar en dos clases y que = a¡/M es la pro del conglomerado y la varianza entre conglomerados se puede in
M U E S TR E O PO R C ONGLOM ERADOS. DE U N A ETAPA: . . . 307
vestigar, ya sea expresando el factor en (9 .3 1 ) y 9.33) como una S,s — cuadrado medio entre estratos
función de M, o buscando una relación entre la varianza dentro del S3J ■» cuadrado medio entre grandes unidades dentro de estratos
conglomerado y M . Si asignamos el valor 1 a cualquier unidad que S3- — cuadrado medio entre elementos dentro de estratos
cae en la clase C, y 0 a cualquier otra unidad, la ecuación funda
mental del análisis de la varianza para M es Si Ñ es elevada y se ignora la cp f, mostrar que la precisión relativa de la
unidad grande a la pequeña (e l elem ento) mejora gracias a la estratifica
ción, si
N M F (\- P ) = M l (p, - P )2+ M I A ( 1- Pi) (
(M - l) M 1
suma de cuadrados total = suma de cuadrados entre conglomerados
+ s.c. dentro de conglomerados V ** *»
9.5. En una encuesta rural, donde la unidad de muestreo es un conglome
A partir de esta relación se puede calcular el cuadrado medio rado de M granjas, el costo de tomar una muestra de n unidades es
dentro de conglomerados y se le puede graficar como una función
de M. McVay (1 9 4 7 ) describe el uso de este análisis en la investi C —4tMn + óO^ñ
gación del tamaño óptimo del conglomerado.
donde t es el tiempo en horas gastado para obtener las respuestas de un gran
jero. Si se gastan $2 000.00 en encuesta, los valores de n para M — 1, 5, 10;
t = 2 dan lo siguiente.
E J E R C I C I O S
M
9.1. Para los datos de la Tabla 9.1, comparar las precisiones netas rela
tivas de los 4 tipos de unidad, cuando el propósito es el de estimar el número 1 5 10
total de plántulas en la era con un error estándar de '200 plántulas (nótese
que se involucra la cp f). í= jh 400 131 74
9.2. Para los datos de la Tabla 3.5, estimar la precisión relativa de la i = 2h 156 40 21
unidad fam iliar comparada con el individuo para estimar la razón de los sexos
y la proporción de personas que hayan visto al doctor en los doce meses V erificar dos de estos valores para asegurarse de que ha entendido el uso
precedentes, suponiendo muestreo aleatorio simple. de la fórmula.
9.3. Una población que consiste en 2 500 elementos, se divide en 10 es
tratos , conteniendo cada uno cincuenta grandes unidades compuestas de cinco La varianza de la media de muestra (ignorando la c p f) es
elementos. El análisis de la variancia de la población para cierta caracterís
tica es el siguiente, con base en los elementos.
g.l. c.m. S i p = 0.1 para todo M enhre 1 y 10, ¿cuál es el tamaño de unidad más pre
ciso para ( a ) t = \'2 h, ( b ) t = 2 h? ¿Cómo explica la diferencia en los
Entre estratos 9 30.6 resultados?
Entre grandes unidades dentro de estratos 490 3.0 9.6. Si hubiera $5 000.00 para la encuesta, ¿esperaría que el tamaño óptimo
Entre elementos dentro de las grandes de la unidad creciera o decreciera (relativam ente a la que corresponde a
unidades 2 000 1.6 $2 000.00)? Dé sus razones. Puede, si lo desea, encontrar el tamaño óptimo
para verificar su argumento.
Ignorando la cpf. ¿considera usted que la precisión relativa de la unidad

gTande a la pequeña es mayor con muestreo aleatorio simple, que con mues
treo aleatorio estratificado (asignación proporcional)?
9.4. Una población que contiene L Ñ M elementos, se divide en L estratos,

cada uno con Ñ grandes unidades, y cada una de éstas con M unidades
pequeñas. Las siguientes cantidades provienen del análisis de la variancia de
la población, basándose en elementos.
C A P IT U L O 9A
Muestreo Conglomerado de
una Etapa:
Conglomerados de Tam años
Desiguales
9A.1 U N ID A D E S C O N G LO M E R A D O S
DE T A M A Ñ O S D E S IG U A L E S
En la mayor parte de las aplicaciones, las unidades conglome

rados (com o son municipios, ciudades, manzanas de una ciudad)
contienen números diferentes de elementos o subunidades (como
son regiones geográficas, viviendas, personas). Este capítulo trata
de algunos de los numerosos métodos de selección de muestra y esti
mación que se han producido para el caso de unidades conglomera
dos de tamaños desiguales. Sea M¡ el número de elementos de la
z-ésima unidad. Para estimar el total de población Y de los yif ya
tenemos dos métodos conocidos.
Muestreo aleatorio simple de conglomerados:

estimación insesgada
Como antes, sea
¡-i
el total de elementos para la i-ésima unidad conglomerado, Dada una
muestra aleatoria simple de n de las N unidades de la población,
una estimación insesgada de Y es (p or el Teorema 2.1, Corolario)
M U ESTRE O C O N G LOM ERAD O DE U N A E T A P A ' C O N G L O M E R A D O S ... 31J
Y = % X y¡ (9A.1) y, V-V4WO 1VJ

n /_i
Mi, en tanto que Y no lo exige. Lo contra!*0 es verdadero cuando
Por el Teorema 2.2, su varianza es estimamos la media de población por element0- En este caso las esti
maciones correspondiente son
N 2( l _ n f (y ,- Y )2 /i
(9 A ‘2> Í = M 0 nMlt í * = M„
tr =—
" = media muestral por elemento
X Mi
donde Y - Y/N es la media de población por conglomerado.
Por lo tanto, exige solamente el conocimie!*to de *os 9ue caen
Suele descubrirse que la estimación Y' es de una precisión me en la muestra seleccionada.
diocre. Esto ocurre cuando las y¡ (medias por elemento) varían poco
entre las unidades y los varían considerablemente. En este caso,
las y, = M¡y¡ también varían considerablemente entre las unidades y 9A.2 M U E S T R E O C O N P R O B A B IL ID A D
la varianza (9 A .2 ) es graftdé. P R O P O R C IO N A L A L T A M ^ °
Muestreo aleatorio simple de conglomerados: Si todos los Mi son conocidos, Hansen y fturwttz (1943), han
estimación de razón a tamaño desarrollado otra técnica en donde se seleccioi*an *as unidades con
probabilidades proporcionales a sus tamaños Un método de elegir
Sea
una sola muestra es el que ilustra la pequeña población siguiente
N de N = 7 unidades.
M » = X M, = número total de elementos de la población.
Tamaño Gama
Si los Mi y, por tanto, M0 se conocen, una alternativa es la estima Unidad Af £ M¡ asignada
ción de razón en donde Aí¿ se toma como la variable auxiliar x t.
n 1 3 3 1-3
ly , 2 1 4 4
Y r - M 0-^ p — = M 0 (media muestral por elemento) 3 11 15 5-15
4 6 21 16-21
i Mi
i-i 5 4 25 22-25
6 2 27 26-27
En la notación de la estimación de razón, la razón de población 7 3 30 28-30
R = Y jX = Y/M0= Y, media de población por elemento. Por el Teo
rema 6.1, al suponer que el número de conglomerados de la muestra
es grande, Se forman las sumas cumulativas de los M ¡. Par¡3 elegir una unidad
se saca un número aleatorio entre 1 y M0 = 30. S11?011?*111108 9ue sea
el 19. En la suma, el número 19 cae en la uni¿ad 4 9ue cubre la
(9A.3) gama de números de 16 a 21 inclusive. Con este método de extrac
N- 1
ción, la probabilidad de seleccionar cualquier dnidad distinta, es
proporcional a su tamaño.
(9A.4) Este método de selección de una unidad r£SLdta conveniente
cuando N es tan sólo moderado, o en el muestreo estratificado, cuan
Como demuestra (9 A .4 ), la varianza de YR depende de la variabilidad do los N,, son pequeños o moderados, pero la acuñ*ulación- de los M,
entre las medias por elemento y a menudo se encuentra que es mucho puede consumir tiempo considerable para N grande ( como sería N =
más pequeña que V (V ). 20 000). Para este caso, Lahiri (1 95 1) ha dado ub método alterna
tivo que evita la acumulación. Sea M mix el mayor de los M¡. Extrái
M U E S TR E O CONGLOM ERAD O D E una ETAPA: CONGLOMERADOS . . . 313
de modo que la varianza de Ypps, como la de Í'r, depende de la varia

gase un número aleatorio entre 1 y N y supóngase que es i. Ahora,
bilidad de las medias por elemento de la unidad.
extráigase otro número aleatorio m entre 1 y Si m es menor,
En algunas aplicaciones, los tamaños M¡ se conocen sólo aproxi
o igual a M i, se selecciona la i-ésima unidad. En caso contrario, se
madamente. En otros, el “tamaño” no es e l número de elementos de
ensaya con otro par de números aleatorios. Naturalmente, este mé
la unidad sino una medida de su extensión que se piensa altamente
todo involucra el menor número de rechazos cuando los M¡ no difie
correlacionada con el total de unidad y¡. Por ejemplo, el “ tamaño” de
ren mucho entre sí.
un hospital podría medirse por el número total de camas, o por el
Ahora consideremos n > 1; supongamos por el momento que el
número promedio de camas ocupadas en un cierto periodo de tiempo.
muestreo es con restitución. Para seleccionar una segunda unidad
De manera semejante, es posible dar varias medidas del “ tamaño” de
por el método cumulativo, extráigase un nuevo número aleatorio
un restaurante, un banco o un distrito agrícola. Por consiguiente,
entre 1 y 30. Sin embargo, a diferencia del muestreo sin restitución,
consideraremos una medida de tamaño M i y una probabilidad co-
no prohibimos la selección de la unidad 4 una segunda vez. Con N
esta regla, las probabilidades de selección permanecen proporciona rrespondiente de selección = M//M,', donde Af0' = X M¡'. En lo que
les a los tamaños en cada extracción. Una ventaja de la selección respecta los resultados teóricos los z¿ pueden ser cualquier conjunto
sin restitución es que las fórmulas para las varianzas verdadera y de números positivos de suma 1 sobre la población. Se mostrará que
estimada de las estimaciones son simples.
Por otro lado (Sec. 9 A .6), en muestreo sin restitución, el con Y =—Y (9A.7)
servar las probabilidades de selección proporcionales a los tamaños ,_i z¡
pp: n ¡-1
elegidos es más difícil, y tarde o temprano se hace imposible al es una estimación insesgada de Y con varianza
aumentar n. Esto puede verse en el caso extremo (aunque poco prác
tico) de n ■= 7 del ejemplo anterior. Si la selección fuera sin resti
tución, existe la certeza de que cada unidad sería elegida sin conside <9A -8)
ración a los tamaños originales Mi. Pero para muestreo estratificado, Las pruebas utilizan un método introducido en la Sec. 2.10. Sea
en donde los N* son pequeños, se ha investigado profusamente (Sec. U el número de veces que aparece la i-ésima unidad en una muestra
9A.6 y siguientes) para desarrollar métodos prácticos de muestreo específica de tamaño n donde tf puede tomar cualquiera de los valo
con probabilidades desiguales sin restitución. res 0, 1,2, . . . , n. Consideremos la distribución de frecuencia con
junta de los t¡ para todas las N unidades de la población.
9A.3 SE LE C C IO N C O N P R O B A B IL ID A D E S El método de extraer la muestra equivale al problema estándar
de probabilidad en el cual se colocan n bolas en N cajas, y la proba
D E S IG U A L E S Y C O N R E S T IT U C IO N
bilidad de que una bola determinada vaya a la caja i-ésima es igual
Sea Aí¡/M„ la probablidad con que se ha elegido la i-ésima unidad a z¡ en cada colocación. En consecuencia, la distribución conjunta
de los U es la expresión multinomial
y con restitución, donde M 0 = X Aí¿- Ahora mostraremos que la siguien
te es una estimación insesgada del total de población Y. n- , , ,
Z l ' Z 2h . . . Z N‘"
Y = — ( y, + y2+ - • -+ y K) Para la multinomial, son bien conocidas las siguientes propiedades

n
de la distribución de los números t¡
- M0 (m edia de las medias por elemento de las
unidades) (9 A .5 ) E (tl) = nz¡, V(t,) = nzi( l - z l), Cov (/,/,) = -nz¡z¡ (9A.9)
Para su comparación con métodos subsecuentes, denotaremos, esta Teorema 9A.1. Si una muestra de n unidades se extrae con las
probabilidades z¡ y con restitución, entonces
estimación por medio de Ypps. Además
(9A.6) Yppz ¿ “T
n i-i <9 A 1 °)
314 TE C N IC A S DE M U ES TRE O
M U ESTREO CONGLOM ERAD O DE U N A E T A P A : CONGLOMERADOS . . . 315
es una estimación insesgada de Y con varianza

Teorema 9A.2. Si se extrae una muestra de n unidades, con pro
babilidad proporcional a z¡ con restitución, para cualquier n > 1, la
U ( f ppí) = ^ I (9A.11)
«l-l Vi ' siguiente es una estimación muestral insesgada de V'(f'ppJ ,
Prueba. Podemos escribir
v(Y ppz) = £ ( J - YppX / n(n —1) (9A.16)
i = l \z¡ / /
pp n\ z¡ z2 > ZS J z, Prueba. Por la identidad algebraica usual

donde la suma se extiende a todas las unidades de la población. En
muestreo repetido, las son variables aleatorias, en tanto que los i (* ' i ( f - v )’ - « ( V - Y f (9A-17)
y¡ y los z¡ son un conjunto de números fijos. Por lo tanto, ya que
de modo que por (9 A .1 6 )
E ( t ¡ ) = nzi por (9 A .9 ),
£ [n (n - l)u (Y ppJ ] = £ £ ( ^ - y V - i . V( Y ^ ) (9A.18)
E ( Y ^ ) = l ; Z ( n z i) f = Í y i = Y i - l \z, /
n ¡mi Z, | .|
por la definición de V (fj,p2). Al introducir las variables t¡, obtenemos

de modo que Yppz es insesgada. También
n(n - l ) £ [ u ( f PPj)] = £ I t¡(—~ Y ^ ~ n V (Y ppz)

/-i xz¡ '
m + 2 , ? „ í S f c ° v(w' )] <9ai2)
=" I z l ^ - Y Í - n V ( Y „ t)
i = l xz¡ J
= n ( n - l ) V ( í ppz) (9A.19)
al usar (9 A .1 1 ) en el Teorema 9A.1. Esto terminala prueba.

- K i . f ' - n w
Ya queYpp2es la media de los n valores y¡/z{, la Fórmula (9 A .16)
dado que £ z¡ = 1. Esto completa la prueba. toma una forma muy simple.
Al tomar z¡ = M¡/M0 en el Teorema 9A.1 se obtienen los corres Cuando la selección es estrictamente proporcional al tamaño (esto
pondientes resultados para muestreo con probabilidad proporcional es z¡ = M ¡/M „) los Teoremas 9A.1 y 9A.2, se expresan como sigue.
al tamaño.
Teorema 9A.3. Si se extrae una muestra de n unidades con pro
Puede darse otra expresión para V (Y ppz). A partir de (9 A .13),
babilidades al tamaño z¡ «= M¡/M0 y con restitución
N v ,2f 1 - 2 - 1 n N
n V (Y „ z) = I l I y,y, (9A.14)
i= I z¡ ¡= 1;>¡ C n= V \M¡/
£ f e )« = ¡=i
V Z (y/) = M 0y (9A.20)
Como (1 - z , ) es igual a la suma de todos los Zj restantes de la
donde y es la media no ponderada de las medias de unidades, es una
población, el coeficiente de yr/z¡ en (9 A .1 4 ) contiene un término
estimación insesgada de Y con varianza
z, para cada j =f= i. De manera semejante, el coeficiente d eyf/z¡ con
tiene un término Zj. Por lo tanto,
0 = 7n Í¡=iW r f ) 2 (9A.21)
Estos resultados provienen del Teorema 9A.1, dado que y, = y¡/M¡ y

? = Y/Ma.
Teorema 9A.4. En las condiciones del Teorema 9A.3, una esti

mación muestral insesgada de V (Y pps) es
M U E S TR E O CONGLOM ERADO DE U N A E T A P A : C O N G L O M E R A D O S ... 317
No existe una regla simple para decidir cuál es la más exacta.

v(Y pps) = M 2 Í ( f , - y ) 2/ n ( n - l ) (9A.22) El resultado depende de la relación entre y, y Aí¡ y de la varianza
i-1
de y¡ como función de M¡. La situación favorable a las estimacio
El resultado se obtiene por sustitución de z¡ = M¡/M0 en (9 A .1 6 ), nes de razón y pps es aquella en que y, no esté relacionada con M¡. La
dado que y¡ = y,/M, y otra vez YpPZ = M 0y. situación favorable a Yu es aquella en que el total de unidad no
esté relacionado con Mi.
Para guiarse en la elección, pueden expresar las varianzas de
9A.4 L A M E D ID A O P T IM A D E L T A M A Ñ O las tres estimaciones en una forma comparable. Suponemos que
N
En los casos donde la medida del tamaño M/ es una estimación ( N - l ) = N y escribimos £ (y , - V )2= I ( y ¡ - Y ) 2/N. También suponemos
de lo grande de la unidad, la siguiente es una pregunta de interés que el sesgo YR es despreciable.
para nosotros: ¿cuál es la medida del tamaño que minimiza la va
Para Yu tenemos, a partir de (9 A .2 ),
rianza de Ypp. ?
^ n V ( Yu) = N \ 1- f )E (y , - Y )2 = (1 -f)E (N y , - Y )2 (9A.23)
Ahora bien, Va) Para YR, y a partir de (9 A .4 ),
n V (Y R) = N 2( 1 - f )E M 2(y¡ - Y )2= (1 - f ) ^ f ( M 0yt " Y )2

Esta expresión se anula si z¡ <x y*: es decir, si z¡ =y¡/Y. Si los y¡
son todos positivos, el conjunto de z¡ es un conjunto aceptable de (9A.24)
probabilidades. De modo que las mejores medidas del tamaño son
donde M = l M i/N = M 0/N.
números proporcionales a los totales de atributos y¡ para las unidades.
Este resultado no es de una aplicación práctica directa; si los y* De (9 A .2 1 ), para Ypps,
se conocen de antemano para toda la población, sería innecesaria la
muestra. El resultado sugiere que si los y¡ son relativamente estables n V (Y pp¡) = NMoEM,(y, - Y )2= ^ ( ^ ( y , - Y )2
en el transcurso del tiempo, los valores previos más recientemente
disponibles de y, podrían ser las mejores medidas del tamaño para
= £ 0 | )(A / oy , - Y ) 2 (9A.25)
este atributo. En la práctica, claro está, debe usarse una sola medida
del tamaño para todos los atributos al seleccionar la muestra. Si se
De (9 A .2 3 ), (9 A .24 ), (9 A .2 5 ) concluimos que V (Y U) depende
puede elegir entre diferentes medidas del tamaño, podemos esperar
de la exactitud de las cantidades Ny¡ = NM¡y¡ como estimaciones de
que la mejor sea la más cercana a la proporcionalidad respecto a los
Y, en tanto que V (Y R)y V { Y m ) dependen de la exactitud de las canti
totales de unidades de los atributos principales.
dades = M 0y,/M, como estimaciones de Y. Si y, no está relacio
nada con M i, esperamos que M 0y,- sea más exacta que NM¡y¡, y la
9A.5 E X A C T IT U D E S R E L A T IV A S situación inversa, si y i no está relacionada con M¡.
D E L A S TRES T E C N IC A S En cuanto a YR y Ypps¡ observamos que, por (9 A .24 ) y (9 A .2 5 ),
la expresión V{YR) otorga un peso relativamente mayor a las unida
En esta sección comparamos las exactitudes de las tres técnicas des grandes que V (Ypps). Nótese también que Y„ y YR se benefician
precedentes para estimar el total de población, con unidades que son del término cpf, que puede ser sustancial en estratos pequeños (co
conglomerados de tamaños desiguales (suponiendo que se conocen mo, por ejemplo, con v.h = 2, N* = 10). Este aspecto ha estimulado
los M i si la técnica los requiere). el desarrollo de la selección con probabilidades desiguales sin resti
tución. Desde luego, la Fórmula (9 A .2 4 ) para YR, sólo es válida en
1. Selección: probabilidades iguales. Estimación: Yu.
muestras grandes.
2. Selección: probabilidades iguales. Estimación: YR. Se han realizado nuevas comparaciones entre los métodos a par
tir de un modelo de población infinta por Cochran, segunda Ed.,
3. Selección: probabilidad « tamaño. Estimación; Ypp¡.
318 TE C N IC A S DE M U ESTRE O M U E S TR E O C O N GLOM ERAD O DE U N A F .TAPA: CONGLOMERADOS 319
Des Raj (1954-1958), Yates (1 9 6 0 ), Zarcovic (1 9 6 0 ) y Foreman y

Brevver (1971). La mayoría de los autores suponen que la población ^ = «® + c E (M / ) (9A.32)
finita es una muestra aleatoria de una suprapoblación infinita en
la que
= - ~ ^ r i ) + c M E ( M r l) (9A.33)
y, = a + fiM, + e,; E(e, |AÍ) = 0 (9A.26)
lo que se espera aproxime la relación vigente en muchas encuestas. Considérese primero a = 0, caso en el que y, no está relacionada
Es necesario hacer algún supuesto respecto a la varianza de e¡ en con M i. Es claro que
conglomerados de un tamaño dado. VR < V U
De (9 .1 2 ) en la Sec. 9.4 obtenemos, al dividir por (TV—1) = N , Si fi (que en este caso se convierte en f ) es grande, la superioridad
de la estimación de razón puede ser considerable. Con a = 0,
V (e,)=
VPPs<V u para g^l
Como unaaproximación esto sugiere que V ( e ¡ ) = cM ¡L donde
1 < g < 2 en la mayoría de las aplicaciones. Delmodelo(9 A .26 ) Estas desigualdades son válidas porque la covarianza de M ¡ y
es positiva si g > 1 y nula si g = 1, de modo que con g > 1.
se obtiene
E ( M ñ = E [(Af,)(Af*-*)] ^ M E ( M r ')
Y = a +p M + é„: * = (9 A-27>
Si p = 0 y a zjkQ, por lo tanto, el total de unidad y{ no está
relacionado con M¡, Yu siempre es superior a YR y también a Ym
Suponemos que aquí éN; esto se reduce a ignorar la cpf.
salvo, posiblemente, en el caso poco verosímil de que g = 2 con
Se infiere que, P - 0.
Cuando ni a ni p se anulan, los comportamientos relativos de
Yu Yr , Ypp, dependen de las magnitudes relativas de la| y \p\. Por
= E(y( - Y )2 = E[/3(Mi - M ) + e ,f
ejemplo, YR supera Yu si p- > a"/M2, como señalaron Foreman y
= p 2 V (M l)+ c E (M * ) (9A.28) Brewer (1971).
En lo que respecta a Vs contra Vr¡,„ los coeficientes de tP son
EM,2(y, - f )2= E(y¡ aproximadamente los mismos en V„ y V^,,. De los términos en c,
V„,s < V* en el caso g > 1 que es de esperarse se aplique en casi
todas las situaciones que tienen p diferente de 0, en tanto que
= E [ a ( l - M J M ) -f-e,]2= — + c E (M ') (9A.29) Vws > VK si g < 1.
Ai
Los resultados de este modelo concuerdan con las conclusiones
= MEM,K - t)> - +¿ -]J antes sugeridas en esta sección. Si y¡ no presenta o sólo presenta
una tendencia moderada al aumentar M ¡, el método de razón con
probabilidades iguales y el método pps (probabilidades proporcio
= C,2E{ {MMíÑ ~\ + v Ñ E { M r l ) - - 2^ T - + c M E ( M r ') (9A.30) nales al tamaño) son más precisos que la estimación insesgada
con probabilidades iguales, y de hecho, pueden ser mucho más pre
Por lo tanto, las varianzas aproximadamente comparables en cisos. í"u es superior si el total de unidad y¡ no se encuentra
este modelo son relacionado con Mi. Hay menos amplitud de elección entre las es
timaciones de la razón y las de pps como esperamos que g se encuen
^ = 0 2V(M ,) + cE(M;*) (9A.31) tre entre 1 y 2, la estimación pps suele ser más precisa y sus
resultados no se restringen a muestras grandes.
M U ESTREO CONG LO M ERAD O DE UNA ETAPA: CO NG LO M ERAD O S . . . 321
Las estimaciones Yu y YR se benefician con el término cpf, 0.3 y 0.4, se obtuvo que los z¡' valen 0.1173, 0.2206, 0.3042 y
cuando éste es apreciable. Anticipándonos a trabajos posteriores 0.3579.
(Sec. 9A.12), la evidencia sugiere que los mejores métodos j rps sin Se han usado tres métodos para tratar con esta distorsión de las
probabilidades de selección que se piensan usar. Uno de ellos con
restitución se benefician aproximadamente con la misma cantidad
siste en retener el método natural de selección de muestra prece
del término cpf, como lo que beneficia al muestreo equiprobabilista.
dente, pero con cambios apropiados en el método de estimación del
total de población. Otro es utilizar un método diferente al de selección
9A.6 M U E S T R E O C O N P R O B A B IL ID A D E S de muestra, que conserva ir¡ = nzt sujeto a ciertas restricciones en los
D E S IG U A L E S S IN R E S T IT U C IO N valores de nz,. Otro más, consiste en aceptar cierta distorsión de
las probabilidades, si esto presenta ventajas compensatorias (por
Una parte importante de este trabajo se realizó para extensas ejemplo, una mayor sencillez o generalidad). En la Sec. 9A.8 y
encuestas, en las que las unidades Conglomeradas se estratificaron sigs., se dan ejemplos de estos tres métodos.
según otro principio (p or ejemplo, situación geográfica) en un Primero, presentamos la estimación general del total de pobla
número sustancial de estratos relativamente pequeños, al haberse ción, más conocida, para muestreo con probabilidades desiguales sin
extraído, tan sólo un pequeño número de unidades conglomerados restitución.
de cada estrato. El caso nh = 2 que proporciona un grado de liber
tad de cada estrato para estimaciones de errores de muestreo, es de
9A.7 E L E ST IM A D O R DE H O R V IT Z-T H O M P S O N
particular interés.
Supongamos que se van a extraer dos unidades de un estrato.
Se selecciona una muestra de n unidades sin restitución por al
La primera se extrae con probabilidades z¡, proporcionales a alguna
gún método. Sea
medida del tamaño. Sea la i-ésima unidad la que se selecciona. Si
seguimos el método más natural en la segunda extracción, se selec tt¡ = probabilidad de que la i-ésima unidad esté en la muestra.
ciona una de las unidades restantes con probabilidades asignadas tu = probabilidad de que la i-ésima y j-ésima unidades estén
z ,/ (l — z¡). De modo que la probabilidad total tt¡ de elegir la i-ésima ambas en la muestra.
unidad, ya sea en la primera o en la segunda extracción es
Son válidas las relaciones siguientes:
m = z , +;>e ¡ (71 r- eZ ry ) r z( V 1 + £ t1 -^Z /) <9A-34) í tt¡ = n,Z •"//- ( n - l)ir¡, £ I irv = \n(n - 1) (9A.36)
■ i*¡ > i>¡
= z ,(l + (9A.35) Para establecer la segunda relación llamemos P ( s ) a la probabilidad
de una muestra que consiste en n unidades especificadas. Entonces
donde A = 2 z,/( 1 - z ¡) tomada sobre todas las N unidades. tÍ í ¡ = 2 P (s ) sobre todas las muestras que contienen las unidades
i-ésima y j-ésima, y tr* = 2 P ( s ) sobre todas las muestras que con
Supongamos que 7r¡ - 2z¡, al quedar proporcionales las proba
tienen la i-ésima unidad. Cuando tomamos para j i, cada
bilidades relativas de selección respecto a la medida de tamaño z¡.
P (s ), para una muestra que contenga la i-ésima unidad se cuenta
El estimador simple que introdujeron Horvitz y Thompson (1952),
(n - 1) veces en la suma, puesto que hay otros (n — 1 ) valores de
j en la muestra. Esto prueba la segunda relación. La tercera relación
/ rr¡ L ¡ z¡ se deduce de la segunda.
El estimador de Horvitz-Thcmpson (1 9 5 2 ) del total de pobla
tendrá entonces varianza nula si los z¡ son proporcionales a los y,,
dado que z¡ = y J Y y cada unidad seleccionada dará la estimación ción es
correcta y-JzK= Y. Sin embargo, en (9 A .35 ), las cantidades
Y ht = Í - (9A.37)
z¡' - tt¡/2 están siempre más cerca de la igualdad que los z¡ origi ¡ ni
nales, a causa del segundo factor en (9A.35). En el ejemplo que
donde y-, es la medición para la i-ésima unidad.
dieron Yates y Grundy (1 9 5 3 ), con N = 4, n = 2, z¡ = 0.1, 0.2,
M U ESTRE O CO NGLOM ERAD O DE U N A E T A P A : CONGLOMERADOS . 323
Teorema 9A.5. Si n¡ > 0, ( i — 1, 2, . . N) , De modo que
V(V7rr) = Xi />,
X ( ^ / - ^ ) [L('77,/
~ ) 2+ ('77//
A )2-2~ A7/J
77/ 7 ]
« 77,
es un estimador insesgado de Y, con varianza

= X X (77/77/- 7r//)(— - 2 (9A.42)
i />( 77/77/7
V (Y h t)= X +2 I I (9A.38) Corolario. A partir de (9 A .4 1 ), al usar el método t¡, se ve que
/«I Vi TTÛjf
un estimador Y ^ Y ^ - ) insesgado de muestra es
donde tt,/ es la probabilidad de que estén en la muestra las unidades
z-ésima y ;-ésima. , . A (1 77/) 2 " " (77// -77/77,)
í’i( Yht) ~ X 2— y. + 2 X X — y¡yi (9A.43)
-
i IT i i y>í TTfTTjTT^j
Prueba. Sea U ( i =■ 1, 2, . . N ) una variable aleatoria que a condición de que ninguno de los ir,,- de la población sea nulo.
toma el valor 1 si se extrae la z-ésima unidad y el valor cero en el
Yates y Grundy (1 9 5 3 ) así como Sen (1 9 5 3 ) han dado un es
otro caso. Entonces, t, sigue una distribución binomial para una
timador de muestra diferente. De (9 A .4 2 ), este estimador es
muestra de tamaño 1 con probabilidad ^¡. Por lo tanto,
£ ( /,) = 77,, V'(fj) = 77,(1 —77,) (9 A .3 9 )

a a p ¿ (a ._ iV (9A.44)
i />i 77// '77/ 77//
El valor de Cov (t ¡t ¡) también se necesita. Dado que t tt¡ es 1, sólo si con la misma restricción sobre las 7r¡/.
las dos unidades aparecen en la muestra, Como los términos (*-¡77/ — irfy) suelen variar considerablemente
y a veces son negativos, iq y v, tienden a ser cantidades inestables.
C o v (t,tj) = E {titi) - E ( t i)E {t¡) = tr¡, - 7r,77; (9 A .40)
Ambos estimadores pueden tomar valores negativos para ciertos
Luego, al considerar z/¡ fija y las í¡ como variables aleatorias, métodos de selección de muestra. Rao y Singh (1 97 3) compararon
los coeficientesde variación de vx y v¡ en muestras de n - 2 , a par
tir de 34pequeñas poblaciones naturales que encontraron en
£ ( í -h t ) = e ( z * * ) « X y, = Y
ví - i rr¡J j-i textos y artículos sobre encuestas por muestreo, al utilizar el método
de selección de muestra de Brewer (Sec. 9A. 8 ) para el cual t s - 2z 4
V( í-«r)=Z ( - V Y ( 0 +2 z í - Cov (vy) como se deseaba. El estimador vt si era considerablemente más
, 77, , ;>¡77j 77,
estable y siempre mayor que 0 para este método, mientras que
v¡ tomaba frecuentemente valores negativos.
g L^ - ^ / ) y<yy (9A41)
¡ 77,- ,' />, 77,77/ Ahora veremos los métodos de selección de muestra. La biblio
grafía por Brewer y Hanif (1 9 6 9 ) menciona más de 30, de los
Esto termina la prueba. cuales describiremos 4. La mayoría de los métodos se complican
uniformemente al crecer n por arriba de 2 , aunque algunos se ex
Esta varianza se puede expresar en otra forma, al usar las dos tienden con bastante facilidad. En la presentación nos fijaremos
primeras relaciones de (9 A .36 ). Se tiene principalmente en el caso n = 2 , por su sencillez y porque es la si
tuación común en encuestas nacionales que usan numerosos estra
X (Vi, ~ Tr.irj) = ( n - 1)77/ - 7r¡(n - 77,) = - 7 7 ,(1 - n,] tos pequeños con ti» = 2 .
i*i
Al sustituir (1 - tt( ) en el primer término de (9A.41).

DA.8 EL M ETODO DE BREW ER
g fic a lr f- g i < »,,- ,,)(* )’ - ! i Para n - 2, este método de selección de muestra conserva
/ 7T, , '77,/ , />, LV77// '77}/ J
7r¡ = 2z, y utiliza el estimador de Horvitz-Thompson
324 TE C NIC AS DE M U ESTRE O M U ESTRE O CO NGLOM ERAD O DE U N A E T A P A : CONGLOMERADOS . . . 325
?„-a+zu Un+y¡\
Vi v¡ 2 \zi z¡J
En este caso, el divisor de las proporciones es
Con diferentes enfoques los métodos producidos por Brewer (1 9 6 3 ), | - £ £ +f ( i V 1 +l (9a49)

Rao (1965) y Durbin (196 7) dieron todos los mismos valores de Por lo tanto, el divisor es igual a 2D en el método de Brewer (9A.45).
tr¡ y na. Suponemos que cada z f < 1/2. La probabilidad de que se extraiga en primer lugar la unidad i-ésima
Brewer extrae la primera unidad con lo que él llama probabili y en segundo la ;-ésima es, por tanto,
dades proporcionales revisadas a z ¡ ( l — z ¡ ) / ( l — 2z¡), y la segunda
unidad con probabilidades z ¡ / ( l - z<) donde j es la unidad extraída
<9A-50)
primeramente. El divisor necesario para convertir las z ¡ ( l - z ¡)/
(1 — 2zt) en probabilidades reales es su suma Por simetría, esto iguala P ( j ) P ( i ! j ) , de modo que las de Durbin
son las mismas que las de Brewer en (9 A .47 ).
f z ,(l-* ) 1 £ z,(2-2z¡) 1/ * z, \
Sampford (1 96 7) ha extendido este método a muestras de ta
D ~ .l 1 - 2 zt " 2 , ? , ^ 2 Í “ - 2 l 1 + ? T 3 2 í J (9A45)
maño n, siempre que nz¡ < 1 para todas las unidades de la pobla
Con n = 2 la probabilidad de que se extraiga la i-ésima unidad, ción. Con este método de selección de muestra, la probabilidad de
es la suma de las probabilidades de ser extraída en primero y se que la muestra consista por ejemplo en las unidades 1, 2, . . . . n
gundo lugar. Así es una extensión natural de (9 A .4 7 ), y es proporcional a
z , ( l - z , ) , 1 n z, ( l - z , ) z,
írl r-,/i - \ r-> L
D ( l - 2 z t) ' D f a d - l z , ) (1 - z ,)
1- I z¡) ñ i j ñ (1 -n z ,) (9A.51)
i-l / 1-1 1 i- 1
Para este método, puede mostrarse que n> = nz¡. Se da una fórmula
- § ( ' +| , - 2* <9A46> para con ciertas instrucciones para su cálculo por computadora.
El estimador H T para Y se usa de modo que hay fórmulas para su
al escribir ( 9A.45) por D. De manera semejante, varianza y varianza estimada. El estimador de Yates-Grundy v 2 en
„ -£ !flY — i— + — I— \ = 2z¿z¿ — (1 - 2j - Zj)__ (9 A .44 ) es siempre positivo. Sampford ha sugerido varios métodos
“ D \ \ - 2 zí 1 -2 z j D (1 —2 zj)(l-2 zy) ( 9‘ ’ para extraer la muestra de modo que se satisfaga (9 A .51 ). Uno de
ellos es la extracción de la primera unidad con probabilidades
Corno este método utiliza la estimación H T (Horvitz-Thompson), de z¡, y todas las unidades subsecuentes con probabilidades propor
el Teorema 9A.5 y su corolario proporcionan fórmulas para la va- cionales a z , / ( l — n z ,) con restitución. Si se obtiene una muestra
rlanza y varianza estimada de YB. con n unidades distintas, se acepta. Pero se desecha cualquier intento
El método tiene dos propiedades deseables. Brewer (1 9 6 3 ) mos- de obtención de muestra cuando por segunda vez aparece una uni
iró que su varianza siempre es menor que la de la estimación Yppz dad. Este método conduce a (9 A .5 1 ). Para dar una idea de su
en muestreo sin restitución. En segundo lugar, con un poco de álge rapidez, se presenta una fórmula del número esperado de intentos
bra, Rao (1 96 5) muestra que (v (k ¡ — irif ) > 0 para todo i^ = j , por necesarios para obtener una muestra.
lo tanto, la estimación de Yates-Grundy para v 2 de la varianza es Para n = 2 el método de Durbin (1 9 6 7 ) de extracción de la
siempre positiva. muestra a diferencia del método de Brewer, tiene la propiedad
El método de Durbin (1 96 7) extrae la primera unidad ( i ) con de que la probabilidad incondicional de extraer la unidad i es z¡
probabilidad z¡. Si la unidad i se extrajo primeramente, la probabi tanto en la primera como en la segunda extracción. En muestreo
lidad de que la unidad j se extraiga en segundo lugar se hace pro de varias etapas para encuestas repetidas a intervalos regulares,
porcional a Felligi (1 96 3) señaló que es necesario o aconsejable dejar unidades
fuera y reemplazarlas ocasionalmente según un procedimiento re
gular llamado esquema de rotación, debido a lo poco conveniente
4 < r h +(T ^ > ] <9A-48> que son los interrogatorios prolongados de las mismas personas. Este
326 TE C N IC A S DE M U ESTRE O M U E S TR E O CONGLOM ERADO D E U N A E T A P A : C O N G L O M E R A D O S ... 327
autor produjo un método de selección de unidades sucesivas que tam etc. para n > 3, luego,cuando sumamos 2 P (s ) YMsoore todas las
bién posee la propiedad de Durbin. Su método, basado en cálculos
muestras de tamaño n, el coeficiente de y i en la sumaes1, demodo
repetidos, es semejante al de Brewer-Durbin, pero tiene valores li
geramente diferentes de las ?riy-, que
E (Y M) = l P ( s ) Y M = l y ^ Y (9A.53)
i
9A.9 E L M E T O D O DE M U R T H Y
Murthy (1 95 7) ha dado expresiones generales para V (Y M) y v ( Y M)
Este método utiliza la primera técnica de selección sugerida para cualquier n.
(Sec. 9A.6) al extraer las unidades sucesivas con probabilidades
Cuando n = 2, la muestra que consiste en lasunidades i y j,
z ¡> z;/( 1 - z¡)> z* / (l - z¡ - Z j) y así sucesivamente. El estimador
deMurthy (1 95 7) se apoya en trabajos anteriores debidos a Des Raj
P M O -I r * ¿i
-; f í J l / ) “ 1T TZ¡7 <9 A 5 4 >
(1956a), que produjo estimaciones insesgadas de una manera in
geniosa, al basarse en el orden específico en que se extraen las n P(s) = 7Tij = ZiPislO + ZfPÜ li) = Z iZ j (2 —Zi —Z;)/(l - Z¡)( 1- z¡) (9A.55)
unidades de la muestra. Murthy mostró que correspondiendo a cual
quier estimación ordenada de esta clase, podemos construir una Por lo tanto, la estimación es, al usar (9 A .5 2 ), (9 A .54 ) y (9 A .55 ),
estimación no ordenada que también es insesgada y presenta
una varianza más baja. Ym = . ■ ~ - f ( l - z/ ) 7 + ( l - zi)^ 1 (9A.56)
Z — Z¡ — Zy L Z( Z¡ J
Su estimador propuesto es
Por definición V (V M) es (para n = 2 )
ÍW )y ,
I P(s)Y M2- y 2= I I Zn ,(2 ~ Z; ~ Z’l Ym2- Y2 (9A.57)
j ¡ ¡>¡ D —z ¡)(i z¡)
*M = ±1 W (9A'52)
Después de sustituir YM2 según (9 A .56 ) y Y- y rearreglando términos,
donde
encontramos
P (s ¡i) = probabilidad condicional de obtener el conjunto de uni
dades extraído, dado que se sacó la i-ésima unidad en V (V m ) = I I --^ -1- - 2‘ ~ Z/)( - - ^ ) 2 (9A.58)
i i> l l Zi~Zj \z¡ Zj/
prim er lugar
Al comparar con V (Y ppI) para muéstreos con restitución, Fórmula
P ( s ) = probabilidad incondicional de obtener el conjunto de
(9 A .15 ), claramente V {Y M) < V ( Y ppz).
unidades extraído.
Dado que para cualquier v(Y M) propuesta su promedio es 2 P ( s )
Ahora probamos que la estimación Ym es insesgada. Para cual v {Ym), la siguiente es una estimación muestral insesgada de la va
quier unidad i de la población, l P ( s } i ) = 1, suma tomada sobre rianza para n = 2
todas las muestras en las que se tiene la i-ésima unidad en primer lu
gar. Para mostrar esto en el caso n = 2, donde j es la otra unidad
de la muestra (9A-59>
N que siempre es positiva.
z lz >
P (,| i)= — Í - ; 2 p (í |,) = i ü _ =1 La fórmula correspondiente para muestras de tamaño n es
r i - z¡
Para n = 3 con j y fe siendo las unidades segunda y tercera, ¿ [P(^)P(5|¿,/)-P(5|/)P(5|/)]z,z/^-^)2) (9A.60)
[< t-rij 1 / ¡>¡ yz¡ z¡> >
donde P(s\ ij) es la probabilidad condicional de obtener la muestra,
dado que se eligieron las unidades i y j (en cualquier orden) en
M U E S TR E O CO NGLOM ERAD O DE U N A E T A P A : C O N G L O M E R A D O S ... 329
las dos primeras extracciones. Bayless (1 9 6 8 ) ha dado un programa Si nzi < 1 (es decir, n M / < M 0' ) para todo i, cualquier unidad
para computadora que calcula las P ( s f i ) y las P(s\ ij). tiene probabilidad nz¡ de selección, y ninguna unidad se selecciona
dos veces o más. Por ejemplo, la unidad 5 es elegida si 4 < r < 15,
lo que da probabilidad 12/30 = 3z5. Si nz¡ > 1 para una o más
9A.10 M ETO DO S R E L A C IO N A D O S
unidades, tales unidades se pueden seleccionar inás de una vez en
CO N E L M U E ST R E O SIS T E M A T IC O
la muestra, pero la frecuencia ■promedio de selección es 7r{ = nzs.
Esto ocurre en el ejemplo para la unidad 3, ya que 3M/ = 33 >
En un método sugerido por Madow (1 9 4 9 ), que como señala
30 = Aí0'. La unidad 3 se elige una vez si 1 < r < 12 o 16 < r < 30
Murthy (1 96 7) se utilizó en encuestas en la India, tenemos una
(en todas las 27 elecciones) y dos veces si 13 < r < 15 (3 eleccio
extensión del muestreo sistemático. Sus ventajas son que la mues
nes). La frecuencia promedio de selección es ( I X 2 7 + 2 X 3 ) /
tra fácilmente se extrae para cualquier n, el método conserva ir¡ — nz¡,
30 = 33/30 = 3za.
y proporciona una estimación insesgada de Y. Además, la persona
que construye la muestra puede en ocasiones poseer un conocimiento Se deduce que
anticipado, que le permita arreglar aproximadamente las unidades
en un orden para el cual el muestreo sistemático da buenos resul <9 A -61>
sys 7 n¡ n 7 zf
tados. Una desventaja del método sistemático es, como de costumbre,
la ausencia de una u(í"lyJ) insesgada. es una estimación insesgada de Y.
Se puede extraer una muestra de tamaño n, al usar los z{ o las Hartley y Rao (1 9 6 2 ) examinaron este método con las unidades
medidas de tamaño M ¡' de las cuales se derivaron los z< = Aí¡7 en orden aleatorio. Con la restricción nz¡ < 1 , (todo i ) , obtuvieron
>:AÍ/ - M//M/. Si se usan los Ai/, se forma una columna de totales oxnresiones aDroximadas o ara Vi Y....) v u( Ysw).
cumulativos T , de las cantidades nM/. De esta columna, dentro del
Intervalo 1 a nM,/, se asigna un intervalo de tamaño nM/ a la unidad
i Para la selección de muestra, se extrae un número aleatorio r en- 9A.1I E L M E TO D O D E R A O , H A R T L E Y , CO C H R A N
iro I y M./ y se seleccionan las n unidades paralasque el intervalo
asignado incluye los números r, r + M 0', .. . , r + (n - 1)AÍ0'. Para una muestra de tamaño n , este método comienza al cons
Este método se ilustra con los datos de la Sec. 9A.2 y con N = 7. tituir n grupos aleatorios de unidades, se debe elegir una unidad
Estamos suponiendo n = 3. Al formar los T¡ y los intervalos asig de cada grupo. Los números de unidades N a, N 2, en los
nados, se saca un número aleatorio entre 1 y Aí0 =■ 30, digamos grupos respectivos se pueden elegir de antemano: veremos que esto
r - 17, Las unidades elegidas son las que tienen como intervalos es ventajoso para hacer los N , lo más iguales posible. Si Z„ es la
asignados los que incluyen los números 17, 47, 77, es decir, las uni medida total del tamaño para el grupo g, la i-ésima unidad del grupo
dades 3. 4, 6. recibe una probabilidad de selección Zi/Z,. La estimación del total
de población, Rao, Harüey y Cochran (1 96 2) es
Tamaño Intervalo Unidades
Unidad M/ T, = 3 v M/ Asignado Seleccionadas * r h c = 1 Z f ^ = Z ?s (9A.62)
g-l ZS 8=3
1 3 9 1-9 donde y,, z, se refieren a la unidad extraída del grupo g.
2 1 12 10-12
3 11 45 13-45 17 (unidad 3) Como los Z, no serán iguales, este método no conseiva las pro
4 6 63 46-63 47 (unidad 4) babilidades de selección proporcionales a los tamaños y hay eviden
5 4 75 64-75 cia parcial de que este estimador padece de una pequeña impre
6 2 81 76-81 77 (unidad 6) cisión. Sus ventajas estriban en su sencillez y generalidad.
7 3 90 82-90
Al desarrollar V 'C f W ) promediamos en dos etapas. La etapa
M0' = 30 1, es la aleatorización en grupos y la etapa 2, la selección de una
unidad dentro de cada grupo. Para cualquier división específica en
330 TE C N IC A S DE M U E S TR E O M U E S TR E O C O N GLOM ERAD O D E U N A E T A P A : CO N G LO M ER AD O S. 33 1
grupos, Yt en (9 A .6 2 ) es un estimador insesgado del total de grupo Un estimador insesgado de la varianza es

Yg, y por lo tanto, E ¡( YRHC) - Y. En el Cap. 10 se demuestra una
fórmula bien conocida, para encontrar una varianza sobre dos etapas
( i n .2- . " ) , „
de muestreo, que es
r I (9A.68)
V ( W ) = E ,[V 2( ^ hc)]+ V',[£'2( Yrhc)] (10.2) ( n 2- i Ng2] * " *
v *-i >
Como E j ( 1 W ) = Y y es constante, tiene varianza nula, y el se
con N - nR + fe, y fe grupos de tamaño ( R + 1 ), la Fórmula
gundo término en ( 10 .2 ) se anuía en esta aplicación,
(9 A.6 8 ) viene a ser
Para V .(Í' rhc ) podemos usar, dentro de un grupo, la fórmula
de la varianza para muestreo con restitución, dado que sólo se rv ' N 2+ k ( n - k ) - Ñ n " ^ (y K V-
t,( Y* H c ) - N 2(n _ l ) _ k (n _ k ) Z Z g[ Zí W j (9A.69)
selecciona una unidad en cada grupo. Dentro de un grupo, las
probabilidades de selección son z¡/Z¡,. Por (9 A . 15), de la Sec. 9 A.3,
obtenemos para cualquier división específica (con n„ *• 1 ),
9A.12 C O M P A R A C IO N E S N U M E R IC A S
(9A.63) En la literatura se encuentran comparaciones de los comporta
mientos de algunos de los métodos, particularmente por Rao y
tomada sobre pares de unidades del grupo g. Sobre el conjunto de
Bayless (1969, 1970), en tres situaciones: ( c ) en poblaciones
subdivisiones aleatorias en grupos, la probabilidad de que cualquier
artificiales pequeñas [por ejemplo, las poblaciones con N = 4, n = 2
par de unidades caiga en el grupo g_ es N „(N „ — 1 )/ N (N — 1 ). Por
construidas por Yates y Grundy(1 9 5 3 )], ( b ) en el modelo de regre
lo tanto, el valor promedio de V2( Ys ) sobre la aleatorización es
sión lineal usado en la Sec. ¿A. 5, y ( c ) en 20 poblaciones natu
i . * ) (9^ > rales.
Aquí se comparan siete métodos en tres poblaciones artificiales
con N = 5, n - 2. Los tamaños relativos z* de las unidades son los
a partir de (9A.63), Como f RHc ~ I ? , ,
mismos en las tres poblaciones A, B y C (Tabla 9A.1). En A, la media
por elemento que es proporcional a í/í/z¡ no se encuentra correlacio
( l ^ ) / Ny 7 X " ( I ^ - n )
nada con Zi. En B, la media por elemento se eleva al aumentar los
tamaños. En C, los totales de unidad tienen poca relación con los ta
maños.
En esta forma, V (Y RHC) es simplemente un múltiple de la varianza
de la estimación Y ^ en muestreo con restitución. Si N/n es entero, Los planes se comparan como sigue.
la elección N , — N / n minimiza el multiplicador. En este caso
1. El muestreo aleatorio simple de las unidades (probabilidad
igual). Estimación: YSKS= Ñy.
V ( VW c) = (1 y ) V ( YppI) (9A.66)
TABLA 9A.1. Tres P e q u e ñ a s P o b l a c io n e s A b t ie ic ia l e s
Si N - n R + fe, con R entero y fe < n, la mejor elección consiste
en formar fe grupos de tamaño (ñ + 1 ), siendo los restantes Tamaños relativos (a ) 0.1 0.1 0.2 0.3 0.3
(w — fe) del tamaño E. Esco da
y. 0.3 0.5 0.8 0.9 1.5
Población A
yJa 3 5 4 3 5
(9A.67) 0.3 0.8 1.5 1.5
y¡ 0.3
Población B
yjz¡ 3 3 4 5 5
Si N/n es entero, (9 A .6 6 ) da V (Y RHC)/ V ( t „ z ) - ( N - n )/ 0.7 0.6 0.4 0.9 0.6
Población C y¡
( N — 1 ), y se obtiene la misma razón que en el muestreo aleatorio yjzi 7 6 2 3 2
simple.
M U ES TRE O CONGLOM ERAD O DE U N A E T A P A : CONGLOMERADOS . . . 333
2. Muestreo aleatorio simple de las unidades. Estimación: razón TABLA 9 A .2 . V a r ia n z a s de T o t a l e s E s t im a d o s d e P o b l a c ió n

al tamaño, Yr = I »/ £ z¡. Población
3. Muestreo con probabilidad proporcional al tamaño con resti Estimación A B C
tución. Estimación: Yppz = ( 1 / « ) I (y¡/z¡).
Ysrs 1.575 2.715 0.248
4. Método de Brewer, muestreo sin restitución. Estimación: Y„ = Y r (E C M ) 0.344 0.351 1.421
( 1 / « ) I {y¡/Zi). 0.400 0.320 1.480
Ys 0.246 0.248 1.251
5. Método de Murthy. Estimación: Y^ = |\l- z ¡ ) —+(1 - Yv, 0.267 0.237 1.130
Yr„ c 0.320 0.256 1.184
(2 - Z i - Z j ) .
Yiys 0.150 0.140 0.760
6. El método Rao, Hartley y Cochran, con un grupo de tres uni
dades, y uno de dos unidades. Estimación: YRHC- 1 Z s(yg/zg). ( N — 1 ) - 0.75 para estas poblaciones. Para YRHC, la razón V (Y RHC)
7. El método sistemático de Madow, con las unidades dispuestas /V (Y ppz), donde Y ^ denota muestreo con restitución es 0.8 en la Tabla
9A.2. Para los métodos con probabilidades desiguales, la razón varía
en orden creciente de y-JZi. Estimación: 'frJys= (l/w)I()'//ri). entre poblaciones. El promedio de las tres razones en A, B, C es 0.74
para el método de Brewer y 0.73 para el método de Murthy, más o
Para damos una idea de lo que se puede esperar de los compor
menos la misma razón que para los métodos equiprobabilistas. Los
tamientos relativos de los métodos de Brewer, Madow y RHC, contra
resultados para n = 3, 4 sobre pequeñas poblaciones naturales de
el muestreo aleatorio simple con probabilidades iguales, nótese que
bidas a Bayless y Rao (1 9 7 0 ) en general concuerdan con ( N - n )/
las varianzas relativas de los métodos más nuevos respecto a V ^ f ^ )
( N - 1).
son aproximadamente los coeficientes relativos de variación de las En las poblaciones A y B, otros métodos son mucho más exactos
cantidades y jz - x y y¡. Las razones cv(y¡/z¡)/cv(y¡) son 0.19 en la po
que Ysrs con muestreo aleatorio simple. La estimación de la razón al
blación A, 0.11 en B y 6.7 en C. De modo que los métodos de pro
tamaño con muestreo aleatorio simple, tiene un comportamiento
babilidad desigual deberían tener una eficiencia relativa aproximada
semejante a los de los métodos de probabilidades desiguales, aunque
de 5 en A, 9 en B, pero sólo 0.15 en C. Esta comparación es un poco
no tan bueno. En este último, no hay mucho que elegir entre los mé
injusta respecto a los métodos de probabilidad desigual, que ponde
todos de Brewer, Murthy o RHC. El método sistemático en su caso
ran los errores cuadrados en y'/z¡ por las medidas de tamaño. Los más favorable da muy buenos resultados.
ECM de Yr deberían estar no muy alejados de las varianzas de los En la población C, donde los totales de unidades poco tienen que
métodos de probabilidad desigual.
ver con los tamaños, el muestreo aleatorio simple con probabilidades
En la práctica, al elegir un método, las consideraciones más im iguales es el mejor. Como se señaló al final de la Sec. 9A.13, esta
portantes se refieren a la facilidad de estación de la muestra, la sen superioridad es probablemente debida al estimador Ny, y no al mues
cillez de la estimación, la exactitud de la estimación, y la existencia treo aleatorio simple.
de un estimador de la varianza de la estimación. Con n = 2, todos Rao y Bayless (1 9 6 9 ) compararon 10 métodos no equiprobabilis
los métodos son simples. Por lo que respecta a la exactitud, el mé tas en 20 poblaciones naturales que se encuentran en diversos libros
todo sistemático sólo se muestra en su caso más favorable y la infor y artículos sobre el muestreo con N entre 9 y 35. Se limitaron a los
mación que dispone el encuestador rara vez le permitirá usarlo. Todos métodos ( a ) que se sabe presentan varianzas más pequeñas que YPP,
los métodos, a excepción Ysys y YR> proporcionan estimaciones mués y ( b ) que proporcionan un estimador de varianza positivo insesgado.
trales insesgadas de la varianza de error. La Tabla 9A.2 presenta las Entre los métodos aquí presentados, compararon las eficiencias de
varianzas (con el ECM para YR). *
Ym, Yrh c, y Yppz con la de Ys. Para n = 2, casi no había elección posible
En selección equiprobabilista, la razón de V{ Y) en el muestreo sin
entre los tres métodos sin restitución, sin embargo, YM aventaja un
restitución ala varianza V ( Y) en muestreo con restitución es (N - n )/ poco y supera a Yrhc . siempre que los dos métodos difieren en pre
334 TE C N IC A S DE M U E S TR E O M UESTREO CO N G LO M ERAD O DE UNA ETAPA: CO NG LO M ERAD O S. . . 335
cisión. También hemos notado (Sec. 9A.7) que el estimador de va sola elección de los z¡ o zki para todas las variables que requieren
rianza puede ser inestable para métodos que usan la estimación de estimaciones. Así, por ejemplo, los z¡ o z»¡ pueden ser proporcionales
Horvitz-Thompson. Los resultados de Rao-Bayless comparan los coe a las ventas recientes totales de un tipo de negocio, cuando la en
ficientes de variación d e v(Y M), v(Y RHC), y v(Y B) en la forma de Yates- cuesta debe estimar las ventas del día de ciertas clases de artículos,
lo mismo que ventas totales del día. Para algunas clases de artícu
Grundy, con el de v (Y pp:}, como medidas de las estabilidades de los
los, las ventas pueden no ser ni aproximadamente proporcionales
estimadores de varianza. Con relación a v (Y B) como 100%, las
a los z,. En tales casos, el uso de la conocida “razón a la misma
eficiencias medianas, de los otros estimadores de varianza son:
variable en la última ocasión” puede producir aumentos sustanciales
v($'rhc) = 109%, u(YM) = Í04%, ü(Ypp-) = 97%, y los tres métodos pre
de la precisión.
sentan algunas ganancias individuales, considerables.
Con muestreo de probabilidades desiguales, el cambio en las
Bayless y Rao (1 97 0) dan comparaciones semejantes para n = 3
fórmulas a las de los estimadores de razón se efectúa fácilmente. En
(14 poblaciones) y n = 4 (10 poblaciones). Se usó la extensión de
una población no estratificada se reemplaza Y para cualquier método
Sampford del método de Brewer. Para n muy superior a 2, los mé - n
todos de Sampford y Murthy requieren cálculos de las probabilidades por X Y /X . Así, por ejemplo, con el estimador H T usamos X (£ y j
en conmutadora. Las varianzas de YM y Ys concordaban estrecha 7n)/¿ (x¡/ir¡) para la forma de razón, en lugar de X (y,/rr,). Para las
mente en casi todas las poblaciones, con Yrhc un poco superada, ya aproximaciones estándar al ECM y ECM estimado de una estimación
que su eficiencia mediana relativa respecto a Ys caía al 92% para de razón, reemplácese y i por di = (y i — R x ¡) en V (Y ) y por d ' =
rz = 4. Por otro lado, en la estabilidad de los estimadores de varianza (y i - Rx¡) en v(Y ).
la superioridad de YRHC y yM aumentaba con eficiencias medianas Así, por ejemplo, con la forma de razón del estimador de Horvitz-
relativas de 118% (n - 3 ) y 129% (n - 4 ) para v(Y RHC) y 110% Thompson, la aproximación a v2, la varianza estimada en la forma
(n = 3 ) y 120% (n = 4 ) para u{YM) con relación al 100% corres de Yates-Grundy, es a partir de (9 A.4 4), Pág. 323,
pondiente a v(Y s).
Rao y Bayless también compararon las eficiencias de Y y v (Y ) «b [ Í W > ] * X X (9A.71)
i />¡ ir¡j '1T¡ 77}/
para algunos de los estimadores en el modelo de regresión lineal de
En una población estratificada puede esperarse que con nh peque
la Sec. 9A.5 con a = 0. En tanto que los resultados comparativos
ño, la estimación de razón combinada( Sec. 6 . 11 ) será la utilizada [es
dependían de la potencia g, la tendencia general era semejante a la
to es, Y = X (Z h.)/(X^),)]- Para fórmulas de varianzaaproximada, se
que se presenta en poblaciones naturales.
reemplaza yhi por dhi = yhi- R x hi en V, y por dhi' = yhi - Rxhi en v.
Cuando las y¡ para un atributo no están relacionadas a los z¡ y
9A.13 E ST IM A C IO N E S E S T R A T IF IC A D A S Y D E R A Z O N no hay una estimación de razón adecuada factible para un atributo
semejante. Rao (1 9 6 6 ) investigó estimadores alternativos. Estos se
Las fórmulas precedentes se han presentado como se aplicarían obtienen de cualesquier estimadores de probabilidades desiguales
a un solo estrato, aunque la concentración en valores pequeños de (Horvitz-Thompson, Madow, Rao-Hartley-Cochran, etc.) al reempla
n implica estratificación previa, con base en otro principio (com o la zar y,/Zi por Ni/,, siempre que y i aparezca en elestimador.Entonces,
localización geográfica, la estratificación urbana-rural). La extensión por el estimador deHorvitz-Thompson, la forma alternativa es
de las fórmulas a esta estratificación se hace como de costumbre. Para
cualquier método, si nh, zhi, vh¡, yhh etc., se refieren al estrato h, YHT=-Xy, (9A.72)
n i
y =l V (Y ) = Z V ( Y h)- . v (Y ) = Z v ( Y h) (9A.70) en tanto que para el método RHC

h h
Las estimaciones de razón entran en los cálculos cuando la va Y l Hc = M Z Z syg (9A.73)
riable de interés es una razón (com o mujeres desempleadas/mujeres
aptas para el trabajo), o cuando se utiliza para incrementar la preci Los estimadores son sesgados, pero la intuición sugiere que si
sión. En muestreo con probabilidades desiguales, debe hacerse una las iji no tienen relación con las z¡ los sesgos serían relativamente
336 T E C N IC A S DE M U E STR E O M UESTREO CONG LO M ERAD O DE U N A ETAPA: CO NG LO M ERAD O S . . . 337
pequeños. Por el mismo método que el usado al encontrar V (V m )

IM í
en (9 A .4 2 ), obtenemos
P- IV
Z M,
' /[ É £ t ] = ^ - I E - TTij)(y¡ - y j ) 2 (9 A .7 4 ) 1 -1
n ¡ />;
donde Z es una sum a sobre aquellas escuelas con la facilidad.
De modo que, V[Y& t] depende de la cantidad de variación en los
totales de unidades, así como con V{YSRS). En la población C, Tabla Una muestra de rt escuelas se extrae con probabilidad proporcional a ¡Ví¡
con estimación. Para una facilidad, a de entre n escuelas se encuentra que la
9A.2, este método dio 0.266 y 0.280 para el ECM de las formas al
poseen, ( a ) Muestre que P = a/n es una estimación insesgada de P y que su
ternativas de Y ht y Ym> y estas formas se comportan casi tan bien varianza verdadera es P ( l - P ) / n . ( Sugerencia. En el corolario al Teorema 9.4
como YSrs- En ambos métodos, el término (Sesgo)2 era aproximada deje que y¡ = M ¡ si la escuela tiene la facilidad e igual a 0 de otra manera.)
mente del 4% del ECM. ( b ) Muestre que una estimación insesgada de V (P ) es v (P ) = P (1 —P)/{n - 1).
9A.3. Las unidades grandes en una población se arreglan en un número
finito de clases por tamaño: todas las unidades en la clase h contienen M,,
E J E R C I C I O S unidades pequeñas, ( a ) ¿En qué condiciones el muestreo con pps da, en pro
medio, la misma distribución en clases por tamaño en la muestra que estra
9A.1. Horvitz y Thompson (1 9 5 2 ) dan los siguientes datos para estima tificación por tamaño de la unidad, con distribución óptima para un tamaño
ciones visuales M ¡ del número de fam ilias y para los números reales yi en fijo de muestra? ( b ) Si la varianza entre unidades grandes en la clase h
20 manzanas de la ciudad de Ames, Iowa. Para asistir en los cálculos, también es kMh, donde k es una constante para todas las clases, ¿cuál sistema de pro
babilidades de selección de las unidades da una muestra en la que los tamaños
se dan los valores de y¡ y de y¡~/M, . Se escoge una muestra de n «= 1 manzana.
tienen aproximadamente la misma distribución que una muestra aleatoria
Calcule las varianzas del número total de familias Y, obtenido mediante ( a )
estratificada con distribución óptima para un tamaño fijo de muestra?
la estimación insesgada en muestreo con iguales probabilidades, ( b ) la esti
mación de la razón en muestreo con iguales probabilidades, ( c ) muestreo con 9A.4. Para una población con N = 3, z, = j , ¿ y y, = 7, 5, 2, se extraen dos
probabilidad proporcional a M ¡. (Para la estimación de razón calcule el ver unidades sin restitución, la primera con probabilidad proporcional a zi y la
dadero error cuadrático medio, no la fórm ula aproximada.) segunda con probabilidad proporcional a los otros tamaños, ( a ) V erificar que
t t i= ié - t r 2 = |g, 13-j = Í5 y que 7rl2 = |^, 7r,3= 55, Tr2J = ¿ u( b ) Para este método de
selección de la muestra, comparar las varianzas de ñ cr y K y también, com
A/, V¡ Vi y ? IM t Mi Vi V. Vi {M i
pararlas con la varianza de Y rhc al usar su método de selección de muestra.
Se pueden construir las tres estimaciones posibles, o bien usar las fórmulas
9 9 1.0000 9.000 19 19 1.0000 19.0p0 de la varianza. ( c ) Mostrar que la razón de V (Y M) a V (Y pp.) en un muestreo
9 13 1.4444 18.778 21 25 1.1905 29.762 con restitución, se acerca al valor \ que se aplica a muestreo equiprobabilista.
12 12 1.0000 12.000 23 27 1.1739 31.696
9A.5. Para la población del Ejercicio 9A.4, una segunda variable tenía los
12 12 1.0000 12.000 24 21 0.8750 18.375
valores y..¡ = 8, 5, 9, no todos estrechamente relacionados a les z¡, de modo
12 14 1.1667 16.333 24 35 1.4583 51.042
que con e l método de muestreo del Ejercicio 9A.4, Y r t y Y se esperaría que
14 17 1.2143 20.643 25 22 0.8800 19.360
se comportasen mediocremente para esta variable. Para el estimador de Rao,
14 15 1.0714 16.071 26 25 0.9615 24.038
Y h t = l.5(y2, + y 2/), comparar su ECM con la varianza de YSRS = l.5 (y 2; + y 2/)
17 20 1.1765 23.529 27 27 1.0000 27.000
en muestreo equiprobabilista. ¿Cuál es la contribución del sesgo al ECM?
18 19 1.0556 20.056 30 47 1.5667 73.633
18 18 1.0000 18.000 40 37 0.9250 34.225 9A.6. Para e l método de Brewer con n =. 2 en la Sec. 9A.8 se ha mos
trado que
= Azlzl ( l - z ¡ - z l ) ¡ i "_ z ¡_ \
¿Concuerdan los resultados con la discusión en la Sec. 9A.5?
" ( l - 2 r i) ( l - 2 z /)/ V t i -2z )
9A.2. Hay que enviar un cuestionario a una muestra de escuelas secunda
rias para encontrar cuáles proveen ciertas facilidades, como por ejemplo, un ( a ) Mostrar que si cada z ¡ < 5,
curso de ruso o una alberca. Si M ¡ es el número de estudiantes en la i-éslma
escuela, la cantidad que hay que estimar para una facilidad dada es la pro 0 < vi,, < 4 z,z¡ (cada i j)
porción P de estudiantes que están en escuelas que tienen dicha facilidad, ( b ) Mostrar que este resultado hace positivo al estimador de varianza de
esto es, Yates- Grundy, para este método.
338 TE C N IC A S D E M U E S TR E O
Sugerencia. Para ( a ) es suficiente mostrar que
9A.7. ( a ) Para el m é to d o de Durbin, con t i = 2 verificar directamente que C A P IT U L O 10

la p r o b a b ilid a d de que se l a j-ésima u n i d a d en s e g u n d o l u g a T es
e x tr a ig a n
z¡ como se dijo e n la Pág. 325.

( b ) Con N = 4, Zj = 0.1, 0.2, 0.3, 0.4, calcular la probabilidad de que
con el método de Brewer se extraiga primeramente la unidad 1 y después
la probabilidad de extraerla en segundo lugar. V erificar que ambas probabi
lidades suman 0.2 *= 2z¡.
Submuestreo con Unidades
9A.8. En el método sistemático de Madow se puede elegir una unidad
más de una vez en la muestra si nzi > 1 (es decir, n M t' > M 0')- Mostrar
(com o se dijo en la Pág. 329) que para tales unidades, la frecuencia promedio
de Tam años Iguales
de selección es nz¡, de modo que el estimador de Horvitz-Thompson de Y sigue
insesgado para nz¡ > 1.
10.1 M U E STR E O E N DOS E T A P A S
Supongamos que cada unidad de la población se puede dividir

en cieno número de unidades más pequeñas, o subunidades. Se ha
tomando una muestra de n unidades. Si las subunidades contenidas
en una unidad seleccionada dan resultados semejantes, no parece
económico medirlas todas. Una práctica acostumbrada consiste en
seleccionar y medir una muestra de subunidades de alguna unidad
elegida. Esta técnica se llama submuestreo, dado que la unidad no
se mide completamente, sino que a su vez es objeto de un mues
treo. Mahalanobis le ha dado el nombre de muestreo en dos etapas,
porque la muestra se obtiene en dos pasos. Lo primero que se hace
es seleccionar una muestra de unidades, que a menudo se denominan
unidades primarias, y después se selecciona una muestra de unida
des de la segunda etapa o subunidades de cada una de las unidades
primarias elegidas.
El submuestreo tiene una gran variedad de aplicaciones que re
basan en mucho los alcances inmediatos de las encuestas por mues
treo. Cuando un proceso involucra pruebas químicas, físicas o
biológicas, realizables en una pequeña cantidad de material, común
mente se obtendrá ésta como submuestra de una cantidad más
considerable que a su vez es una muestra.
En el presente capítulo, vamos a considerar el caso más simple
en el que cada unidad contiene el mismo número M de subunidades,
de las cuales se elegirán m al submuestrear cualquier unidad. En la
Fig. 10.1 exhibimos una representación esquemática de una muestra
en dos etapas, para la que M = 9 y m — 2.
340 TE C N IC A S DE M U E S TR E O SU B M U ESTREO CON UNIDADES DE TA M A Ñ O S IG U ALES 341
seleccionada, se da un método para seleccionar de un número espe

cífico de subunidades de la misma. A l encontrar la media y la va
rianza de una estimación hay que tomar promedios sobre todas las
muestras que puede generar este proceso de dos etapas. Una manera
de calcular este promedio, consiste primero en promediar la estima
ción sobre todas las selecciones de la segunda etapa, que pueden
extraerse de un conjunto fijo de n unidades elegido por el plan. Pos
teriormente, se promedian sobre todas las posibles selecciones de n
unidades por medio del plan. Para una estimación 9, este método
se expresa como
E (6 ) = E X[E 2(6)] (10.1)

donde E denota el valor esperado o promedio sobre todas las mues
tras, Eadenota el promedio sobre todas las posibles selecciones, en
la segunda etapa, de un conjunto fijo de unidades, y E, denota el
promedio sobre todas las selecciones de la primera etapa.
Para V(0)este método da el siguiente resultado, fácil de recordar.
V (S )= VX[E 2(6 )]+ E X[V 2(0 )] (10.2)

[XI denota un elemento en la muestra
donde V2(0) es la varianza sobre todas las posibles selecciones de
Fie. 10.1. Representación esquemática de un muestreo en dos etapas
(¿V = 8 1 .n -5 ,M = 9,m =2) submuestra para un conjunto dado de unidades. Para demostrarlo,
sea 9 = E ( 6) (donde 9 no es necesariamente la cantidad que Ó va a
La principal ventaja del muestreo en dos etapas es su flexibilidad
estimar, puesto que 6 puede ser sesgada). Por definición
con respecto al muestreo de una etapa. Se reduce al muestreo de una
etapa en el caso m ■= M, pero, a menos que ésta sea la mejor elección
V(6) = E ( d - 0 ) 2= E xE 2(9 - Q)2 (10.3)
de m, tenemos la posibilidad de tomar un valor más pequeño que
resulta más eficiente. Como de costumbre, lo que se trata es de al Pero
canzar un cierto equilibrio entre precisión estadística y costo. Cuando E 2(0 - d ) 2= E 2(02) -2 9 E 2(9) + 92 (10.4)
las subunidades de la misma unidad concuerdan estrechamente, la
precisión sugiere un valor pequeño de m. Por otro lado, en ocasiones = [ £ 2(0)]2+ V2(0 )-2 6 E 2(0 )+ 0 2 (10.5)
es casi tan económico medir toda la unidad que submuestrearla como,
Ahora se promedia sobre las selecciones de la primera etapa. Dado
por ejemplo, cuando la unidad es una vivienda y una sola persona
que E,E2( 0 ) => 6,
puede proporcionar datos exactos respecto a todos los ocupantes de
la misma.
V ( 6) = E X[E ¿ 9 )]2- 92 + E x[ V2(0)] (10.6)
= V x[E 2{9 )]+ E x[V ¿ 9 )] (10.7)
10.2 D E T E R M IN A C IO N D E M E D IA S Y V A R IA N Z A S
EN M U E ST R E O D E DO S E T A P A S La Fórmula (1 0 .7 ) admite una extensión natural a tres o más
etapas. Para muéstreo de tres etapas
En el muestreo de dos etapas, el plan de muestreo da primero
un método de elección de n unidades. En seguida, para cada unidad V(0) = Vx{E ¿ E 3(0)Ji + E ,{ V2[E 3«?)]} + £ ,{E 2[ U3(0)]} (10.7’)
342 T E C N IC A S DE M U ESTREO SU BM U ESTREO C O N UNIDADES DE TA M A Ñ O S IG U ALES 343
rx
10.3 V A R IA N Z A D E L A M E D IA E S T IM A D A Además, con y=Y.y¡/n y muestreo aleatorio simple en la segunda

EN M U E ST R E O D E DOS E T A P A S etapa,
Se usará la notación siguiente. ... (M - m ) Y , S 2¿2
yif = valor obtenido para la ;-ésima subunidad en la i-ésima unidad

primaria. donde S2J2= Í ( y i¡- Y¡)2/ (M - \ ) es la varianza entre subunidades pa
y ¡= media muestral por subunidad en la i-ésima unidad pri- ra la i-ésima unidad primaria. Cuando promediamos sobre las
maria. * y
muestras de primera etapa, ^ S 2iVn promedia a J s 2i2/A' = 522.
$= £ = media global de muestra por subunidades.
¡- i n Por lo tanto,
i (Y -tf
2 f-1 _= varianza entre medias de unidades primarias. U v 2( W] - ( í £ = ) £ l (1013)
sr =
N - 1
N M El teorema resulta de la Fórmula (1 0.10 ), al sumar (10.11) y
” 2
(10.13).
2 i? ,? , ^ varianza entre subunidades dentro de unidades
5z = N (M -l) = primarias. Si f, = n/N y f2 =» m/M son las fracciones del muestreo en la
primera y segunda etapas, otra forma del resultado es
Hay que observar que Y¡ denota el total sobre las subunidades de
la i-ésima unidad (que en los Cap. 9 y 9A se denotacony i ) . V(.y) = ^ 1S l2+^— ^ S 21 (10.14)
n mn
Teorema 10.1. Si las n unidades y m subunidadesde cada uni
dad elegida, se seleccionan por muestreo aleatorio simple, y es la 10.4 E S T IM A C IO N M U E S T R A L DE L A V A R IA N Z A
estimación insesgada de Y con varianza
Teorema 10.2. En las condiciones del Teorema 10.1, tenemos
como estimación insesgada de V(y)
Prueba. Con muestreo aleatorio simple en ambas etapas, (10.15)

n mn
donde f t - n/N, f, = m/M, y
I T.{y¡¡~y¡)2
Para V(y), usárnosla Fórmula (10.2).
D 2= ---- —
' 7— s 22 = — , 77- (10.16)
n —1 n (m -l)
m = Vl[£ ,(y -)]+ E ,[V 2(y)] (10.10)
Prueba.
n
Dado que E 2(y) = Z Y¡/n, el primer término de la derecha es la va

( n - l ) s ¡2= Z (y i - $ ) 2= Í y l2- n $ 2 (10.17)
rianza de la media por subunidad para un muestreo aleatorio simple
de una etapa, de n unidades. De modo que, por el Teorema 2.2, Por lo tanto
Y\[Ez(y )] = (10.11)
344 TE C N IC A S DE M U ESTB EO SU B M U ESTREO CO N UNIDADES DE TA M A Ñ O S IG UALES 345
donde f"„ = ¿ Y jn . El último término de la derecha es válido, porque que n/N sea pequeña. Si n /N no es pequeña, (10.23) sobreestima
el submuestreo es independiente en diferentes unidades y y = £ y jn por la cantidad /,S;2/n, como se ve a partir de (10.20) y (10.14).
En consecuencia,
10.5 L A E S T IM A C IO N D E PR O PO R CIO N ES
(., - 1 )E 2(s ,2) - £ (Y ,~ {n ~ ^ (10.19)
Al multiplicar por (1 — f.)/ra(n - 1) y promediar sobre la primera Si las subunidades se clasifican en dos clases y estimamos la
etapa de muestreo aleatorio simple, proporción de ellas que pertenece a la primera clase, se pueden
aplicar las fórmulas precedentes por el artificio acostumbrado de
E (1 s,2= ^ ^ 5 , 2+ ■■■~ — — S22 (10.20) definir j/¡/ como 1, si la subunidad correspondiente está en esta
ri /i mn clase, y como cero en el caso contrario. Sea p¡ = a¡/m la proporción
Al comparar con (10.14) para V(y), nótese que el término en S/ que cae dentro de la primera clase en la submuestra de la i-ésima
está indefecto por la cantidad f , (1 — f 2)S 22/nm. Dado que E,E.. unidad. Las dos varianzas estimadas s,2 y s22 requeridas para el
(s .2) = S¡¡2, por lo tanto,“una estimación insesgada de V(y) es Teorema 10.2 son como sigue:
U (y )= — 5i 2+ ^ - ^ í 22 (10.21) I (p ¡ - p )2
n mn 2 _ (-1
Corolario. Un resultado utilizado más tarde es que a partir
de (10.20)
*
2\_ C 2 , ( l / 2 ) c 2_ C 2 . S22 Si*
£Ui ) -S i + - — S2 5, h í -¡yr (10.22) donde p = i p j n . En consecuencia, por el Teorema 10.2,
m m Ai
llOHulta que una estimación insesgada de S/ es
2 s 2 2 ( 1 - / 2)
Ejemplo. En un estudio sobre enfermedades de las plantas, éstas fueron
1 m plantadas en 160 pequeñas parcelas que contienen nueve plantas cada una.
Se escogió una muestra al azar de 40 parcelas y se examinaron tres plantas
Ñutas al Teorema 10.2. Si M = m o sea f2 = 1, la Fórmula
en cada parcela muestreada para ver si estaban enfermas. Se encontró que 22
(10.15) resulta apropiada para el muestreo aleatorio simple de las
parcelas no tuvieron plantas enfermas (de las tres), 11 tuvieron una, cuatro
unidades. Si n - N, la fórmula es la del muestreo aleatorio estrati tuvieron dos y tres tuvieron tres. Estime la proporción de plantas enfermas
ficado proporcional, puesto que las unidades primarias pueden y su e.e. El símbolo ^ denota las frecuencias 22, 11, 4, 3.
considerarse entonces como estratos, todos ellos muestreados. En Tenemos N = 160, M = 9, n = 40, m = 3. Para encontrar s,2 y s.,2, es
relación con esto, el muestreo en dos etapas es una clase de estra conveniente trabajar primero con los números de plantas enfermas (3 p ¡)
tificación incompleta, con las unidades como estratos. y los números de plantas sanas (3 <j¿). Los cálculos se plantean como sigue:
Cuando puede despreciarse f, = n/N, obtenemos el simple re Frecuencia
sultado, 3Pi 9M / 9ip ¡q ¡ 3l r ¡ Hp,
0 22 0 0 0 0
2 ¿ (y .-y )2
1 11 2 22 u 11
(10.23) 2 4 2 8 8 16
3 3 0 0 9 27
Por lo tanto, la varianza estimada podrá calcularse con sólo conocer
las medias de unidades. Este resultado es útil cuando el submues 40 30 28 54
treo es sistemático, porque en este caso no podemos calcular una
estimación insesgada de S22. Pero (10.23) es aún aplicable, siempre
346 T E C N IC A S DE M U ESTREO SU B M U ESTREO CON U NID AD ES DE T A M A Ñ O S IG UALES 347
dondear hacia arriba si m > e > m (m + 1 ), de otra manera redon

dear hacia abajo. Si v ióp, > Ai o si S r < SS/M, tómese m = Ai. al
usar muestreo de una etapa. (E l producto (V + Sí'l/ N )C es una
^ ( " - P > 2= ¿ ( 5 4 - l f ) = 3.8 22
función estrictamente decreciente de m cuando S,J < S23/M .)
Para encontrar el valor de n, se resuelve la ecuación de costo o
= ^ = 3.3 3 3
la ecuación de varianza, según la que se haya preasignado.
Por lo tanto, de la fórmula inmediatamente anterior a este ejemplo, En la mayoría de las situaciones prácticas, el óptimo es relativa
mente bajo. Un error de unas cuantas unidades en la elección de m
' (3 )0 .8 2 2 ) (2 )0 .3 3 3 )
produce sólo una pequeña pérdida de precisión, como lo ilustra el
P) (4)(40)(39) + (4)(3)(1600)(2) 000201
ejemplo siguiente. Escríbase
La proporción enferm a es 0.233 con e.e. 0.045. La fórm ula aproximada
s jy / r i, de (1 0.23), da 0.049, una estimación razonablemente buena consi 5„2= S,2- ^ (10.27)
derando que fj = l/£. M
Ejemplo. Sea
10.6 F R A C C IO N E S O P T IM A S D E M UESTREO cl = 10c2, S2= 1.3S„

Y SU B M U E STR EO entonces
Estas dependen del tipo de función de costos. Si los gastos de TTldpí = 1 ■3v/10 = 4 .1
viaje entre unidades son de poca importancia, una forma de la fun Consideraremos fijo el costo total y veremos cómo cambia la varianza de y
ción qué ha demostrado ser útil, es al cambiar m. Se supone que N es elevado. De (10.14)
C = c ¡n + c 2nm
v w - s : +£
n nm
La primera componente del costo, c,n es proporcional al número
de unidades primarias de la muestra, la segunda, c.nm es propor me2
cional al número total de unidades o elementos de la segunda etapa. m' C
Del Teorema 10.1 se ve que V{y) puede escribirse al elim inar n por medio de la ecuación de costo. Esto da
El último término de la derecha no depende de la elección de n y m. Al omitir el factor constante, la varianza relativa se puede calcular para dife
Al minimizar V para C fijo, o C para V fija, equivale a minimizar el rentes valores de m. La Tabla 10.1 muestra estas varianzas y las precisiones
producto relativas (tom ar como estándar la precisión m áxim a para m = 4 ).
Para cualquier valor de m entre 2 y 9, la pérdida de precisión relativa a la
óptima es inferior al 12% .
T A B L A 10.1. V a r ia n z a s R e l a t i v a s y P r e c i s i o n e s p a r a V a l o r e s
Por la desigualdad de Cauchy-Schwaxz
D if e r e n te s de m
rn = 1 2 3 4 5 6 7 8 9 10
(m 26)
Varianza relativa 29.59 22.14 20.32 19.92 20.07 20.51 21.10 21.80 22.56 23.38
siempre que S,2 > S2'/ M . Se redondea máp, al entero más cercano. 0.67 0.90 0.98 1.00 0.99 0.97 0.94 0.91 0.88 0.85
Precisión relativa
Si m es un entero tal que m < vn6pt < m + 1, la siguiente es una
regla más conveniente para m 6pt pequeña, (Cameron, 1951): re
348 TE C N IC A S DE M U ESTRE O SU B M U ESTREO C O N UNIDADES DE TA M A Ñ O S IG UALES 349
En la práctica, la elección de m requiere las estimaciones de TABLA 10 .2 . L ÍM IT E S p a ra S 2V S t¡- d e n tro de lo s c u a le s m 0 da al
c,/c2 y S=/S, o en forma equivalente S2/Su. Debido a lo achatado M enos 90% de la P r e c is ió n M á x im a
de la óptima, no es necesario obtener estas razones con gran pre

c,lc2 = 1 Ci/C2 = 2 4
cisión. Si e j e . se conoce razonablemente bien y un valor de m, i
m0 L U L U m0 L U L U
digamos m 0, se ha seleccionado, una tabla muy útil (Brooks, 1955)
muestra la gama de valores de S22/Su2 dentro de la cual m 0 da una 0.0 4 2 0.5 8 0.2 4
1 0.0 11
precisión de al menos un 90% de la óptima. 2 2.0 98 1.1 22 3 1.2 21 0.5 8
La tabla se obtuvo como sigue. Para un costo dado, al suponer 3 4.1 >* 2.4 72 4 2.2 44 1.0 16
N grande, la precisión relativa de m 0 a se encuentra que es 4 6.6 > 4.0 > 5 3.3 82 1.6 27
5 9.5 > 5.9 > 6 4.7 > 2.4 42
V(y\mopi) _ ________ (Su'/c[ + S2-J72) 2________ (10.28) 6 13 > 8.1 > 7 6.3 > 3.3 61
V{y\m0) Su2Cl + 522c2+ m ^ S ^ + c ^ / m o 7 16 > 11 > 8 8.0 > 4.3 87
El conjunto de valores de S2/S„ para los cuales esta expresión ex 8 20 > 13 > 9 10 > 5.4 >
cede algún nivel asignado L, son aquellos que se encuentran entre
c jc i = 8 16 <ü/ca = 32 64
las dos raíces
mQ L U L U m0 L U L U
S2 _ y ± J L ( l - L )(V ^ 0+ y2
2. ' _ (10.29) 6 1.0 17 0.3 8 5 0.1 3 0.0 2
Su ~ (L y 2/m0) —(1 —L )
7 1.5 24 0.5 11 10 0.4 12 0.1 7
donde y2 ■= c,/c2. 8 2.0 32 0.7 15 15 1.2 26 0.3 14
9 2.6 42 1.0 19 20 2.7 46 0.7 24
La Tabla 10.2, adaptada de Brooks (1 9 5 5 ), muestra los límites
10 3.3 53 1.3 23 25 4.5 74 1.5 37
superior e inferior de S22/Su2 para L = 0.9. El amplio intervalo entre 52
15 7.6 > 3.5 55 30 6.S > 2.5
los límites inferior y superior es sorprendente en casi todos los 35 9.7 > 3.7 71
20 13.3 > 6.6 >
casos. Nótese que la gama de valores de m0 cambia en diferentes 20.4 10.5 > 40 13 > 5.2 93
25 >
partes de la Tabla.
Si tenemos una idea aproximada de los valores de S22/S„2 para * > denota “ > 100.”
las características principales en un reconocimiento, la Tabla 10.2
puede usarse para seleccionar un valor de m,,. Nótese que si p es la ya que los costos de viaje tienden a ser proporcionales a V n . Si se
correlación entre elementos en la misma unidad primaria, según ha especificado un valor deseado de V ( y ) , pares de valores de (n,
se definió en la Sec. 9.4, la razón S22/Su- es casi igual a (1 — p)/p. m ) que dan esta varianza se calculan fácilmente a partir de (10.25)
Un valor de S22/S„2 tan bajo como 1 corresponde a p = 0.5. Este para V ( y ) . Los costos para combinaciones diferentes se calculan
sería un grado de correlación intraunidad inusitadamente alto. En
entonces a partir de (10.30) y se encuentra la combinación que dé
forma similar, P = 0.1 da S2-/Su- - 9, mientras p = 0.01 da S22/
el menor costo. Cuando el costo se ha fijado con anterioridad, Han-
S.2 - 99.
sen, Hurwitz y Madow (1 95 3) dan un método para determinar la
Ejemplo. Suponga que c1/c„ es casi 1 y que S22/Su- 6e espera entre 5 y combinación (n , m ) que minimiza la varianza y una tabla que
100 para las características principales. Las columnas Cj/c2 = 1 dan m„ = 4
facilita una elección rápida. Nótese que su n es nuestra m , y vice
como una elección satisfactoria, ya que ésta cubre las razones de 4 hasta
más de 100 (realmente hasta 196). Con c1/c2 — 16 y la misma gama deseada, versa.
la tabla sugiere un valor de m0 poco más o menos entre 15 y 20, Cálculos
ulteriores a partir de (1 0.29) muestran que — 18 es mejor. Esta cubre la
gama de 5.2 a 84, no tan amplia como se deseaba. 10.7 ESTIMACION DE n u ,t DE UN RECONOCIMIENTO
PILOTO
Cuando el costo de viajar entre las unidades primarias es sus
tancial, una función de costo más exacta puede ser
En ocasiones las estimaciones de S22 y Sa2 se obtienen de
C = c¡n + c¡'/ñ+c2nm (10.30) un reconocimiento piloto en el cual se escogen vf unidades prima
SU B M U ESTREO CO N U NID AD ES DE TA M A Ñ O S IG U A LE S 351
rías, con m ' elementos tomados de cada unidad. Esta sección trata S u s titu y e n d o e s to s v a lo re s d e F s e o b tie n e
de la elección de r í y m ’. Si sl2 es la varianza entre medias de las
lím it e in f e r io r m,ip, = 2.8; lím it e su p erio r m 6l„ = 9.0
unidades y s.2 es la varianza entre elementos dentro de las unidades,
según se definió en la Sec. 10.4, (1 0 .2 2 ) da C o m o se m u es tra e n la T a b la 10.1, c u a lq u ie r m e n e s ta g a m a d a u n g r a d o d e
p re c is ió n c e rc a n o al ó p tim o . A s í con n ’ = 10, m ' = 4, h a y 8 o p o rtu n id a d es
i!) (10.31)
d e 10 q u e la p é rd id a d e p re c is ió n s ea p e q u e ñ a c o n d a to s n o rm a le s .
\ MI m “ m Los límites del 80% y 95% para r í = 5, 10, 20 y m ' = 4 son los que
Para la función simple de costo c,n -F c2nm , teníamos aparecen en la Tabla 10.3. Con r í — 20 casi hay seguridad de que estimar
m &pt con precisión cercana al óptimo. Esto no es así con r í = 5.
S2
T A B L A 10.3. L í m i t e s S u p e r io r e s e I n f e r i o r e s p a r a m ÓJIt
Como una estimación de a partir de este reconocimiento piloto, rí 80% 90%

(10.31) sugiere que tomemos
5 2.5, a> 1.8, co
10 2 .8 ,9 .0 2.3, co
20 3 .1 ,6 4 2.7 ,9 .1
* » - / = <1032)
V s , - . s 2 /m V(m s, /jz ) —1
La estimación mdp, está sujeta a un error de muestreo que depende
Si la razón c^c-, es la misma en la encuesta piloto que en la
del error de muestreo de la razón s15/s.2. Del análisis de la varianza
encuesta principal el costo de la encuesta piloto será proporcional
se sabe que m 's,Vs22 está distribuida como
a c,n ' + c.n'm '. Brooks (1 9 5 5 ) da una tabla de valores de ( n m ' )
en la encuesta piloto más económica que proporciona una precisión
relativa de 90% en la estimación de mê- La Tabla 10.4 es parte
donde F tiene (n ' — 1 ) y r í { r r í — 1) grados de libertad, siempre de dicha tabla.
que las y¡¡ estén normalmente distribuidas. Este resultado conduce
TABLA 10.4. D is e ñ o s d e M u e s t r a s P i l o t o q u e T i e n e n u n a P r e c i s i ó n
a la distribución de muestra de m op! para valores dados de r í y rrí,
R e la t iv a E sp era d a d e 90%
esto es,
c jc 2 ¿1 2 4 8 16 32 64
•JrrtcJc-2
(10.33)
S2V S S rí m’ rí rrí rí ni' rí r rí rí r rí rí m' rí rrí
1
1 7 3 6 4 6 5 5 6 5 7 4 10 4 12
Ejemplo. Para el ejemplo en la Sec. 10.6, en el cual 2 8 5 7 7 6 9 6 9 5 13 5 14 4 20
4 9 9 8 11 8 12 7 14 7 15 5 25 5 27
c, = 10c2, S 2=1.3S„, «1^ = 1.3770 = 4.1
8 10 14 10 15 9 17 9 18 8 22 6 32 5 44
considérese qué tan bien se estima m ópt a partir de una muestra piloto con 16 10 25 10 27 10 27 10 28 8 37 7 46 6 60
n' = 10 y m ’ = 4. De (10.33) 32 10 46 10 47 10 48 10 49 9 58 8 69 6 102
6.324 _ 6.324 64 10 92 10 93 10 96 10 100 10 104 8 137 7 169
" W = V F tl + (4 / 1 .6 9 )]- í_ 7 3 .3 6 7 F - l
donde F tiene 9 y 30 gl. Para encontrar los límites entre los cuales rhipt
Los cálculos suponen N , M elevadas: los diseños son conserva
se situará el 80% del tiempo, tenemos, considerando los valores de sign ifi
cación al 10% para F en un solo extremo, dores si los términos de cpf se toman en cuenta. Nótese que no más
de 10 unidades primarias son las requeridas y que los diseños no
F ,o (9 ,30) = 1.8490, F9o ( 9, 30) = 1/Fln(3 0 ,9 )= 1/2.2547 = 0.4435
presentan sensibilidad, relativamente, respecto a la razón c^/c2.
SU B M U ESTREO C O N UNIDADES DE TA M A Ñ O S IG U A LE S 353
352 TE C N IC A S DE M U E S T R E O
Teorema 10.3. Si se usa muestreo aleatorio simple en las tres

10.8 M U E S T R E O D E TRES E T A P A S
etapas, la media de la muestra por unidad de tercera etapa y es
estimación insesgada de f con varianza
El proceso de submuestreo se puede llevar a una tercera etapa al
muestrear las subunidades (elem entos) en lugar de enumerarlas
completamente. Por ejemplo, en reconocimientos para estimar la V'(y) = — S12+ ^ - ^ S 22+^Z t S32 (10.34)
' n nm nmk
producción de cosechas en la India. (Sukhatme, 1947), la aldea donde f3 = n/N, ~ m/M , f 3 = k/K son las fracciones de mues
es una unidad de muestreo conveniente. Dentro de una aldea, so
treo en las tres etapas.
lamente se seleccionan los campos cultivados con la cosecha en cues
tión, así que el campo es la subunidad. Cuando se selecciona un Prueba. Solamente se indican los pasos principales. Escríbase
campo, solamente ciertas partes de él son recolectadas para la deter
f - f = - t H) + ( t - f ) (10.35)
minación del rendimiento por acre; por lo tanto, se muestrea la
subunidad en sí misma. Si están involucrados análisis físicos o donde Ynm es la media de población de las mn unidades de segunda
químicos de la cosecha, puede usarse un submuestreo adicional, etapa que fueron seleccionadas y es la media de población de
ya que estas determinaciones se hacen a menudo en una parte de las 7i unidades primarias que fueron seleccionadas. Cuando elevamos
la muestra recolectada en un campo. al cuadrado y sacamos el promedio, los términos con productos cru
Los resultados son una extensión directa de los del muestreo zados desaparecen. Las contribuciones de los términos elevados al
en dos etapas y se dan brevemente. La población contiene N uni cuadrado resultan ser como sigue:
dades de primera etapa, cada una con M unidades de segunda etapa,
cada una de las cuales tiene K unidades de tercera etapa. Los
números correspondientes a la muestra son n, m y k, respectiva
mente. Sea y ilu el valor obtenido para la u-ésima unidad de tercera
etapa en la j-ésima unidad de segunda etapa sacada de la i-ésima
unidad primaria. Las medias de población relevantes por unidad
de tercera etapa son como sigue: n
K M K N M K Al sumar estos términos, se obtiene el teorema.
ly¡iu l l y ,,u Í lly i/ u
Y; = “----- f, = l ji f = ‘ ’ "----- Teorema 10.4. Una estimación insesgada de V ( y ) a partir de
" K ' MK ' NMK la muestra es
Se requieren las siguientes varianzas de población:
D(y«) = l z á 2+ / i a = á ) 5 2+ / ^ ( i - A ) , (1036)
n nm nmk.
Í(? ,-Y )2 donde s,s, s2=, s32 son en la muestra los análogos de Si*, S3a, S3-, res
C 2= _í________ pectivamente.
1 N- 1
N M Prueba. Esto se puede probar mediante los métodos de la Sec.
1Z (? *-t)2 10.4 o alternativamente, al demostrar que
C 2 = JL¿___________
2 N ( M - 1)
E (s {2) = + — j^-Si 2 (10.37)
N M K tn mk
1 1 1 (y ,/ * - ñ )2
o 2 _ ■ / “__________ E(s22) = S22+ ^ S > 2
3 N M ( K - 1)
SU B M U ESTREO C O N UNID AD ES DE T A M A Ñ O S IG UALES 355
y E (s 3’ ) = S3-. Para obtener el primer resultado, sea yiK la media La extensión de los resultados en esta sección, a etapas adicionales
sobre todas las m unidades de segunda etapa en la i-ésima unidad de muestreo, debería ser clara a partir de la estructura de las
primaria, al suponer que todos los K elementos fueron enumerados fórmulas.
durante la tercera etapa. Sea yK la media de los n valores ylK. En
tonces, de ( 10.22 ) para el muestreo en dos etapas, se tiene que
10.9 M U E STR E O E S T R A T IF IC A D O D E L A S U N ID A D E S
(i0 38) El submuestreo puede combinarse con cualquier tipo de muestreo

de las unidades primarias. El submuestreo en sí mismo puede em
Ahora, si y, es la media de la muestra para la i-ésima unidad pri plear estratificación o muestreo sistemático. Las fórmulas para las
maria, escríbase varianzas para estas modificaciones se pueden construir a partir de
las fórmulas para los métodos más simples.
(ft ~ 9 ) = (y * - yK) + [< * - M - ( y - y *)] (10.39) Los resultados que se presentan son para muestreo estratificado
A l promediar primero sobre muestras en las cuales las unidades de Jas unidades primarias en una muestra de dos etapas. Los tama
de primera y segunda etapa son fijadas, se puede mostrar fácilmente ños de las unidades primarias se suponen constantes para un
que estrato dado pero pueden variar de estrato a estrato. Esta situación
ocurre cuando las unidades primarias se estratifican por tamaño,
de tal manera que los tamaños dentro de un estrato se vuelven cons
^ r Y y £ Í [ ( y í - y iK)-(y-y/c)32= ^ - ^ ^ - (10.40)
tantes o casi.
y que la suma de términos con productos cruzados (1 0 .3 9 ) en nada El h-ésimo estrato ¡V,, unidades primarias, cada una con Ai* uni
contribuye. Esto establece el resultado para ECsp). El correspon dades de la segunda etapa; los números correspondientes en la mues
diente a ECs-3) se encuentra en forma similar. Por lo tanto tra son n* y m*. La media de población estimada por unidad de la
segunda etapa es
IN M S h
9 * m I N*Aí* * (1045)
nm \ k / nmk *
donde Wh = es el tamaño relativo del estrato en térmi
= ± z L S * + l Z Í l S¿ + } z ! l s * = V(y) (10.41) nos de unidades de la secunda etapa y y* es la media de la muestra
n nm nmk
Lo mismoque con el muestreo en dos etapas, es claro a partir en e l estrato. A l aplicar el Teorema 10.1 dentro de cada estrato,
de (1 0 .3 6 ) que si es despreciable u(y) se reduce a tenemos
U (y„) = I (10.46)
, ( a - fn¿ - £n(n
y —- f1)f (10.42)
donde fih ~ nJ N,„ f 2h = m j M h.
Esta es una estimación conservadora si ft no es despreciable. A partir del Teorema 10.2, una estimación insesgada de la mues
Con una función de costo de la forma
tra es
C = c ln + c 2nm + c3nmk (10.43)
v(y„) = I VF*2[ — + /u( 1~ /2* W 1 (10.47)
los valores óptimos de k y m son a L nh nhm h J
S3 v(s 2—5 21 Lasvarianzas correspondientespara el total de población estimado

seobtienen multiplicando las Fórmulas (10.46) y (1 0 .4 7 ) por
( ' a44) (2N*AÍ»)«.
356 TE C N IC A S D E M U E S T R E O SU BM U ESTREO CO N UNIDADES DE T A M A Ñ O S IG U A LE S 357
10.10 A S IG N A C IO N O P T IM A CO N M UESTREO Z Z Z YM¡

Hi f m
E S T R A T IF IC A D O
Z nhmh y
Esto trata sobre la mejor elección de los nh y los m h. Si los costos
La condición es, como puede esperarse, que la fracción de muestreo
de viaje entre unidades no son el factor principal, el costo se puede
completa f„ sea la misma en todos los estratos.
representar adecuadamente por la fórmula
De (1 0.50 ), la asignación óptima da
C = 'L c ihAh+ 'Z c 2hnhmh (10.48)
h h (10.53)
N hM h Vc2fl
A partir de (1 0.46 ), la varianza puede escribirse como
Frecuentemente c;,„ el costo por unidad de la segunda etapa,
será aproximadamente el mismo en unidades primarias grandes y
V(9» ) = I v ^ í - U s , * 2- ^ ) + — ^ - - ¿ - s . * 2]
h M h 1 nhmh Nh J pequeñas; pero S-* puede ser mayor en las unidades grandes que
La cantidad en las pequeñas. Sin embargo, dado que el óptimo es achatado, una
muestra autoponderante será a menudo tan precisa como el óptimo.
y(y,r) + A(Y.clhnh +I.C2hnhmh- c ) Nótese que este resultado se mantiene aun si el muestreo óptimo de
'h k J las unidades primarias está lejos de ser proporcional.
donde \ es un multiplicador de La gran ge, es una función de las
variables nh y Por lo tanto, para minimizar V para C fija, E J E R C I C I O S
o viceversa, tenemos
jy 10.1. Un grupo de 20 000 registros se guarda en 400 gaveteros de archivo,
nitV\ = - = J s lh2- S 2h2/Mh (10.49) con 50 registros cada uno. En una muestra en dos etapas, se extraen cinco
registros al azar de cada uno de 80 gaveteros seleccionados al azar. Para
una característica, las estimaciones de la varianza fueron s,2 ■= 362, s..2 = 805,
r WhSzh según se definen en la Sec. 10.4. ( a ) Calcule el error estándar de ía media
nhm,¡/ \ = -j — (10.50)
por registro de esta muestra, ( b ) Compare éste con el error estándar dado por
Clh
la fórmula aproximada (¿ 0 .2 3 ) en la Sec. 10.4.
Esto da 10.2. De los resultados de una muestra piloto en dos etapas, en la cual
se escogieron m ' subunidades de cada una de n' unidades, es útil estimar el
valor de V (y ) que estaría dado por una muestra subsecuente que contiene
7n subunidades de cada una de n unidades. Muestre que una estimación in
<10M) sesgada de V (y ) es
La fórmula para mh óptimo es exactamente la misma que en el
muestreo no estratificado [(1 0 .2 6 ) en la Sec. 10.6],
(y> \ N >n mrA m' m’N MN>
De (1 0.49 ), dado que W k « N kM„
donde s,2 y s,2 se calculan a partir de una muestra preliminar. Indicación.
2
Use el Teorema 10.1 y el resultado (1 0 .2 2 ):
n„ ce d o n deSuh2= S lh2- ^ - (10.52)
~Jclh
Ya que son convenientes estimaciones autoponderantes, consi M m
deraremos en qué circunstancias la asignación óptima conduce a
10.3. A l muestrear campos de trigo en Kansae, con el campo como unidad
una estimación autoponderante. De (1 0 .4 5 ) se desprende que y» primaría, K ing y McCarty (1941) reportaron los siguientes cuadrados medios
es autoponderante si nhmh/NhMh =/o= constante, ya que en este caso para rendimiento en bushels por acre: s,2 = 165, s22 =» 66. Se tomaron dos
submuestras por campo. Para una muestra de ti campos, compare las varian
zas de la media de la muestra dada por ( a ) la muestra tal y cual fue tomada,
Z(NhM J n hmh) l l y h, Z Z Z Y h,
( b ) cuatro submuestras por campo de n campos, ( c ) A l cosechar enteramente ti
Ü =h_____________ LJ.____ = Jl_Lí___
campos.
* I fo Z W t,
...
N y M se pueden suponer grandes y constantes. En ( c ) suponga que la cose

cha completa equivale a muestreo en una sola etapa (es decir, a tener m = M ).
10.4. En la misma encuesta, con dos submuostras por campo, los cuadra
dos medios para e l porcentaje de proteína fueron Sj2 = 7.73, s22 = 1.43.
¿Cuántos campos se requieren para estimar el rendimiento medio con aproxi
mación de ± 1 bushel y el porcentaje medio de proteína con aproximación de C A P IT U L O 11
± y 4 salvo en un caso de 20? Realice los cálculos suponiendo ( a ) que se toman
dos submuestras por campo en la encuesta principal, ( b ) suponiendo una
cosecha completa de un campo en la encuesta principal.
10.5. Para los datos sobre rendimientos de trigo en el Ej. 10.3, ¿cuál es
el valor de c,/c, en una función lineal de costo si la m óptima estimada es 2?
EJ Submuestreo con Unidades
10.6. Si m /M y n/iV son ambas pequeñas y la función de costo es lineal,
muestre que v i = 2 da un valor de V ( j ) menor que m = 1si
de Diferentes Tam años
10.7. Un gran almacén maneja alrededor de 20 000 cuentas recibidas por

mes. Una muestra del 2% (n i = 4 0 0 ) se verificó cada mes durante 2 años 11.1 IN T R O D U C C IO N
(ra = 24 ). Los números de cuentas erróneas que se encontraron por mes
(d e entre 4 0 0 ) fueron (e n orden de m agnitu d) 0, 0, 1, 1, 2, 4, 4,5, 5, 5,
Al muesixear una población extensa, suelen encontrarse unida
5, 6, 6, 6, 7, 7, 8, 9, 9, 10, 10, 13, 14, 17, siendo errático el patrón de tiempo.
A partir de los resultados en la Sec. 10.5, calcule s(2 y s22. De aquí, calcule des primarias que varían en tamaño. Además, por consideraciones de
el error estándar de ,p, como una estimación del porcentaje de cuentas erró costos se suele recomendar el uso del muestseo de varias etapas,
neas por año, que se obtendría de la verificación de ( a ) 1 200 cuentas de modo que los problemas discutidos en este capítulo ocurren con
tomadas al azar, de un solo mes. ( b ) 300 cuentas de cada uno de cuatro me frecuencia. Si los tamaños no varían considerablemente, un método
ses a l azar, ( c ) 100 cuentas cada mes. Indicación. Use la fórm ula en el
es el de estratificar por tamaños de unidades primarias, de modo que
Ejercicio 10.2 con m ' ^ 400 u obtenga estimaciones insesgadas de Sp y S,2
y use el Teorema 10.1. las unidades dentro de un estrato sean iguales o casi. Las fórmulas
10.8. Al planear una encuesta en dos etapas, se esperaba que c j c 2 sería de la Sec. 10.9 pueden, entonces, ser una aproximación adecuada.
alrededor de 4 y que S„2/Su2 estaría entre 5 y 50. ( a ) ¿Cuál valor de m escogería Pero frecuentemente seguirán existiendo diferencias sustanciales de
de la Tabla 10.2? ( b ) Suponga que a l terminar la encuesta se encontró que tamaño dentro de los estratos y en ocasiones será aconsejable basar
c,/c, fue cercana a 8 y S.p/S^ a 25. Calcule la precisión relativa dada la estratificación en otras variables. Gray y Corlett (1 95 0) en una
por su m con la dada por la m óptima, ( c ) Haga los mismos cálculos para
c j c „ = 4, S22/Su2 = 100. revisión de las encuestas sociales en Gran Bretaña, que son muestras
10.9. Si p es el coeficiente de correlación entre unidades de la segunda a nivel nacional, con distritos como unidades primarias, señalan
etapa en la misma unidad primaria, pruebe que que el tamaño primero fue incluido como una de las variables para
la estratificación, pero que al llegar a conocer mejor las caracterís
1-P V .y
ticas de la población, pareció más conveniente considerar otro factor.
P í ( N - \ ) / N ) S S - S 22/ M SJ
Para adquirir un buen conocimiento práctico del muestreo de
(Esto establece un resultado empleado en la Sec. 10.6.) varias etapas, será necesario un esfuerzo concentrado cuando las
10.10. Muestre que si Su2 > 0 en la notación de la Sec. 10.6, una muestra unidades son de tamaños variables, porque la técnica es flexible a
aleatoria simple de n unidades primarias, con 1 elemento tomado por unidad,
este respecto. Se pueden elegir las unidades con probabilidades igua
es más precisa que una muestra al azar de n elementos (n > 1, M > 1).
Muestre que la precisión de los dos métodos es igual si n / N es despreciable. les o bien, con probabilidades proporcionales al tamaño, o a alguna
¿Esperaría esto intuitivamente? estimación del tamaño. Se han construido varias reglas para deter
minar las fracciones de muestreo y submuestreo y se dispone de
varios métodos de estimación. Las ventajas de los diferentes métodos
dependen de la naturaleza de la población, de los costos de campo,
y de los datos adicionales de que disponemos.
360 TE C N IC A S DE M U ESTRE O E L SU B M U ESTREO CO N UNIDADES DE D IFERE N TES T A M A Ñ O S 361
La primera parte de este capítulo se dedica a la descripción de los 11.2 M ETODOS D E M UESTREO C U A N D O n = 1
métodos principales en uso. Empezaremos con una población que
consta de un solo estrato. La extensión al muestreo estratificado es Supongamos que la z-ésima unidad se seleccionó conteniendo
posible, como en los capítulos precedentes, al sumar las fórmulas Mi subunidades, de las cuales m¡ se escogen al azar. Consideramos
de varianza apropiadas sobre los estratos. Para simplificar las cosas, tres métodos de estimación de 9, la media por subunidad, o unidad
suponemos primero que sólo se eligió una unidad primaria, es decir,
de la segunda etapa, como suele llamarse.
que n — 1. Este caso no es tan impráctico como parece a primera
vista, porque cuando hay un gran número de estratos, se puede
I. Unidades elegidas con probabilidad igual
alcanzar una precisión satisfactoria en la estimación aunque nh - 1.
En las encuestas mensuales del U.S. Census Bureau para estimar los Estimación = y, = y¡.
números de personas empleadas, la unidad primaria es un munici
La estimación es la media de muestra por subunidad. Es sesgada
pio* o un grupo de municipios vecinos. Esta es una unidad grande,
porque en muestreo repetido de la misma unidad, el promedio de y,
pero tiene ventajas administrativas que disminuyen los costos. Como
los municipios están lejos de la uniformidad en cuanto a sus carac es Y¡, y como cada unidad tiene la misma oportunidad de selección,
terísticas, la estratificación se extiende hasta el punto en que sólo el promedio de Y¡ es
se selecciona uno de cada estrato. En consecuencia, la teoría que se
va a discutir sólo se aplica a un solo estrato en este plan de muestreo. ¿ I T ¡ = Y0 (digam os)
N i= l
Como en capítulos anteriores, las cantidades por estimar pueden
ser el total de población Y, la media de población (usualmente la Pero la media de población es
media por subunidad 9 ), o la razón de dos variables.
1HY,
Notación. La observación para la ;-ésima subunidad pertene
f = —, donde M = £
ciente a la i-ésima unidad, se denota con y¡¡. Los siguientes símbolos M 1=1
son referentes a la i-ésima unidad.
Por tanto, el sesgo es igual a (9 a- 9 ) . Dado que el método es sesgado,
Población Muestra vamos a calcular el error cuadrático medio (E C M ) respecto a 9.
Escribamos
Número de subunidades Mt m,
Media por subunidad Y, y. y¡ - 9 = (yi - Yi)+(,Y¡ - 9 a) + ( 9 a - 9 )
Al elevar al cuadrado y tomar la esperanza matemática sobre todas
Total Y,=M,Y, y, = m,y¡ las muestras posibles; todas las contribuciones de términos cruzados
se anulan. Las esperanzas de los términos cuadrados se obtienen
Los siguientes símbolos se refieren a la totalidad de la población fácilmente por los métodos dados en el Cap. 10. Encontramos
o de la muestra.
Población Muestra ECM (y,)=¿ I X (Y ¡~ Ya)2+ (9 a + Y )2 (11.1)

/V , = i M¡ m, /V /-i
donde
Número de subunidades M0=EM, ¿m,
Total N S ¿ = -r?— l ( y , - Y t
Y = l Y, M j-ly-i
ly ,
Media por subunidad
9 = Y/M0 9 = 1 yJl™, es la varianza entre subunidades de la z-ésima unidad.
Media por unidad primaria Y = Y/N y=lyjn El ECM de y, contiene tres componentes: uno surge de la va
riación entre unidades, otro de la variación entre verdaderas medias
* C o n d a d o , en e l o r ig in a l. (N . del T .) de las unidades, y otro más del sesgo.
El. SU D M U ESTREO CON UNID AD ES DE D IFERE N TES T A M A Ñ O S 363
III. Unidades escogidas con probabilidad proporcional al tamaño

Los valores de los ra¡ no se han especificado. La elección más
común consiste en tomar todos los tamaños m ¡ iguales, o tomar Estimación = ym = 2/¡ = ™edia de la muestra
m, proporcional a M¡, es decir, submuestrear una proporción fija de
cualquier unidad seleccionada. La elección de los 77i¡ sólo afecta la Esta técnica se debe a Hansen y Hurwitz (1 9 4 3 ), y provee una
primera de las tres componentes de la varianza, a saber, la compo media de la muestra que no tiene sesgo y no está sujeta a la infla
nente que proviene de la variación dentro de las unidades. ción de la varianza en el Método II.
En muestreo repetido, la i-ésima unidad aparece con frecuencia
I I. Unidades elegidas con igu al probabilidad relativa M¡/M„. Por lo tanto,
„ . _ N M ¡y , N M¡ -
Estimación = y¡,= ----- —
M0
Esta estimación es insesgada. Dado que es una estimación
insesgada de Y¡, el producto M,y¡ es una estimación insesgada del Adem ás,
total de unidad Y¡. Por tanto, NM¡y¡ es una estimación insesgada y,i.- Y = ( y m - Yi) + ( Y ¡ - Y)
del total de población Y, al dividir por Aí0, el número total de subuni Promediemos primero sobre muestras en las cuales se selecciona la
dades en la población, obtenemos una estimación insesgada de Y. i-ésima unidad.
Para encontrar V<yu) que desde luego es igual a su ECM, tenemos
Mq Ahora promediemos sobre todas las selecciones posibles de la unidad.

NM t - Dado que la i-ésima unidad se selecciona con frecuencia relativa
A/n A L / M o,
Ahora M ¡Y¡ = Y¡, el total para la unidad, y Y = NY/Mít, donde Y es V íym í-xrfs <1M1
M,¡ L¡=i m, ,=i J
la media de población por unidad. Esto da
Nótese que, como en el Método I, la componente entre-unidades
resulta de diferencias entre las medias Y 4 por elemento en las uni
dades sucesivas. Si estas medias por elemento son casi iguales, esta
Por lo tanto, componente es pequeña.
N
Ejemplo. Apliquemos estos resultados a una población pequeña, artificial-
U(j'ii) = TT2 * I ( Y , - Y )2 (11.2) mente construida. Los datos se presentan en la Tabla 11.1. Hay tres unida e
M „ ,=, m, Ma con 2, 4 y 6 elementos, respectivamente. Se pueden verificar las cifras
La componente entre unidades de esta varianza (segundo término para Y 4, S2¡2, y Y 4. La media Y de la población es 33/12, o 2.75. La media sin
a la derecha) representa la variación entre los totales de unidades Y 4.

TABLA 11.1. PO B L A C IÓ N A R T IF IC IA L C O N U N ID A D E S DE T A M A Ñ O S D ESIG U ALES
Esta componente está afectada tanto por las variaciones en las
de unidad a unidad, como por las variaciones en las medias Y¡ por \/ c 2 Y Y• Y
Unidad yt¡ M¡ ’ ¡ ¿a < >
elemento. Si las unidades varían considerablemente en tamaño, esta
, o 1 2 1 0.500 0.5 -2.25
componente es grande aunque las medias por elemento Y 4 son casi
2 1.2, 2, 3 4 8 0.667 2.0 -0.75
constantes de unidad a unidad. Con frecuencia esta componente es i 3, 3 ,4 ,4 . 5, 5 ó 24 0.800 4,0 +1.25
tan grande que y » tienen un ECM mucho más alto que la estimación
con sesgo y¡. Entonces, ni el Método I ni el Método II son entera Totales 12 33 _________ _____________
mente satisfactorios.
364 TE C N IC A S DE M UESTREO E L SU B M U ESTREO C O N UNID AD ES DE D IFERE N TES T A M A Ñ O S 365
ponderar de las Y es 2.167 = f a, de tal manera que el sesgo en el Método I reducciones en la contribución de la variación entre unidades, en
es — 0.583. Su cuadrado, la contribución al ECM, es 0.340. comparación con el Método sin sesgo II, y reducciones que prome
Una unidad se selecciona y dos elementos muestreados de ella. Conside diaron 30% en comparación con el Método I. (Ellos supusieron
raremos cuatro métodos, dos de los cuales son variantes del Método I. como despreciable la contribución de la variación dentro de unida
des.) En la estimación de características típicas de instalaciones
Método la.
Selección: unidad con probabilidad igual, = 2. agrícolas para el Estado de Carolina del Norte, Jebe (1 9 5 2 ) reportó
reducciones del orden del 15% en la varianza total en comparación
Estimación: y¡ (con sesgo). con métodos del tipo I. En ambos estudios la unidad primaria fue
Método Ib. un condado.
Selección: unidad con probabilidad igual = y2M ¡.
Estimación: y, (con sesgo).
Método II. 11.3 M UESTR EO C O N P R O B A B IL ID A D P R O P O R C IO N A L
Selección: unidad con probabilidad igual, m ¡ — 2. A L T A M A Ñ O ESTIM AD O
Estimación: N M ,y J M 0 (insesgada).
Método III. Como se mencionó en el Cap. 9, los tamaños M¡ de las unidades
Selección: unidad con probabilidad M J M 0, m¡ = 2. apenas se conocen aproximadamente con base en datos anteriores
Estimación: y, (insesgada). y en otras encuestas pueden tenerse varias otras medidas posibles
disponibles del tamaño de una unidad. Sea z¡ la probabilidad o
El Método Ib (submuestreo proporcional) no garantiza un tamaño de 2 tamaño relativo asignado a la i-ésima unidad, donde z¡ son cualquier
(éste puede ser 1, 2 o 3 ), pero el tamaño promedio de la muestra es 2.
conjunto de números positivos que suman la unidad. Todavía supo
Al aplicar las fórmulas para el error de muestreo (1 1 .1 ), (1 1 .2 ) y (1 1 -3 )
obtenemos los resultados de la Tabla 11.2. nemos Tt = 1.
Método IV Una estimación insesgada de Y es

TA B LA 11.2. ECM de las E s t im a c io n e s M u é s t r a l e s d e Y
Contribución al ECM de
ECM
( U '4)
Dentro de
Método unidades Entre unidades Sesgo Total Esto resulta porque, en muestreo repetido, la i-ésima unidad aparece
con frecuencia relativa z¡, de tal manera que
la 0.144 2.056 0.340 2.540
Ib 0.183 2.056 0.340 2.579 " ( M¡y,\ -
II 0.256 5.792 0.000 6.048 £ (y .v )= I 2\—r r ) = I ?
,-i \ZiM<y —i AdTo
III 0.189 1.813 0.000 2.002
La varianza de yEV se obtiene de la manera usual. Escríbase
Aunque el ejemplo es artificial, los resultados son característicos
[por (1 1 .4 )]
de los que se encuentran en comparaciones hechas en muchas po
blaciones. El Método III da el ECM más pequeño porque tiene la
contribución más pequeña de la variación entre unidades. El Método
II, aunque sin sesgo, es muy inferior. El Método la (tamaño igual
de la submuestra) es ligeramente mejor que el .Método Ib (sub En la varianza, cada cuadrado recibe una ponderación z¡. Por
muestreo proporcional). lo tanto
También se han hecho algunas comparaciones entre estos mé
v + £ 2, ( M S _ Mo?V 1 (1L5)
todos en poblaciones reales. Para seis características (total de tra M q L,-_x z¡ m¡ ¡-i V z¡ ' J
bajadores, total de trabajadores agrícolas, total de trabajadores no
agrícolas, estimados separadamente para hombres y mujeres). Han- Si z4 = M,/M0, (1 1 .5 ) se reduce a (1 1 .3 ) para V\y(II). Si z< = 1/N
sen y Hurwitz (1 9 4 3 ) encontraron que el Método III produjo grandes (probabilidades iniciales iguales), (1 1 .5 ) se reduce a (1 1 .2 ) para
E L SU B M U ESTREO C O N UNID AD ES DE D IFE R E N TE S T A M A Ñ O S 367
la varianza de la estimación insesgada cuando las probabilidades Si escribimos

son iguales.
}Fv" F = ( * - £ ) + ( ? < - £ ) + ( ? * - * )
A menos que z¡ = M¡/M0, la componente entre unidades en
las tres componentes del ECM resultan ser como sigue:
(1 1 .5 ) es afectada en cierto grado por las variaciones en los tama
ños M¡ tanto como por las variaciones en las medias Y¡ por elemento.
ECM (yv) = I Z,(Al r — — + XM - ~n (11.6)
¡=i M¡ m¡ ¡«i
TA B L A 11.3. Cá l c u l o de K { i/i v )
Ejemplo. Si los valores de y se escogen como en la Tabla 11.3, se
puede verificar que las componentes de la varianza de yv son como se muestra
Unidad AL, Af,/A/0 z, mt - - - - - ~ M i) S2Í* Y, - — - Y
z i, n i Z¿ Zj en la Tabla 11.4.
1 2 0.17 0.2 2 0 0.500 1 5 -2 8 TABLA 11.4. C o n t r ib u c io n e s al ECM en el M éto d o v

2 4 0.33 0.4 2 10 0.667 8 20 -1 3
3 6 0.50 0.4 2 30 0.800 24 60 +27 Dentro Entre ECM
unidades unidades Sesgo Total
Ejemplo. La Tabla 11.3 muestra los cálculos para encontrar V (y ,v) en la
población artificial de la Tabla 11.1. Las z¡ se han tomado como 0.2, 0.4 y
0.173 1-800 0.062 2.035
0.4, y las m ¡ = 2.
De (1 1 .5 ), la varianza resulta ser como sigue:
Este es superior a todos los métodos, excepto el Método I I I (p p s ) y es
contribución dentro-de-unidades = £ tL ÍM :— - .'I1^21 / M 2 = 0 213 casi tan bueno como el Método m .
z,m,
contribución entre-unidades = £ z / — — V”) /AL,,2= 3.583 11.4 R E S U M E N D E LO S M E TO D O S P A R A n = 1

Una comparación con la Tabla 11.2 muestra que el Método IV Los cinco métodos para estimar la media Y por elemento y sus
tiene una varianza más baja que el Método sin sesgo II, en el cual
ECM en el ejemplo numérico se resumen en la Tabla 11.5.
la unidad primaria se escoge con probabilidades iguales, pero el
Método IV es decididamente inferior al Método I o al Método III.
T A B L A 11.5. M étod os de M u e s tre o en dos Etapas (n = 1)
En este ejemplo, el Método IV paga un precio muy alto para obtener
una estimación insesgada.
P ro b a b ilid a d e s
Consecuentemente, es natural considerar si la media de la mues en la selección Estimación Condición ECM en
tra (como en el Método I ) sería mejor que la estimación adoptada en Método de unidades de ¥ de sesgo ejemplo
el Método IV.
1 Vi Con la : 2.541
Iguales
V. Unidades escogidas con probabilidad proporcional I¿>: 2.579
a tamaño estimado NM&t
11 Iguales Sin 6.048
M
Estimación = yv = y, = media de la muestra AL,
111 — ce Tamaño y, Sin 2.002
La estimación es sesgada ya que, por ejemplo, Mo
IV ¡ í « Tamaño estimado Sin 3.796
ztM 0
V ce Tam año estimado v¡ Con 2.035

Si las z¡ son buenas estimaciones, ¥x está cercana a la media co
rrecta ? = ! , M¡Yi/Mu y el sesgo es pequeño.
368 T E C N IC A S DE M U ESTREO E L SUB M U ESTREO CON U N ID A D E S DE D IF E R E N T E S TAM AÑOS 369
11.5 M ETO DO S D E M U E S T R E O C U A N D O n > 1 segunda etapa o2l2. El submuestreo es independiente en las diferen
tes unidades primarias. Se considera un estimador insesgado del
Para n > 1 los principales métodos de muestreo son extensiones total de población Y de la forma.
» naturales, tanto de los Métodos I a IV precedentes como de los mé
todos discutidos en el Cap. 9A para muestreo de una etapa con Y = Í w^Y, (11.7)
unidades que son conglomerados de tamaños desiguales. Las canti ¡-i
dades más a menudo estimadas son los totales de población, las donde el peso w¡, se conoce para cada muestra s, y puede depender
medias de población por subunidad y las medias o proporciones que de las otras unidades primarias contenidas en la muestra, así como de
tienen la estructura de estimaciones de razón. la unidad i.
En muchas aplicaciones, la cantidad M 0, número total de subuni Adoptaremos el artificio usado en la Sec. 2.9 al dejar vju' , como
dades de la población, es desconocida, y sólo se conocen los M¡ para una variable aleatoria, que es igual a w¡3 si la unidad i aparece en
las unidades primarias de la muestra, que se extraen dado que pueden la muestra, y cero en el caso contrario. Así obtenemos
contarse por medio de una lista. Por lo tanto, vale la pena observar
que los Métodos II y IV y sus extensiones a n > 1, no requieren el Y = I wJYi (11.8)
í-i
conocimiento de JVÍ„ para la estimación del total de población. El mé
todo I y sus extensiones no requieren que se conozca M0 para estimar Ahora bien
la media por subunidad. El Método III de probabilidad proporcional
E (Y ) = E 1E 2(Y ) = E 1I z w í¡' y ) = Y (11.9)
al tamaño, requiere el conocimiento de M 0. \ ,-= i /
Las estimaciones se denominan autoponderantes cuando simple

mente son-un múltiplo del total sobre todas las subunidades de la si y sólo si E J w ¡/ ) = 1 para cada i.
muestra. En vista de la conveniencia práctica de las estimaciones Teorema 11.1.
autoponderantes en encuestas a gran escala, debe observarse la con
dición en la cual cada estimación se vuelve autoponderante. Para las V (Y ) = v{ i = v( I w„ y ) + 1E J w S W ■ (11.10)
'i - 1 ' \ - l • i= l
estimaciones insesgadas, la condición será, como veremos, que cada
unidad de la segunda etapa en la población, o más generalmente, Prueba. Por la Fórmula (1 0.2),
cada unidad de la última etapa del muestreo, tenga la misma oportu
nidad de extracción. V ( f ) = V 1[E2( f ) ] + E l[V 2( t ) ]
11.6 DO S R E S U L T A D O S U T IL E S = h ^ )+ E ,[ £ w S V A t,)] (11.11)
Al investigar varianzas y estimaciones de muestra son útiles puesto que la covarianza de segunda etapa entre Y¡ y Y¡ es
ios dos siguientes resultados. Consisten en mostrar cómo se extien cero, porque el submuestreo es independiente. Por lo tanto,
den los resultados del muestreo de una etapa a resultados de muestreo
de dos etapas o muestreo de múltiples etapas. Primero los probó
v ( í ) = \Á i *vüy f) + z [ £ , ( * * ' W ] ( 11. 12)
Durbin (1 9 5 3 ) para estimadores que son sumas de estimadores '¡- i ' ¡-i
para las unidades primarias de la muestra y posteriormente, Des Con esto se completa la prueba.
R aj (1 96 6) los extendió a funciones lineales de los estimadores de El primer término en (11.12) es la varianza del estimador co
las unidades primarias, y nuevamente, Rao (1975b) los extendió rrespondiente, cuando cada unidad primaria de la muestra se enu
a casos más complejos. Seguiremos el estudio de Des Raj. mera totalmente y se obtiene a partir de resultados del muestreo
Las unidades primarias se eligen sin restitución con probabili en una etapa.
dades iguales o desiguales. En la i-ésima unidad primaria, sea f,
Ejemplo. Para el análogo de dos etapas del estimador de Horvitz-Thomp
un estimador insesgado del total de unidad Y¡, con varianza de
son, Yh t ~ ¿ f 'Jir„ el wi> = 1/2r> si la unidad * esta en la muestra y
370 TE C N IC A S DE M U E S TR E O E l. SIIB M U E STR E O C O N U NID AD ES DE D IF E R E N TE S T A M A Ñ O S 371
cero en el caso contrario. De modo que E , ( w ia'2) = Tj/irj2 = l/w{ , donde

iri es la probabilidad de extraer la unidad i-ésima. Además, s i m t subunída- íi¿?a(z «I,' y;2+ 2 £ £Z,'sy y ) + E lE 2( í Wa’á 2i'2)
' i ¡ i> ¡ ' x '
des se han extraído de entre las JVÍ¡ por muestreo aleatorio simple, siempre
que se extraiga la unidad i-ésima,
^ ,iy íy ,M M z í!J .v C1U3) = B l( í a ¡s'Y i2+ 2 l I b ^ Y ^ + U V M + E 2^ ' ) ] ^ (11.19)

' i i j> ¡ ' I
m,
En (1 1 .1 9 ) hemos usado los resultados en los que E (a ¡/ ) = V (w ¡/ )
A si pues, por el Teorem a 11.1 y usando la Fórmula (9 A .4 2 ) como análogo
de una etapa de V ( Yln.), tenemos y en los que para todo i, E ,(w ¡/ ) = 1 = E,2(w ¡/ ). A continuación
(11.14) E v ( l w „ y )] = v ( f wb Y¡) + £ £ , ( * „ '2W = v {| w ,,y ) (11.20)

'ir,- ir/ i- i m,7r,
Teorema 11.2. Supóngase que tenemos una estimación insesga por (11.12), y así concluye la prueba.
da CT-2,2 de la varianza de segunda etapa de <r2i2de y¡, y una estimación Consideramos ahora algunos estimadores específicos del total de
población Y. En encuestas muy extensas la selección de las unidades
muestral insesgada de V (£ w í3Y í ) = V ^ v v ^ y ) del muestreo de una
primarias con probabilidades desiguales ha llegado a ser la técnica
etapa. Esta última será una forma cuadrática como más usada. Las Secs. 11.9 (muestreo con restitución) y 11.10
(muestreo sin restitución) tratan sobre estos dos métodos; la Sec.
t'(lv v ¡íY¡) = £ a uYj2+ 2 l (11.15) 11.13 presenta el estimador de razón en muestreo ppz. Otras Secs.
' ' i i ) >/
(1 1 .7 ) y (1 1 .8 ) dan los métodos correspondientes, cuando las uni
Entonces, un estimador muestral insesgado de y [¿ w^Y,) es dades primarias se eligen con probabilidades iguales.
= (£ «(, ^ + 2 1 1 w ^ 2f2 (íi.id)

' ' v¡ ¡ /•>( / 11.7 U N ID A D E S S E L E C C IO N A D A S C O N P R O B A B IL I
Por lo tanto, la regla para construir el estimador muestral de \/(f w¡sY¡) D A D E S IG U A L E S : E S T IM A D O R IN S E S G A D O
es: en un estimador insesgado de V{f,w¡sY,) de la primera etapa del
muestreo se inserta Y, en donde aparece Y¡. A esto se suma el tér- Salvo mención de lo contrario, las m.i subunidades de muestra
n rt A
mino £ (w^ú-j;2), donde £ w^Y, - Y, y <f2,2 es un estimador insesgado que pertenecen a la i-ésima unidad se tomarán con muestreo alea
torio simple. El estimador insesgado del total de población es
de V2(í¡-).
* N n N "
Prueba. í 'u = - l A í y . = - I Y¡ (11.21)
n n
y ( L wís' y ) = 1 Y 2V ( ^ ') + 2 £ £ Y ^ c o v íh V v V ) (11-17) Para aplicar el Teorema 11.1, obsérvese que
ví ' i /y>i
Introdúzcase la variable aleatoria, ai3', donde a¡,/ = a,, si la uni
= E (v O = ~ = l ; E0v,/2) = ^ =-
dad i pertenece a la muestra y ait' - 0 en el caso contrario. De ma n N n N n n
nera semejante, sea = b iU, si las unidades i y j pertenecen a la en consecuencia, por el Teorema 11.1 y resultados anteriores
muestra y b'n, = 0 en el caso contrario. A partir de (11.15) para
muestreo de una etapa
01.22,
n — i) n m,
« { i m'ú'Y,) = £ a,/ Y 2+ 2 £ £ Z ^ y y (11.18)
V ' ■ i ;> l donde fu = rnJN l,. El estimador se hace autoponderante si fu es
constante, ( - f„, digamos). Entonces tenemos
Si esto debe ser insesgado, al comparar (11.18) con(11.17) se ve
quedebemos tener E, (a ,/ ) - V («/¡/). Ahora, paranuestro estimador
de la varianza (11.16)
E L SUBM UESTREO CON U N ID A D E S D E D IF E R E N T E S TAM AÑOS 373
Así como con Yu, este estimador se hace autoponderante si

La cantidad nf»/N es, desde luego, la probabilidad de que se extraiga
cualquier unidad de segunda etapa. c m¡ , , , m Nm
f2 i= T 7 = constante^ = T = —
Para una estimación muestral insesgada de la varianza, el Teo M¡ M M0
rema 11.2 proporciona, a partir de (11.16),
En este caso, la contribución dentro de unidades se puede ex
presar más simplemente al poner m¡ = NmM¡/M0, lo que da
JV2(1 - / ,) ? ( f '~ YJ2 , ( n 24)
n n —1 n ¡ m¡
E C M ( f , ) ^ (l (11.28)
11.8 U N ID A D E S S E L E C C IO N A D A S C O N P R O B A B IL ID A Puede observarse el parecido con la fórmula correspondiente en la

DES IG U A L E S : E S T IM A C IO N D E L A R A Z O N A L T A M A Ñ O que las unidades primarias son del mismo tamaño. De (10.14) Sec.
10.3, tenemos, al multiplicar por M 02 ya que Y = M 0y,
El estimador del total de población Y es
V( t )■,jSrt1- é ) r ■-n +m„*(i - A) » m
YR = M oZ J * h = M 0P ± (11.25) (N -l) nm L \n ) S2í (1L29)
I M, Z Mi La diferencia es que en (11.28) las contribuciones de los ECM
Este es un estimador de razón característico ya que tanto el de las unidades primarias son ponderadas, pues las unidades más
grandes reciben mayor peso.
denominador como el numerador varían de una muestra a otra.
Se utiliza principalmente para estimar medias por subunidad, en Por el Teorema 11.2, una estimación muestral aproximada del
donde no se requiere el conocimiento de M0 y en donde este esti ECM Cf*) en 11.27 está dada por
mador es una extensión del método I con n = 1.
Para encontrar su ECM aproximado, escríbase »(»«> = ^ a M r iz L K !
n n -1 n m¡
donde Y r = i M tfJ Z M, = Y J M ».
Y* - Y - J & - y^ Í M¡(y, - Y ) (11.26)
Cuando este estimador se utiliza para estimar la media de po
IM ,
donde Y = Y fM 0. blación por subunidad, tenemos f R = t Y / t M , y » A ) = 0 (f* )/ M oa.
n A
Dado que Yu = (N/n) podemos obtener el E CM (YR) aproxi Cuando M0 se desconoce, sustituimos M 0 = N (¿ M,-/n) en v ez de M„ en
mado, a partir de la Fórmula (11.22) para V (Y „), al sustituir el cálculo de v ( f K).
W ( y ¡ - Y ) en vez de M¡y¡ o más generalmente, (y ¡ ¡- Y ) para y,,. Cuando se seleccionan unidades primarias con probabilidades
iguales, una estimación alternativa de la media de población por
Ahora (11.22) es
subunidad ( otra extensión del método I ) es
V( Yu) = — (1 Zn (y i+ ? 2 + •••+>„)
n N - 1 n" m¡
En la sustitución, Y¡ = M¡Y¡ se convierten en M ¡ ( Y , - Y ) en tanto Esta estimación es autoponderante si m¡ = constante, como en el
que y = £ y J N se reemplaza por 0. También, S2,2= I (y,¡ - Y¡)2/(M, - 1) ejemplo que sigue. Cuando m¡ y Y¡ están no correlacionadas, esta
permanece inalterado cuando (y ¡ j - Y ) reemplaza a!y¡¡. Esto nos da estimación puede ser satisfactoria, pero es susceptible de un sesgo
el resultado que no se anula ni aun con n grande.
Ejemplo. Del volumen, Am erican M en o f Science, se tomaion 20 páginas
al azar. De cada página se registraron las edades de dos científicos, también
374 TE C N IC A S DE M U ESTRE O E L SUBM U EST8EO CON U N ID A D E S DE D E F E R E N T E S TAM AÑO S 375
elegidos aleatoriamente. El número total de biografías por página, varía en Como M „ = 359/20, estimado de la muestra, se obtiene,
general entre 14 y 21. Estimar la edad promedio y su error estándar de los
datos de la Tabla 11.6, usando el estimador de razón. ,1 » (20X571300)
(19)(359)*
De la columna extrema derecha,
s( Í r) = 2.16,años
* m 17 g ^ - 4 7 . 7 años
r* 2 Mi 359 11.9 U N ID A D E S S E L E C C IO N A D A S CO N P R O B A B IL ID A
DES D E S IG U A L E S Y C O N R E S T IT U C IO N : E ST IM A D O R
T A B L A 11.6. E d a d e s d e 40 C i e n t í f i c o s en Am erican Men o f Science
IN S E S G A D O
(n = 20, tíi = 2)
Edades Las unidades primarias se seleccionan con probabilidades pro

Unidad Total porcionales a z¡ con restitución. Los resultados para z( = AL/AL,
No. Mf ya y ¿2 Vi (probabilidad proporcional al tamaño) siguen como un caso especial.
La subniuestra de m , subunidades de la i-ésima unidad se supone
1 15 47 30 77 577.5
extraída aleatoriamente sin restitución. Si la i-ésima unidad se selec
2 19 38 51 89 845.5
45 88 836.0 ciona más de una vez, se supone que en cada selección se restituye
3 19 43
16 55 41 96 768.0 la totalidad de la submuestra, al hacer una nueva extracción in
4
5 16 59 45 104 832.0 dependiente de m¡ unidades sin restitución de la unidad completa.
6 19 39 38 77 731.5 Una estimación insesgada del total de población es
7 18 43 43 86 774.0
8 18 49 51 100 900.0 ( 1U1)
9 18 45 35 80 720.0
10 18 46 59 105 945.0
Paran = 1, se mostró en la Sec. 11.3 que este estimador, M 0y fV=
11 20 71 64 135 1 350.0
Yiv.es insesgado. Su varianza se obtiene de la Fórmula (1 1 .5 ) al
12 18 35 46 81 729.0
61 54 115 1 092.5 multiplicar por M02 como
13 19
14 7 19 45 87 132 1 254.0
15 18 31 38 69 621.0 v (L ). (1L32)
i= i \Z¡ ) ¡.1 z .n ii
16 16 64 39 103 824.0
17 16 63 47 110 880.0 Con este método de muestreo, el estimador Yppz es la media de
18 19 36 33 69 655.5
n estimaciones independientes de la forma Y¡v. En consecuencia,
19 19 61 39 ¡00 950.0
19 54 34 88 836.0 a partir de la teoría clásica del muestreo se sabe que Yppz es inses
20
gado y
Totales 359 1 904 17 121.5
g -f& u ' ( I i .33)
n «¡.i \z¡ / n¡. i m,z¡
n / N puede ignorarse. tenemos de (1 1 .3 0 ), al dividir por M, Además, dadas las n estimaciones independientes YIV = YJz„ un
2 estimador muestral insesgado de V (Y ÍV) es, desde luego,
nM2(rr -1)
¡ = l 'Z ¡ /
El numerador se calcula como
t ( Y lv) = " ‘ (11-34)
(n-1)
X(Hy,): - 2f a i c m m + t 21 H 2 En consecuencia, un estimador muestral insesgado de V(Y ppz) es la
= 15 375 020-(95.3844X 309 747.5)+ (2274.55X6481) = 571 300 expresión muy simple
ET. S U B M U E S T R E O CON U N ID A D E S D E D IF E R E N T E S TAM AÑOS 377
extraído la unidad) con cualquiera de los dos métodos. El efecto

i ( f - t j f es un incremento de V (Y ppz)e n la cantidad
( I 1 '3 5 ) (1 ~f2i)S2l2
m¡
Estos resultados también son válidos para el muestreo de múl
P a ra e l m is m o co sto , T ara v e z p u e d e e s p e ra rs e q u e la s d ife re n c ia s
tiples etapas, siempre que Y¡ sea un estimador insesgado de Y¡, y
e n p re c is ió n e n tre estos m é to d o s s ea n su stan ciales.
que el submuestreo sea independiente cuando se extraiga una unidad
Si z¡ = Mj/Mo la estimación insesgada (11.31) se reduce a
primaria.
Para descubrir en qué ocasiones Yppz se hace autoponderante en
dl-39)
el muestreo de dos etapas, escribimos n i
Es claro que esta estimación se hace autoponderante, cuando m{ - m ,
(11-36) para que Ypp, = M 0y.
n i z¡m¡ ¡
Un estimador muestral insesgado es
Por lo tanto, la condición es
= constante = f 0 (11.37)
Ai
Esta expresión es la probabilidad de extraer cualquier unidad espe 11.10 SE LE C C IO N D E L A S U N ID A D E S SIN R E STITU C IO N
cífica de la "segunda etapa. A partir de (11.37), m J M i = f j n z {.
Si la probabilidad f0 se elige de antemano, se podrá decir al trabaja Para cualquiera de los métodos “sin restitución” estudiados en el
dor de campo qué fracción de la segunda etapa m 4/M¡ debe tomar Cap. 9A, se obtienen las fórmulas para la varianza, y varianza esti
de cualquier unidad primaria ele<J4a. Por ejemplo, supongamos f 0 = mada en muestreo de dos etapas, a partir de los Teoremas 11.1, 11.2.
1/50 = 0.02 y ?z = 60 unidades primarias elegidas. Si z¡ = 0.0026 Con los métodos de Brewer o Durbin,
para una unidad seleccionada, debemos tener m ¡ / M i = 0.02/(60)
(0.0026), o 1 en 7.8. Yf l = f — = (11.41)
Con una muestra autoponderante, el estimador de varianza 7r¡ n z¡ n z¡
con varianza
(11.35) toma la forma más simple
v tfc )- í ( 1 i .4 3 )
( u '3 8 )
i ¡> ¡ '77i T T j' i 771,71¡
donde y¡ = I y¡j es el total de muestra en la unidad i-ésima. La senci Para elestimador correspondiente Yppzen muestreo con restitución,
llez de las7 varianzas estimadas (11.35) y (11.38) es un rasgo tenemos, a partir de (1 1.33 ), con ^ = nzt,
atractivo del muestreo con restitución.
Con este método, hay otras maneras de extraer las submuestras. v ( ÚppJ = - Z Z ( ( - ~ y ) 2+ í M,2{1 ~ f2i)S2‘ (11.43)
ti \ Z ¡ / 771,77;
Si la unidad i-ésima se selecciona t¡ veces, una variante del método
Puesto que las contribuciones “dentro de unidades” a la varianza
es la extracción de una sola submuestra de tamaño ti7n¡ sin resti
son las mismas en (11.33) y (11.43), cualquier ganancia relativa
tución, a condición de que M¡ > m¡t¡. Sukhatme (1 95 4) ha mos-
N 2 en la precisión al seleccionar unidades sin restitución, se diluye en
trado que con este método, V(Yppz) se reduce en ( « - 1 ) T. M íS2¡ /«• Otro las muestras de dos etapas por la contribución intraunidades a la
método es el de extraer una sola submuestra de tamaño m-x sin im varianza. Por ejemplo, en un muestreo de varias etapas estratificado
portar cuántas veces se selecciona la unidad i-ésima. La estimación de ti = 44 provincias, entre N = 147 provincias, Des Raj (1964)
encontró que la razón V (Y WOR)/ V (Y WR) promediaba alrededor de 0.79
M ,y jz t de esta unidad recibe el peso t( (número de veces que se ha
378 T E C N IC A S DE MG’ E STRE O EL SUB M U ESTREO CON U N ID A D E S D E D IF E R E N T E S TAM AÑO S 379
sobre siete atributos para la componente entre unidades, pero el pro to, la estrategia consiste en usar métodos de selección que hacen
medio de la razón sobre ambas componentes era 0.92. (niTTfTrif1 — 1 ) igual a 1 o 0. Estas elecciones dan como resultado la
Con n = 2, una estimación muestral insesgada de V (Y B) es reducción de u(Yht) en (1 1 .4 4 ) al término
W - l ) i ( U 44;
' 7rl 7r2 ' ¡” 1 Wj-TT;
donde los subíndices 1, 2 denotan las unidades elegidas.
o al segundo término de (11.44). Brewer y Hanif (1 96 9) mejoraron
La extensión al estimador de Sampford para n > 2 es directa. y extendieron los métodos a estimadores diferentes de Yht-
El estimador alternativo de RHC
(11-45) 11.11 C O M P A R A C IO N D E L O S M ETODOS

s zs
donde Z K= £ z, sobre el grupo ,g-ésimo y M g, yg, y zg se refieren a la En muestreo de una etapa (Sec. 9A.12), se comparó el
unidad extraída del gmpo. Para una muestra de n unidades, un muestreo con probabilidad igual y con la estimación insesgada
estimador insesgado de V(Y)u/c) es Yu con las estimaciones de razón correspondientes y con varios mé
todos de muestreo de probabilidades desiguales. Dicho brevemente,
( y n 2~ n ]
la razón de la varianza de Yu a la de otro método que rnuestreaba sin
v (Y * ” c ) ( N 2- Z N > ) j z A zx Y rh c) + t Z * z g restitución, era igual a la razón del coeficiente de variación del total
(11.46) de unidad Y ¡ a la de Y ¡/ Z i. En lo que respecta al muestreo con pro
Las Fórmulas (11.44) y (1 1 .4 6 ) requieren cálculo separado de babilidades desiguales con y sin restitución, la razón V(V'S2 )/ V (Y CK),
las contribuciones a la varianza estimada entre unidades y dentro era más o menos igual a ( Y - n ) / ( N — 1 ), al igual que en la
de unidades. En encuestas extensas con numerosos estratos y atri selección con probabilidades iguales.
butos, la complicación de tales fórmulas hace que la estimación En muestreo de dos y más etapas, el efecto neto de la contri
de las varianzas se convierta en un trabajo que requiere más tiem bución a la varianza dentro de unidades es diluir las diferencias
po de computadora del que posiblemente se le puede dedicar en la creadas por las contribuciones entre unidades. Con los métodos de
práctica. Recordemos la forma más simple de la fórmula de la varian submuestreo usados en la práctica, la contribución dentro de uni
za (11.35) cuando se extraen las unidades con restitución; esto es dades suele ser aproximadamente la misma para los diferentes mé
todos. El efecto neto es que las precisiones relativas globales de
ü( * ppz> = n ( n - l ) % ( l ~ ~ Yppz) diferentes métodos se acercan a la igualdad. En la práctica, la com
donde y¡" = AfiyI-/z(. Este resultado hace más atractivo el muestreo con ponente dentro de unidades suele ser, cuando menos, tan grande
como la componente entre unidades.
restitución, si no conduce a una gran pérdida de precisión.
Aun si contamos con computadoras poderosas, las formas auto-
Entre los métodos sin restitución, Platek y Singh (1 9 7 2 ), al
ponderantes de las estimaciones son convenientes y muy utilizadas.
planear la reorganización de la encuesta sobre la fuerza del trabajo
El uso de un plan autoponderante debería acarrear tan sólo una
canadiense para estratos en los que nh = 6 , o un múltiplo de 6,
pérdida de precisión de poca importancia, porque la elección de los
señala las ventajas de Yrhc y de la versión de Hartley-Rao del m ¡ sólo afecta la contribución a la varianza dentro de unidades. La
muestreo sistemático (Sec. 9A.10) en cuanto a sencillez y estima forma autoponderante requiere mi cc M-Jzít en tanto que el m¡ que
ción de la varianza. minimiza V.. para un número total esperado de subunidades es
Para el caso de numerosos estratos pequeños con nh = 2, Durbin t?i¡ cc M ¡Sji/z¡. Estas dos asignaciones difieren poco, a menos que
(1 9 6 7 ) ha producido métodos que dan una estimación de varianza S2i varíe dentro de una gama importante de valores.
simple si las unidades se seleccionan sin restitución. Este autor usa En las encuestas de muchos atributos, también observamos (Sec.
YhT e investiga métodos para los cuales t¡ = 2zt. Dentro de un estra- 9A.13) que las z¡ usadas para selección de muestra podían no ser
380 T E C N IC A S DE M UESTREO EL SUBM UESTREO C O N U N ID A D E S DE D IF E R E N T E S TAM AÑO S 381
una buena elección respecto a algunos de los atributos, cuando Y, ta son el ingreso promedio de familias suscritas a una cierta revista, o
tuviera poca relación con z{. Si se puede encontrar una variable auxi la cantidad promedio de dinero para gastos menores que tiene un
liar x¡ tal que y¡/x* sea razonablemente constante, una posibilidad adolescente,
es la de cambiar a la estimación de razón (Sec. 11.13). Si no se dis Con cualquiera de los métodos precedentes de selección de uni
pone de tal Xi, la estimación alternativa que sugiere Rao (1 96 6) es dades (probabilidades iguales o desiguales, con o sin restitución),
de la forma
la fórmula aproximada estándar para el ECM de la varianza de YR
y R se obtiene fácilmente de la fórmula para V (Y ) para el mismo
Y-*P, = ^ Í H y , (11.47)
n i método de selección de muestra por la técnica que hemos usado
La evidencia preliminar mostrada por Rao, sugiere que si Y¡ y z¡ no repetidamente.
están relacionadas, Y*p. se puede comportar casi tan bien como lo Para obtener V (Y R), se reemplaza y {j por dii = y¡¡-Rx,l en V (Y )
haría Yu si el muestreo fuese con probabilidades iguales (com o se para el método de muestreo usado. Para V {R ), se divide también
ilustra en la Sec. 9A.13). Si se eligen las unidades primarias con por X2.
restitución, una estimación muestral insesgada de V (Y * « ) es Para el ECM estimado o varianza estimada v (Y R), se reemplaza
y¡¡ por d / = yi, - R x ij en v {Y ). Para v2(R ), también se divide por X 2.
0( f p =^ T T j i W i (11 -48) Esto resulta por el método usado en el Teorema 2.5. Para
donde Y%¡ = Y % JN . Esta expresión no incluye la contribución del Y X

YR - Y = X j r - Y = j r ( Y - R X ) = ( Y - R X ) = D (11.49)
sesgo en estg. estimación de su ECM, que se espera pequeña si
Y| y zs no están relacionadas.
donde dij = yii- R x ij. Dado que E (D ) = 0 con cualquier plan de mues
treo en el que Y y X son insesgadas, encontramos E (Y R - Y ) 2 al
11.12 R A Z O N E S A O T R A V A R IA B L E tomar la fórmula para V (Y ) para este plan y al sustituir d,, = y,¡ - Rx¡¡
en lugar de y¡,.
En muestreo de dos etapas, la cantidad que se debe estimar es
a menudo una razón Y/X. Esto ocurre por dos razones diferentes. Por ejemplo, consideremos Yu = (N/n) £ M¡y, = (N/n) £ Y, en mues
Como ya dijimos antes, si x es el valor de y en un censo reciente, treo con probabilidades iguales. De la Fórmula (1 1.22 ), Sec. 11.7,
la razón y/x puede ser relativamente estable. Una estimación del
total o media de población de y, basados en esta razón, puede ser v t f j jí o
rt rs — i n m.
más precisa que las estimaciones consideradas basta aquí en este
capítulo. Por lo tanto, con muestreo de probabilidades iguales YR = X Y J X U,
Las estimaciones de razón de este tipo también se encuentran
al estimar proporciones o medias sobre partes de la población. En
una encuesta urbana con unidad primaria, donde las unidades pri n N —1 n m,
marias son las manzanee de una ciudad, un ejemplo de una propor donde
ción de este tipo es
número de empleados de sexo masculino de más de 16 años de edad ^ a = T r - r Z [(y¡/ - Rxq) - ( Y¡ - R X t)]2
M¡ - 1 ¡_1
número total de habitantes de sexo masculino, mayores de 16 años
Las condiciones en las cuales YR se reducen a un múltiplo de la
Si ya = 1 para cualquier empleado de sexo masculino, mayor de
razón de totales de muestra 1'lyíj/'XLxlj siempre son aquellas en las que
y y u - 0 en el caso contrario, y r ¡ j = l para cualquier habitante
la Y correspondiente se hace autoponderante, en este caso fu = m j
del sexo masculino mayor de 14 años y x¡, = 0 en el caso contrario, la
proporción de población es Y/X. Otros ejemplos de este tipo de encues Mi = constante.
382 T E C N IC A S DE M U ESTREO El. SU BM U ESTREO C O N UNID AD ES DE D IFERE N TES T A M A Ñ O S 383
Para la varianza estimada, la sustitución de d¡¡' = y ¡¡- Rx¡¡ para y¡,- La más simple de las funciones de costos contiene tres términos.
en (11.24) para v(Y u) da cu = costo fijo por unidad primaria
Cj ■= costo por subunidad
(11.52)
n n —1 n mt c¡ ■= costo de la lista por subunidades en una unidad seleccionada
De modo semejante, con selección ppz de probabilidades propor El tercer término se incluye porque generalmente se debe hacer una
cionales al tamaño z con restitución teníamos lista de los elementos de cualquier unidad seleccionada y se debe
verificar el número de ellos para extraer una submuestra. Por lo
Yppz = ~ l M y J z , tanto,
costo = cun + c 2 Í m¡ + c, £ M,
(de (11.33) en la Sec. 11.9)
Esta fórmula no es útil en la forma que aparece, pues el costo de
(H .53) pende del conjunto particular de unidades elegidas. En lugar de
n \z¡ J n z¡m¡ esto, se considera el costo promedio sobre n unidades, que es igual a
Por lo tanto, para YR = X Y j X en muestreo sin restitución,
E (C ) = cun + c2nm + c,nM = (cu + c¡M)n + c 2nm = c ln + c 2nm (11.58)
V( ) = - £ - ( Y, - R X f + - £ — ( 11. 54) donde c, incluye ahora el costo promedio de hacer la lista de una
Ti Zj H TTl¡ unidad.
D'e (1 1.35 ), una estimación de muestra v(YR) ligeramente ses Determinamos n y m = f .M para minimizar V(y) para un costo
gada es dado o viceversa. De (11.28) Sec. 11.8, al dividir por M02 = (MN)2,
' ” .55) ECM(?) - 1 z l l

Ky> n M ( N —1) nm L M0 21
Con el método de Brewer del muestreo sin restitución YRB = Escríbase
X Y b/Xb, donde YB =£M,y,/Vi- Para n = 2, las Fórmulas (11.42) y N
(11.44) dan, para la estimación de razón, , 22 _ _Z M h Y i - f j 2
M 2( N - 1)
V (Y rb ) = I l {ir.TTj-Tr^y----- ~ L) + I ----- — — (11.56)
l j>l ™¡ 1Tj / ¡- I m¡TT¡ Esta es una varianza ponderada entre medias por elemento de
unidades. Es análoga a la varianza S,= de la Sec. 10.3 y se reduce
donde D¡ “ Y¡ — RX¡ y las unidades t y j son las dos seleccionadas.
a S r si todos los M¡ son iguales. También podemos escribir
/* t /
v ( Y RB) = (iriiTiirll
- - 1n) (( ó—----
' V-J
A V +. Lf M 2( l - / 2, ) i k
---------— --------- (11.57) < 2_ f M e 2
\7T¡ TTj I (=1 WtyJTj
Esta es una media ponderada de las varianzas intraunidades. Se re

11.13 E L E C C IO N D E F R A C C IO N E S D E M UESTREO duce a S,2 de la Sec. 10.3 si todos los M ¡ son iguales.
Y SUBM UESTR EO . P R O B A B IL ID A D E S IG U A L E S En esta notación, dado que f 2= m/M,
Primero se discute el problema para la estimación razón a ta

e c m w = ¿ ( s , 1- ^ ) + 4 s 2! - 2 - s 4! (11.59)
maño, cuando las unidades se toman con probabilidades iguales. La n\ M I nm N
fracción de submuestreo fs = m ¡/M ¡ se supone constante, así que Al aplicar la desigualdad de Cauchy-Schwarz, como de costumbre, a
la estimación es la media de muestra por subunidad. (11.58) y (11.59) obtenemos
EL SUB M U ESTREO CON U N ID A D E S DE DEFERENTES TAM AÑOS 385
384 T E C N IC A S DE M UESTREO
Tómese A y p. como multiplicadores de Lagrange, y minimícese.
V + A^ + c2f 0M 0+ c, Z ir¡M¡ ~ E ( Q J + ¡í{n - £ ir¡) (11.64)

Los métodos dados en la Sec. 10.8 para usar el conocimiento que se
Por derivación se tienen
tiene respecto a las razones S2/Sb y c,/c 2 para guiar la selección de
mópt se aplican aquí. La estimación insesgada, cuando las unidades n: Acu + m = 0 ; /í = -A c u ( 1 1 .6 5 )
se extraen con probabilidades iguales, puede manejarse en forma

parecida. ir,: = 4 - ( d i2- ^ 7 í) + A c , M - M = 0 (11.66)
7T¿ ' M .¡ /
La siguiente sección presenta un análisis más general de este
problema. Las relaciones (11.65) y (1 1 .6 6 ) conducen a
z , = ^ o c M , ( a 2 - m / (Cu + (1 1 . 6 7 )
11.14 P R O B A B IL ID A D E S D E S E L E C C IO N O P T IM A
Y T A S A S DE M UESTREO Y S U B M U E ST R E O Como los valores individuales de {D ? -S ¿ 2J M ¡) no se conocen,
Un análisis antiguo, pero importante, de Hansen y Hurwitz podemos considerar la manera como el valor promedio puede de
( 1 9 4 9 ) determina simultáneamente las z, óptimas como funciones pender del tamaño de la unidad M¡, al usar el siguiente argumento
de los M¡ y las fracciones óptimas de muestreo y submuestreo. Las más o menos burdo. Supóngase que se dividiera una población
unidades se seleccionan con restitución. El análisis se presenta para en unidades de tamaño M. Como E (D ¡) = 0, la fórmula (9.10),
en la forma autoponderante, de modo que mi = f QM i/nzi = f 0M Jrri. Pág. 298 da
Como en la Sec. 11.13, la función de costos es
n n E & f t = Y ( A ) = ^ [ 1 + (M -D P w ]
C = c un + c 21 m, + c , I A Í
Aunque se conocen los M¡ se incluye un costo de lista para aquellas donde es la varianza de población de los d¡j y p¡¡ es la correlación
unidades que caen en la muestra, porque esta lista será necesaria intraunidad para unidades de tamaño M. También d e (9 .1 5), Pág.300,
para proporcionar un marco al submuestreo.
E (S 2d2¡)= S d2(l ~ P ^ )
El costo promedio de muestrear n unidades es
por lo tanto,
E (C ) = cun + C2f 0M ll-\-cl T,-rrM¡ (11.61)
Por ( 1 1 . 5 4 ) enla Sec. 11.12, E( - ~ % ~ ) ~ M 1

[1 + 1
{ M “ l)PM {1 ~ Pm)] = PmS*
De (1 1 .6 7 ) esto nos da como una aproximación
V (Y B) = - í l - ( Y - R * , ) 2 + M‘ ~ S Ú (11-62)
n L z¡ z¡m¡ J
Dado que d¡j = yit- R x ij, podemos escribir (Y ¡ -R X ¡ )- M ¡D ¡ . A l observar ( 11.68 )
v cu+ c¡M¡
que 7r, = nz¡, Mjnz¡mi = l//0, y combinar los términos primero y tercero
con p positivo, se puede esperar que Pui decrezca al aumentar Mi,
en ( 1 1 . 6 2 ) , obtenemos
porque las subunidades muy distantes entre sí están menos sujetas
a influencias comunes, pero esta disminución puede ser solamente
ligera para V f <sT. Las deducciones a partir de (11.68) son las si
El problema está en elegir n, f 0 y las = nzi para minimizar guientes :
V, sujeta a un costo promedio fijo y a la restricción
1. El costo de poner en lista c¡M¿ no es importante, z ( cc M¡ (es
N N
I z ¡ = l, I> / = n decir, selección pps) es la mejor si V pm varía poco sobre la gama
386 -T E C N IC A S DE M U E S TR E O
E l. SU BM U ESTREO C O N U NID AD ES DE DIFERENTES TA M A Ñ O S 387
de valores de tamaños en la población. Si \rpî decrece notablemente, dentro de los estratos, si la probabilidad f„h = nnzKim hi/Mhi de selec
las probabilidades óptimas están entre z* « M* y z¡ ce VAÍi. ción de una subunidad en el estrato es constante dentro del estrato.
2. Si los costos de lista predominan, z{ caería entre V M ¡ y una En este caso, la estimación viene a ser
constante (probabilidades iguales).
3. Si los costos de lista y los fijos son del mismo orden de mag ? « = Z t - Í yu (11.73)
h JOh i
nitud, z¡ « puede ser un buen compromiso.
que es completamente autoponderante si es la misma en todos los
La derivación de (11.64) con respecto a la fracción de muestreo estratos como intuitivamente podría preverse.
global f0 da
Si las unidades dentro de un estrato dado son del mismo tamaño
(esto es Mu = A L ), en la Sec. 10.10 se mostró que la asignación
X W S ¡2¡
fa = muestral que conducía a una estimación completamente autoponde
Ac2M,> (11.69)
rante se acerca al óptimo a condición de que S2h/ V c¡¡¡ sea razonable
El valor de A se encuentra en términos de las t conocidas, al sumar mente constante. Cuando los M u varían dentro de los estratos, un
(1 1 .6 6 ) sobre todas las unidades. Este paso lleva al resultado resultado correspondiente para los estimadores como Y y Ye es el
1/2 siguiente. Supongamos que la función de costos es lineal, como
/o = en las Sec. 11.13 y 11.14, y que el estimador es autoponderante den
(11.70)
tro de los estratos (es decir, foi = n^Zumu/Mu)- Entonces, el óptimo
para un costo esperado dado, se puede mostrar que es de la forma
Al comparar con (1 1 .6 0 ), se verá que tiene la misma estruc
tura que en el muestreo con probabilidades iguales, si recordamos foh x - = / X (AL./M 0h)S\hi (11.74)
que en (11.60), - n m ^ / M * y c , «= c„ + CiM. vc 2/, ■'
El óptimo n se encuentra de la ecuación de costo promedio donde Aí0* - l M k¡. Así, la elección f„* = f„, que hace estos estimadores
(11.61).
completamente autoponderantes, será cercana al óptimo en cuanto
a precisión, a menos que S^. o bien, los c2h varíen mucho entre estra
11.15 M UESTR EO E S T R A T IF IC A D O . E ST IM A D O R E S tos, en especial porque esta elección sólo afecta la contribución de
IN S E S G A D O S segunda etapa a la varianza.
Para los métodos insesgados ( Yu, Y^., YB, etc.) la extensión al

11.16 M UESTREO E S T R A T IF IC A D O . E ST IM A C IO N E S
muestreo estratificado es directa. E l subíndice h denota el estrato. DE R A Z O N
El total estimado de población es Y„ = £ Yk, con
Las fórmulas para la estimación separada Y*, resultan de las de
v (9 „ ) = i v ( 9 „ ) (11.71) la Sec. 11.12 para un solo estrato, al suponer una muestra grande en
h h
cada estrato y muestreo independiente en diferentes estratos.
Estas varianzas se pueden obtener de las fórmulas ya dadas. Para la estimación combinada, YKc= X Y u/X„,
Podemos observar las condiciones en las que las estimaciones
se hacen autoponderantes. Para Yppz (Sec. 11.9) o YB (Sec. 11.10), YKc~ Y = x Í Y J l X h- Y
Yu = Í - ¿ — (11-72) = - r X (ñ - R Á j= X (n - R Á j
h nh ¡ mh,zh¿ -*3t
donde y¡,¡ es el total sobre las m hi subunidades de la i-ésima unidad Por lo tanto, sustituimos ¿Un = y¡,n — Rxkii en lugar de i/MJ para
en el estrato h. Estas estimaciones se ve que son autoponderantes obtener las fórmulas aproximadas de V (Y Rc) a partir de las corres
E L SU BM U ESTREO CO N UNIDADES DE D IFE R E N TE S T A M A Ñ O S 389
pondientes para V (Y „ ) por el plan de muestreo usado. Para v(Y Rc) varianzas de estimadores insesgados lineales, como Ys„ Y^., o Y m -.
sustituimos d\u = yhi, - R exhii en v ( y j . A l suponer que la muestra es lo bastante grande para que estos
estimadores tengan distribuciones cercanas a la normalidad, las ta
Por ejemplo, con probabilidades desiguales con restitución (Sec.
blas normales darán los límites de confianza y las pruebas de signi
11.9) la Fórmula (11.33) lleva a
ficación. Quedan muchos problemas pendientes para estimadores
no lineales en encuestas complejas.
h nh ¡ \zh, ) zhimhi J Se han introducido tres métodos apropiados para la estimación
de los errores estándar de estimadores no lineales. Se describirán
donde
para muestras aleatorias estratificadas con n* -= 2 en todos los
D ju = Yh¡ - R X hi estratos, caso en el que se han estudiado más profusamente. Todos
los métodos dan las estimaciones insesgadas usuales de la varianza,
s l z k i = - ~ —^ l [ ( y k ¡r ^ i) - ( Y u - R X hí)]2 cuando el estimador es lineal. La muestra puede ser de varias etapas
con unidades primarias extraídas con probabilidades iguales o con
Para la varianza estimada, la Fórmula (11.35) da, después de la probabilidades desiguales con restitución.
sustitución,
11.18 D E S A R R O L L O E N SERIES D E T A Y L O R
I ( Z V - D , ’) 2
Este es el método que dio las fórmulas aproximadas para las
,í^ )4 ^ - i ) (1L76)
varianzas estimadas de R, y R c, R¡ en muestreo estratificado. La
donde
función que se va a estimar, f ( Y „ Y 2, . . . , Y * ) = f ( Y ) se expresa
como una función de los totales de población de ciertas variables, al
I Dhi'
r-, i Aly,,' d fu / I 7 , _ A - ser la estimación f ( Y ) la función correspondiente de las estima
Dhi — , D h ------ , ah¡ - yh¡ - Rcxh,
Zhi nh ciones insesgadas de muestra de Y. Para j variables con nh - 2,
cuando las unidades se eligen por e l método ppz con restitución, el
11.17 E ST IM A D O R E S N O L IN E A L E S E N E N C U E S T A S total de población y su estimador lineal son
C O M P LE JA S
Además de la estimación de totales, de medias, razones y dife

rencias entre éstos, el análisis de los datos de la encuesta puede donde j/yn = y m i/2z*( y Y ih¡ es una estimación muestral insesgada
comprender estimaciones de una estructura matemática más compleja de Yy*( a partir de la submuestra en esta unidad.
(com o serían los coeficientes de correlación simple y parcial, las De (11.35) una estimación insesgada de V ( Y¡ ) viene a ser
medianas y otros porcentiles). Los objetivos de los análisis pueden
incluir la determinación de un intervalo de confianza a la cantidad l,( í > ) = Z Z 2 (y jw—y'jhí^—Y. (y'¡h\~y¡hz)2 0 L78)
h i h
estimada, o bien, la realización de una prueba de significación.
Dada una muestra aleatoria simple de una población infinita, De modo que, por la extensión de Woodruff (1 97 1) en la Sec. (6 .1 3 )
la teoría estadística ha producido toda una variedad de métodos del método abreviado de Keyfitz para n h = 2, una aproximación en
para lograr estos objetivos, métodos exactos de muestras pequeñas serie de Taylor a la varianza de f ( Y ) es
basados sobre algunos supuestos respecto a la naturaleza de las dis
tribuciones que siguen las observaciones y métodos aproximados de v [ f ( Y ) ] ^ l [ Í ( ^ C y y;hi- y 'IH2) ] 2 (11.79)
grandes muestras que requieren menos hipótesis. Por otro lado, con
los tipos más complejos de muestras estudiados en este libro, hemos La expresión de una función no lineal de las variables medidas
podido dar métodos de cálculo de estimadores insesgados de las en la forma / (Y ) puede requerir algún trabajo y precauciones que no
390 T E C N IC A S DE M U E S TR E O E l. SU B M U ESTREO C O N U NID AD ES DE D IFE R E N TE S T A M A Ñ O S 391
son posibles con algunas funciones de interés. Consideremos un ejem l f ( H ) — f ( S ) ¡ t. McCarthy (1 9 6 6 ) observó que se puede encontrar
plo simple, el del muestreo aleatorio simple de una etapa con unidades un conjunto de medias muestras equilibradas en las que, para cada
primarias de tamaños iguales, donde debe ser estimada la correlación par de estratos, la mitad de los signos correspondientes a los pro
entre los totales de unidades de dos variables y U¡. El valor de ductos cruzados del conjunto son + y la otra mitad Si este
población f ( Y ) es conjunto contiene g diferentes medias muestras, los términos de
producto cruzado no deseados se cancelan al sumar sobre el conjun
X X í / J Í X X U 2k) to, lo que da
h ¡ / \h ¡ /
Í í u lu U u u - ' 'h '
h i N - X [/(«!)• - f ( S ) ? - X ( y M '- y , 2')2 = v (Y ) (11.82)
p = g ¡ *
r ÍX X U lh] 1/2 (X X í^ 2Ai) 1/ 2 Si Ci es la media muestra complementaria de Hi, tenemos como
segunda y tercera formas
En términos de nuestras variables Y m , ésta es una función de cinco v( Y ) = i £ l f { Q ) - f ( S )]2- ^ í [W ) ~ f ( Q ) f (11.83)

de estas variables
Un cuarto estimador es el promedio de los dos primeros anteriores.
Y¡ h¡ — U\hi 2hil Y 2hi ~ U\h¡\ Y-ihi ~ U lte
Los conjuntos equilibrados de este tipo fueron propuestos ante
Y4h¡ = U\ hi> Y shi = U 2hi riormente por Plackett y Burman (1 9 4 6 ) para usarlos en un diseño
con y'lhi= Ü xh,Ü Ui/2zhi, i = \,2,zu = \/Nh en este caso. experimental para el que g es cualquier múltiplo de 4. Para L es
tratos, el conjunto equilibrado más pequeño tiene g iguales al más
pequeño múltiplo de 4 superior a L. Con L = 5 estratos, g ™ 8 . La
11.19 REPLICAS REPETIDAS EQUILIBRADAS Tabla 11.7 muestra un conjunto equilibrado para L = 5, el signo 4-
denota aquí la unidad 1, y el — denota la unidad 2 en un estrato.
Inicialmente, consideremos este método para una función lineal
de una sola variable. Sea f ( Y ) = Y, con su estimación f (Y ) = Y = T A B L A 11.7 M e d ia s M uestras B alanceadas para L = 5 Estrato s
XO'ai' + íW ). donde yH' = y a¡/2z*¿- Una estimación insesgada de la

M e d ia M u estra
varianza v ( y ) es, de (11.78)
Estrato 1 2 3 4 5 6 7 8
u ( ^ = X ( y fci '- y « ' ) 2 (11.80) 1 + + + — + — — —

h
2 — + + + - + - -
Tómese una media muestra H, al elegir una unidad de cada 3 - - + + + - + -
estrato. La estimación de f ( Y ) = Y de esta media muestra es f ( H ) ■= 4 + - - + + + - -
2 X yh¡ , donde hi es la unidad elegida en el estrato h. Por lo tanto, si 5 — + — — + + + -
f ( S ) denota la estimación de f ( Y ) hecha a partir de toda la muestra,
f ( H ) - f ( S ) = 2 Z yhl' - Z ( y kl' + yh2-) = l ± ( y h¡' - y k2') (11.81)

h h h Cuando este método de réplica repetida equilibrada ( BRR) se
aplica a una función no lineal f ( Y ) de varias variables, los cuatro
y los signos dependen de si se elige la unidad 1 o 2 en el estrato h.
estimadores
Al comparar (11.81) con (1 1.80 ), se ve que para cualquiera de
las 2L posibles selecciones, [ f ( H ) - f ( S ) ] 2 contiene los términos
cuadrados correctos (y h¡' - i/*.')* en v{ Y ) en cada estrato. Sin em
1X[/•(/-/,)•-/(S)]2; - X[ f ( Q ) - f ( S ) T ; ¿ i \ .m ) - m ) f
g i g i 4g i
bargo, para cada media muestra específica, cada par de estratos y el promedio de los dos primeros, todos difieren hasta cierto punto.
contribuye con un término cruzado que lleva un signo ± para También f ( S ) - f ( Y ) es sesgado y las estimaciones de varianza no
E L SU B M U ESTREO CON U NID AD ES D E DEFERENTES TA M A Ñ O S 393
incluyen la contribución correcta del sesgo al E C M [f(Y )]. Sin em restante de tamaño (2 L — 1 ). Una forma de la estimación Jacknife
bargo, hay que observar que si se extraen m muestras independientes, de V [ f ( S ) ] es entonces
Si, cada una con una complementaria H it C<> la cantidad
tf[/(S)] = Z [/($,) ~ f (S )]2 (11.86)

¿ f [ / ( / í ) - / ( q )]2 (11.84) h
Para un estimador lineal f ( Y ), este estimador de varianza se reduce
es una estimación insesgada de V [f(H )]. Por lo tanto, dicho burda al estimador insesgado usual en muestreo ppz con restitución.
mente, el método BRR equivale a suponer para f ( S ) , que: ( a ) su
A l igual que con BRR, existen cuatro versiones análogas del es
sesgo es despreciable, ( b ) V ff(S )] = ( l / 2 ) V [ f ( f í ) ] , y ( c ) el cálculo
timador Jacknife de z>[f(S)].
de i # ( S ) ] a partir de BRR para una sola'S estratificada concuerda
aceptablemente con su cálculo a partir de muestras independientes
Si para considerarla útil. 11.21 C O M P A R A C IO N D E L O S TR E S M ETODOS
El método de las réplicas repetidas, se ha usado extensamente,
tanto para la selección de muestras y la estimación de la varianza por Los métodos de Taylor, BRR y J han recibido una justificación
el U.S. Census Bureau en la década de los 50, como por Deming teórica rigurosa muy limitada. Para evaluar su comportamiento con
(1956-1960). La idea proviene de una técnica de Mahalanobis de diferentes estimadores y tipos de encuestas, se han utilizado principal
mente como base los estudios de Montecarlo. Un estudio tal lo
las submuestras interpenetrantes (Mahalanobis, 1944). McCarthy
describe Frankel (1 97 1) y Kish y Frankel (1974).
(1 96 9) pasa revista a las propiedades del método BRR con una
discusión posterior de Kish y Frankel (1974). La muestra era de una etapa con unidades conglomeradas de
tamaños ligeramente diferentes, que tienen 14.1 viviendas en pro
medio. L a población de N = 3 240 unidades o 45 737 viviendas se
11.20 E L M ETO D O J A C K N IF E dividió en turno en 6 , 12 y 30 estratos del mismo tamaño con
nh - 2 en cada estrato. Se usó el muestreo aleatorio simple dentro
Para R en muestras aleatorias simples, se describió este método de los estratos. Los datos se tomaron de la encuesta de población
en la Sec. 6.17. Fue propuesto como un medio de estimación Current Population Survey (U.S. Census Bureau). Las ocho variables
de V ( R 0 ), pero también pudo proponerse como estimación de originales para una casa eran: el número de personas, el número
V (/ £ ). Omítase la unidad j-ésima d é la muestra y calcúlese R¡, de ellas con menos de 18 años de edad, el número de ellas en la
la estimación de razón para el resto de la muestra. A l ignorar la fuerza de trabajo y el ingreso total, y para la cabeza de familia,
el ingreso, la edad, el sexo y los años de educación. Se calcularon
cpf, se puede obtener un estimador aproximado de V ( R ) a partir
varias medias (razones), diferencias de medias y coeficientes de
de ( 6 .8 6 ) con g = n. Si suponemos R = R _ , la media de las R¡, este
correlación simple, parcial y múltiple (tres variables independien
estimador se convierte en tes). En números de unidades primarias, las muestras eran muy
pequeñas, 12, 24 y 60, con alrededor de 170, 340 y 850 como nú
0(j?)i í ^ £ (^ _ j í )2= ÍÍL Z l)[/(S.) _ /(S)] a (1185)
meros de casas.
A l calcular los estimadores de varianza, se compararon las cua
la expresión de la extrema derecha indica cómo se puede aplicar el
tro formas del método BRR y el método J. El método de Taylor no
método a otras estimaciones no lineales.
se usó para regresiones múltiples y parciales, por la dificultad en
Para un estimador lineal, como y, es fácil verificar que la Fórmu
expresar las derivadas parciales df/dY¡ en una forma manipulable.
la (11.85) se reduce a la usual v(y) = £ ( y ¡ - y ) 2/ n ( n - 1).
Puesto que el método de muestreo era la estratificación proporcional
Al extender este método a las muestras estratificadas con nh - 2, sin restitución, el término cpf (1 — f ) se incluyó en todas las es
Frankel (1971) sugiere que se omita una unidad al azar del estrato timaciones de varianza con f — n /N , aunque se necesitaron poco
h para h = 1, 2, . . ., L en tumo y se calcule f (S h) de la muestra con estas muestras pequeñas.
E L SU B M U ESTREO C O N UNID AD ES DE D IF E R E N TE S T A M A Ñ O S 39 5
TABEA 11.8 P r o m e d io d e P r o b a b ilid a d e s e n l a s C o l a s d e la s

Salvo los coeficientes de correlación múltiple, los estimadores
D is tr ib u c io n e s p a ra [ f ( y ) — E f ( Y ) ] / e . s . [ f ( y ) {
f ( Y ) presentaban sesgos de relativa poca importancia para los tres C om p a ra d os c o n lo s d e l a t d e S tu d e n t
tamaños de muestras, al ser las razones |sesgo|/error estándar infe
6 estratos
riores a < 0 . 1, para razones, diferencias de razones y coeficientes
P (l) = .042, t = 2.576 PU) = .098, í = 1.960
de regresión simple, y alrededor de 0.2 para los coeficientes de BRR J Taylor BRR J Taylor
correlación simple y parcial. Cuando las v ( y ) aproximadas se con
Razones .044 .049 .052 .096 .106 .112
sideran como estimadores de E CM ( Y ), los tres métodos Taylor, BRR
**¿> .034 .048 .058 .085 .117 .127
y J se comportaban bien para razones y diferencias de razones hr .052 .069 .084 .114 .137 .163
con el promedio de sesgo en v ( Y ) ¡/ECMX Y ) inferior a 5% . Para t parciales .043 .063 _ .092 .132 _
R múltiples .065 .088 — .105 .160
coeficientes de correlación simples los estimadores de varianza BRR —
presentaban sesgos sustancialmente más bajos que los estimadores
30 estratos
T o /. Lo contrario era cierto para coeficientes de regresión simple. PU) = .059, f = 1.960 />(:) = . 110, r = 1.645
Con BRR y ] el mejor de los cuatro métodos v { Y ) era el promedio • BRR J Taylor BRR J Taylor
de las estimaciones H y C (esto es, con B R R ).
Razones .056 .057 .057 .109 .111 .112
b .062 .067 .068 .110 .116 .116
¿ {£ u m -m f + 1 u í q ) -/ o s)]2} u i.87) r .089 .098 .102 .138 .153 .164
r parciales .103 .121 — .156 .181 ---
En lo que respecta a los enunciados de intervalos de confianza* R múltiples .175 .207 — .265 .297 —
y las pruebas de significación, lo importante era saber qué tan bien
concordaban las colas de las distribuciones de probabilidad de la b = coeficiente de regresión simple.
variable [ f ( Y ) — f(Y )]/ e .s . [ f ( Y )] de la t de Student con L g.l. 6 r = coeficiente de correlación simple.
Para valores elegidos de t, Frankel (197 1) da las estimaciones

de Montecarlo de las frecuencias para la variable relacionada Este estudio abre un vasto campo de investigación de los méto
dos, con diferentes planes de encuesta y diferentes tipos de estimador
[ f ( Y ) — E f(Y )]/ e .s .[f(Y )]. Algunos resultados para 6 y 30 estratos
f(Y ).
se muestran en la Tabla 11.8 para los valores de t que presenta
En un estudio de Montecarlo y una muestra más compleja
Frankel cerca de los niveles en ambas colas del 5 y 10%. La versión
(muestreo de dos etapas con probabilidades proporcionales al ta
(11.87) de los métodos BRR y J es la que se muestra. maño, con restitución incluyendo estratificación y postestratificación)
En resumen, el método BR.R üene un comportamiento consistente Bean (1 97 5) comparó los métodos de Taylor y BRR para estimadores
mente mejor en la Tabla 11.8. Salvo para las R múltiples, se puede del tipo de razón. Ambos métodos dieron estimaciones satisfactorias
considerar adecuado para el uso práctico desde el punto de vista de de la varianza y probabilidades de confianza bilaterales satisfacto
que en el análisis de datos, un valor de la cola del 5% en la Tabla rias, calculadas a partir de la distribución normal, sin embargo, aún
representa un valor real entre el 3 y el 8 % . El método J es un poco existe bastante asimetría y por lo tanto, no se puede confiar en los
mejor que el método de Taylor. Salvo BRR con razones y regresiones intervalos de confianza unilaterales.
simples, todos los métodos dan frecuencias reales en la cola, más
elevadas que las de las tablas t, por lo tanto, las probabilidades de
E J E R C I C I O S
confianza son altas. Un aspecto que intriga es que, para los coefi
cientes de correlación, el aumento del tamaño de muestra de 12 a 11.1. Obteniendo las estimaciones para todas las muestras posibles que
60 no produjo una mejoría correspondiente en la aproximación de se pueden extraer de la población artificial de la Tabla 11.1, por los Métodos
las frecuencias reales a las colas de la distribución í. la , Ib, II y III, verificar el ECM total dado en la Tabla 11.2.
396 TE C N IC A S DE M U E S TR E O E L SU BM U ESTREO C O N UNID AD ES DE D IFE R E N TE S T A M A Ñ O S 397
11.2. Para los Métodos II (probabilidades iguales, estimación insesgada) Nota. Y a que = Tn¡/mt , la componente entre unidades de v (p ') puede
y III (selección pps) volver a calcular las variancias de y para el ejem plo en calcularse como
la Tabla 11.1, cuando m i = 1. Mostrar que la precisión del Método III
relativamente al Método II es más baja para = 1 que para m ¡ = 2. ¿Cuál
es el resultado general que ilustra esto? m ü V 1)<ZQ,Í'~1P1 ' * 1 m'2)
11.3. Para la población de la Tabla 11.1, si los tamaños estimados z¡ son
y dado que las m i son bastante grandes, la componente dentro de unidades
0.1, 0.3 y 0.6 con m¡ = 2, mostrar que la estimación insesgada (M étodo IV )
se calcula como
da una varianza más pequeña que el muestreo pps. ¿Cómo se explica este
resultado?
11.4. Los elementos de la población que tienen tres unidades primarias, ata
(nm)
se clasifican en dos clases. Los tamaños de unidades M ¡ y las proporciones P¡
de elementos que pertenecen a la prim era clase son como sigu e: 11.7. Si se seleccionan unidades primarias con probabilidades iguales y
f 2 es constante, mostrar que en la notación del Ejercicio 11,5 la estimación
M, = 100, M 2= 200, Af3= 300, P, = 0.40, P2=0.45, P3= 0.35 insesgada de una proporción de población es p = Ny.a¡/nM„f.. y que si los
términos en 1/ m i pueden despreciarse, su varianza se puede calcular como
Para una muestra de 50 elementos de una unidad primaria, comparar el ECM
de los métodos la, II y I I I para estimación de la proporción de elementos de la
primera clase en la población. (E n las fórmulas de la variancia de la Sec.
11.2, S<- es aproximadamente P,Q¡.)
11.5. Una muestra de n unidades primarias es seleccionada con probabi calcular p y su error estándar para los datos del Ejercicio 11.6.
lidades iguales, de cada unidad elegida se toma una fracción constante de 11.8. Una muestra de n unidades primarias se elige con probabilidades
subunidades, f„. Si a¿ de las m ¡ subunidades en la unidad i-ésima caen en la proporcionales a los tamaños estimados z¡ (con restitución) y con una frac
clase C, muéstrese que la estimación razón al tamaño (Sec. 11.8) de la pro ción constante esperada global de muestreo, f0. Mostrar que las estimaciones
porción de'población en la clase C es p = 1 .a J lL m De la Fórmula 11.36, mostrar insesgadas v^de razón al tamaño del total de población son respectivamente
que la siguiente es una estimación de E C M (p ) es T/f0 y T M 0¡J,m ¡, donde T es el total de muestra. (S e sigue que si M 0 es des
conocida, puede usarse la estimación insesgada, pero no la de razón al tamaño.
1 I M ,2iP, - P)2 . /,(1 ~ h ) £ M,m, Para estim arla media de población por subunidad, se invierte la situación.)
V{P) = ~ ^ n - 1...... + ~ ñ ^ M Z ^ m 11.9. En un estudio de sobrepoblación en una gran ciudad un estrato
donde p.¡ = ai/m i. contenía 100 manzanas de las cuales se tomaron 10 con probabilidades pro
porcionales al tamaño estimado (con restitución). Se usó como fracción de
11.6. Una firm a que tiene 36 fábricas decide verificar la condición de
muestreo esperado global f0 = 2 % . Estimar el número total y el número
cierto tipo de equipo del cual hay Aí0 = 25 012 piezas en uso. Una muestra
promedio de personas por habitación, y sus errores estándar a partir de los
aleatoria de 12 fábricas es la que se toma y después se verifica una submuestra
datos que siguen.
del 10% en cada una de las fábricas seleccionadas. Los números de piezas
examinados ( n i j ) y los números encontrados de piezas con alguna deteriora
ción ( a ¡ ) son como sigue: Manzana 1 2 3 4 5 6 7 8 9 10
Cuartos 60 52 58 56 62 51 72 48 71 58
a, Personas 115 80 82 93 105 109 130 93 109 95
Fábrica nti a¡ Fábrica m¡ ai
P i~ ñ t m,
11.10. Para el método de Durbin (Sec. 11.10) en que se simplifica la esti
1 65 8 0.123 7 85 18 0.212 mación de varianza en muestreo con probabilidades proporcionales a z sin
2 82 21 0.256 8 73 11 0.151 restitución, un método simple de selección de muestra debido esencialmente
3 52 4 0.077 9 50 7 0.140 a Kish (1 9 6 5 ) es el siguiente. E l subíndice h que denota el estrato se omite
4 91 12 0.132 10 76 9 0.118 y el número de unidades primarias se supone que es par.
5 62 1 0.016 11 64 20 0.312 Se arreglan las unidades en orden de z¡ creciente y se marcan por pares.
6 69 3 0.043 12 50 2 0.040 El método es exacto solamente si zá — z¡ para miembros del mismo par; esto
es lo que se supondrá aquí. Se seleccionan dos unidades ppz con restitución.
Si se sacan dos unidades diferentes, se aceptan. Si se saca la misma unidad
Estimar el porcentaje y número total de piezas defectuosas en uso y esti
dos veces, se hace que la muestra consista en los dos miembros del par al
mar sus errores estándar.
que pertenece esta unidad. Muéstrese que para este método: ( a ) tt¡ = 2 z ¡, (b )
para unidades que no están en el mismo par, 7r,( = 2z,z¡ = 7r,jr;/2, de modo
que TTiTTj-irJ1—1 = 1, y ( c ) para unidades en el mismo par tt,¡ ~ 4 z ¡Z j = ir ^ , de
modo que iT|V(rr¡¡~1— 1 = 0 .
11.11. En la Sec. 11.9, la Fórmula (11.33) para V (Y PP¡) en muestreo con
restitución se probó con base en que siempre que se seleccione la i-ésima
CAPITULO 12
unidad, se extraiga de toda la muestra una submuestra aleatoria simple in
dependiente de tamaño m¡. Demostrar los siguientes resultados para dos planes
alternativos.
(a ) Cuando se selecciona la unidad t-ésima ts veces, se saca una sub
muestra aleatoria simple de tamaño de la misma (supóngase mit , ^ M í ').
N Muestreo Doble
En este plan, V iY ^ , ) en (11.4 1 ) se reduce en la cantidad( n - 1)£ M S -J/n
(Sukhatme, 1954).
(fc ) Cuando se selecciona la i-ésima unidad veces, se toma una muestra
aleatoria simple de tamaño m ¡. Entonces V('9'rft) en ( H . 4 1 ) aumenta en la
cantidad 12.1 DESCRIPCION DE LA TECNICA
ti Como hemos visto, varias técnicas de muestreo dependen de si

N se tiene información anticipada respecto a una variable auxiliar x {.
tanto en ( a ) como en ( b ) , Ypp¡ = T_t,\í,yJnz„ al recibir la unidad i-ésima asig
Las estimaciones de razón y regresión requieren que se conozca la
nada el peso t¡.
media de población X. Si se desea estratificar la población respecto
a los valores de x debe conocerse su distribución de frecuencia.
Cuando falta esta información, es relativamente económico to
mar una gran muestra preliminar, sólo para medir x¡. El propósito
de esta muestra es obtener una buena estimación de X o de la dis
tribución de frecuencia de x¡. En una encuesta que tiene el propósito
de hacer estimaciones para otra variable y¡, puede ser conveniente
dedicar parte de los recursos a esta muestra preliminar, aunque esto
significa que deberá disminuir el tamaño de la muestra en la en
cuesta principal para y,. Esta técnica se conoce como muestreo doble
o muestreo de dos fases. Como lo implica la discusión, la técnica es
provechosa sólo si lo que se gana en precisión a partir de estimacio
nes de razón o regresión, o bien, de la estratificación, hace más que
compensar la pérdida en precisión debida a la reducción del tamaño
de la muestra principal.
El muestreo doble puede ser apropiado cuando la información
respecto a x¡ está contenida en tarjetas no tabuladas. Así, por ejem
plo, en encuestas de la población civil alemana en 1945, la muestra
en cualquier ciudad se extraía generalmente de las listas de registro
de racionamiento. Además de la estratificación geográfica dentro de
la ciudad, para la que ya se tenían los datos, se propuso la estrati
ficación por sexo y edad. Como la muestra debía extraerse apresu
radamente y como las listas se necesitaban constantemente, no era
factible la tabulación de la distribución completa de edades y sexos.
400 T E C N IC A S DE M U E STR E O M U E S TR E O DOBXE 401
Pero una muestra sistemática, moderadamente grande, sí podía ex

traerse de prisa. Cada persona seleccionada se clasificaba en la
Prueba. Primero se promedia sobre las muestras donde los wh
clase apropiada de edad-sexo. A partir de estos datos, se seleccionó
son fijos. Dado que yh es la media de una muestra aleatoria simple
una lista mucho más pequeña de personas para ser entrevistadas.
del estrato, E(yh) = Yh. Además, cuando promediamos sobre selec
ciones diferentes de la primera muestra, E (w k) = W,„ puesto que
12.2 M UESTREO D O B L E P A R A E ST R A T IF IC A C IO N la primera muestra es en sí misma una muestra aleatoria simple.
En estas condiciones
La teoría fue dada inicialmente por Neyman (1938). La pobla
ción debe estratificarse en L clases (estratos). La primera muestra E (y,,) = E [E (Z H w fcK )] = E ( I *v* Y„) = £ WhYh = Y (12.2)
es una muestra aleatoria simple de tamaño n'.
Teorema 12.2. Si la primera muestra es aleatoria y de tamaño
Sea
n', la segunda muestra es una submuestra aleatoria de la primera,
W* - N h/N = proporción de la población que cae en el estrato h. de tamaño u* - v*7z*', donde 0 < vh < 1 y los vh son fijos
W:, = n//n' - proporción de la primera muestra que cae en el es
trato h.
. < i 2 -3 )
Entonces, wh es una estimación insesgada de W h.
La segunda muestra es una muestra aleatoria estratificada de donde S" es la varianza de población.
tamaño n en donde las yu son las variables a medir: se toman nh
Prueba. La prueba se obtiene fácilmente con el siguiente arti
unidades del estrato h. Usualmente, la segunda muestra en el estrato
ficio. Supóngase que las yhi se midieron en todas las unidades nh' de
h es una submuestra aleatoria de los n/ elementos en el estrato. El
la primera muestra en el estrato h y no sólo sobre una submuestra
objeto de la primera muestra es la estimación de los pesos de esrtatos;
el de la segunda muestra es la estimación de las medias de estratos aleatoria de n h. Entonces, como xuh = nh'/n',
La media de población Y = £ WhYh. Como estimación usamos I w hyh' = y'

h
L
es la media de una muestra aleatoria simple de tamaño n ' de la po
ys<= X whyh (12.1)
h-1 blación. En esta forma, el promediar sobre selecciones repetidas de
la muestra de tamaño n',
El problema es el de elegir r í y los nh para minimizar V ( y„ ) a un
costo dado.
Debemos entonces verificar si la varianza mínima es menor que
(i2 -4'
la que puede obtenerse por una muestra aleatoria simple, en donde
pero
se mide i/¡ sola. Al presentar la teoría, suponemos que los nh son una
submuestra aleatoria de los nh'. Por lo tanto, nh = vhn h' donde 0 < y » = X whyh = 1 whyh'+ Z wh{yh - y h') (12.5)
u* < 1 y los Vh se eligen por adelantado. El muestreo repetido implica h h h
una nueva extracción de la primera y la segunda muestra para que
Sea el subíndice 2 el que se refiere a un promedio global sobre todas
las iv,„ nh y yh sean todas variables aleatorias. Así, la cuestión es un
las submuestras aleatorias de n h unidades quepueden extraerse de
problema de estratificación en el cual no se conocen exactamente los
n/ unidades dadas. Es claro que E 2(yh) = yh'. Losresultados si
tamaños de estratos (Sec. 5A.2).
Por sencillez se harán dos aproximaciones. El primer tamaño guientes se infieren inmediatamente (v er Ejercicio 2.16):
de muestra n' se supone lo suficientemente grande para que wh > 0 . co v [jV , (y * - y Y )] = 0 :
En segundo lugar, cuando lleguemos a la discusión de la estrategia
óptima, cada v¡, óptima, como la de la fórmula, se supone < 1. cov (yh\yh) = V(yhy. V(yh - y h') = V ( y * ) - V(yh')
M U E STR E O DO BLE 403
Corolario 2. Si lo que se estima es una proporción en la segun

luego, para ivh fijo,
da muestra, las expresiones; S 2 = N P Q / (N — 1 ) y
(U .7 )
= ( Y „ - Y ) 2= (P h - P ) 2
puesto que nh = vhnh' = vhwhn '.

se sustituyen en (1 2 .3 ), (1 2 .1 1 ) y (12.13). Tenemos en (12.14),
Al promediar sobre la distribución de los wh obtenida por selec para n'vh/N también despreciable
ciones repetidas de la primera muestra, tenemos, de (1 2 .4 ) (1 2 .5 )
7 (12.7), v ( p J * i y ¡ 7 & + S - , Z w h{Fh - P ) 2 (12.15)
h n vh rt h
Corolario 3. Los resultados para el caso en el cual la segunda
n t í - H H H ^ G r 1) (12'8)
muestra se toma independientemente de la primera, demodo que
Corolario 1. El resultado se puede expresar en varias formas los tza no dependan de los nh' (excepto en lo que respecta el supuesto
diferentes. Por el análisis de la varianza, n» < » * ' ) , se dieron en la segunda edición Pág. 401 para nh/Nh
( N - l ) S 2= I ( N , - l ) S , 2+ l N h( Y * - Y )2 (12-9) despreciable, el término guía de la varianza tiene la misma estruc
tura que (12.14), y es
Por lotanto, si g' = ( N - n ')/ (N - 1 ), al multiplicar por g '/ n 'N
L M Z 2 C, 2 n ' L
se obtiene wh{? h - Y ? (12.16)
h n h
( í L ^ ! = s 2( - i7- ¿ ) = ^ I ( V y h - N - ,)5 )l2 + ¿ I Wh( Y h - Y ) 2
nN \n N/ n n (12.1 0 ) Robson (1 9 5 2 ) y Robson y King (1 9 5 3 ) escribieron artículos en
donde extienden la teoría de la estratificación al muestreo de dos
De (1 2 .3 ) esto da etapas y la aplican a la estimación de lectura de revistas.
(«i- N - w + J i w ñ - ? )2
h n \ v h/ n h « a ( 12 . 11 )
12.3 A S IG N A C IO N O P T IM A
Además, por la definición de g’ = (N — n ')/ (N — 1 ), resulta que
El objetivo es elegir los n' y vh para minimizar V(ysl) a un costo
_ ! +¿ = - I + -lL
n’ n' N nN
( 12.12) específico. Sea C el costo de la clasificación por unidad y ch el
costo de medir una unidad en el estrato h. Para una muestra espe
En consecuencia ( 12 .11 ), los términos segundo- y tercero en £ WhSh2,. cífica
que tienen coeficientes — 1/n' y g'/n' se pueden escribir alternati
C = c 'n '+ Z c hnh (12.17)
vamente, lo que da h
vtíF.)-í "MR. -P)‘ Dado que los nh son variables aleatorias, minimizamos el costo es
h Xn A / n IV h n (12.13) perado para n ' y vh elegidas
Si la clasificación no es costosa, puede no ser razonable suponer E ( Q = C * = c 'n '+ n 'Z c hvhWh (12.18)
n'/N despreciable, dado que una proporción importante de la pobla
ción se puede clasificar. Sin embargo, para la mayoría de las aplica Para V = V(y„), la Fórmula (1 2 .3 ) conduce a
ciones, podrá ignorarse el término g'/n'N en (12.13). Y en este
n'(V + S 7 N ) = (S 2- I * l t f ) + z 3 á £ (12.19)
caso, (12.13) se simplifica a h vh
El producto C * (V + S2/ N ) no involucra n'. A l aplicar la desigual
V(yit) = Í Whs A - ± - - ~ ) + ^ Z Wh( Y h - Y ) 2 (1 2.14)
h i'h Ni n i, dad de Cauchy-Schvvarz a este producto, se muestra que el producto
Los resultados en el Teorema (1 2 .2 ) fueron dados por Rao (1973). se minimiza, si para cada h,
404 TE C N IC A S DE M U ESTRE O M U E STR E O D O BLE 405
VhCh_ c' Estratos S»J s. Yk

(S2- 1 W hSh2) (1220>
Esto da 1 0.786 312 17.7 19.404
► 2 0.214 922 30.4 51.626
n = S*[c'/ch(S2- 2 WhSh)V/2 (12.21)
Población 620 26.300
El valor de n' se obtiene de la ecuación de costo esperado (12.18).
Por sustitución del óptimo vh en la fórmula para C * (V + S-/N ), Supóngase que C * = 100, c# = 1 «= c y que S2/N puede ignorarse. Esto
la varianza mínima se encuentra que es implica que si no se usa el muestreo doble, podemos permitimos la toma de
una muestra d e n = 100 granjas, lo que da F(j>) = 6.20. Sea c' el costo de la
clasificación por granja en el estrato 1 ( < 160 acres) y en el estrato 2 ( > 160
^ ( y » ) = ¿ Í I Wkshv r h+ (S 2- 1 W„Shy 2V ? ]2~ (12.22)
acres). Considérense las preguntas:
El uso de la Fórmula (12.21) para asignación óptima exige, en 1. ¿Para qué valores de c'/c trae un aumento en la precisión el muestreo
la práctica, más conocimientos de la población del que se puede es doble?
perar que tenga el encuestador. Pero afortunadamente, los errores 2. ¿Cuál es el plan de muestreo doble óptimo si c' = c/100 y cuál la
debidos a conjeturas tienen aspectos de compensación. Así, si los V (y „) resultante?
v h de ( 12 .2 1 ) son demasiado elevados, los r í en (12.18) serán de
3. En el Prob. 2, ¿cómo cambia el plan y el valor de V (y „) si los vh se
masiado bajos y los pesos de estratos no estarán determinados tan conjeturan como el doble de las fracciones óptimas?
convenientemente como deberían. Sin embargo, en compensación
1. De los datos de población 2 WhS,, = 20.4, (S 2 — ’¿ W¡,Sh" ) = 177. En
parcial, las medias de estrato yh tendrán una determinación más consecuencia por (12.22)
precisa que en la solución óptima. Cuando casi no se conocen anti
V™ (y„) = 0.01 (20.4 + \13-Jc1)1
cipadamente los pesos de estratos W», Srinath (1 9 7 1 ) y Rao (1 97 3)
sugieren un método de selección de los n¡, ligeramente diferente, Si ésta debe ser menor que 6.20 para muestreo aleatorio simple, c’ <
que se piensa es más resistente a los efectos de conjeturas medio 0.11; esto es, c’ /c < 1/9.
cres de los W*. 2. Si c'/c = 1/100, entonces, con e l plan óptimo, (1 2.22) da
El caso que presenta el problema más fácil de asignación es
V ^ ,(y „ ) = 0.01(20.4 +1.3)* = 4.71
aquel en el cual c,, y Sh son constantes. Entonces (12.21), viene
a ser Nótese que si la clasificación por tamaño de la granja no cuesta nada,
tendríamos
Vnim(y „) = 0.01 (20.4)2= 4.16

En lo que respecta a los detalles del plan, con c'/c = 1/100, de (12.21),
donde </> = S2/S,„2, es la eficiencia relativa de la estratificación pro
obtenemos
porcional al muestreo aleatorio simple. Por lo tanto, si conjeturáse
mos que la estratificación reduciría V (y ) en la mitad, para que vh= Sft/133; «<5= 0.133; vt = 0.229
</. - 2 , entonces v h = (c '/ c )1'2. Como s W V j = 0.1535. de (12.1 8 ) encontramos que n ' = 612. A su
vez, esto nos da los valores esperados de 64, 30 para rt,, tl,. De modo
Ejemplo. Este ejemplo no sale de un problema de muestreo doble, pero que casi todo el dinero se gastará en la medición: sólo un 6% en la
ilustra algunos aspectos de la solución. Usamos los datos del condado de clasificación.
Jefferson (Pág- 404). A l estimar los acres dedicados al cultivo del maíz,
supóngase que podemos o bien tomar una muestra aleatoria simple de gran 3. Si conjeturamos >■, = 0.266, r2 = 0.458, entonces ZW*,?,, = 0.307 y de
jas, o dedicar algunos recursos a la clasificación de las granjas en dos estratos, (1 2.18), n ' = 315, lo que conduce a valores esperados n, = 66, ns =
según el tamaño de la granja. Los datos pertinentes de la población son 31. De (1 2 .3 ), V(ya) para este plan se encontrará igual a 4.85, sólo
para los acres de cultivo de maíz. un aumento del 3% sobre el óptimo 4.71 del Prob. 2.
406 TE C N IC A S DE M U E S TR E O M U ESTRE O DO BLE 407
12.4 V A R I A N Z A E S T IM A D A E N M UESTREO Al sustraer (12.30) de (1 2 .2 9 ) y multiplicar g'Jn' se tiene

D O B L E P A R A E S T R A T IF IC A C IO N
* ,(* ,- -y „ )2« 5 [ s w^ - - 9 )1 + 1 v(y->]
Si tanto 1/n' como 1/N se pueden ignorar respecto a 1 (por
ejemplo, < 0 .0 2 ), una estimación de muestra casi insesgada de ( 1 2 . 3 1 )
V (y„) en (12.14) es simplemente la copia muestral de esta fórmula.

Al sustituir (1 2 .3 1 ) para encontrar (n '-l)N E v (y „ )/ n '{ N -\ ) a partir
de (12.25). Se tiene
- * * > ’ (i2 -24)
( n '- l ) N _ .. g'\ . ( n '- l ) N
n '(N —1) V n 'I {y,,) n '(N - 1) ^
h nh h N n h (12-24')
Esto demuestra el resultado. Obsérvese que los dos términos medios
donde g ' = ( N - n ') / ( N - 1). Esta fórmula será suficiente para en (12.25) son del orden 1/n'N y l/ n ' 2v* y pueden ignorarse con re
casi todas las aplicaciones. Si 1/N y 1/n' no pueden ignorarse, se lación a los términos que se conservan, si 1/N y 1/n' son despre
necesitará una expresión algebraica más complicada. ciables. Esto justifica la forma más simple (12.24).
Teorema 12.3. Una estimación muestral insesgada de V(ys¡) en Rao (1 9 7 3 ) dio el resultado (12.25) en términos de los nk y nh'
muestreo doble es como sigue.
, N —1 „ /nh' — 1 (N - n ') 2
■**>>-í S ? ^ !( ¿ - ¿ ) + £ ? ? *■<*■ - « ■ ] (1 2 . 3 2 )
Corolario. Para usar (12.24) en la estimación de una propor

(12.25)
ción, sustituyase pk por yh y n»p*q*/(n* - 1 ) por s*2.
Prueba. De (12.13) la forma general de la varianza que se va a
estimar es Ejemplo. En una muestra aleatoria simple de 374 casas de un distrito, 292
estaban ocupadas por fam ilias de personas de raza blanca y 82 por otras. Una
muestra de aproximadamente una de cuatro casas dio los siguientes datos
n w - i " A Í ¿ ; - i ¡ ) + ú ¡ ¥ w ' - 1)s>,+£ ? w^ - 9)1
respecto a propiedad.
(12.26)
A l promediar primero para n ' fijo y wk fijo, y luego sobre las varia De su
ciones de los wk, el promedio de wksh3 en (1 2.25) es W kSh2, en tanto Rentas propiedad Total
que el de sh2 es Sb2. Estos resultados se usarán después de la Ec.
(12.31). Blancas 31 43 74
En el último término de (12.25) N o blancas 4 14 18
I *’h (,y h -?«)2= Z w hyh2- y l (12.27)

Estimar la proporción de casas rentadas en el área de la que se sacó la muestra
Al promediar primero respecto a wh fijo, y su error estándar.
Si el primer estrato consta de las casas ocupadas por blancos.

h /* 5 „2 ( — L - L ) ( 1 2 . 2 8 )
\fhwhn whN l
Además,
EJEG.wky * ) = l W ^ + Y . s A — — ) ( 1 2 . 2 9 )
'v hn' N/
También,
E ( y l ) = Y 2+ V (y J (12.30)
M U E S TR E O DOBLE 409
Para n, fijo, ambas relaciones (1 2.33) y (12.34) son de la forma

De hecho se encuentra que sólo el primer término de (12.2 4 ) es de inv
portancia. Luego L -2
z — = v ( 1 2 .3 6 )
, n„ iffcM * _ ^ i* '* 2M it_(0.78)1(0.2436)i (0.22)2(0.1716) i «¡
HPJ U n „ - 1) W tk - 1 ) 73 + 17
donde suponemos que S¡2, S , f y por tanto los a¡2 se conocen de an
= 0.00252 temano.
í ( p j = 0.050 Cuando el objetivo es minimizar V para C dado, Sedransk (1965)
La proporción estimada de casas rentadas es 0.62 ± 0.050. y Booth y Sedransk (1 96 9) intentan valores diferentes de n' en tur
no. Para r í dado, el valor d e n s e conoce por (12.35). Para n dado,
los n¡ que minimizan V son n¡ = na¡/(^ a^. Puede surgir alguna difi
12.5 M UESTR EO D O B L E P A R A
cultad al usar estos ni; porque los n¡r que proporciona la muestra
C O M P A R A C IO N E S A N A L IT IC A S
inicial son variables aleatorias. En algunos subgrupos, podemos en
En la Sec. 5A.13 nos hemos ocupado de la determinación de ta contrar n ,'< na,/(Z a;)para que los n¡ que minimizan, excedan los « /
maños de muestras en subgrupos de la población para ciertas com disponibles. Las reglas de asignación que sirven para manejar esta
paraciones analíticas entre L medias de subgrupos. Si el objetivo es situación se ilustrarán para L = 3 grupos, según Sedransk (1965).
obtener varianzas de las diferencias entre las medias para cada par Numérense los subgrupos en orden creciente de n,'(Z a,)/na„ y denótese
de subgrupos todas iguales a V, se observó que una asignación sim con (£ a ¡) la suma sobre todas las clases, salvo la primera. Tómese
ple de compromiso, a menudo adecuada, consiste en especificar o 1
na, na{
minimizar tan sólo la varianza -promedio de las L (L — 1 )/2 dife si rti'a
rencias. Qa ) c z í)
(12.33) n, = n/ si n ,<
L ¡ n¡ £ a ¡)
En otra aplicación, Booth y Sedransk (1 9 6 9 ), los subgrupos for (n —n¡)a2 si n2' a

maban una clasificación factorial 2 X 2 y el problema era la estima 2 (L a ,) (I 4) (12-37)
1 i
ción de los efectos renglón y columna con la misma precisión. En
este caso, la varianza por especificar o minimizar tomaba la forma si
M
II
M
n2'< -
3
3
(Z a,)
\ Ím * + 6 ? )¥ -= V (1 2 .3 4 ) i
2 ¡ j n,j
n2— n —n, —n2
donde los 6¡ y 9¡ son pesos que el investigador elige, y los símbolos
( i j ) denotan los 4 subgrupos.
donde Z a ¿ = Z ^ ¡_ «i-
En la discusión de la Sec. 5A.13 los subgrupos se podían mues- 1
trear directamente. El problema viene a ser un problema de muestreo
Estas reglas no son completas, pero cubrirán casi todos los v!
doble cuando los miembros de los subgrupos no se pueden identificar
que puede esperarse cercanos a los óptimos. El principio consiste en
de antemano, pero las unidades pueden clasificarse, a un costo re
no alejarse de la asignación n¡ a a¡. Para más detalles consúltese
lativamente bajo, en los subgrupos de una muestra aleatoria simple
Booth y Sedransk (1969).
inicial de tamaño n'. Si n'¡ de las muestras iniciales caen en el sub-
grupo i, los n¡ para la muestra final que se mide para proporcionar Ejemplo. Un ejemplo en donde el muestreo doble opera convenientemente
las comparaciones deseadas se extraen de los n ¡'. La función de es el siguiente: C = 2 000, c' = 1, c <= 10. Los tres subgrupos son de tamaños
relativos W , = 0.05, W, = 0.25, W , = 0.70, a,* = S¡* - 10 (i = 1, 2, 3 ).
costos más simple es
Considérese primero muestreo sencillo. Como el costo de selección, clasifica
C = c 'n '+ c L ni = c 'n '+ c n (12.35) ción y medida de una unidad de muestreo es de 11 unidades monetarias,
podemos perm itir n = 182 con muestreo sencillo.
donde suponemos ? < c.
410 T E C N IC A S DE M U ESTREO M U E S TR E O DO BLE 411
La asignación óptima requeriría Uj iguales, pero en promedio, los valores Al resolver (1 2 .4 2 ) para m u el valor de n ' en el que v, = 1, se
de n de muestreo sencillo con n = 182 son 9.1, 45.5, 127.4. A l suponer obtiene
E(l/ra¿) = 1 / E (« j) la V promedio de muestreo sencillo es aproximadamente
m i = [c' + cH '1( Z fll)/flJ (12 '43)
Con muestreo doble, los cálculos para los diferentes n ' muestran que el n'
Para examinar valores de n ' menores que m,, hágase v, “ 1 y
óptimo está cerca de 620, lo que da n = 138. Con n = 138 el n ¡ óptimo es úsese la desigualdad de Cauchy-Schwarz para obtener las restantes
46 en cada clase. Sin embargo, n ’ = 620 proporciona tan sólo 31 elementos vj. Encontramos, para i > 1,
esperados, en la clase 1. Por lo tanto, en promedio, la regla de asignación
(1 2.37) para muestreo doble da n l ~ E ( n \ ) (0 .0 5 )(6 2 0 ) ~ 31, n2 = n, =
53.5, lo que conduce a
i
donde£ a¡ = La. E ( V ) mínima resultante es ahora
£(V)"10(á+
,31 ¿ ) =°'
53.5/ --70
una reducción de 50% de E ( V ) con muestreo que no es doble. a c(2 > , ) 2

Rao (1 97 3) trata estos problemas por el método usado con mues E m ~ ir w ,+ C Z -n V + c W ,) ,12-45)
treo estratificado: este método especifica la fracción v¡ de los n {
en el subgrupo i-ésimo que se van a medir. Una ventaja es que De esta E (V ) se anula la derivada dE(V)/ctn/ en
el óptimo ti' se puede determinar analíticamente. Con C = c'n ' +
/f £ > ,) .
en, al igual que antes, el costo esperado es
« ' = C * / [(c ' + cW 1) + - ^ - [cW ^ c' + c W J ]1' 2] (12.46)
C* = c'n ' + cn'Y. h w< (12.38)
El valor m 2 donde v2 y son ambas 1, para que (12.45) deje de
donde W , es el tamaño relativo del subgrupo i. A l suponer, como ser válido es
antes, que E ( l/ n , ) = 1/E(n»), el promedio V es
/r cW 2(Z o,)
E( v , = ¿ 4 í ,1239>
m 2 = C * / [(c '+ c W 'l) + ---- ^ J (12.47)
Por la desigualdad de Cauchy-Schwarz, la fracción Ví óptima para For lo tanto, las expresiones (1 2 .4 5 ) y (12.46) sólo se aplican para
n ' fijo está dada por los valores m x > r í > m 2. Si d E (V )/ d n ' no se anula para n' > m 2,
debemos poner v,, v2 y así sucesivamente = 1 en tumo hasta encon
(12.40) trar el punto de vuelta de E (V ). Sin embargo en muchas situaciones
d a¡) c en las que es económico el muestreo doble, el punto de vuelta de
siempre que v¡ < 1. La sustitución de n 'W ¡*, a partir de (12.40) E ( V ) ocurre para mx > r í > vn2.
en (1 2 .3 9 ) da, para la E ( V ) mínima Ejemplo. Para el ejemplo desarrollado en esta sección, C * =■ 2 000, c' =
1, c - 10, a 4* = S¡= = 10, VV¡ = 0.05, 0.25. 0.70. De (1 2 .4 3 ) y (12.47) tenemos
£ (V )‘ é ^ v ? (12-41) 2000
= 800
1 [1 + (10)(0.05)(3)
Como E ( V ) en (12.41) decrece al decrecer n', el n' óptimo dis
minuirá cuando menos hasta alcanzar el valor n h digamos, en el 2000
que una de las v ¡, digamos v,, se hace 1. En este punto, (1 2 .4 0 ) y [1.5 + (10)(.25)2] 308
(12.41) ya no se aplican. De (12.40), v, es 1 cuando Además. d E (V )/ d n ' en la Fórmula (1 2 .4 6 ) se anula en
2000
n 'W l = a i(C * ~ n'C
--)- (12.42) r = 619
{1.5 + (2)[(0.5)( 1.5 )]l/2}
c d a,)
Como este valor está entre 800 y 308, proporciona el mínimo requerido. La donde su' 2 es la varianza de u dentro de la muestra grande. Así, se
Fórmula (12.44) da = .346, rt = .124. Numéricamente, esta solución es, infiere que
en esencia, la que se encontró por el método de Sedransk con n ' = 620 y
valores semejantes de n i en los tres subgrupos.
V(y,r)= V(ylr) = v l(y ')+ B l( ~ ¿ j ) í ll'2 (12.50)
Ambos métodos se extienden fácilmente al caso de costos dife
renciales de medición en subgrupos diferentes. También se han dado
sugerencias (Rao, 1973) para el caso en donde E (l/ n ¿ ) es sustan
cialmente mayor que 1/E (n ¡).
ya que s u'2 es una estimación insesgada de Su2 = S „*(l - p2). Por lo
tanto
12.6 E ST IM A D O R E S D E R E G R ESIO N
(12.49)
En algunas aplicaciones del muestreo doble, la variable auxiliar
x ¡ se ha usado para obtener una estimación de regresión de Y. En Esto completa la prueba.
la primera (gran de) muestra de tamaño n', medimos tan sólo x¡;
en la segunda, una submuestra aleatoria de tamaño n = vn'=n'/k Como en la Sec. 7.8 se supone, con base en Royall (1 9 7 0 ), que
donde la fracción v se elige de antemano, medimos tanto x¡ como yt. la población finita es en sí misma una muestra aleatoria de una
La estimación de Y es suprapoblación infinita, en donde es válido un modelo de regresión
lineal. Entonces, y,r se hace insesgada según modelo y pueden ob
ylr = y + b ( x '- x ) (12.48) tenerse resultados exactos de muestras pequeñas para su varianza.
donde x', x- son las medias de las x¡ en las muestras primera y se Sea el modelo de regresión en la suprapoblación
gunda, y b es el coeficiente de regresión de mínimos cuadrados de
y = a+/3-t + e (12.52)
t/, respecto a x¡,, calculado de la segunda muestra.
Si no se hace un supuesto respecto a la presencia de una regre donde, para x dados, los c son independientes, con medias 0 y la
sión lineal en la población, yir será sesgada. T al como en el muestreo varianza <r„*( 1 - p2), donde % y p son ahora parámetros de la su
de una etapa (Cap. 7 ). Puede darse una aproximación a V{yt,) al prapoblación.
suponer muestreo aleatorio y 1/n y 1/ra despreciables respecto a 1 . Al sustituir para y, Y, y b a partir de (1 2.52 ), cálculos algebraicos
directos proporcionan
(12, 9)
n
Prueba. Para encontrar el error de muestreo de y¡, en muestreo v

yir V
Y—- er n—eN
r +I p
n(r'
(x -XV)-\
i I — £|(*1 ~ (12.53)
aleatorio simple, habíamos mostrado que si b en ylr se reemplazaba l i X i - x ) 2
por el coeficiente de regresión de población finita B - S&/SJ, el
Al promediar sobre la distribución de los e, resulta de (12.53)
error en la aproximación era de orden l/vn con relación al de y\r
que y,, es insesgada según modelo para x fijas en la población finita
El mismo método se aplica aquí. Por lo tanto, examinamos la va
y las dos muestras.
rianza de la aproximación. Además, de (12.53),
ylr = y + B(,x'-x)
E [(ylr- ^ ^ ] = <z / ( l - p 2) ( ~ ¿ ) + / 3 2( x ' - ^ 2+ (r / ( l - p 2) ^ ^
Los subíndices 1, 2 denotarán variaciones sobre las fases primera
y segunda del muestreo. Sea u 4 = y¡ — Bx^. En la segunda fase se (12.54)
considera la muestra grande como una población finita. Entonces,
El último término a la derecha de (12.54) proviene del error de
como la pequeña muestra se extrajo al azar de la grande,
muestreo de b y es de orden 1 /ti, con relación a los dos primeros
términos de la derecha. A l promediar los dos primeros términos de
E 2(yir) = y ' - V ’2 ( y l r ) = ( “ ^ 7) s u ' 2 la derecha sobre la distribución de las x creada por selecciones alea-
414 TE C N IC A S DE M U ESTRE O M U E S TR E O DOBLE 415
tonas repetidas de la población finita y de las dos muestras, se Asi, para un costo especificado C,
obtiene y _ S 2( M 1 - P 2) + '/ ? ? ) 2 Sy2
'™ " y C N (12.61)
(1255) Si sededican todos los recursos a una sola muestra sin ajuste
de regresión, esta muestra tiene tamaño C/c y lavarianza de su
= ( 12.5ó)
n n N media es
Esta expresión tiene la misma forma que (12.49), excepto en cSy2 Sy2
que en (12.56) ay- y p se refieren a la suprapoblación. y) = _C ~N (1Z62)
El muestreo doble con regresión ha sido extendido por Khan y Por lo tanto, el uso óptimo del muestreo doble dará una varianza
Tripathi (1 96 7) al caso donde p de las variables auxiliares x se miden menor si
en la segunda muestra, al estimar Y por la regresión lineal múlti
ple de y en estas variables. Al ser la segunda muestra una submues c > ( V c ( l - p 2) + V X > V (12.63)
tra aleatoria de la primera, y con normalidad multivariada supuesta Esta desigualdad puede expresarse de dos maneras.
para y y las x, la extensión de (1 2 .5 4 ) para p > 1 da para la varianza
promedio c (lW T T V . (12 64)
c p
<12-57)
2. 4 (c/c') ti r\
donde R es el coeficiente de correlación múltiple entre y y las x.
p ■ (I2 -65)
El caso en que la segunda muestra se extrae independientemente
Las Ecs. (1 2.64) y (12.65) dan los intervalos críticos de c/c' para p
de la primera fue considerado por Chameli Bose (1943).
dada, y de p para c/c/ dada, que redundan en un muestreo doble ven
tajoso.
12.7 A S IG N A C IO N O P T IM A Y C O M P A R A C IO N La Fig. 12.1 gráfica los valores de la razón c/c/ (en una escala
C O N E L M U E STR E O S IM P LE logarítmica) contra p. La curva I es la relación cuando los muéstreos
sencillo y doble son de la misma precisión; la curva II es válida
De la fórmula de la varianza (1 2.49 ), donde se supone 1/n cuando V¿p, =0.8 V(y), es decir, cuando el muestreo doble da un
despreciable, el muestreo doble con estimación de regresión puede incremento de precisión del 2 5 % , y la curva III se refiere a un in
compararse con una sola muestra aleatoria simple sin ajuste de re cremento de precisión del 50% . Por ejemplo, cuando P = 0.8, el mues
gresión. Tenemos treo doble es igual al sencillo en precisión si c/c' es 4, da un in
cremento de precisión de 25% de c/c' es más o menos 7V2, y un
= C = c n + c 'n ' (12.58) incremento de 50% si el valor de c/c? es aproximadamente de 13.
N n n
Para usos prácticos, las curvas sobreestiman las ganancias al
Por la desigualdad de Cauchy-Schwarz, el producto VC se minimiza canzadas gracias al muestreo doble, porque los mejores valores de
cuando n y n ' deben ser estimados de datos previos o conjeturados. Hay cier
_ r . i ti — A to margen para los errores en las estimaciones que deberían fijarse
c'n , n fe ' (1 - p ) 11/2 .
r'^V)~7s}
•Sy (1 ~ P )
P^y asiûe ^ Le ~~pr~\ (1259) antes de decidir adoptar el muestreo doble.
Para cualquier p , hay un límite superior a la ganancia en pre
A l sustituir en VC se tiene cisión por muestreo doble. Esto ocurre cuando la información sobre
CS 2 x' se obtiene gratuitamente (c 7 = 0 ). El límite superior a la pre
( V C ) min = 5 y2( v c ( l - p J) + J 7 ? ) 1 (1 2 . 6 0 ) cisión relativa es 1/(1 - p2).
416 TE C N IC A S D E M U E S T R E O M U ESTRE O DOBLE 417
es una estimación insesgada de S„2, se infiere que
c 2—s2
*yjc
Es una estimación insesgada de p2Sv2.
Por lo tanto, una estimación muestral de V (y(r) es
( l 2 .s 7 )
Si la segunda muestra es pequeña y los términos en 1/n no se

pueden despreciar en relación a 1, una estimación de varianza su
gerida para muestras aleatorias simples, a partir de (12.54) es
(12-68>
Esta es una híbrida de la varianza condicional y la varianza pro
medio.
12.9 E ST IM A D O R E S D E R A Z O N
Si la primera muestra se usa para obtener x‘ como una estima

ción de X en una estimación de razón Y, el estimador de Y es
F ig . 12.1. R e la c ió n e n tre c/c' y p p a ra treS v a lo r e s f ijo s d e la í >recis'ó n
r e la t iv a d e m u e s tre o d o b le y s e n c illo (12.69)
Curva I : los muéstreos doble y sencillo soJ1 'SU al precisión.
Para encontrar la varianza aproximada, escríbase
Curva I I : en muestreo doble da un incre*»61110 precisión del
Curva III: muestreo doble da un incremef1' 0 4e Precisión del 5<7'°•
y W = f * - '- v
12.8 V A R I A N Z A E S T IM A D A EN M UESTREO
D O B L E P A R A R E G R E S IO N = (| x - y ) + | < i '- v )
Si los términos en 1/n se pueden ignorar, U V(y,r) está áada P 01

= ? ( y - l W ) + £ ( x '- X )
(1 2.49 ): X X
La primera componente es el error de la estimación ordinaria de
v(h) = n n N razón (Sec. 2.11). Para obtener la varianza apropiada del error en
Con un modelo de regresión lineal, Ia cantidad la Sec. 2.11, reemplazábamos el factor X/x por la unidad en este
término. Para el mismo orden de aproximación, reemplazamos el
( 12 . 6 6 ) factor y/x en la segunda componente por la razón de población
R = Y/X. De modo que
es una estimación insesgada de S / ( l " P2)- Como
yR_ y = ( y - , R í ) + f ? ( ¿ '- Á ) (12.70)
z l(y,-9i
5)1 n- 1 Si la segunda muestra es una submuestra aleatoria de la primera
M UESTREO D O BLE 419
418 TE C N IC A S DE MTJESTREO
En el resto de este capítulo se considera el asunto del reemplazo

E2(yR - Y ) = y - - Y : v 2( f c - f ) * ( I - i L * (1 2 . 7 1 )
\n n > de la muestra y el asunto relacionado con hacer estimaciones a par
tir de una serie repetida de muestras. Este tema de estudio es apro
donde s/2 es la varianza dentro de la segunda muestra de la variable piado al contenido de este capítulo porque se pueden utilizar las
di = — Rx,. A l promediar ahora sobre selecciones aleatorias re técnicas del muestreo doble.
petidas de la primera muestra
Con los datos de una serie de muestras, hay tres clases de can
V'(y«)= V,E2+ £ ,V 2 tidades que podríamos estimar.
1. El cambio en Y entre una ocasión y la siguiente.

+ +R25*2) (1272) 2. El valor promedio de Y sobre todas las ocasiones.
como sd'2 es una estimación insesgada de Sd2 = S,/ — 2RSyr + R2S.2. 3. El valor promedio de Y para la última ocasión.
A l separar los términos en 1/n y 1/n' obtenemos En la mayoría de las encuestas, se centra el interés sobre el
promedio actual (3 ), particularmente si se puede esperar que las
n Í K ) J ^ - 2 ? S^ S ^ R S „ - R ^ _ S ¿ características de la población cambien rápidamente con el tiempo.
n n N Por otro lado, con una población que sufre cambios lentos, un pro
medio anual ( 2 ) sobre 12 muestras mensuales o cuatro muestras
12.10 M UESTREO R E P E T ID O D E L A M IS M A P O B L A C IO N trimestrales sería adecuado para los usos principales. Esta sería la
situación en un estudio sobre la permanencia de ciertas enferme
La práctica de confiar en muestras para la recolección de series dades crónicas en un gran lapso de tiempo. Tratándose de una en
importantes de datos publicados a intervalos regulares, se ha hecho fermedad cuya permanencia presenta una marcada variación esta
común. Esto se debe en parte a que se ha comprendido que con una cional, los datos corrientes son de mayor interés, pero también son
población dinámica, un censo a intervalos no frecuentes es de poca útiles los promedios anuales para comparaciones entre diferentes re
utilidad. Una información muy precisa sobre las características de una giones y años. Las estimaciones del cambio ( 1 ) se desean principal
población en julio de 1960 y julio de 1970, puede no ser de mu mente al intentar estudiar los aspectos de las fuerzas que se sabe
cha ayuda en la planeación que requiere un conocimiento de la actúan sobre la población. Por ejemplo, si se acepta una moción que
población en 1976. Pueden resultar útiles una serie de pequeñas supuestamente estimula la construcción de viviendas, es interesante
muestras tomadas a intervalos de un año o menos. saber si la tasa de construcción de casas nuevas se ha incrementado
en el año siguiente (a l tener presente que este incremento no se debe
Cuando se muestrea repetidamente la misma población (salvo
enteramente á la nueva le y ).
los cambios debidos al paso del tiem po) el muestreador está en una
posición ideal para hacer estimaciones realistas, tanto de los costos Supóngase que estamos en libertad de alterar o retener la com
como de las varianzas, para aplicar las técnicas, que conducen a la posición de la muestra, y que su tamaño total debe ser el mismo en
eficiencia óptima del muestreo. Una pregunta importante es, ¿con todas las ocasiones. Si deseamos maximizar la precisión, se pueden
cuánta frecuencia y de qué manera debe cambiar la muestra con el hacer los siguientes enunciados respecto a las políticas de reemplazo:
transcurso del tiempo? Son muchas las consideraciones que afectan 1. Para estimar el cambio, lo mejor es conservar la misma
esta decisión. La gente puede estar poco dispuesta a dar el mismo muestra en todas las ocasiones.
tipo de información una y otra vez. Los entrevistados pueden estar
2. Para estimar el promedio sobre todas las ocasiones, lo mejor
influidos por la información que reciben en las entrevistas y esto es sacar una nueva muestra en cada ocasión.
puede hacerlos cada vez menos representativos con el paso del tiem
3. Para estimaciones actuales, se obtiene la misma precisión,
po. Sin embargo, en ocasiones la cooperación es mejor en una se
ya sea conservando la misma muestra o cambiándola en cada oca
gunda entrevista que en la primera y cuando la información es de
sión. El reemplazo de una parte de la muestra en cada ocasión puede
índole técnica o confidencial, la segunda visita puede producir datos
ser mejor que estas alternativas.
más exactos que la primera.
420 TE C N IC A S DE M U E S TR E O M U E S TR E O D O BLE 421
Los enunciados 1 y 2 son válidos porque casi siempre habrá una es la primera muestra y la variable auxiliar x+ es el valor de y¡ en la
correlación positiva entre mediciones de la misma unidad en dos primera ocasión. La varianza de y£m' viene de (12.49), Págs. 412
ocasiones sucesivas. El cambio estimado en una unidad tiene la y 413: nótese que las muestras m y n corresponden a n y nJ, res
• varianza S,*+S**—2PS,S¿, donde los subíndices denotan las dos oca pectivamente, en (12.49). La cpf es despreciable.
siones. Si el cambio se estima de dos unidades diferentes, la varian La mejor estimación combinada de Y 2 se encuentra ponderando
za es S,*+Sa*. Al estimar la media global para las dos ocasiones, la las dos estimaciones independientes inversamente a sus varianzas.
varianza es (S ,2 + S, 2 + 2pS,S2)/4 si se conserva la misma unidad Si W s„, W » son las varianzas inversas, esta estimación es
y (S i 2 + S.*)/4 si se elige una nueva unidad.
(12.73)
El enunciado 3, menos obvio, se investiga en las secciones si
guientes.
donde
, "2 u
92 — W2u+ W 2m
12.11 M UESTR EO E N D O S O C A S IO N E S
Supóngase que las muestras son del mismo tamaño n en ambas Según la teoría de los mínimos cuadrados, la varianza de y•/ es
ocasiones y que las estimaciones actuales son de interés primario.
La política del reemplazo ha sido examinada por Jessen (1942). V(y2')= - 1
W2u + W2m
Por simplicidad, suponemos que se usa muestreo aleatorio simple.
De la Tabla 12.1, esto resulta ser después de simplificar
La media de la primera muestra tiene varianza S¿/n, sin que
haya información previa que utilizar. Al seleccionar la segunda
muestra, se retienen m unidades de las de la primera muestra (m <12-74)
para apareadas). Las u unidades restantes (u para no apareadas)
Nótese que si u - 0 (apareamiento completo) o si u = n (n o
se descartan y reemplazan por una nueva selección de unidades
apareamiento) esta varianza tiene el mismo valor, S£‘/n.
no seleccionadas previamente.
El valor óptimo de u se encuentra al minimizar (12.79) con
Notación. respecto a variación en u. Esto da
]/a„ = media de la porción sin aparear en la ocasión h
ü . ‘ ü — ¡ L (12.75)
“ media de la porción apareada en la ocasión h n 1+ V l - p 2 n 1+ v l - p
yh - media de la muestra completa en la ocasión h
Cuando la u óptima se sustituye en (1 2.74 ), la varianza mínima
Las porciones apareadas y las sin aparear de la segunda muestra
resulta ser
proveen las estimaciones independientes y2J, yM’ de ? 2, como se
muestra en la Tabla 12.1. En la porción apareada usamos una esti
V * , Ü V > - ^ < 1+ V T ? ) (12.76)
mación de regresión de muestreo doble, donde la muestra “grande”
La Tabla 12.2 muestra, para una serie de valores de p, el por
T A B LA 12.1. E s t i m a c i o n e s d e l a s p o r c io n e s a p a r e a d a y no
APAREADA
centaje óptimo que se debe aparear y la ganancia relativa en pre
cisión comparada con no apareamiento. El mejor porcentaje a apa
Estimación Varianza
rear nunca excede 50% y disminuye constantemente conforme p
aumenta. Cuando p = 1, la fórmula sugiere m - 0, la cual cae fuera
N o apareada: S22 1
ii
de la gama de nuestras suposiciones, ya que m se ha supuesto razo

a
u V^2„
nablemente grande. El procedimiento correcto en este caso es tomar
Apareada: t f d - P 2) , , s 22 1 m — 2. Las dos unidades apareadas son suficientes para determinar
y2n.'=y2», + b(y] - y Im)
m P n Wlm pY3rtarr\íir\tr¡ la Knpa de rePTesiÓn.
m u estreo d o ble 423
En algunas aplicaciones los datos para la ocasión 1 proporcionan

TABLA 12.2. P o r c e n t a j e Op t im o A pareado
varias variedades auxiliares correlacionadas con y,, una de las cua
%
les será usualmente y,. Por ejemplo, al estimar la caza de aves acuá
% de g a n a n c ia con
% ó p tim o de g a n a n cia ticas ys por cada cazador en Ontario de 1968 a 1969, Sen (1973a)
p m 1 rrt 1
ap areado en p rec is ió n encontró que la caza por cazador y el número de días de cacería
n 3 n ~ 4
en 1967 y 1968 estaban correlacionados con y2. En este artículo
0.5 46 7 7
amplió el análisis anterior al caso en que y2m se ajusta por su re
6
0.6 44 11 11 . 9
gresión lineal múltiple respecto a las variables auxiliares y donde las
0.7 42 17 17 15 muestras en las dos ocasiones son de tamaños desiguales. Con gran
0.8 38 25 25 23 des muestras de tamaño igual el único cambio en (12.76) para
0.9 30 39 39 39 V¿p,(y2') es sustituir P'1 por el cuadrado R- del coeficiente de corre
0.95 24 52 50 52 lación múltiple entre y. y las variables auxiliares (suponiendo nor
3.0 0 100 67 75 malidad multivariada). La teoría correspondiente para el caso en que
y2m se ajusta por la estimación de razón multivariada se da en
Sen (1 9 7 2 ) para tamaños de muestras iguales y en Sen (1973b)
La ganancia en precisión más grande que se puede obtener es para tamaños diferentes.
100% cuando P — 1. Si P no es alto, las ganancias son modestas.
Aunque el porcentaje óptimo para aparear varía con P, en la
12.12 M UESTREO E N M A S D E DO S O CASIO NES
práctica, solamente se puede usar un solo porcentaje para todas
las características de una encuesta. En la Tabla 12.2, la columna
El problema general de reemplazo lo ha estudiado Yates (1 96 0)
de la derecha muestra los porcentajes de ganancia en precisión cuan
y Patterson (1S50), en relación tanto con estimaciones actuales
do se aparean un tercio y un cuarto de las unidades. Ambas son
como con estimaciones de cambio. Cuando hay más de dos ocasiones,
buenos compromisos, excepto para las características en las cuales
p excede 0.95. aumentan las oportunidades para un uso flexible de los datos. En
una ocasión h podemos tener partes de la muestra que se aparean
Kulldorff (1 96 3) da una detallada discusión de este modelo; él
con la ocasión h - 1, partes que se aparean con ocasiones h — 1 y
considera el caso en el que en la segunda ocasión el costo de medi
h — 2, etc. En un intento por mejorar la estimación actual, podemos
ción de una unidad apareada (es decir, una antes medida) puede
tratar con una regresión múltiple que comprende todos los aparea
diferir de 1 de la medición de una nueva unidad no apareada y no
mientos en ocasiones anteriores. También se puede revisar la esti
supone tamaños iguales de muestra en las dos ocasiones. Por lo
mación actual para la ocasión h — 1 después de conocer los datos
tanto, aparte de los costos fijos, su costo en la segunda ocasión es
para la ocasión h. En la estimación revisada podría utilizarse la re
gresión de la ocasión h — 1, tanto en la ocasión h - 2 como en la
C 2= mcm+ ucu: — =m 8+u (12.77)
Cu ocasión h, al suponer que estuvieron disponibles las apropiadas por
ciones apareadas de la muestra.
donde 8 = c„/cu. Si los tamaños de muestras son los mismos en
Esta sección contiene una introducción a la materia. La atención
ambas ocasiones de manera que m + u =* n, la proporción no apa
se restringirá a estimaciones actuales en las que sólo se usa la re
leada óptima en la segunda ocasión se obtiene minimizando
gresión en la muestra inmediatamente anterior. Esto da como resul
VC, tado una pequeña pérdida de precisión, pero dado que usualmente
= [«5 + u ( l - S ) ] - [¿i +M(1 (12.78)
cS ? (n - u p ) (1 - p. p ) la correlación P disminuye conforme aumenta el intervalo de tiempo
entre las ocasiones, la pérdida en precisión rara vez será significa
donde p. - u/n y V viene de (12.74). Si 8 < 1, siendo más econó
tiva. La varianza S‘ y el coeficiente de correlación p entre valores
mico aparear, la proporción apareada óptima es desde luego, mayor
de características en la misma unidad en dos ocasiones sucesivas se
que los valores de la Tabla 12.2. También trata el caso en el que
suponen constantes todo el tiempo.
los costos deben ser los mismos en ambas ocasiones.
TABLA 12.3. E s t im a c io n e s de Yh e n la /í-esim a O c a s ió n

Ahora escogemos m h y u,, para maximizar esta cantidad y, por
lo tanto, minimizar V(yh’). A l escribir uh = n - m h y diferenciar el
E s tim a c ió n V a r ia n z a lado derecho de (1 2 .8 0 ) con respecto a mh obtenemos
" c o la
i v , ( i - p y 2f t - , y
- lRa f
N o ap a rea d o :
y j= y h u mh2 V mh n i
Esto da, al resolver para la mh, óptima, digamos,
A p area d o: Vi™' = + M y ¡,- 1 - j 'l.- l. m )
á ( 1 2 .8 1 )
n g h - ^ l+ V l- p )
En la /i-ésima ocasión, sean mh y uh los números de unidades
apareadas y no apareadas, respectivamente, con la ( f e - l)-ésim a Cuando se sustituye este valor en (12.80), la relación se con
vierte después de alguna manipulación algebraica en
ocasión. Las dos estimaciones de Yh que pueden obtenerse se dan en
la Tabla 12.3. El único cambio en procedimiento en la segunda oca 1 1- V l - p 2
sión (Tabla 12.1) es que en el ajuste de la estimación de la porción — = 1+ -----------t = = (12.82)
gh g h - i i l + 'J l - p )
apareada por la regresión, usamos la estimación mejorada y¡¡_¡ en
lugar de la media de la muestra yh-\- Esta relación puede escribirse
La varianza de la estimación apareada yhm‘ en la Tabla 12.3 rh = 1+ ¿r*_,
se deriva de (12.49) que está en Págs. 412 y 413. Nótese que ( a )
donde rh = l/gh y r , = l/ g x - 1. El uso repetido de esta relación de
nuestra m corresponde a la n en (1 2 .4 9 ) y (fe) el término P2S,-/n’
recurrencia da
en (12.49) que es igual a B 2V (x'), se reemplaza por p2V(y',,-l), como
B = P cuando S es constante en ocasiones sucesivas y y '_ , corres — = rh = 1+ b + b2+ • • • + bh~l =■V - T -
ponde a x ' en el análisis previo. gk l-o
Ahora examinamos la precisión obtenida si en toda ocasión se donde, de (1 2 .8 2 ), b = ( l - V l - p 2)/(l + V l - p 2). Dado que 0 < b < 1,
usan las óptimas mh y u,. y las ponderaciones óptimas. Se encontrará el factor límite de la varianza g « es
que la óptima m j n aumenta constantemente en ocasiones sucesi
2v l - "
vas, y se aproximan rápidamente a un valor límite de Vz-
A l ponderar inversamente con la varianza, la mejor estimación
de yh es Por lo tanto, la varianza de yh' tiende hacia
(12.79)
v'(yco') = - ( - ^ S ! ) (12.84)
donde <¡>h - 'WHJ ( W ha + W ^ ) . Esto da n '1 + v 1 —p l
Finalmente, el valor límite de mh se obtiene de (12.81) como

y ( ñ ') = w * =—
whu + Whm n m~o V i —p 2 1
donde gh denota la razón de la varianza en la ocasión h a la de la n _ goo(l d -'/ l-p 2) ~ 2

primera ocasión. A l sustituir W hu, W hm de la Tabla 12.3, tenemos
independientemente del valor de p.
S2 n .................% 1
La Tabla 12.4 muestra el porcentaje óptimo a aparear — 100m jn ,
según se obtiene de (1 2 .8 1 )— y las varianzas resultantes para p =
0.7, 0.8, 0.9 y 0.95 y para una serie de valores de fe.
r
M U ESTRE O DOBLE 427
Por lo tanto,
TABLA 12.4. P o rcentaje O p t im o A paread o v V a r ia n z a s
% a p a rea d o 100r fijr t K » = n Y O ín llS 2 gh = [ ^ ~ + <1 +p2(1 - 4,)2gh- 1 (12-85)
donde p = u/n, x = m/n. Escríbase esta relación como
II
P
SO
0.7 0.8
O
h 0.7 0.8 0.9 0.95 0.95
gh = a+bgh-i
2 42 38 30 24 0.857 0.800 0.718 0.656 Por aplicación repetida, tenemos, dado que g¡ = 1,
3 49 47 42 36 0.837 0.762 0.646 0.556
4 50 49 47 43 0.834 0.753 0.622 0.515 a ( l - b h~')
5 50 50 49 46 0.833 0.751 0.613 0.495 **— \ = r ~ 'b
■CO 50 50 50 50 0.833 0.750 0.607 0.476
Como b = P2( 1 - es menor que 1, el valor límite es
Para la cuarta ocasión, el porcentaje óptimo apareado es cercano a \ ó 2+ pt.(l-<p)2( . l - p 1) , , 0 0 f.N

a 50 para todos los valores de p mostrados, aunque una cantidad a „ [iV < i-7 > T ' ( ]
menor de apareamiento se indica para la segunda y tercera ocasio
El valor de la ponderación £ que minimiza la varianza límite pue
nes. Las reducciones en varianza, esto es (1 — <?/.), son modestas si
de encontrarse al diferenciar (12.86). Esto conduce a una ecuación
P es menor que 0 .8 .
cuadrática cuya raíz apropiada es
V i —p 7[ V l —p 2+ 4 A ja p 2 —V i —p 2]
12.13 S IM P L IF IC A C IO N E S Y A D E L A N T O S U LTE R IO R ES
4>6P I = 2Ap2
En su aplicación práctica, el análisis precedente puede necesitar En la práctica, no se conocerá el valor exacto de p y diferirá de
una modificación. Hemos supuesto que todas las políticas de reem característica a característica. En general, se puede escoger un valor
plazo cuestan lo mismo y son igualmente factibles. Con poblaciones simple de transacción. Claramente, <£,>,„ será menor que = u/n,
humanas, los costos de campo probablemente sean más bajos si se ya que la parte apareada de la muestra da una precisión más alta
retienen las mismas unidades para un cierto número de ocasiones. por unidad que la parte no apareada. Por ejemplo, con p — 0.25, esto
Si las estimaciones del cambio en el total o en la media de la pobla es, V4 de la muestra sin aparear, <¡>ápt resulta ser 0.216, 0.198 y 0.164
ción son de interés, este factOT también apunta hacia el apareamien para P = 0.7, 0.8, 0.9. La elección de c¡> = 0.2 sería adecuada para
to de más de la mitad de las unidades de una ocasión a la siguiente. esta gama de valores de p.
También es conveniente conservar constantes las ponderaciones Para la estimación de cambio, tenemos
y las proporciones apareadas, en lugar de cambiarlas en cada oca
sión. Consecuentemente, investigaremos las varianzas de yh' y de la Y (y V - y Á - ,)= V'(yfc') + V ( y ; _ 1) - 2 c o v fo 'y í.- ,) (12.87)
estimación del cambio (yh'~ y 'h -i) cuando m , u y <¡> se mantienen Para encontrar el término de covarianza, nótese que si yh¡, ¡
constantes. Continuamos escribiendo V(yv) = ghS2/n, aunque el valor son los valores para la i-ésima unidad en el grupo apareado en las
actual de g¡, será diferente del de la sección precedente. ocasiones h y ( h — 1 ), nuestro modelo es
La estimación es ahora
y*, = Yk +p(yh- u ~ Yh- i ) + ehi
¿h =<t>yhu'+tt-<l>)yhm
donde los e„¡ son independientes de las y. A partir de este modelo se
Al sustituir las expresiones para las dos varianzas (de la Tabla
encuentra, por sustitución, que
12.3), tenemos
ñm ' = 9hm+ p(y'h-i-yh-i,m)= Yk+p(y'h-i- Yh-i)+ ehm
V(yh' ) = Í!f = < p 2V(y',u')+(l-<1 >)2V(yhm')
Por lo tanto, la covarianza de yhm' y yj,_, es p V (y¡,_i). Pero
, s y q -^ fa ,.,
cov (y,,'y¿-|) = cov {[</>yh„ +(1 -<A)y/,m']yÁ-i} = p (l —V>) V(y'h- 1)
Lu m n
M U ES TRE O DOBLE 429
TABLA 1 2 .5 . G a n a n c ia s P o r c ie n to en E fic ie n c ia p a ra la E s tim a c ió n

puede ser una buena práctica si las estimaciones actuales y las de
yh ' A c tu a l y la E s tim a c ió n d e l C a m b io ( 9 k '~ y l . - i)- P r o p o r c io n e s
A p a rea d a s:% y %
cambio son importantes.
La comparación de las ganancias en eficiencia para la estima
Estimación actual: ganancia porciento = 100(1 — gA)/ s 4 ción actual, yh' en la Tabla 12.5, con las ganancias óptimas a partir
de la Tabla 12.4 sugiere que después de la segunda ocasión poca
precisión es la que se pierde usando peso constante y una propor
1
0.7 P= 0.9 P = 0.95 , ción fija de elementos apareados, a menos que P > 0.95.
i'
0 .8
Q. ~ks
II
h a 1 a 3 Si P excede 0.8, el coeficiente de regresión b = P puede sustituirse
4 2 i 4 i 4
con tan sólo una pequeña pérdida de precisión resultante. Esto da
2 14 10 22 14 33 19 41 22 una estimación yh" de la forma
3 16 14 30 20 52 32 67 39
4 17 15 32 24 59 40 79 52 ñ “= + (1 - <t>W-x+ 9hm- (12.89)
co 17 15 33 26 62 50 89 74
En la encuesta de población actual hecha mensualmente en los
RG a 15 10 27 18 56 40 Estados Unidos por la Oficina del Censo una cuarta parte de las uni
— —
dades de segunda etapa se reemplaza cada mes, de modo que un
h Estimación del cambio-, ganancia porciento = 100(2 - 3jl')/ domicilio particular permanece en la muestra durante cuatro meses
consecutivos. Ese domicilio se omite en la muestra por ocho meses-,
2 106 153 156 233 245 399 326 565 pero luego se reincluye por cuatro meses, incrementando así ligera
3 113 160 170 245 277 415 365 588 mente la precisión de las comparaciones entre años sucesivos.
4 115 160 174 251 285 424 388 603 La estimación compuesta usada en esta encuesta es de una forma
co 115 163 178 251 292 440 397 624 relacionada con (12.89) pero ligeramente diferente.
RG 101 163 166 269 381 605 — — yh" = (1 - K ) y h + + 9km - jfc-i.J (12-90)
"Descrito en la Pág. 430. donde K es un factor de ponderación constante. La diferencia es
que yh, la estimación actual para toda la muestra, toma el lugar de
dado que y^ es independiente de yÁ-i- De (12.87), esto da
y,men (1 2.89 ). Las cantidades yhm, yh en (12.90) son estima
S2 ciones de razón de un tipo bastante complejo.
v ( y » '- y ¡ , - i ) :=— { g h + g h - ili- 2 p (i-< f> )]i ( 1 2 .8 8 ) La varianza de % " (debida a Bershad) está dada en Hansen,
Hurwitz y Madow (1 9 5 3 ); véase también el apéndice en Hansen y
De (1 2.85 ) y (1 2.87 ), las varianzas de yh' y (yh'- y 'h-x) pueden cal
otros (1 95 5). El estimador del cambio de un mes a otro es
cularse para cualesquiera valores de m, <¡>, y P. La Tabla 12.5 muestra
las ganancias porciento en eficiencia que resultan para estas esti dk = yh" = y ;-1
maciones en relación a las estimaciones obtenidas a partir de mues
Como las unidades primarias permanecen inalteradas, sólo se afectan
tras independientes en cada ocasión. Las proporciones apareadas
las componentes dentro de unidades de V(yh") y V(dh) por la política
son A - m/n = /¿ y %. El peso <f> se tomó como 0.35 para X - % y
de rotación de muestra.
0.2 para A. = %.
Rao y Graham (1 96 4) han examinado el comportamiento de
N o es sorprendente que las características más importantes de las estimaciones compuestas en políticas de rotación de este tipo,
la Tabla 12.5 son las ganancias elevadas en eficiencia para las es en las que un entrevistado permanece en la muestra durante r meses,
timaciones del cambio cuando P es al menos 0.7. Además, el aumento y luego se le saca de la muestra durante m meses. Ellos usaron como
de la proporción apareada de % a %, da lugar a ganancias sustan modelos un correlograma exponencial y un correlograma lineal en
ciales en eficiencia de las estimaciones de cambio a costa de pérdidas el tiempo, que desciende a cero. Graham (1 97 3) ha estudiado un
menores en eficiencia para las estimaciones actuales. Los resultados correlograma más complejo, requerido cuando hay una elevada co
sugieren, que retener la proporción %, % o % de una ocasión a otra, rrelación entre los meses fe y (fe — 12 ).
430 T E C N IC A S DE M U ESTREO M U ESTREO DO BLE 431
Sus ganancias en eficiencia para r = 2, 4 y tn = co corresponden cuando los datos dependen de la memoria no registrada del entre
a los resultados para x = V2l % en la Tabla 12.5. Para un coxrelo- vistado, sin embargo, el método puede tener éxito si los datos son
grama exponencial en el que la correlación entre resultados de la del tipo que el entrevistado registra cuidadosamente por rutina.
misma unidad en las ocasiones fe, fe - i es P\ las líneas rotuladas
RG de la Tabla 12.5 muestran para p = 0.7, 0.8, 0.9 sus porcentajes
E J E R C I C I O S
ganancias en eficiencia. Para cada p utilizan en (12.90) el K óptimo
para las estimaciones actuales al tender h co. Como, se muestra 12.1. Se destinan $3 000 a una encuesta para estimar una proporción. La
en la Tabla 12.5 también encuentran que las ganancias de eficiencia encuesta principal costará $10 por unidad de muestreo. Se dispone de infor
con las estimaciones compuestas son mucho más grandes al estimar mación en registros, a un costo de $0.25 por unidad de muestreo, que permite
la clasificación de las unidades en dos estratos de tamaños casi iguales. Si la
el cambio que al estimar el nivel actual.
proporción verdadera es 0.2 en e l estrato 1 y 0.8 en el estrato 2, estime
En un contexto más general, Scott y Smith (1 9 7 4 ) han discutido n y n' óptimas y el valor resultante de ¿Produce el muestreo doble
el papel que desempeñan los métodos de series de tiempo en las alguna ganancia en precisión sobre el muestreo simple? (L as razones n '¡ ¡V,
estimaciones hechas en encuestas repetidas de varios tipos. nh/Nh se pueden ignorar.)
12.2. Para las W ht P,, en el ejercicio 12.1. encuentre las razones de costo
En otra política de rotación se extrae una nueva muestra en cada c j c n‘ para las cuales el muestreo doble es más económico que el simple.
ocasión, sin aparear. Con muestreo semanal o mensual, este plan es 12.3. Una población contiene L estratos de igual tamaño. Si V rnn denota
apropiado, cuando son primordiales las estimaciones anuales ( y en la varianza de la media de una muestra aleatoria simple y V , „ V son las
nienor medida las semestrales o trimestrales) como, por ejemplo, varianzas correspondientes para muestreo aleatorio estratificado con asigna
en una encuesta sanitaria con énfasis en las enfermedades crónicas. ción proporcional y para muestreo doble con estratificación, demuestre que,
aproximadamente,
Si el cuestionario obtiene para cada unidad los resultados del mes
anterior y los del mes en curso, podemos considerar las estimaciones
compuestas de la forma nVm = sKi + -— - -----
yh=yh+<t>h(y'k-i-yh-i.h) (12.91)
nV„ = 5, 2
donde yh «= estimación de datos actuales en la muestra actual." -
E (ñ -ñ 2
yh-i.ii = estimación hecha sobre datos del mes anterior en la
muestra actual.
yÁ_i = estimación compuesta para el mes anterior. donde Sh- es la varianza promedio dentro de estratos. ( N y n ' se pueden con
siderar ambas como grandes en relación con L y las nh en muestreo doble pue
La teoría es discutida por Hansert, Hurwitz y Madow (1 9 5 3 ), y den suponerse iguales a n / L .)
W oodruff (1 9 5 9 ), que la aplican a una encuesta de ventas al me Por lo tanto, si ( R P ) , ¡ denota la precisión relativa de la muestra estra
nudeo, y por Eckler (1 9 5 5 ). En la encuesta de ventas al menudeo, tificada con la muestra aleatoria simple, con una definición correspondiente
para ( R P ) is demuestre que
la estimación compuesta involucra una estimación de razón, que
es de la forma (RP)
l + (/ i/ n ')[(R P )„ - 1]
y V = (i- ^ )ñ + ^ ( ^ - W _ ,
'yh-i,hy Para ( R P ) „ = 2. trace (R P )«¡, contra n / n ‘. ¿Qué tan pequeña debe ser esta
razón para que ( R P ) Js = 1.9?
donde W es un factor ponderante. Como las correlaciones de mes-a
12.4. Si p = 0.8 en muestreo doble para regresión, ¿qué tan grande debe
mes son muy elevadas al promediar cerca de 0.98, las ganancias en ser n' con relación a n, si la pérdida en precisión debida a errores de mues
precisión serán sustanciales. Un mes más tarde se calcula una es treo en la media de la muestra grande se quiere menor al 10% ?
timación compuesta realizada para el mes fe, que usa los resultados 12.5. En una aplicación de muestreo doble para regresión, la muestra
para el mes fe de la nueva muestra tomada en el mes (fe + 1 ). pequeña fue de tamaño 87 y la grande de tamaño 300. Los siguientes cálculos
se aplican a la muestra pequeña:
Con este método es esencial que los datos obtenidos del mes pre-
ODÍ)n f.xact:os en \a muestra actual. Esto podría no ser así,
Calcule el error estándar de la estimación de la regresión de Y. pondiente a y en muestreo doble con selección óptima de n/n‘ es (im órese
12.6. Para p = 0.95, verifique los datos que aparecen en la Tabla 12.4
1/N),
para el porcentaje óptimo que tendría que ser apareado y para la ganancia
en precisión en relación con no apareamiento. Calcule los correspondientes E* = e / ( \ + y f ^ J E - 1 )2
porcentajes de ganancias en precisión si se retiene una tercera parte de las
unidades de la primera a la segunda ocasión y la mitad de las unidades se Por lo tanto, debe observarse que con cualquiera de estos estimadores, el
retiene en cada ocasión subsiguiente. muestreo doble no será altamente efectivo a menos que c ’/c sea pequeño
12.7. En muestreo aleatorio simple en dos ocasiones, suponga ‘que la esti (com o < 1/10). Por ejemplo, con c'/ c = 1/10, E = 6 da = 2.1.
mación en la segunda ocasión es, en la notación de la Sec. 12.11,
12.11. En muestreo en dos ocasiones, supóngase que St = S„ = S y que
y2" = (r-<¿)(yI+y 2m -y 1J + tf,j'2u las muestras son grandes, de modo que los coeficientes de regresión de y.,¡
respecto a yu y de respecto a y2i en la parte apareada de las muestras
(a ) A l ignorar la cpf, muestre que en las dos ocasiones, son ambos efectivamente iguales a p. La estimación
V i' en !a Sec. 12.10 y una estimación análoga y ,' se construyen usando la
regresión de yu respecto a y2i. Demostrar que
donde A = rn/n, p = u/n. ( b ) Para p, A, p, dados encuentre el valor de

que minimiza V(y2"). Muestre que si p excede V2 la m ejor ponderación <¡> yace
entre p y p / (l + p.).
12.8 . Para p = ¡i = y2, p = 0.8 y p = 0.9, compare V (y 2") en el ejer

cicio anterior con la varianza de la estimación compuesta óptima de la regre [Una manera de hacerlo, es expresar (y2'± y i ') como funciones lineales de
sión y/, según se da en la Ec. 12.74. (E n y " tome $ — 0.2 cuando p = % (y z m i y ^ l y que no están correlacionadas].
y </» = 0.4 cuando p = y¿.) Verifique que para estos valores de ¡, la estima Nótese que, como lo sugiere la intuición, ( i ) se minimiza cuando u = 0
ción y.," es casi tan precisa como y.,' para ambas p = y p = y,. mientras que ( t i ) se m inim iza cuando u = n.
12.9. Una muestra independiente de tamaño n j e toma cada mes. De la
muestra tomada en cualquier mes se toman datos para el mes actual y para 12.12. E l caso más favorable para la aplicación del método en el Ejerci
el anterior. Se form a una estimación compuesta y/ como en (1 2.91), Sec. cio 12.1 ocurre cuando, en el estrato 1, la verdadera proproción es 0. Al
12.13. estimar el número total de unidades Y, en la población que tienen un atributo
costoso de medir, esto ocurre cuando hay un segundo atributo, barato de me
dir tal que sólo- unidades que tengan el segundo atributo pueden poseer el
primero. E n una muestra aleatoria simple de tamaño n ', cuéntese el número
El modelo es m ' que tienen el atributo 2. Extráigase una submuestra de tamaño vm’ =
m'Jk de éstas, y cuéntese el número r que tiene el atributo 1.
= Yh +p(y*-u - Yi,-i) + ew
( a ) De los Teoremas 12.1 y 12.2 mostrar que Y, = Nkr/n es una estima
donde ehi es independiente de las y y tiene varianza (1 — p2) . Muestre
ción insesgada de Y 1 con varianza
que
(<0 Vh ~ Ía = ¿n + tÁ S h -i ~ Ja—i ) + (p — ~ Ja_i)
( b ) Si K (y/) = ghS -/n¡ donde S 2 es constante en todas las ocasiones,
“ U - P1) + + (P - donde P,, (P , 4- P2) son las proporciones de población que tienen los atribu
( c ) E l óptimo ^ = p/( 1 -f- y el óptimo resultante gh es tos 1, 2. Supóngase que 1/N(P, + P2) se puede ignorar.
(b ) Con c = 10, c' = 1, el investigador conjetura que P, •= 0.25. P 2 =

1 + gh-\ 0.15. ¿Es provechoso el muestreo doble en este caso?
( d ) El gh limitante es g „ = Y\ — p2. Estos resultados los dio Ecklcr

(1955).
12.10. Si E¡, = V (y )/ V (y fr) y E R = V (y)/ V (yR) son las eficiencias relativas de
las estimaciones de regresión lineal y de razón de la media de una muestra
aleatoria simple, demostrar que para yb y para yR la eficiencia relativa corxes-
C A P IT U L O 13
Fuentes de Error en las Encuestas
13.1 IN T R O D U C C IO N
La teoría presentada en capítulos precedentes supone todo el

tiempo que se usa alguna clase de muestreo probabilístico y que la
observación y¡ en la i-ésima unidad es el valor correcto para esa
unidad. El error de la estimación emana solamente de la variación
aleatoria de muestreo que está presente cuando se miden n de las
unidades en lugar de la población completa de N unidades.
Estas suposiciones son razonables para los tipos más simples de
muestreo, en los cuales los medios de medición son exactos y la cali
dad del trabajo es alta. En encuestas complejas, particularmente
cuando intervienen difíciles problemas de medición, los supuestos
pueden estar muy lejos de la verdad. Pueden presentarse tres fuentes
adicionales de error que son las siguientes:
1. Fracaso en medir algunas de las unidades en la muestra esco

gida. Esto puede ocurrir por omisión, o, con poblaciones humanas,
debido al fracaso en la localización de algunos individuos o su re
nuencia a contestar las preguntas una vez que se les localiza.
2. Errores de medición en una unidad. El medio de medición
puede estar sesgado o ser impreciso. Con poblaciones humanas los
entrevistados pueden no poseer información exacta o dar contesta
ciones sesgadas.
3. Errores introducidos en la edición, codificación y tabulación
de los resultados.
Estas fuentes de error necesitan una modificación de la teoría

estándar de muestreo. Los principales objetivos de tal modificación
son proveer una guía respecto a la distribución de recursos entre la
reducción de errores aleatorios de muestreo y la reducción de los
436 T E C N IC A S DE M UESTBEO F U E N T E S DE ERROR E N L A S E N C U E STAS 437
otros errores, así como desarrollar métodos para calcular errores TABLA 13.1. R e s p u e s ta s a T k e s S o lic it u d e s e n una
E n c u e s ta p o r C o rre o
estándar y límites de confianza que permanezcan válidos aun cuan
do estén presentes los otros errores. Número promedio
Número de % de la de árboles
productores población por productor
13.2 EFECTO S D E L A N O -R E S P U E S T A
Respuesta al primer envío 300 10 456
Respuesta al segundo envío 543 17 382
Usaremos el término no-respuesta, para referimos a la falla en
Respuesta a l tercer envío 434 14 340
la medición de algunas de las unidades en la muestra seleccionada.
Personas que no responden 1839 59 290
En el estudio de la no-respuesta es conveniente pensar en la pobla después de 3 envíos ------ __
ción como dividida en dos “estratos”, el primero consistente de Población total 3116 100 329
todas las unidades para las cuales serían obtenidas las mediciones
si las unidades llegaran a caer en la muestra y el segundo, de las
tres cartas. La respuesta total fue pobre, más de la mitad de la po
unidades para las cuales no se obtendrían mediciones. Las composi
blación no dio la información aun después de los tres intentos.
ciones de los dos estratos dependen íntimamente de los métodos que
Consideremos ahora los efectos de la no-respuesta sobre la esti
se usen para localizar las unidades y obtener los datos. Una encuesta
mación de muestra. Sean N „ N 2 los números de unidades en los
en la cual se hacen al menos tres llamadas, si fuera necesario, en
dos estratos y W , = N t/N, W 2 = N 2/N, de tal manera que W 3 es la
cada casa y en la que un supervisor con poderes excepcionales de
proporción de no-respuesta en la población. Supongamos que se toma
persuasión va a visitar a todas las personas que se rehúsan a dar
una muestra aleatoria simple de la población. Una vez que se com
datos, tendrá un estrato de “no-respuesta” mucho menor que una
pleta el trabajo de campo, tenemos datos de una muestra aleatoria
en la cual solamente se hace un solo intento por casa.
simple del estrato 1 pero no tenemos datos del estrato 2. Por lo tanto,
Esta división en dos estratos distintos es, desde luego, una sobre-
la cantidad de sesgo en la media de la muestra es
simplificación. La casualidad juega su parte en la determinación de
si una unidad se encuentra y se mide en un número dado de inten E iy J - Y = Y, - Y = Y ,- ( W t V, + W2? 2)
tos. En una especificación más completa dei problema, nosotros
= W2( Y l - Y 2) (13.1)
asignaríamos a cada unidad una probabilidad que representara la
oportunidad que tiene de ser medida por un método de campo dado, La cantidad de sesgo es el producto de la proporción de no-res
si cayera en la muestra. puesta y la diferencia entre las medias de los dos estratos. Dado
La muestra no provee información acerca del estrato 2 de que la muestra no provee información acerca de 7 2, el tamaño del
no-respuestas. Esto no importaría si se pudiera suponer que las ca sesgo es desconocido a menos que se puedan establecer límites para
racterísticas del estrato 2 son las mismas que las del 1. Sin embargo, Y 2 a partir de alguna fuente que no sean los datos de la muestra.
dondequiera que se han hecho comprobaciones se ha encontrado Con una variable continua, los únicos límites que se pueden asig
que las unidades en el estrato “no-respuesta” difieren de las unida nar con certeza a menudo son tan amplios que tienen poca utilidad.
des que son mensurables. Una ilustración aparece en la Tabla 13.1. Consecuentemente, con datos continuos, cualquier proporción
Los datos provienen de un muestreo experimental de huertos de apreciable de no-respuesta usualmente hace imposible la asignación
frutales en Carolina del Norte en 1946. Tres envíos sucesivos por de límites de confianza útiles a Y a parür de los resultados de la
correo del mismo cuestionario se hicieron a los productores. Para una muestra. Quedamos en la posición de tener que confiar en alguna
de las preguntas — número de árboles frutales— había datos com conjetura acerca del tamaño del sesgo, sin datos que apoyen seme
pletos para la población (Finkner, 1950). jante conjetura.
La declinación constante en el número de árboles frutales por En el muestreo para porporciones, la situación es un poco más
productor en las respuestas sucesivas es evidente, siendo estos nú fácil, ya que la proporción desconocida P 2 en el estrato 2 debe estar
meros 456 para las respuestas al primer envío, 382 en el segundo entre 0 y 1. Si W 2 es conocida, estos límites de P 2 nos capacitan
envío, 340 en el tercero y 290 para los que no respondieron a las para la construcción de límites de confianza para la proporción P
F U E N T E S DE ERROR E N LA S ENCU ESTAS 439
de la población. Supóngase que se toma una muestra aleatoria sim

muestra equivalente nc, al suponer que no hay no-respuesta, se en
ple de n unidades y que se obtienen mediciones para n, de las uni cuentra de la ecuación
dades en la muestra. Suponiendo n, suficientemente grande, los
límites de confianza al 95% para P, están dados por 5.6 = 2V(50)(50)/n,
p i ±2'/piq l/n¡ n, =320
donde p v es la proporción de la muestra y la cpf se ignora. . Para W 2 = 10, 15 y 20% , los valores de ne son 155, 90 y 60
Cuando tratamos de derivar una declaración de confianza acerca respectivamente. Es evidente la conveniencia de dedicar una porción
de P, estaremos en terrenos seguros si suponemos P-. = 0 en la bús sustancial de los recursos a la reducción de la no-respuesta.
queda de P,, y P, = 1 cuando buscamos Pu. Entonces podemos tomar, Si la tasa de no-respuesta de la población es desconocida, como
para los límites al 95%, sucederá de costumbre pueden calcularse límites conservadores de
confianza de los datos de muestra por un método que sugirió un
K = Wi(pl -2 '¡p ¡q ¡/ n ,)+ W2(0) (13.2)
estudiante. A l calcular el límite inferior, supone que todos los no-
P u = ^ ( p l + 2^pxq l/nl) + W 1( l ) (13.3) respondientes de la muestra hubiesen dado una respuesta negativa.
Es fácil verificar que estos límites son conservadores, esto es, que A l calcular el límite superior, suponer que todos los que rehusaron
responder hubiesen dado una respuesta positiva. Por ejemplo, supo
Pr(PL s P s P u) > 0.95
ner n = 1 000 , n í = 800 y p¡ — 10 % , de modo que 80 miembros
Los límites se pueden estrechar un poco mediante un argumento de la muestra dan una respuesta positiva y la tasa muestral de no-
más cuidadoso (Cochran, Mosteller y Tukey, 1954, Pág. 280), dado respuesta es 20% . Entonces en porcentajes,
que P.. no puede ser 0 y 1 simultáneamente, como antes se supuso.
Los limites son demasiado amplios a menos que W.. sea muy PL = 8 - 2V(8)(92)/1000 = 6.3%
pequeña. La Tabla 13.2 muestra los límites promedio para una mues
tra de tamaño n = 1 000 y una serie de valores de W , y p,. Como Pu = 28 + 2V(28)(72)/1000 = 30.8%
los limites en (1 3 .2 ) y (1 3 .3 ) dependen del valor de (número Los límites son un poco más amplios que para p, =■ 10%. W - =
de entrevistados en la muestra), hemos tomado n r = n W lt su valor 20% , en la Tabla 13.2.
promedio, para los cálculos en la Tabla 13.2. Si se conoce W z de experiencia previa en el tipo particular de
El rápido aumento en la amplitud del intervalo de confianza encuesta, Bimbaum y Sirken (1950a, 1950b) dan un método para
con una W.¿ creciente es evidente. Es interesante examinar cuáles encontrar el tamaño n de muestra que garantiza con riesgo a, un
valores de n serían necesarios para dar las mismas amplitudes de error absoluto en la proporción de muestra menor que una cantidad
intervalo de confianza si W , fuera cero. Esto se hace fácilmente especificada d. N o se supone conocimiento anticipado de P2, P-, o
cuando p, es 50% . Para W . =*= 5% , la Tabla 13.2 muestra que la P. Si no hubiera no-respuesta tomaríamos (según la Sec. 4.4),
amplitud media del intervalo de confianza es 5.6. El tamaño de
n = tazPQ/d2 (13.4)
TABLA 13.2. L ím it e s d e C o n fia n z a a l 9 5 % p a ra P (% )
Cuando n = 1000
donde t„ es el desvío normal correspondiente al riesgo « de que el
error exceda d. Sin información previa sobre P, tomaríamos P = 0.5
No-respuesta Porcentaje de muestra, 100 p,
como el caso menos favorable, lo que da
ioowt. 5 10 20 50
0 (3.6, 6.4) (8.1, 11.9) (17.5, 22.5) (46.7, 53.2)

5 (3.4, 11.1) (7.6, 16.3) (16.5, 26.5) (44.4, 55.6) Al tomar la combinación menos favorable del sesgo W 3(P j — Ps)
10 (3.2, 15.8) (7.2, 20.8) (15.6, 30.4) (42.0, 58.0) Y el valor de P., Bimbaum y Sirken muestran que un valor de n
15 (3.0, 20.5) (6.8, 25.2) (14.7, 34.3) (39.6, 60.4) que aún garantiza un error menor que d, con riesgo a, es
Í2.8. 25.2) (6.3, 29.7) (13.7, 38.3) (37.2, 62.8)
T A B L A 13.3. V a l o r M í n im o d e n p a r a L í m i t e d a d o d e
son más difíciles de alcanzar, que las familias con niños muy peque
E r r o r d , c o n R i e s g o a = 0 .0 5 ños o con personas de edad confinadas en la casa.
% 3. Incapaz de contestar. El entrevistado puede no tener la infor
N o -re s p u e s ta d (% ) mación requerida para ciertas preguntas o puede mostrarse poco
lOOtK* 20 15 10 5 inclinado a darla. Una redacción hábil del cuestionario y su prueba
previa son una salvaguardia.
0 24 43 96 384
122 4. Los “hueso duro". Las personas que inexorablemente recha
2 27 50 653
4 31 60 166 2000 zan ser entrevistados, que están incapacitadas o que están fuera de
6 36 75 255 .... casa durante todo el tiempo disponible para el trabajo de campo, son
8 43 99 521 las que constituyen este sector. Esto representa una fuente de sesgo
10 53 142 que persiste, sin importar cuánto esfuerzo se ponga en la perfección
15 112 de las listas.
La identificación y medida del no-cubrimiento son difíciles. Con

Nótese que no hay valor de n que satisfaga si W 2 > d. Si W 2 - 0,
muestreo de áreas, un método es revisitar las unidades primarias,
esta ecuación se reduce a (1 3 .5 ) aparte del término — 1, el cual
al hacer una lista cuidadosa que sirve como comprobación. Las
viene de una aproximación en el análisis. Algunos valores de n
comparaciones de los recuentos de los números de personas o habi
dados por el método de Bimbaum y Sirken se muestran en la T a
taciones con los de otra encuesta indican a veces que algunas se han
bla 13.3.
omitido. Cuando el marco principal es un directorio de direcciones
Esta tabla cuenta la misma triste historia que la Tabla 13.2. Si
por calles, el mismo se puede completar con muestra de área, cuyo
nos contentamos con una estimación imprecisa ( d — 2 0 ), cantida
propósito es muestrear parte de la ciudad (p. ej., edificios nuevos)
des de no-respuesta hasta de 10 % se pueden manejar duplicando el
no cubierta adecuadamente por el directorio, y en partes donde el
tamaño de la muestra. Sin embargo, cualquier porcentaje considera
directorio parece exacto, buscar direcciones no incluidas en el mismo.
ble de no-respuesta hace imposible o muy costoso alcanzar una pre
Las encuestas que emplean estos métodos, con una discusión del
cisión altamente garantizada mediante el aumento del tamaño de la
problema de no-cubrimiento, son descritas por Kish y Hess (1958)
muestra entre los entrevistados.
y Woolsey (1956).
Con respecto a los no-en-casa, el problema es más fácil en
13.3 T IP O S D E N O -R E S P U E S T A encuestas en las cuales cualquier adulto en la casa es capaz de
contestar las preguntas, que en aquellas en las que se entrevista
En las secciones subsiguientes se describen algunos métodos para un solo adulto escogido al azar. Usualmente es preferible un
el manejo del problema de la no-respuesta. Una clasificación aproxi solo adulto si la encuesta se refiere a individuos en la cual una per
mada de los tipos de no-respuesta es la siguiente. sona no puede responder con exactitud por otra o si se espera que
las correlaciones intrahogareñas sean altas, de tal manera que la
1. No-cubrimiento. Falla en la localización o la visita a algunas
medida de más de una persona por familia es antieconómica. A este
unidades de la muestra.
respecto, un método útil de seleccionar una sola persona por cada
Este es un problema con unidades de muestreo que son áreas,
casa fue desarrollado por Kish (1 9 4 9 ). El plan original fue diseñado
en las cuales el entrevistador debe encontrar y enlistar todas las
para casas que pudieran contener hasta seis personas elegibles, pero
viviendas (de acuerdo con alguna definición) en una manzana de
el procedimiento puede adaptarse a familias mayores o menores.
la ciudad. También surge del uso de listas incompletas. Algunas
veces el mal tiempo o las escasas facilidades de transporte hacen El entrevistador enlista en el inventario a las personas elegibles
imposible alcanzar ciertas unidades durante el periodo de la encuesta. en la familia y luego las numera: primero los hombres en orden
decreciente de edad, luego las mujeres en el mismo orden. Cada
2. Los no-en-casa. Este grupo contiene personas que residen en
inventario tiene impreso uno de los grupos de instrucciones en la
el lugar pero que se encuentran temporalmente fuera de casa. Las
Tabla 13.4.
familias en las cuales ambos padres trabajan y las familias sin niños
FUENTES DE ERROR E N LAS ENCU ESTAS 443
TABLA 13.4. In s t r u c c io n e s p a r a l a S e l e c c ió n d e u n S o l o
E n t r e v is t a d o
En encuestas en las cuales cualquier adulto de la familia podría
contestar las preguntas, la primera visita obtuvo cerca del 70% de
S i el número de adultos la muestra y las dos primeras visitas, 87% . El costo creciente del
en la fam ilia es muestreo cuando hay que entrevistar a un adulto escogido al azar
Tecuencia
Tabla es evidente, al producir la primera visita apenas 37% de las entre
relativa
número 1 2 3 4 5 6 vistas requeridas. El marcado éxito de la segunda visita refleja el
de uso
trabajo previo del entrevistador, al investigar con anterioridad cuándo
Seleccione el adulto numerado
el entrevistado estaría en casa y disponible.
1/6 A 1 1 1 1 1 1 Muy poco se ha publicado sobre los costos relativos de las visitas
1/12 B1 1 1 1 1 2 2 posteriores a la primera. Debe esperarse que estas visitas sean más
1/12 B2 1 1 1 2 2 2 costosas por entrevista completa, ya que las casas están más espar
1/6 C 1 1 2 2 3 3 cidas en el área asignada al entrevistador y dado que sus ocupantes
1/6 D 1 2 2 3 4 4 son presuntamente personas que pasan más que una cantidad pro
1/12 El 1 2 3 3 3 5
medio de su tiempo fuera de casa. Basado en experiencias británicas,
1/12 E2 1 2 3 4 5 5
2 3 4 5 6 Durbin (1 9 5 4 ) sugiere que las visitas ulteriores pueden ser menos
1/6 F 1
costosas de lo que podría anticiparse. Las cifras siguientes muestran
costos relativos estimados por entrevista completa (p or ejemplo: di
Cada persona elegible en una familia de un tamaño dado tiene
nero gastado en i-ésimas visitas dividido por el número de entrevistas
igual probabilidad de ser seleccionada, excepto que los adultos 3 y 5 en
obtenidas) para cada visita hasta la quinta, en un estudio especial
familias de tamaño 5 están ligeramente sobrerrepresentados. Dado
relatado por Durbin y Stuart (1954).
que los entrevistados masculinos están concentrados en las Tablas
A, B y C , el entrevistador puede dedicar las visitas vespertinas a las
TA B LA 13.6. C o s t o s R e l a t iv o s po r N u e v a E n t r e v is t a
familias así designadas. Co m p l e t a en la í -é s i m a V is it a
Visita 1 2 3 4 5
13.4 R E V IS IT A S
Costo relativo 100 112 127 151 250
Una técnica estándar es especificar el número de revisitas, o un
número mínimo, que deben hacerse en cualquier unidad antes de La estimación de estos costos requiere sumo cuidado. Si el entre
abandonarla como “ contacto imposible” . Stephan y McCarthy (1 95 8) vistado deseado no está en casa durante la primera visita, el entrevis
presentan los datos de un cierto número de encuestas sobre el por tador puede gastar algún tiempo inquiriendo cuándo estará en casa
centaje de la muestra total obtenido en cada visita. Los resultados y concertando una cita tentativa. Al costear ese tiempo se debe asig
promedio se muestran en la Tabla 13.5 nar a la segunda visita y no a una primera que no tuvo éxito.
Una medida más útil es el costo promedio por entrevista com
TA B LA 13.5. N ú m e r o d e V i s i t a s R e q u e r id a s p a r a pleta sobre todas las entrevistas obtenidas hasta la i-ésima visita.
E n t r e v is t a s Co m pletas Estas cifras dan los costos relativos de obtener n entrevistas com
% de la muestra con el cual se estableció contacto en la pletas cuando insistimos en i visitas, antes que el entrevistador se
Primera Segunda Tercera o Porcentaje de dé por vencido. Para calcular estas cifras, debemos saber cuántas
Entrevistado visita visita posterior visita No-respuesta Total entrevistas se obtienen en cada visita. En la Tabla 13.7 se hacen es
tos cálculos con base en dos tipos de suposiciones. El primero simula
Cualquier adulto* 70 17 8 5 100
encuestas en las que cualquier adulto puede contestar las preguntas,
Adulto al azar 37 32 23 8 100
el segundo tipo aquellas encuestas que demandan un adulto al azar.
• Dos encuestas en las cuales el entrevistado fue un ama de casa y un operarlo Los datos sobre los números de entrevistas obtenidas se tomaron
dé una finca, respectivamente, han sido incluidas en e l grupo '•cualquier adulto". de la Tabla 13.5.
444 TE C N IC A S DE M U E S TR E O F U E N T E S DE ERROR E N LA S E N C U ESTAS 445
T A B L A 13.7. Co s t o s R e l a t i v o s p o r E n t r e v i s t a Co m p l e t a H a s t a l a Por simplicidad, suponemos wtl > 0 para todas las clases, aunque
í -é s i m a V i s i t a el método se adapta fácilmente para incluir personas imposibles de
Entrevistado — Cualquier adulto alcanzar. Si y¡y es la media para aquellos en la clase j que fueron
alcanzados durante o antes de la i-ésima visita, también se supone
Adulto que E { % ) = p¡.
i-ésima visita Hasta i-ésima visita “ al azar” La media verdadera de la población para la característica es
No. Costo No. Costo No. Costo
total de Costo por de por
¿ = (13.7)
Costo de de i
Visita relativo ents.* ents. ents. total ent. ents. ent.
Considérese la composición de la muestra después de i visitas. Las
1 100 0.70//, 70//, 0.70/r, 70/i„ 100 0.37//, 100 personas en la muestra pueden clasificarse en ( r + 1 ) clases como
2 112 0.1 ln a 19.04/1, 0.87/r, 89.04n, 102 0.32/1, 106
sigue: en la primera clase y entrevistadas; en la segunda clase y
3 127 0.07no 8.89/1, 0.94/1, 97.93/1, 104 0.16//, 110
6.04/z, 0.98/1, 103.97/1, 106 0.09//, 114 entrevistadas; y así por el estilo. La ( r 4- l)-ésim a clase consiste de
4 151 0.04//,
5 250 0.02//, 5.00/1, 1.00//, 108.97/1, 109 0.06/1, 122 todos aquellos aún no entrevistados después de i visitas. Si se ignora
la cpf, los números que caen en estas ( r + 1 ) clases están distri
* Entrevistas. buidos de acuerdo con la multinomial
[ WtlPl + WaP2 + • • •+ WuPr + (1 - I H'íyP,)]"'

Los detalles de los cálculos se muestran solamente para la pri
mera suposición, siendo el método exactamente el mismo para la donde na es el tamaño inicial de la muestra.
segunda. El simbolo n» denota el tamaño original de la muestra.
Resulta entonces que el número n¡ de quienes han sido entre
El insistir hasta por tres visitas cuesta solamente 4% más por
vistados en el curso de i visitas está binomialmente distribuido con
entrevista completa que las visitas únicas, si cualquier adulto es un
el número de intentos = ti, y probabilidad de éxito lw ifpi. Por lo
prospecto satisfactorio; y solamente 10% más si debe entrevistarse
tanto
a un adulto al azar. N o se sabe qué tan típicos sean estos resultados, r
pero el método da estimaciones realistas del costo de la insistencia E (r ii) = número esperado de entrevistas en i visitas - n0 £ Wi¡p¡
en revisitas si se han recolectado datos sobre el costo necesario y * (1 3 .8 )
el tamaño de la muestra. También interviene el factor tiempo: las Para n± fijos, los números de entrevistas n if obtenidas ( j - 1,
revisitas retrasan los resultados finales. 2 ,. .., r ) siguen una multinomial con probabilidades w 4¿P//2Ws,p,-. Re
sulta que
13.5 U N M O D E LO M A T E M A T IC O D E LO S EFECTOS v-/ i \ niwnP¡
D E L A S R E V ISIT A S
Deming (1 95 3) desarrolló un modelo matemático útil y flexible Por lo tanto, si y, es la media de la muestra obtenida después de i
para el examen más detallado de las consecuencias de diferentes visitas,
políticas sobre revisitas. La población se divide en r clases, de acuer
do con la probabilidad de que el entrevistado se encuentre en casa. Sea
Wí i ■= probabilidad de que se encuentre un entrevistado en la j-ésima Dado que este resultado no depende de n¡, la media incondicional
clase antes de la i-ésima visita. de y¡ es también fL¡. El sesgo en la estimación y es, por lo tanto,
p, - proporción de la población que cae en la j-ésima clase. (£ - £ ).
ií¡ - media de la característica para la j-ésima clase. La varianza condicional de y¡ para n¡ dado, se encuentra en for
<t-;2 - varianza de la característica para la j-ésima clase. ma similar que es
446 T E C N IC A S D E M U E S T R E O FU EN TES DE ERROR E N LAS ENCUESTAS 447
TA B L A 1 3 .9 . N úmero de E n t r e v is t a s , C o s t o s por E n t r e v is t a y Se s g o s
í */;P;W +(M/-/Á)2]
V'(j',-|ni) = i ; (13.10) Número de Costo
Número requerido entrevistas promedio por Sesgo
í H'i/P, Sesgo
i de visitas obtenidas entrevista I II
La varianza incondicional, al ignorar los términos de orden l/n¡3,
1 0.425//, 100 + 1.118 + 2.235
está dada aproximadamente al reemplazar n¡ en (1 3 .1 0 ) por su 2 0.771/1, 105 +0.711 + 1.421
valor esperado de (1 3.8). 3 0.882/1, 108 +0.421 +0.842
Finalmente, el error cuadrático medio de la estimación obtenido 4 0.933/1, 110 +0.266 +0.532
5 0.960/1, 114 +0.180 +0.360
después de i visitas es
ECM (y i| i)~ V(y 4| « )+ (¿ - / í )2 (13.11)
En II, por ejemplo, la media verdadera de la población p es 54%. La media
Debe considerarse también el costo de hacer i visitas. El número p ¡ obtenida de la primera visita es 56.235%, lo que da un. sesgo de + 2.235%
esperado de entrevistas nuevas obtenidas en la fe-ésima visita es mostrado en la tabla. Una política que requiere tres visitas reduce este sesgo
a + 0.842%.
Y ,(W kj-wk-i,>)Pj- P °r lo tanto, si ck es el costo por entrevista completa
Los valores del ECM (y ) obtenidos de un gasto dado de dinero se compa
en la fe-ésima visita, el costo esperado de hacer i visitas es n 0C (i ) ,
raron para las diferentes políticas de revisita. En las primeras comparaciones
donde la cantidad de dinero es suficiente para tomar n ü = 500 si solamente se hace
una visita. De la Tabla 13.9 el número esperado de entrevistas obtenidas du
C ( j ) = C, I W1;P/+ C 2 Z (W lj ~ W\l)Pj + ' • ’ + Cl I Oty ~ Wi-\,¡)Pi
rante la primera visita es E (n .,) = (5 0 0 ) (0.4 2 5 ) = 212.5. Si se hacen dos
Ejemplo. Una población con tres clases aparece en la Tabla 13.8. Se visitas, este número esperado debe ser reducido a E (n 3) = 212.5/1.05 = 202.4
intenta que las p ¡ y w ¡j representen encuestas en las cuales se entrevista a para mantener el mismo costo, y en form a similar para 3, 4 y 5 revisitas.
Estos valores de E ( n ¡ ) se sustituyeron en la Ec. (13.10) para dar V (y ) y,
un adulto al azar. Durante la primera visita las probabilidades de obtener
por lo tanto, ECM (y).
una entrevista se toman como 0.6, 0.3 y 0.1 en las tres clases. Durante la
La Tabla 13.10 presenta los ECM que resultan para tres importes de
segunda y subsiguientes visitas, las probabilidades condicionales de entrevistar
desembolso, correspondientes a n0 = 500, 1 000, 2 000 para una sola visita.
una persona omitida anteriormente son 0.9, 0.5 y 0.2. Estas cifras se hicieron
Cuando n 0 = 500, también se dan los valores del ECM (y ) para la situación
mayores que las probabilidades correspondientes a la primera visita para re
"no-sesgo” en la cual toda = 50. Esta columna muestra el efecto de las
presentar el efecto de una investigación inteligente por parte del entrevistador.
revisitas cuando las mismas son innecesarias, ya que no resulta sesgo alguno
El dato que se está estimando es un porcentaje binomial cercano a 50% . de reducir la encuesta a una sola visita.
Se consideran dos grupos de ¡i¡ ( I , I I ) . Por simplicidad, las varianzas dentro-
de-clase o f = ¡ij( 100 — ¡¡¡) se tomaron todas como 2 500. Los costos rela
TA B L A 13.10. Valores del ECM ( y ) para D if e r e n t e s P o l ít ic a s de
tivos por entrevista completa en visitas sucesivas son los dados en la Tabla 13.6.
R e v is it a que Cu e sta n la M is m a Su m a
La Tabla 13.9 muestra ( a ) el número total esperado de entrevistas obte
nidas para un total de i visitas, ( b ) el costo promedio de estas visitas por n„ = 500
entrevista, y ( c ) el sesgo (f i ¡ ~ P ) en la estimación y bajo las suposiciones (sólo para primeras visitas) "o = 1000 n0 = 2000
1 y I I acerca de las /ij.
Número
requerido No
TA B LA 1 3 .8 . C a r a c t e r ís t ic a s de las T res Clases
de visitas I* II* 1 11 1 11
sesgo
Clase
1 11.8 13.0 16.9 7.1 10.9 4.2 8.0
3 2 I2..4 12.9 14.6 6.7 8.3 3.6 5.2
i 2
3 12.7 12.9 13.6 6.5 7.1 3.4 3.9
0.45 0.50 0.05 4 13.0 13.1 13.4 6.6 6.9 3.3 3.6
Pl
0.6 + C0.4)[l — (0.1)*-»] 0.3 4- (0.7)[1 -(0 .5 )'-'] 0.1 +(0.9)[1 -(0 .8 )'-'] 5 13.5 13.5 13.8 6.8 6.9 3.4 3.5
55 50 45
ii/q 60 50 40
* Esta» rnprcnenlnii poblaciones con la m ás pequeña ( I ) y la m ás grande ( I I > can
tidades do songo, scgiln «o definen en la T a b la 13.8.
F U E N T E S D E ERROR E N LA S E N C U E STAS 449
donde c son los costos por unidad: c0 es el costo de hacer el primer

Las políticas que dan los ECM más bajos se muestran en letra negrita.
Considérese primero e l tamaño de la muestra más pequeña, 7i„ = 500. SI las
intento, cl es el costo de procesar los resultados de este primer inten
revisitas no son necesarias, una política que reclama tanto com o cuatro re to y c 2 es el costo de obtener y procesar los datos en el segundo estrato.
visitas da por resultado sólo un modesto aumento en e l ECM. En I, que Si W ,, W 2 son las proporciones de población de ambos estratos, el
comprende la menor cantidad de sesgo, las diferentes políticas producen costo esperado es
aproximadamente la misma exactitud, aunque tres es el óptimo. En II, tres
a cinco revisitas son satisfactorias, una sola visita da un ECM cercano al C = c 0n '+ c i W ín '+ C2^ '2n (13.13)
25% sobre el mínimo. rC
Para los tamaños de muestra mayores el número óptimo de revisitas au Como estimación de Y, tomamos
menta a cuatro o cinco y el uso de una sola visita resulta en pérdidas más
sustanciales de exactitud. . . . (« i'í'i + 'h'yi)
y = w lyl + w2y2= — (13.14)
Esta, desde luego, es solamente una ilustración. La importancia
del método es que, conforme la información se acumula con relación donde y,, y 2 son las medias de las muestras de tamaños n, - n,'
a costos y sesgos relativos, se puede plantear una política económica y n¡= n!/k. Por el Teorema 12.1, la estimación y' será insesgada,
para cualquier tipo de encuesta. si lasrespuestas se obtienen de todas las submuestrasaleatorias se
leccionadas de tamaño n2 = n¿/h.
Por la Fórmula (1 2 .3 ), la varianza de y' es
13.6 F R A C C IO N O P T IM A D E M U E STR E O E N TR E
LO S Q U E N O RESPONDEN
Después'de hacer el primer intento para llegar a las personas de s2 + ( l c - l ) W 2S22 (1315)
la muestra, otro método debido a Hansen y Hurwitz (1946), consiste \n‘ N/ n1
en tomar una submuestra aleatoria de las personas no entrevistadas
Entonces, las cantidades n ' y k se eligen para minimizar el pro
y hacer un gran esfuerzo para entrevistar a todos en la submuestra.
ducto C (V + S2/N ). De (13.15) y (13.13) tenemos
Esta técnica se desarrolló primero para encuestas donde el intento
inicial se hizo por correo, una submuestra de las personas que no
v + s V N _ < £ l z l ^ +í * S i (13.16)
contestaron el cuestionario completo se trató de alcanzar por el n n
método más costoso que es la entrevista personal.
Este método se puede ver como una aplicación de la técnica del C = (c0+ c i Wl)n ' + C
- ^ ^ (13.17)
muestreo doble para estratificación, que se presentó en la Sec.
12.2. Se empieza por tomar una muestra aleatoria simple de nr Por la desigualdad de Cauchy, el óptimo k es
unidades. Sea ra/ el número de unidades de la muestra que propor , /c2(S2- W2S22)
cionan los datos buscados, y tu! el número en el grupo de no res * * - V s X c + c W .) <1318)
puestas. Mediante esfuerzos más intensos, los datos se obtienen más
El tamaño inicial de muestra n' se puede elegir ya sea para mi
tarde de una submuestra aleatoria tu = v2n2/ entre los n !. Hansen
nimizar C con V especificada o V con C especificado, al resolver para
y Hurwitz usan la notación v2 = 1/fe de modo que n2 = n2'/fe.
n ' de (1 3 .1 6 ) o (13.17). Si V es especificada,
En el contexto de la Sec. 12.2 hay dos estratos. El estrato 1 con
siste en aquellos que no responden al primer intento con una muestra , N [S 2+ ( k - l ) W 2S22]
medida de tamaño na = n ! , de modo que v-, - 1. El estrato 2 son ¿pl (N V + S2)
aquellos que responderían al segundo intento con tu = n!/k. donde V es el valor especificado para la varianza de la media de
El costo de tomar la muestra es población estimada.
Las soluciones exigen un conocimiento de W .: a menudo, este
c0n '+ c ln l' + ^ . (13.12)
puede estimarse de experiencias previas. Además de S2, cuyo valor
F U E N T E S DE ERROR E N LA S E N C U ESTAS 451
debe estimarse de antemano en cualquier problema de “ tamaño de Nótese que hemos puesto S2/V = 1 000, o V = S2/1 000, ya que esta es la
muestra”, las soluciones también involucran S22 que es la varianza varianza que tendría la media de la muestra si se tomara una muestra de
en el estrato de no respuestas. El valor de S2= puede ser más difícil 1 000 y se obtuviera una respuesta completa.
de predecir; probablemente no sea el mismo que S"-. Por ejemplo, en Consecuentemente, deberían enviarse por correo 1870 cuestionarios. De
encuestas por con'eo en casi todos los tipos de empresa económica, los 935 que no son devueltos, entrevistamos una muestra al azar de 935/2.739
los que responden tienden a ser los grandes operadores, con varian o sea 341. El costo es $2 095.
zas mayores entre unidades que los que no responden. Como lo ha señalado Durbin (1 9 5 4 ), el submuestreo probable
Si W.. no se conoce bien, como una aproximación satisfactoria mente no muestre un beneficio marcado a menos que c. sea grande
se busca el valor de n 'ópl de (13.18) y (13.19) provisionalmente para en relación con (c 0 + c ,W ,). Las dos cantidades son comparables,
una cierta gama de valores supuestos de W 2 entre 0 y un límite dado que (c 0 + CiWx) es el costo esperado por unidad de hacer el
superior seguro. El n V máximo de esta serie se toma como tamaño primer intento y procesar los resultados y c.. tiene el mismo signi
inicial de muestra n'. Cuando se reciben las respuestas a la encuesta ficado para el segundo intento. De las ecuaciones puede mostrarse
por correo, se conoce el valor de n¡'. Al buscar el valor de k usado que la razón del costo de obtener una V prescrita con k = 1 (sin
con este método, utilizamos la varianza v,.(y') condicional a los valo submuestreo) al costo mínimo para k óptimo es
res conocidos de n 2 y n'. Esta se puede obtener de (1 2 .4 ) y (1 2 .7 )
como S 2(c0+ c, + c2W2)_______________ c 0+c, W, + c2 Wz____
[V(S 2- W2S22) ( c0+ c 1W 1)+ J T 2W2S2f +
V iO T = s . ( i . i ) + ~ !
si S- y SV son aproximadamente iguales. Si r es la razón de c2 a
(c 0 + CtWx) la razón de costo se convierte en
La Ec. (13.20) se resuelve para encontrar el k que da la varian
1 + rW2
za-condición al deseada. Generalmente, el costo para este método es
un poco más elevado que el costo óptimo para W 2 conocido. (V w l+ S rW J 2
Ejemplo. Este ejemplo es una condensación de la publicación por Hansen Por ejemplo, la razón de costo es 1.029 para W ¡ = 0.5 si r = 4, 1.146
y Hurwitz (1 9 4 6 ). La primera muestra se toma por correo y se espera que la si r = 10 y 1.228 si r - 16. Pero si S= es bastante más grande que
proporción de respuestas sea 50% . La precisión deseada es aquella que daría S2= hay más que ganar del submuestreo.
una muestra aleatoria simple de tamaño 1 000 si no hubiera no-respuesta. El
costo de enviar los cuestionarios por correo es 10 centavos y el costo de pro Con muestreo estratificado, los valores óptimos de los n\ y los
cesar el cuestionario completo es 40 centavos. Llevar a cabo una entrevista kh en los estratos individuales son más complejos. Una buena apro
personal cuesta $4.10. ximación consiste primero en estimar, por los métodos de las Secs.
¿Cuántos cuestionarios deberían enviarse y qué porcentaje de los que no 5.5 y 5.9, los tamaños de muestra n oh que se requerirían en los es
responden deberían ser entrevistados?
tratos si no hubiera no respuesta. Ahora, de (13.19) si W 2 - 0, te
En términos de la función de costo (1 3 .1 2 ) los costos por unidad en
dólares son los siguientes: nemos
wc 2
c0 = costo del primer intento = 0.1
c, = costo de procesar datos por respuesta = 0.4 <13'21)
c, = costo de obtener y procesar los datos por cada no-respuesta = 4.5
Luego (13.19) se puede escribir como
Los n y fe óptimos se pueden obtener de (1 3 .1 7 ) y (1 3 .1 8 ). S i las va
rianzas S- y S23 se suponen iguales y N se supone que es grande, entonces r. .(fc-nwî
n ¿ p , - n 01^14 J ( 1 3 .2 2 )
(4.5)(0.5) r_
°p' V c0+c,l *'1 V 0.11+ (0.4)(0.5)
= v(7)5 = 2.739 Esta ecuación aplicada separadamente a cada estrato, da una
aproximación al óptimo n/. Los valores de kh se encuentran al aplicar
, S 2( l + ( * - l ) H A ]
=— ~ = 1000{1 +(1.739)(0.5)} (1 3 .1 8 ) en cada estrato.
Estas técnicas se pueden usar con estimaciones de razón o re
= 18 70 gresión. Con la estimación de razón, las cantidades S- y S22 se reem
452 TE C N IC A S DE M U E S TR E O F U E N T E S DE ERROR E N LA S ENCU ESTAS 453
X X 6ní,yí,/(/ + l ) N N
plazan por Sd2 y S«J;, donde d¡ = y¡ — Rx¡. Con una estimación de
regresión, S2 se convierten en S2( l — p2) y S22 en S2=( l — p2). yFS= + ~D (d,gamos) (1324)
Esta es una estimación de razón. En muestras grandes, su media es

aproximadamente E (N )/ E (D ).
13.7 A JU S T E S PO R SESG O S IN R E V IS IT A S
Si n„ es el tamaño inicial de la muestra (respuestas más no-en-
Un método ingenioso para disminuir los sesgos presentes'en los casa) y n, es el número de entrevistados de la clase j, se hacen las
resultados de la primera visita lo sugirió Hartley (1 94 6) y lo desa siguientes suposiciones: V«
rrollaron Politz y Simmons (1949-1950) y Simmons (1954). Supon ■f Y *
gamos que todas las visitas se hicieron por la noche y en días labo (i) -i- es una estimación binomial de pfrr¡ f.y / \o\
no 7 o'/ Yn\
rables. Al entrevistado se le pregunta si estaba en casa, en el momento 5, , í ¿ [ SíHJOTECA ] > }
de la entrevista, en cada una de las cinco noches precedentes de la (ii) E(npl«y) = n ,í ! ( 5 _ — tt/ ( 1 “ w>) * , V.
semana. Si afirma que estaba en casa t noches de las cinco, se toma
la razón ( t + l )/6 como estimación de la frecuencia ir con que está (iii) E(y,,) = M,. Para cualquier ; y t
en casa durante las horas de entrevista.
La suposición( i i ) es cuestionable. Sin dar una explicación de
Los resultados de la primera visita se ponen en seis grupos se tallada, la misma supone que las personas responden correctamente
gún el valor de t (0, 1, 2, 3, 4, 5 ). En el grupo t, sea n t el número si estaban o no en casa.
de entrevistas obtenidas y y „la media de atributos. La estimación de Para una j dada, al usar la suposición (ii),
Politz-Simmons de la media de población p es
X 6 n ,y ,/ (t+ l) I, (ííi);d V /(w'r <13-25>

9p s = - 7 ----------------------- (13.23)
= % - ( l - 7 r y)6] (13.26)
X 6nr/ ( í + l ) '7r;
1-0
Por lo tanto,
En este enfoque se reconoce que los resultados de la primera vi
sita están indebidamente ponderados con personas que están en casa E ( D )= £ — [1 —(1 —ir,)6] = n„ £ p,[ 1 - (1 —«-,)«] (13-27)
la mayor parte del tiempo. Dado que en promedio, una persona que ¡ . I TTj ¡-J
está en casa una proporción ir del tiempo, tiene tina oportunidad al usar la suposición ( i ) . Además, dado que E (y it ) = pj para cual
relativa ir de aparecer en la muestra, su respuesta debería recibir quier j y t, esto da el resultado
una ponderación 1/ir. La cantidad 6 / ( í + 1 ) se usa como una esti
mación de 1/-. Entonces y„, es menos sesgada que la media de la X P;M,[1-(1 - ti-;)6]
muestra y de la primera visita, pero -su varianza es mayor porque E { y „ ) = Ürs * * = } (13-28)
se reemplaza una media sin ponderar por una media con pondera Z f t t i - d - » - / ) 6]
ciones estimadas. /-1
En la presentación de la media y la varianza de yPS, hacemos Dado que la media verdadera /x = £ p¡p.¡, algún sesgo permanece
uso de la notación de la Sec. 13.5. La población se divide en clases, en ypa.Encierto sentido, esta estimación tiene el mismo sesgo que
las personas en la j-ésima clase están en su casa una fracción irj y„, la mediade la muestra dada por el método de lasrevisitas, con
del tiempo. Nótese que el t-ésimo grupo (p. ej., personas en casa el requisito de que se hagan cuando menos seis visitas si es nece
t de las cinco noches precedentes) contendrá personas de varias sario. Se mostró en la Sec. 13.5, Ec. 13.9, que el método de las
clases. Sean njt, y¡t el número y la media del dato para aquellos en revisitas con un total de i visitas, da una estimación insesgada de
la clase j y el grupo t. Entonces, yp¡ puede escribirse en la forma My/=X > w / X w¡iPi' donde w 'i es la probabilidad de que una per
siguiente: sona en la clase j que cae en la muestra sea entrevistada. Ahora
cuesten sustancialmente más de lo que aquí se afirma. La técnica

id,¡ = ir¡. Si en visitas subsecuentes la probabilidad de encontrar en
Politz-Simmons tiene la ventaja de economizar tiempo. Los errores
casa a una persona a quien no se alcanzó previamente permanece
e imperfecciones en los valores de t, no considerados en el análisis,
como ir¡, entonces
son una desventaja. El método puede aplicarse, según lo sugiere
H'¡/= [ 1—(1 —-JTy)'] Simmons (1 9 5 4 ), junto con varias revisitas.
de tal modo que /iPS = p.<¡- Sin embargo, con el método de lgs revi Se han propuesto varios otros métodos para disminuir el sesgo
sitas, la probabilidad de una entrevista en una visita posterior puede causado por “no-en-casa”. El de Bartholomew (1 9 6 1 ) se aplica a una
ser mayor que ir;, como resultado de la información obtenida por encuesta con dos visitas. Este supone que para aquellos que no es
el entrevistador durante la primera visita o las anteriores. En este tán en casa durante la primera visita, el entrevistador puede hacer,
caso, el método de las revisitas tiene menos sesgo después de seis por medio de una cuidadosa indagación, que la probabilidad de
visitas. encontrarlos en la segunda visita sea aproximadamente igual. Si esto
La varianza de yPS es más bien complicada. Con la aproximación es así, las n, personas entrevistadas durante la segunda ■visita son
acostumbrada para una estimación de razón, puede expresarse, de una submuestra al azar de las (n„ — n ,) personas omitidas en la
acuerdo con Deming (1953), como primera visita. Por lo tanto, [n,y, + (n „ - n , ) f 2]/n0 es una estima
ción insesgada de la media de la muestra original propuesta. Este
V ( y / > s ) = - 7 7 { I * i P ,B l [<r,2 + ( j i l - f i p s ) 2'] método dio buenos resultados en ciertas encuestas en Inglaterra a
n0U
las cuales lo aplicó Bartholomew. En encuestas repetidas Kish y Hess
+K - D I - A f o , - ¿ rs ? ) (1 9 5 9 ) sugieren que las no-respuestas de encuestas recientes pueden
de donde servir para reemplazar las no-respuestas en una encuesta actual.
Donde quiera que el sesgo de las primeras visitas muestre un patrón
U = l - l p , { l - 7 T íf
sistemático, como en la Tabla 13.1, Hendrícks (1 94 9) ha deüneado
métodos de extrapolación para estimar los resultados promedio que
A, = - [ 1 -< 1 -* > )« ]
7r> hubieran sido dados por los que no respondieron.
13.8 U N M O D E LO M A T E M A T IC O P A R A ERRORES
Aunque esta expresión es difícil de evaluar sin aplicarla a po D E M E D IC IO N
blaciones específicas, se pueden hacer dos comentarios. Si las p.¡
Teóricamente, podemos imaginar que es posible un gran número
no difieren grandemente, esto es, si el sesgo de las primeras visitas
de repeticiones independientes de la medida en la i-ésima unidad.
es moderado, el término dominante es el primero:
Sea i/id el valor obtenido en la «-ésima repetición. Entonces
y¡a = + eia (13.29)
donde ¡xí ■= valor correcto

Esta expresión tiende a ser 25 a 35% más alta que la varianza de
la media sin ponderar de las primeras visitas. También, Y (y PS) con en* - error de medida.
tiene un término que no decrece conforme n 0 aumenta y llega a ser
importante en muestras muy grandes. La idea de un “valor correcto” requiere un poco de discusión.
Con algunas características el concepto es simple y concreto. Por
Para resumir, las comparaciones hechas en poblaciones simu
ladas por Deming (1 9 5 3 ), Durbin (1 9 5 4 ) y el autor, sugieren que ejemplo, en un inventario hecho por muestreo, el valor correcto pue
de ser el número de bandas para ventilador que están en un estante
este método muestra la mejor ventaja en relación a las revisitas,
a las doce del día de un día específico. En algunos casos, el valor
cuando los sesgos provenientes de las visitas iniciales son sustan
ciales y la muestra es grande. Sin embargo, las reducciones en ECM correcto puede definirse operacionalmente. La presión sanguínea
para el mismo desembolso son pequeñas, a no ser que las revisitas diastólica correcta de una persona en un momento específico, se
F U E N T E S D E ERROR E N L A S ENCU ESTAS 457
puede definir como el valor obtenido cuando se mide mediante cierto TA B LA 13.11. C o m p o n e n t e s d e l E r r o r d e M e d ic i ó n en la
instrumento estándar bajo condiciones cuidadosamente prescritas. i -é s i m a U n i d a d
Sin embargo, podemos ver que nuestro instrumento estándar está
Símbolo Naturaleza del componente
sujeto a errores de medición y podemos esperar que con el tiempo
se desarrollará un instrumento más preciso. Con otras característi
P Sesgo constante sobre todas las unidades.
cas, por ejemplo, algún aspecto de la actitud de un empleado con f¡¡ — f¡ Componente variable de sesgo, que sigue alguna dis
respecto a su patrón, o de habilidad de una persona para enfren tribución de frecuencia con media cero conforme
tarse a sus problemas diarios, nadie puede reclamar que tiene un i varía y puede estar correlacionada con el valor
método satisfactorio de medir el “valor correcto”. N o obstante, el correcto
d¡a = eia — P¡ Componente fluctuante del error, que sigue alguna
concepto es útil aun en tales casos.
distribución de frecuencia con media cero y va
En mediciones repetidas de la misma unidad, los errores e¡„ rianza j , ! conforme a varía para i fija.
seguirán una distribución de frecuencia. Para la i-ésima unidad, su
pongamos que eia tenga media p¡ y varianza a?. El término p { re
construidas hace algunos años, Hansen, Hurwitz y Bershad (1 96 1)
presenta un sesgo en la medición. Las magnitudes de p¡ y ad depen apuntan que si algunas casas en la muestra se han vendido reciente
derán, desde luego, de la naturaleza de la característica medida y
mente, sus precios establecen un nivel de guía al entrevistador y al
del instrumento de medición. Pueden depender también de muchos
dueño en la asignación de precios a las casas que no se han vendido
otros factores. Con poblaciones humanas, el clima político y econó
durante muchos años. De hecho, el precio promedio registrado para
mico prevalentes y la cantidad y tipo de publicidad que la encuesta la muestra puede dependeT del orden en el cual aparezcan en la
haya recibido con anterioridad, pueden influir las respuestas al muestra las casas vendidas recientemente.
cuestionario.
Para manejar estas correlaciones intramuestra en sus términos
El siguiente paso es considerar cómo cambian los errores de
más generales, se requiere un modelo más complejo que el que se
medición cuando nos movemos de una unidad a la otra. Pueden sur presentó aquí. En particular, las notaciones para e¡<* y /3¡ _tendrían
gir varias complicaciones.
que indicar que sus valores pueden depender de otras unidades pre
Para el componente del sesgo, puede haber uno constante, sentes en la muestra. Sin embargo, los tipos de correlación que se
digamos, E {¡3¡) = p, que afecta a todas las unidades de la población. cree son los más comunes, en la práctica se pueden representar por
También habrá otra componente ( p¡ - p ) que sigue una distribu el presente modelo o por extensiones simples del mismo.
ción de frecuencia sobre la población. Esta componente puede estar Los componentes del error de medición se resumen en la Tabla
correlacionada con el valor correcto por ejemplo, e l aparato de
13.11.
medición puede subestimar consistentemente los valores altos de ¡u¡
Hemos notado además que los valores de p, y d,<* en diferentes
y sobrestimar los bajos.
unidades en la misma muestra pueden estar correlacionados uno
Puede haber una correlación entre los valores de eia en diferentes con el otro, cuando d¡a - eta — pi.
unidades en la misma muestra. El ejemplo .más sencillo es el “sesgo
Hansen et al. (1 9 5 1 ), Sukhatme y Seth (1 9 5 2 ), Hansen, Hur
del entrevistador” . Algunas veces se encuentran grandes diferencias
witz y Bershad (1 9 6 1 ), han desarrollado modelos semejantes al que
entre los valores de y,a obtenidos por diferentes entrevistadores que
precede así como Hansen, Hurwitz y Pritzker (1 9 6 5 ). Fellegi (1 96 4)
están muestreando partes comparables de la misma población [véase
ha dado un modelo más extenso que incluye numerosas correlacio
Lineau (1 9 4 1 ), Mahalanobis (1 9 4 6 ) y Barr (1957)1.
nes cruzadas que puedan existir entre diferentes fuentes de errores
Un efecto similar apareció cuando se cortan muestras de una
de medición en las situaciones prácticas.
cosecha por diferentes equipos y cuando se hacen análisis químicos
En sus artículos de 1965 y 1961 Hansen y otros., expresaron nues
o biológicos en laboratorios diferentes. El factor humano no es la
tro modelo en terminología un poco diferente incluida la adición de
única causa de correlaciones entre unidades que se miden más o
un subíndice G a todas las variables como recordatorio de que los
menos al mismo tiempo. El tiempo afecta muchos procesos de me
errores y sus magnitudes en general dependen de las condiciones
dición, algunos hacen uso de materias primas cuya calidad varía
generales ( G ) de la encuesta. Ellos expresan sus resultados en tér
de lote a lote. En la estimación del precio de venta actual de casas
minos de dia y de
458 TE C N IC A S DE M U ESTRE O FUENTES D E ERROR E N LA S E N C U ESTAS 45 9
p/ = £(y«Jí') = M ,+A (13.30) la media y de una muestra aleatoria simple también está sujeta al
sesgo ti. En la varianza estimada del error que asignamos a la media
La cantidad ^ (que denotan Y< o P¡ con una proporción) es de la muestra, el sesgo se cancela, ya que esta estimación se de
conceptualmente el promedio obtenido de numerosas repeticiones riva de una suma de cuadrados de los términos (y¡ - y ) 2. Conse
del proceso de medición de la unidad i. Así es que cuentemente, el cálculo usual de los límites de confianza para Y
a partir de los datos de la muestra ignora el sesgo. Los mismos re
d¡a = e¡a- p ¡ = y , „ - / V (13.31)
sultados se aplican al muestreo aleatorio estratificado.
Llaman a dia, la desviación de la respuesta en la unidad i, en
tanto que nosotros la hemos llamado la componente fluctuante del La situación es esencialmente la misma con las estimaciones de
error de medición. Por lo tanto, razón y de regresión. Considérese la estimación de regresión
y¡a - p = dio + 0 *,''- p ') + {fi' - f i ) (13.32) y[r = y + b ( X - x )
donde / es la media de población de los m'. donde tanto las y¡ como las x.¡ pueden estar sujetas a sesgos cons
tantes (3U y (3,., respectivamente. Dado que la estimación de mínimos
Promediando sobre la muestra tenemos, cuadrados b permanece inmutable y dado que el sesgo fix se cancela
ya- p = < ¡ a + (¿ L '- p ')+ (f j. '- p ) (13.33) en el término [ X — x ) , se obtiene que yu está sujeta a un sesgo ¡3y.
Es fácil verificar que la estimación de V(y,r) de la muestra no con
Esto conduce a la fórmula tiene ninguna contribución debida al sesgo.
ECM(ya) = V{da) + V (p ') + (iJ .'-p )2+ 2 co\(da,¡L') (13.34)

fc -f*
Para la media muestral ya, los términos de la derecha se llaman,
respectivamente, la varianciade respuesta, la variancia de muestreo, el sesgo es también ¡3,, para una primera aproximación, ya que en
el cuadrado del sesgo global, y el doble de la covarianza entre el muestras grandes E (X / x ) es aproximadamente 1 aun si las x¡ están
sesgo de respuesta promedio en la muestra y el error de muestreo. sujetas a un sesgo constante. En muestras grandes, la estimación
Como E(d¡a\i) = 0 en nuestro modelo, esta covarianza se anula por de varianza a partir de la muestra
repeticiones del proceso de medición en el mismo conjunto de uni
dades de muestra en el mismo orden. Podría no anularse bajo repeti , ( N - n ) L (y¡- R x , )2
ciones sobre muestras diferentes o en órdenes diferentes si los d¡a v{y* ) = ~ ñ l (l3 '35)
se ven afectados por otras unidades en la muestra. Aunque se va a estará casi tan libre de sesgo como una estimación de
ignorar este término por sencillez, Fellegi (1 9 6 4 ) ha mostrado en
un estudio canadiense que podría sesgar materialmente algunos mé E (yR - Y )2
todos de estimación de las componentes de la varianza de respuesta
V (& ). esto es, como estimación de la varianza alrededor de la media ses
gada Y.
Usando el método de Comfield como se describe en la Sec. 2.9
Koch (197 3) ha mostrado una descomposición general del ECM del Para resumir, un sesgo constante pasa desapercibido por los da
estimador en encuestas multivariadas por muestreo con aplicaciones tos de la muestra. Como hemos visto (Sec. 1.8), las probabilidades
a las medias de subclases. del 95% de confianza casi no se afectan si la razón de ¡3V al error
estándar de la media estimada es menor que 0 . 1, pero a medida que
la razón aumenta más allá de este valor, el cálculo de los límites de
13.9 EFECTOS D E L SESG O C O N S T A N T E
confianza se vuelve engañoso. Estimaciones de cambio entre un pe
riodo de tiempo u otro, entre un estrato y otro, permanecen sin ses
Supóngase que las mediciones y, en todas las unidades están su
jetas a un sesgo constante ¡3 cuya magnitud se desconoce. Entonces, go, siempre que éste se mantenga constante.
460 T E C N IC A S DE M U ESTREO F U E N T E S DE E R R O R E N LA S E N C U ESTAS 461
ocurren errores de medición, esto implica que a veces las unidades

13.10 EFECTO S D E ERRORES N O C O R R E L A C IO N A D O S
DENTRO DE L A M UESTRA se clasifiquen incorrectamente. Para la unidad i-ésima, el valor re
gistrado i/í« es en ocasiones 1 y otras 0. Sea P¡ la notación para la
En esta sección se dan algunos resultados respecto a V (y a ) y proporción de medidas de la unidad i-ésima para la que y ¡„ es igual a 1.
v (y a ) para muestreo aleatorio simple en la situación más simple Entonces, para un i dado, yia es una variable binomial en medición
en la que los errores de medición no están correlacionados dentro repetida con media m' = P ¡mientras que la varianza de d.¡a es P¡Q¡. En
de la muestra. Esta situación se puede aplicar a encuestas tomadas de esta forma, si p<* = ya es la estimación de muestra (13.38), viene
archivos, a encuestas sobre cuestionarios que llena el demandado a ser
(com o el caso de las encuestas por correo) en las que los miembros
de una misma muestra no se consultan entre sí, y a algunas encues V (p .)= V (y J = ^ l P , Q , + ^ (13.40)
tas de poblaciones inanimadas en donde la medición es objetiva. El
supuesto de no correlación no puede hacerse a la ligera: la corre
lación intramuestreal puede aparecer, por ejemplo, en la entrevista,
la edición, la codificación y la transferencia de los datos a la má
quina computadora, si es la misma persona la que manipula un = N
PQ (13.41)
cierto número de elementos de la muestra. n ( N — 1)
A partir de (13.34) obtenemos, para la varianza, donde
V(ya) = V ( J a) + V ( f ) (13.36) N
P=^
Al encontrar las varianzas, primero promediamos sobre repeticio N
nes del proceso de medición sobre una muestra específica y después Como lo muestra (13.41), la suma de la varianza de respuesta
sobre diferentes muestras aleatorias simples. Ahora, V (d ¡« ) = <n2 y
y la varianza de muestreo tiene un límite superior N P Q / n (N — 1).
los errores no están correlacionados en unidades diferentes dentro
Este límite superior es también la varianza de la media de muestra
de la muestra. Por lo tanto, para el muestreo aleatorio simple, si S
de las mediciones correctas sobre las unidades, si la cpf se ignora
denota una muestra especifica
y no hay sesgo global. Ya que la medición correcta m en cualquier
unidad es entonces una variable binomial con media P, de modo que
E(.da2\S) = ~2 Z °V2 (13.37)
« .
Cuando promediamos subsecuentemente sobre todas las muestras % mi & k T ) P Q z y M
aleatorias simples, tenemos
Este resultado más bien inesperado es válido porque ( 1 ) la varianza
de muestreo que entra en (13.39) y (13.40) es la de n,' = (fi¡+l3¡)
l N j . I U ' - M ) 2
y ( 2 ) en la estimación de una proporción ¡n y p¡ son siempre nega
= -S t T I- ( 13.38) tivamente correlacionadas. Cuando /x, = 1, p¡ < 0, pues P,¡ = (j í ¡ + p¡) < 1,
y de manera semejante cuando /j.¡ =0, p¡ s=0. De modo que el
= -c r d2-r(- ^ - S Z (13.39) término
n n
donde a? denota el promedio de población de las varianzas de los s ¡¿
n
errores de medición. En la terminología de Hansen y otros, ap/n es
la varianza de respuesta de la estimación de muestra de ya. en (13.39) es siempre menor
Con errores no correlacionados, el mismo modelo se puede aplicar c2
al estimar una proporción de población P (Hansen, Hurwitz y Ber
n
shad, 1961). Para cualquier unidad, sea elvalorcorrecto p{ igual
a uno sila unidad está en la clase C y cero en el casocontrario. Si por una cantidad aproximada de la varianza de respuesta de ¡ja.
Con errores no correlacionados, un resultado útil es que la donde los productos se promediaron sobre todos los pares de uni
fórmula usual para v (y a ) en muestreo aleatorio simple permanece dades en la misma muestra. Por analogía, con el muestreo conglo
sin sesgo si puede ignorarse la cpf. Del Teorema 2.4 corolario, esta merado, el coeficiente de correlación intramuestral promedio p w pue
fórmula desarrollada al suponer que no hay errores de medición es de definirse por la ecuación
E ( d,a dja) = pw<rd2 (13.49)
,13-43) Esto nos da, a partir de (1 3.48 ),
Ahora bien,
yia- y a = (d ia- d a) + ( fi i' - i i ' ) (13.44) V(da) = ^ - [ l + ( n - l ) Pw] (13.50)

n
A l elevar al cuadrado y promediar primero sobre mediciones Hansen, Hurwitz y Bershad (1 9 6 1 ) han llamado V ( d « ) « la va
repetidas y después sobre selecciones de muestra repetidas, obte rianza total de respuesta, ya que afecta la media muestral. Su com
nemos ponente aS'/n es llamada la varianza simple de respuesta, en tanto
que el término (n - 1 )p w<r¿*/n es la componente correlacionada de
Ed(y„) = — a / + — S^ 2 (13.45) la varianza total de respuesta.
n n
A partir de (13.34) obtenemos, al suponer cov (da, /x') = 0,
en tanto que, de (13.39)
V(ya) = — [1 + (n - D p J + ^ V 2 (13.51)
V (y J = £(Ed2+ ^ A v 2 (13.46) n n
El valor promedio de la v (y a ) usual en (13.43) se encuentra de la
Por lo tanto, Ev(yu) = V(ya) si puede ignorarse f.
misma manera y es
De la misma manera, las fórmulas en capítulos precedentes para
las estimaciones de muestra de varianzas de error de muestreo puede Ev(ya) = {- ^ - [ c r d2( l - p J + S / - } (13.52)
mostrarse que siguen siendo válidas en muestreo estratificado y de
varias etapas, como lo hacen las fórmulas de grandes muestras Como puede esperarse que pw sea positivo para muchos tipos de
aplicables a las estimaciones de razón y regresión, siempre y cuando error de medición, la fórmula estándar para v(ya) suele ser una
los errores de medición en y¡a y x¡a no estén correlacionados dentro subestimación en este caso y hace que la estimación de muestra
de la muestra y las cpf sean despreciables. parezca más precisa de lo que es. Esto es verdad aun cuando la
cpf sea despreciable.
Tal vez el ejemplo más frecuente de correlación intramuestral
13.11 EFECTO S D E L A C O R R E L A C IO N IN T R A M U E S T R A L entre errores de medición es la antes mencionada correlación dentro
E N T R E ERRORES D E M E D IC IO N del entrevistador, particularmente al tratarse de preguntas que in
volucran opiniones o criterios. Supongamos que n => mk, y que cada
Supóngase que para algunos o todos los valores de dia para uni
uno de los k entrevistadores obtenga datos de m entrevistados. Si
dades en la misma muestra, algunos de estos valores, o todos, están
podemos suponer que no hay correlación entre los errores de medi
correlacionados. El término puede escribirse
ción de diferentes entrevistadores,
da2 = “ 2 ( i d,a2 + 2 i duxd ¡\ (13.47)
n ' > ¡<i ' V (d J = ^ - [ l + (m - \ )p w] (13.53)
Por lo tanto, al promediar sobre medicionesrepetidas y muestras
aleatorias simples donde Pw es el coeficiente promedio de correlación dentro del entre
vistador.
V (d a) = E (d a2) = ^ a d2+ - n ^ ~ l ) E (d ,„ d¡a) (13.48) Aun un valor pequeño de p,c puede dar una contribución impor
tante a V{y„), porque es multiplicado por el tamaño m (más o me
FU E N TE S DE ERROR EN LAS ENCUESTAS 465
nos) de la asignación del entrevistador. También puede haber alguna que el progreso será lento y costoso. Una razón es que, como ya se
correlación entre los errores de mediciones para diferentes entrevis mencionó, los errores de medición dependen íntimamente tanto de
tadores (como, por ejemplo, cuando han sido entrenados o dirigidos las características como de los procedimientos de medición Los re
por el mismo supervisor). sultados acerca de los errores de medición hallados para una en
Este modelo sólo representa el tipo más simple de correlación cuesta rara vez pueden suponerse aplicables a otras.
intramuestral. Con muestreo estratificado, por ejemplo, un codifi Idealmente, el mejor método para estudiar los errores de medi
cador puede procesar resultados de varios estratos y por un mal ción es obtener los valores correctos de Pi. En la práctica, esta vía
entendido en las instrucciones puede introducir errores correlacio de acceso está limitada a características para las cuales existe un
nados que se extienden por sobre los estratos. El modelo matemá método factible para encontrar Pi y por problemas de ejecución y
tico se puede adaptar para aplicarlo a situaciones de este tipo. gasto. Algunos ejemplos son dados por Belloc (1 9 5 4 ), quien com
paró los datos sobre hospitalización declarados en entrevistas a do
13.12 R E S U M E N D E LO S EFECTOS DE micilio, con los registros del hospital para el individuo, y por Gray
ERRORES D E M E D IC IO N (1 9 5 5 ), quien comparó las declaraciones de los empleados respecto
a sus ausencias por enfermedad con los registros de la oficina de
En términos del modelo, la media y de una muestra aleatoria personal. Las comprobaciones de este tipo, algunas veces llamadas
simple sería insesgada, con varianza S ^ /n (ignorando c p f), si todas ''registro-verificación", son posibles con características tales como
las mediciones fueran perfectamente exactas. Como resultado de los edad, ocupación, número de años de escuela y precio pagado por
tipos de errores de medición aquí discutidos, la media puede estar automóvil. Una dificultad es que algunas veces los registros no con
sujeta a un sesgo de cantidad /?, y su error cuadrático medio es tienen un reflejo exacto de la persona entrevistada.
A l faltar un método para determinar el valor correcto, una alter
ECM(y„) = +crd2[ l + ( n - l)p w]} + 0 2 (13.54) nativa es volver a medir, mediante un método independiente que se
n
considera más exacto. Kish y Lansing (1 954) contrataron evalua
donde ¡x¡' = ¡n + j8|. dores profesionales para estimar los precios de venta de casas que
La Fórmula 13.54 contiene dos términos, S/*/n (1 - Pw)/n, ya habían sido declarados por su propietarios. En investigaciones
que disminuyen con 1/n. Los otros dos términos, Pw crd2 y /?=, a pri estadísticas sobre enfermedades, las contestaciones de los entrevis
tados se han comparado, sea con los registros de su médico o con
mera vista parecen independientes de n. Pero esto puede ser una
sobresimplificación. Cualquier cambio material en el tamaño de la los resultados de un examen médico completo [Sagen, Dunham y
Simmons (1 9 5 9 ), Trussell y Elinson (195 9)]. Los resultados de tales
muestra puede requerir un cambio de los métodos de campo de me
dición y esto puede afectar a y [i2. Sin embargo, estos dos términos comparaciones no son fáciles de interpretar en términos del modelo,
dado que el instrumento superior está en sí mismo sujeto a errores
deberían cambiar con relativa lentitud, si acaso, de acuerdo con n.
Ya que en muestras grandes el ECM parece estar dominado por estos de medición, pero las comparaciones indicarán, cuando menos, las
características para las cuales el instrumento de rutina concuerda
dos términos; la varianza ordinaria de muestreo se vuelve no impor
bien con el instrumento superior y aquellas con las cuales no con
tante y es engañosa como guía para la exactitud real de los resultados.
cuerda.
En encuestas por entrevistas a viviendas, un método con un pro
13.13 E L E ST U D IO D E LO S ERRORES D E M E D IC IO N pósito semejante consiste en volver a entrevistar una submuestra
de los entrevistados con entrevistadores más expertos y con un cues
En años recientes se ha investigado profusamente el estudio de tionario más detallado y exhaustivo. Después de la reentrevista, el
los errores de medición en las prácticas de muestreo. Los objetivos experto discutirá con el entrevistado las discrepancias entre las res
son descubrir los componentes que contribuyen principalmente al puestas originales y las repetidas, con objeto de determinar la
ECM y encontrar las maneras de disminuir estas contribuciones. respuesta más exacta y la razón de la discrepancia. Así puede ga
Algunos de los métodos principales se describen en ésta y en las narse mucha información útil. Al presentar algunos métodos para
secciones subsiguientes. En la actualidad está perfectamente claro la medición de errores de respuesta, Madow (1 965) discutió el uso
466 TE C N IC A S DE M U ESTRE O F U E N T E S D E ERROR E N LAS ENCU ESTAS 467
del muestreo doble con un estimador de diferencia de la forma Esta expresión estima o-ji2, que es la varianza simple de respuesta
[ y ' - ( y - 4 )J como medio para reducir el sesgo de las respuestas. para el agente 1 en la encuesta, si se cumplen dos condiciones ( A ) :
Aquí /í es la media de las mediciones no sesgadas o menos sesgadas no hay correlación entre errores de respuesta dn , di2, en la misma
hechas sobre la submuestra, en tanto que y' y y son medias de las unidad; y v¿,2 = a¿22. La Ec. (1 3 .5 6 ) se aplica a un solo par de
mediciones originales sobre la muestra y submuestra. agentes y se promedia sobre la submuestra de k pares de agentes.
Ocasionalmente, son factibles las comparaciones generales entre Las condiciones A pueden presentarse cuando la medición es una
los resultados de dos reconocimientos diferentes. Para un cierto nú codificación y los agentes son codificadores de habilidades seme
mero de características, los resultados del “Censo de los Estados jantes y están entrenados por supervisores diferentes, sin que un
Unidos" se pueden comparar con los dados por el “Reconocimiento codificador pueda ver el trabajo de otro. Al hacer la entrevista, se
de la Población Actual” que se tomaron al mismo tiempo. Dado que puede esperar una cov ( d u d ¡.) positiva porque algunos entrevis
el “Reconocimiento” se considera más exacto, particularmente para tados repiten una respuesta incorrecta de memoria. En este caso,
características difíciles de medir, se pueden obtener estimaciones I (y ,t-y ,z)ll 2m subestima od?. También subestima crdl2 si el segundo
imprecisas del sesgo de medición ,6 en los datos del “Censo” [Hansen, agente es más hábil que el primero como lo muestran para una me
Hurwitz y Bershad (196 1)]. Stephan y McCarthy (1 9 5 8 ), describen dición (0 ,1 ), Hansen, Hurwitz y Pritzker (1965). Aún más, se ha
un cierto número de comparaciones entre resultados de muestras de encontrado que £ {y u -y i-iP llm declina si el segundo entrevistador
cuota y muestras por probabilidad. obtiene las respuestas que obtiene el primero, aun cuando se le
En las secciones siguientes consideraremos algunos métodos di indique que no las vea hasta terminar la n entrevista repetida (Koons,
señados para producir estimaciones cuantitativas de las componen 1973). Estas complicaciones ilustran lo difícil del estudio realista
tes de la varianza total (varianza de respuesta más varianza de de los errores de medición.
muestreo) de una estimación muestral. Para la varianza total de respuesta, la estimación pertinente a
partir de (13.55) para un solo par de agentes es (y .i-y . 2) 2/2, donde
y.i, y .2 son las medias de las primeras y de las segundas m medicio
13.14 M E D IC IO N E S R E P E T ID A S D E S U B M U E S T R A S nes. En las condiciones (A ).
En estudios recientes se ha centrado el interés en la estimación:

- i9 \ 92)-' = ^ [ l + ( m - l k ] (13.57)
( a ) de la varianza total de respuesta y los tamaños relativos de la ¿ m
varianza simple de respuesta y la componente correlacionada como
donde p ,„ es la correlación entre errores de respuesta en unidades di
contribuciones a ella, y ( b ) de los tamaños relativos de la varianza
ferentes por el mismo agente. La Ec. (13.57) proporciona sólo un
total de respuesta y de la varianza de muestreo. Para ( a ) un mé
grado de libertad, pero está promediada sobre los k pares de agen
todo usado comúnmente es seleccionar una submuestra de los agen
tes. Con una estimación de a/ a partir de (1 3.56 ), podemos estimar
tes de medición (entrevistadores, codificadores, etc.) y volver a los tamaños relativos de la varianza de respuesta simple y la com
medir sus asignaciones por medio de otros agentes con, supuesta
ponente correlacionada. En encuestas por entrevistas, la componente
mente, la misma habilidad. Supongamos que mk es el tamaño de la
correlacionada suele encontrarse que es mucho mayor que la varian
submuestra, donde m es el tamaño de la asignación de un agente y
za simple de respuesta, excepto para atributos básicos como son la
k el número de agentes elegidos en la muestra original. edad, sexo y estado civil (Fellegi, 1964). En parte, por esta razón
Sean y¡,, yi2 las dos mediciones sobre la unidad i-ésima de la el Censo de los Estados Unidos de 1970 utilizó ampliamente la auto-
asignación de un agente. Si (13.31) es válida, enumeración por correo (Hansen y Waksberg, 1970).
y¡« = 4,+M .-' (13.55) Si (13.55) es aplicable, también podemos estudiar la razón de
la varianza simple de respuesta a la varianza de muestreo que se
Por lo tanto, al promediar sobre la asignación, aplica a la muestra en una asignación de un agente. Pues, en las
condiciones A,
£ K y n - y .c )2 2 2
di d2~ cQ v(d n di2) (13.56) ^ I I (y ^ - y . J 2/ 2 (m - l) = 0-/(1 - p J + 5M.2 (13.58)
2m 2 a i
468 TE C N IC A S DE M U E S TR E O FU E N TE S DE ERROR E N LA S E N C U E STAS 469
Pritzker y Hanson (1 96 2) han llamado a la razón La interpretación de estas comparaciones, a menudo se ve oscu
recida por las dudas que existen sobre la validez de las condiciones
A. Estimaciones más complejas basadas en supuestos más realistas
son las que da Fellegi (1964).
el índice de inconsistencia, que es análogo a la cantidad (1 — </>),
donde 4, es el coeficiente de contabilidad usado al estudiar errores
13.15 S U B M U E S T R A S IN TE R P E N E T R A N T E S
de medición en psicología. Si pu, es despreciable, 1 se puede estimar
a partir de la razón de (13.56) a (13.58). Esta técnica de particular utilidad en el estudio de errores correla
Con una variable (0 ,1 ), las Ec. (13.40) y (13.41) de la Sec. cionados fue propuesta por Mahalanobis (1946). Para presentarla
(13.10), al tener n = 1, muestran que para una sola medición de en los términos más simples, se divide una muestra aleatoria de
una sola unidad, la suma de la varianza simple de respuesta y la n unidades, al azar, en fe submuestras, donde cada submuestra con
varianza de muestreo es V{yla) = PQ, donde P = JJP J N , al supo tiene m = n/k unidades. El trabajo de campo y el procesamiento
ner que puede despreciarse f. El conjunto de valores por pares (y iu de la muestra se planean para que no exista correlación entre los
yi2) obtenido por ambos agentes se resume en la siguiente tabla errores de medición de 2 unidades en submuestras diferentes. Así,
2 X 2 de frecuencias. por ejemplo, supongamos que la correlación de la que nos ocupamos
se origina solamente en sesgos de los entrevistadores. Si cada uno
Núm ero de respuestas de los k entrevistadores se asigna a una submuestra diferente y si
Segundo agente no hay correlación entre errores de medición para entrevistadores
1 0 Total diferentes, tenemos un ejemplo de la técnica.
Con el mismo modelo matemático es conveniente rotular las
Primer 1 a b a +b unidades con subíndices dobles. Sea
agente 0 c d c+d
yiia = p'>i + di¡a (13.61)
a+c b+d m
donde i denota la submuestra (entrevistador) y j el miembro dentro
Así, b es el número de unidades sobre las que el primer agente re de la submuestra. Se ignora la cpf.
gistra 1, y el segundo agente registra 0. En las condiciones A Dado que la submuestra i-ésima es una submuestra aleatoria,
ella misma es una muestra aleatoria simple de tamaño m. De modo
K y u - j'iz )2 que, por (13.51), la varianza de su media es
- 2 ¡ ■= (b + c)/ 2 m (13.59)
o-d —
2m V (y J = ^ { S S + a d2[ l + ( m - l)p „]} (13.62)
Como estimación de 1 a partir de la submuestra, una elección es
donde pw es la correlación entre los di¡a obtenidos por el mismo en
I = Z 4 = --------------- m ( b + c ) ---------------- (13.60) trevistador.
PQ (a + b )(c + d ) + {a + c){b + d)
Como los errores son independientes en las diferentes submuestras,
que promedia las estimaciones PQ a partir de los dos conjuntos de
mediciones. Las estimaciones del índice han sido publicadas tanto y {ya ) » r V(yu, ) = 7 ( V + <rd\ 1 + (m - 1 )p w]} (13.63)
para el Censo como para la encuesta por muestreo por Pritzker y Han-
son (1962), Fellegi (1 9 6 4 ) y Koons (1973). Estas estimaciones son De los resultados de la muestra se puede calcular un análisis de
útiles al comparar la poca confiabilidad relativa de la medición para la varianza de las km observaciones en las componentes "Entre
diferentes atributos en censos sucesivos, o entre métodos diferentes entrevistadores (submuestras)” con (fe — 1) grados de libertad y
de medición, al proporcionar así una evaluación de los nuevos mé ‘‘Dentro de entrevistadores” con k (m — 1 ) grados de libertad. Es fácil
todos de medición. verificar que los valores esperados de los cuadrados medios prome-
470 T E C N IC A S D E M U ESTRE O F U E N T E S DE ERROR E N LA S E N C U ESTAS 471
T A B L A 13.12
de unidades últimas en la asignación de un entrevistador se conserva
en su nivel acostumbrado en la encuesta, aunque el entrevistador
Esperan zas de los Cuadrados M e d io s ( con Ba s e e n u na Un id a d )
tenga que viajar de una área dos veces mayor que la usual. Para un
gl cm E(cm) conglomerado, la Tabla 13.12 proporciona un grado de libertad entre
entrevistadores y 2 (m - 1 ) g.l. dentro de entrevistadorés: las me
Entre dias cuadradas correspondientes se promedian sobre los conglomera
entrevistadores dos elegidos para el estudio. Desde luego, la varianza de muestreo
(submuestras) que se mide es sólo aquella dentro de la última etapa de la conglo
V + aa2[ l + ( « - ! ) ? . , ]
k 1 b k -1 meración. Como recordatorio de este hecho, el término de la varianza
Dentro de del muestreo en E (c 7n ) a veces se escribe Suin (1 — P¡) en lugar de
entrevistadores S/P2, donde p, es la correlación intraconglomerados entre los errores
. . n , H .(y u a -? J 2 SS+cr¿2( l - p w)
k (m - 1) k ( ^ { ) de muestreo para subunidades diferentes.
En esta forma se usó el método de interpenetración en el estudio
______________________________________________________________— --------- ---
Response Variance Study 1 del U.S. Census Bureau (1968), diseña
diados sobre selecciones de los entrevistadores y de las muestras do para estimar las componentes correlacionadas de las varianzas tota
aleatorias y submuestras aleatorias vienen a ser como se muestra les de respuesta de atributos en el censo 1960. Las áreas en este
en la Tabla 13.12. estudio eran conglomerados compactos de viviendas, los conglomera
La Tabla 13.12 contiene 2 resultados importantes. Al comparar dos se dispersaron sobre todos los EE.UU. En un conglomerado de
con (13.63) vemos que sb3/n es una estimación insesgada de V(ya), muestra cualquiera se formaron dos submuestras interpenetrantes
si se ignora la cpf. Así es como las submuestras interpenetrantes y se asignó cada submuestra a un entrevistador diferente.
proporcionan una estimación de V(ya) que toma en cuenta apropia En la mitad de los conglomerados, los dos entrevistadores tenían
damente la varianza simple de respuesta y la componente correla diferentes jefes de equipo. En una mitad se supuso, como parece
cionada. razonable, que los errores de respuesta de los dos entrevistadores
El análisis también permite estimar la componente correlaciona no estaban correlacionados. Así ( s ¡,5 - suf)/m estima Pw <¡¿, donde
da, ya que Stf es ahora el cuadrado medio promedio entre entrevistadores en el
mismo conglomerado. En la otra mitad de los conglomerados, los
Ei l ¿ Z± ? ) =Pw(T2 (1364) dos entrevistadores tenían el mismo jefe de equipo. Aquí, el objetivo
m
era medir hasta donde “el efecto jefe de equipo” inducía una cova-
En consecuencia, al comparar (m - 1 ) (s 6= - sw2)/ m con sb2, rianza entre d., y d ». para los dos entrevistadores en un conglomera
se estima la cantidad relativa con que la componente correlacionada do. De ser así, sb- en la Tabla 13.12, ahora estima
de la varianza de respuesta contribuye a la varianza total de ya. Con
■V2( 1 - P.) + (r A 1+ ( " » - 1 )Pw] ~ mE cov (d ,<¿2)
mediciones en donde la componente correlacionada es mucho mayor
que la varianza simple de respuesta, la razón (m - 1 ) ( s f — s„! )/ y (si ,2 — Sa'^/m estima
msb'- se ha usado en forma alternativa como medida de la contribu
ción relativa de la varianza total de respuesta a la varianza total de pwa / - E (c o v d Ad 2) (13.65)
ya. Tepping y Boland (1 9 7 2 ) presentan estimaciones de esta razón A l comparar' los dos conjuntos de valores de (s*J — sw2)/ m se ve
para atributos que aparecen en el “Reconocimiento de la Población que existe un efecto “jefe de equipo” . Dado que las diferencias entre
Actual” . estimaciones de la varianza como sb- y sw5 son inestables, se necesita
Cuando el método de interpenetración se aplica en una muestra un gran número de conglomerados en las dos mitades de este tipo
de varias etapas que cubre una extensa área geográfica, la práctica de estudio para medir el efecto "jefe de equipo” con alguna precisión.
más común consiste en tener pares de entrevistadores que miden las La técnica de interpenetración se extiende al muestreo estratifi
submuestras interpenetrantes extraídas de los conglomerados más cado y al de varias etapas. Si el interés primario está en obtener una
;pequeños de entre las etapas sucesivas. De esta manera, el número estimación insesgada de V(ya) que tome en cuenta adecuadamente
F U E N T E S D E ERROR E N LA S E N C U ESTAS 473
era la asignación de un entrevistador. Las áreas de enumeración

los efectos de los errores de medición, lo único que se necesita es
contiguas se agruparon en 67 pares. Se asignaron dos entrevistado-
que la muestra consista en un número de submuestras de la misma
estructura, en las que tengamos la seguridad de que los errores de res a cada par, para que cada uno de ellos entrevistara una mitad
aleatoria de las viviendas en el par. De esta manera, cada enume-
medición son independientes en submuestras diferentes. Estricta
mente, esto requiere que los diferentes equipos de entrevista, los rador tenía una carga de trabajo regular, pero desparramada sobre
supervisores y los procesadores de datos sean diferentes en las diver un área doble. Entonces, las asignaciones de los dos entrevistado-
sas submuestras. Si yu, es la media de la i-ésima submuestra, la res se intercambiaron para obtener así la combinación deseada de
interpenetración y medición repetida.
cantidad K y * , - y „ ) 2A (fc ~ 1) es una estimación insesgada, de V(yQ),
con (fe - 1 ) grados de libertad. Este resultado es válido porque las Si Sj, S2 denotan las dos submuestras interpenetrantes e I„ I 2,
submuestras se pueden considerar como una unidad de muestreo los dos entrevistadores, al comparar ( I , S2) con ( L S , ) o ( í , St), con
compleja, en la que la muestra es en efecto, una muestra aleatoria ( í 2 S2) se tiene el análisis de “ medición repetida” , en tanto que al
simple de dichas unidades complejas, con errores de medición no comparar (I.S ,) con. (J*Sa) o (h S 2) con ( I 2S ,), se tiene el análisis de
correlacionados entre las diferentes unidades complejas. En conse “ interpenetración” . Estas comparaciones conducen a estimaciones de la
cuencia, los resultados de la Sec. (13.10) son aplicables. varianza simple de respuesta, la componente correlacionada, la va
Existen numerosas aplicaciones de este método, algunas veces rianza total de respuestas y el índice de inconsistencia. La varianza
llamado muestreo replicado, que describe Deming (1 9 6 0 ), quien lo de muestreo involucrada es la que existe entre viviendas dentro de
ha usado extensamente. Para otras discusiones de sus ventajas, puede pares de áreas de enumeración. Un análisis más extenso de Fellegi
verse a Jones (1 9 5 5 ) y Koop (1960). Los costos de viaje de los estima también la covarianza entre desviaciones de muestreo y de
entrevistadores aumentan por la interpenetración, pero este efecto respuesta para el mismo entrevistador. Este término se despreció
puede mitigarse si la muestra se estratifica en áreas compactas. Así, en el modelo aquí presentado, pero Fellegi muestra que en las esti
por ejemplo, cada estrato podría contener dos muestras aleatorias maciones de p<r/, puede crear sesgos considerables.
asignadas a un entrevistador diferente. Cada entrevistador deberá Bailar y Dalenius (1 9 6 9 ) han hecho una buena exposición de
viajar por todo el estrato y no sólo la mitad de él. Cada estrato pro las ventajas y desventajas de las diferentes variantes del método
porciona un grado de libertad para la estimación de V(ya). repetido y del método de interpenetración. Hansen y Waksberg (1970)
revisan el trabajo de investigación del U.S. Census Bureau sobre
errores de medición en lo que respecta al censo y a algunas de las
13.16 C O M B IN A C IO N D E L A IN T E R P E N E T R A C IO N
más importantes encuestas por muestreo realizadas por la misma
Y L A M E D IC IO N R E P E T ID A
oficina. Los cambios resultantes en el censo 1970 incluían un uso
Como hemos visto (Sec. 13.14), la medición repetida de las más extendido de la autoenumeración (a l omitir sesgos de entre
unidades en la asignación de un agente por otro de calidad seme vistadores) en un censo por correo, una mayor utilización del mues
jante, proporciona estimaciones de la varianza simple de respuesta treo en contraposición al censo completo y una preselección por
y de la varianza total de respuesta, si se aplican las condiciones A, computadora de la muestra para evitar algunos sesgos que se habían
aunque éstas pueden subestimar en encuestas por entrevistas si los detectado en la selección de la muestra de la última etapa que hizo
errores de los entrevistados en ambas ocasiones están correlaciona el entrevistador. Se encontraron errores graves en datos sobre la
dos positivamente. El esquema de interpenetración (Sec. 13.15) ocupación, la industria y la calidad de las viviendas, así como pro
proporciona interpretaciones de la componente correlacionada de la blemas de revisión en datos sobre gastos, que se seguían estudiando.
varianza de respuesta y su contribución a la varianza total, varianza
de respuesta más varianza de muestreo.
Es mucho más lo que puede aprenderse con una combinación 13.17 P R E G U N T A S D E L IC A D A S : R E S P U E S T A S
ingeniosa de interpenetración y repetición como la usa Fellegi (1 9 6 4 ) A L E A T O R IZ A D A S
en un estudio de errores de respuesta en el censo de población cana
Una situación que se puede esperar conduzca a negativas o a
diense 1961. El estudio se llevó a cabo en 134 áreas de enumeración,
respuestas evasivas por parte de los entrevistados, ocurre cuando
cada una de las cuales contenia alrededor de 150 viviendas lo que
P U E N T E S DE ERROR E N LA S E N C U ESTAS 47 !
una pregunta de la muestra es delicada o muy personal (com o, por. fácilmente encontramos
ejemplo, ¿suele el entrevistador robar objetos de las tiendas o usar
drogas?). Considérese primero la estimación de una proporción bi T/i (¡ , _ ^ a ( 1 -tta ) P (i- p )
V (* A„ ] (13.70)
nomial — la proporción vA de entrevistados que pertenecen a cierta
clase A o han cometido cierto acto— . A l utilizar ingeniosamente un
El primer término en V (ñ AW) es la varianza que tendría V(írA) si
artificio de aleatorización, Warner (1 9 6 5 ) mostró que se puede esti los n entrevistados contestaron verazmente a una pregunta directa
mar esta proporción sin que el entrevistado revele su posición per sobre su pertenencia a la dase A. Salvo cuando esté cerca de
sonal respecto a la pregunta. El objeto es ayudar a que se den res y P > 0.85 el segundo término es mayor que el primero, a menudo
puestas veraces y se conserve plenamente lo confidencial del asunto. mucho mayor. Por lo tanto, en general, el método es muy impreciso.
El artificio de aleatorización, como es la flecha giratoria o una Esto podría esperarse, ya que el entrevistador no sabe si una res
urna con bolas blancas y rojas, selecciona uno de dos enunciados o puesta “afirmativa” implica una pertenencia a la clase A o a su
preguntas, cada uno de los cuales requiere una respuesta “sí” o “no” opuesta. Sin embargo, como lo mostró Warner, su método puede
por parte del entrevistado. El entrevistador no sabe cuál es la res dar un ECM menor de lo que daría una pregunta directa delicada,
puesta dada por el entrevistado, pero sí sabe cuáles son las proba si esta última produjera numerosos rechazos o respuestas falsas.
bilidades relativas P y (1 - P ) con las que se han presentado los
dos enunciados. El éxito del método depende de que el entrevistado
13.18 L A S E G U N D A P R E G U N T A N O R E L A C IO N A D A
esté convencido de que su participación no revelará su posición
personal con respecto al asunto que se considera delicado o muy per
sonal. Como alternativa al método de Warner, Simmons sugirió (Hor-
vitz. Si ah y Simmons, 1967) que la cooperación de los entrevista
En la proposición original de W arner los dos enunciados son:
dos podría mejorar si el segundo enunciado no fuese delicado y no
“Soy miembro de la clase A.” (Presentada con probabilidad P ) tuviese relación con el primero. Por ejemplo,
“N o soy miembro de la clase A.”
“Yo nací en el mes de mayo”.
Con una muestra aleatoria de n entrevistados, el entrevistador
registra una estimación binomial $ = m/n de la proporción <f> de El primer enunciado no se ha alterado. Si todos responden veraz
respuestas “afirmativas” . Si las preguntas se contestan verazmente, el mente, la proporción de población de respuestas “afirmativas” es ahora
cociente entre <¡> y tt,, en la población es
4> =PrrA + (1 - P ) ttu (13.71)
<f>= P vA + ( l - P ) ( l - v A) = (.2 P - l)n A + ( l - P ) (13.66)
donde ttv es la proporción en la población muestreada de los que na
Con P conocida, esta relación sugiere la estimación cieron en mayo. Si se conoce la estimación obvia y de mayor
verosimilitud de t,, es
* [0 - q - f ) ] ( P A\
* Aw - \ P * 2) (13.67) [<í> - ( I - P ) ttu]
¿ a u ~'
ttau = p (13.72)
Esta estimación resulta ser la estimación de mayor veracidad de vA.
(E l subíndice W es por “Warner” .) La estimación es insesgada, con con varianza
varianza
V(ñAu) = ~ n ~ 'f* (13.73)
(13.68)
Murtón (Greenberg y otros., 1969, Pág. 532) ha sugerido cómo pue
Al escribir (1 - </>) en la forma de obtenerse siempre el caso irv conocida. Una urna contiene bolas
azules,blancas y rojas en proporciones conocidas Pu P2, P3. Al sacar
(1-<¿) = (2 P —l)(l- 7 r A) + (l —P) (13.69)
una bola rojase produce un enunciado delicado. Al sacar una bola
F U E N T E S D E ERROR E N LA S ENCU ESTAS 477
azul o blanca se produce el enunciado: “El color de esta bola es blan preservar la confidencialidad, es útil tener trv aproximadamente igual
co” . Así itu = P-J ( Ps + Pj )• a 7ta.
Dovvling y Shachtman (1 9 7 5 ) han mostrado que V( ttau) < V(-irAW) Se han estudiado muchas variantes de estos métodos (como sería
para todas las ir*, wa siempre que P exceda %. (L a varianza de ttaw el uso de preguntas no relacionadas) así como los sesgos producidos
es simétrica alrededor de P — Vi, pero la de frAU no lo es, y una P en ¿ aw y ttau si una fracción de los entrevistados contesta falsa
pequeña da lugar a pocas respuestas a la pregunta delicada con este mente a la pregunta. Greenberg y otros (1971) han aplicado la técnica
método.) de dos muestras para estimar la media pA a una variable sensible
Si fuese necesario estimar t a y *0 podemos tener dos hnuestras discreta o continua, por métodos análogos a los que conducen a las
aleatorias de tamaños n¡, h2, con proporciones diferentes P lt P2 a la Ecs. (13.74) y (13.75). La pregunta no relacionada estima la media
pregunta delicada. A l denotar <t>u las proporciones de respuestas pv para una variable no sensible. Los subgrupos aleatorios de 72¡
“sí” en las poblaciones definidas por las selecciones P, y Px, sujetos ( i = 1 , 2 ) reciben la pregunta delicada con probabilidad P¡.
y la no delicada con probabilidad (1 - P ¡). La variable registrada z¡
«¿ ^ P .^ + O - P ,)^ (13.74) para unsujeto, sigue por tanto una mezcla de dos distribuciones en
<t>i = PiTrA + ( 1 - P 2)7Tu (13.75) las proporciones P¡, (1 — P ¡), una distribución con media p A, va
rianza crp, y la otra con media pv, varianza <rc2. Por lo tanto,
Estas relaciones sugieren la estimación
E (zl) = Pip A H l ~ P í)P v (13.80)
[¿ .(l- P iM U - P .)]
V<Z() = f W + (1 ■- P . W + P A 1 - P i)(M a - P u )2 (13.81)
(? F iy (1376)
Análogamente a (1 3.76 ), la estimación de pA es
con
- _ [(1 - P 2 )f,- (1 - P ,)¿ 2 ]
V (^ )- \ (13.77,
(P 1- P 2) 1 nx n2 J » AU [ P {~ P 2) (1382)
Para una eficiencia máxima se requieren las condiciones pv = pA,
Si P, > l/¡. Greenberg y otros, (1 9 6 9 ) mostraron que esta varianza
¡Tu3 = 0 , en tanto que para preservar el anonimato lo mejor es pv =
se minimiza cuando P 2 = 0 , o sea, cuando a todos los miembros de la
Pa, cu2 ~ va'-
segunda muestra (n s) ha hecho la pregunta ttv no relacionada. Moors
Warner (1 97 1) ha construido un contexto teórico para una gran
(1971) recomendó este procedimiento, pero Greenberg y otros (1969)
clase de modelos de respuestas aleatorizados. Como lo sugieren
sugieren P, + P, = 1 como regla de trabajo, cuando la elección P2 = 0
(13.74) y (13.75) el truco consiste en estimar ciertas funciones li
pudiera debilitar la cooperación de los entrevistados. Cuando, por
neales de las ir o p delicadas y no relacionadas con tantas ecuacio
ejemplo, P, = 0.8 en promedio el 80% de la muestra 1 y el 20% de
nes como parámetros a estimar.
la muestra 2 se verían confrontados con la pregunta delicada.
El método se ha aplicado a la obtención de estimaciones de las
Con las óptimas n „ n, para dada n - nt + n,, la desigualdad de proporciones de nacimientos ilegítimos, de abortos inducidos, de adic
Cauchy-Schwarz muestra que la varianza mínima resultante de ttau es tos a la heroína, de personas conectadas con el crimen organizado,
y del ingreso medio y número de abortos, como aplicaciones conti-
Vm!n(ñ AU) = * p ,2[ ( l - P 2) ^ . a - < f r i ) + a - P f r f t i o 3 ^ ) ] 2 (13.78) nuas-discretas. Como el método ha llamado mucho 1&. atención, se
n ( r , - P 2)
puede esperar que aparezcan más aplicaciones. Horvitz, Greenberg
La razón n,/n2 minimizante es y Abernathy (1 9 7 5 ) han hecho una excelente revisión.
«1 (1 - P 2
2))
Ultimamente se ha discutido el grado de privada que los entre
vistados tienen en las diferentes versiones de las entrevistas aleato-
n2 ( 1- P .,)) V
V ^ 2d(l-<
- ^^ 2) (13'79)
rizadas. En algunas versiones el entrevistador puede conjeturar la
Esta elección requiere estimaciones anticipadas de irx y *u, pero posición de algunos entrevistados sobre la pregunta delicada con
el óptimo es bastante plano. Greenberg y otros (1 9 6 9 ) hacen algunas
una probabilidad bastante alta de corrección, — lo que es un aspecto
recomendaciones respecto a las elecciones de P,, P2, n¡ y n-.. Para indeseable para este método.
la calidad del trabajo de campo y con una evaluación postencuesta

13.19 RESUM EN
de los éxitos y puntos débiles en la operación.
En ciertas hipótesis, una segunda medición de una subrnuestra
Con relación a sus efectos en las fórmulas dadas en capítulos
de unidades por otro entrevistador de habilidad semejante proporcio
anteriores, los errores que no son de muestreo se pueden clasificar
nará estimaciones de la varianza simple de respuesta y su razón a
como sigue:
la variancia total de respuesta, así como una estimación aproximada
1. Con cubrimiento incompleto y no-respuesta, la consecuencia de su razón y la varianza de muestreo o la que se sujeta esta sub-
más importante es que las estimaciones pueden contener se§go, por muestra. Un segundo método de — submuestras interpenetrantes de
que la parte no alcanzada de la población puede diferir de la parte estimaciones de la varianza total (varianza de muestreo más va
muestreada. Hay ahora amplia evidencia de que estos sesgos varían rianza de respuesta) y una estimación de la componente correla
considerablemente de característica a característica y de encuesta a cionada de la varianza de respuesta. La combinación de interpene
encuesta, siendo algunas veces despreciables y otras considerables. tración y medición repetida es particularmente provechosa.
Una segunda consecuencia es, desde luego, que las varianzas de las
estimaciones aumenta porque la muestra obtenida realmente es más
E J E R C I C I O S
pequeña que la muestra propuesta. De este factor puede hacerse car
go, al menos en parte, la selección del tamaño de la muestra pro
13.1. Supóngase que, mediante métodos de campo de diferentes intensi
puesta. dades, es posible hacer que el estrato “respuesta” consista de 60, 80, 90 o
2. Los errores de medición que son independientes de unidad a 95% de la población total. Para un porcentaje a estimar, las medias verda
unidad dentro de la muestra y promedian cero sobre toda la pobla deras del estrato “respuesta" son: estrato 60% , 40.7; estrato 80% , 43.5;
ción, se toman en cuenta adecuadamente en las fórmulas usuales estrato 90% , 44.8; estrato 95%, 45.4; 5% restante, 59.0. ( a ) Para un método
que muestre solamente e l estrato 6 0 % , demuestre que la raíz cuadrada del
para el cálculo de los errores estándar de las estimaciones, siempre
error cuadrático medio del porcentaje estimado para la población total es
que los términos cpf sean despreciables. Tales errores disminuyen
la precisión de las estimaciones y es conveniente encontrar si esta •/(2414/n) + 28.94
disminución es significativa. donde n es el número de cuestionarios completos obtenidos, ( b ) Demuestre
3. Si los errores de medición en diferentes unidades de la muestra que la raíz cuadrada del error cuadrático medio de 5% n o se puede lograr
están correlacionados, las fórmulas usuales para los errores están con un método con 60% de respuesta, pero sí con algo más de 100 cuestio
dar contienen sesgo. Es probable que los errores estándar sean muy narios completos para métodos que tienen una respuesta de 80% o mejor,
( c ) Si se prescribe una raíz cuadrada del error cuadrático medio de 2 % ,
pequeños, dado que las correlaciones en su mayoría son positivas en
¿cuáles métodos pueden lograrlo y cuáles son los tamaños de muestra nece
la práctica. Este tipo de perturbación se pasa por alto fácilmente sarios ?
e incluso puede pasar inadvertida.
13.2. En 13.1 ( c ) supóngase que cuesta $5 por cuestionario completo para
4. Un sesgo constante que afecta a todas las unidades por igual
el método de campo que tiene un 90% de respuesta. El obtener un cuestionario
es el más difícil de advertir. Ninguna manipulación de los datos de completo del siguiente 5% de la población cuesta $20. Para una raíz cuadrada
la muestra revelará dicho sesgo. del error cuadrático medio de 2 % , ¿es más barato usar el método con una
proporción de respuesta de 90% o el de una proporción de respuesta de 95%?
Como se ha indicado en este capítulo, el estudio de estos proble
mas es lento y difícil. No obstante, se ha comenzado bien. Se demos 13.3. Una población consiste en dos estratos de igual tamaño. La proba
bilidad de encontrar el entrevistado en casa y anuente a ser entrevistado du
tró mucho ingenio para procurar técnicas para la evaluación y con
rante cualquier visita es 0.9 para las personas en el estrato 1 y 0.4 para las
trol de los errores que no son de muestreo. Aunque este es un campo personas en el estrato 2. ( a ) En la notación de la Sec. 13.5 demuestre que
en el cual es difícil hacer amplias generalizaciones, gradualmente
debería acumularse la información acerca de la naturaleza y mag w,,= l-(O .l)', w¡2= 1—(0.6)'
nitudes de los errores de medición en los diferentes tipos de inves ( b ) Si el tamaño original de la muestra es n 0, calcule el número total esperado
tigaciones. También es necesario saber más sobre lo que se puede de entrevistas obtenidas para 1, 2, 3, 4 y 5 visitas, ( c ) Si los costos relativos
lograr con un buen adiestramiento y la supervisión de los entrevis por entrevista a la i-ésima visita son 1O0, 120, 150, 200 y 300 para t = 1, 2,
tadores, con pruebas preliminares, con mecanismos para controlar 3, 4, 5, respectivamente, calcule el costo promedio por entrevista para todas
las entrevistas obtenidas hasta la i-ésima visita, ( d ) El dinero disponible para

13.8. U na población con N = 6 contiene tres unidades para las cuales la
la encuesta es suficiente para pagar las primeras 300 visitas completas. Si la
respuesta correcta a una pregunta es sí, y tres unidades para las cuales
política es insistir en i visitas, ¿cuáles son los números esperados totales
es no. Debido a errores de medición, la probabilidad de obtener una respuesta
de entrevistas completas que se pueden obtener por la misma cantidad de
“sí" en una unidad sí, es 0.9; y la probabilidad de obtener una respuesta “no”
dinero cuando i = 1, 2, 3, 4, 5?
en una unidad no, es también 0.9. ( a ) A l obtener la distribución de todas
13.4. En el Ejercicio 13.3 Las personas en el estrato 1 tienen una media las respuestas posibles para muestras de tamaño 2, demuestre que las proba
de 40% para algún porcentaje binomial que se está estimando, y las personas bilidades de que la muestra de 0, 1, 2 respuestas “ sí" son 0.218, 0.564,
en el estrato 2 tienen una media de 60% . (a ) Calcule el sesgo en la media y 0.218. ( b ) Demuestre que la varianza de la proporción estimada de con
de la muestra para i *= 1, 2, 3, 4, 5 visitas, ( b ) Calcule la varianza de las testaciones “sí" es 0.1090. Verifique los resultados (13.4 0 ) y (1 3.41) en la
medias de la muestra para la situación de costo en la parte ( d ) del Ejercicio Sec. 13.10. ( c ) ¿Cuál sería la varianza de la proporción estimada de “ sí” , si
13.3. (P a ra economizar cálculos, la varianza puede tomarse como 2 600/ni , no hubiera errores de medición?
donde n ¡ es el número total esperado de entrevistas obtenidas.) ( c ) ¿Cuál
13.9. En una parte de la Encuesta de Trabajo en Bengala 1942 (Mahala-
política da el ECM más bajo? nobis, 1946) se tomó una muestra al azar de cerca de 175 familias en cada
13.5. En la Sec. 13.6 (submuestreo de quienes no responden) verificar la uno de tres estratos. La muestra en cada estrato se dividió en cinco sub
fórmula (Pág. 451) para la razón del costo esperado de obtener una V espe muestras al azar, asignando cada una a un entrevistador diferente. Los cinco
cificada sin submuestreo al costo mínimo esperado, entrevistadores trabajaron en todos los cinco estratos. Para gastos de alimentos,
la parte relevante del análisis de varianza (co n base en una sola fa m ilia )
. , F ÍC o + c .W .+ C jW J es como sigue:
Razón = —, - ............----------- 7=—
[V fF -W q X co + c .W ,) + H q V c J gl cm E (c m )
donde F = S2/S¡2. Sea c0 = c, — 1, c, = 16. ( a ) Si F =. 1, demuestre que Entre entrevistadores 4 22.3 <V2+ o/+ 3 5o-/s2+ 105cr,2
la razón de costo tiene un máximo de 1.25 cuando W 3 = 0.2 o 0.25. ( b ) Entrevistas X estratos 8 9.6 <V j + ^ 2+35<70 2
S i F — 1.5, demuestre que el máximo es 1.41 para W , = 0.3 o 0.35. Dentro de submuestras 510 9.9 cr^ + crdz
13.6. En una encuesta de aves de corral y cerdos mantenidos en patios y
ciertas instalaciones pequeñas (G ray, 1957), una encuesta por correo con
Si g ^ vshi, representan sesgos del entrevistador i, el modelo para una
varios recordatorios, se continuó con entrevistas de una submuestra de las
sola fam ilia es
personas que no contestaron. Por un juicio adelantado, se escogió fe = 2 (es
decir, tina submuestra del 50% ) . Para una característica importante se dis
y = i ¡ - k + gl + îü+(u'hii-p-h)+ ‘ilu^
puso de los siguientes datos después de la encuesta, en la notación del
Ejercicio 13.5. Varianzas: cr,2 crIS2 o / ad2
Verifique las expresiones dadas para E (c m ) y estime la proporción de la

— — 0.15, — — 9.5, VV', = 0 .8 , S2= S 22
varianza total de la media que puede ser adscrita a sesgos del enumerador.
Co co
Al encontrar VC para fe = 2 y para una fe óptima, determine si fe = 2 fu e una 13.10. Considérese un acto ilegal que haya sido cometido por el 10% de
buena elección. la población (ir , = 0.1). Si todos los entrevistados son veraces, compárese la
para n - 500 dada por ( o ) una pregunta delicada directa, ( b ) el mé
13.7. En una encuesta por el método Politz-Simmons se encontraron en
todo de W arner con P — 0.8, ( c ) el método de la pregunta no relacionada con
casa durante la primera visita 390 personas que respondieron, de una muestra
sru — 0.2 conocida. (<f) el método de dos muestras y pregunta no relacionada
inicial de 660. Los números de los que declararon haber estado en casa durante
con ir„ de hecho igual a 0.2, pero desconocida cuando P, •• 0.8, P 2 — 0 como
las 0 , 1, . . . , 5 de las cinco noches precedentes y e l número de los que con
lo recomendó Moors, ( e ) el mismo método cuando P , — 0.8, P.. — 1 — P,.
testaron sí a una pregunta en la encuesta fueron como sigue:
Supóngase que se puede usar la n t/n.¿ óptima en ( d ) y ( e ) . Se han evitado
0 /5 1/5 2 /5 3 /5 4 /5 5/5 algunos decimales al calcular para los métodos V(100ir,,) = 10"V (ñ A).
13.11. En el Ejercicio 13.10, supóngase que todos los entrevistados fueron

Número 14 35 55 74 94 118 veraces con cualquiera de los métodos de respuesta aleatorizada ( b ) , ( c )
Respuestas sí 4 13 20 30 42 156 ( d ) o ( e ) , pero que a una pregunta directa y delicada con el método ( a )
algunos entrevistados que cometieron el acto lo niegan. Para n = 500, ¿cuál
de los métodos de respuesta aleatorizada da un ECM (ir,,) menor que el mé
Calcule la estimación Politz-Simmons de la proporción de contestaciones
todo ( a ) si ( 1 ) 15% , ( 2 ) 20% , ( 3 ) 25% de los que cometieron el acto lo
afirmativas en la población y compárelo con la estimación binomial simple.
niegan con el método (a )?
*
Bibliografía
Armitage, P. (1 9 4 7 ). A comparison o f stratified with unrestricted random

sampling from a finite population. Biometrika, 34, 273-280.
Arvesen, J. N . (1 969). Jackknifing U-Statistics. Ann. Math. Stat, 40 2076-
2100. ’ ’
Avadhani, M. S. y Sukhatme, B. V. (1 9 7 3 ). Controlled sampling with equal

probabilities and without replacement. In t. Stat. Rev., 41, 175-183.
Bailar, B. A. ( 1975). The effects o f rotation gxoup bias on estimates from

panel surveys. J o u t . Am er. Stat. Assoc., 70, 23-30.
Bailar, B. A., y Dalenius, T. (1 9 6 9 ). Estimating response variance components
o f the U.S. Burean o f the Census Survey Model. Sankhya, B31, 341-360.
Barr, A. (195 7 ). Differences between experienced interviewers. App. Stat.,
6, 180-188.
Bartholomew, D. J. (1 9 6 1 ). A method o f allowing fo r "not-at-home" bias in
sample surveys, App. Stat., 10, 52-59.
Bartlett, M. S. (1 9 4 9 ). Fitting a straight line when both variables are subject
to error. Biometrics, 5, 207-212.
Basu, D. (1 958). On sampling with and without replacement. Sankhya, 20
287-294.
Bayless, D. L. (1 9 6 8 ). Variance estimation in sampling from fin ite popula-
tions. Ph. D. Thesis, Texas A & M University.
Bayless, D. L., y Rao, J. N. K. (1 9 7 0 ). An em piiical study of stabilities of
estimators and variance estimators in unequal probability sampling (n =
3 o 4 ). J out . Amer. Stat. Assoc., 65, 1645-1667.
Beale, E. M. L. (196 2 ). Some uses o f computers in operational research.
In d u strióle Organisation, 31, 51-2.
Bean, J. A. (1 970). Estimation and sampling variance in the health interview
survey. National Center for Health Statistics, Washington, D. C., Series
2, 38.
Bean, J. A. (1 975). Distribution and properties o f variance estimators fo r
complex multistage probability samples. National Center for Health Sta
tistics, Washington, D. C., Series 2, 65.
Beardwood, J., Halton, J. H., y Hammersley, J. M. (1 9 5 9 ). The shortest path
through many points, Proc. Cambridge Phil. Soc., 55, 299-327.
Beilhouse, D, R. y Rao. J. N. K. (1 9 7 5 ). Systematic sampling in the presence
o f a trend. Biometrika, 62, 694-697.
Belloc, N. B. (1 9 5 4 ). Validation o f morbidity survey data by comparison with
hospital records. J o u t . Amer. Stat. Assoc., 49, 832-846.
Birnbaum, Z. W., y Sirken, M. G. (1950a). Bias due to nonavailability in
sampling surveys. Jour. Am er. Stat. Assoc., 45, 98-111.
tciuuie», i
Watson, D. J. (193 7 ). The estimation o f lea f areas. Jour. Agr. Sci., 27, 474.
West, Q. M. (1 9 5 1 ). The Results o f Applying a Simple Random Sampling
Process to Farm Management Data. Agrícultural Experiment Station, Cor-
nell Uitiversity.
William s, W . H. (1 963). T h e precisión o f some unbiased regression estimators.
Biometrika, '17, 267-274. Respuestas a los Ejercicios
Wishart, J. (1 9 5 2 ). Moment-coefficients o f the fe-statistics in samples from a
fin ite population. Biometrika, 39, 1-13.
Wold, H. O. A. (1 9 5 4 ). A Study in the Analysis o f Stationary Tim e Series.
Alm qvist and Wicksell, Stockholm, segunda edición.
W oodruff, R. S. (195 9 ). The use o f rotating samples in the Census Bureau’s
1.1. ( a ) Como ejemplos de problemas de definición, se tienen las deci
Monthly Surveys. Proc. Soc. Stat. Sect. Am er. Stat. Assoc., 130-138,
siones de contar las letras en e l prólogo o en el índice y de cómo tratar a los
W oodruff, R. S. (197 1 ). A simple method fo r approximating the variance
símbolos matemáticos como "palabras". Sin embargo, en un libro como éste,
o f a compíicated estímate. Jour. Am er. Stat. Assoc., 66, 411-414.
con muchos símbolos matemáticos, parece poco probable que se quiera contar
Woolsey, T . D. (1956). Sampling methods fo r a small household survey. las palabras, ya sea incluyendo u omitiendo los símbolos, ( b ) ( 1) Las páginas
Pub. Health Monographs, Núm. 40.
constituyen un marco conveniente. Una desventaja de una página como unidad
de muestreo en la que contamos todas las palabras en una página de muestra
Yates, F. (1 9 4 8 ). Systematic sampling. P hil. Trans. Roy. Soc. London, A241, es que con numerosas ilustraciones, el número de palabras por página puede
345-377. ser muy variable, debido a las páginas incompletas. Quizá valdría la pena
Yates, F. (196 0 ). Sampling Methods fo r Censuses and Surveys. Charles Griffin primero poner en lista todas las páginas incompletas y form ar dos subpobla-
and Co., London, tercera edición. ciones o estratos de páginas incompletas y uno de páginas completas, mues-
Yates, F., y Grundy, P. M. (1 953). Selection without replacement from within treadas separadamente por el método de muestreo estratificado descrito en
strata with probability proportional to size. Jour. Roy. Stat. Soc., B15, el Cap. 5. ( 2 ) Un problema con el renglón es que el obtener una lista de ren
253-261. glones para que se puedan muestrear directamente los renglones, consumiría
mucho tiempo. También hay renglones incompletos al final de los párrafos.
Zarkovic, S. S. (196 0 ). On the efficiency o f sampling with various probabilities Sin embargo, como las palabras por renglón son más o menos estables en
and the selection o f units with replacement. Metrika, 3, 53-60. números, la solución podría ser el usar un muestreo en dos etapas (Cap. 11)
Zukhovitsky, S. I., y Avdeyeva, L. I. (1 9 6 6 ). Linear and Convex Programming. en el que se extraiga primero una muestra de páginas, y después se cuente
W . B. Saunders, Philadelphia. el número de renglones en cada página seleccionada y se extraiga una sub
muestra de renglones en estas páginas.
1.2. La cuestión supone que primero debemos extraer una muestra de tar
jetas con probabilidad igual, ( a ) Si los nombres de muestra que no están
en la población objeto se descartan, el único problema es que el tamaño de la
muestra de nombres a partir de la población objeto será generalmente más
pequeña que el número de tarjetas y además, será una variable aleatoria que
depende de las tarjetas elegidas, ( b ) El problema es que los nombres que apa
recen en varias tarjetas tienen probabilidades de selección más elevadas. Una
manera de tratar esto es contar el número de tarjetas en las que aparece un
nombre seleccionado y usar este número al hacer la estimación por métodos
apropiados a la selección con probabilidades desiguales (Cap. 9 A ). Otra ma
nera que da a cada nombre la misma oportunidad, pero que puede involucrar
muchos rechazos, es la de retener una tarjeta sólo si es la primera del con
junto en el que aparece el nombre, ( c ) T a l como en ( b ) los nombres se
seleccionan con probabilidades desiguales. N o se conoce un método fácil de
dar a cada nombre la misma oportunidad. Si el número de tarjetas en las que
aparece cada nombre se registró en alguna parte, se puede utilizar un método
de probabilidad igual como en (b ).
1.3. Como sugerencias tenemos: ( a ) un directorio reciente de almacenes
y de tiendas de equipajes, ( b ) las oficinas de artículos perdidos que hay en
las compañías de trenes subterráneos y de autobuses, y ( c ) hospitales y mé
498 T E C N IC A S I>E M UESTREO
RESPUESTAS A LOS EJERCICIOS 499
dicos privados en el área geográfica donde se presentan mordeduras de ser

100 cuando el número de propietarios de la muestra esté entre 19 y 81 será
piente, además de cualquier organización de salud pública donde se reportan suficiente, esta probabilidad es 0.94,
las mordeduras, son obligatorios. Las debilidades de los tres marcos son
posiblemente el estado incompleto más los costos elevados en ( c ) , si las mor 2.11. ( a ) 420; ( b ) 490; ( c ) ambos son insesgados; ( d ) estimación (b ).
deduras de serpientes son raras y no se reportan a un centro, ( d ) Una lista
3.2. 1 066, 1 334 dado por la aproximación normal, Ec. 3.19
de casas suele usarse como marco para seleccionar una muestra de familias.
Aunque habrá cierto estado incompleto (fam ilias con las que no es posible 3.3. Casi concluyente.
entrar en contacto) el problema mayor puede ser el de errores de medición.
3.6. ( a ) 76.2 ± 3.6% ; ( b ) 1 738 ± 280 familias.
1.4. Un problema es el estado incompleto debido a la nueva construcción.
3.7. 1 789 ± 268 familias.
E n una muestra de direcciones, los nuevos inquilinos usualmente pueden ser
tratados por el entrevistador que verifica para cualquier dirección de muestra 3.8. Como un resultado exacto,
si hay nuevos domicilios entre esta dirección y la siguiente en el directorio
y de ser así, in clu irá estos nuevos domicilios en la muestra. Podrían no men V (Á ,) _ N t 2nQ,
cionarse las áreas completas de nuevas construcciones en el directorio, lo V (A , ')= ,(1 - *-)«?, + P, n)
que requiere el desarrollo de un marco separado. Se prefiere sacar una mues Ahora N , = N ( 1 - ir ) y en muestras grandes it, = n ( l - •*-). E stas su sti.
tra de direcciones a extraer una lista de personas, porque las direcciones son tuciones dan el resultado apuntado. Para que V (Á ,)V (Á ,') sea pequeña, de
más permanentes. Sin embargo, por razones de gastos de viaje, la unidad bemos tener t ( 1 - Q ,)/ Q l grande. Esto significa que Q, debe ser pequeña:
de muestreo podría ser una manzana de la ciudad de la cual se seleccionaría en otras palabras, la proporción del grupo 1 que está en la clase C debe ser
una submuestra de viviendas. grande. Para una Qj dada, ir debe ser grande.
1.5. $80 390 y $82 970. 3.9. Todos dan A v = 13. Por la hípergeométrica, la probabilidad de no
unidades en C en la muestra es 0.0601 para A c = 32 y 0.0434 para A r = 13.
1.6. La probabilidad de confianza es aproximadamente de 0.054 (se encon
Por la binomial, P „ = 0.4507 y V T - fP c = 0.4114, dando A c. = 12,3. El
tró a partir de t = — 1.67 con 25 grados de libertad). Esto supone que los Ejercicio 3 de la Pág. 90 da 0.061 para A,- = 12 y 0.044 para Ac- = 13.
recibos futuros siguen la misma distribución de frecuencia que la muestra
de 26 recibos y que esta distribución es normal. 3.11. La estimación ( b ) parece más precisa.
1.7. Cuando el E C M se debe enteramente al sesgo, la estimación siempre 3.12. E l valor más alto es PQ/n en comparación con PQ/mn por la fórmula
es incorrecta por una magnitud de 1 V~ECM. La probabilidad de un error ma binomial. Esto sucede cuando todo conglomerado consiste enteramente de
unos o enteramente de ceros. El valor más bajo puede ser cero si todo con
yor que 1 V~ETCM es, por tanto, la unidad, y la probabilidad de un error
glomerado da la misma proporción P. (E sto es posible solamente para ciertos
mayor que 1.96 V E C M o mayor que 2.576 V E C M es cero. valores de P y ira.)
2.4. f = 51 473. Probabilidad cerca de 0.9. 3.13. La varianza es 0.00184 por el método de la razón y 0.00160 por la
2.5. Sí. o-(Y) es 98.4. fórm ula binomial,
2.8. y =20 2 38. .5(10 =849. 3.14. Tamaño promedio de la muestra = m/P.
2.7. ( a ) Público: P = 15.46. Privado: R = 12.75. (b) Público: s(A) = 4.1. 735 casas. Se necesita este tamaño de muestra para casas con dos
coches si P = 10%.
0.761. Privado: s(JR) = 0.727. Para la cpf tomamos f = 100/468. (c) 14.2<
R < 16.7. 4.2. Aproximadamente 260 hojas.
2.8. E>if./e.e.mf = 2.71/1.186 = 2.28. P cerca de 0.023. Note que no se usa 4.3. ( a ) 2 475; ( b ) 4 950.
la cp f en el cálculo de e.e.drt.
4.4. n — 21 (tom ando t = 2 ).
2.9. (a) 9 408, e.e. = 780; (b) 9 472, e.e. = 1 104.
4.5. ii =■ 48-1. Para el número de sin empleo, el cv sería aproximadamente
2.10. E.e. (en 1 000'es) = (a) 14 800; (b) 3 900; (c ) 3 140. de 15%.
2.11. 9.2 (a) 2.7; (b ) 2.4. 4.6. 62 más.
2.12. (a) n = 60, con 30 de cada grupo; (b) n = 80 será suficiente si el 4.7. (a ) n = 278; (b ) n = 2315; ( c ) n = 3046.
número de propietarios en la muestra está entre 20 y 60. Con n = 80, la
4.8. Si se supone una distribución rectangular dentro de cada clase, to
probabilidad de que esto pase es 0.54 (de las tablás binomiales). Con n =
mamos S2 - 0.083b2 o S = 0.29b. Esto da estimaciones de 230, 580, 2 030 y
500 TE C N IC A S BE M U ESTRE O RESPU ESTAS A LOS EJERCICIOS 50 1
11 600 en las cuatro clases. Si se usa la distribución de triángulo rectángulo 5A.7. W , = 0.728, W 2 = 0.272, S, = 1.806, S2 = 4.698 (en la escala codi
en la cuarta clase, tomamos S = 0.24H, lo que da 9 600 para esta clase. fica d a ). ( a ) Loo tamaños óptimos de muestra son re, = 0.507n, n„ = 0.493re.
/ UNS \ 2 /3 (b ) V(y) = 3 1 .9 5 /re, V¿p,(y„)= 6.72/re.
4 U' ' 5A.8. ( i ) J '//(y) dy = j V2(l - y )d i = 2v/2[l —(1 —a)3,2]/3. Por lo tanto, queremos
5.1. ( a ) L a asignación de Neym an da re, = 0.87, n2 — 13.13. ( b) Hay tres
posibles estimaciones bajo asignación óptima y nueve bajo asignación pro U - (1 - a y r.] „ l/2.
porcional. =¿=0.167: Vprop(y „)= £ = 0.583. (d ) Fórmula 5.27 da 5A.9. En el Ejercicio 5A.7, W , = 0.728, como en la regla de Dalenius-
0-159. Hodge, se acerca lo más a la regla de Ekman. En el Ejercicio 5A.8, la regla
de Ekman, da a = (3 — V 5 )/ 2 = 0.38.
5.2. ( a ) re, = 375, n2 = 625; ( b ) n , = 750, n2 = 250.
5A.10. Las óptimas son L = 7 para p = 0.95, L = 5 para p = 0.9 y
5.3. RP = 181% para asignación proporcional y 214% para asignación
L = 4 para p = 0.8. Y a sea L = 5 o L = 6 son un buen compromiso.
óptima.
5A.11. (a ) La ganancia en precisión es cerca de 110%. ( b ) La ganancia
5.5. Los aumentos relativos máximos ocunen cuando W , = W 2 e igual de estratificación proporcional sobre muestreo aleatorio simple es cerca de 90%.
0.029 para c2/c i = 2 y 0.111 para c2/c i =4.
5A.12. Aumentar re, como se sugiere, dejando n2 = 400. Requerimos n, —
5.6. ( a ) n,/n = l/3, n2/n = %; (b ) re = 264, n, = 88, n2 = 176; (c ) 140, dando n = 540.
$1 936.
6.1. Para la estimación de razón V (Y R) = y para la expansión
5.7. ( a ) $2 288 contra $1 936. ( b ) N o. El costo de campo mínimo para simple V (Y ) = N - ( l — f ) S ¿v/n, donde d = (y — R x ). Para la muestra de
21 familias las estimaciones de y Sp2 son las siguientes. Número de h i
reducir V a 1 es $2 230.
jos, sd* = 0.49, = 1.61; número de coches, sd2 = 0.41, s„2 = 0.39; núme
5.8. ( a ) re, = 384, re2 = 192; ( b ) re, = 400, re* = 1 600; ( c ) re, = 1200, ro de receptores de TV, slC- = 0.51, sy- = 0.45. La estimación de razón parece
re2 = 2 400. ser superior para los hijos.
6.2. Ganancia = 6 6 % . Cuando menos 11 unidades por el método de razón.

5.9. Aumento fraccionario = %.
6.3. Límites cuadráticos (2 7 100, 29 870); límites normales (2 7 030,
5.10. re, - 541, re2 = 313, re, = 146. 29 700).
5.12. En población 1, VpTOp - 0.143/rc; - 0.134/re. En población 2, 6.4. Aplique el Teorema 6.3 a la estimación de R = Y/X. Con muestras
Vprop = 0.0491/re, Vdj)¡ = 0.0423/re. La reducción en varianza de asignación grandes, use y fX si r < ( c v de x )/ 2 (c v de y ) y use y/x de otra manera,
óptima es cerca de 6% en población 1 contra 14% en población 2. donde r y los cv son estimaciones de muestras.
5.14. ( a ) Si conjeturamos P, = 45% , P 2 = 25% , P, — 7.5% como un con 6.5. Los ECM son 46.5 para la estimación de razón separada y 40.6 para
venio, esto da re, = 268, re2 «= 116, re3 = 16; ( b ) e.e. = 0.0225; ( c ) e.e. = la estimación de razón combinada. E n ambos casos la contribución del sesgo al
0.0241. ECM es despreciable.
6.6. Para el método de Lahiri, V (£"*,) = 40.1.

5.15. A l aproximarse re a N , ¿alcanza una etapa en la que la fórmula
estándar nh a N h Sh para la asignación óptima de Neyman, no es ya aplicable, 6.7. Total de población estimado = 116.21 millones. La varianza relativa
porque ello requeriría nh > N h al menos en un estrato. Como se observó en es 0.00111, de tal manera que e l e.e. es (0.0333) (116.21) = 3.87 millones.
la Sec. 5.8, la fórmula (5 .2 7 ) deja de ser válida. El estudiante está en el La estimación está dentro de 1 e.e. del total verdadero.
error si afirma que (5 .2 7 ) es errónea siempre; la fórmula tiene un área lim i
6.8. Las estimaciones son ( a ) 1 896, ( b ) 1 660, ( c ) 1 689. En ( c ) encon
tada de aplicaciones, que sin embargo, las cubre casi todas.
tramos = 2.38, w2 = — 1.38. Los e.e. estimados son ( a ) 256, ( b ) 36.9,
5A.4. No- En cada uno de los peores casos [2(w(, - Vt^)?h]2 es (0 .1 0 5 )2 ( c ) 18.6. Para la estimación estándar en ( b ) se usó la fórmula
= 0.0110. Entonces, con estratificación, ECM (y,,), según lo da la fórmula e.e. = YR 1- f ) ( c „ + c j, - 2cyl)Jn. donde YR es la estimación de
(5 A .6 ) es 0.0108 + 0.0110 = 0.0218. Con muestreo aleatorio simple V('tf) razón de Y, esto es, 1 660. Para el e.e. en ( c ) se usó YMR = 1 689.
= 0.0177. 7.1. Estimación = 11 080; e.e. = 152 (incluyendo la c p f).
5A.6. ( a ) n = 1024. La asignación óptima para la segunda variable (can 7.2. N o, dado que b es muy cercano a 1.
tidad promedio invertida) satisface ambos requerimientos. 7.3. y lr = 28177 ± 570. La precisión relativa es 113%.
502 TE C N IC A S DÉ M U E S TR E O RE SPU ESTA S A XOS EJERCICIOS 503
7.4. 27 751 ± 694. 9A.4. ( b ) V{YnT) = 1.75, Vf,YM) = 0.27, V (YR„ C) = 0.33. En este proble
ma 1/,/Z; varía muy poco, pero Yht da resultados mediocres (relativam ente)
7.6. Para la estimación de la diferencia, V ( y ) = S3*/n; para la estimación porque con el método de selección de muestra 7r¡ 2 z4. E l estimador de Mur-
de la regresión lineal, V(yi,)= Se2S 2/n(S.2+Sy2). La estimación de la re thy se construye para este método de selección de muestra teniendo V (Y m )
gresión tiene la varianza menor, pero su superioridad no tiene importancia = 0 si i/j/Zj es constante, como lo muestra (9 A .6 0 ). ( c ) V ( rA1)/ V ( ) =
si S//S/ es pequeña. 0.54 en tanto que ( N — ? t)/ (N — 1 ) ' = y2.
7.7. E C M (Í '| „ ) = 34.5, Sesgo* = 9.7; E C M (Y lrc) = 11.9, Sesgo* = 1.2. 9A.5. E C M C ? * ,-^ ) = 7.06, (Sesgo)=/ECM = 0.065, V (Í"SS3) - 6.5
7.9. E C M (f í ( ) = 8.9, E C M (Y Bp) = 6.7. 10.1. ( a ) 2.00; ( b ) 2.13.
8.1. Las varianzas son 8.19 (sistem ático), 11.27 (aleatorio sim ple), 8.25 10.3. ( a ) 165/7!; (b)148.5/n; ( c ) 132/n.
(estratificado, 2 ), 7.46 (estratificado, 1). 10.4. ( a ) n = 660 campos; ( b ) n = 530 campos. La proteína requiere
8.2. V S,J3 = 0.00141, V rm = 0.00340. menos campos que rendimiento.
8.3. La muestra sistemática debería ser m ejor para la proporción de perso 10.5. Cj/c2 = 8.
nas de ascendencia polaca, dado que esta variable exhibe estratificación geo 10.7. ( a ) 0.93%; ( b ) 0.51% ; ( c ) 0.36%.
gráfica. Es probablemente inferior para la proporción de hijos porque el inter
valo de muestreo, 1 en 5, coincide con el tamaño promedio de una familia. Lo 10.8. ( a ) Cualquiera m 0 = 7 o m 0 = 8 es apropiado; ( b ) 89% para m 0
7 y 93% para m 0 = 8; ( c ) 86% para m0 — 7 y 89% para m a = 8.
mismo es cierto, aunque en menor medida, para la proporción de hombres.
11.2. La precisión relativa de I I I a 13 baja de 3.02 a 2.75. Si dos planes
8.4. Las varianzas son las siguientes. Hombres. V(rJ = 0.0204, V ajH =
de muestreo difieren principalmente en su contribución entre-unidades a la
0.0216; hijos, Vjrj = 0.0204, V a(/, = 0.0776; profesionales, V Jrl = 0.0192,
varianza, la precisión relativa del plan superior disminuirá en general con
V ,v, = 0.0016.
form e la razón de la varianza dentro-de-unidades con los aumentos de la
8.5. Varianza real *= 8.19. Método ( a ) da 11.29. Para el método ( b ) la varianza total.
varianza estimada de una sola muestra es (1 — f ) ( f it — y i ; ) 2/4, donde 11.3. La explicación es, dicho brevemente, que con estos datos las Y¡/z¡
y „,y (2 son las medias de las dos mitades. El promedio es 3.24. La subestima son más estables que las Y.¡/Mj. Si tomamos z¡ = y33, % 3, y 24/33, la contribu
ción seria es inesperada. ción entre-unidades en el método IV desaparecería.
8.7. Ambas varianzas son (fe* — l)/ 6 . 11.4. Varianza total: 0.00504 ( l a ) , 0.02358 ( I I ) , 0.00554 ( I I I ) .
8.8. E l muestreo aleatorio simple es mejor, a menos que n « 1 o fe = 1. 11.6. Porcentaje estimado 14.2 ± 2.16. Número estimado 3 540 ± 540.
8.9. Cada fc-ésima unidad, V ( Y ) = 362.2; Yates, E C M ( Y ) = 7 . 3 ; Sethi, 11.7. Porcentaje estimado 13.9 ± 2.49.
V ( Y ) = 21.0; Singh, y cois., V ( Y ) = 81.0. Los dos últimos estimadores son
insesgados en. este ejemplo. 11.9. ( a ) Total de habitaciones 29 400; total de personas 50 550; personas
por habitación 1.72; ( b ) e.e.: total de personas 2 440; personas por habita
9.1. Los costos relativos de usar los cuatro tipos de unidad son 100, 90.1, ción 0.066.
79.7 y 77.8 (tomando la primera unidad como estándar).
12.1. n = 267, n’ = 1 320 o n = 268, n' =■ 1 280. V (p 3t) con asignación
9.2. La precisión relativa de la fam ilia es 211% para la proporción de óptima es 6.67 cuando psl es en % . Con muestreo simple, V ( p ) = 8.33.
sexos y 38% para la proporción que ha visitado a un médico.
12.2. c,/cn' > 9.
9.3. La precisión relativa de la unidad grande es 0.566 con muestreo alea 12.3. n/n.' = 1/19.
torio simple y 0.625 con muestreo aleatorio estratificado.
12.4. n ' > 16n.
9.5. ( a ) M «= 5; (fc ) M = 1.
12.5. Por la fórmula (1 2 .6 7 ), e.e. = 1.25, al ignorar 1/N.
9.6. La M óptima debería disminuir porque el costo de viaje, el cual varía
con y 1n, se convierte relativamente en menos importante conforme jt aumenta. 12.6. Las ganancias en porcentaje de la segunda a la sexta ocasión son
50, 75, 91, 100 y 105, respectivamente.
9A.1. ( a ) 34 242; ( b ) 5 534; ( c ) 6 493.
12.8. Las valores de nV(y;")/ó2 y nV(y2')/S2 son los siguientes: p =
9A.3. ( a ) Si la d.e. entre unidades grandes en la ciase fe a M h. ( b ) Si la P - 0.8: 0.885, 0.875; p = % , p = 0.9: 0.843, 0.840; p = p = 0-8: 0.824,
probabilidad a 0.810; p = l/2, p = 0.9: 0.752, 0.746.
12.12. ( a ) Sea y¡ = 1 para toda unidad que tiene el primer atributo y

« = 0 en cero contrario y sea el estrato 1 el estrato en que cada unidad tiene
e l segundo atributo. En la rotación del Teorema 12.1, 12.2, con 1/N despre
ciable, S2 -= P ,Q l y S * - P,P2/ (P , + P2) 2- Los resultados de ( a ) se siguen
de los teoremas; ( b ) si C* es el costo esperado, al muestreo doble con v1 =
1/2, fe = 2 (e l óptim o) de V ( Y „ ) = N 2(0 .8 4 4 )/ C *, en tanto que una muestra
aleatoria simple da V (Y ') - N 2(1 .8 7 5 )/ C *. considerable.
13.1. ( c ) 90% de respuesta con 1 047 cuestionarios completos a 95% de

respuesta con 701 cuestionarios completos. *
Indice Alfabético
13.2. El método con 90% de respuesta cuesta $5 235. Con 95% de res
puesta cuesta $5.7895 por cuestionario completo o $4 058de costo total.
13.3. ( b ) 0.65no, 0.815n0, 0.8915no, 0.9351tio, O.9611n0;( c ) 100, 104, 108,

112, 117; ( d ) 300, 288, 277, 267, 256.
13.4. ( a ) Sesgo (e n % i = - 3.85, - 2.15, - 1.21, - 0.69, - 0.40;

( b ) las varianzas son 8.67, 9.03, 9.39, 9.74, 10.16; ( c ) cuatro visitas. — A — fórmulas de la variancia, 128-
132
13.6. Sí. VC para fe — 2 es solamente cerca de 2% sobre el m ínim o VC. Abreviaciones en la computación de
Asignación óptima en muestreo estra-
la variancia de la estimación
13.7. Estimación Politz-Simmons, 39.7% ; binomial, 42.3%. tificado;
de razón, 221
comparación con asignación pro
13.8. ( c ) Varianza = 0.1. Aleatorio, muestreo ver Muestreo alea
porcional, 136, 147
torio simple
13.9. Si el error de medición de cada enumerador fuese independiente de comparación con muestreo aleato-
fam ilia a fam ilia, la varianza de la media de la muestra sería (o y 2+-crd + Alistamiento de las unidades prima
torio simple, 136, 147
tr^ + cr/)/525 en lugar de (<r^2+ ad2+ 35<Th2+ 105«r,*)/525. Los sesgos del enu rias, efecto del costo sobre la
con estimaciones de razón, 220
merador contribuyen a cerca del 55% de la varianza total. probabilidad óptima de selec
con más de una característica, 160-
ción, 386
13.10. 10*V(iíA) = V(100ifA) = ( a ) 1.80 (D ire c to ); ( b ) 10.69 (W a rn e r); 165
Apareamiento en muestreo repetido
( c ) 3.30 (ir „ conocida); ( d ) 5.12 (M o o rs ); ( e ) 6.30 ( P 2 = 1 — P 2). con muestreo doble, 403
de la misma población, 441- de dos etapas, 346
13.11. ( a ) 104E C M (4 a ) = 3.81; 4AU es superior si irv es conocida, ( b ) 442
efecto de errores de:
10-'ECM(ita ) = 5.47; la probabilidad de dos preguntas ñAU es también superior Aproximación de Satterwhaitte a nú
en Sh, 155-157
si P2 = 0. ( c ) 10‘E C M (4 a ) — 7.64. Todos los métodos son superiores excepto mero de grados de libertad,
en tamaños de muestra, 157
el método original de Warner. 133
efecto de las desviaciones desde la
Asignación:
óptima (asignación), 155
de Neyman, 136
en muestreo para proporciones, 146
los mejores límites de estratos
estimación de datos previos, 139,
para, 169 173
proporcional en muestreo estratifi
para costo total fijo, 133-135
cado, 127
para tamaño fijo de muestra, 135-
autoponderación muestral, 127 136
comparación con asignación óp requiriendo un muestreo de más
tima, 136, 141, 147 del 100%, 142
comparación con muestreo alea Asimetría:
torio simple, 136, 147 coeficiente de asimetría, 70, 248
comparación con postestratifíca- efecto de la estratificación sobre la,
ción, 177 72
consejos para su uso, 141, 148 efecto sobre los límites de confian
en la estimación de proporcio za, 67
nes, 147 Atributos ver Proporciones
506 IN D IC E A LF A B E T IC O IN D IC E ALFABETICO 507
— c — Distribución Encuesta piloto de muestra sistemática, 259-265

binomial, 89 su uso al estimar tamaño de mues
Cambio, estimaciones del, 414, 426- de muestreo estratificado, 127-136
lím ites de confianza, 90 tra, 111
428 en muestreo conglomerado, 298
para proporciones de muestra, 85
nTTTTTTA
Características uso al estimar fracciones óptimas en muestreo de tres etapas, 352-
referencias a las tablas, 84 de muestreo y submuestreo, 349- 355
cualitativas, 79 ver también Propor
uso erróneo en muestreo por con
ciones, estimación de 351 de la regresión en muestreo estra
glomerados, 95-99 tificado, 251-254
raras, método de Haldane, 109 Encuestas
condicional, de proporciones, 92 del total de dominio, 61
Censo descriptivas, 23
hipergeométrica, 85 por correo, 189, 437, 448 en muestreo estratificado, 187
de los E.U.A., uso del muestreo,
como distribución condicional, 92 Entrevistador, sesgo de, 456, 476 del total de población estimado de
21-22
límites de confianza, 87 una muestra aleatoria simple,
uso del muestreo en, 21 modelos matemáticos, 455-458
referencia a tablas y gráficas, 87 49
Coeficiente E promedio sobre todas las muestras
normal, 29 del total en una población que pa
de correlación: posibles, 33
como aproximación a la hiper see cierto atributo, 82
con una muestra sistemática, 261 Errores de medición, 455
geométrica, 88 de m edia de dominio, 59-60
en poblaciones finitas, 200 efectos de errores no correlaciona
* como distribución lím ite de me en muestreo estratificado, 189-
intraconglomerados, 264 dos dentro de la muestra, 460
dias de muestra, 65-66 192
de regresión en población finita, efectos de la correlación entre erro
su validez con medias de datos de proporción-:
242 res, 462
continuos, 66-72 en muestreo aleatorio simple, 81-
de variación, 83 efectos del sesgo constante, 458
A A Ai H A l i i i i r r
utilización en encuestas, 32 84
Consistencia modelo matemático, 455-458
Doble muestreo, 339 en muestren conglomerado, 95-
definición, 45 resumen de los efectos, 464
estimaciones de razón, 417-418 99
de la media de muestra aleatoria técnicas para estudio de, 464-473 en muestreo de dos etapas, 344
Dominios de estudio (subpoblaciones),
simple, 45 utilización de muestras interpene
60 en muestreo estratificado, 145-147
de una estimación de razón, 198 comparaciones entre medias, 65 trantes, 469-472 sobre un dominio, 93-94
de una estimación de regresión, comparaciones entre proporciones y Errores en encuestas, tipos de, 321 de una razón en muestreo de dos
241 totales, 94 Error estándar etapas, 380
Corrección por continuidad, 88, 95 dominios que cruzan varios estra ( aproximado) de estimadores no Estimación
Correcciones tos, 186-188 lineales, 388 autoponderante, 127
finales, 270 estimaciones de medias y totales comparación de los métodos, 393- en muestreo de dos etapas, 371-
por población finita, (c p f), 49 (variable continua), 60-61 395 372, 373, 376, 387
en muestreo aleatorio estratifica estimaciones de proporciones y to método de la serie de Taylor, 389 compuesta en muestreo repetido,
do, 128 tales (la variable 0-1), 93-94 método Jacknife, 392 429
en muestreo de dos etapas, 342 estratos como dominios, 184 replic aciones repetidas equilibra de razón combinada, 212
regla para ignorarla, 49 tamaño requerido de la muestra, al estimar medias de dominios,
das, 390
Correlación intraconglomerado, 262 115-117 187
de la desviación estándar de una
Correlograma, 273 Dos etapas, muestreo de, ver Mues asignación óptima para, 220
muestra, 70
Costos de viaje, fórmula, 133 treo doble comparada con la estimación de
de la diferencia entre dos razones,
Covariancia de medias de muestra, 50 razón separada, 214
Cuadrado latino del movimiento de 229
en muestreo estratificado de dos
un caballo del ajedrez, 284 — E— ^ d e la diferencia entre medias de
etapas, 387
Cuadrático error medio, definición, 37 dominios, 65 lím ite superior al sesgo relativo,
E j, E„, promedios sobre las etapas de la estimación de razón, 58, 198-
justificación del uso del, 37 213
prim era y segunda, 341
relación con la varianza y el sesgo,
Efecto del diseño (D e f f ) , 45
202 multivariada, 234 f
¥
38 en muestreo estratificado, 211- varianza„ 213
Elementos, 56
214 varianza estimada, 214
£1 método Jacknife, 222
— D— de la estimación de regresión, 241, de regresión combinada, 253
para estimar la varianza de una 4
Desigualdad de Cauchy Schwarz, 134 razón, 227 245, 246 comparada con la estimación de
Desviación para la varianza de una estima de la media: regresión separada, 254 4
de muestra aleatoria simple, 48, varianza, 253
de la respuesta, 458
estándar sn población finita, 47
ción de una función no lineal,
392 50-51 varianza estimada, 254 •
(1
OVO IN W IO J S A W M ftlW V » IN D IC E A LFA B E T IC O 509
insesgada, definición, 33 varianza en muestra grande, 55, — F— — K—

simple, 216 198
varianza estimada, 58, 201, 227 Factor Keyfitz, método abreviado para esti
Estimaciones
de expansión, 45 mación de varianza, 217-219
de varianzas de población: ver tam bién: Estimación de ra
zón combinada; Estimación se de inflación, 45
efectos de errores en S„ sobre
parada de razón Fracción de muestreo, 45 — L _
la precisión del muestreo estra
de regresión, 239 primera etapa, 342
tificado, 155 segunda etapa, 343 La m ejor estimación insesgada, 204
para determinar el tamaño de comparado con estimador de ra Límites
Fronteras de estratos, regla para su
muestra, 111 zón, 246
determinación, 169-173 cuadráticos de confianza para es
visuales, 239 comparado con media por uni
Función timación de razón, 202
Estimador dad, 246
de costo: de confianza, 33
de razón, 56, 195 condiciones para que sea inses
para el número de estratos, 176 condicionales, 91
ajustes para disminuir e l sesgo, gado, 250
con pendiente preasignada, 241 al determinar la fracción ópti definición para atributos, 87
222 ma de muestreo para no res efecto de la no respuesta sobre,
asignación óptima en muestreo efecto del error en la pendiente,
pondientes, 448 436-440
estratificado, 220 242
en muestreo aleatorio estratifica al determinar la fracción ópti efecto del sesgo en, 36
como caso especial de estima ma de submuestreo, 346, 382
do, 252, 253 en muestreo aleatorio estratifi
ción de regresión, 241 al determinar probabilidades óp cado, 132
en muestreo doble, 412
comparado con estimación de re timas de selección de unidades para estimaciones de razón, 202
en muestreo repetido de la mis
gresión, 246 primarias, 380-388
ma población, 420-431 para medias en muestreo alea
comparado con media por uni en la determinación del tamaño
exactitud de la varianza de mues torio simple, 52
dad, 203 de muestra, 117
tra grande, 247 para proporciones o porcentajes
comparado con muestreo estra en la determinación del tamaño
producto, 235 87-90
tificado, 216 óptimo de la unidad conglo
sesgo, 249 validez de la aproximación nor
condiciones óptimas para, 207 merada, 302 mal, 66-72
utilizaciones del, 239
condiciones para que sea inses en muestreo aleatorio estratifi
varianza en muestras grandes,
gado, 204 cado, 133
245 — M—
consistencia, 198 en muestreo de dos marcos, 189
varianza estimada, 245
cota superior a sesgo relativo, en muestreo doble: Marco, 26
ver también estimación combina
209 da de regresión; Estimación con estratificación, 404 estimaciones cuando el marco tie
en muestreo aleatorio estratifica para comparaciones analíticas, ne unidades fuera de la po
separada de regresión
do, 211 408 blación objeto, 63-64
de regresión lineal, ver Estimador-
en muestreo conglomerado, 56, para estimaciones de regre muestreo de dos marcos, 189-190
de regresión
97 sión, 415 Media de la muestra, propiedades
Estimados de Horvitz-Thompson, 321-
en muestreo doble, 416 323 de la varianza, 300 óptimas de la, 72-73
en muestreo estratificado de dos de pérdidas, 117, 162
Estratificación, 125 Mediciones repetidas, 466, 472
etapas, 387 doble, 165 Medida de homogeneidad, 307
error estándar para comparación efecto del número de estratos en la — G— Método
de dos razones, 229 precisión, 174 Grados de libertad de la serie de Taylor, 389
estimación de Hartley Ross, 222 efecto en la normalidad de la va número efectivo en muestreo es de respuesta aleatorizada, 473-474
estimación de la varianza por riable, 72 tratificado de, 133 original de Warner, 474
método jackknife, 224 geográfica, 140 otras variantes, 477
estimaciones insesgadas de tipo construcción de los estratos, 174 — H— segunda pregunta n o relaciona
razón, 222 ganancias en precisión, 140-141 da, 475
Hueso duro en no-respuesta, 440
exactitud de variancia aproxima la m ejor variable para una, 139 Métodos
da, 209 Estratos, 89 de estratos contraídos, 182, 282
límites de confianza, 202 construcción de, 169-174 de Politz y Simmons para tratar la
método de Lahiri, 226 número óptimo de, 174-177 Indice de inconsistencia, 468 no respuesta, 452-455
multivariado, 234 Etiquetas ( o rótulos), 72 Items ( ver también Características y Miembro aleatorio en un domicilio,
sesgo de, 207-209 Expansión, factor de, 45 atributos), 44 método de selección, 442
IN D IC E A L F A B E T IC O 509
508 IN D IC E A L F A B E T IC O
varianza en muestra grande, 55, — F— — K—

insesgada, definición, 33
simple, 216 198 Keyfitz, método abreviado para esti
Factor
Estimaciones varianza estimada, 58, 201, 227
de expansión, 45 mación de varianza, 217-219
de varianzas de población: ver también: Estimación de ra
de inflación, 45
efectos de errores en Sh sobre zón combinada; Estimación se — L—
Fracción de muestreo, 45
la precisión del muestreo estra parada de razón
primera etapa, 342
de regresión, 239 La m ejor estimación insesgada, 204
tificado, 155 segunda etapa, 343
comparado con estimador de ra Límites
para determinar el tamaño de Fronteras de estratos, regla para su
zón, 246 determinación, 169-173 cuadráticos de confianza para es
muestra, 111
comparado con media por uni timación de razón, 202
visuales, 239 Función
dad, 246 de costo: de confianza, 33
Estimador
condiciones para que sea inses condicionales, 91
de razón, 56, 195 para el número de estrátos, 176
ajustes para disminuir el sesgo, gado, 250 definición para atributos, 87
al determinar la fracción ópti
con pendiente preasignada, 241 efecto de la no respuesta sobre,
222 ma de muestreo para no res
efecto del error en la pendiente, 436-440
asignación óptima en znuestreo pondientes, 448
242 efecto del sesgo en, 36
estratificada, 220 al determinar la fracción ópti
en muestreo aleatorio estratifica
como caso especial de estima ma de submuestreo, 346, 382 en muestreo aleatorio estratifi
do, 252, 253 cado, 132
ción de regresión, 241 al determinar probabilidades óp
en muestreo doble, 412
comparado con estimación de re timas de selección de unidades para estimaciones de razón, 202
en muestreo repetido de la mis
gresión, 246 primarias, 380-388 para medias en muestreo alea
ma población, 420-431
comparado con m edia por uni en la determinación del tamaño torio simple, 52
exactitud de la varianza de mues
dad, 203 de muestra, 117 para proporciones o porcentajes,
tra grande, 247
comparado con muestreo estra en la determinación del tamaño 87-90
producto, 235
tificado, 216 óptimo de la unidad conglo validez de la aproximación nor
sesgo, 249
condiciones óptimas para, 207 merada, 302 mal, 66-72
utilizaciones del, 239
condiciones para que sea inses en muestreo aleatorio estratifi
varianza en muestras grandes,
cado, 133 — M—
gado, 204 245
consistencia, 198 en muestreo de dos marcos, 189
varianza estimada, 245 Marco, 26
cota superior a sesgo relativo, en muestreo doble:
ver también estimación combina
con estratificación, 404 estimaciones cuando e l marco tie
209 da de regresión; Estimación
en muestreo aleatorio estratifica para comparaciones analíticas, ne unidades fuera de la po
separada de regresión
408 blación objeto, 63-64
do, 211 de regresión lineal, ver Estimador
en muestreo conglomerado, 56, para estimaciones de regre muestreo de dos marcos, 189-190
de regresión sión, 415
97 Media de la muestra, propiedades
Estimados de Horvitz-Thompson, 321-
en muestreo doble, 416 de la varianza, 300 óptimas de la, 72-73
323
de pérdidas, 117, 162 Mediciones repetidas, 466, 472
en muestreo estratificado de dos Estratificación, 125
etapas, 387 doble, 165 Medida de homogeneidad, 307
— G— Método
error estándar para comparación efecto del número de estratos en la
de dos razones, 229 precisión, 174 Grados de libertad de la serie de Taylor, 389
estimación de Hartley Ross, 222 efecto en la normalidad de la va número efectivo en muestreo es de respuesta aleatorizada, 473-474
estimación de la varianza por riable, 72 tratificado de, 133 original de Warner, 474
método jackknife, 224 geográfica, 140 otras variantes, 477
estimaciones insesgadas de tipo construcción de los estratos, 174 — H— segunda pregunta no relaciona
razón, 222 ganancias en precisión, 140-141 da, 475
Hueso duro en no-respuesta, 440
exactitud de variancia aproxima la M ejor variable para una, 139 Métodos
da, 209 Estratos, 89 de estratos contraídos, 182, 282
límites de confianza, 202 construcción de, 169-174 d e Politz y Simmons para tratar la
método de Lahiri, 226 número óptim o de, 174-177 Indice de inconsistencia, 468 no respuesta, 452-455
multivariado, 234 Etiquetas (o rótulos), 72 Items (v e r también Características y Miembro aleatorio en un domicilio,
Expansión, factor de, 45 atributos), 44 método de selección, 442
sesgo de, 207-209
IN D IC E A L F A B E T IC O 513
512 IN D IC E A L F A B E T IC O
Regla de V T cumulativa, 171 do, 143, 148

efecto de la estratificación sobre Precisión en contraste con exactitud Regresión separada, estimación de, método de Cox para muestreo de
la, 72 38 252 dos etapas, i 11-112
efecto sobre los límites de con relativa, 136 comparada con la estimación com minimizando pérdidas, costo más
fianza, 67 método de cálculo, 141 binada, 254 pérdida por errores, 117
frecuentemente encontrada en la Preguntas delicadas, 473-474 confiabilidad con sesgo, 253 para aproximación normal a lí
práctica del muestreo, 67 método de respuesta aleatorizada, varianza, 253 mites de confianza de propor
respuesta, 436 372-477 varianza estimada, 253 ciones, 69-72, 88
efecto de revisitas, 442-448 Probabilidad proporcional al tamaño Relativa, precisión, 136 para aproximación normal a lí
efecto en límites de confianza, ppt, (m uestreo de una etapa), método de cálculo, 141 mites de confianza para datos
437-440 311 Replicaciones repetidas equilibradas, continuos, 69-72
efecto sobre la varianza en mues comparada con probabilidades igua 390 para comparaciones entre domi
treo estratificado, 188 les, 316-320 Revisitas, 442 nios, 117
fracción óptima de muestreo en método de extracción de muestra, costo relativo, 443-444 para medias sobre dominios, 115
tre no respondientes, 448-452 310 efectos en razón de respuestas, 442 óptimo de la submuestra:
método de Politz y Simmons, selección sin restitución, 320 modelo matemático, 444 unidades primarias de mismo ta
452- 455 Proporciones, estimación de, 79 política óptima, 447-448 maño, 346
razones para, 441 con más de dos clases, 90, 91 reentrevistas en el estudio de erro unidades primarias de tamaños di
sesgo producido por, 436-438 efecto de la P de población en la res de medición, 465-466 ferentes, 382-386
sesgado según modelo, 204 precisión, 83 Teoría, en encuestas por muestreo, 28
Notación efecto de no respuestas, 437 — S—
para errores de medición, 455-458 en muestreo aleatorio estratificado, Selección — U—
para estimaciones de razón, 196 145-150 a propósito, 32 Unidad de muestreo, definición, 26
para muestreo aleatorio simple, 44 en muestreo aleatorio simple, 79, controlada, 165 Unidades primarias de muestreo, 339
para muestreo en dos etapas, 342 99 Sesgo Usos de las encuestas por muestreo,
para muestreo estratificado, 126 en muestreo conglomerado, 95-99, debido a errores en pesos de estra 21-23
para proporciones, 79, 93 304 tos, 157 en censos de cada diez años, 21-22
para varianzas de estimaciones, 52 en muestreo de dos etapas (unida de estimador de razón, 207 en la investigación del mercado, 21
Números aleatorios, 42 des de mismo tam año), 344 de estimador de regresión, 249 en sondeos de opinión, 23
en muestreo de dos etapas (unida definición, 34 para los negocios y la industria, 22
_ 0 —
des de tamaños desiguales), del entrevistador, 457 por países miembros de la O.N.U.,
Objeto de población, 24 380 en pequeñas unidades de área, 289 21
en muestreo doble, 403 por no respuesta, 436-438
— P—
uso deliberado de procedimientos
tamaño de muestra para, 105
Pasos a seguir en una encuesta por sesgados, 34-37 “ Valor correcto", 455
Prueba preliminar, 27
muestreo, 24 Subpoblación, ver Dominios de estu Variación periódica, efecto en el mues
Población, 24 dio treo sistemático, 271
— R—
muestreada, 25 Subunidades (elem entos), 289 Varianza
objeto, 25 Razón Suprapoblación, 204 de estimaciones muéstrales, ver
Poblaciones autocorrelacionadas, 273 de dos estimadores de razón, 232 Error estándar
Porcentaje óptimo apareado en mues separada, estimación de, 211 definición de S2 y a-, 46, 49
treo repetido, 422, 425 asignación óptima, 220 Tamaño de población, estimaciones antici
Porcentajes, estimación de, ver Pro comparada con la estimación de la muestra para límites especi padas, 110-114
porciones, estimación de combinada, 214 ficados de error: de respuesta, 458
Postestratificación, 177 confiabilidad con sesgo, 212 análisis del problema, 105 componente correlacionada, 463
comparada con asignación propor varianza, 212 con atributos raros, 108 simple, 463
cional, 177 varianza estimada, 214 con datos continuos, 109 total, 463
Ppt (e n muestreo de dos etapas), 363, Reconocimientos analíticos, 23 ver con más de una característica, simple de respuesta, 463
377 también Dominios de estudio 114 total de respuesta, 463
comparada con probabilidades igua Reentrevistas en el estudio de errores con proporciones, 107 Ventajas del muestreo, 19-20
les, 367-379 en muestreo aleatorio estratifica Verificaciones de registros, 465
de medición de revisitas, 465,
selección sin restitución, 377 466

Técnicas de Muestreo - William G. Cochran-FreeLibros - Me

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Técnicas de Muestreo - William G. Cochran-FreeLibros - Me

Cargado por

Copyright:

Formatos disponibles

TECNICAS

COM PAÑIA EDITORIAL C O N TIN E N TAL, S. A. MEXICO

ESPAÑA - AR G E N TIN A - CHILE - VENEZUELA - COLOMBIA

B olivia — Brasil — Costa Rica — D om inicana — Ecuador — E l Salvador — Estados Unidos

1.1 Las Ventajas del Método de Muestreo ......... 19

2.1 Muestreo Aleatorio Simple .................................. 41

Cap. Pág. Cap. Pág.

Cap. Pág. Cap. Pág.

Cap. Pág- Cap. p ág.

10.3 Varianza de la Media Estimada en Muestreo de

13 FUENTES DE ERROR EN LAS ENCUESTAS ............ 435

investigación de operaciones. Los libros de Deming (1 9 6 0 ) y Slonim

La discusión precedente presupone que cr¿, según se calcula de

1.8 E L SESG O Y SUS EFECTOS

En la teoría de las encuestas por muestreo es necesario consi­

0.02 0.0238 0.0262 0.0500

En el uso de estos resultados se deben distinguir las dos fuen­

Muestreo Aleatorio Simple

El muestreo aleatorio simple es un método de selección de n

2.3 D E F IN IC IO N E S Y N O T A C IO N El símbolo * identifica una estimación muestral de una carac­

y también que Corolario 3. El error estándar de Y es

£ [ (y , - Y)(y 2 - Y ) + ( y . - v ) ( y 3- ? ) + • • • + < y . - i - *)(y« - ? ) ] NS

+ - - - + (yN . l - y ) ( y N - Í Ó ] (2-11) 2.6 L A CO R R EC C IO N PO R P O B L A C IO N F IN IT A

Prueba. Aplicando el Teorema 2.2_ a la variable u¡ = y¡ + x*. Prueba. Podemos escribir:

E [(y - f ) + ( x - X ) 3 2 = ^ ^ ¿I[(y ¿ - D + (*, - X ) ] 2 (2.16) S° ble Ias s o p le s al azar

por definición de S*. Además, por el Teorema 2 .2 ,

2.7. E S T IM A C IO N D E L ERROR E S T A N D A R (2.19)

I(y ,- iÓ 2 varianza verdadera: V(y) = o--2

Yt; = y + VTi l y W ' <2-23>

Probabilidad de confianza ( % ) 50 80 90 95 99 T A B L A 2.2

0.67 1.28 1.64 1.96 2.58

Cov (a,a¡) = E(a¡al) - E ( a i)E (a í) Cov (»/>) = — ( 2. 34)

n (n -l) Y « V - _______ 1 ( l- - ) (2.27)

V (y )= - ^ f Z y.-2V(Oi) + 2 1 y,y¡ Cov (a,a,)l (2.28)

Teorema 2.5. Si las variables y¡, x, son medidas en cada unidad

V ( R ) = j p E ( y - R x ) 2= ~ (1 - / ) (2 .4 4 ) D o r ^ r r Y 6 eSÜma ( a ) ,el Pr0medi0 de gaSt0S sem M ales en alimentos

estimaciones^116 " “ aUmen,° ' Cakule los errores «t á n d a r de estas

i (yi - R x ¡ ) 2 T A B L A 2.3. T a m a ñ o , I ngreso S e m a n a l y C o s t o d e Al i m e n t o s

lizando la Ec. (2.47) N—Nj^n—nt * N¡Cn¡

de las cuales se realizan estimaciones diferentes. En una encuesta de en donde

2.13 E S T IM A C IO N E S D E T O T A LE S EN Este resultado demuestra que la estimación Y, como se define

A l calcular s' consideramos nuestra muestra de 180 observaciones con

Si se identifican las unidades no nulas, sacamos de ellas una

Se obtiene una ecuación semejante a (2 .6 7 ) para pruebas de sig­

que sucede usualmente a los límites y probabilidades de confianza

y — 1.96sji< Y < y + 1.96s¡,

está equivocada, es generalmente más alta que el 5% .

es mayor que 2.5% .

es m enor que 2.5%.

Como una ilustración, consideremos una variable y que la pode­

Sea n = 400, P - 0.1. Entonces Y ~ 0.1 Ji. Al probar encontra­

Puesto que G1 - 1.9, tomamos como una n mínima

Px (postulado de confianza equivocado) = 0.0574

La probabilidad total de estar equivocado no está muy lejos de Intervalos Escala

te siempre que sea posible.

Y. y = 2138, Z y : = 131682 50-100 105 550-600 2

Ys = y + c si la muestra contiene y ( pero no y v

Y „ = ( y , + 6y 2+ y8)/8 En algunas ocasiones deseamos estimar el número total, la pro­

Número de unidades en C en Proporción de unidades en C en

La estimación muestral de P es p, y la estimación muestral de A es

X y,2 = A = NP, X y,2= a = np ■w = ; n r <3-9>

1 ( N P - N P 2)= -r ^ -r P Q (3.4) v (p )- s' 2 = ^ é ñ t3-1»

En la teoría de las encuestas por muestreo es necesario consi

En el uso de estos resultados se deben distinguir las dos fuen

2.3 D E F IN IC IO N E S Y N O T A C IO N El símbolo * identifica una estimación muestral de una carac

Se obtiene una ecuación semejante a (2 .6 7 ) para pruebas de sig

Como una ilustración, consideremos una variable y que la pode

Sea n = 400, P - 0.1. Entonces Y ~ 0.1 Ji. Al probar encontra

Y „ = ( y , + 6y 2+ y8)/8 En algunas ocasiones deseamos estimar el número total, la pro

donde f = n/N y t es el desvío normal correspondiente a la proba A l ~ f ) p q / ( n - l ) = '/(0.8)(0.37)(0.63)/99 = 0.0434

Esta es una distribución hipergeométrica ordinaria para una mues

Si el tamaño de un conglomerado no es constante, sea m ¡, el núme

la población (Cap. 5 ) de'm odo que dentro de un estrato, el inter E ncuestas R e g io n a l e s

Se planea una encuesta para estimar características de área con un coefi

En el muestreo estratificado, la población de N unidades se di

Las subpoblaciones se denominan estrato¿ Para obtener todo el bene

Teorema 5.9. Con el muestreo aleatorio estratificado, la va N ^ ^