Explora Libros electrónicos
Categorías
Explora Audiolibros
Categorías
Explora Revistas
Categorías
Explora Documentos
Categorías
DE MUESTREO
WILLIAM MENDENHALL
LYMAN OIT
Merrell Research Center
Traductores:
Grupo Edibrial
Mo AfOac 32 - Alevia nF
a-B,mncs
Versión en español de la obra Elementary Survey Sampling - Third Edition, por
Richard L. Scheaffer, William Mendenhall & Lyman Ott Edición original en
inglés publicada por PWS Publishers, Copyright@1986, en Estados Unidos de
América. ISBN 0-87150-943-1
D. R. @1987 por Grupo Editorial Iberoamérica, S.A de C.V. y/o
Wadsworth Internacional/Iberoamérica, Belmont, California 94002
Ninguna parte de este libro puede ser reproducida, archivada o
transmitida en forma alguna o mediante algún sistema, ya sea
electrónico, mecánico, de fotorreproduceión, de almacenamiento en
memoria o cualquier otro, sin el previo y expreso permiso por escrito de
Grupo Editorial Iberoamérica y/o Wadswofih
Internacional/lberoamérica, división de Wadsworth, Inc.
ISBN 968-7270-20-9
Impreso en México
PRÓLOGO
La obra Elementos de Muestreo es un texto introductorio sobre el diseño y análisis
de encuestas por muestreo, dirigido a estudiantes de administración, ciencias
sociales y ciencias biológicas. El único requisito es haber tomado un curso
elemental de estadística. La gran cantidad de ejemplos, con soluciones, lo hace
también adecuado para usarse como un texto adicional para cursos de mayor nivel.
Ya que el texto está dirigido a estudiantes con limitada preparación en
matemáticas, se hace hincapié en los aspectos prácticos de los problemas de las
encuestas. Cada capítulo presenta un diseño de muestreo de encuestas o un método
viable de estimación, mediante la descripción de un problema practico pertinente,
y luego explica la conveniencia de la metodología propuesta. Esta introducción va
seguida de un procedimiento de estimación apropiado y de una presentación
resumida de las fórmulas, para luego resolver un problema práctico. La naturaleza
de este texto no es en su totalidad un recetario de cocina. Se presentan
explicaciones que apelan a la intuición de los estudiantes para justificar muchas de
las fórmulas y para fundamentar la elección de un diseño de muestreo particular.
Se han seleccionado ejemplos y ejercicios de muchos campos de aplicación. Las
respuestas, dadas para algunos ejercicios seleccionados, pueden estar sujetas a
pequeños errores de redondeo debido a la complejidad de algunas de las fórmulas.
Las secciones de "Experienciascon datos reales" , que se encuentran al final de
la mayoría de los capítulos, sugieren maneras de cómo puede el estudiante resolver
problemas de muestreo reales. Los proyectos de estos problemas pueden ser grandes
o pequeños; algunos requieren cálculos por computadora. Hemos visto que son
expe. riencias de aprendizaje valiosas para estudiantes que toman un curso de
muestreos El trabajo en proyectos reales obliga al estudiante a considerartodos los
aspectos de
RQÕLOGO
Richard L. Scheqffer
William Mendenhall
Lyman Ott
PRÓLOGO
LA EDICIÓN
EN
ESPAÑOL
Hasta ahora el empleo del muestreo probabilisticoha requerido especialistas muy
bien preparados en la estadística matemática, con amplio dominio de los aspectos
teóricos y con una gran intuición derivada de la práctica y experiencia
profesionales. Sin embargo, la correcta utilización de las técnicas del muestreo se
ha hecho indispensable para los profesionales de las ciencias sociales, la
administración, las ciencias biológicas y otras en donde cada día aumenta la
necesidad de diversificar y profundizar los estudios, y donde el muestreo juega un
papel de gran importancia y utilidad por su c ar & ter de rapidez y economía.
Este libro es un intento afortunado de proporcionar una conexión entre el
análisis de la información estadística para la toma de decisiones y el problema
práctico de la obtención de datos, al que necesariamentese enfrenta el estudiante y
el investigador en las diversas áreas del conocimiento.
El lector quedará convencido de la importancia de la correcta aplicación de
las diferentes técnicas del muestreo probabilístico para obtener los datos
necesarios para hacer inferencias estadísticas correctas, es decir, con una validez
científica sólida.
Los autores presentan las técnicas y los problemas del muestreo con ejemplos
y aplicaciones en una gran variedad de disciplinas, lo cual estimula al estudiante y
le
-4roporciona una idea clara sobre qué hacer en la vida real para llegar a soluciones
prácticas, económicas y eficientes. El libro es entonces un valioso complemento de
consulta para otros que tratan el muestreocon mayor profundidad y formalidad
teórica.
La presentación del contenido, con poca profundidad matemática, es clara y
hace el mayor énfasis en los aspectos prácticos que se deben resolver en las
anpstas por muestreo. El tratamiento de los temas es gradual; inicia con los
conceptcx elãten— tales, continúa con la presentación de los diferentes diseños
generales del
viii PRÓLOGO A IAEDICON BIESPAÑOL
CONTENIDO
Prólogo
Al estudiante
4 INTRODUCCIÓN
2 REVISION DE CONCEPTOS BÁSICOS 5
2.1 Introducción 5
2.2 Resumen de la información en poblaciones y muestras 6
2.3 Distribuciones de muestreo 9
2.4 Covarianza y correlación 13
2.5 Estimación 14
2.6 Resumen 16
Ejercicios 16
3 ELEMENTOS Da 49
3.1 Introducción 19
3.2 Términos técnicos 20
3.3 Cómo seleccionar la muestra:
el diseño de la encuesta pormuestreo 22
3.4 Fuentes de error en las encuestas 24
3.5 Métodos de recolección de datos 27
3.6 Diseño de un cuestionario 29
3.7 Planeación de una encuesta 35
3.8 Resumen
Ejercicios
x CONTENIDO
39
4 MUESTREO IRRESTRICTO ALEATORIO
4.1 Introducción 40
4.2 Cómo seleccionar una muestra irrestricta aleatoria 42
4.3 Estimación de una media y un total poblacionales 43
4.4 Selección del tamaño de muestra para la estimación
de las medias y totales poblacionales 52
4.5 Estimación de una proporción poblacional 55
4.6 Muestreo con probabilidades proporcionales al tamaño 60
4.7 Resumen 66
Ejercicios 67
Experiencias con datos reales 74
77
5 MUESTREO ALEATORIO ESTRATIFICADO
78
5.1 Introducción
5.2 Cómo seleccionar una muestra aleatoria estratificada 80
5.3 Estimación de una media y un total poblacionales 82
5.4 Selección del tamaño de muestra para estimar las
medias y totales poblacionales 85
5.5 Asignación de la muestra 88
5.6 Estimación de una proporción poblacional 96
5.7 Selección del tamaño de muestra y asignación de la
muestra para asignar proporciones 98
5.8 Comentarios adicionales sobre muestreo estratificado 103
5.9 Una regla óptima para formar los estratos 107
5.10 Estratificación después de seleccionarla muestra 109
5.11 Resumen 111
Ejercicios 112
Experiencias con datos reales 118
al tamaño 217
8.9 Resumen 220
Ejercicios 221
Experiencias con datos reales 229
9 MUESTREO coanv8UDOS
ETAPAS 231
9.1 Introducción 232
9.2 Cómo seleccionar una muestra por conglomerados en dos etapas
CONTENIDO
9.3 Estimación insesgada de una media y un total poblacionales 234
9.4 Estimación de razón de una media poblacional 238
9.5 Estimación de una proporción poblacional 240
9.6 Selección de tamaños de muestra 243
9.7 Muestreo por conglomerados en dos etapas con
probabilidades proporcionales al tamaño 245
9.8 Resumen 248
Ejercicios 249
Experiencias con datos reales 253
INDICE 320
AL ESTUDIANTE
Grapo Zitorial Iberoamérica en s u esfuerzo
permanente por producir cada vez mejores textos,
pone en tus manos esta nueva obra en la que se ha
puesto la más alta calidad en los aspectos teó7ico y
didáctico, así como en diseño y presentación, con el
objetivo de proporcionarte la mejor herramienta, no sólo
para facilitarte el aprendizaje sino también para hacerlo
más estimulante.
Este, como cualquiera de nuestros libros, ha sido
cuidadosamente seleccionado para que encuentres en él
un pilar de tu preparación, y un complemento ideal a la
enseñanza del maestro. Lo didáctico de la presentación
de sus temas hace que lo consideres el mejor auxiliar, y
el que llevas a todas partes.
Lo anterior es parte de nuestro propósito de ser
partícipes en una mejor preparación de profesionales,
contribuyendo asia la urgente necesidad de un mayor
desarrollo de nuestros países hispanohablantes.
Sabemos que esta obra seráfundamental en tu
biblioteca, y tal vez la más inmediata y permanente
fuente de consulta.
Como uno de nuestros intereses principales es
hacer mejores libros en equipo con profesores y
estudiantes, agradeceremos tus comentarios y
sugerencias o cualquier observación que contribuya al
enriquecimiento de nuestras publicaciones.
INTRODUCCIÓN
Los cursos introductorios enfatizan que la estadística moderna es una teoría de la
información con la inferencia como su objetivo. El objetivo de nuestra
curiosidades un conjunto de mediciones, una población, que de hecho existe o
que puede ser generada por experimentación repetida. El medio para la inferencia
es la muestra, la cual es un subconjunto de mediciones seleccionadas de la
población. Deseamos hacer una inferencia acerca de la población sobre la base de
las características de la muestra —o, equivalentemente, la información contenida
en la muestra— .
Por ejemplo, supóngase que una cadena de tiendas mantiene un registro de
las cuentas de sus clientes. La cantidad que se adeuda a la compañía va a variar
día a día, conforme se efectúen nuevos cargos y se paguen algunas cuentas.
Ciertamente, el conjunto de cantidades que se deben a la compañía en un
determinado día representan una población de mediciones de considerable interés
para la gerencia. La característica poblacional de interés es el total de todas las
mediciones en la población o, equivalentemente, la carga total de crédito diario.
El mantener actualizados los créditos totales diarios asociados con las
cuentas, puede ser una tarea simple para una computadora electrónica. Sin
embargo, los datos deben ser actualizados diariamente y esta actividad consume
tiempo. Un método más sencillo para determinar la carga total de crédito
asociada con las cuentas es muestrear aleatoriamente la población de cuentas en
un determinado día, estimar el importe promedio adeudado por cada cuenta y
multiplicar por el número de cuentas. En otras palabras, empleamos un estimador
estadístico para hacer una inferencia acerca del total de la población. La
estadística elemental nos dice que esta estimación se puede hacer tan exacta
como queramos simplemente al incrementar el tamaño de la muestra. La
estimación resultante puede ser acompañada por un límite para el error de
estimación (Mendenhall, 1983, Capítulo 8) o bien expresada como un intervalo
de confianza. Entonces la informaciónen la muestra se utiliza para hacer una
inferencia acerca de la población.
La información obtenida de las encuestas por muestreo afecta casi todos los
aspectos de nuestra vida cotidiana. Tal información determina las políticas del
gobierno
2 INTRODUCCION
5
2 CE BASCOS
PEVISIÕN CONCEPTOS
1/10
FIGURA 2.
Distribución unapoblaciónque 0 con O rrwna
frecuencia
2.2 LA
donde la sumatoria incluye todos los valores de y para los cuales p(y) > 0.
Para la población y variable aleatoria y en estudio,
E(y) = E yp(y)
= Op(O) + lp(l) + 2p(2) • • • + 8p(8) + 9p(9)
= = 4.5
Se puede ver queE(y)es igual al valor promedio, o valor medio, de todas las
mediciones de nuestra población conceptual. En general, una media poblacional
será de notada por g, por lo que
F=-E Yi
CE
9+3+
- 5.4)21
= 4(92.4) = 10.27
2.3
fuera desconocida. De la misma manera, podría ser una aproximación razonable para
si fuera desconocida, y s podría ser una aproximación razonable para a .
o to 20 30 40 50 60 70 80 90 100
den = 20 mediciones de esta población, de tal manera que cada muestra posible de
tamaño 20 tuviera una misma probabilidad de ser seleccionada (véase Capítulo 4).
Este proceso se repitió hasta que fueron seleccionadas 50 de tales muestras. Se
calculó la media para cada muestra; la distribución de estas medias muestrales se
indica en la Figura 2.4. Nótese la tendencia de este histograma a la forma de
campana, aunque no perfectamente simétrica.
Una población de N = 20 mediciones fue generada posteriormente,
presentando la distribución que se indica en la Figura 2.5. Se seleccionaron 50
muestras de tamaño n — 15 cada una, siguiendo la metodología esbozada
anteriormente. La distribución de las 50 medias muestrales se presenta en la Figura
2.6. Nótese nuevamente una tendencia hacia una distribución en forma de campana
un tanto simétrica. Sin embargo, esta distribución difiere considerablemente de la
presentada en la Figura 2.4. Aquí, las medias muestrales están agrupadas muy
cerca alrededor de la media poblacional, como debía esperarse, ya que el tamaño
de muestra de 15 es muy similar al tamaño de la población de 20. Se podría sugerir
que la distribuciónen la Figura 2.6
2
co•CHJlC6BÀscos
10 20 40 50 60 70 80 90 100
15
—
Cov(Y1, )'2) = ¯ V2)]
cov(yt, 12)
2.5 ESTIMACIÓN
2 V(â) = es pequeña.
Un estimador que posee la propiedad 1 se dice que es insesgado. Con respecto a la
propiedad 2 , no se tratarán estimadores insesgados de mínima varianza en este
texto, pero se compararán estimadores insesgados sobre la base de sus varianzas. Si
podemos contar con dos estimadoresinsesgados de 8 , generalmente daremos
preferencia al que tenga la menor varianza.
Aunque la distribución de probabilidad de j, un estimador común, dependerá
del mecanismo de muestreo y los tamaños de la muestra y la población, en muchas
situacionesla media muestral tiende a presentar una distribución simétrica en forma
de campana, conocida como distribución normal. Esta observación
especialmentecierta si n es grande, digamos n 30.
Una vez que sabemos qué estimador 8 estamos usando en una situación y
conocemos algo acerca de su distribución de probabilidad, podemos evaluar la
magnitud del error de estimación. Definimos el error de estimación como 19 — 91.
¿Qué tan bueno será un estimador? No podemos establecer que un estimador
observado estará dentro de una distancia especificada de 9, pero podemos, al
menos aproximadamente, encontrar un límite B tal que
P(lô - el B) = 1 —a
para cualquier probabilidad deseada 1 — a, donde 0 < a < l. Si 8 tiene una
distribución normal, entonces B = za/2Üê, donde za/2 es el valor que separa un
área de (a /2) en la cola del lado derecho de la distribución normal estándar. La
tabulación de valores de za/2 se presenta en la Tabla 1 del Apéndice. Si 1 — a =
().95, entonces, zo.025 —— I .96, o sea aproximadamente2. Ya que muchos
estimadoresque usamos a lo largo del texto no van a tener una distribución
precisamente normal para muchos va-
2 CONCEPTOS BÁSICOS
lores de n y N, y ya que el teorema de Tchebysheffestablece que al menos 75% de
las observaciones para cualquier distribución de probabilidad estará dentro de dos
desviaciones estándar de su media, vamos a usar 20ô como un limite para el error
de estimación. Este valornos da una — B) = 0.95 para los casos aproximadamente
normales y P(le — B) 0.75 en cualquier caso. Nótese que para un8 normalmente
distribuido, un límite que satisfaga cualquier probabilidad deseada (1 — u) puede
ser encontradcu través del uso de la Tabla 1.
SiP(le — BI 1 — a, entonces — B — u. En esta forma (O
— B, + B) se denomina in terv al ode confianza para 9 con coeficiente de
confiabilidad (1 — a) .La cantidad 8 — B ,esllamada el límite inferior de confian
(LIC), y 8 + B es llamada el límitesuperior de confianza (LSC).
2.6 RESUMEN
EJERCICIOS
ELEMENTOS Da
MUESTREO
3.4 INTRODUCCIÓN
49
3 MUESTPEO
DEFINICIÓN 3.2 Una población es una colección de elementos acerca de los cuales
deseamos hacer alguna inferencia.
problema de la selección del tamaño de muestra para obtener un cierto límite para el
error de estimación se trata en Mendenhall (1983, Capítulo 8).
El diseño básico (muestreo irrestricto aleatorio) consiste en seleccionar un
grupo de n unidades muestrales de tal manera que cada muestra de tamaño n tenga
la misma oportunidad de ser seleccionada. Entonces, podemos obtener una muestra
aleatoria de n votantes elegibles en la encuesta de emisión de bonos, a través de la
extracción de nombres de la lista de votantes registrados, de tal manera que cada
muestra de tamaño n tenga la misma probabilidad de selección. Los detalles de
muestreo irrestricto aleatorio son explicados en el Capítulo 4. Por ahora,
simplemente señalamos que una muestra irrestricta aleatoria va a contener tanta
informaciónsobre la preferencia de la comunidad como cualquier otro diseño de
muestreo, siempre y cuando todos los votantes en la comunidad tengan
características socioeconómicas similares.
Sin embargo, supóngase que la comunidad consta de personas de dos
diferentes grupos de ingresos, alto y bajo. Los votantes en el grupo alto pueden
tener opiniones sobre la emisión de bonos que sean muy diferentesde las opiniones
de los votantes en el grupo bajo. Es por esto que para informaciónexacta acerca de
la población, queremos muestrear votantes de cada grupo. Podemos dividir los
elementos de la población en dos grupos o estratos, de acuerdo al ingreso, y
seleccionar una muestra irrestricta aleatoria de cada grupo. A la muestra resultante
se le llama muestra aleatoria estratificau.
Nótese que la estratificaciónes llevada a cabo usando el conocimiento de una
variable auxiliar, es decir, ingreso personal. Mediante la estratificaciónen valores
alto y bajo del ingreso, incrementamosla exactitud de nuestro estimador. La
estimación de razón es un segundo método que usa la información contenida en
una variable auxiliar. Los estimadores de razón usan no solamentelas mediciones
en la respuesta de interés, sino que incorporan mediciones sobre una variable
auxiliar. La estimación de razón puede también utilizarse con muestreo aleatorio
estratificado.
Aunque se desean preferencias individuales en la encuesta, un procedimiento
más económico, especialmente en áreas urbanas, puede ser el muestrear familias
específicas, edificios de departamentos o manzanas de la ciudad, en lugar de
votantes individuales. Las preferencias individuales pueden ser obtenidas de cada
votante elegible dentro de cada unidad muestreada. Esta técnica es llamada
muestreo por conglomerados. Aunque la población ha sido dividida en grupos,
tanto en muestreo por conglomerados como en muestreo aleatorio estratificado, las
técnicas son diferentes. En muestreo aleatorio estratificado tomamos una muestra
aleatoria simple en cada estrato; mientras que en muestreo por conglomerados
tomamos una muestra aleatoria simple de grupos y entonces muestreamos todos los
elementos de los grupos seleccionados (conglomerados).
Algunas veces, los nombres de las personas en la población de interés se
encuentran en un listado, tal como una lista de registro, o en tarjetas de archivo
almacenadas en un tarjetero. Para esta situación, una técnica económica es extraer
la muestra mediante la selección de un nombre cerca del principio de la lista y
luego leccionar cada diez o quince nombres después del anterior. Si el muestreo
es conducido de esta manera, obtenemos una muestra sistemática. Como puede
esperarse, el muestreo sistemático ofrece un medio conveniene de obtener
información muestral; desafortunadamente, no necesariamente obtenemos la
mayor información con una cantidad de dinero especificada.
Sabemos que las observaciones cuestan dinero. Nótese que el costo de una
observación puede variar de un diseño a otro, aun dentro de un mismo diseño,
dependiendo
3 MUESTREO
REENTREVISTAS
La no respuesta puede ser minimizada teniendo preparado un plan ciudadoso para
reentrevistas sobre los elementos muestreados. Un número fijo de reentrevistas
debe ser requerido para cada elemento muestreado, y esas reentrevistasdeben ser
en diferentes días de la semana y a diferentes horas del día. Un método específico
para determinar el número apropiado de reentrevistasva a ser presentadoen el
Capitulo 11. Es importante obtener algunas respuestas en al menos un subconjunto
de las no respuestas originales, de tal manera que se puedan eliminar factores
grandes de sesgo. Por ejemplo, al recabar opiniones sobre legislación para el
control de armas, se debe estar seguro de que quienes no respondieron no hayan
sido personas que favorecen el control de armas, aun cuando no lo suficiente como
para molestarse en responder el
cuestionario.
26 3 ELEMENTOSDEL PROBLEMA DE MUESTREO
RECOMPENSAS E INCENTIVOS
En algunas ocasiones, una táctica apropiada para estimular las respuestas es
ofrecer un premio por la respuesta. Este premio puede ser un pago en efectivo para
la persona que accede a participar en un estudio. O en estudios de productos para
el consumidor, se le puede dar al participante una provisión del producto. Los
premios deben ser ofrecidos a participantes potenciales en un estudio únicamente
después de que han sido seleccionados para la muestra mediante algún
procedimientoobjetivo. H tomar como la muestra a aquellos que responden a un
premio anunciado no suele ser apropiado, ya que quienes responden a tal aliciente
pueden ser no representativos de la población objetivo.
Los incentivos para la respuesta son particularmente de mucha ayuda para
muestras de grupos que tienen un interés particular en el problema que se estudia.
Los automovilistas asegurados pueden estar más dispuestos a responder un
cuestionario sobre seguros de automóviles si en la portada se presenta una circular
de la oficina del inspector estatal de seguros, en la que se establece que los
resultados pueden ayudar a promover tarifas más bajas. Los cazadores responderán
a un cuestionariosobre prácticas de gestión cinegética si se les asegura que los
resultados pueden mejorar las condiciones de cacería. Se pueden dar muchos
ejemplos similares, pero el punto importante es que la gente está más dispuesta a
responder a una encuesta si ve que puede obtener algunos beneficios de los
resultados.
ENTREVISTADORES ADIESTRADOS
La habilidad de un entrevistador está directamente relacionada a la calidad y
cantidad de la información resultante de una encuesta, ya sea que la entrevista sea
en persona o por teléfono. Los buenos entrevistadores pueden hacer las preguntas
de tal manera que se estimule a respuestas honestas, y pueden notar la
diferenciaentre quienes realmente desconocen la respuesta y aquellos que
simplemente no desean contestar. Los entrevistadores recientemente contratados
deben ejercitarse con respondientes tlpicos, como aquellos que se pueden
encontrar en el campo. Estas sesiones de preparación deben efectuarse con la
supervisión de entrevistadores experimentados, que puedan evaluar la entrevista y
sugerir mejoras en la técnica de entrevista.
VERIFICACIÓN DE DATOS
Los cuestionarios completados deben ser cuidadosamente analizados por alguien
diferente al entrevistador, para verificar si han sido llenados correctamente. En
esta etapa, y después nuevamente, si los datos se introducen en una computadora,
se debe revisar la información mediante un sistema preestablecido para detectar
errores reconocibles en la información.
27
Las amplitudes de las mediciones pueden ser verificadas para separar los
casos en que, digamos, la edad de una persona es listada como 1040, o una familia
es anotada como que tiene 53 hijos con una edad menor a 1 2 años. Los datos
pueden comprobarse en un cuestionario bien diseñado para ver, por ejemplo, si la
edad indicada por el respondiente concuerda con el año de nacimiento anotado.
Datos aritméticos sencillos —por ejemplo, las proporciones deben estar entre 0 y 1
y las horas por día, asig-
35 MÉTODOS DE DATOS
nadas a diferentes tareas en el trabajo, no pueden sumar más de 24— pueden ser
incluidos en estas verificaciones de datos.
La verificación rápida de datos, para que las respuestas dudosas puedan ser
corregidas mientras el respondiente está aún disponible, es un aspecto muy
importante para el buen éxito de una encuesta por muestreo.
Después de que todas las respuestas han sido recolectadas y los datos están
siendo analizados, se pueden hacer verificaciones adicionales. Los resultados de la
encuesta deben ser representativos de la población, y algunas veces los datos de la
muestra pueden ser verificados con datos conocidos de la población, para ver si
existen áreas potenciales de problemas. Por ejemplo, si la población tiene 50% de
mujeres, pero la muestra sólo presenta un 10%, puede haber errores serios en el
resumen de las mediciones promedio en hombres y mujeres. Si el ingreso
promedio para los respondientes en la encuesta es bastante bajo con respecto al
valor reportado por otras fuentes, Comparado con el valor promedio de la
población objetivo, grandes errores pueden aparecer en la recopilación de las
variables relacionadas con el ingreso. Algunos de esos problemas potenciales
pueden ser resueltos mediante un incremento en la muestra 0 cambiando la forma
de análisis, pero aun si estos problemas no son resueltos, cualquier inconsistencia
debe ser señalada en el análisis final.
CUESTIONARIOS AUTOAPLICADOS
Otro método útil de recolección de datos es el cuestionario autoaplicado, el cual
es administrado por el respondiente. Estos cuestionarios usualmente son
enviados por correo a los individuos incluidos en la muestra, aunque se pueden
usar Otros métodos de distribución. El cuestionario debe ser cuidadosamente
construido Si Se desea estimular la participación de los respondientes.
El cuestionario autoaplicado no requiere entrevistadores, por IO que Su uso
produce un ahorro en el costo de la encuesta. Este ahorro en el costo es
usualmente obte-
3.6
OSERVACIÓN
El cuarto método de recolección de datos es la observación directa. Por ejemplo, si
estamos interesadosen estimar el número de camiones que circulan por
determinado camino durante las horas de mayor tránsito, 4-6 P.N'I., podemos
asignar a una persona para contar el número de camiones que pasan por un punto
especificado durante este periodo. Posiblemente se utilizaría un equipo de conteo
electrónico. La desventaja de usar un observador estriba en la posibilidad de errores
en la observación.
La observación directa es usada en muchas encuestas que no requieren
mediciones en las personas. El Departamento de Agricultura de Estados Unidos,
por ejemplo, obtiene mediciones de algunas variables referentes a cultivos en
ciertas secciones de las parcelas, para obtener estimaciones de rendimiento de
cultivos, Los biólogos que estudian las poblaciones salvajes, pueden contar
animales, huellas de animales, huevos o nidos para estimar el tamaño de
poblaciones de animales.
Un aspecto que se relaciona con lo anterior es el de obtener información de
fuentes objetivas que no son afectadas por los propios respondientes: la
información sobre salud puede obtenerse de los expedientes de un hospital; la
información sobre ingresos, de registros de los empleadores (especialmente para
trabajadores del gobierno federal y estatal). Este procedimiento puede tomar más
tiempo, pero puede producir grandes recompensas en encuestas importantes.
ORDENAMIENTO DE LAS
Las personas que responden a cuestionarios generalmente tratan de ser consistentesen
sus respuestas a las preguntas. La consistenciadel respondiente puede ocasionar que
el
3 MUESTREO
ordenamiento de las preguntas afecte las respuestas, algunas veces de maneras que
parecen impredeciblespara el investigador inexperto. Un ejemplo presentado por
Schuman y Presser (19'81) ilustra este punto.
Se realizó un experimento con las siguientes dos preguntas:
A. ¿Considera usted que Estados Unidos debe permitir a reporteros de
periódicos comunistasde otros países venir y enviar a sus periódicos las
noticias tal como ellos las ven?
B. ¿Considera usted que un país comunista como Rusia debe permitir acceso
a reporteros de periódicos estadounidenses y enviar a Estados Unidos las
noticias tal como ellos las ven?
Para encuestas de 1980, en las cuales las preguntas aparecieron en el orden
(A, B), 54% de los respondientes contestósí a A y 63.7% contestósí a B. Para
encuestas en las cuales las preguntas aparecieron en el orden (B, A), 74.6%
contestó sí a A y 81.9% contestó sí a B. Así, la evidencia sugiere que haciendo
primero la pregunta B se ubica a los respondientes en un marco de actitud más
complacienterespecto de permitir reporteros comunistas en Estados Unidos. En
otras palabras, los que contestaron a B, cuando esta pregunta fue hecha primero,
trataron de ser consistentes y respondieron también sí a una pregunta similar. A.
Entonces, el contextoen el cual se hace una pregunta es muy importante, y debe ser
entendido y explicado en el análisis de los datos del cuestionario.
El orden es también importante en la posición relativa de preguntas
específicas y preguntas generales. Se les puede preguntar a los respondientes las
siguientes preguntas: A. ¿Apoyaría usted un aumento en los impuestos para
educación?
B. ¿Apoyaría usted un incremento en los impuestos?
No sería muy extraño encontrar más gente apoyando B si es preguntada en el orden
(B, A), que es preguntada en el orden (A, B). Si la pregunta A e; hecha primero, las
nas que apoyan los impuestos para la educación, y contestan afirmativamente a
A, pueden pensar que B implica un aumento en los impuestos que no se destinan a
la educación, y pueden contestar no a esta pregunta. Si B es preguntada primero,
las mismas personas que apoyan más impuestos para educación pueden responder
afirmativamente, ya que no han visto aún una pregunta específica sobre impuestos
para educación.
La actitud hacia una pregunta en una encuesta es muy frecuentemente
determinada o cambiada por preguntas anteriores, relacionadas con el mismo tema.
Schuman y Presser señalan que reportaron más casos delictivos cuando se hizo la
31
un número entre 1 y 10, donde 10 significa muy bueno. Si el primer lugar le parece
bueno al respondiente, va a tender a clasificarlo cerca de 10 y los otros tenderán a
ser clasificados más bajo. Si el primer sitio le parece desagradable al respondiente,
va a tender a ser clasificado cerca de 1 y los otros van a tender a ser clasificados
más alto. Entonces, dentro del grupo de los sitios agradables, cada uno tenderá a
recibir su más alta clasificación cuando aparezca primero en la lista. Asimismo,
cada uno de los sitios malos tenderá a recibir su más baja clasificación cuando
aparezca primero en la lista. Evidentemente, el primer lugar en la lista se utiliza
como un punto de referencia, y los otros objetos son clasificados arriba o abajo en
relación con el primer objeto.
Para muchas preguntas de la encuesta, el orden de las posibles respuestas(o
elecciones) a una pregunta particular es tan importante como la posición de las
preguntas en el cuestionario. Si a una persona que está siendo entrevistada se le
presenta una larga lista de posibles elecciones, o si cada posible elección es difusa
o dificil de interpretar, entonces la persona tenderá a contestar con la más reciente
elección (la última en la lista). Si un respondiente debe elegir entre una larga lista
escrita, entonces los objetos que van apareciendo hacia el tope de la lista tienen una
ventaja de selección. Por ejemplo, considérese la elección de candidatos para
empleo de una larga lista: aquellos que están hacia el tope de la lista tienden a ser
elegidos. En una lista de elecciones simples, tales como muy de acuerdo, de
acuerdo, desacuerdo y muy en desacuerdo, en una encuesta sobre actitudes, las
opciones tienden a recibir sus más altas frecuencias cuando aparecen primero. Esto
es, la proporción que está muy de acuerdo tenderá a ser mayor cuando esta opción
aparezca primero que cuando aparezca en cuarto lugar en la lista.
Los investigadoresque van a diseñar un cuestionariodeben tener cuidado con
los problemas comunes de ordenamiento de pregunta y respuesta. Deben tratar de
contrarrestar problemas potenciales, considerando las siguientes técnicas.
1. Impresión de cuestionarios con diferentes ordenamientos para
diferentes subconjuntos de la muestra.
2. Usar letreros o repetición de las preguntas tan frecuentemente como
sea necesario en una entrevista, de tal manera que la pregunta y
posibles respuestas sean claramente entendidas.
3. Explicación cuidadosa en el análisis de los datos del contexto en el
cual se hézo la pregunta.
OPCIÓN DE RESPUESTA
En casi cualquier pregunta que puede ser hecha, alguien siendo entrevistado querrá
decir que no sabe o que no tiene una opción. Ya que tales respuestas no dan
información útil acerca de la pregunta y esencialmente reducen el tamaño de
muestra, una práctica común en las encuestas es evitar el uso de esas opciones. El
respondiente es forzado a elegir entre las respuestas infonnativas listadas, a menos
que el entrevistador decida que simplemente no se puede hacer tal elección.
Sin embargo, forzar a la gente a tomar decisiones sobre cuestiones que
desconoce parece ser inapropiado. Entonces, un buen cuestionario debe
proporcionar preguntas seleccionadas para determinar si el entrevistado tiene
suficiente información para formarse una opinión acerca de un determinado
problema. De ser así, la pregunta principal se hace sin la opción "no opina". De lo
contrario, la pregunta debe ser evitada.
3.6 DISEÑO DE UN CUESTONA,Q'O 33
En otras palabras, las preguntas acerca de las cuales casi todo mundo tiene
suficiente información para formarse una opinión, tales como un cumplimiento
más estricto de las leyes sobre límites de velocidad para los conductores de
automóviles, deben ser establecidas sin la opción "no opina". Las preguntas de
naturaleza detallada, limitada o específica, tales como preguntas sobre reglamentos
municipales recientemente emitidos, deben ser consideradas previamente mediante
preguntas seleccionadas para saber si el entevistado tiene alguna información sobre
ese aspecto.
Aun después de que la opción "no opina" ha sido eliminada de una pregunta,
permaneceel problema de determinar cuántas opciones se deben permitir.
Frecuentemente, los cuestionarios pretenden polarizar la opinión hacia uno u otro
lado, como en la siguiente pregunta:
¿Cónsidera usted que el cumplimiento de las leyes de tránsito en la ciudad es
muy estricto o muy complaciente?
Aquí no se ofrecen opciones intermedias. Una razón por la que no se permiten
elecciones intermedias, tales como ' 'me parece correcta la forma en que se está
haciendo" , es que los entrevistados pueden tomar esta elección con demasiada
frecuencia sólo pará salir del paso. La opción de dos elecciones fuerza a la persona
entrevistada a interpretar la dirección de la respuesta, pero el entrevistador debe
explicar que se pueden tomar en cuenta diversos grados de rigidez o tolerancia.
"¿A qué polo estoy más cercano?", es el punto al cual se quiere llevar al
entrevistado. Por supuesto, si se quieren categorizar los grados de rigidez o
tolerancia en esta pregunta, entonces se deben presentar más de dos opciones. Sin
embargo, los diseñadores de cuestionariosdesean conservar el número de opciones
tan pequeño como sea posible.
REDACCIÓN
Aun para las preguntas en las cuales el número de opciones está claramente
determinado, el diseñador debe considerar las palabras que componen la parte
principal de la pregunta. Preguntas "Sí-No", como
{Apoya usted la aplicación de la pena de muerte?,
deben ser hechas en una forma más equilibrada, tal como:
{Apoya usted la pena de muerte o se opone a ella?
Algunas preguntas conllevan inherentes sólidas proposiciones y
contraproposiciones. Schuman y Presser (1981, p. 186) muestran resultados para
la comparación de las siguientes preguntas:
A. ¿Si en una compañía o negocio particular existe un sindicato, considera
usted que es .necesarioque todos los trabajadores sean miembros del
sindicato, o se opone usted a esto?
B. ¿Si en una compañía o negocio particular existe un sindicato, considera
usted que es necesario que todos los trabajadores sean miembros del
sindicato, o se debe dejar a cada individuo decidir si quiere o no estar en el
sindicato? Entre las personas a quienes se les hizo la pregunta A, 32.1 %
respondióque se deberequerir a los trabajadores que sean miembros del
sindicato; pero de quienes contestaron la pregunta B, únicamente 23%
respondió de esta manera. La pregunta B tiene una firme contraproposición
en la segunda fase de la pregunta. Las personas que no tienen sólidas
inclinaciones hacia cualquier tendencia son particularmente suscep-
tibles a fuertes proposiciones o contraproposiciones en el texto de la pregunta.
nuevo, las preguntas deben hacerse en forma equilibrada, con un mínimo de
proposiciones o contraproposiciones en su contenido.
Algunas veces el entrevistado puede tender a mostrar acuerdo con el
entrevistador cuando la pregunta es sugerente. Por ejemplo, la pregunta:
¿Está usted de acuerdo en que los tribunales son muy tolerantes con los
transgresores de la ley?,
recibirá muchas más respuestas afirmativas que las que debiera, simplemente
porque la respuesta parece concordar con la noción del entrevistador de la
respuesta correcta. Las preguntas sugerentes deben ser replanteadas en una forma
equilibrada, como se indicó anteriormente en esta subsección.
Las respuestas a muchas preguntas pueden ser radicalmente alteradas tan sólo
debido a una elección apropiada o inapropiada de palabras. Schuman y Presser
(1981 ,
p. 277) informan sobre estudios de las siguientes preguntas •
3.8 RESUMEN
EJERCICIOS
3.1 Un experimentador quiere estimar el consumo promedio de agua por familia en una ciudad.
Analice los méritos relativos a seleccionar familias individuales, unidades habitacionales
(casas para una sola familia, edificios de apartamentos, etc.) y manzanas de la ciudad
como unidades de muestreo. ¿Qué usaría usted como marco en cada caso?
Un guardabosques quiere estimar el número total de árboles que poseen diámetros mayores de
12 pulgadas en un área forestal. Se tiene disponible un mapa del área. Analice el problema
de la selección de unidades muestrales apropiadas y refiera un marco apropiado,
3.3 Un perito en seguridad está interesado en estimar la proporción de llantas de automóvil en
mal estado. {Debería usar automóviles individuales o colecciones de automóviles, tales como
los de estacionamientos, como unidades de muestreo? ¿Qué podría usar como marco?
3.4 Una industria está constituida por muchas plantas o fábricas pequeñas, localizadas a lo largo y
ancho del país. Una ejecutiva quiere encuestar las opiniones de los empleados sobre la
política vacacional de la industria. ¿Qué sugerirla usted que ella utilizara como unidades de
muestreo? ¿Qué podría ella usar como marco?
3.5 H departamento de agricultura de un estado desea estimar el área sembrada con maíz dentro del
estado. Sugiera posibles unidades de muestreo y marcos.
3.6. Un investigador de ciencias políticas quiere estimar la proporción de adultos residentes en un
tado que favorecen una legislatura unicameral. Analice posibles unidades y marcos.
Estudie también los méritos relativos a entrevistas personales, entrevistas por teléfono y
cuestionarios por correo como métodos de recolección de datos.
3.7 Analice los méritos relativos a utilizar entrevistas personales, entrevistas por teléfono y
cuestionarios por correo como métodos de recolección de datos para cada una de las
situaciones siguientes:
(a) Una ejecutiva de televisión quiere estimar la proporción de televidentes en el país que
están viendo su cadena a cierta hora.
(b) Un editor de periódico deseaencuestar las actitudes del público hacia el tipo de noticias
que publica su diario.
(c) El regente de una ciudad está interesadoen determinar la actitud de los casatenientes con
respecto a un cambio propuesto en la zonificación.
(d) El departamentosanitario de un municipio quiere estimar la proporción de perros que han
sido vacunados contra la rabia el año pasado.
3.8 Analice problemas asociados con el orden de las preguntas. Elabore una lista de dos o
pre• guntas para las cuales usted considera que el orden es importante y explique por qué.
3.9 Analice el uso de preguntas abiertas contra cerradas. Indique un ejemplo con una pregunta
abierta apropiada. Señale un ejemplo de cómo una pregunta similar puede ser cerrada.
Cuáles son las ventajas de las preguntas cerradas?
sao Presente un ejemplo de una pregunta que tiene una débil contraproposición. Refiera un ejemplo
de una pregunta que tenga una fuerte contraproposición.
3.11 Analice el uso de una opción de "no opinión" en una pregunta cerrada.
3.12 Exponga un ejemplo de una pregunta.que pueda forzar una respuesta en una cierta dirección
debido al uso de palabras inconvenientes.
3.13 Analice la importancia de técnicas apropiadas de manejo de datos y control de calidad en
una encuesta.
3.14 Analice la importancia de realizar una prueba piloto.
3.15 ¿Por qué la tasa de respuesta es una consideración en las encuestas?. Estudie métodos para
reducir la tasa de no respuesta.
3.16 Los entrevistados comúnmente reciben llamadas por teléfono de personas que realizan
encuestas durante las horas de la cena. Quienes planean la encuesta probablemente piensan
que muchos potenciales entrevistadosse encuentran en casa en esos momentos. Analice los
pros y contras de dicho procedimiento.
3.17 Usted ha sido contratado para estimar la proporción de republicanos registrados en su
condado que favorecen un incremento en el número de armas nucleares propiedad de
Estados Unidos. ¿Cómo planearía usted la encuesta?(Revise los once pasos de la sección
3.7, observando que los pasos 4 y 11 no puede ser contestados completamente en este
momento.)
3.18 Una encuesta de Yankelovich, Skelly y White, realizada en el otoño de 1984, mostró que un
quinto de las 2207 personas encuestadas falsearon información en su declaración del
impuesto federal al ingreso. ¿Considera usted que esta fracción es cercana a la proporción
real que ocultó información? ¿Por qué? (Analice las dificultades de obtener información
exacta sobre preguntas de este tipo.)
3.19 En una encuesta de Gallup sobre la juventud (GainesuUe Sun, febrero 13, 1985) , a 414
alumnos intermedios y avanzados se les hizo la siguiente pregunta:
MUESTREO
IRRESTRICTO
ALEATORIO
ESTUDIO DE CASO
Casi todos periódicos publican una revisión de cuando mems una encuesta de
opinión. Lm lectores alertas pueden aplicar el conocimiento de bs procedimientos
estadísticosbásicos para decidir S la información divulgada en bs artículos está res
paldada por bs datos.
encuesta de Yankelovich, Skelly y White, realizada a firES de 1984
examinó opiniones de 2207 residentes de sobre aspectos relacionados con el
impuesto federal de ingresos Sun, enero 1 5, 4985). Ic resultados mostraron que
el 54% de residentes entrevistados consideró a formularios de impuestos del
Servicio de Ingresos Escales complicados para declarasiones de impuestos. ¿Está
justificado el artículo que afirma: 'La mayoría encuentra complicado el impuesto
de ingresos"? La técnicas estadísticas explicadas en el Capítulo 4 ayudaran a
responder esta pregunta. El análisis para este caso presentará al final del capítulo
3
4 AEATCFD
4.4 INTRODUCCIÓN
IRRESTRICTA ALEATORIA
EJEMPLO 4.1
SOLUCIÓN
Podemos considerar que las cuentas son los números 001 , 002, . . , 999, 000. Esto
es, tenemos 1000 números de tres dígitos, donde 001 representa el primer registro,
999 el registro del paciente 999 y 000 el milésimo.
Recurra a la Tabla 2 del Apéndice y utilice la primera columna; si no
tomamos en cuenta los dos últimos dígitos de cada número, vemos que el primer
número formado de tres dígitos es el 104, el segundo es el 223, el tercero es el 241,
y así sucesivamente. Tomando una muestra aleatoria de 20 dígitos, obtenemos los
núyneros que se muestran en la Tabla 4.1.
Si los registros están numerados, solamente seleccionamos los registros con los
números correspondientes, y estos registros representan una muestra irrestricta
aleatoria de n = 2C) de N = 1000. Si las cuentas de los pacientes no están
numeradas, podemosremitimos a una lista de las cuentas y numerar de la la. a la
loa, 23a, 70a, y así sucesivamente, hasta obtener los números deseados. Si un
número aleatorio ocurre dos veces, se omite la segunda ocurrencia y se selecciona
otro número como su reemplazo.
(4.1)
Puesto que cada una de estas medias muestrales puede ocurrir con probabilidad
de conocemos la distribución de muestreo de y
De nuestra
43
YUüOfALPOBLAClONALES 45
definición de valor esperado,
También,
2
+ (2.5 -
= (2.5)Q) = —
Recordando que para este ejemplo u2 N = 4, y n = 2, tenemok
1
donde
La varianza del estimadorj es la misma que la dada en un curso
introductorio, excepto que está multiplicada un factor de corrección para ajustar
por el muestreo de una población finita. El factor de corrección toma en cuenta el
hecho de que una estimación basada en una muestran = 10 de una población de
N = 20 unidades contiene más información acerca de la población que una
muestra de n' = 10 de una población de N = 20,000.
Varianza estimada de j:
(4.3)
donde
EJEMPLO 4.2
Remítase al auditor del hospital del Ejemplo 4.1 y suponga que una muestra
aleatoria den = 200 cuentas es seleccionada del total de N = 1000. La media
muestral de las IOTA- 4
SOLUCIÓN
Usamos = $94.22 para estimar g. Un límite para el error de estimación puede ser
encontrado usando la Ecuación (4.4).
= $2.67
Por lo tanto estimamos que el valor medio por cuenta, g, será = $ 94.22.
Puesto que n es grande, la media muestral tendrá una distribución
aproximadamente normal, así que $ 94.22 + $ 2.67 es un intervalo de confianza
para la media poblacional de aproximadamente 95%.
EJEMPLO 4.3
Y7
SOLUCIÓN
Es conveniente presentar los datos y cálculos de la muestra como indica en la Tabla
4.5.
Al sumar las cantidades en la columna y, obtenemos
Yi = 368.00
De la columna de y , tenemos
15,332.50
50
3
33.5
0 ,122.25 32.00 t .024.00
52.00
43.00 i ,849 00
40.00 j .681
45-00 2.025.00 42 so 1.806 25
39.00
368 00
9
— -(15,33250 - 15.047.1 l l
= 35.67
Utilizando Ja Ecuación (4.4), obtenemos el Irmite para elzerror de estimación,
(4.5)
n
Varianza estimada de T :
(4.6)
donde
q
ue la varianza estimada de = Ni en la Ecuación (4.6) es NP veces la varian• za
estimada de dada en la Ecuación (4.3).
EJEMPLO 4.4
Una empresa industrial está interesada en el tiempo por semana que los científicos
emplean para ciertas tareas triviales. Las hojas de control del tiempo de una
muestra aleatoria de n = 50 empleados muestran que la cantidad
promedio de tiempo empleado en esas tareas es de 10.31 horas, con una varianza
muestral de SE = 2.25. La compañia emplea N = 750 científicos. Estime el número
total de horas-hombre que se pierden por semana en las tareas insignificantes y
establezca un límite para el error de estimación.
SOLUCIÓN
Sabemos que la población consiste de N = 750 empleados, de los cuales una
muestra aleatoria de n = 50 hojas de control del tiempo fue obtenida. La cantidad
promedio de tiempo que se pierde por los 50,empleadosfue = 10.31 horas por
semana. Luego la estimación de T es
= 750(10.31) = 7732.5 horas
4.4 55
52 MUESTREO ALEATORIO
2476
En alguna etapa del diseño de la encuesta, alguien debe tomar una decisión
acerca del tamaño de la muestra que será seleccionada de la población. Hasta
ahora hemos tratado un procedimiento de muestreo (el muestreo irrestricto
aleatorio) pero nada acerca del número de observaciones que serán incluidas en
la muestra. Las implicacionesde tal decisión son obvias. Las observaciones
cuestan dinero. Por lo tanto si la muestra es muy grande, tiempo y talento son
desperdiciados. Por el contrario, si el número de observaciones incluidas en la
muestra es muy pequeño, compramos información inadecuada por el tiempo y
esfuerzo empleado y nuevamente hemos hecho un mal gasto.
El número de observaciones necesarias para estimar una media poblacional
g con un límite para el error de estimación de magnitud B se encuentra al
establecer dos desviacionesestándar del estimador, p, igual a B y resolviendo esta
expresión para n. Esto es, debemos resolver
(4.8)
para n.
Usted recordará que la varianza estimada de F, V(ñ, esta dada por
4 PRESTRICTO
(4.9)
También(4.10)
(4.11)
La solución se presenta en la Ecuación (4.12).
donde
EJEMPLO 4.5
La cantidad promedio de dinero para las cuentas por cobrar de un hospital debe ser
estimada. Aunque no se cuenta con datos anteriores para estimar la varianza
poblacional " 2, se sabe que la mayoría de las cuentas caen dentro de una amplitud
de variación de $100. Existen N = 1000 cuentas abiertas. Encuentreel tamaño de
4.4 57
muestra necesario para estimar y con un Ifmite para el error de estimación de B = $
$,
SOLUCIÓN
Necesitamosuna estimaciónde , la varianza poblacional. Ya que la amplitud de
variación es aproximadamente igual a 4 desviaciones estándar (4C), un cuarto de
tal amplitud proporcionará un valor aproximado de u . Por lo tanto,
rango -— 10() = 25
4
(25)2 = 625
Al usar la Ecuación (4.12), obtenemos
MUESTREO ALEATORIO
B2 (3)2
donde 2.25
4 4
1000(625)
= 217.56
999(2.25) + 625
Esto es, necesitamos aproximadamente 218 observaciones para estimar g , la media
de las cuentas por cobrar, con un límite para el error de estimación de $3.00.
o, equivalentemente,
(4.13)
[La razón para esta equivalencia está dada directamente después de la Ecuación
(4.14)
donde
4N2
EJEMPLO 4.6
SOLUCIÓN
Podemos obtener un tamaño de muestra aproximado usando la Ecuación (4.14) con
igual a 36.00 y
43
Esto es,
4.5 ESTIMACIÓN DE uu
PROPORCIÓN POBLACIONAL
o bien p n
(4.15)
Varianza estimada de F:
(4.16)
donde
(4.17)
43
EJEMPLO 4.7
Una muestra irrestricta aleatoriade n = 100 estudiantes del último año de un
colegio fue seleccionada para estimar: (1) la fracción de N = 300 estudiantes del
último año que asistirán a una universidad, y (2) la fracción de estudiantes que
han tenido trabaps de tiempo parcial durante su estancia en el colegio. Sean y Xi (i
1 2 , 100) las respuestas del i•ésimo estudiante seleccionado. Estableceremos que
O si el i-ésimo estudiante no planea asistir a una institución superior, y = si lo
planea. Asimismo, sea x, = 0 si él no ha tenido alguna vez un trabajo de tiempo
parcial durante su estanciaen el colegio, y Xi = 1 si lo ha tenido. Usando los datos
de la muestra presentados en la tabla adjunta, estime p: , la proporción de
estudiantes del último año que planea asistir a una universidad y P2, la proporción
de estudiantes del último año que ha tenido un trabajo de tiempo parcial durante
sus cursos en el colegio (incluyendo los veranos).
ESTIMACIÜ\J [E- POBLACIONAL
SOLUCIÓN
Las proporciones muestrales de la Ecuación (4.15) están dadas por
15
4 PRESTRICTO
'-t
0.15 100
65
100
Los límites para los errores de estimación de pt y P2 son, respectivamente,
= 2(0.0293) = 0.059
= 2(0.0$91) 0.078
Por lo tanto, estimamos que 0.15 (15%) de los estudiantes del último año planea
asistir a una universidad, con un límite para el error de estimación igual a 0.059
(5.9%).
Estimamos que 0.65 (65%) de los estudiantes del último año ha tenido un trabajo
de tiempo parcial durante su estancia en el colegio, con un límite para el error de
estimación igual a 0.078 (7.8%).
MUESTREO
(4.18)
EJEMPLO 4.8
Los dirigentes del consejo estudiantil en un colegio desean realizar una encuesta
para determinar la proporción de estudiantes que está a favor de una propuesta de
código de honor. Ya que entrevistar a N = 2000 estudiantes cn un lapso razonable
es casi imposible, determine el tamaño de muestra (número de estudiantes a
entrevistarse) necesario para estimar p con un límite para el error de estimación de
magnitud B =
0.05. Suponga que no hay información previa disponible para estimar p.
SOLUCION
4
B2 (0.05)'
= 0.000625
5 ESTIMACIÓN DE PROPORCIÓN POBLACIONAL 59
500
1.499
= 333.56
Esto es, 334 estudiantes deben ser entrevistados para estimar la proporción de
estudiantes que está a favor de una propuesta de código de honor, con un limite
para el error de estimación de B = 0.5.
EJEMPLO 4.9
SOLUCIÓN
En este ejemplo debemos determinar un tamaño de muestra que nos permita
estimar Pl con un límite BI = 0.05 y con un límite B = 0.07. Primero
determinamoslos tamaños de muestra que satisfacen cada objetivo
separadamente. Luego, el mayor de los dos será el tamaño de muestra combinado
para una encuesta que satisface ambos objetivos. Del Ejemplo 4.8, el tamaño de
muestra requerido para estimar Pl con un límite para el error de estimación de BI =
0.05 fue n = 334 estudiantes. Podemos usar los datos de la encuesta del año
anterior para determinar el tamaño de muestra necesario para estimar P2.
Tenemos que
(0.07)2
= 0.001225
4 4
y, por lo tanto, con 0.60,
Npq
= 178.52
RRESTRICTO
Esto es, 179 estudiantes deben ser entrevistados para estimar p„ la proporción de
N 2000 estudiantes que considera que el consejo estudiantil satisface sus
necesidades, con un límite para el error de estimación igual a 0.07.
H tamaño de muestra requerido para lograr ambos objetivos en una
encuesta es 334, el mayor de los dos tamaños de muestra.
(4.20)
Varianza estimada de r
(4.21)
Varianza estimada de g pp
t(ôppc) - (4.24)
Límite para el error de estimación:
y
g son insesgados para cualquier selección de Ti, pero claramente el interés del
experimentadores seleccionar las Ti de tal manera que las varianzas de los
estimadores sean lo más pequeñas posibles. ¿Cómo se debe hacer esta selección?
Supóngase, por el momento, que el valor de se conoce para cada una de las N
unidades en la población. Por lo tanto, el total poblacional T también será conocido.
En estas condiciones podemos seleccionar cada unidad para la muestra con
probabilidad proporcional a su valor y, suponiendo que todas las medicionesson— o
sitivas. Esto es, podemos hacer Ti = yd r.
Con Ti = Yi/T para cada unidad muestreada, rppt será
n(n — 1)
1 si el dígito aleatorio es Q
2 si el dígito aleatorio es 1,
3 si el dígito aleatorio es 2, 3, 4 0 5, 4 si el dígito aleatorio es 6, 7, 8 0
9.
4
1.00
1 2
2 0.1 0.1
EJEMPLO 4.40
SOLUCIÓN
Listamos el número de componentes (nuestra medida del tamaño) en una columna, y
los intervalos acumulados y las Ti deseadas en columnas adyacentes, como
sigue:
10
10/150
2 12 11-22 12/150
3 22 23-44 22/150
4 8 45-52 8/150
5 16 53-68 16/150
6 24 69-92 24/150
7 9 93-101 9/150
8 10 102-111 10/150
9 8 112-119 8/150
10 31 120-150 31/150
EJEMPLO 4.14
Después de que el muestreo del Ejemplo 4.10 fue completado, el número de
defectos encontrados en los tableros 2, S, 5 y 7 fueron, respectivamente, 1, S, 2 y 1.
Estime el número promedio de defectos por tablero, y establezca un límite para el
error de estimaclón.
SOLUCIÓN
estimada por
74= 1
12 22 16 9
1 so ISO'
Por lo tanto,
3050)
+ - 17.10
22
72 4
150 2
17.10
9
= 0.0295
La estimación del número promedio de defectos por tablero, con un límite para el
error de estimación, es entonces,
1.71 ± 0.34
H intervalo (1.37, 2.05) proporciona un intervalo de confianza de aproximadamente
95% para el número promedio de defectos por tablero.
A-EATCFD
4.7 RESUMEN
ANÁLISIS Da ESTUDIO
DE CASO
LA BUJESTA SIF
capítulo, el 54% de 2207 personas entrevistadas opinó que hs formas del SIF no.'
complicadas.l-ka estimación de la proporción poblacional que considera formas
complicadas encontró usando
EEFCICOS
al que el tarnanode la población Na grande Con = 0.54. la porción
4.1 2 quepuedenseleccionar-
Liste todas las posiY• muestras irrestrictas aleatorias de tamaño n se de la población {O,
74 4
1, 2, 3, 4). Calculela T2 de la población yla V(Í) de la media muestral Luego, demuestre
por cálculos directos que
4.2 Para las muestras irrestnctas aleatorias generadas en el Ejercicio 1 , calcule la s2 de cada
muestra. Demuestre numéricamente que
E(s2) = —1—cr2
4.3 Suponga que usted va a estimar el número de conglomerados de maleza de cierto tipo en un
campo. ¿Cuál es la población, y qué usaría como unidades de muestreo? (Cómo
construiría un marco? (Cómo seleccionaría una muestra aleatoria?Si la unidad de
es un área, tal como una yarda cuadrada, ¿afecta el tamaño seleccionado para la unidad
de muestrm a la precisión de los resultados?¿Qué consideraciones tomaría en cuenta su
elección del tamaño de la unidad de muestreo?
4.4 El conjunto de datosen el Apéndice (Tabla 3) lista las cifras de la población de residentes por es
tado, según el censo de 1980. Seleccione una muestra irrestricta aleatoria de cinco
estados. Use las cifras de la población de 1980, de los estados seleccionados para estimar
la población total de Estados Unidos, y establezca un límite para el error de estimación.
{ Incluyesu intervalo obtenido la cifra de la población total dada en la tabla? (Considera
usted que cualquier intervalode confianza de 95%, basado en muestras de tamaño 5,
incluiría al total verdadero? ¿Por qué?
4.5 Las autoridades de un parque estatal están interesadas en la proporción de personas que
acampan y que consideran que el espacio del área disponible para acampar en un terreno
en particular es adecuado. Las autoridades decidieron tomar una muestra irrestricta
aleatoria de n 30 de los primerosN = 300 acampadosque visitan el campo. Sea y, O si el
jefe del i-ésimo grupo muestreadoconsidera que el espacio del área disponible para
acampar no es adecuado, y y, = 1 si consideraque es adecuado{t 30). Use los
&tosde la tabla adjunta para timarp. la proporción de personas que acampan y que
consideran que el espacio del área nible para acampar es adecuado. Establezca un
límite para el error de etimación.
MUESTREO RRESTRICTO
Per"na muatrada
Rapuata , Yi
1 1
2
3
29 1
30 1
75
4.6 Use los datos del Ejercicio 4.5 para determinar el tamaño de muestra requerido para
estimar p con un límite para el error de estimación de magnitud B 0.05.
4.7 Una muestra irrestricta aleatona de n = 100 medidores de agua es controlada dentro de una
comunidad para estimar el promedio de consumo de agua diario por casa, durante un
periodo estacional seco. La media y la varianza muestrales fueron - —- 12.5ys e -— 1252.
Si suponemos que hay N = 10,000 casas dentro de la comunidad, estime g, el promedio de
consumo diario verdadero, y establezca un Ifmite para el error de estimación.
48 Usando los datos del Ejercicio 4.7, estime el número total de galones de agua, r, usado
diariamente durante el periodo seco. Establezca un Iñmite para el error de estimación.
49 Los encargados de administrar los recursos de los terrenos dedicados a la caza silvestre
están interesados en el tamaño de las poblaciones de venado y de conejo en los meses de
invierno en un bosque en particular. Como una estimación del tamaño de la población, los
administradores proponen usar el número promedio de grupos densos de conejos y de
venados por parcelas de pies por lado. De acuerdo con una fotografa aérea, el bosque
fue dividido en N = 10,000 cuadros de pies por lado. Una muestra irrestricta aleatoria de n
= 500 parcelas fue seleccionada, y se observóel número de grupos densos de conejos y de
venados. Los resultadosde este estudio se resumen en la tabla adjunta. Estime gt y g2, el
número promedio de grupos densos de venados y de conejos, respectivamente, por
parcelas de pies por lado. Etablezca los límites para los errores de estimación.
4.10 Una muestra irrestricta aleatoria de n 40 estudiantes de un colegio fue entrevistada para
determinar la proporción de estudiantes que está a favor del cambio del sistema emestral
al trimestral. Veinticinco de los estudiantes respondieron afirmativamente. Estime la
proporción de estudiantes del colegio que está a favor del cambio (suponga que N 2000).
Establezca un Ilmite para el error de estimación.
4.11 Un dentista está interesadoen la efectividadde una nueva pasta dental. Un grupo de N =
1000 niñosde escuela participó en el estudio. Los registrosde un estudio anterior
mostraron que habfa un promedio de 2.2 caries cada seis meses para el grupo. Después de
tres meses de iniciado el estudio, el dentista muestreón = IO niños para determinar cuánto
hablan progresado con la nueva pasta dental. Usando los datos de la tabla adjunta,
estimeel número medio de caries para todo el grupo, y establezca un limite para el error de
estimación.
EJERCICIOS
Número caria en
Niño el Irri«lo de tre mu
76 4
2 4
3 2
4 3
5
5 2
7 3
8 4
4.12 El Departamento de Caza y Pesca de cierto estado está interesado en la dirección de sus
programas futuros de caza. Para mantener un potencial mayor de caza futura, el
departamento desea determinar la proporción de cazadores que buscan cualquier tipo de
ave de caza. Se obtuvo una muestra irrestricta aleatoria de n 1000 de los N = 99,000
cazadores con permiso. Suponga que 430 indicaron que cazaron aves. Estime p , la
proporción de cazadorescon permiso que buscan aves de caza. Establezca un límite para el
error de estimación.
4.13 Usando los datos del Ejercicio 4.12, determine el tamaño de muestra que el
Departamentodebe obtener para estimar la proporción de cazadores de aves de caza, dado
un límite para el error de estimación de magnitud B = 0.02.
414 El auditor de una compañía está interesado en estimar el número total de comprobantes de
viáticos que fueron archivados incorrectamente. En una muestra irrestricta aleatoria de N =
50 comprobantes tomados de un grupo de N = 250, 20 fueron archivados incorrectamente.
Estime el número total de comprobantes archivados incorrectamentede los N = 250, V
establezca un límite para el error de estimación. [Sugerencia: Si p es la proporción
poblacional de comprobantes archivados incorrectamente, entonces Np es el número total
de comprobantes archivados incorrectamente. Un estimador de Np es NF, el cual tiene una
varianza estimada dada por N2Ü(F).]
4.15 Un psicólogo desea estimar el tiempo de reacción promedio para un estímulo entre 200
pacientes de un hospital especializado en transtornos nerviosos. Una muestra irrestricta
aleatoria de n = 20 pacientes fue seleccionada, y fueron medidos sus tiempos de reacción,
con los resultados siguientes j = 2. I segundos s = O.4 segundos
Estime la media poblacional g, y establezca un límite para el error de estimación.
4.16 En el Ejercicio 4.15, ¿de qué tamaño deberá ser la muestra para estimar con un límite para el
error de estimación de 1 segundo?Use 1.0 segundos como una aproximaciónde la
desviación estándar poblacional.
4.17 un estudio sociológico, realizado en una pequeña ciudad, se hicieron llamadas telefónicas para
estimar la proporción de hogares donde habita cuando menos una persona mayor de 65
años de edad. La ciudad tiene 621 hogares, según el directorio telefónico más reciente.
Una muestra irrestricta aleatoria de n 60 hogares fue seleccionadadel directorio. Al
terminarla investigación de campo, de los 60 hogares muestreados, en 1 1 habita cuando
77
menos una persona mayor de 65 años de edad. Estime la proporción poblacional p, y
establezca un límite para el error de estimación.
4.18 El gerente de un taller de maquinaria desea estimar el tiempo promedio que necesita un operador
para terminar una tarea sencilla. El taller tiene 98 operadora. Se seleccionaron aleato•
IRRESTRICTO ALEATORIO
4.19 En el Ejercicio 4.18, ¿de qué tamaño deberá ser la muestra para estimar p con un límite
para el error de estimación de 0.08? Suponga que la proporción verdadera p es
aproximadamente 0.2.
4.20 Un investigador está interesado en estimar el número total de "árboles marcados" (árboles más
grandes que cierto tamaño específico) en una plantación de N 1500 acres. Esta información
utiliza para estimar el volumen total de madera aserrada para los árboles en la plantación.
Una muestra irrestricta aleatoria de n = 100 parcelas de 1 acre fue seleccionada, y cada
parcela fue examinada en relación con el número de árboles marcados. H promedio
muestral para las n = 100 parcelas de 1 acre fue = 25.2, con una varianza muestral de s2 =
136. Estime el número total de árboles marcados en la plantación. Establezca un límite para
el error de estimación.
4.21 Usando los resultados de la encuesta descrita en el Ejercicio 4.20, determine el tamaño de
muestra requerido para estimar r, el número total de árboles en la plantación, con un límite
para el error de estimación de magnitud B = 1500.
4.22 Una gran empresa constructora tiene 120 casas en diversas etapas de terminación. Para estimar
la cantidad total de dólares que será registrada en el inventario de la construcción en
proceso, se seleccionó una muestra irrestncta aleatoria de 12 de esas casas y se
determinaron los costos acumulados en cada una de ellas Suponga que los costos obtenidos
para las 12 casas de la muestra fueron los siguientes:
35,500 30,200 28,900
36,400 29,800 34,100
32,600 26,400 38,000
38,200 32,200 27,500
Estime los costos totales acumulados para las 120 casas, y establezca un límite para el error
de estimación.
4.23 los datos de la Tabla S en el Apéndice, seleccione una muestra irrestricta aleatoria simple de n
= IO estados. Estime la proporción de estados con el ingreso por persona de 1977 que estén
abajo de $ 5500, y establezca un límite para el error de estimación.
78 4
4.24 Los resultados de una encuesta de opinión pública, reportados en una revista (Time, Enero 2,
1984), mostraron que el 51% de los entrevistados coinciden completamente con la
siguiente declaración:
Los soviéticos están tan temerosos de una guerra nuclear como los
estadounidenses, y por lo tanto el interés mutuo encontrar formas para negociar.
El anfculo establece que "10s resultados están basados en una encuesta por teléfono de
1000 votantes registrados . . . H error de muestreo potencial es de más o menos 3 " ¿Cómo
se calculó y cuál es la interpretación del 3 % ? ¿Podemos concluir que la mayoría de los
votantes registrados coinciden completamente con la declaración ?
4.24 La encuesta de Florida de febrero-marzode 1984 (Gamestalle Sun, abril 1, 1984) entrevistó a
871 adultos de todo el estado. En una pregunta, el 53% de los entrevistados favoreció fuerte
EJEFCCOS
mente el apoyo a Israel. ¿Podrfa usted concluir que la mayoría de los adultos en Florida
favorecen el apoyo decidido a Israel?
4.26 Los resultados de una encuesta de Louis Harris establecen que el 36% de los estadounidenses
registra al fútbol como su deporte favorito. Un artfculo establece: "Con una muestra de
este tamaño (1091 adultos) se puede decir con 95% de seguridad que los resultados están
dentro de más o menos 3% de lo que estarían, si la población completa de adultos hubiera
sido encuestada" (Gainestille Sun, mayo 7, 1961). ¿Etá usted de acuerdo?
4.27 La Compañía Nielsen, A. C. , ha instalado monitores electrónicosen los aparatos de televisión
de aproximadamente 1200 de los 80 millones de hogares estadounidenses. Los datos
obtenidos de los monitores registran estimaciones de la proporción de hogares que
sintonizaron un programa de T V en particular. Nielsen presenta la siguiente justificación
para este tamaño de muestra (D. Cody, "Poll and Pollsters", Sky, octubre de 1982, p. 116):
Mezcle 70,000 frijoles blancos y 30,000 frijoles rojos y luego extraiga una
muestra de 1000 frijoles. Las probabilidades matemáticas son de que el número de
frijoles rojos estará entre 270 y 330, o sea de 27 a 30% de la muestra, lo que
corresponde a una "cla sificación" de 30, más o menos tres, con una certeza de 20
a 1 de confiabilidad estadística. La regla estadística básica no cambiaría si el
muestreo proviniera de 80 millones de frijoles en lugar de 100,000.
Interprete y justifique esta declaración en términos de los resultados de este capftulo.
4.28 En una encuesta de opinión se interrogó a 1684 adultos en todo Estados Unidos (Gainestille
Sun, julio 4, 1983). En la encuesta se reportó tener un 6% de margen de error para los
resultadosreferentes a las proporciones de entrevistados que favorecen ciertas decisiones. ¿Etá
usted de acuerdo?
429 Un auditor detecta que cierta empresa regularmenteexagera las cantidadesde dinero en dólares
de los inventarios, a causa de los retrasos en el registro de las retiros. H auditor quiere
estimar la cantidad total exagerada sobre 1000 artículos listados, obteniendolas
cantidadesexactas (revisadas) del inventario mediante una muestra irrestricta aleatoria de
15 artículos, y comparando estas cifras exactas con las cantidades registradas. Los datos
para los artículos seleccionados se muestran en la tabla respectiva (todos los datos en
dólares). Estime la cantidad total exagerada sobre los 1000 tipos de artículos, y establezca
un Ifmite para el error de estimación. (Omita la cpf )
2 295 305 10
3 68 91 23
4 74 82 8
5 128 12
6 241 250 9
7 362 384 22
8 72 80 8
9 59 82 23
10 112 140 28
11 118 124 6
12 210 230 20
13 240 260 20
14 123 247 24
15 96 108 12
4
PRESTPICTC
4.30 Un auditor muestrea aleatoriamente 20 cuentas por cobrar de las 500 cuentas de una
empresa. El auditor lista la cantidad de cada cuenta y verifica si los documentos respectivos
cumplen con los procedimientos establecidos. Los datos son como sigue (cantidades en
dólares, Y = si, N = no):
1 278 11 188
2 192 12 212
3 13 92
94
4 14 56
86 142
5 15
335 37
16
7 310 186
290
17
8 221 18 221
9 19 219
168
10 20 305
Estime el total de cuentas por cobrar para las 500 cuentas de la empresa, y establezca un
límite para el error de estimación. ¿Considera usted que el Promedio de las cuentas por
cobrar de la empresa excede de $250? ¿Por qué?
4.31 Remftase al Ejercicio 4.30. Con los datos referentes a la concordancia, estime la proporción de
las cuentas de la empresa que no cumplen con los procedimientos establecidos. Establezca
un límite para el error de estimación. { Considera usted que la proporción de cuentas que
cumplen con los procedimientos establecidos excede del 80%? ¿Por qué?
4.32 Remítase al Ejercicio 4.30. Suponga ahora que las 20 cuentas dadas representan una
población de la cual n = 5 cuentas serán seleccionadas para una investigación más detallada.
(El cuentahabiente será entrevistado para verificar las cantidades.) Seleccione una muestra
de 5 cuentas con probabilidades proporcionales a las cantidades.
4.33 El departamento de agricultura de un estado quiere medir la producción total de tomates para
una muestra de campos sembrados, con el propósito de estimar la producción total de
tomate para el estado. Analice los méritos del muestreo irrestricto aleatorio comparado con
el muestreo
con probabilidades proporcionales al tamaño.
4.34 Remítase a las cifras de la población de Estados Unidos dadas en la Tabla 3 del Apéndice.
nueve estados del noreste, seleccione una muestra de cuatro estados con probabilidades
proporcionales a los tamaños de su población total en 1970. ¿Es este procedimiento un
esquema dp muestreo apropiado para estimar el total de desempleoen el Noreste este
procedimiento un esquema de muestreo apropiado para estimar acres de terreno forestal?
4.35 Para los n = 4 estados seleccionadosen el Ejercici04.34, registrelos tamaños desu población en
1980, según la Tabla 3 del Apéndice. Use estos datos para estimar la población total en
1980 de los estados del noreste, y establezca un límite para el error de estimación. ¿Etá el
total que se indica en la tabla incluido en su estimación por intervalo? {Considera usted
que este método de muestreo es mor que seleccionar una muestra irrestricta aleatoria de
cuatro estados con fines de estimar la población total? ¿Por qué?
4.36 La tabla adjunta muestra gastos de consumo personal en Estados Unidos para una selección de
bienes y servicios(en miles de millones de dólares). Seleccione una muestra de tres
categoríascon probabilidades proporcionales a los gastos de 1981. Utilice para las
categorías muestreadas datos de 1982 para estimar el gasto total por las nueve
categoríasen 1982. Establezca un límite para el error de estimación.
13
4.37 Un estudio para evaluar las actitudes de los contadores, respecto a la publicidad de sus
Ervicios, incluyó el envío de cuestionarios a 200 contadores seleccionadosde una lista de
1.400 nombres. Un total de 82 cuestionarios debidamente contestados fueron devueltos. El
resumen de los datos para una pregunta es como sigue:
Certeza virtual 22 35
Muy probable 4
Poco probable 19 35
Alrededor de 50-50 18 15
Poco improbable 6 10
Muy
improbable
No absoluto
No respuesta
(a) Estime la proporción poblacional de certeza virtual para hacer publicidad nuevamente.
(b) Estime la proporción poblacional de tener al menos una probab dadde 50-50 de hacer
publicidad nuevamente.
(c) Entre aquellos con publicidaden el pasado, estimela proporciónpoblacionalde ser
pocoimprobable el hacer publicidad nuevamente.
(d) Entre aquellos con publicidad en el pasado, estime la proporción poblacional de tener al
menos una probabilidad de 50-50 de hacer publicidad nuevamente.
En todos los casos establezca un límite para el error de estimación. ¿Las partes (c) y (d)
requieren de más suposiciones de las que se hacen para las partes (a) y (b)?
4.38 Una empresa de investigación de mercados estima la proporción de clientes potencialesque
prefiere cierta marca de lápiz labial, mediante la selección " aleatoria" de 100 mujeres que
74 4 VUESTPEO RPESTRICTO ALEATCRO
4.1 La Tabla 4.7 lista algunas de las estadísticas finales para la temporada 1982-1983 de la Aso
ciación Nacional de Basquetbol. Use estos datos para completar los ejercicios siguientes:
(a) Seleccione una muestra irrestricta aleatoria den = 5 equipos de los,N 23 equiposlistados.
los puntos anotados por los 5 equipos muestreados para estimar el número
promedio de puntos anotados por equipo y el número total de puntos anotados en la
temporada por todos los equipos. En cada caso establezca un límite para el error de
estimación. (Incluye su estimación por intervalo, para el total de puntos anotados, al
total verdadero?
(b) En papel cuadriculado, grafique el número de puntos anotados contra el número de
parti- dos ganados para cada uno de los 23 equipos. (Parece existir una gran
correlación positiva entre estas dos mediciones?Suponga que una muestra de n = 5
equipos es seleccionada con probabilidades proporcionales al número de partidos
ganados, y que esta muestra es usada para estimar el número total de puntos
anotados en la asociación. (Considera usted que la vananza de este estimador será
más grande o más pequeña que la vananza del estimador del total de puntos
anotados usado en el inciso (a)? (Por qué?
(c) Grafique el número de partidos ganados contra el número de rechazos para cada uno de
kx; 43 equipos. (Parece existir una correlación positiva entre estas dos mediciones?
(d) Seleccione una muestra de n = 4 equipos con probabilidades proporcionales al número
de partidos ganados. Use el número de rechazos de estos cuatro equipos para estimar el
número promedio de rechazos por equipo en la asociación. Establezca un límite para el
error de estimaclón.
Identifique un problema en su área de interés del cual pueda usted extraer una muestra
irrestricta aleatoria para estimar una media, un total o una proporción poblacionales. Defina
claramente la población, las unidades de muestreo, y construya un marco. Seleccione una
muestra irreãricta aleatoria del marco, usando la tabla de números aleatorios en el
Apéndice. Luego recolecte datos y efectúe los cálculos necesarios.
co.' DATOS REALES
la de Bosquetõoi
TM.A4.7
División del Atlántico
Philadelphia 65 17 9,191 8,562 3,920
Boston 56 26 9,191 8,752 3,805
New Jersey 49 33 8,672 8,445 3,693
New York 38 8,198 7,979 3,343
Washington 42 40 8,134 8.145 3.529
División del Centro
Milwaukee 51 31 8,740 8,379 3,572
Atlanta 43 39 8,335 8,413 3,572
Detroit 37 45 9,239 9,272 3,789
Chicago 28 54 9,102 9,403 3,794
Cleveland 23 59 7,964 8,574 3,587
Indiana 20 62 8,911 9.391 3,593
División del Medio Oeste
San Antonio 53 29 9,375 9,075 3,831
Denver 45 37 10,105 10,054 3,738
Kansas City 45 37 9,328 9,209 3,663
Dalias 38 44 9,243 9,277 3,677
Utah 30 52 8,938 9,282 3,643
Houston 14 68 8,145 9,096 3,466
División del Pacífico
Los Ángeles 58 24 9,433 8,978 3,668
Phoenix 53 8,776 8,361 3,612
Seattle 48 34 9,019 8,756 3,721
Portland 46 36 8,808 8,633 3,560
Golden State 30 52 8,902 9,205 3,565
San Diego 25 57 8,903 9,299 3,502
Fuente: The World Almanac & Book of Facts, 1984 edition, copyright@Newspaper
Enterprise Inc., 1983, New York, NY 10166.
Algunos proyectos sugeridos son como sigue:
Comercio: Estime el ingreso promedio bruto para las empresas de un cierto tipo en su
área, o la cantidad promedio gastada para esparcimiento entre los varones de un colegio.
Ciencias sociales: Estime la proporción de votantes registrados que apoyan alguna
propuesta política popular, o estime el número promedio de personas por familia para
cierta sección de su ciudad.
Ciencias fsicas: Considere un experimento de laboratorio, tal como medir la
resistencia de tensión de un alambre o medir el diámetro de una barra. Tome n
observacionesindependientes sobre tal experiniento trátelas como una muestra
irrestricta aleatoria. Construya una estimación por intervalo para la media "poblacionai ".
Aquí la población es meramente conceptual (se podrían efectuar muchas mediciones del
fenómeno en cuestión), y su media representa la resistencia promedio del alambre de
este tipo o el diámetro promedio de la barra.
Ciencias biológicas: Estime el peso promedio de los animales alimentados con una
dieta durante un periodo específico, o estime la altura promedio de los árboles en cierta
porción de terreno. Como un ejemplo para trabajar con totales en lugar de medias,
estime el número total
4 RRESTRICTO AEATCFD
de colonias de (de cierto tipo) que plaga una parcela. Aqul cali dãhso en la selección de las
unidades de muestreo y la construcción del marco.
Si un ejemplo real involucra un conjunto grande de datos, quizá desee usar una
computadora para sus cálculos. La mayoría de los centros de cómputo tiene programas
tipo que calculan medias y varianzas muestrales. Cuatro paquetes de tales programas
ampliamente usados son SPSS, SAS, BIOMED y MINITAB (véase la Bibliografa en el
Apéndice).
MUESTREO
ALEATORIO ESTRATIFICADO
ESTUDIO DE CASO
77
5.4 INTRODUCCIÓN
los significados de urbano y ruml es esencial que cada unidad muestra I pertenezca
claramente únicamente a un estrato.
Después que las unidades de muestreo han sido divididas en estratos,
seleccionamos una muestra irrestricta aleatoria de cada estrato, mediante la técnica
presentada en el Capítulo 4. El problema de elegir el tamaño de muestra apropiado
para cada estrato se tratará posteriormente en este capftulo. Debemos estar seguros
de que las muestras seleccionadas en los estratos sean independientes. Esto es, se
deben aplicar diferentes esquemas de muestreo aleatorio dentro de cada estrato, de
tal manera que las observacioneselegidas en un estrato no dependan de las que se
han elegido en otro
estrato.
Se requiere alguna notación adicional para muestreo aleatorio estratificado. Sea
número de estratos
Ni = número de unidades muestrales en el estrato i
N = número de unidades muestrales en la población
EJEMPLO 5.4
Una empresa publicitaria está interesada en determinar qué tanto debe enfatizar la
publicidad televisivaen un determinado municipio, y decide realizar una encuesta
por muestreo para estimar el número promedio de horas por semana que se ve la
televisión en los hogares del municipio. Este comprende dos pueblos, pueblo A y
pueblo B, y un área rural. El pueblo A circunda una fábrica, y la mayoría de los
hogares son de trabajadores fabriles con niños en edad escolar. El pueblo B es un
suburbioexclusivo de una ciudad vecina y consta de habitantes más viejos con
pocos niños en casa. Existen 155 hogares en el pueblo A, 62 en el pueblo B y 93 en
el área rural. Analice los méritos de usar muestreo aleatorio estratificado en esa
situación.
SOLUCIÓN
La población de hogares se ubica en tres grupos naturales, dos pueblos y un área
rural, de acuerdo con su localización geográfica. Entonces la población dividida en
tres estratos es bastante natural, simplemente por conveniencia administrativa para
seleccionar las muestras y para ejecutar el trabajo de campo. Además, los
elementos de cada estrato deben presentar tendencias similares de
comportamientoentre ellos mismos. Se espera relativamente poca variabilidad en
el número de horas que se ve' televiSión en los hogares de cada grupo, y este es
precisamente el caso en que la estratificación produce una reducción en el limite
para el error de estimación.
La empresa publicitaria puede desear producir estimaciones, por separado,
del número promedio de horas que se televisión en cada pueblo. El muestreo
aleatorio estratificado permite estas estimaciones.
Para la muestra aleatoria estratificada, tenemos N, 155, N, = 62 y N, = 93, con N
= 310.
82 5 VICIESTREC ESTRATIFCADC
¿Cómo podemos usar los datos de una muestra estratificada para estimar la
media de la población?Sea ji la media muestral para la muestra irrestricta
aleatoria seleccionada en el estratoi, ni el tamaño de la muestra en el estrato i, la
media poblacional para el estrato i, y el total poblacional para el estrato i.
Entonces, el total de la población r es igual a Tl + T2 + • • • + TL. Tenemos una
muestra irrestricta aleatoria dentro de cada estrato. Por ello sabemos, a partir del
Capítulo 4, que ji es un estimador insesgado de g, y NÑi es un estimador
insesgado del total del estrato Ti = Ni'.Li. Parece razonable formar un estimador
de T, que es la suma de los mediante la suma de los estimadores de los r,.
Asimismo, ya que la media poblacional g es igual al total poblacional T dividido
entre N, un estimador insesgado de se obtiene sumando los estimadores de los Ti
de todos los estratos y luego dividiendoentre N. Denotamos este estimador por
Fst, donde el subíndice st indica que se ha utilizado muestreo aleatorio
estratificado.
N, n,
(5.2)
EJEMPLO 5.2
SOLUCIÓN
(a) De la Tabla 5.1 y Ecuación (5.1),
310
= 27.7
es la mejor estimación del número promedio de horas por semana en que en todos
los hogares del municipio se ve televisión. También, t(ñt)
12
= 1.97
La estimación de la media poblacional, con uniímite para el error de estimación de
aproximadamente dos desviacionesestándar, está dada por
35 28 26 41 27 4 49 10 8 15 21 7
43 29 32 37 15 41 25 30 14 30 20 11
12 32 34 24
36 25 29 31
39 38 40 45
28 27 35 34
o sea 25.1
o sea 25.1 ± 10.1
Esta estimación tiene un límite grande para el error de estimación porque s2 es
grande y el tamaño de muestra n2 es pequeño. Entonces la estimación de la media
poblacional es bastante buena, pero la estimaciónj2de la media del estrato 2 es
deficiente. Si Se desea una estimación para un estrato particular, la muestra del
estrato debe ser lo suficientemente grande para proporcionar un límite razonable
para el error de estimación.
(5.5)
EJEMPLO 5.3
Remítase al Ejemplo 5.2 y estime el número total de horas por semana que
las familias del municipio dedican a ver televisión. Fije un límite para el
error de estimación.
SOLUCIÓN
Con los datos de la Tabla 5.1,
= 8587 horas
La varianza estimada de NP está dada por f(NFst) = N 2
ê(Fq) = = 189,278.560
La estimación del total de la población, con un límite para el error de
estimación, está dada por
N osea
8587 ± 870
esta manera estimamos que el tiempo semanal total que en los
hogares del municipio se ve televisión es de 8587 horas. El error de
estimación debe ser menor que 870 horas :
V(Fst) = — 4
(5.8)
para estimar g
4
En la Sección 5.5 se preEngan métodos para elegir las fracciones w, , u,'2, . . . , WL.
EJEMPLO 5.4
Una encuesta anterior sugiere que las vananzas de los estratos para el
Ejemplo 5. son aproximadamente 25, 225 y 100. Deseamos estimar la
poblacional mediante Seleccione el tamaño de muestra para obtener un
Ifmfre en el error de estimación igual a 2 horas, si las fracciones
asignadas son w, = S, y En otras palabras. se debe tomar un número
igual de observaciones de cada estrato.
SOLUCIÓN
Un límite para el error de estimación de 2 horas significa que
= 2 o sea V
Por tanto D = l.
Enel Ejemplo 5.1, N, = 155, N, 62 y N, 93. Poresto
= 6,991,275
NOi =
=
= 27,125
2
=
ND
Y POBLACONALES 97
la Ecuación (5.8) tenemos que
= 56.7
Entonces el experimentador debe tomar n = 57 observaciones con
n(wl) = = 19
EJEMPLO 5.5
A' como en el Ejemplo 5.4, supóngase que las varianzas del Ejemplo 5.1
son aproximadas por 25, 225 y 03 100. Deseamos estimar el total
poblacional r con un límite de 400 horas para el error de estimación.
Seleccione el tamaño de muestra apropiado, si se va a tomar el mismo
número de abservaciones en cada estrato.
SOLUCIÓN
El límite para el error de estimación debe ser 400 horas y por ello,
B 2 (400)2 40,000
4N2 4N2
Para calcular n con la Ecuación (5.8) necesitamos las siguientes
cantidades:
— 6,991,275
(del Ejemplo 5.4)
= 27,125
(del Ejemplo 5.4)
2
D N2 40,000 = 40,000
N
ferente para la media muestral. Por lo que nuestro objetivoes usar una asignación que
presente una cantidad especificada de información a un costo mfnimo.
En términos de nuestro objetivo. el mejor esquema de asignación está influido
por tres factores. Ellos son los siguientes:
1. H número total de elementos en cada estrato.
2. La variabilidad de las observaciones dentro de cada estrato.
3. El costo por obtener una observación de cada estrato.
(5.9)
donde Ni denota el tamaño del i-ésimo estrato, denota la varianza poblacional para
el i-ésimo estrato y q denota el costo para obtener una observaciónindividual del i-
ésimo estrato.
(5.10)
100 5 MUESTREO ALEATORIO ESTRATIFICADO
para asignación óptima con la varianza de fija en D.
EJEMPLO 5.6
La empresa publicitaria del Ejemplo 5.1 encontró que cuesta más obtener una
observación del área rural que una del pueblo A o del B. El incremento es debido
los costos de traslado de un hogar rural a otro. El costo por observación en cada
pueblo se ha estimado en $9.00 (esto es, Cl = c2 = 9), y los costos por observación
en el área rural se han estimado en $16.00 (esto es, = 16). Las desviaciones
estándar por estrato (aproximadas por las varianzas muestrales de una encuesta
previa) son 5, 15y 10. Encuentre el tamaño de muestra total n y los tamaños
de muestra para los estratos nt, ti2 y n, , que permiten a la empresa estimar, al
mínimo costo, el tiempo promedio que ve televisión, con un límite para el error de
estimación igual a 2 horas.
SOLUCION
Tenemos que
= 800.83
= 8835
Entonces
58
Asimismo,
Por ello el
5.5 ASGNACON LA VUESTPA 94
das en ver la televisión, al mínimo costo, con un límite de 2 horas para el error de
estimación.
(5.11)
(5.12)
EJEMPLO 5.7
La firma publicitaria del Ejemplo 5.1 decide utilizar entrevistas por teléfono en
lugar de entrevistas personales, porque todos los hogares en el municipio tienen
teléfono y este método reduce los costos. El Costo de obtener una observación es
entonces el misrno en los tres estratos. Las desviaciones estándar son de nuevo
aproximadas por 5, 15 y 10. La empresa estimar la media población con un
límite para el error de estimación igual a 2 horas. Encuentre el tamaño
aproximado de la muestra n y los tamaños de muestra para los estratos ni, n2 y
n3.
SOLUCIÓN
Ahora vamos a usar las Ecuaciones (5.11) y (5.12), ya que los costos son iguales en
todos los estratoy Por eso, para encontrar las fracciones de asignación WI, y w3,
usamos la Ecuación (5.11). Entonces
— n(O.30)
103
VUESTR20 ALEXOP'O
Asimismo,
osea =1
Por eso,
N 2D = =
96,100
TambiénNg,2 = 27,125
(2635)2
56.34 0 bien 57
96,100 + 27,125
Entonces17 =
= 20
= 20
El tamaño de muestra n en el Ejemplo 5.7 es casi
igual al del Ejemplo 5.6, pero la asignación ha cambiado. Sc toman más observaciones del área
rural porque éstas ya no tienen un costo más alto.
EJEMPLO 5.8
Una investigadora quiso estimar el peso promedio de 90 ratas (50 machos y 40 hembras) que
han sido alimentados con cierta dieta. Las ratas fueron separadas por sexo; por lo que el de
muestreo aleatorio estratificado con dos estratos pareció apropiado. Para aproximar la
variabilidad dentro de cada estrato, la investigadora seleccionó la rata más pequeña y la más
104 5
grande en cada estrato y las pesó. Ella encontró que la amplitud de variación fue de 10 gramos
para los machos y de 8 para las hernbras. ¿Qué tan grande debió tomarse la muestra para
estimar el promedio pobla 55 ASiCNACiÜNl
cional con un límite de I gramo para el error de estimación? Suponga que el costo de
muestreo fue el mismo para ambos estratos.
SOLUCIÓN
Denotemos los machos como el estrato 1 y las hembras como al estrato 2. Para usar la
Ecuación (5.11) primero debemos aproxirnar y Ch. La desviación estándar debe ser alrededor
de un cuarto de la amplitud de variación, suponiendo que los pesos tienen una distribución
normal. Entonces
De la Ecuación (5. I l)
. = 472.50
4 4
Usando la Ecuación (5.12), tenemos
(205)2
= 16.83
(90f(0.25) + 472.50
El tamaño de muestreo n debió haber sido 17 con
105
—
(5.13)
EJEMPLO 5.9
La empresa publicitaria del Ejemplo 5.1 considera que las varianzas aproximadas que se usaron
en los ejemplos previos son erróneas y que las varianzas de los estratos son iguales. El valor
común de fue aproximado por IO en un estudio preliminar. Se van a efectuar entrevistas por
teléfono, por 10 que los costos serán iguales en todos los estratos. La empresa desea estimar el
número promedio de horas por semana que se ve la televisión en los hogares del municipio,
con un límite para el error de estimación igual a 2 horas. Encuentre el tamaño de muestra y los
tamaños de estratos necesarios para lograr esta exactitud.
SOLUCIÓN
Tenemos que
106 5
— 310(100) = 31,000
Entonces, ya que D = 1, de la Ecuación (5.14) resulta
31,000
= 75.6 0 bien 76
310(1) + ,000)
55 ASIG\ACION DE WWESTQA
Por lo que
15
23
= n(0.5) = 38
Estos resultados difieren de los del Ejemplo 5.7 porque aquí hemos supuesto que las varianzas
Son iguales en todos los estratos y son aproximadas por un valor común
EJEMPLO 5.4 0
En el ejemplo del tiempo de ver televisión, supóngase que los costos son como los
especificados en el Ejemplo 5.6. Esto es, Cl = 9 y = 16. Vamos a aproximar las varianzas por 5,
i 5 y IO. Dado que la empresa publicitaria tiene únicamente $500 para gastar en muestreo, elija
el tamaño de muestra y la asignación que minimice V(js,).
SOLUCION
El esquema de asignación es aún dado por la Ecuación (5.9). En el Ejemplo 5.6 encontramos
que w, = 0.32, tV2 0.39 y = 0.29.
Ya que el costo total debe ser igual a $500, tenemos que
C2t12 + C3n3 500
o bien 9111 + 9'12 + 16n3 = 500 Ya que n, = nwi, podemos sustituir como
sigue:
9nW1 9n2V2 + 16nw3 = 500
107
o bien 9n(O.32) + 9n(O.39) + 16n(O.29) = 500
Al despejar n, obtenemos
11,03n = 500
500
= 45.33
11.03
MIJESIPEO ALEAVC)QO ESTPAIiFCADO
Por lo que debemos tomar n = 45 para asegurar que los costos permanezcan inferiores a $500.
La asignación correspondiente está dada por
= 14
— 18
— 13
(5.16)
EJEMPLO 5.44
SOLUCIÓN
El valor estimado de la proporción de hogares donde se ve el programa X está dado
por psx. Usando la Ecuación (5.15), calculamos
La varianza de psr puede estimarse usando la Ecuación (5.16). Primero vamos a calcu-
lar
(310)2
— 0,0045
Entonces el valor estimado de la proporción de hogares en el municipio donde se ve
el programa X, con un límite para el error de estimación, está dado por
Para estimar una proporción poblacional, primero indicamos qué tanta información
deseamos mediante la especificación del tamaño del límite; e] tamaño de la muestra
es elegido de acuerdo con esto.
La fórmula para el tamaño de muestra n (para un límite dado B del error de
estimación) es igual que la Ecuación (5.8), excepto que está dada por pg..
MUESTRA 111
5.7 SE-LE-CCIÔN DEI TO,VIAÑO DE V ASIGNACION DE MUESTRA
Tamaño de muestra aproximado que se requiere para estimar•p, con un límite B para el error de
estimación:
(5.18)
donde N _ denota el tamaño del i-ésimo estrato, Pi denota la proporción poblacional para el i-ésimo estrato y Ci
denota el costo por obtener una observación individual del i-ésimo estrato.
EJEMPLO 5.42
Los datos de la Tabla 5.2 fueron tomados de un muestreo realizado el año pasado. La empresa publicitaria quiere
ahora efectuar un nuevo estudio en el mismo municipio para estimar la proporción de hogares donde ven el
programa X. Aunque las fracciones y ps que aparecen en las Ecuaciones (5,18) y (5.19) desconocidas, pueden
ser aproximadas por las estimaciones del estudio anterior, esto es, Pl = 0.80, F2 = 0.25 y ps = 0.50. El costo por
obtener una observación es $9 para cualquiera de los pueblos y $16 para el área rural, esto es, c, = cz = 9 y '3 =
16Los hogares que se encuentran dentro de los estratos son NI = 155, N2 = 62 y Ns = 93. La empresa quiere
estimar la proporción poblacional p, con un limite para el error de estimación igual a 0.1. Encuentre el tamaño de
la muestra n y los tamaños de los estratos nt, tt2 y n3, que darán el límite deseado a un costo mínimo.
ESIPATIÇICADO
5 MUESTREO ALEATORIO
SOLUCIÓN
Primero usamos la Ecuación (5.19) para encontrar las fracciones de asignación Wi. Usando Pi para aproximar Pi,
tenemos
9
62.000 26.846 46.500 3 3 4
= 20.667 + 8.949 + 11.625 — 41.241
— n(O.50)
Asimismo,
Entonces w, 0.50,
0.22 y W3 = 0.28.
El siguiente paso es usar la Ecuación (5.18) para encontrar n. Primero deben calcularse las cantidades siguientes:
= 59.675
Para encontrar D, hacemos 0.1 (el límite para el error de estimación). Entonces
(0.1)2
= 0.0025 = D 4
NI D = 240.25
57 SELECCIÓN DEL TAMAÑO DE Y ASIGNACION DE LA VIUE-STQA
0 bien 63
Si el costo de muestreo no varía de un estrato a Otro, entonces los factores de costo q se cancelan de la
Ecuación (5.19),
*APLO 5.43
Supóngase que en el Ejemplo 5.12 se van a efectuar entrevistas por teléfono, por 10 que los costos de muestreo los
por p, t 1' = 1, 2, 3. Deseamos estimar la proporción poblacional p con un límite de 0.1 para el error de estimación.
Encuentre el tamaño de muestra apropiado para lograr este límite al costo mínimo.
SOLUCIÓN
La Ecuación (5.19) se utiliza para encontrar las fracciones Wi, w2 y w3, pero ahora todos los términos q pueden ser
reemplazados por 1. Por lo que
NiGã
= 62.000 + 26.846 + 46.500 = 135.346
n(O.20)
n(O.34)
62.000
= n(O.46)
5 MUESTREO ALEATORIO
135.346
Asimismo ,
La Ecuación (5.18) o la Ecuación (5.12) con = Se pueden utilizar para encontrar n. Usando
(5.12) tenemos
A
(135.346)2
= 61.08 0 bien 62
240.25 + 59.675
Por lo que tomamos una muestra de 62 observaciones para estimar p con un limite en el error de
magnitud B 0.1. La asignación correspondiente está dada por
n, = = 62(0.46) = 29
= = 62(0.20) = 12
113 = = 62(0.34) = 21
Estas respuestas son similares a las encontradas en el Ejemplo 5.12. Los cambios en la asignación
resultan porque los costos no varían en el Ejemplo 5.13.
Recuérdese que la fórmula de asignación (5.9) toma una forma muy simple cuando las
varianzas, así como los costos, son iguales en todos los estratos. La Ecuación (5.19) se simplifica
de la misma manera, siempre y cuando todas las proporciones de los estratos Pi sean iguales y
todos los costos q sean iguales. Entonces la Ecuáción
(5.19) toma la forma
12...L (5.20)
Como ya se mencionó, este método de asignación de los tamaños de muestra a los estratos es
llamado asignación Proporcional.
EJEMPLO 5.44
SOLUCION
Las fracciones de asignación se determinan mediante la Ecuación (5.19) con Pl, . . . , y , CL
reemplazados por I . Entonces
= n(0.5)
o bien = 0.3
El tamaño de muestra n se determina con la Ecuación (5.18), usando 0.4 como una aproxirnación
para Pl, y p3, o bien puede encontrarse haciendo piqi en la
Ecuación (5.14). Usando la última ecuación con Pi = 0.4, tenemos
N pqi
= 74.4
ND
74.4
= 73.3 0 bien 74
117
Entonces = 37
= 15
= 22
El muestreo aletorio estratificado no siempre produce un estimador con una varianza más
pequeõa que la de] estimador correspondiente en el muestreo irrestricto aleatorio. El siguiente
ejemplo explica este aspecto
404
EJEMPLO 5.45
24
120
Asimismo ,
94 91 108 92
90 99 96 110
102 93 100 94
110 105 93 91
111 93 113
IDI
99 ñ = 100 = 98 100 e,
= 78.67 55.60 39.50 = 112.50
SOLUCIÓN
De la Ecuación (5. l)
jst ¯ ¯ =
N,
COvlENIARIOS ADICIONALES MUESTREO ESTPATFCADO
Nótese que el estimador de la media poblacional es el promedio de todas las observaciones muestrales cuando se
55.60
Entonces
. 6
= 2.93
y la estimación de las ventas mensuales promedio, con un límite para el error de estimación, es
Supóngase que el distribuidor ha decidido tomar una muestra irrestricta aleatoria de n 20 almacenes y los
mismos 20 almacenes del Ejemplo 5.15 son seleccionados. En otras palabras, suponga que los 20 almacenes
constituyen una muestra irrestricta aleatoria en lugar de una muestra aleatoria estratificada. Entonces el estimador
de la media poblacional tiene el mismo valor que el calculado en el ejemplo, esto es,
— — 99.3
Pero la varianza estimada toma el valor
119
= 2.49
EJEMPLO 5.4 6
Un servicio forestal estatal está realizando un estudio de la gente que utiliza las instalaciones
de campamentos operados por el estado. El estado tiene dos áreas para acampar, una
localizada en las montañas y otra localizada a lo largo de la costa. El servicio forestal desea
estimar el número promedio de personas por sitio dentro de los campamentos, y la
proporción de sitios que utilizan personas de fuera del estado durante un particular fin de
semana, cuando se espera que todos los sitios estén ocupados. El número promedio de
personas se va a estimar con un límite de 1 para el error de estimación, y la proporción de
personas de fuera del estado con un límite de O. I . Las dos áreas para acampar forman
convenientemente dos estratos, la localidad de la montaña como el estrato 1 y la localidad de
la costa como el estrato 2. Se sabe que NI = 120 sitios para acampar y N 2 = 80. Encuentre el
tamaño de muestra y la asignación necesarios para lograr estos dos límites.
SOLUCION
Suponiendo que los costos de muestreo Son los mismos en cada estrato, podemos obtener el
tamaño de muestra más pequeño mediante el de la asignación de Neyman. Sin embargo, esta
asignación depende de las varianzas de los estratos y nos da diferente asignación para los dos
tipos de mediciones consideradas en el problema. En lugar de eso, usamos asignación
proporcional porque es usualmente cercana al óptimo y nos da la misma asignación para
cualquier medición deseada. Entonces
120
=
0.6
N 200
= 0.4
N 200
Ahora se debe determinar el tamaño de muestra separadamente para cada una de las
estimaciones deseadas. Primero, consideramos el problema de estimar el número promedio
de personas por sitio. Debemos tener una aproximación de las varianzas de los estratos para
poder usar la Ecuación (5.8) para el tamaño de muestra. El semicio forestal conoce por
experiencia que la mayoría de los sitios contienen de I a 9 personas. Por lo que podemos usar
la aproximación
i 1,2
4
Por lo que
2
59 407
De la Ecuación (5.8)
= 14.8 0 bien 15
es el tamaño de muestra requerido.
Ahora vamos a considerar la estimación de la proporción de ocupantes de fuera del
estado. No se tienen disponibles estimaciones previas de las proporciones p, así que hacemos
pl = P2 = 0.5 para obtener un tamaño de muestra máximo. Usamos la
Ecuación (5.18) para encontrar n, por lo que debemos encontrar
50 = 10,000
10,000
= 67
40
100 +
27
50
Entonces
5 MUESTREO ESTRATIFICADO
son los tamaños de muestra requeridos para obtener ambos límites. Nótese que estos
tamaños de muestra dan una estimación del número promedio de personas por sitio con un
límite mucho más pequeño que el requerido.
EJEMPLO 5.4 7
Un investigador desea estimar el promedio anual de ventas para 56 empresas, usando una
muestra de n = 15 empresas. Se encuentran disponibles datos de frecuencias en una
clasificación por incrementos de $50 000 y se presentan en la tabla siguiente. ¿Cómo podemos
asignar las empresas a L = 3 estratos?
56
SOLUCION
Nótese que hemos añadido dos columnas a los datos de frecuencias de la población, es decir,
la raíz cuadrada de las frecuencias y la rafz cuadrada acumulada. El método óptimo
aproxirnado para la estratificación consiste en encontrar intervalos iguales en la columna de la
raíz cuadrada acumulada. (Nota: en esta escala 7.06 es 3.32 + 3.74, y así sucesivamente.)
Entonces (20.27)/3 = 6.76 y nuestros límites de estratos deben estar lo más cerca posible a
6.76 y 2(2.76) — 13.52. En la escala real, 7.06 es lo más cercano a 6.76 y 14.30 es lo más
cercano a 13.52. Entonces resultan los siguientes tres
estratos:
Estrato I : empresas con ingresos de 100,000 a 200,000. Estrato 2:
empresas con ingresos de 200,001 a 350,000. Estrato 3: empresas con
ingresos de 350,001 a 500,000.
Suponiendo que las empresas en esos estratos puedan ser identificadas antes del muestreo, la
muestra de n = 15 se obtiene tomando 5 de cada estrato. (Tamaños de muestra iguales en los
estratos quedan cerca de la óptima con esta técnica.)
Ocasionalmente, aparecen problemas en los cuales desearíamos estratificar con base en una
variable clave, pero no es posible ubicar las unidades de muestreo en sus estratos correctos sólo
hasta después de haber seleccionado la muestra. Por ejemplo, podemos desear estratificar una
encuesta de opinión pública por sexo de los entrevistados. Si la encuesta se realiza mediante
muestreo de números telefónicos, los entrevistados no pueden ubicarse en el estrato de
masculino o en el femenino sino hasta después de haber hecho contacto con ellos. Asimismo,
una auditora puede querer estratificar las cuentas de acuerdo con si son al mayoreo o al
menudeo, pero ella quizá no disponga de esta información sólo hasta después de haber tomado
una cuenta para la muestra.
Supóngase que una muestra irresticta aleatoria de n personas es seleccionada para una
encuesta. La muestra puede ser dividida en n 1 masculinos y n 2 femeninos después que la
5 MUESTREO ESTRATIFICADO
muestra ha sido entrevistada. Entonces, en lugar de usar para estimar g, podemos usar siempre
que Ni/N sea conocido tanto para masculinos como para femeninos. Nótese que en esta
situación n, y n2son aleatorzos, ya que varían de una muestra a otra aunque n sea fija. Entonces
esta muestra no es exactamente una muestra aleatoria estratificada de acuerdo con la Definición
5.1. Sin embargo, si Ni/ N es conocido y si n, 20para cada estrato, entonces este método de
estratificar después de la selección de la muestra es casi tan exacto como el muestreo aleatorio
estratificado con asignación proporcional.
La estratificación realizada de la selección de la muestra, frecuentemente es apropiada
cuando la muestra irrestricta aleatoria no está adecuadamente equilibrada de acuerdo con las
agrupaciones principales de la población. Supóngase, por ejemplo, que una muestra irrestricta
aleatoria de n = 100 personas es seleccionada de una población que debe estar igualmente
dividida entre varones y mujeres. La medición muestral de interés es el peso de los
entrevistados, y el objetivo es estimar el peso promedio de la gente de la población. La muestra
revela la siguiente información:
Varone Mujere
n, = 20 = 80
= 180 libras = 110
— 124 libras
Con una baja representación de los varones en la muestra, el estimador j = 124 parece
indebidamente bajo. Podemos ajustar esta estimación calculando
+ 0.5(110) = 145
Esta estimación parece ser mas realista, ya que varones y mujeres están ahora igualmente
ponderados. Nótese que Ni/N es conocido con un •buen grado de aproxirnación, aun cuando se
desconocen NI y N2.
«o
EJEMPLO 5.48
Una gran empresa sabe que 40% de las cuentas que reciben son al mayoreo y 6()% son al menudeo. Sin
embargo, identificar las cuentas individuales sin consultar un archivo es complicado. Un auditor desea
muestrear n = I OO de Sus cuentas para estimar la cantidad promedio de las cuentas por cobrar de la
empresa. Una muestra irrestricta aleatoria presenta 70% de cuentas al mayoreo y un 30% de cuentas al
menudeo. Los datos son separados cn cuentas al mayoreo y cuentas al menudeo después del muestreo,
con los siguientes resultados (en dólares):
Mayoreo Menudeo
Estime g, la cantidad promedio de las cuentas que recibe la empresa, y fije un límite al error de
estimación.
SOLUCION
Ya que la proporción observada de cuentas al mayoreo (O. 7) está muy alejada de la proporción
verdadera (0.4), la estratificación después de que se ha seleccionado la muestra irrestricta aleatoria
parece apropiada. Este procedimiento se justifica, ya que tanto n 1 como n 2 exceden 20.
= 376
y omitiendo la correcciÓn por población finita, tenemos
a una muestra irrestricta aleatoria son varones, entonces la proporción de varones en la muestra va a
ser pequeña, y se podlfa producir un estimador ajustado mediante la estratificación después del
muestreo. Este método puede incluso inducir a graves.sesgos en el resultado si la no respuesta sesga
la muestra irrestricta aleatoria. Lo que debe recordarse es que la muestra original debe aún ser una
muestra irrestricta aleatoria de la población.
5.44 RESUMEN
Una muestra alátoria estratificada se obtiene separando los elementos de la población en grupos, o
estratos, de tal manera que cada elemento pertenezca a uno y sólo uno de los estratos, y entonces se
obtiene una muestra irrestricta aleatoria de manera independiente en cada estrato. Este diseño de
muestreo de encuestas presenta tres ventajas principales sobre el muestreo irrestricto aleatorio.
Primero, la varianza del estimador de la media poblacional es por lo común reducida porque la
varianza de las observaciones dentro de cada estrato es usualmente más pequeña que la de toda la
población. Segundo, el Costo por recolectar y analizar los datos es frecuentemente reducido por la
separación de una población grande en estratos más pequeños. Tercero, se pueden obtener
estimaciones separadas para estratos individuales sin seleccionar otra muestra y, por lo tanto, sin
costo adicio
La Ecuación (5. l) nos da un estimador insesgado de la media poblacional, el cual es un promedio
ponderado de las medias de los estratos. La Ecuación (5.2) nos da un estimador insesgado de la
varianza de este estimador es usado en la obtención de límites para el error de estimación. Se da
también un estimador insesgado del total poblacional, así como su varianza estimada.
Antes de realizar una encuesta, los experimentadores deben considerar qué tan grande deben
tolerar el error de estimación, y de acuerdo con esto seleccionar el tamaño de la muestra. El tamaño
de muestra n es dado por la Ecuación (5.8) para un límite fijo B en el error de estimación. Esta muestra
debe ser entonces asignada a los diferentes estratos. La asignación que nos da una cantidad fija de
información a un mínimo costo es dada por la Ecuación (5.9); la cual es afectada por los tamaños de
los estratos, las varianzas de los estratos, y los costos por efectuar observaciones.
El estimador pst de una proporción poblacional tiene la misma forma que y es dado por la
Ecuación (5.15). Un estimador insesgado de pst es dado por la Ecuación (5.16). Los problemas relativos
al tamaño y asignación de muestra tienen las mismas soluciones que anteriormente, excepto que es
reemplazada por .
Carolinas Rocosas
= 40,828
= • 19,333
Aho a ocdemos estirnar el costo total anual
de io primera hosoitoiizoclón cara os pacientes corm litiasis en ias dos
regones combinadas como
o sea
Fi límite Para ei e ror de estgmación es (ya que los poblaciones son grandes
compa radas con os amaños oe muestra]-
Entonces esfimamos que e! costo total anua' para los dos regiones está entre
S72 y S82 millones aproximadamente,
EJERCICIOS
5.1 Una cadena de almacenes de departamentos está interesada en estimar la proporción de cuentas por cobrar
negligentes. La cadena consiste de 4 almacenes. Así que el costo de muestreo es redu-
EJERCICIOS
443
cido. Se usa muestreo aleatorio estratificado, con cada tienda corno un estrato. Ya que no se dis. pone de
inforrnación referente a las proporciones poblacionales antes del muestreo, Se usa la asignación
proporcional. De la tabla acompañante, estime p, la proporción de cuentas negligentes para la cadena, y
fije un límite para el error de estimación.
Tamaño de muestra
Número muestral de cuentas negligentes 4 2 8 1
5.2 Una corporación desea estimar el número total de horas-hombre perdidas debido a accidentes de los
empleados, en un mes determinado. Ya que los obreros, los técnicos y los administrativos tienen
diferentes tasas de accidentes, el investigador decide usar muestreo aleatorio estratificado, con cada
grupo formando un estrato. Datos de años previos sugieren las varianzas mostradas en la tabla anexa,
para el número de horas-hombrc perdidas por empleado en los tres grup(E, y de datos actuales se
obtienen los tamaños de los estratos. Determine la asignación de Neyman para una muestra de n = 30
empleados
5.3 Para el Ejercicio 5.2, estime el número total de horas•hombre perdidas durante el mes indicado y establezca un
límite para el error de estimación. Use los datos de la tabla acompañante. obteni• da de una muestra de 18
obreros, IO técnicos y 2 administrativos.
8
o 8 32 24
o
6 16 8 12
7 4 4 3 2
9 5 8 8
18 2 0
5.4 Se forma una comisión de zonificación para estimar el valor promedio de avalúo en un suburbio residencial de
una ciudad. El uM) de ambos distritos de votantes en el suburbio como los estratos es conveniente
porque se tienen disponibles listas separadas de las viviendas en cada distrito. De los datos presentados
en la tabla acompañante, el valor promedio de avalúo para todas las casas en el suburbio, y establezca un
límite para el error de estimación (nótese que se utilizó la asignación proporcional).
444 5 MUESTREO ALLATCHO ESTIQA[FICADO
5.5 Una corporación desea obtener información acerca de la efectividad de una máquina comercial. Se
va a entrevistar por teléfono a un número de jefes de división, para pedirles que califiquen la
maquinaria con base en una escala numérica. Las divisiones están localizadas en Norteamérica,
Europa y Asia. Es por eso que usa muestreo estratificado. Los costos son mayores para las
entrevistas de los jefes de división localizados fuera de Norteamérica, La tabla siguiente
proporciona los costos por entrevista, varianzas aproximadas de las calificaciones, y los Ni que
se han establecido. La corporación quiere estimar la calificación promedio con v(Pst) 0. I. Elija el
tamaño de muestra n que obtiene este limite y encuentre la asignación apropiada
5.6 Una escuela desea estimar la calificación promedio que puede ser obtenida en un examen de
comprensión de lectura por estudiantes de sexto grado. Los estudiantes de la escuela
agrupados en tres estratos, los que aprenden rápido en el estrato I y los que aprenden lento en
el estrato III. La escuela decide esta estratificación porque de esta manera se reduce la
variabilidad en las calificaciones del examen. El sexto grado contiene 55 estudiantes en el
estrato I, 80 en el estrato ll y 65 en el estrato III. Una muestra aleatoria estratificada de 50
estudiantes es asignada proporcionalmente y produce muestras irrestrictas aleatorias de n, 14,
n2 20 y n3 = 16 de los estratos I, II y III. El examen se aplica a la muestra de estudiantes y se
obtienen los resultados que se muestran en la tabla. Estime la calificación promedio para este
grado y establezca un limite para el error de estimación.
Estrato I Estrato II Estrato
EJERCICIOS
80 92 85 82 42 32
68 85 48 75 36 31
72 87 53 73 65 29
85 91 65 78 43 19
90 81 49 69 53 14
72 61 31
62 79 81
53 42 30
61 83 59
68 39 32
52
71 61
59 42
415
5.7 Supnga que la calificación promedio para el examen de la clase del Ejercicio 5.6 va a estimar de nuevo al final
del año escolar. LOS costos de muestreo Son iguales en todos los estratos, pero las varianzas son
diferentes. Encuentre la asignación Óptima (Neyman) para una muestra de tamaño 50, usando los datos
del Ejercicio 5.6 para aproximar las varianzas.
5.8 Utilizando los datos del Ejercicio 5.6, encuentre el tamaño de muestra requerido para estimar la
calificación promedio, con un límite de 4 puntos para el error de estirnación. Use asignación
proporcional.
5.9 Repita el Ejercicio 5.8, ahora usando la asignación de Neyman. Compare los resultados con la respuesta del
E*rcicio 5.8.
5.10 Un guardabosques quiere estimar el númem total de de árbols en ranchos de un estado. Ya que
el número de acres de árboles varía considerablemente con respecto el tamaño del rancho, decide
estratificar con base en el•tamaño de los ranchos. Los 240 ranchos en el estado puestos en una de 4
categorías de acuerdo con el tamaño. Una muestra aleatoria estratifi• cada de 40 ranchos, seleccionada
mediante asignación proporcional, produce los resultados del número de acz-es plantados de árboles que
se muestran en la tabla anexa. Etime el número total de acres plantados de árboles en los ranchos del
estado, y un límite para el error de egimación.
5.13 Un ayuntamiento municipal está interesado en ampliar las instalaciones de un centro de atención diurna para
niños con retraso mental. La ampliación va a incrementar los costos de asistencia a los niños del centro.
Se va a realizar una encuesta por muestreo para estimar la proporción de familias con niños afectados que
utilizarán las instalaciones ampliadas. Las familias están divididas en aquellas que usan las instalaciones
y aquellas que no lo hacen. Algunas familias viven en la ciudad donde se encuentra localizado el centro,
y Otras viven en las áreas rurales o suburbanas de los alrededores. Entonces se usa
muestreo aleatorio estratificado Con en la ciudad que usan las instalaciones,
personas de los alrededores que las usan, en
5
MUESTREO ALEATORIO ESTPATFCADO
la ciudad que no las usan, y personas en los alrededores que no las usan, formando los estratos I , 2, 3
y 4, respectivamente. Aproximadamente 90% de los que usan las instalaciones y 50% de los que no las
usan van a utilizar las nuevas instalaciones. Los costos por efectuar la observación de un cliente actual
es de $4.00 y de $8.00 para uno que no lo es. La diferencia en el costo resulta de la dificultad para
localizar a quienes no usan las instalaciones.
Registros existentes nos dan NI 97, a'V2 = 43, N, = 145 y N4 68. Encuentre el tamaño de muestra
aproximado y la asignación necesaria para estimar la proporción poblacional con un límite de 0,05
para el error de estimación.
5.14 Se lleva a cabo la encuesta del Ejercicio 5. IS y se obtiene la siguiente proporción de familias que usarán
las nuevas instalaciones.
0—10 2
11-20 4
21-30 6
31-40 6
41-50 5
51—60 8
61-70 10
71-80 14
81-90 19
91-100 13
101-110 3
111—120 7
EJERCICIOS
promedio de días de ausencia por enfermedad, «orgados por cierto grupo de empresas en un año
determinado. No se tiene disponible infonnación referente a días de ausencia pr enfermedad, pero se
puede encontrar información sobre el número de empleados por empresa. Suponga que para estas
empresas se tiene que el número total de días de ausencia por enfermedad está altamente
correlacionado con el número de empleados. Use los datos de frecuencias de la tabla acompañante
para dividir óptimamente las 97 empresas en L = 4 estratos, para los cuales es posible usar tamaños de
muestra iguales.
5.18 Considere el Ejercicio 4.30. El auditor desea ahora submuestrear algunas de las 20 cuentas para una
auditoría más detallada. Separe las 20 cuentas en dos estratos, aplicando el método acumulativo de la
raíz cuadrada de frecuencias a las cantidades dadas.
5.19 Una verificación de control de calidad estándar para acumuladores de automóviles consiste
simplemente en registrar su peso. Un embarque particular de una fábrica consistió de
acumuladores producidos en dos meses diferentes, con el mismo número de acumuladores para cada
mes. El investigador decide estratificar con base en meses para el muestreo de inspección a fin de la
variación mensual. Las muestras irrestrictas aleatorias de pesos de acumuladores para los dos meses
mostraron las siguientes mediciones (en libras):
61.5 64,5
63.5 63.8
63.5 63.5
64. O 66.5
63.8 63.5
64.5 64.0
Estime el promedio de los acumuladores en la Pblación (el embarque) , y fije un límite para el error de
estimación. Descarte la cpf, El estandar de la fábrica para este tipo de acumuladores es de 69 libras.
¿Considera usted que el embarque cumple el estándar del promedio?
5.20 ¿Cree usted que la estratificación del Ejercicio 5.19 es deseable, o será suficiente con muestreo irrestricto
aleatorio? Suponga que el muestreo irrestricto aleatorio es tan conveniente como el muestreo aleatorio
estratificado.
5.21 Una inspectora de control de calidad debe estimar la proporción de circuitos integrados de
microcomputadora defectuosos que provienen de dos diferentes operaciones de ensamble. Ella sabe
que de entre los circuitos integrados que van a ser inspeccionados, 60% procede de la operación de
ensamble A y 40% de la operación de ensamble B. En una muestra aleatoria de 100 circuitos
integrados resulta que 38 provienen de la operación A y 62 de la operación B. De entre los circuitos
integrados muestreados de la operación A, 6 defectuosos. De entre las piezas muestreadas de la
operación B, IO son defectuosas.
(a) Considerando únicamente la muestra irrestricta aleatoria de 100 circuitos integrados, estime la
proporción de los defectuosos en el lote, y establezca un límite para el error de estimación.
418 5
(b) Estratifique la muestra, después de la selección, en circuitos integrados provenientes de la
operación A y B, estime la proporción de los defectuosos en la población, y fije un Emite para el
error de estimación
Omita los cpf en ambos casos. ¿Qué respuesta encuentra más aceptable?
5.22 ¿En qué condiciones ocurre que la estratificación produce grandes ganancias en precisión sobre el
muestreo irrestricto aleatorio? (Suponga que los costos de observación son constantes en ambos.
diseños.)
5.23 Un analista de investigación de mercados quiere estimar la proporción de personas que favorece el
producto de su compañfa respecto a un producto similar de una compañía rival. El área de
VUESTQEO ALEATORIO ESTPATFCADO
prueba para esta investigación es el estado de Nueva York. Él también está interesado en obtener
estimaciones separadas para la proporción en personas con edades de 18 a 25 años y para mayores de
25 años. Analice posibles diseños para esta encuesta.
5.24 Un investigador desea estimar el ingreso promedio de los empleados de una gran empresa. Se tienen
registros de los empleados listados por antigüedad, y, en términos generales, se tiene que el salario se
incrementa con la antigüedad. Analice los méritos relativos al muestreo irrestricto aleatorio y al
muestreo aleatorio estratificado para este caso. ¿Cuál recomendaría usted y cómo organizaría el
esquema de muestreo?
5.25 En el uso de como un estimador de g, algunas veces resulta ventajoso encontrar la asignación y el tamaño
de muestra que minimiza la para un costo fijo c. Esto es, el costo c perrnitido para el muestreo es fijo y
queremos encontrar la mejor asignación de recursos en términos de maximizar la información sobre
La asignación óptima para este caso es aún dada por la Ecuación (5.9). Muestre que la elección
apropiada de n es
5.1 En la Tabla 3 del Apéndice se presentan datos del Censo de 1980 de Etados Unidos. Considerando las
cuatro divisiones mayores del país (Noreste, Centro Norte, Sur y Oeste) como estratos, seleccione una
muestra aleatoria estratificada de estados, y estime el total de la poblaclón para 1980, con un límite
para el error de estimación. En el diseño, seleccione un tamaño de muestra y una asignación que
considere apropiados para obtener una buena estimación. ¿Qué consideraciones intervienen en su
elección? ¿El intervalo producido incluye el total verdadero indicado en la tabla? Compare su
respuesta con las de otros e«udiantes. ¿Todos los intervalos encontrados son de la misma longitud?
¿Incluyen todos los intervalos el verdadero valor poblacional?
5.2 Usando los mismos datos del Censo de 1980 de Unidos, y los misrnos estratos del Ejercicio 5.1 , estime la
proporción de estados que tienen tasas brutas de natalidad (nacimientos anuales por cada mil
habitantes) mayores que la tasa de natalidad para todo el pais durante 1978. Fije un límite para el error
EJERCICIOS
de estimación. Usted puede seleccionar un tamaño de muestra y asignación diferentes a los usados en
el Ejercicio 5. I .
5.3 La Tabla 5.4 muestra la altura de edificios altos en ciertas ciudades de Estados Unidos. Usando las ciudades
como estratos, seleccione una muestra aleatoria estratificada de edificios y estime la altura promedio
para esta población. Fije un límite para el error de estimación. Compare su respuesta con las de sus
compañeros.
5.4 Considere la Tabla 5.4. Usando las ciudades como estratos, estime la proporción de edificios en esta lista
que Obrepasan los 500 pies de altura. Etablezca un límite para el error de estimación. Ponga atención
cuidadosa al tamaño de muestra y la asignación para obtener de modo eficiente un límite pequeño.
5.5 Etime el precio promedi% a] menudeo de un abarrote común frX)r ejemplo café, pan, pasta dental o azúcar)
en la ciudad, o sección de la ciudad en la cual vive. Considere de tres a cinco estratos para los
almacenes, y observe de modo cuidadoso la mejor manera de estratificación. Se sugiere estratificar
con base en el tipo de almacén (gTandes supermercados contra pequeñas tiendas de
420 5
AS coX DATOS REALES 449
Atlanta, Ga.
para un total dc
Dallas, Tex.
Building
Hilton Hotel
Peachtree Center Harris
Telephone
Trust Company Bank
States
Center Cain Budding
Peachtree Center Building
Chicago, 111.
1000 uke Shore Plaza
Mai 2001 Bryan St Building 372 first International Building San Jacinto Tower Court House & Federal Ofce 362 LTV Republic Bmk Building,
Building
Arco no tone ornamental Mercantile Building vine To 150 She Hotel
TWO W y n dham Hotel Plat* of ne America's
Bank One Main place Este)
Re-public Bank Tower LTV Hotel
City Center National Bank Elm
SW Bell Tower Building, torre Mai n To
One Lincoln Plaza de pies Tower
Olympia Y Mobil Bu,iding Plan of the America's
Reunion To wet 'Mart Hotel y Sur)
Life Fi d clity Union Ccntnl No. 3 Diamond One Centre Adolph us To wc r Detroit, Mich.
Detrdit Plaza Hotel David Stott
Penobacot Building Michigan Consolidated Gas Top of Troy Building
15000 Town Company Building Detroit Bank & Trust Buildihg 370
Guard i an Edison
(4 edificios) 479 J. L Building To
BOO k To McNamara Federal Off
13000 Dr. Building
Tower Detroit bank & Trust Budding 374 Continüa
YUE-STQE-O Alf-ATCRIO ESTRATIFICADO
Houston, Tex.
Regency Houston
Filadelfia, Pa.
Philadelphia Electric Company
Pittsburgh, Pa.
Plaza Oliver
Fuente: The W0fld Almanac e. Book of Facts, 1984 edition, copyright C)NewspaF Enterpri*
Auxiation, Inc., 19839 New York, NY 10166
barrio), áreas geográficas, o con una combinación de los dos. El último método es importante si usted dexa
comparar las estimaciones para pequeñas tiendas de barrio en diferentes secciones de la ciudad. Construya
cuidadosamente un marco, buscando varias fuentes de posibles listas de almacenes que deban ser incluidas en la
población. Elija un tamaño de muestra para obtener una varianza fijada de antemano para el estimador a un costo
mínimo. Etablezca estimaciones para cada estrato, así como para toda la población. Use una tabla de números
aleatorios en la selección real de Sus muestras.
424 5
ESTIMACIÓN DE
RAZÓN, REGRESIÓN Y
DIFERENCIA
ESTUDIO DE CASO
Puesta cuer* es conocido (es Io cantidcc presentado oor IO firrmJ, e! único oroeees
estimar r
LOS técnicos del Coaítula 6 puecern utilzorse para estmor 'o toral ael rventaro
reviscd0 y el error total del inventario. TOI análisis se presento pos erormen-
423
424 CE REGRESIÓN Y DIFERENCIA
6.4 INTRODUCCIÓN
6.2 ENCUESTAS WE
ESTIMADORES DE RAZÓN
Podemos estimar y usando y i, los promedios del contenido de azúcar y el peso para la
muestra de n naranjas. También, podemos medir , el peso total de las naranjas en el camión.
Entonces una estimación de razón del contenido total de azúcar r es
con un total similar para el año pasado, puede multiplicarse por las ventas totales
del año pasado para estimar las ventas totales de este año. Métodos similaresson
usados para predecir el crecimiento de la población.
En la investigación académica, los sociólogos están interesados en medidas
como la razón del presupuesto total mensual para alimentación con el ingreso total
mensual por familia, o la razón del número de niños con el número de personas que
viven en
6.3 ESTIMACIÓN RAZÓN
[E 127
una unidad habitacional. Los investigadores en medicina pueden medir la potencia relativa de un
nuevo medicamento, observando la razón de la cantidad promedio requerida del nuevo producto
para producir una respuesta con la cantidad promedio requerida de un medicamento tipo para la
misma respuesta.
Como usted puede ver, las aplicaciones posibles de la estimación de razón son in terminables.
Sin embargo, ahora desviaremos nuestra atención a la estructuración de estimadores para Ay, Ty y
R; y proporcionaremos ejemplos numéricos de cada uno. Cuando sea pertinente, las
comparacionesse harán con los estimadores de aquellos parámetros presentados en los capítulos
previos.
Vamos a suponer que una muestra irrestricta aleatoria de tamaño n será seleccionada de una
población finita que contiene N elementos. Entonces„¿cómo estimamos una media p„ un total Ty, o
una razón R poblacionales, utilizando la información de la muestra sobre y y una variable auxiliar
x?
(6.1)
Varianza estimada de r:
(6.2)
(6.3)
EJEMPLO 6.4
En una encuesta para examinar las tendencias en bienes ralces, un investigador está
interesado en el cambio relativo en el valor calculado de las casas en una comunidad
en particular durante un periodo de dos años. Una muestra irrestricta aleatoria de n
= 20 casases seleccionada de N = 1000 casas de la comunidad. [k los registrosfisca.
les, el investigador obtiene el valor calculado para este año (y) y el valor
correspondiente para hace dos años (x), de cada una de las n = 20 casas incluidas en
la muestra. El investigador desea estimar R, el cambio relativo en el valor calculado
para las N
1000 casas, usando la información contenida en la muestra.
actual
1 6.7
2
44,89 8.2 8.4 67.24 70.56 68.88 50.41
47.57
3 7.9 8.2 62.41 67.24 74.78
4 6.4 6.9 40.96 47.61 44.16
5 8.3 8.4 68.89 70.56 69.72
6 7.2 7.9 51.84 62.41 56.88
7 6.0 6.5 36.00 42.25 39.00 Los
8 7.4 7.6 54.76 57.76 56.24 datos
para la
9 8.1 8.9 65.61 79.21 72.09
encuesta
de 10 9.3 9.9 86.49 98.01 92.07
bienes
11 8.2 9.1 67.24 82.81 74.62 ralces se
12 6.8 7.3 46.24 53.29 49.64
13 7.4 7.8 54.76 60.84 57.72
14 7.5 8.3 56.25 68.89 62.25
15 8.3 8.9 68.89 79.21 73.87
16 9.1 9.6 82.81 92.16 87.36
17 8.6 8.7 73.96 75.69 74.82
18 7.9 8.8 62.41 77.44 69.52
19 6.3 7.0 39.69 49.00 44.10
20 8.9 9.4 79.21 88.36 83.66
6.3 ESTIMACIÓN
presentan en la Tabla 6.1. Hfrnos adicionadolas columnas x, , y Xi)', las cuales
son útiles para el cálculo de la V(r).
Usando los datos de la Tabla 6.1, estime R, el cambio relativo en el avalúo de
bienes raíces en el periodo de dos años dado. Establezca un límite para el error de
estimación.
[E 129
SOLUCIÓN
La estimación de R, usando los datos de la muestra, está dada por 20
154.5
Por lo tanto estimamos que el avalúo de bienes raíces se ha incrementado
aproximadamente un 20% en un periodo de dos años en el área estudiada.
El límite para el error de estimaciónse encuentra usando la Ecuación (6.3). Un
método abreviado para calcular Ei_l (Yi — rxi)2 está dado por
(6.4)
Estas cantidades pueden obtenerse de la Tabla 6.1 :
—
(Yi — 'Xi)2 = 1373.71 +
= 1.3157
Usando la Ecuación (6.5) resulta
1000 - 20 1 1.3157
= 0.02 20(1000) 2
19
(7.725)
Por lo tanto estimamos que la razón del avalúo actual de bienes
rafces con aquel de hace dos años es r = 1.07, y estamos bastante
confiados en que el error de estimación es menor que 0.02. Esto es, la razón verdaderaR para la
población deberá estar entre 1.05 y I .09. Nótese que el límite para el error de estimación es
bastante pequeño. En consecuencia r será un estimador muy preciso de R.
130 6 ESTIMACION PAZÕN, Y DIFERENEIA
Los intevalos de confianza para muestras grandes, basados en la teoría de la
distribución normal, presentados en el Capftulo 2, también se aplican en el caso de la
estimación de razón. Así, por ejemplo, un intervalo de confianza de aproximadamente
95% para la razón R es de laforma
CE REGRESION
d
e
rrx (6.5)
Varianza estimada de T :
2
t(ôy) = (6.6)
donde y Tx son la media y el total poblacionales, respectivamente, para la
variable aleatoria X.
(6.7)
Nótese que si bien no necesitamos conocer N o Ax, debemos conocer para estimar r
mediante el procedimiento de estimación de razón.
EJEMPLO 6.2
6.3 ESTIMACIÓN
SOLUCIÓN
H contenidode azúcar de una naranja usualmente es registradoen grados brix — una
medida del número de libras de sólidos (principalmente azúcar) por 100 libras de
jugo—. Para nuestros cálculos usaremos las libras por naranja. Una estimación de r
CERAZÓN USANDO MUESTREO IRRESTRICTO ALEATORIO 431
a021
040
2 0.030 0.48
3 0.025 0.43
4 0,022 0.42
5 0.033 0.50
6 0.027 0.46
7 0.019 0.39
8 0.021 0.41
9 0.023 0.42
10 0.025
E % =0.246 E = 4.35
0 246
132 6 ESTIMACION PAZÕN, Y DIFERENEIA
-¿.#1800) = 101.79 libras
Un límite para el error de estimación puede ser encontrado si usarnos una versión
modificada de la Ecuación (6.7). Debido a que en este ejemplo N es desconocida,
suponemos que la corrección por población finita (N — n)/ N, es casi la unidad. P.*a
suposición es razonable porque esperamos al menos N = 4000 naranjas en una carga
pequeña. La media muestral debe ser usada en lugar de en la Ecuación (6.7); puesto que
gx es desconocida. Con estos ajustes la Ecuación (6.7) se transfonna en
donde
6.3
De los datos,
= 0.10839
4 35
— = 0.435
10
Sustituyendoen la Ecuación (6.4) da
10
(1800)2 — 0.000052285
10
En resumen, la estimación de razón del contenido total de azúcar de la carga de na = 101.79,libras,
con un límite para el error de estimaciónde 6.3. Estamos confiados en que el contenido total de azúcar
cae dentro del intervalo
101.79 + 6.3
a
Usted recordara que el tamaño de la población N con frecuencia es desconocido.
Consecuentemente, el investigador debe decidir en qué condicionesel uso del estimador de razón = r gs
mejor que el del estimador correspondiente NI, donde ambos estimadores están basados en un muestreo
irrestricto aleatorio (véase Sección 6.5). En general, rrx pos— una varianza más pequeña que N' cuando
existe una fuerte correlación positiva entre X y y (donde.p, el coeficiente de correlación entre x y y, es
mayor que i), Intuitivamente, esta aseveración tiene sentido porque en estimación de razón se utiliza la
información adicional proporcionada por la variable auxiliar X.
Si un investigador está interesado en una media poblacional más que en un total poblacional, el
correspondiente procedimiento de estimación de razón se muestra en las Ecuaciones (6.8), (6.9) y (6.10).
134 6 ESTIVACIÓN REGRESIÓN Y DIFERENCIA
133
(6.8)
Varianza estimada A :
(6.9)
Límite para el error de estimación:
EJEMPLO 6.3
compaííía desea estimar la cantidad promedio de dinero pagado a los empleados por
gastos médicos durante los pruneros tres meses del aíío en curso. Ins reportes del
promedio por trimestres están disponibles en los informes fiscales del aiío anterior. Una
muestra aleatoria de 100 registros de empleados se seleccionó de una población de 1000
empleados. Los resultados de la muestra se resumen a continuación. los datos para
estimar y establezca un límite para el error de estimación.
n 100, N = 1000
Total para el trimestre actual:
100
= rgx
donde
12,500
Entonces18.23
= 441
= 0.42
1000— 100 441.68
100(1000) 99
Por lo tanto estimamos que la cantidad promedio de dinero pagado a
los empleados por gastas médicos es $18.2S. Estamos muy confiados en
que el error para estimar e; menor que $0.42.
Al recordar las fórmulas para la estimación de razón de una media, un total o una razón
poblacionales, hacemos las siguientes asociaciones. La razón muestral r está dada por la
fórmula
(6.11)
136 6 ESTIMACION RAZÓN, REGRESION Y DIFERENEIA
Luego los estimadores de R, Ty,y gy son
rgx
(6.12)
(6.13)
(6.14)
Por lo tanto solamente necesitamos conocer la fórmula para r y su relación con y ry. Las
varianzas aproximadas pueden ser obtenidas si usted recuerda la fórmula básica,
(6.15)
Así(6.16)
(6.17)
(6.18)
para n. Aunque no hemosrevisado la 6rma de V(r), usted recordará que V(r), la varianza
estimada de r, está dada por la fórmula
2
(6.19)
2
(6.20)
En este caso definimos
s
Una varianza poblacional aproximada, V(r), puede ser obtenida de V (r) reemplazandos
con la varianza poblacionalcorrespondiente*. Por lo tanto el número de observaciones
requeridas para estimar R, con un límite B para el error de estimación, se determina
despejando n de la siguiente ecuación:
En una situación práctica nos enfrentamos con el problema para determinar el tamaño
de muestra apropiado porque no conocemosc . Si no se dispone de información anterior
para calculars como un estimadorde , tomamos una muestra preliminar de tamaño ri y
calculamos
EJEMPLO 6.4
Una compañfa industrial desea estimar la razón de cambio del año pasado con este año en
cuanto al número de horas-hombre que se pierden debido a enfermedad. Se efectuó un
estudio preliminar con n' = IO registros de empleados, y los resultados se presentan en la
tabla adjunta. Los registros de la compañía muestran que el número total de horas-hombre
que se perdieron a causa de enfermedad el año anterior fue rx = 16,300. Use los datos para
determinar el tamaño de muestra requerido para estimar R, el cambio relativo para la
compañía, con un límite para el error de estimación de magnitud B = 0.01. Suponga que la
compañfa tiene 1000 empleados (N =
1000).
Horas-hombl* pedida• en perdHn•
en
Empleau e] a50 αη*Ηοτ, 'Χ el aHo actu•l, Υ
10 14 12
178 187
SOLlJClON
Primero, estudio prehminar. M calculamos
una admaci6n de
donde
= 4245
ΙΟ
187
178
Ιο tanto
10 ΙΟ
= + — 31.265
140 6 ESTIMACIÓN PAZÜN,
CE
10
31.265
= 3.474
9 9
El tamaño de muestra requerido ahora puede ser encontrado usando la Ecuación (6.22). Nótese que
16,300
= 16.3
N 1000
2 2
= 0.006642
4 4
N62 1000(3.474)
ND +62 10000006642) + 3.474
Por lo tanto debemos seleccionar aproximadamente 344 registros de empleados para estimar R, el
cambio relativo eq horas-hombre perdidas por enfermedad, con un límite para el error de estimación de
0.01 horas.
Asimismo podemos determinarel número de observaciones n necesarias para estimar una media
poblacional Ay, con un •te para el error de estimaciónde magnitud B. El tamaño de muestra requerido se
encuentra despejando n de la siguiente ecuación :
(6.23)
Establecido de manera diferente,
Tamaño de muestra requerido para estimar con un límite para el error de estimación B:
(6.24)
B2
6.4
Nótese que no necesitamos conocer el valor de gr para determinar n en la Ecuación (6.24); sin
embargo, necesitamos una estimación de (7 2, de información anterior si está disponible o de
información obtenida en un estudio preliminar.
139
EJEMPLO 6.5
Una investigadora desea estimar el número promedio de árboles por acre en una
plantación de N = 1000 acres. Ella planea seleccionar n parcelas de 1 acre y contarel
número de árboles Y' en cada parcela. También tiene fotografias aéreas de la plantación,
con las cuales puede estimar el número de árboles x en cada parcela para la plantación
completa. En consecuencia conoce gx. Por lo tanto parece apropiado usar un estimador de
razón para g . Determine el tamaño de muestra necesario para estimar gy con un límite
para el error de estimación de magnitud B = 1.0.
SOLUCIÓN
Suponiendo que no se dispone de información anterior, debemosconducir un estudio
preliminar para estimar . Puesto que un investigador sólo puede examinar 10 parcelas de
un acre en un día para determinar el número total de árboles y por parcela, resulta
conveniente realizar un estudio preliminar con n' = 10 parcelas. Tns resultados de tal
estudio se dan en la tabla adjunta, con la estimación aérea x correspondiente.
23
2 14 15
3 20 22
4 25 24
5 12 13
6 18 18
7 30 35
8 27 30
9 8 10
10 31 29
208 221
9
Usando la Ecuación (6.4):
6 ESTIMACON RAZÓN, Y DIFERENICIA
10 10
2
(25)2
(15)2 + + (29)2 = 5469
(23)2 + (14)2
+ . . . + (31)2 =
4872
440 [E PEGPESON
10
5144
10
221
208
10
= 37.8992
9 9
= 16.56
2
ND +c 1000(0.25) + 4.21
(6.25) o, equivalentemente,
Tamaño de muestra requerido para estimar con un límite para el error de esti-
mación B:
NC2
(6.26)
EJEMPLO 6.6
Un auditor desea comparar el valor verdadero en dólares del inventario de un hospital, Tv,
con el inventarioregistrado, El inventario registrado puedeser obtenido de los registros
almacenados en la computadora del hospital. El inventario real podría
determinarseexaminando y contando todos los artlculos del hospital, pero este proceso
serfa muy costoso y emplearía mucho tiempo. Por lo tanto el auditor planea estimar r con
base en una muestra de n hospital aleatoriamente.
En el inventario del hospital, los registros de computadora listan N = 2100 artlculos
de diferente tipo y el número de cada artlculo en particular. Con estos datos puede
obtenerse un valor total para cada artlculo, x, multiplicandoel número total de cada
artlculo registrado por el valor unitario de cada artlculo. El valor total de inventario
obtenido, según los registros de computadora, esta dado por
2100
SOLUCIÓN
Debido a que no hay información previa disponible, debe realizarse un estudio preliminar
para estimar . personas pueden determinar el valor verdadero y para cada uno de 15
artículosen un día. Para este ejemplo usaremos los datos del inventario
6 ESTIMACON RAZÓN, Y DIFERENICIA
Valor Valor
ArúculO de computadora, X real, y
1 4 15.0 14.0
2 9.5 9.0
3 14.2 12.5
4 20.5 22.0
5 6.7 6.3
6 9.8 8.4
7 25.7 28.5
8 12.6 10.0
9 15.1 14.4
10 30.9 28.2
11 7.3 155
12 28.6 26.3
13 14.7 13.1
14 20.5 19.5
15 10.9 9.8
242.0 237.5
6 ESTIVACIÓN CE RAZÓN, Y DIFERENCIA
REGPESON
de un solo día (n' = 15)como un estudio preliminar para obtener una primera estimación de y,
consecuentemente, una primera aproximación del tamaño requerido de muestra n. Eñ realidad, el
investigador probablemente efectuaría un estudio preliminar del inventario de dos o tres días para
proporcionar una buena aproximación de 2 y en consecuencia de n; sin embargo, para simplificar
10' cálculos, consideraremos un estudio preliminarden' = 15 artículos. Estos datosse resumen en la
tabla adjunta con las correspondientes cifras de la computadora (los datos en cientos de dólares).
Para determinar una estimación de u2 , debemos calcular
— 4522.19
= 4706.54
15
—0.98
+••+
= 4560.27
Por lo tanto
= 4522.19 +
= 104.2218
E (Yi
104.2218
7.4444
14 14
Ahora el tamaño de muestra requerido puede ser encontrado usando la Ecuación (6,26). Tenemos
0.01417
y por lo tanto
¯ 2100001417) + = 420.2326
6 ESTIVACIÓN CE RAZÓN, REGRESIÓN Y DIFEREhCIA
Así el auditor debe seleccionar aproximadamente 421 artículos para estimar, Ty, el valor real del
inventario, dentro de B = $50().
El uso del estimador de razón es más efectivo cuando la relación entre la respuesta yy una
variable auxiliar x es lineal a través del origen y la varianza de y es proporcional a
x. El ejemplo siguiente ilustra este punto. Un distribuidor de neumáticos para automóvil
desea estimar el promedio de los ingresos en efectivo para sus 1570 tiendas (N 1570)
durante un periodo particular de ventas. una muestra irrestricta aleatoria den = 50 tiendas,
los ingresos en efectivo correspondientesyi (i = 1, 2, 50) son observados. Un posible
estimador de gy, el promedio de los ingresos en efectivo para la compañia, es j, la media
muestral.
Además de obtener los ingresosen efectivo y„ suponga que el distribuidor puede
obtener Xi (i — 1, 2, — . . . , 50), el número de clientes que hacen compras en la tienda i
durante el periodo de ventas. Para determinar la relación entre y y X, el distribuidor puede
graficarlos datos de las ventas y los clientes para las n = 50 tiendas muestreadas.
Si la gráfica es similar a la presentada en la Figura 6.1 , podemos suponer que los
ingresos en efectivo y están linealmente relacionados con el número de clientes que
compran mercanclas, x. De hecho, podríamos representar esta relación mediante una línea
recta que pasa a través de la intersección de los ejes X y y, y por lo tanto podemos decir
que es lineal a través del origen. Además usted notará en la Figura 6.1 que la "dispersión "
de los valores dey se ensancha a medida que se incrementa X. Por lo tanto podemos decir
que la varianza de y es proporcional a X. En estas condiciones el estimador de razón de g ,
la cantidad promedio de ingresos en efectivo por tienda, deberá tener una varianza más
pequeña y, en consecuencia, será más preciso que
o 10 '20 30 40 50 60 70 80 90 100
x = número de clientes
FIGURA 6.1 Gráfica de kE itv•esos en efectivo contra el número de dientes
IE(ô) — s — (6.27)
donde 9 puede ser el estimador de razón r, o y 9 es el correspondiente pará.
metro estimado. Si las estimaciones de Ci, y Ax son conocidas de una
experimentación anterior, podemos estimar el sesgo máximo para una situación
asica dada usando la Ecuación (6.27).
Generalmente,para un tamaño de muestra grande (n > 30) y para (CHAx)
0.10, el sesgo es despreciable. Nótese también que los estimadores de razón son
insesgados cuando la relación entre y y x es lineal a través del origen.
Finalmente, debemos considerar el costo de obtención de información sobre
la variable auxiliar x. Si la situación • a sugiere el uso de la estimación de razón, el
experimentador debe decidir si el incremento en la precisión del estimador de
razón justifica el costo adicional.
EJEMPLO 6.7
Remítase al Ejemplo 6.4. Trate las 10 observaciones dadas ahí sobre horas-hombre
perdidas debido a enfermedad como una muestra irrestricta aleatoria de la
compañfa A. Asf 10, FA = 18.7, EA = 17.8, 1.05, NA = 1000 y 16,300.
Una muestra irrestricta aleatoria de 11, = IO mediciones fue tomada de la
compañla B dentro de la misma industria. (Suponga que las compañías A y B
juntas forman la población de trabajadoresde interés en este problema.) Los datos
se presentan en la tabla anexa. Se sabe que B = 1500 empleados y = 12,800.
Encuentre el estimador de razón separado de gy y su varianza estimada.
SOLUCIÓN
El estimador de razón de AyA es (FA/ [véase la Ecuación (6.8)], y su varianza
estimada está dada por la Ecuación (6.9).El estimador carrespondiente de gyB
con una varianza estimada similar.
Para obtener un estimador de Ay, la media poblacional de las y, necesitamos
promediar los estimadores eligiendo pesos proporcionales al tamaño de los estratos,
f(ôyRS)
El valor observado de según los datos, es
(y, = 87.45
146
1
2
34
414 6 5 12 10
6 6
7 4 2
8 4
9 8 4
10 16 8
78 46
=0.40
EJEMPLO 6.8
por•rc, la comoel
varian- m estimada
EB)1 -
2
= 10.24
= 11.80
16,300 + 12,800
= 11.64
2500
67 ESTIMACÓN DE REGRESIÓN 147
10.24
(11.64) = 10.13
11.80
También,— rc(Xi
= 51.56
— rc(Xi
- = 144.21
V(pyRC)
148
El estimador dado a continuación supone que las X
son fijadas de antemano y que las y son variables
aleatorias. Podemos considerar que el valor de X es
algo que ya ha sido observado, semejante a los ingresos
en el primer trimestre del año pasado, y la respuesta
pcomo una variable aleatoria que será observada, tal
como los ingresos trimestrales actuales de una
companía, para la cual ya se conoce X. Las propiedades
probabilfsticas del estimador entonces dependen
solamente de y para un conjunto dado de las x.
Varianza estimada
de g
(6.29) Límite para el error de estimación:
-
E 32
(6.30)
EJEMPLO 6.9
final
1
65
2 43 78
3 21 52
4 64 82
5 57 92
6 47 89
7 28 73
8 75 98
9 34 56
10 52 75
SOLUCIÓN
Los cálculos resultan = 76, = 46,
= 0.766
Entonces el valor observado de pyL es
+ b(gx - i) = 76 - 46) = 80
7.397
También, t(ôYL) -
y el límite para el error de estiP1ación es
6 ESTIMACÕN Y
apropiado que un estimador de razón. (Una gráfica de los puntos mostraría que la
línea de regresiónro pasa por el origen Sin embargo, el estimadorde de un regresi
ón
450 CE PAZC».I. REGRESOQ
ü(PyD) = (6.32)
donde di = Yi — Xi
Límite para el error de estimación:
EJEMPLO 6.40
para obtener una buena estimación del valor intervenido total o promedio para la
población.
Supóngase que una población contiene 180 artículos inventariados con un valor
establecidoen el libro de $13,320. Denote por Xi el valor en el libro y por el valor
intervenido del i-ésimo artículo. Una muestra irrestricta aleatoria de n = IO artículos
produce los resultados que se muestran en la tabla adjunta. Estime el valor intervenido
medio de g mediante el método de diferencia y estime la varianza de gyD.
9
10
2 14 12 +2
3 7 8 —1
4 29 26
47 —2
5 45
6 109 112 —3
7 40 36
8 238 240
-
2
9 60 59
10 170 167 +3
SOLUCIÓN
Puesto 71.7 y que 74.0,
6 ESTIMACÕN Y
= 6.27
9
Por lo tanto
REGRESIÓN
SOLUCIÓN
Empezando con el estimador de regresión, tenemos
Por lo tanto
71.7) = 74.38 • =o.99
Usando la Ecuación (6.29) y haciendo los cálculos se tiene
f'(ôYL) = 2.24
Para el estimador de razón de g , la Ecuación (6.8) da
721
(V ) —— (74) 74.41
Nótese que las tres estimaciones de son aproximadamente iguales, pero en este caso el
estimador de diferencia tiene la -varianza estimada más pequeña, y el estimador de regresión
con mucho tiene la varianza estimada mas grande.
¿Cómo seleccionarla usted el mejor estimador para una situación dada? El estimador de
diferencia trabaja bien cuando la gráfica de y contra X muestra que los puntos caen a lo largo
de una línea recta con pendiente igual a la unidad. Verificando
2 1
4 2 2
6 3 3
8 4 4
10 5 5
6.9 RESUMEN
454 6 RAZÓN, Y
información adicional para estimar el parámetro de la población de interés. Cuando existe una
fuerte correlacián positiva entre las variables x y y , el precedimiento de estimación de razón
usualmente proporciona estimadores más precisos de y que aquellos obtenidos con las técnicas
clásicas presentadas en el Capítulo 4.
Los tamaños de muestra requeridos para estimar gy, Ty y R fueron presentados con un
Ifmite para el error de estimación igual a B. En cada caso uno debe obtener una estimación de
con base en la información anterior o de un estudio preliminar para tener una aproximación del
tamaño de muestra requerido.
La estimación de regresión es otra técnica para incorporar información sobre una variable
auxiliar. Este método generalmente será mejor que la estimación de razón si la relación entre
las y y las X es una Ifnea recta que no pasa por el origen.
Aunque estos métodos pueden emplearse con cualquier diseño de muestreo, nos hemos
concentrado en el muestreo irrestricto aleatorio, mencionando el muestreo aleatorio
estratificado para el caso de razón.
El método de estimación de diferencia es similar en principio a la estimación de
regresión. Funciona bien cuando la gráfica de y contra x muestra que los puntos caen
uniformemente cerca de una línea recta con pendiente igual a la unidad.
70
--2 = 0.9
6.3
La estimadón de Ty, la cantidad totd intervenida,
135 7.0
1.4
[en unidades de SOCO), y el límite para el enor 5
2
= 14
EJERCICIOS
6.1 Un guardabosques está interesadoen estimar el volumen total de árboles en una venta de madera. Registra el
volumen de cada árbol en una muestra irrestricta aleatoria. Además mide el área basal de cada árbol
marcado para venta. Luego usa un estimador de razón del volumen total.
El guardabosques decide tomar una muestra irrestncta aleatoria de n = 12 de los N = 250 árboles
marcados para venta. Denótese por el área basal y por? el volumen en pies cúbicos para un árbol. El
área basal total para los 250 árboles, , es de 75 pies cuadrados. Use los datos de la tabla adjunta para
estimar , el volumen total en pies cúbicos de los árboles marcados para venta, y establezca un límite
para el error de estimación.
1 0.3 6
2 0.5 9
3 0.4 7
4 0.9 19
5 0.7 15
6 0.2 5
7 0.6 12
8 0.5 9
9 0.8 20
10 0.4 9
11 0.8 18
12 0.6 13
456 6 RAZÓN, Y
6.2 Use los datos de y en el Ejercicio 6.1 para calcular una estimación de TF , , Establezca un límite
para el error de estimación. Compare sus resultados con aquellos obtenidos en el Ejercicio 6.1. ¿Por qué
la estimación Ni, la cual no usa losdatosdel área basal, es mucho mayor que
457 6 CE RAZÓN,
EST'VIACIÕN
Cantidad gastada
Familia total, X en alimentos, y
64 Una corporación está interesada en estimar el total de ganancias por las ventas de televisiones de
color al final de un periodo de tres meses. tienen las cifras del total de ganancias de todos
distritos dentro de la corporaciónpara el periodo de tres meses correspondientedel año anterior.
Una muestra irrestricta aleatoria de 13 oficinas de distrito es seleccionada de las 123 oficinas de
la corporación. Usando un estimador de razón, estime y establezca un límite para el error de
estimación. Ue los datos de la tabla adjunta, y tome = 128,200.
550
2 720 780 EERCOOS 157
3 1500 1600
65 4 1030 los datos del Ejercicio 6.4 para estimar las
5 620 600
ganancias medias para las oficinas de la
6 980 1050 corporación. Establezca un límite para el
7 928 977 error de estimación.
6.6
8 1200 1440
Un investigadortiene una colonia de N =
9 1350 1570 763 ratas que han sido sometidasa un
10 1750 2210
11 670 980 •
12 729 865
13 1530 1710
458 CE RAZCN REGRESIÓN
fármaco tipo. El tiempo promedio para atravesar correctamente un laberinto bajo la influencia del
fármaco tipo fue de = 17.2 segundos. Al investigadorahofa le gustaría someter a un nuevo
fármaco a una muestra aleatoria de 11 ratas. Estime el tiempo promedio requerido para atravesar
el laberinto bajo la influencia del nuwo fármaco. (Véanse los datos en la tabla adjunta). Etablezca
un Ifmite para el error de estimación. (Sugerencia: empleo de un estimador de razón para g será
conveniente si suponemos que las ratas reaccionarán al nuevo fármaco de la misma manera que lo
hicieron con el fármaco tipo.)
1 14.3 15.2
2 15.7 16.1
3 17.8 18.1
4 17.5 17.6
5 13.2 14.5
6 18.8 19.4
7 17.6 17.5
8 14.3 14.1
9 14.9 15.2
10 17.9 18.1
11 19.2 19.5
6.7 Un grupo
utiliza en un estudio de nutrición. En un estudio previo se registró el peso de cada conejo. El
promediode estos pesos es 3.1 libras. Después de meses el experimentador quiere obtener una
aproximacióndel peso promedio de los conejos. Selecciona entonces al azarn = 10 conejos y los
pesa. Los los actuales se presentanen la tabla adjunta. Estime el promedio actual,
y establezca un límite para el error de estimación.
3.2
4.1
2 3.0 4.0
3 2.9 4.1
4 2.8 3.9
5 2.8 3.7
6 3.1 4.1
7 3.0
8 3.2 4.1
9 2.9 3.9
10 2.8 3.8
6.8 Un trabajador social quiere estimar la razón del número de cuartos por apartamento con el número
promedio de personas por apartamento en un determinado barrio de cierta área urbana. El
trabajador social selecciona una muestra irrestricta aleatoria de 25 apartamentos de los 275 del
barrio. Sea X, el número de personas en el apartamento i, y sea y, el número decuartos en el
apartamento i. En el cómputo del número de cuartos y el número de habitantesen cada
apartamento se obtuvieron los datos siguientes:
6 ESTWIACIC)N Y
E 2240, y? = 169.0
Estime la razón del número promedio de cuartos con el número promedio de personas en esta
área, y establea un límite para el error de estimación.
6.9 Un director de recursos forestales está interesado en estimar el número de abetos muertos por una
fuerte infestación en un área de 300 acres. Usando una fotografia aérea, el director divide el
área en 200 parcelas de uno y medio acres. Sean n la cantidad de abetos muertos, calculada con
base en la fotografia, y y la cantidad real en el terreno para una muestra imstricta aleatoriade n
= 10 parcelas. H número total de abetos muertos, obtenido según la cantidad en fotografia,
= 4200. Use los datos de la muestra de la tabla adjunta para estimar Ty , el número total de
abetos muertos en el área de 300 acres. Establezca un límite para el error de estimación.
12
2 30 42
3 2424
4 2436
5 18 24
6 30 36
7 12 14
8 6 10
9 36 48
10 42 54
6.10 Ins miembros de una asociación de maestros están interesadosen los incrementos salariales
otorgados a los maestros de escuela secundaria en un sistema acolar particular. Una muestra
irrestricta aleatoria de n 15 maestros es seleccionada de una lista en orden alfabético de todos
los maestros de escuela secundaria en el sistema. T m 15 maestrosson entrevistadospara
determinar sus salarios en este año y los del año pasado (véase la tabla adjunta). Use estos
datos para estimar R, el cambio relativo, para los N = 750 maestros de escuela secundaria en el
sistema escolar de la comunidad. Establezca un límite para el error de estimación.
815
897
2 919 992
3 690 752
4 984 1093
5 200 768
6 260 828
7 1323 1428
8 1067 1152
9 789 875
10 573 642
11 834 909
12 1049 1122
6.12 Una agencia de publicidad está interesadaen el efecto de una nueva campaña de promoción
regional sobre las ventas totalesde un productoen particular. Una muestra irrestricta aleatoria de n
= 20 tiendas es seleccionada de N = 452 tiendas regionales en las cuales se vende el producto. Ins
datos de las ventas trimestrales son obtenidos para el periodo actual de tres meses y para el
periodo de tres meses previo a la nueva campaña. estos datos (véase la tabla anexa) para estimar
ry, el total de ventas para le periodo actual, y establezca un límite para el error de estimación.
Supóngase que Tx = 216,256.
Ventas VentkS Ventas antes Ventas
Tienda antes de la campaha actuales Tienda de la campana actuale
6.15 Muestre cómo se ajustan las Ecuaciones (6.28) y (6.29) para estimar un total en lugar de una
media Ay.
6.16 Remftase al 6.9. Estime r usando un estimador de regresión, y establezca un límite para el
error de estimación. ¿Cree usted que para este problema el estimador de regresión es
mejor que el estimador de razón?
6.17 Ins comerciantes de futuros mercados están interesados en los precios relativos a ciertas
mercancías más que en los ñiveles del precio específico. Estos precios relativos pueden
presentarse en términos de una razón. Una muy importante en agricultura es la razón
res/cerdo. De 64 días de comercio en el primer trimestre de 1977, los precios de res y de
cerdo fueron obtenidos al seleccionar 18 días, con los resultados que se muestran en la
tabla adjunta. Estime el valor verdadero (py/ gx) para este periodo, y establezca un límite
para el error de estimación.
Res, Cerdo, X, Xi
417
Georgia 869 472
Illinois 1284 545
Massachusetts 547 57
New Jersey 699 407
Oklahoma 391 59
15 16 12
18 17 14
16 17 20
14 16
13 12 8
16 18 15
1981 1982
CE REGRESÔN
6.23 H ingreso nacional para 1981 será estimadocon base en una muestra de n = 10 industrias que declaran
sus ingresos de 1981 antes que las 35 restantes. (Existen 45 industrias que se utilizan para
determinar el ingreso nacional total.) Se dispone de los datos del ingreso de 1980 para las 45
industrias y los totales son 2174.2 (en miles de millones). Los datos se presentan en la tabla
adjunta.
462 6 ESTIVACON RAZÓN, Y
(a) Encuentre un estimador de razón del ingreso total de 1981, y establezca un límite para
el error de estimación.
(b) Encuentre un estimador de regresión del ingreso total de 1981 , y establezca un límite
para el error de estimación.
(c) Encuentre un estimador de diferencia del ingrzso total de 1981, y establezca un límite
para el error de estimación.
(d) ¿Cuál de los tres métodos, (a), (b) o (c), es el más apropiado en este caso? ¿Por qué?
6.24 El gerente de ventas de una empresa quiere medir la relación entre las ventas mensuales y los
costos de publicidad mensuales. { Usted qué parámetros le sugeriría estimar? ¿Por qué?
¿Qué datos debe recolectar el gerente?
6.25 Una empresa industrial elabora un producto que es empaquetado, para propósitos de
mercado, en dos marcas comerciales. Estas dos marcas sirven como estratos para estimar
el volumen poten cial de ventas para el trimestre siguiente. Una muestra irrestricta
aleatoria de clientes para cada marca es entrevistadapara proporcionar una cantidad
potencial y de ventas (en número de unidades) para el próximo trimestre. La cifra de las
ventas verdaderas del año pasado, para el mismo trimestre, está disponible para cada uno
de los clientes muenreados y se denota por x. Los datos presentan en la tabla anexa. La
muestra para la marca I fue tomada de una lista de 120 clientes, para quienes el total de
ventasen el mismo trimestredel año pasado fue de 24,500 unidades. La muestra de la
marca ll viene de 180 clientes, con un total trimestral de ventas para el año pasado de 21 ,
000 unidades. Encuentre una estimación de razón del total potencial de ventas para el
próximo trimestre. Estime la varianza de su estimador.
Marca 1 Marca II
6.1 La Tabla 6.3 muestra la temperatura normal (T)y la cantidad de precipitación(P) para las estaciones
meteorológicasen todo Estados Unidos. los datos de precipitaciónen enero y mano para una
muestra de n estaciones, y determine las estimaciones siguientes.
(a) Estime la razón de la precipitación promedio de mano con la precipitación promedio en
enero.
(b) Estime la precipitación promedio en mano para todas las estaciones, utilizando los datos de
enero y mano. EliJa uno de los tres posibles estimadores de este capitulo, y explique el moti
vo de su elección.
CE REGRESÔN
Gnnd Junction,
Colo. 27 0.6 34 0.6 41 0.8 52 0.8 62 0.6
Gnnd Rapids, Mich. 23 1.9 25 1.5 33 2.5 47 3.4 57 3.2
Hartford, Conn. 25 3.3 27 3.2 36 3.8 48 3.8 58 3.5
Helena, Mont. 18 0.6 25 0.4 31 0.7 43 0.9 52 1.8
Honolulu, Hawaii 72 4.4 72 2.5 73 3.2 75 1.4 77 1.0
Houston, Tex. 52 3.6 55 3.5 61 2.7 69 3.5 76 5.1
Huron, S.D. 13 0.4 18 0.8 29 1.1 46 2.0 57 2.8
Indianapolis, Ind. 28 2.9 31 2.4 40 3.8 52 3.9 62 4.1
Jackson, Miss. 47 4.5 50 4.6 56 5.6 66 4.7 73 4.4
Jacksonville, Ha. 55 2.8 56 3.6 61 3.6 68 3.1 74 3.2
Juneau, Alaska 24 3.9 28 3.4 32 3.6 39 3.0 47 3.3
Kansas City, Mo. 27 1.3 32 1.3 41 2.6 54 3.5 64 4.3
Knoxville, Tenn. 41 4.7 43 4.7 50 4.9 60 3.6 68 3.3
Lander, Wyo. 20 0.5 26 0.7 31 1.2 43 2.4 53 2.6
Little Rock, Ark. 40 4.2 43 4.4 50 4.9 62 5.3 70 5.3
Los Angeles, Calif. 57 3.0 58 2.8 59 2.2 62 1.3 65 0.1
Louisville, Ky. 33 3.5 36 3.5 44 5.1 56 4.1 65 4.2
Marquette, Mich. 18 1.5 20 1.5 27 1.9 40 2.6 50 2.9
Memphis, Tenn. 41 44 4.7 51 5.1 63 5.4 71 4.4
Miami, Fla. 67 2.2 68 2.0 71 2.1 75 3.6 78 6.1
Milwaukee, Wis. 19 1.6 23 1.1 31 2.2 45 2.8 54 2.9
Minneapolis, Minn. 12 0.7 17 0.8 28 1.7 45 2.0 57 3.4
Mobile, Ala. 51 4.7 54 4.8 59 7.1 68 5.6 75 4.5
Moline, 111. 22 1.7 26 1.3 36 2.6 51 3.8 61 3.9
Nashville, Tenn. 38 4.8 41 4.4 49 5.0 60 4.1 69 4.1
Newark, N.J. 31 2.9 33 3.0 41 3.9 52 3.4 62 3.6
New Orleans, La 53 4.5 56 4.8 61 5.5 69 4.2 75 4.2
New York, N.Y. 32 2.7 33 2.9 41 3.7 52 3.3 62 3.5
Nome, Alaska 6 0.9 5 0.8 7 0.8 19 0.7 35
Norfolk, Va. 41 3.4 41 3.3 48 3.4 58 2.7 67 3.3
Okla. City. Okla. 37 1.1 41 1.3 48 2.1 60 3.5 68 5.2
Omaha. Nebr. 23 0.8 28 1.0 37 1.6 52 3.0 63 4.1
Parkersburg, W. Va 33 3.1 35 2.8 43 3.8 55 3.5 64 3.6
Philadelphia, Pa. 32 2.8 34 2.6 42 3.7 53 3.3 63 3.4
Phoenix, Ariz. 51 0.7 55 0.6 60 0.8 68 0.3 76 0.1
Pittsburgh, Pa 28 2.8 29 2.4 38 3.6 50 3.4 60 3.6
Portland, Maine 22 3.4 23 3.5 32 3.6 43 3.3 53 3.3
Portland. Oreg. 38 5.9 43 4.1 46 3.6 51 2.2 57 2.1
Rovidence, 28 3.5 29 3.5 37 4.0 47 3.7 57 3.5
Raleigh, N.C 41 3.2 42 3.3 49 3.4 60 3.1 67 3.3
Rapid City, SD 22 0.5 26 0.6 31 1.0 45 2.1 55 2.8
Reno, Nev. 32 1.2 37 0.9 40 0.7 47 0.5 55
Richmond, Va. 38 2.9 39 3.0 47 3.4 58 2.8 67 3.4
EXPERIENCIAS CON' DATOS REALES
T P T P T P T P T P
Fuente: The World Almanac & Book Cf Facts, 1984 edition. copyright@Newspaper Enterprise
Association,lnc.. 1983, Ycyk, NY 10166.
6.2 En la Tabla 3 del Apéndice se presentan los datos del censo de 1980 de Estados Unidos. Usando como
estratos las cuatro regiones del país, forme una estimación de razón estratificada del total
poblacional de 1980, haciendo uso de los datos de 1970 para los estados y para Estados Unidas en
total. Seleccione una asignación y un tamaño de muestra apropiados. Establezca un 'te para el error
de estimación.
6.3 Un proyecto interesante es estimar qué porcentaje del dinero gastado para esparcrmlento por las
estudiantes de su comunidad corresponde a un tipo específico de entretenimiento, tal como el cine.
Usted puede obtener esta estimación listando una muestra irrestricta aleatoria de n estudiantes,
llamándolos por teléfOno (o entrevistándolospersonalmente), y registrando la cantidad total gastada
para esparcimiento (xi) así como la cantidad gastada en cine Luego estime la razón (1%/ gx), y
establezca un límite para el error de estimación.
Considere el tamaño de muestra antes de iniciar el estudio. También puede ser más conveniente
concentrarse en los estudiantes de una localidad, tal como un edificio de apartamentos o un grupo de
casas, más que en los estudiantes sin ninguna limitación. La no respuesta siempre es un problema
cuando se trata con poblaciones humanas, por lo tanto piense en las formas de minimizar este
problema.
6.45 La estimación de razón frecuentementees un método convemente para estimar las propiedades de objetos
materiales que son difíciles de medir directamente. Reúna una caja de piedras u objetos de
forma irregular. Se desea estimar el volumen total de las piedras. El volumen de Ójetos de forma
irregular es algo difícil de medir, pero el volumenesta relacionado con el peso, el cual es bastante
fácil de medir. Por lo tanto el volumen puede ser estimado usando la relación del volumen con el
peso.
166 6 ESTIMACION M PAZCN, PEGRESION Y DIFERENCIA
Seleccione una muestra den piedras. Mida el peE y el volumen & cada piedra en la
muestra. (Se puede usar el desplazamiento de agua como un método para medir el
volumen.) Luego ob. tenga el total de todas las piedras en la caja. Use estos datos para
construir una estimación del volumen total de las piedras, con un límite para el error de
estimación.
MUESTREO
SISTEMÁTICO
EL WEL CALIDAD?
antes están interesados en la calidad de Es
idos. consumidores quieren asegurarse que
ducto que funcionará de acuerdo con
te desea evidenaar que s s productos están
evidencia frecuentemente proporcionada por
el contrd de calidad dentro del proceso de
eo frecuentemente involucran la selecdón de
de una línea de producción en continuo
elecdón puede requerir el muestreode cada
n artículocada hora, o algún plan sistemático
idad observada para cada artículo puede una
el fiempo de duración, o sinvemente una
"aprobado" y "no aprobado" Luego compara
terística observada con un vabr que Sn..e de
e la calidad.
ieno equipo hidráulico, un componente
ce La característica de calidad principal de la
e que contiene el proceso de fabricación
de cada media hora de producción, y d dato
mula durante 8 Ex:xas de un día. Rr lo tanto
la producción de un día porcentajesde cobre
anza de 18. La norma para el bronce fuede
n la norma? Lm técnicas presentadasen este
der pregunta.
467
468 7 MIJESTPEO SISTEMATICO
7.4 INTRODUCCIÓN
l. El muestreo sistemático es más fácil de Iles.g a cabo en el campo, y por lo tanto, a diferencia de
las muestras irrestrictas aleatorias y las muestras aleatorias estratificadas, está menos expuesto
a los errores de selección que cometen los investigadores de campo.
2. H muestreo sistemático puede proporcionar mayor información que la que puede proporcionar
el muestreo irrestricto aleatorio por unidad de costo.
Recibo
Recibo muutreado
2
3 3
4
5
6
7
8 8
9
10
996
997
998 998
999
1000
mostrador de pago se le puede preguntar su opinión acerca del sabor, color, o textura de un producto
alimenticio. A cada décima persona que aborde un autobús
7.2 CÓMO SELECCIOBIARUNA S STEMÁTICA 171
se le puede pedir que llene un cuestionario acerca del servicio de autobús. Cada
centésimo automóvil que entra a un parque de diversión puede ser detenido y al
conductor preguntarle acerca de los sistemas de publicidad del parque o sobre el
preciode los boletos. Todas estas muestras son sistemáticas.
Las estimaciones de la producción de plantas cultivadas frecuentemente
resultan de muestras sistemáticasde terrenoscultivados y pequeñas parcelas dentro
de los terrenos cultivados. Asimismo los guardabosques pueden muestrear
sistemáticamente parcelas de terreno para estimar la proporción de árboles
enfermos o pueden muestrear sistemáticamente los mismos árboles para estudiar
patrones de crecimiento.
Por lo tanto el muestreo sistemático es un diseño conocida. Ahora
investigaremos la elaboracióq de estos diseños y las propiedades de los estimadores
resultantes de medias, totales y proporciones.
(7.1)
donde el subíndice sy significa que se utilizó el muestreo sistemático.
Varianza estimada de j.y:
(7.2)
Límite para el error de estimación:
—
Si N es desconocida,eliminamosla cpf, (N n)/N las Ecuaciones (7.2) y
7 MUESTREO
(7.3).
Usted reconocerá que la varianza estimada de dada en la Ecuación (7.2) es
idéntica a la varianza estimada de obtenida mediante muestreo irrestricto aleatorio
(Sección 4.3). Este resultado no implica que las varianzas poblacionales sean iguales.
La varianza de está dada por
(7.4)
Asimismo la vananza de está dada por
2
(7.5)
V(ñy)
n
7.3 POBIACIONALES
ES UNA MEDIA Y TOTAL 173
donde p una medida de la correlación entre los pares de elementos dentro de la misma muestra
sistemática. Si p está cercano a uno, entonces los elementos dentro de la muestra son bastante
similares con respecto a la característica que se está midiendo, y el muestreo sistemático producirá
una varianza de la media muestral mayor que la obtenida con el muestreo irrestricto aleatorio. Si p es
negativo, entonces el muestreo sistemático puede ser mejor que el muestreo irrestricto aleatorio. La
correlación puede ser negativa si los elementos dentro de la muestra sistemática tienden a ser
extremadamente diferentes. (Nótese que p no puede ser negativamente grande como para que la
expresión de la varianza llegue a ser negativa.) Para p cercano a cero y N bastante grande. el muestreo
sistemático es aproximadamente equivalente al muestreo irrestricto aleatorio.
Un estimador insesgado de V(Fsy) no puede ser obtenido usando solamente los datos de una
muestra sistemática. Este enunciado no implica que nunca podremosobtener una estimación de
v(Fsy). Cuando el muestreo sistemático es equivalente al muestreo irrestricto aleatorio, podemos
tomar como aproximadamente igual a la varianza estimada de basada en un muestreo irrestricto
aleatorio.
¿Para cuáles poblacionesocurre esta relación ?Para responder esta pregunta, debemos
considerar los tres tipos siguientes de poblaciones:
1. Población aleatoria,
2. Población ordenada,
3. Población periódica.
DEFINICIÓN 7.3 Una población es ordenada si los elementos dentro de la población están
ordenados en magnitud de acuerdo con algún esquema.
con una escala numérica. Se extrae'entoncesuna muestra de una lista de evaluaciones que están
distribuidas en orden numérico ascendente. La población de mediciones de la cual se extrae la
muestra se considera una población ordenada..
7 MUESTREO
Una muestra sistemática extralda de una población ordenada es generalmente heterogénea con
p O, Puede demostrarse, usando las Ecuaciones (7.4) y (7 ,5), que cuando N es grande y p 0,
Por lo tanto una muestra sistemática de una población ordenada proporciona más información que
una muestra irrestricta aleatoria por unidad de costo, debido a que la varianza de es menor que la
varianza correspondiente de
Ya que no podemos obtener una estimación de v( Fsy) con base en los datos de la muestra, una
estimación conservadora (una que es mayor de lo que se esperaría) de v( Fsy) está dada por t(ñy)
DEFINICIÓN 7.4 Una población es periódica si los elementos de lapoblación tienen variación ciclica.
Supóngase que estamos interesados en determinar el volumen de ventas promedio diario para
una cadena de tiendas de abarrotes. La población de las ventas diarias claramente es periódica,
ocurriendo las ventas máximas al final de cada semana. La efectividad de una muestra sistemática de 1
-en* depende de los valores que seleccionemos para k. Si muestreamos las ventas diarias cada
miércoles, probablemente subestimaríamos el promedio verdadero del volumen de ventas diario.
Asimismo si muestreamos las ventas cada viernes, probablemente sobreestimaríamos el promedio
verdadero de las ventas. Podríamos muestrear cada noveno día de trabajo para evitar muestrear
consistentemente los dfas de ventas altas o bajas.
Los elementos de una muestra sistemática extraída de una población periódica pueden ser
homogéneos (estoes p > O). Por ejemplo, los elementos de una muestra sistemática de ventas diarias
tomadas cada miércoles serán bastante homogéneos. Puede demostrarse, mediante las Ecuaciones
(7.4) y (7.5), que cuando N es grande y
Por lo tanto en este caso el muestreo sistemático proporciona menos información que el muestreo
irrestricto aleatorio por unidad de costo. Como en las situaciones anteriores, v( jsy) no puede ser
estimada directamente mediante una sola muestrasistemática. Podemos aproximar su valor usando V(
j), como para muestreo irrestricto aleatorio. En general este estimador subestimará la varianza
verdadera de
Para evitar este problema que ocurre con el muestreo sistemático de una población periódica, el
investigador podría cambiar varias veces el punto de inicio aleatorio. Este procedimiento reducirá la
posibilidad de seleccionar observaciones con la misma posición relativa en una población periódica.
Por ejemplo, cuando una muestra sistemática de 1-en-l() es extraída de una larga lista de tarjetas
archivadas, una tarjeta es
475
seleccionada aleatoriamente de entre las 10 primeras tarjetas (por*mplo, la no. 2) y
posteriormente cada décima tarjeta. Este procedimiento puede modificarse
seleccionando aleatoriamente una tarjeta de entre las primeras 10 (por ejemplo, la no. 2)
y posteriormentecada décima tarjeta para tal a las 15 seleccionesobtener los números
2, 12, 22, 152
7.3 POBIACIONALES
En este momento se puede seleccionarotro punto de inicio aleatorio de entre los 10
números siguientes:
EJEMPLO 7.4
mumtreado en la savia, y
2 82 6724
3 76 5776
83 6889
210
211 84 7056
212 80
79 6241
212 212
= 17,066
E
476
estos datos para estimar g , el contenido de azúcar promedio de los árboles de arce en la
finca. Establezca un límite para el error de estimación.
7 MUESTREO
SOLUCIÓN
Una estimación de g está dada por
17,066
= 80.5 n 212
Para encontrar un límite para el error de estimación, primero debemos calcular s .
Usando la fórmula para el cálculo, obtenemos
= 535.48
Intuitivamente, podemos suponer que la población de árboles en la finca es aleatoria.
Según esta suposición la varianza estimada de está dada por la Ecuación (7.2). Habiendo
realizado la muestra de 1-en-7, conocemos N. Suponiendo N = 1484 resulta
donde
Nótese que los resultados presentados en las Ecuaciones (7.6), (7.7) y (7.8) son
idénticos a los presentados para estimar un total poblacional mediante muestreo
irrestricto aleatorio. Este resultado no implica que la varianza de sea la misma que la
varianza de NP. Nuevamente no podemos obtener un estimador insesgado de V(Nñy)
con base en los datos de una sola muestra sitemática. Sin embargo, en ciertas
circunstancias, como se anotó antes, el muestreo sistemático es equivalente al
muestreo irrestricto aleatorio, y podemos usar los resultados presentados en la Sección
4.3.
EJEMPLO 7.2
SOLUCIÓN
Una suposición razonable es que la población es aleatoria; por lo tanto los muestreos
irrestricto aleatorio y el sistemático son equivalentes. Si la población fuese periódica, el
experimentador podría seleccionar varios puntos de inicio aleatorios en la selección de
los árboles que serán incluidos en la muestra.
Una estimación de r está dada por
= 1300(3.52) = 4576
Un límite para el error de estimación puede determinarse usando la Ecuación
(7.8) con n = 130:
7 MUESTREO
1300 -
= 150
478 SISTEMÁTICO
130
1300
Por lo tanto estimamos que 'la producción total del huerto
de manzanos es 4576 bushels, con un límite para el error de estimación de 150 bushels.
Un investigador a menudo desea usar los datos de una muestra sistemática para
estimar una proporción poblacional. Por ejemplo, para determinar la proporción de
votantes registrados que están a favor de una prometedora emisión de bonos, el
investigador podría utilizar una muestra sistemática de 1-en-k de la lista de votantes
registrados.
H estimador de la proporción poblacional p por muestreo sistemático se denota
mediante psy. Como en el muestreo irrestricto aleatorio (Sección 4.5), las propiedades
de psy son análogas a las propiedades de la media muestral si las mediciones de la
respuesta se definen como sigue: sea = O si el i-ésimo elemento muestreado no posee
la característica específica y = 1 si la posee. El estimador psy es entonces el promedio
de los valores 0 y 1 de la muestra.
(7.10)
donde ay
7.3 POBIACIONALES
Límite para el error de estimación:
179
7.4 ESTIMACIÓN PROPORCIÓN POBLACCNAL
EJEMPLO 7.3
Una muestra sistemática de 1-en-6 es obtenida de una lista de votantes registrados para
estimar la proporción de votantes que están a favor dela emisión de bonos propuesta.
Diferentes puntos de inicio aleatorio se utilizan para asegurar que los resultados de la
muestra no son afectados por variación periódica en la población. Los resultados
codificados de esta encuesta de elección previa se muestran en la tabla adjunta. Estime p,
la proporción de los 5775 votantes registrados que están a favor de la emisión de bonos
propuesta (N = 5775). Establezca un limite para el error de estimación.
16
5760
5766
5772 1
962
E Yi = 652
SOLUCIÓN
La proporción muestra I está dada por
962
652
== 0.678
962 962
7 MUESTREO
Puesto que N es grande y varios puntos de inicio aleatorio fueron seleccionados en la
extracción de la muestra sistemática, podemos suponer que
180 SISTEMATICO
5775
Por lo tanto estimamos que 0.678 (67.8%) de los votantes registrados favorece a la
emisión de bonos propuesta. Estamos relativamente confiados en que el error de
estimación es menor que 0.028 (2.8%).
(7.12)
EJEMPLO 7.4
SOLUCIÓN
Una suposición razonable es que la población es aleatoria; por lo tanto p O. Luego
podemos usar la Ecuación (7.3) para encontrar el tamaño de muestra aproximado.
Reemplazando pors y estableciendo
4 4
tenemos
2500(100)
= 96.19
2499(1) + 100
Por lo tanto la administración debe muestrear aproximadamente 97 cuentas para estimar
la cantidad promedio de tiempo que tienen de estar vencidas las cuentas atrasadas, con un
límite para el error de estimación de 2 días.
EBRO 7.5
Una empresa publicitaria está iniciando una campaña de promoción para un nuevo
producto. La empresa quiere muestrear clientes potenciales en una pequeña comunidad
para determinar la aceptación del producto.
7
482 VUESTPEOSSTEMÀT'CO
Para eliminar algo de los costos asociados con las entrevistas personales, el
investigador decide seleccionar una muestra sistemática de entre N = 5000
nombres listados en un registro de la comunidad y recolectar los datos mediante
entrevistas por teléfono. Determineel tamaño de muestra requerido para estimar
p, la proporción de personas que consideran "aceptable" el producto, con un límite
para el error de estimación de magnitud B = 0.03 (esto es, 3%).
SOLUCION
El tamaño de muestra requerido puede ser encontrado usando la Ecuación (7.14).
Aunque no se tienen disponibles datos anteriores sobre el nuevo producto,
podemos encontrar un tamaño de muestra aproximado. Haga p = 0.5 en la
Ecuación (7.14) y
B 2 (0.03) 2
= 0.000225
4 4
Entonces el tamaño de muestra requerido es
= 909.240
Por lo tanto la empresa debe entrevistar 910 personas para determinar la
aceptación del producto con un límite para el error de estimación de 3%.
Establecimos en la Sección 7.3 que no podemos estimar la varianza defrsy con base
en la información contenida en una sola muestra sistemática a menos que el
muestreo sistemático genere, con fines prácticos, una muestra aleatoria. Cuando
ocurre este resultado podemos usar los procedimientos de estimación del
muestreo irrestricto aleatorio explicados en la Sección 4.3. Sin embargo en la
mayoría de los casos el muestreo aleatorio sistemático no es equivalente al
muestreo irrestricto aleatorio. Un método alternativo debe ser usado para estimar
V(ñy). Tal ,métodoes el muestreo sistemático replicado.
Como el nombre lo implica, el muestreo sistemático replicado requiere de
réplicas, o sea de la selección de más de una muestra sistemática. Por ejemplo,
diez muestras sistemáticas de 1-en-50, cada una conteniendo seis mediciones,
podrían ser obtenidas en aproximadamente el mismo tiempo que una muestra
sistemática de I -en5 conteniendo 60 mediciones. Ambos procedimientos
producen 60 mediciones para estimar la media poblacional g , pero el
procedimientode muestreo replicado nos permite. estimar V(jsy) utilizando el
cuadrado de las desviaciones de las n, = 10 medias muestrales individuales
7 MUESTREO SISTEMÂTCO
alrededor de su media. El promedio g de las 10 medias muestrales estimará la
media poblacional p.
Para seleccionar n, muestras sistemáticas replicadas, debemos separar más
los elementos de cada muestra. Por lo tanto diez muestras de 1-en-50 (n, 10, k' =
50) de seis mediciones cada una contienen el mismo número de mediciones que
una sola muestra de 1-en-5 (k = 5) conteniendon = 6() mediciones. El punto de
inicio para
7.6 MUESTREO SISTEMÁTICO REPLICADO
17 177
21 181
42 202
73 233
81 241
86 246
102 262
112 272
185
Frecuentemente seleccionamos n, = 10 pues nos permite obtener suficientes medias
muestrales para adquirir una estimación satisfactoria de V(g). Seleccionamos k' de tal
manera que dé el mismo número de mediciones que se obtendrían con una sola muestra
sistemática de 1-en-k: así k =kn,
(7.15)
donde representa el promedio de la i-ésima muestra sistemática.
Varianza estimada de g :
t(fi) = (7.16)
Límite para el error de estimación:
(7.18)
Varianza estimada de f :
2
= N2 t(Ê) N2 (7.19)
Límite para el error de estimación:
EJEMPLO 7.6
7 MUESTREO SISTEMÂTCO
cado con 10 muestras de 8 automóvilescada una. Usando los datos que se presentan en la
Tabla 7.2, estime el número promedio de personas por automóvil y establezca un límite
para el error de estimación.
TmA 7.2 Datos del número de personas pcx automóvil [las resçllestas y, están en paréntesis)
Punto de inicio Segundo Tercer Cuarto Quinto Sexto Séptimo Octavo aleatorio elemento elemento
elemento elemento elemento elemento elemento
52 (4) 102 (5) 152 (3) 202 (6) 252 (i) 302 (4) 352 (4) 3.75
55 (3) 105 (4) 155 (2) 205 (4) 255 (2) 305 (3) 355 (4) 3.38
57 (4) 107 (6) 157 (2) 207 (3) 257 (2) 307 (1) 357 (3) 2.88
13 (6) 63 (4) 113 (6) 163 (7) 213 (2) 263 (3) 313 (2) 363 (7) 4.62
26 (4) 76 (5) 126 (7) 176 (4) 226 (2) 276 (6) 326 (2) 376 (6) 4.50
•31 (7) 81 (6) 131 (4) 181 (4) 231 (3) 281 (6) 331 (7) 381 (5) 5.25
35 (3) 85 (3) 135 (2) 185 (3) 235 (6) 285 (5) 335 (6) 385 (8) 4.50
40 (2) 90 (6) 140 (2) 190 (5) 240 (5) 290 (4) 340 (4) 390 (5) 4.12
45 (2) 95 (6) 145 (3) 195 (6) 245 (4) 295 (4) 345 (5) 395 (4) 4.25
46 (6) 96 (5) 146 (4) 196 (6) 246 (3) 296 (3) 346 (5) 396 (3) 4.38
SOLUCIÓN
Para una muestra sistemática
IV 400 5
n 80
Por lo tanto para n, = IO muestras k' = 10k = 10(5) 50
Los siguientes 10 números aleatorios entre el 1 y el 50 son extraídos:
13, 35, 2, 40, 26, 7, 31, 45, 5, 46
Los automóviles con estos números forman los puntos de inicio aleatorio para las muestras
sistemáticas.
En la Tabla 7.2 la cantidad es el promedio para la primera hilera, es el promedio para
la segunda hilera, y asf sucesivamente. La estimación de g es
187
Sustituyendo, obtenemos
1
- = 177.410 - — (1733.06) = 4.104
10
486
400 — 80
4.104
= 0.0365
400 10(9)
La estimación de g con un límite para el error de estimación es
osea 4.16±0.38
Por lo tanto nuestra mejor estimación del promedio de personas por automóvil es
4.16. H error de estimación será menor que 0.38 aproximadamente con una
probabilidad de 0.95.
7.7 RESUMEN
H muestreo sistemático es presentado como una alternativa para el muestreo
irrestricto aleatorio. El muestreo sistemático es más fácil de llevar a cabo y, por lo
tanto, está menos expuesto que el muestreo irrestricto aleatorio a los errores del
entrevistador. Además el muestreo sistemático frecuentemente proporciona más
información que el muestreo irrestricto aleatorio por unidad de costo.
Consideramos la estimación de una media, un total y una proporción
poblacionales usando los estimadores F,y, NPsy y psy, respectivamente. En estos
estimadores se establecieron los límites correspondientes para los errores de
estimación.
Para seleccionar entre el muestreo irrestricto aleatorio y el sistemático
primero debemos considerar el tipo de población que se investiga. Por ejemplo,
cuando N es grande y p < O, la varianza de es más pequeña que la varianza
correspondiente de y' basada en una muestra irrestricta aleatoria. Una muestra
7 MUESTREO SISTEMÂTCO
sistemática es preferible cuando la población es ordenada y N es grande. Cuando
la población es aleatoria, los dos procedimientos de muestreo son equivalentes y
cualquiera de los dos diseños puede ser usado. Debe tenerse cuidado en la
aplicación del muestreo sistemático para poblaciones periódicas.
Las necesidades de tamaño de muestra para estimar g , r y p son
determinadas usando las fórmulas presentadas para el muestreo irrestricto
aleatorio.
El muestreo sistemático replicado se estudió en la Sección 7.6; permite al
experimentador estimar la media o el total poblacionalesy la varianza del
estimador sin establecer ningún supuesto acerca de la naturaleza de la población.
7.1 Suponga que una compañía hipotecaria de casas tiene N hipotecas numeradas consecutivamen te
en el orden en que fueron otorgadas durante un periodo de X) años. Existe una tendencia de
incremento en los saldos sin pagar a causa del aumento en el costo de la vivienda a través de los años.
La compañía desea estimar la cantidad total de los saldos sin pagar. (Emplearía usted un muestreo
irrestricto aleatorio o un muestreo qué?
7.2 Una corporación lista a los empleados por grupos de ingresos (alfabéticamente dentro de grupos)
desde el más alto hasta el más bajo. Si el objetivo es estimar el ingreso promedio por
empleado, (deberá usarse el muestreo sistemático, el mueetreo estratificado o el muestreo
11Testricto aleatorio? Suponga que los costos son equivalentes para los tres métodos y que
usted puede estratificar por grupos de ingreso. Analice las ventajas y desventajas de los tres
métodos.
7.3 Una tienda de ventas al menudeo con cuatro departamentos tiene las cuentascorrientesordenadas
por departamento, con las cuentas vencidas al principio de la lista de cada departamento.
Suponga que cada departamento tiene en promedio alrededor de 10 cuentas, con
aproximadamente el 40% vencidas. Para un día específicolas cuentas podrían aparecer como
se muestra en la tabla adjunta (con números de cuenta del 1 al 40). La tienda desea estimar la
proporción de cuentas vencidas por muestreo sistemático.
(a) Liste todas las posibles muestras„sistemáticas de 1-en-10, y calcule la varianza exacta de
la proporción muestral. (Nótese ue hay IO valores posibles, no todos distintos, para la
propor ción muestral, cada uño con de probabilidad de ocurrir.)
(b) Liste todas las posibles muestras sistemáticas de 1-en-5, y calcule la varianza exacta de la
proporción muestral.
(C) Compare los resultadosde la parte (a) con la varianza aproximada que habría sido obtenida
con una muestra irrestncta aleatoria de tamaño n 4 de esta población. Asimismo compare
los resultados de la parte (b) con los que se obtendrían según una muestra irrestricta alea.
tona con n = 8. ¿Qué conclusiones generales pueden establecerse?
7.4 La gerencia de una compañia privada 3tá interesada en estimar la proporción de empleados que
favorecen una nueva política de inversión. Una muestra sistemática de 1-en-10 es obtenida de
los empleados que salen del edificio al final de un día de trabajo en particular. Use los datos de
la tabla adjunta para estimar p, la proporción a favor de la nueva política, y establezca un límite
para el error de estimación. Suponga N = 2000.
Empleado
muat
reado
7.5 Para la situación referida en el Ejercicio 7.4, determine el tamaño de muestra requerido para estimar
p, con un límite para el error de estimación de 0.01 unidades. ¿Qué tipo de muestra sistemática
deberá obtenerse?
7.6 La sección de control de calidad de una empresa usa el muestreosistemáticopara estimar la cantidad
promedio de llenado en latas de 12 onzas que sale de una linea de producción. Los datos de la
tabla adjunta representan una muestra sistemática de I -en-50 de la producción de un día.
Estime g, y establezca un Ifmite para el error de estimación. Suponga que N = 1800.
Cantidad de llenado (en onzas)
n = 45
Automóvil
7.10 La patrulla de caminos espera que pasen cuando menos N = 3000 automóviles por el puestode
verificación. Determine el tamaño de muestra requerido para estimar p con aproximación de
B = 0.015 unidades.
7.11 Un colegio está interesado en mejorar sus relaciones con una comunidad vecina. Una muestra
sistemfitica de 1-en-150de los N = 4500 estudiantes listados en el directorioes tomada para
estimar la cantidad total de dinero gastado en ropa durante un trimestre del año escolar.
resultados de la muestra están listados en la tabla anexa. Use los datos para estimar , y
establezca un límite para el error de estimación.
1 30 16 32
7 MUESTREO SISTEMÂTCO
2 22 17 14
3 10 18 29
4 62 19
5 28 20 50
6 31 21 9
7 40 22 15
29 23 6
10 7 MUES REO SISTEMÁTICO
9 17 24 93
10 51 25 21
11 29 26 20
12 21 27 13
13 13 28 12
14 15 29 29
15 23 30 38
n = 115
E = 2011.15
Yi = 407.1 (años)
N = 2300
Use estos datos para estimar
la cantidad promedio de
tiempo que las personas han
vivido en su casa actual.
Establezca un límite para el
error de estimación.
7.14 Un grupo de consejeros está
interesado en la colegiatura
promedio anual para los
estudiantes que radican fuera
del estado en 371 escuelas de
estudios universitarios de
primero y segundo años. A
partir de una lista en orden
alfabéticode estas escuelas se
extrae una muestra
sistemática de 1-en-7. Los
datos referentes a las costos
de la colegiaturafuera del
estado para un año escolar
(septiembre a junio) son
obtenidos de cada escuela en
la muestra. Sea y, la cantidad
requerida por colegiatura para
la i-ésima escuela en la
muestra. Use los datos
siguientes para estimar g , y
establezca un límite para el
error de estimación.
E = SI 1,950
E=
Nú
m
e
r
o
d
e
p
e
r
s
o
n
a
s
q
u
e
v
i
s
i
t
a
n
e
l
m
u
s
e
o
3 160
13 350
23 225
173 290
EJERCICIOS
494
Parcela Volumen
muestreada (en pies de tabla)
muestreada
4 7030 279
29 6720 304
54 6850 329
79 7210 354
104 7150 379
129 7370 404
154 7000 429
179 6930 454
204 6570 479
229 6910 504
254 7380
7.17 Los funcionarios de cierta
sociedad profesional desean
determinar la proporción de
miembros que apoyan varias
enmiendas propuestas en las
prácticas de arbitraje. Los
funcionarios conducen una
muestra sistemática de 1-en-
l(), a partir de una lista en
orden alfabético de los N =
650 miembros registrados.
Sea y, = 1 si la i-ésima persona
muestreada favorece los
cambios propuestos y y, = O si
se opone a los cambios. Use
los siguientes datos de la
muestra para estimar p, la
proporción de miembros en
favor de los cambios
propuestos. Establezca un
límite para el error de
estimación.
=
4
8
S
0
4
[Sugerencia: Si = fracción
estimada que alquila,
entonces NF es una
estimación del número total
que alquila; Ü(NF) = N2
7.19 Un granjero desea estimar el peso
total de fruto que producirá
un terreno de zuchini
(calabaza), muestreando
antes de la cosecha. La
parcela consiste de 20 hileras
con 400 plantas por hilera. El
vendedor delas semillas dice
que cada planta puede
producir hasta 8 libras de
fruto. Describa un plan de
muestreo sistemático para
este problema a fin de estimar
el peso total de fruto con
aproximación de 2000 libras.
492 7 VIIJESTPEO SISTEMÁTICO
Fuente: The
World Almanac
& Book of
Facts, 1984
edition,
çopyright@
Newspaper
Enterprise
Asociation, Inc.,
1983, New
York, NY 10166.
7.21 En la tabla anexa se
presentan los datos
sobre las tasas de
divorcio (por cada
1000 personas) en
Estados Unidos para
una muestra
sistemática de los años
de 1900. Estime la tasa
de divorcio promedio
anual para tal periodo
y establezca un límite
para el error de
estimación. ¿E en este
caso el muestreo
sistemático mejor o
peor que el muestreo
irrestricto aleatorio?
¿Por qué?
T
h
e
W
o
r
l
d
A
l
m
a
n
a
c
&
B
o
o
k
o
f
F
a
c
t
s
,
1
9
8
4
e
d
i
t
i
o
n
.
c
o
p
y
r
i
g
h
t
N
e
w
s
p
a
p
e
r
E
n
t
e
r
p
r
i
s
e
A
s
s
o
c
i
a
t
i
o
n
I
n
c
.
,
1
9
8
3
,
N
e
w
Y
o
r
k
,
N
Y
1
0
1
6
6
.
7.22 Un inspector de control
de calidad debe
maestrear obleas de
silicio. con las cuales
se fabricarán circuitos
integrados para
computadoras
después de haberse
horneado. En el horno
se colocan
consecutivamentechar
olas ranuradas que
contienen muchas
obleas durante todo el
día. La colocación de
la charola y la hora del
día pueden tener
efectos importantes
en la calidad de la
oblea. Sugiera un plan
de muestreo con el fin
de estimar la
proporción de obleas
defectuosas.
7.23 Un almacén contiene
estibas de
acumuladarespara
automóvilesque
deben ser
muestreados para la
inspección de calidad.
Cada estiba tiene
anotada una fecha de
producción diferentey
se ordeEXPERIENCIAS
CON DATCS FEAS
na cronológicamente. Los de
las estibas son
aproximadamente iguales.
Sugiera un plan de muestreo
para estimar la proporción de
acumuladores defectuosos.
724 Un auditor se enfrenta a una larga
lista de cuentas por cobrar de
una empresa. El auditor debe
verificar las cantidades con
base en un 10% de esas
cuentas, y estimar la diferencia
promedio entre los valores
revisados y los asentados en el
libro.
(a) Suponga que las cuentas
están ordenadas
cronológicamente,
teniendo las cuentas más
antigüas una tendencia a
tomar valores más
pequeños. Para seleccionar
la muestra, ¿escogerla
usted un diseño de
muestreo sistemático o un
muestreo irrestricto
aleatorio?
(b) Suponga que las cuentas
están colocadas
aleatonamente. Para
seleccionar la muestra,
¿usaría usted un diseño de
muestreo sistemático o un
muestreo irrestncto
aleatorio?
(c) Suponga que las cuentas
están agrupadas por
departamentos y que
dentro de éstos están
listadas en orden
cronológico. Nuevamente
las cuentas más antigüas
tienden a tomar valores
más pequeños. Para
seleccionar la muestra,
¿escogerla usted un diseño
de muestreo sistemático o
un muestreo irrestricto
aleatorio?
7.25 La participación en el mercado de
cierto producto alimenticio
será estimada registrando las
compras almacenadas del
producto durante algunas
semanas seleccionadas del
año. Analice las ventajas y
desventajas de una selección
sistemática de las semanas
para este estudio.
7.26 La producción de trigo para un
extenso terreno será estimada
muestreando parcelas
pequeñas dentro del terreno en
tanto que el cereal madura. El
terreno está en declive con
mayor fertilidad en el lado
más bajo.
(a) Sugiera un
diseño de
muestreo
sistemático
para las
parcelas
pequeñas. (b)
Podrían
usarse
eficazmente
otros diseños
de muestreo
en este caso?
195
496
8.4 INTRODUCCIÓN
Se recordará que el
objetivo del diseño
de encuestas por
muestreoes obtener
una cantidad
especificada de
información acerca
de un parámetro
poblacional a un
costo mínimo. H
muestreo aleatorio
estratificado es
frecuentemente más
adecuado para esto
que el muestreo
irrestricto aleatorio,
debido a los tres
principios indicados
en la Sección 5.1. H
muestreo sistemático
frecuentemente da
resultados al menos
tan exactos como el
muestreo irrestricto
aleatorio y es más
fácil de llevar a cabo,
según se trató en la
Sección 7.1. Este
capitulo introduce un
cuarto diseño,
muestreo por
conglomerados, el
cual algunas veces
proporciona más
información por
unidad de costo que
cualquier otro de los
tres diseños
estudiados
previamente.
DEFINICION
8.1 Una
muestra por
conglomerados
es una muestra
aleatoria en la
cual cada
unidad de
muestreo es
una colección,
o
conglomerado,
de ele. mentos.
El muestreo por
conglomerados es
menos costoso que el
muestreo aleatorio
estratificado o
irrestricto, si el costo
por obtener un marco
que liste todos los
elementos
poblacionales es muy
alto o si el costo por
obtener
observaciones se
incrementa con la
distancia que separa
los elementos.
Para explicarlo,
supóngase que
deseamos estimar el
ingreso promedio por
hogar en una gran
ciudad. ¿Cómo
debemos seleccionar
la muestra? Si
usamos muestreo
irrestricto aleatorio,
se requiere un marco
que liste todos los
hogares (elementos)
en la ciudad, y este
marco puede ser muy
costoso o imposible
de obtener. No
podemos evitar
497
1. No se encuentra disponible o es
muy costoso obtener un buen
marco que liste los elementos de
la población, mientras que se
puede lograr fácilmente un
marco que liste los
conglomerados.
2. El costo por obtener
observaciones se incrementa con
la distancia que separa los
elementos.
Las manzanas de la ciudad son
usadas frecuentemente como
conglomerados de hogares o de
personas, porque la Oficina de
Censos de Estados Unidos reporta
estadísticas de manzana muy
detalladas. En los datos censales
una manzana puede ser una
manzana de ciudad estándar o un
área de forma irregular con límites
políticos o geográficos
identificables. Las estadísticas de
manzana contienen información de
todas las áreas urbanas y lugares
con concentraciones de 10,000 0
más personas. En total las
estadísticas de manzana cubren el
77% de la población nacional. Los
datos reportados para cada
manzana incluyen la población
total, mezcla racial y número de
unidades habitacionales, y pueden
incluir el valor en dólares de la
propiedad, si la casa es alquilada o
propia y si tiene todos los servicios
de plomería.
Las estadísticas de manaana
de la Oficina de Censos son
ampliamente usadas en muestreo
por conglomerados por empresas
de investigación de mercados, las
cuales pueden desear estimar el
mercado potencial de un producto,
las ventas potenciales si se abre un
nuevo almacén en el área, o el
número potencial de clientes para
un nuevo servicio, tal como una
instalación de emergencias
médicas.
H gobierno estatal y local
muestrean manzanas
(conglomeradosde unidades
habitacionales o personas) a fin de
planear nuevos métodos y medios
de transporte y además los
desarrollos habitacionales.
Asimismo organizaciones
comunitarias, tales como iglesias,
utilizan estadísticas de manzanas
para determinar sitios óptimos de
ampliación.
Hay muchos otros ejemplos
comunes del uso de muestreo por
conglomerados. Las mismas
unidades habitacionalesson
conglomeradosde personas y
pueden formar
8
198 cacnv1ERADOS
unidades de muestreo convenientes al muestrear, por ejemplo, estudiantes
universitarios. Los hospitales forman conglomerados convenientes de pacientes con
ciertas enfermedades para estudios del tiempo promedio de hospitalización o
número promedio de recurrencias de padecimientos.
Otros elementos diferentes de personas son frecuentemente muestreados en
conglomerados. Un automóvil forma un buen conglomerado de cuatro llantas para
estudios de uso y seguridad de llantas. Un tablero de circuitos fabricado para una
computadora forma un conglomerado de semiconductores para prueba. Un
naranjo forma un conglomerado de naranjas para la investigación de infestación
por insectos. Una parcela en el bosque contiene un conglomerado de árboles para
la estimación de volúmenes de madera o proporción de árboles enfermos. Como
usted puede ver, la lista de posibles conglomerados, que son unidades
convenientes de muestreo, es infinita.
Ahora analizaremos los detalles de la selección de una muestra por conglomerados.
COh.anv1ERADOS
La primera tarea en muestreo por conglomerados es especificar los conglomerados
apropiados. Los elementos dentro de un conglomerado están
frecuentementejuntos ffsicamente, por lo que tienden a presentar características
similares. Dicho de otra manera, la medición en un elemento en un conglomerado
puede estar altamente correlacionada con la de otro elemento. Entonces la
cantidad de información acerca de un parámetro poblacional puede no
incrementarsesustancialmente al tomar nuevas mediciones dentro de un
conglomerado. Ya que las mediciones cuestan dinero, un experimentador podría
desperdiciar presupuesto si es que selecciona un conglomerado de gran tamaño. Sin
embargo pueden ocurrir situaciones en las cuales los elementos dentro de un
conglomerado son muy diferentes entre sí. En tales casos una muestra que
contenga pocos conglomerados grandes puede producir una estimación muy buena
de un parámetro poblacional, tal como la media.
Por ejemplo supóngase que los conglomerados están formados por cajas de
componentes que van saliendo de una línea de producción, un conglomeradode
componentes por llnea. Si todas las líneas tienen aproximadamente la misma tasa
de componentes defectuosos, entonces cada conglomerado (caja) es
aproximadamente tan variable con respecto a calidad como la población completa.
En este caso se puede obtener un buen estimador de la proporción de productos
defectuosos con base en uno o dos conglomerados.
En contraste, supóngase que los distritos escolaresse especifican como
conglomerados de hogares para estimar la proporción de familias que apoyan un
plan de rezonificación. Ya que los conglomerados contienen muchos hogares, los
recursos permiten únicamente el muestreo de un número pequeño de
conglomerados, dos o tres, por ejemplo. En este caso en un distrito la mayoría de
las familias puede estar satisfecha con sus escuelas y no apoyar la
rezonificación,mientras que en otro distritola mayoría puede estar inconforme con
sus escuelas y favorecer decididamente la rezonificación. Una muestra pequeña de
distritos escolares puede no contener a uno u otro de estos grupos, produciendo
por esto un estimador muy deficiente. Se puede obtener mayor información
muestreando un número grande de conglomerados de menor tamaño.
8.2 CÓMO POR 199
EJEMPLO 8.4
SOLUCIÓN
El muestreo por conglomerados parece ser la elección lógica para el diseño de la
encuesta porque no se encuentrg disponible una lista de elementos. La ciudad es
8
dividida en bloques rectangulares, excepto las dos áreas industriales y los tres
parques que contienen pocas casas. El sociólogo decide que cada bloque de la ciudad
va a ser considerado como un conglomerado, las dos áreas industriales van a ser
consideradas como otro, y, finalmente, los tres parques van a considerarse un
conglomerado más. Los conglomerados son numerados sobre un mapa de la ciudad,
con los números del 1 al 415. El experimentador tiene tiempo y dinero suficientes
para muestrear n = 25 conglomeradosy entrevistar a cada hogar dentro de cada uno.
Entonces se seleccionan 25 números aleatorios entre 1 y 415 de la Tabla 2 del
Apéndice, y los conglomerados con esos números son marcados en el mapa. Después
se asignan los entrevistadores a cada uno de los conglomerados seleccionados.
MUESTREO cncnv1ERADOS
(8.1)
Varianza estimada de :
(8.2)
8.3 ESTIMACICN CE MEDIA Y TOTAL POBLACIONALES
EJEMPLO 8.2
1 8 $ 96,000 14 10 649,000
2 12 121,000 15 9 53,000
3 4 42,000 16 3 50,000
4 5 65,000 17 6 32,000
8
5 6 52,000 18 5 22.000
6 6 40,000 19 5 45,000
7 7 75,000 20 4 37 ,000
8 5 65,000 21 6 51,000
9 8 45,000 22 8 30,000
10 3 50,000 23 7 39,000
11 85,000 24 3 47,000
12 6 43,000 25 8 41,000
13 5 54.000
SOLUCIÓN
H mejor estimador de la media poblacional ges dado por la Ecuación (8.1) y se
calcula como sigue:
caxa-avERADOS
= $8801
Pam calcular Off), necesitamos las siguientes cantidades:
25
6.04
El Ejemplo 8.1 nos da N 415. Entonces de la Ecuación (8.2)
= 653,785
POBLACIONALES 220
83 ESTIMACONCEI-NA TOTAL
(8.4)
Varianza estimada de MI :
(8.6)
EJEMPLO 8.3
Utilice los datos de la Tabla 8.1 para estimar el ingreso total de todos lo residentes de
la ciudad, y ponga un límite para el error de estimación: Existen 2500 residentes en la
ciudad.
SOLUCIÓN
Y POBLACONALES 221
La media muestral se calcula de $ 8801 en el Ejemplo 8.2. Entonces la estimación de T
es
= 2500(8801) = $22, 002, 500
MUESTREO
La cantidad V(l) se calcula con el método usado en el Ejemplo 8.2, excepto que M ahora puede ser
usado en lugar de ñ. La estimación de T con un límite para el error de estimación es
± 4,042, 848
nuevo este límite para el error de estimación es grande, y podría ser reducido incrementando el
tamaño de muestra.
Pt-- E y, (8.7)
es el promediode los totales de conglomerados para los n conglomerados muestreados. Es por esto que
es un estimador insesgado del promedio de los N totales de conglomerados en la población. Por el
mismo razonamiento empleado en el Capítulo 4,'Njt es un estimador insesgado de la suma de los
totales de conglomerados o, equivalentemente, del total poblacional T.
Por ejemplo es altamente improbable que se conozca el número de adultos varones en una
ciudad, por lo que el estimador Nit tendrá que ser usado en lugar de Mi para estimar T.
(8.8)
Nit=- E Y
= N2 f'(yt)
(8.9)
222 8
Límite para el error de estimación:
Si existe una gran cantidad de variación entre los tamaños de los conglomerados y si los tamaños
están altamente correlacionadoscon los totales de conglomerados, la
83 ESTIMACIÓN [E
varianza de [Ecuación (8.9)) es generalmente mayor que la varianza de MI [Ecuación
(8.5)]. El estimadorNjt no usa la información proporcionada por los tamaños de los
conglomerados mp m,, . . . , m n y por esto puede ser menos preciso
EJEMPLO 8.4
Use los datos de la Tabla 8.1 para estimar el ingreso total de todos los residentes de la
ciudad si M no es conocido. Establezca un límite para el error de estimación.
SOLUCIÓN
H Ejemplo 8.1 nos da N 415. la Ecuación (8.8) y la Tabla 8.1, la estimación del ingreso
total es
(1 329,000) =
Esta cantidad es bastante similar a la estimación dada en el Ejemplo 8.3.
Para fijar un límite al error de estimación, primero calculamos
Entonces la estimación del ingreso total de todos los residentes de la ciudad, con un
límite para el error de estimación, es
Ñ, dado por la Ecuación (8. l), es insesgado de la media poblacional V. Segundo, ü(j), dado
por la Ecuación (8.2), es un estimador insesgado de la varianza de Finalmente, los dos
estimadores, Mi y Ni, del total poblacional r son equivalentes.
EJEMPLO 8.5
1 2 3 3 2 4
19
2 3 2 2 3 4
20
1 2 16
3 2 3 2 1 3 20
4 1 3 2 5 2 3
SOLUCIÓN
De la Ecuación (8. l)
= 1.875
ntn 4(10)
También puede mostrarse que
Sustituyendo, obtenemos
Y POBLACONALES 225
2 2 2 2 2
E (Yi — Fmi) = (19) + (20) (16) + (20)
= 10.75
8.4 ESTIMACIÓN DE MEDIAS TOTALES
0.0089
Por lo tanto el mejor estimador del número promedio de periódicos por familia, con un
límite para el error de estimación, es
NnM2
226
(8.11)
La varianza real de es aproximadamente
V(j) = (02) (8.12)
NnÜ2
Debido a que no conocemos o el tamaño promedio del conglomerado, la elección del tamaño
de muestra, esto es, el número de conglomerados neceario para comprar una cantidad especificada
de información concerniente a un parámetro poblacional, es complicada. Eliminamos esta
dificultad utilizando el mismo método usado para la estimación de razón. Eto es, usamos un
estimador de y disponibles de una encuesta previa, o una muestra preliminar de n elementos. Las
estimaciones de y pueden calcularse de la muestra preliminar y utilizarse para obtener un tamaño
de muestra total aproximado n. Entonces, como en todos los problemas de selección de un tamaño
de muestra, igualamos dos desviaciones estándar de nuestro estimador, con un Ifmite para el error
de estimación B. Este límite es elegido por el experimentador y representa el máximo error que
desee tolerar. Esto es
ND (8.13)
donde Tc es estimado por Se
B2M2
para estimar el ingreso promedio por persona con un límite de $500 para el error de
estimación?
p
Y POBLACONALES 227
SOLUCION
Para utilizar la Ecuación (8.13), debemos estimar ; el mejor estimador disponible es Sc, el cual
puede ser calculado mediante el uso de los datos de la Tabla 8.1. Usando los cálculos del Ejemplo
8.2, tenemos
24
Y 228
La cantidad puede ser estimada por = 6.04 calculada con los datos de la Tabla 8. I.
Eüonces D es aproximadamente
B2m2
4 4
Usando la Ecuación (8.13) tenemos
= 166.58
Entonces se deben muestrear 167 conglomerados.
(8.14)
donde es estimada por Sc y
EJEMPLO 8.7
Usando nuevamente los datos de la Tabla 8.1 como una muestra preliminar de ingresos
en la ciudad, señale ¿qué tan grande se necesita una muestra para estimar el ingreso total
de todos los residentes, T, con un límite de para el error de estimación? Hay
2500 residentes en la ciudad (M = 2500)
SOLUCION
mediante
Usamos la Ecuación (8.14) y estimamos
como en el Ejemplo 8.6. Cuando estimamos T, usamos
ND
4(415)
Entonces, usando la Ecuación (8.14) nos da
= 212.88
Luego se deben muestrear 213 conglomerados para estimar el ingreso total con un
240 8 MIJES PEO POR CONG ov1ERADOS
El estimador Nit, que se muestra en la Ecuación (8.8), se usa para estimar cuando
M es desconocido. La varianza estimada de Ni que se muestra en la Ecuación
(8.9), es
f(NFt) = N
donde(8.15)
Entonces la varianza poblacional de Nit es
2
2 2 (8.16)
V(Njt) = N V(Ft) = N
donde es la cantidad poblacional estimada por st.
La estimación de T con un límite de B unidades para el error de estimación nos
lleva a la siguiente ecuación:
Tamaño
de
muetra aproximado requerido para estimar usando límite B para el error de
estimación:
Not2
ND (8.17) donde se estima mediante % , y
EJEMPLO 8.8
Supóngase que los datos de la Tabla 8. I provienen de un estudio preliminar de ingresos
en la ciudad y que no se conoce M. ¿Qué tan grande se debe tomar la muestra para
estimar el ingreso total de todos los residentes, r, con un límite de $l para el
error de estimación?
SOLUCION
La cantidad debe ser estimada por st , que se calcula con los datos de la Tabla 8.1.
Usando los cálculos del Ejemplo 8.4 nos da
24
8.5 CE PR)POPCON POBLACIONAL 241
+ = 182.88
Entonces se debe tomar una muestra de 188 conglomerados para tener un límite de $l
el error de estimación.
Nnü2 (8.19)
8
Límite para el error de atimación:
EJEMPLO 8.9
SOLUCIÓN
El mejor estimador de la proporción poblacional de arrendatarios F, que se muestra en la
Ecuación (8.18), donde
72
-- 0.48
calcular
z
151
ai — 2F ami
y de la Tabla 8.2
_ (415 — 25)(12.729)
= 0,00055
La estimación de p con un límite para el error de estimación
214 8 ca-anvERADOS
(8.21)
EJEMPLO 8.40
Los datos en la Tabla 8.2 son obsoletos. Se va a realizar
un nuevo estudio en la misma ciudad con el propósito de
estimar la proporción p de residentes que alquilan la casa
en que viven. ¿Qué tan grande se debe tomar la muestra para
estimar p, con un limite de 0.04 en el error de estimación?
SOLUCIÓN
El mejor estimador de (Yc es Sc, el cual es calculado
usando los datos de la Tabla 8.2:
2
Fmi)
12.729
0.530 24
La cantidad M es estimada por ñ = 6.04. También D es
aproximada por
B2m2
=0.0146
4 4
Entonces = 33.40
De modo que se deben muestrear 34 conglomerados para
estimar p, con un límite de 0.04 para el error de
estimación.
8. MUESTREO
7
Asf como en el caso de todos los demás métodos de muestreo,
el muestreo por conglomerados puede ser combinado con
muestreo estratificado, con objeto de que la pobla-
8.7 caviBlNADOCON ESTRATIFICACÕN
ción pueda ser dividida en L estratos y se pueda seleccionar entonces una muestra por
conglomerados en cada estrato.
Recuérdese que la Ecuación (8.1) tiene la forma de un estimador de razón y puede ser
considerada como la razón de un estimador del promedio de totales de conglomerados, con
respecto al estimador del tamaño promedio de conglomerados. Entonces, pensando en
términos de un estimador de razón, tenemos dos modos para formar el estimador de una
media poblacional a través de los estratos: el estimador separado y el estimador combinado.
Un poco de investigación nos mostrará que si se emplea el estimador separado, se debe
conocer el número total de elementos en cada estrato para poder asignar las ponderaciones
adecuadas por estrato. Ya que estas cantidades son comúnmente desconocidas, únicamente
analizaremos la forma combinada del estimador de razón en el contexto de muestreo por
conglomerados.
En lugar de presentar fórmulas generales que parezcan formidables, vamos a
ilustrar la técnica con un ejemplo numérico.
EJEMPLO 8.44
Consideremos los datos de la Tabla 8.1 como la muestra del estrato 1, con N, = 415 y
— 25, como en el Ejemplo 8.2. Se toma una ciudad vecina más pequeña como el estrato
2. Para el estrato 2, n = 10 bloquessevanamuestreardeN, = 168. Estimeel ingreso
promedio por persona en las dos ciudades combinadas, y establezca un límite para el
error de estimación, dados los datos adicionales que se muestran en la tabla anexa.
2 $ 18,000
2 5 52,000
3 7 68, 000
4 4 36, 000
5 3 45,000
6 8 96, 000
7 6 64, 000
8 10 115, 000
9 3 41, 000
SOLUCIÓN
H promedio de los totales de conglomerados en las respectivas muestras son 53,
160y yt2 = 54, 700. H promedio de los tamaños de los conglomeradosen las respectivas
muestras es 6 .04 y ñ2 = 4.9(). El estimador del promedio poblacional del total por
conglomerado es entonces
1
— + N2Ft2)
246 8 VUESTPEO POR cotE1-orv1ERADOS
1
— (NIñ1 + N2ñ2)
N2ñ12
pt2(n2 —
Fa) —
1) —
= 9385
415(6.04) + 168(4.90)
Para el estrato I
y para el estrato 2
Ya que= 3329.8 +
por lo que = 412,563.8
"F) = 1285
Entonces, el ingreso promedio por penona para las dos ciudades combinadas es
$9385 ± $1285
Vemos que el límite para el error de estimación es un poco más pequeño que el Ifmite
para el estrato l, como se encontró en el Ejemplo 8.2.
(8.22)
I
*F-- E Fi
La varianza estimada de ,uppa es también fácil de calcular
(8.23)
donde es la media del i-ésimo conglomerado.
Varianza estimada de
(8.24)
n(n — 1)
(8.26)
Varianza estimada de T
(8.27)
EJEMPLO 8.42
Un auditor desea muestrear los registros de ausencias por enfermedad de una gran
empresa, para estimar el número promedio de días de ausencia por enfermedad por
empleado en el cuatrimestre pasado. La empresa tiene ocho divisiones, con diferentes
números de empleados por división. Ya que el número de días de ausencia por
enfermedad dentro de cada división debe estar altamente correlacionado con el número
de empleados, el auditor decide muestrear n = 3 divisiones con probabilidad
proporcional al número de empleados. Muestre cómo seleccionar la muestra si los
respectivos númerosde empleadosson 1200, 450, 2100, 860, 2840, 1910, 290, 3200.
SOLUCIÓN
Primero listamos el número de empleados y el intervalo acumulado para cada diviSión,
como slgue•
12,950
8.8 MUESTREO POR CONGLOMERADOSCON PROBABILIDADESPROPORCONALESAL TAMAÑO 219
EJEMPLO 8.4 3
Supóngase que el número total de días de ausencia por enfermedad registrados en las
tres divisiones muestreadas durante el cuatrimestre pasado son, respectivamente,
Estime el número promedio de días de ausencia por enfermedad requeridos por persona,
de toda la empresa, y establezca un límite para el error de estimación.
SOLUCIÓN
Primero debemos calcular las medias de los conglomerados muestreados, las cuales
1
[(2.06 - 2.02)2 + (2.18 — 2.02) 2 + (1.81 — 2.02)21 3(2)
—0.0119
Entonces el límite para el error de estimación es
Nuestra estimación del número promedio de días de ausencia por enfermedad
utilizados por los empleados de la empresa es
2.02 ± 0.22
8.9 RESUMEN
Este capftulo introduce un tercer diseño de encuestas por muestreo. En este diseño
cada unidad de muestreo es un grupo, o conglomerado de elementos. El muestreo por
conglomerados puede proporcionar la máxima información al mínimo costo cuando no
se tiene un marco que liste los elementos de la población o cuando el costo por obtener
observaciones se incrementa con la distancia entre los elementos.
H estimador de la media poblacional g es la media muestral j, dada por la Ecuación
(8.1). La varianza estimada de es dada por la Ecuación (8.2). Se presentan dos
estimadores del total poblacional con'sus respectivas varianzas estimadas. Se presenta
el estimador MP en la Ecuación (8.4); el cual se usa cuando se conoce el número de
elementos M en la población. H estimador [véase la Ecuación (8.8)] usa cuando no se
conoce M.
En la Sección 8.4 se estudió un tamaño de muestra apropiado para estimar o r con
un límite especificado para el error de estimación.
En muestreo por conglomerados el estimador de una proporción poblacional p es
la proporción muestralF, dada por la Ecuación (8.18). La varianza estimada de F se
242 8
Así que
65 verdadera
ams la
estimación de la Proporción bien O. 16a
0.080
tiene 0.32.Tavms una edad igual o rnaycx a
anos.
65 co
n edad
igual o
rnayxy a
El
- (60.0864)
para
d área de 40
Ert)mes confianzaen
0.24 que del
dentes 16%de
EJERCICIOS
8.1 Una experimentadora que trabaja en un área urbana desea estimar el valor promedio de variable
altamente corrzlacionada con raza. Ella piensa que debe usar muestreo pm• conglomerados,
con manzanas como conglomerados y adultos dentm de manzanas elementos.
COCLav1ERADCS
Explique por qué se debería o no usar muestreo por conglomerados en cada una de las siguientes
situaciones.
(a) La mayoría de los adultos en ciertas manzanas son blancos y la mayoría son no blancos en otras
manzanas.
(b) La proporción de no blancos es la misma en cada bloque y no está cercana a 1 0 a O.
(c) La proporción de no blancos difiere de manzana a manzana en la manera que se podría esperar si los
conglomerados fueran hechos asignando aleatoriamente los adultos de la población a los
conglomerados.
Un fabricante de sierras de cinta quiere estimar el costo de reparación promedio mensual para las sierras
que ha vendido a ciertas industrias. El fabricante no puede obtener un costo de reparación para cada
sierra, pero puede obtener la cantidad total gastada en reparación y el número de sierras que tiene cada
industria. Entonces decide usar muestreo por conglomerados, con cada industria como un conglomerado.
El fabricante selecciona una muestra irrestricta aleatoria de n = 20 de N = 96 industrias a las que da
servicio. I_ns datos sobre costo total de reparaciones por industria y el númerode sierras por industria se
presentan en la tabla anexa. Estime el costo promedio de reparación por sierra para el mes pasado, Y'
establezca un límite para el error de estimación.
de (Eto total de
reparación
reparación para
para el r—
el pasado
pasado
(en dólara) (en dólares)
Industria Número de Número de
1 3 50 11 8 140
2 7 110 12 6 130
3 11 230 13 3 70
244 8
4 9 140 2 50
5 2 60 15 1 10
6 12 280 16 4 60
7 14 240 17 12 280
8 3 45 6 150
18
9 5 60 19 5 110
10 9 230 20 8 120
8.3 Para los datos en el Ejercicio 8.2, estime la cantidad total gastada por las 96 industrias en la reparación de sierras.
Establezca un límite para el error de estimación.
8.4 Después de verificar sus registros de ventas, el fabricante del Ejercicio 8.2 percata de que ha vendido un
total de 710 sierras a esas industrias. Usando esta información adicional, estime la cantidad total gastada
en reparación de sierras por estas industrias, y establezca un límite para el error de estimación.
El mismo fabricante (Ejercicio 8.2) quiere estimar el costo de reparación promedio por sierra para el mes
siguiente. {Cuántos conglomerados debe seleccionar en la muestra si quiere que el límite para el error de
estimación sea menor que $2.001
8.6 Un politólogodesarrolla una prueba para medir el grado de conocimiento sobre acontecimientos actuales. Él
quiere estimar la calificaciónpromedio que obtendrán en su prueba todos los estudiantes de una escuela
preparatoria. La administración de la escuela no le permitirá seleccionar aleatoriamente a los estudiantes
fuera de clases, pero sí interrumpir un pequeño número de clases con el propósito de aplicarla prueba a
cada miembro de la clase. Entonces el experimentador selecciona al azar 25 clases de un total de 108 a
una hora determinada. Se aplica la prueba a cada miembro de las muestreadas, con los resultadosque se
presentan en la tabla anexa.
245
EJERCCOS
Estime la calificación promedio que sería obtenida para prueba por todos los estudiantesen la
escuela. Establezca un límite para el error de estimación.
Número de Número de — Calificaci6n
total Cla• tudiante toul
1 31 14 40 1980
15 38 1990
2 29 28 1420
16
3 25 1590 17 17 900
1510 18 22 1080
4 35
1490 41 2010
19
5 15 1610 20 32 1740
800 21 35 1750
6 31
19
1720 22 890
7 22 1310 23 29 1470
1427 24 18 910
8 27
1290 31
25 1740
9 25 860
1620
10 19 710
11 30 1140
12 18
13 21
8.7 El politólogo del Ejercicio 8.6 quiere estimar la calificación promedio en la prueba para una escuela
preparatoria similar. Él quiere que el límite para el error de estimación sea menor que 2 puntos.
(Cuántas clases debe tomar en la muestra?Supóngaseque la escuela tiene 100 clasesdurante cada
hora en este periodo escolar.
88 Una industria está considerando la revisión de su política de jubilación y quiere estimar la pro porción
de empleados que apoyan la nueva política. industria consiste de 87 plantas separadas
localizadasen todo Estados Unidas. Ya que resultados deben ser obtenidosrápidamente Con
poco dinero, la industria decide usar muestreo por conglomerados, con cada planta como un
conglomerado. Se selecciona una muestra irrestricta aleatoria de 15 plantas y se obtienen las
opiniones de los empleados en estas plantas a través de un cuestionario. Los resultados presentan
en la tabla anexa. Estime la proporción de empleados en la industria que apoyan la nueva
política de jubilación y establezca un iímite para el error de estimación.
Número de empleada
Número de empleada
Númem de que apoyan la nueva Número de que apyan nueva
empleada Planta
1 51 42 9 73 54
2 62 53 10 61 45
49 40 11 58 51
3 73 45 12 52 29
4
101 63 65
246 8
5 13 49 37
6 48 31 14 55 42
65 38 15
7
49 30
8
8.9 La industria del Ejercicio 8.8 modificó su polltica de jubilación después de obtener los resultados de
la encuesta. Ahora se quiere estimar la proporción de empleados a favor de la polftica
modificada. (Cuántas plantas deben ser muestreadas para tener un limite de 0.08 para el error de
estimación? Use los datos del Ejercicio 8.8 para aproximar los resultados de la nueva encuesta.
MUESTREO CO.anvERADOS
8.10 Se diseña una encuesta económica para estimar la cantidad promedio gastada en servicios para el
hogar en una ciudad. Ya que no se encuentra disponible una lista de hogares, se usa muestreo
por conglomerados, con divisiones (barrios) formando los conglomerados. Se selecciona una
muestra aleatoria de bamos de la ciudad de un total de 60. Ins entrevistadoresobtienen el costo
de los servicios de cada hogar dentro de los bamos seleccionados; los costos totales se muestran
en la tabla anexa. Estime la cantidad promedio de gastos en servicios por hogar en la ciudad y
establezca un límite para el error de estimación.
1 55 $2210 11 73 $2930
2 60 2390 12 64 2470
3 63 2430 13 69 2830
4 58 2380 14 58 2370
5 71 2760 15 63 2390
6 78 3110 16 75 2870
7 69 2780 17 78 3210
8 58 2370 18 51 2430
9 52 1990 19 67 2730
71 2810 70 2880
10 20
8.11 En la encuesta del Ejercicio 8.10 se desconoceel número de hogares en la ciudad. Estime la cantidad
total Ostada en servicios por todos los hogares de la ciudad y establezca un límite para el error de
estimación.
8.12 La encuesta económica del Ejercicio 8. IO se va a llevar a cabo en una ciudad vecina de estructura
similar. El objetivo es estimar la cantidad total gastada m servicios por los hogares de la ciudad,
con un Umite de $5000 para el error de estimación. los datos del Ejercicio 8.10 para encontrar el
número aproximado de conglomerados que se necesitan para obtener este límite.
8 . 1 Un inspector quiere estimar el peso promedio de llenado para cajas de cereal empacadas en una
fábrica. El cereal está en paquetes que contienen 12 cajas cada uno. El inspectorseleccionaalea.
tonamente 5 y mide el peso de llenado de cada caja en los paquetes muestreados, con los
resultados (en onzas) que se muestran en la tabla acompañante. Estime el peso promediode
llenadopara las cajas empacadas por esta fábrica, y establezca un límite para el error
247
desestimación. Suponga que el número total de cajas empacadas por la fábrica es lo
suficientemente grande para que no se tome en cuenta la corrección por población finita.
1 16.1 15.9 16.1 16.2 15.9 15.8 16.1 16.2 16.0 15.9 15.8 160
2 15.9 16.2 15.8 16.0 16.3 16.1 15.8 15.9 16.0 16.1 16.1 15.9
3 16.2 16.0 15.7 16.3 15.8 16.0 15.9 16.0 16.1 15.0 15.9 16.1
4 15.9 16.1 16.2 16.1 16.1 16.3 15.9 16.1 15.9 15.9 16.0 16.0
5 16.0 15.8 16.3 15.7 16.1 15.9 16.0 16.1 15.8 16.0 16.1 15.9
E-EfuX)S
8.14 Un periódico quiere estimar la proporción de votantes que apoyan a cierto candidato , candidato
A, en una elección estatal. Ya que la selección y entrevista de una muestra irrestricta aleatona de
votantes registrados es muy costosa, utiliza muestreo por conglomerados, con distritos como
conglomerados. Se selecciona una muestra irrestricta aleatoria de 50 distritos de un total de 497
que tiene el estado. El periódico quiere hacer la estimación el día de la elección, pero antes de
que haya hecho la cuenta final de los votos. Es por que los reporteros son enviados a lugares
de votación de cada distritoen la muestra, para obtener la información pertinente directamente de
los votantes. Tm resultados se muestran en la tabla acompañante. Estime la proporción de
votantes que apoyan al candidato A, y establezca un Ifmite para el error de estimación.
42 6.2 60 6.3
51 52 6.7
49 6.7 61 5.9
55 4.9 49 6.1
oc»a-av1ERADCS
47 5.2 57 6.0
58 6.9 63 4.9
43 4.3 45 5.3
59 5.2 46 6.7
48 5.7 62 6.1
41 6.1 58 7.0
817 Para rmar la seguridad, una compañía de taxis quiere estimarla proporción de llantas inseguras en sus
175 taxis. (No considere las llantasde refacción.) La selección de una muestra alea. toria de
llantases impráctica, que se usa muestreo por conglomerados, con cada taxi como un
conglomerado. Una muestra irrestricta aleatoria de 25 taxis nos da los siguientes números de
llantas inseguras por taxi:
Estime la proporción de llantas inseguras que están usando en la compañía de taxis. y establezca
un límite para el error de estimación.
8.18 Los comercios solicitan frecuentemente a los contadores la realización de Inventarios. Ya que un
inventario completo es costoso, a través del muestreo se pueden realizar inventarios cada cuatro
meses. Supóngase que una empresa abastecedora de artículos de plomería desea un inventario
para muchos artículos pequeños en existencia. La obtención de una muestra aleatoria de articulos
muy difícil. Sin embargo, los artículos encuentran dispuestosen anaqueles, y la selección de una
muestra aleatoria de anaqueles es relativamente fácil, considerando a cada anaquel como un
conglomerado de artículos. Una muestra de 10 anaquelesde un total de 48 dio los resultados que
se muestran en la tabla siguiente. Estime la
cantidad total de dólares de los en los
anaqueles y establezca un límite para el error
de estimación.
249
42 83
2 27 62
3 38 45
4 63 112
5 72 96
6 12 58
7 24 75
8 58
9 32 67
10 41 80
8.19 Una empresa especializada en la fabricación y venta de ropa de descanso tiene 80 almacenes en
Florida y 140 en California. Con cada estado como un estrato, la empresa desea estimar el
tiempo promedio de ausencia por enfermedad por empleado durante el año pasado. Cada
almacén puede ser considerado como un conglomerado de empleados, y se puede determinar de
los registros el tiempo total de ausencia por enfermedad para cada almacén. Muestras inutrictas
aleatorias de 8 almacenes de Florida y IO almacenes de Califomia nos dan los resultados que
muestran en la tabla acompañante (m, denota el número de empleados y denota el total de días
de ausencia por enfermedad para el i-aimo almacén). Estime la cantidad promedio de ausencia
por enfermedad por empleado, Y' calcule un estimador de la varianza de su estimador.
EJERCICIOS
51
52 32
30 11
36 10
71 12 33
15 48 39
10 39 24 61
21 30 37
21
41
250 8
8.20 Las estadísticas de manzana reportan el número de unidade habitacionale, el número de residentes y
el número total de cuartos dentro de las unidades habitacionala para una muestra aleatona de
ocho manzanas seleccionadas de una gran ciudad. (Suponga que el número de manzanas en la
ciudad es muy grande.) datos se preentan m la tabla acompañante.
(a) Estime el número promedio de residentes por unidad habitacional y establezca un límite para
el error de estimación.
(b) Estime el número promedio de cuartos por residente y establezca un límite para el error de
estimación.
8.21 Cierto tipo de tableros de circuitos fabricados para su instalación en computadoras tiene 12
microcircuitospor tablero. Durante la inspección de control de calidad de IO de tableros, el
número de microcircuitos defectuosos por tablero fue como sigue:
Número de
15
2 27 3
251
3 9
4 31 1
5 16 2
824 Suponga que para la empresa del Ejercicio 8.23, los 15 departamentos tienen el número de
artlculos del equipo que se da en la tabla acompañante. Seleccione una muestra de 3
departamentos, con probabilidades proporcionales al número de artículos del equipo.
Número de N de
arúul«
1 12 9 31
2 9 10 26
27 11 22
3
4 40 12 19
5 35 13
14 33
6 15
15 6
7 18
8 10
8 25 Suponga que los tres departamentos seleccionados en el Ejercicio 8.24 tienen cada uno cbs artfculos
del equipo identificadosinapropiadamente. Estime el número total de artlculosimpro• piarnente
identificados en la empresa y establezca un límite para el error de estimación.
8.26 Un gran embarque de mariscos congelados es empaquetado en cajas, conteniendo cada uno
veinticuatro paquetes de 5 libras. Hay cien cajas en el embarque. Un inspector del gobierno
determina el —o total (en libras) de mariscos dañados para cada una de cinco cajas muestreadas.
datos son como sigue:
9, 6, 3, 10, 2
lecciones de unidades habitacionales (dormitorios para estudiantes de primer año, C"" de fra•
temidad, y así sucesivamente) pueden ser usadas como estratos. Analice los méritos de muetreo
por conglomeradoscontra muestreo aleatorio estratificado , si el objetivo es estimar la
proporción de estudiantes que fhvorecen a cierto candidato en los siguientes tipos de elecciones.
(a) Una elección de dirigentes estudiantiles. (b)
Una elección del presidente del país.
8.29 ¿En qué condiciones el muestreo por conglomerados produce un límite más pequeño para el
error de estimación de una media que el muestreo irrestricto aleatorio?
252 8
8.30 Sin considerar los costos de muestreo, ¿qué criterio usaría usted para seleccionar conglomerados
apropiados en un problema de muestreo por conglomerados?
8.1 En la
Tabla S del Apéndicese muestra el ingreso por persona en Unidos (durante 1977). Se presentan
también valores para la población de 1980. Tratando a cada estado como un conglomerado de
personas, seleccione una muestra aleatoria de estados y estime el ingreso personal total para
Estados Unidos. Establezca un límite para el error de estimación.
8.2 Trate de realizar un estudio económico, tal vez considerando los en cierta área fija (tal unas
cuantas manzanas de la ciudad) como conglomerados de personas. Seleccione una muestra de n
hogares y, después de obtener el permiso para la entrevista, registre la cantidad total semanal
que se gasta en alimentos por todos los individuos en el hogar, y el número de individuos.
Entonces estime la cantidad promedio gastada en alimentos por persona entre los hogares de esta
población. Aun si todo el dinero es realmente gastado por una persona (digamosla madre), la
cantidad total es la misma que se hubiera registrado si cada individuo hubiera comprado su
propia alimentación. Entonces, dispone del total para el conglomerado, aun cuando puede no
contarse con las observaciones por elemento.
MUESTREO
COBIGLOMERADOS
DOS ETAPAS
ESTUDIO DE CASO
234
M-BTFK)POR CO,anv1ERADOS ETAPAS
232 9
9.4 INTRODUCCIÓN
El muestreo por conglomerados en dos etapas es una extensión del concepto del
muestreo por conglomerados. Usted recordará, de la explicación del muestreo por
conglomerados en el Capltulo 8, que un conglomerado es usualmente una
colección conveniente o natural de elementos, tal como manzanas de casas o cajas
de bombillas de magnesio. Un conglomerado frecuentemente contiene
demasiados elementos para obtener una medición de cada uno de ellos, o éstos
son tan semejantes que la medición de sólo unos cuantos proporciona
información sobre un conglomerado completo. Cuando cualquiera de las dos
situaciones ocurre, el experimentador puede seleccionar una muestra aleatoria de
conglomeradosy después tomar una muestra aleatoria de los elementos dentro de
cada conglomerado. H resultado es una muestra por conglomerados en dos
etapas.
DEFINICIÓN 9.1 Una muestra por conglomerados en dos etapas se obtiene
seleccionando primero una muestra aleatoria de conglomerados y
posteriormen• te una muestra aleatoria de los elementos de cada
conglomerado muestreado.
Por ejemplo puede realizarse una encuesta nacional sobre las opiniones de
los estudiantes universitarios seleccionandouna muestra irrestricta aleatoria de
universidades de entre todas aquellas en el país y posteriormente seleccionando
una muestra irrestricta aleatoria de los estudiantes de cada universidad
seleccionada. Por lo tanto una universidad corresponde a un conglomerado de
estudiantes. Asimismo la cantidad total de las cuentas por cobrar para una
empresa con una cadena de tiendas. puede ser estimada tomando primero una
muestra irrestricta aleatoria de tiendas y
233
posteriormente seleccionando una muestra aleatoria de las cuentas de cada tienda
seleccionada. Por lo tanto tienda en la cadena pmporóna un de cualtas, El muestreo por
conglomerados en dos etapas se usa comúnmente en las encues tas grandes que involucran el
muestreo de unidades habitacionales. Mencionamos en el Capltulo 4 que la encuesta de Gallup
muestrea aproximadamente trescientos distritos electorales en todo Estados Unidos. En la segunda
etapa esta encuesta selecciona aleatoriamente (o sistemáticamente) aproximadamente cinco casas
por distrito, para tener un tamaño de muestra total de alrededor de mil quinientas casas. En otras
encuestas las estadlsticas de manzana de la Oficina del Censo de Estados Unidos forman
conglomerados de casas, como se explicó en el Capltulo 8, los cuales posteriormente son
submuestrados antes de realizar las entrevistas.
El muestreo con propósitos de control de calidad frecuentemente involucra dos (o más)
etapas de muestreo. Por ejemplo, cuando un inspector muestrea productos empaquetados, tal como
alimentos congelados, el inspector comúnmente muestrea cajas y después muestrea paquetes
dentro de cajas. Cuando uno está muestreando artículos producidos en diversas etapas de proceso,
uno podría muestrear etapas de proceso y posteriormente muestrear artículos producidos en cada
etapa muestreada. Cuando el muestreo requiere una investigación detallada de los componentes de
los productos, tal como medir el grosor de las placas en los acumuladores de automóvil, un
6.3
9.2
El primer problema en la selección de una muestra por conglomerados en dos etapas es la elección
de conglomerados apropiados. Dos condiciones son deseables: (l)proxi•
COCI-avERADOS cr:s
Mn
(9.1)
Varianza
estimada
de g :
(9.2)
236 9
donde(9.3)
mi
(9.4) mi — 1
CCNYOv1ERADOS DCS EVPBSS
EJEMPLO 9.4
TABLA 9.1
Ternpo Sn funcionar para máquinas de coser
50 10 5, 7, 9, o, 11, 2, 8, 4, 3, 5 5.40
11.38
2 65 13 4, 3, 7, 2, 11, O, i, 9, 4, 3, 2, 1, 5 4.00
10.67
3 45 9 5, 6, 4, 11, 12, o, 1, 8, 4 5.67 16.75
4 48 10 6, 4, o, 1, o, 9, 8, 4, 6, 10 4.80
13.29
9.3 ESTiMACÓN MEDIA
5 52 10 11, 4, 3, 1, o, 2, 8, 6, 5, 3 4.30
11.12
6 58 12 12, 11, 3, 4, 2, q q 1, 4, 3, 3.83
14.88
7 42 85.00 5.14
8 66 133.85 4.31
9 40 84.88 6.13
10 56 11 6, 7, 5, 10, 11, 2, 1, 4, o, 5, 4 5.00
11.80
SOLUCIÓN
El mejor estimador de g es p, que se muestra en la Ecuación (9. l),
el cual produce
E Miñ
Mn
INSESGADA UNA Y CNALES
237
90
= 768.38
238 9
11.80
11
= 21,990.96
Luego de la Ecuación (9.2)
(21,990.96)
= 0.037094
La estimación de g con un Ifmite para el error de estimación esta dada por
E Miñ
(9.6)
239 9 MUESTREO
POR CONGLOMEPADOS EN DOSEYÃPAS
Varianza estimada de
donde Sb está dada por•la Ecuación (9.3) y Si está dada por la Ecuación (9.4). Límite para
el error de estimación:
(9.8)
Nótese we no necesitamos conocer M yara calcular T o la varianza estimada de
puesto que lasM se cancelan en las fórmulas para r y V(â) [véanse las Ecuaciones (9.6) y
(9.7)].
EJEMPLO 9.2
Estime la cantidad total de tiempo sin funcionar durante el mes pasado para todas las
máquinas propiedad del fabricante del Ejemplo 9.1. Establezca un límite para el error de
estimación.
SOLUCIÓN
La mejor estimación de T es
90
- (2400.59) = 21,605.31
La varianza estimada de se encuentra usando el valor de V(E) calculado en el Ejemplo 9.1
y sustituyendo como sigue:
06) = M 2 t(Ê) =
La estimación de r, con un límite para el error de estimación, es
o sea 21,605.31 o sea 21 ,
605.31 1733.4
Por lo tanto la estimación del total de tiempo sin funcionar es horas.
Tendremos bastante confianza en que el error de estimación sea menor que 1733.4
horas.
9 MUESTREO
9.4 ESTIMACIÓN DE RAZÓN DE UNA MEDIA
POBLACIONAL
El estimador g, dado por la Ecuación (9.1), depende del número total de elementos en la
población, M. CuandoM es desconocido, como es frecuentementeel caso, en-
9.4 RAZÓN Uu POBLACIONAL 239
tonces debe ser estimadocon base en los datos de la muestra. Obtenemos un estimador de
M multiplicandoel tamaño de conglomerado promedio, Mi/ n, por el número de
conglomeradosen la población, N. Si reemplazamos M por su estimador. obtenemos un
estimador de razón, denotado por debido a que tanto el numerador como el denominador
son variables aleatorias.
Varianza
EJEMPLO 9.3
Usando los datos de la Tabla 9.1, estime el tiempo promedio por máquina sin funcionar, y
establezca un límite para el error de estimación. Suponga que el-fabricante no sabe
cuántas máquinas hay en todas las plantas.
ESTIMACIÓN MEDIA
SOLUCIÓN
Ya que se desconoceM, debemos usar gr, dado por la Ecuación (9.9), para estimar.p.
Nuestros cálculos producen
2400 59
• = 4.60
522
CChKN-CTv,ERADOSff-Q DOS EIPPPS
,978)]
= 1236.57
Nótese que como en la Ecuación 9.1,
52.2
Sustituyendo en la Ecuación (9.10)se obtiene la varianza estimada de Pr:
t(fir)
(21,990.96)
= 0.049306
9 MUESTREO
La estimación del tiempo promedio sin funcionar, con un Ifmite para el error de
estimaclón, es
E Mi
(9.14)
Varianza
estimada
de p:
(9.15)
donde(9.16)
2sTF) (9.17)
EJEMPLO 9.4
El fabricante del Ejemplo 9. I quiere estimar la proporción de máquinas que han sido
retiradas del proceso debido a reparaciones mayores (aquellas reparaciones que
requieren piezas que se surten fuera de la fábrica). Las proporciones muestrales de las
máquinas que requieren reparaciones presentan en la Tabla 9.2. Los datos
Proporción de máquinas
50 10 0.40
2 65 13 0.38
3 45 9 0.22
4 48 10 0.30
5 52 10 0.50
6 58 12 0.25
7 42 8 0.38
8 66 13 0.31
9 40 8 0.25
10 56 11 0.36
son para las máquinas muestreadas en el Ejemp109.1. Estimep, la proporción de máquinas que
involucran reparaciones mayores para todas las plantas, y establezca un límite para el error de
estimación.
SOLUCIÓN
La mejor estimación de p :está dada por
176.08
= 0.34
522
Para estimar la varianza de p, calculamos
= &13381.4688 —
= 18.4482
= 509.4881
Entonces la varianza estimada de p cuando M es estimada por el promedio muestral,
52.2, es
(509.4881)
= o .00081
La mejor estimación de la proporción de máquinas que han requerido reparaciones mayores es
El problema de la
selección de tamaños de muestra mucho más difícil en el muestreo por conglomerados en dos etapas
que en los estudiados antes, en los cuales solamente se involucró una etapa de muestreo. Tenemos
que seleccionar los valores para n y todas las m,; además, la mejor selección de estos valores depende
de dos fuentes de variación, la que existe entre los conglomerados y la que se encuentra entre los
elementos dentro de conglomerados. El princípo general es asignar los recursosd e la muestra a la
componente con la variación más grande. Esto es, si las mediciones en los conglomerados son
homogéneas, pero las medias de éstos varían grandemente de un conglomerado a otro, muestreamos
muchos conglomerados con pocas mediciones de cada uno. Sin embargo, si las medicionesen
conglomeradosvarían grandemente, pero las medias de éstos son homogéneas, muestreamos pocos
conglomerados y muchas mediciones de cada uno. Estableceremos este enunciado en forma más
precisa para una situación de muestreo simplificada.
Suponga que todos los conglomerados contienen M elementos, y que serán submuestreados m
elementos de cada uno de los n conglomerados seleccionados. Esto es,
(9.18)
que es equivalente al promedio general de todas las mediciones de la muestra. También en estas
condiciones y la suposición de que todas las cpf pueden omitirse, la varianza teórica de es de la forma
9 MUESTREO
V(fi) (9.19)
(9.21)
9
(9.22)
(9.23)
la varianza muestral calculada según las estimaciones observadas de las medias de
conglomerados, ñ. Puesto que cada ji es solo una estimación de la media verdadera de un
conglomerado, la Ecuación (9.23) mide una combinación de la variación de un
conglomerado a otro y la variación de un elementoa otro. De hecho, SI es un estimador
insesgado de
(9.24)
Por lo tanto si tenemos los valores de s, y sw, quizás de un estudio piloto, entonces tanto
como Tb pueden ser estimados. Estas estimaciones pueden ser usadas en (9.21) para
encontrar el valor óptimo de m, y posteriormente en (9.19) para encontrar el valor óptimo
de n para una V(g) fija.
EJEMPLO 9.5
SOLUCIÓN
Antes de que podamos usarla Ecuación (9.21), debemos estimar Ahora está estimada
por
Bw- = 3.0
y b es estimada por [véase la Ecuación (9.24)]
w
3.0 = 3.4 — = 2.8
5
Puesto que c, es —is veces '2, entonces = 6. (Nótese que sólo la razón de costos es
necesaria en la selección de m.)
De la Ecuación (9.21) tenemos
(6)
= 2.53 0 sea 3
Por lo tanto 3 placas positivas deben ser muestreadas de cada acumulador seleccionado.
Para encontrar n sustituimos las estimaciones y y m, en la función de varianza, Ecuación
(9.19), la cual es igual a 0.5. Esta sustitución da
2.8 3.0
0.5 + n
MUESTREO CONGL
OMERADOS
DOS ETAPAS CON PROBABILIDADES PROPORCIONALES A-
TAMAÑO
Dado que el número de elementos en un conglomerado puede variar grandemente de un
conglomerado a otro, una técnica frecuentemente ventajosa es muestrear conglomerados con
probabilidades proporcionales a sus tamaños, como se explicó en la Sección 8.8.
Generalmente, el muestreo ppt solamente se utiliza en la primera etapa de un procedimiento
de muestreo en dos etapas, debido a que los elementos dentro de conglomerados tienden a
ser algo similaresen tamaño. Por lo tanto presentaremoslos estimadoresde g, y T para el
muestreopor conglomeradasen dos etapas, en el cual la primera etapa de muestreo se lleva a
cabo con probabilidadesproporcionalesal tamaño.
La Ecuación (8.23) proporciona un estimador de , en el caso del muestreo por
conglomeradoscon una sola etapa, de la forma
CONGLOvlERADOS DOS ETAPAS
(9.25)
En el Capftulo 8, ji fue calculado con base en todos los elementos del conglomerado i y
fue exactamente la media del conglomerado. En este capítulo es calculada de una muestra
de elementos del conglomerado i y es solamente una estimación de la media del
conglomerado. No obstante, la Ecuación (9.25) forma un estimador insesgado de B, con
una varianza estimada dada en la Ecuación (8.24).
Para formar un estimador insesgado de T, sólo se tiene que multiplicar la Ecuación
(9.25) por M, el número de elementos en la población.
Estimador de la media poblacional
(9.26)
Varianza estimada de g
(9.27)
Varianza estimada de T
Límite
9 MUESTREO
EJEMPLO 9.6
Un investigador desea muestrear tres hospitales de entre los seis que existen en una
ciudad, con el propósito de estimar la proporciónde pacientes que han estado (oestarán)
en el hospital por más de dos días consecutivos. Puesto que los hospitales varlan en
tamaño, éstos serán muestreados con probabilidades proporcionales al número
9.7 CON PRCBABLIDADSPROPORCONALESALTNMÑO 247
sus pacientes. En los tres hospitales muestreados se examinara un 10% de los registros de
los pacientes actuales para determinar cuántos pacientes permanecerán por más de dos
días en el hospital. Con la información sobre los tamaños de los hospitales dada en la
tabla adjunta, seleccione una muestra de tres hospitales con probabilidades proporcionales
al tamaño.
Número de Intervalo
Hospital acumulado
1-328
1 328 329-437
2 438—869
109 870—
3 432 1089
4 220 1090-
5 280
1369
190
6 1370-
1559
SOLUCIÓN
Puesto que serán seleccionados tres hospitales, tres números aleatorios entre el 0001 y el
1559 deben ser seleccionados de la tabla de números aleatorios. Nuestros números
elegidos son 1505, 1256 y 0827. Localizar estos números en la columna del intervalo
acumulado nos conduce a la selección de los hospitales 3,5 y 6.
EJEMPLO 9.7
Supóngase que los hospitales muestreados en el Ejemplo 9.6 dieron los siguientes datos
sobre el número de pacientes con permanencia de más de dos días:
permanencia
3 43 25
5 28 15
6 19 8
Estime la proporción de pacientes con permanencia de más de dos dfas, para los seis
hospitales, y establezca un límite para el error de estimación.
SOLUCIÓN
La proporción de interés para cada hospital es simplemente la media muestra] y, por la
Ecuación (9.26), la mejor estimación de la proporción el promedio de las tres medias
muestrales. Así
+ k + ib + 0.54 + 0.42) =
0.51
cc»anv1ERADOSô.u DOS
De la Ecuación (9.27)
1
= —[(0.58 - 0.51)2 + (0.54 - 0.51)2 + (0.42 - 0.51)2] 3(2)
= 0.0025
Por lo tanto el lúnite para el error de estimación es
9.8 RESUMEN
9 MUESTREO
ANÁLISIS Da
ESTUDIO
LA ESTIMACION [E
El plan de muestreo para <innar gastos promedio para entretenimiento entre
estudiantes, descrito al principio de este capítulo, involucra la selec-
249
cón de n 4 salones de Clase de entre N h 50 y el sbnt_pstreo de estudiantesen
cada sabn seleccionado. ID datos como sigtE (prornedios en dólares]:
80 8 16 9 1280 518,400
47 5 30 15 1410 55,225
62 6 21 22 1302 61,504
39 4 45 18 1755 608,400
M = 57
— A)?
=
414,510
= 31,275
(31,275) =
(414,510) 11
promedio
que la mensual verdadera
b tanto = + '14 = $36
terwnos de d
redidrse en en cantidad e dase o más
tamano sabn decanfianza 25 - $14y estudiantes
25 pa
clases ¿Cuál procedimiento
muestreando recomendaríausted?]
EJERCICIOS
Suponga que una gran tienda de ventas' al menudeo tienecuentas
partamento. listada por
por La empresa desea usar el
muestreo para estimar en un día especffico el toál de las cuentas por cobrar. Analice
relativos del muestreo akatorio estradficado, del muestreo por conglomeradosen una etapa, del
sistemático y del muestreo por conglcy merados en dos etapas. ¿Qué información adicional le
gustaría tener sobre estas cuentas de seleccionar el diseño de muestreo?
250 CONGLOWERADOS EIPPPS
9.2 El dueño de un vivero quiere estimar la altura de los arbolitos en un extenso terreno que está di
vidido en 50 lotes que varían levemente en tamaño. El dueño cree que las alturas son bastante
homogéneas en cada lote pero pueden variar considerablemente de un lote a otro. Por lo tanto decide
muestrear un 10% de los árboles dentro de cada uno de los IO lotes usando una muestra por
conglomeradosen dos etapas. Los datos se dan en la tabla adjunta. Estime la altura promedio de los
arbolitos en el terreno y establezca un limite para el error de estimación.
Número de
7 50 5
8 61 6 9, 10, 8, 9, 9, 10
9 60 6 7, 10, 8, 9, 9, 10
10 45 6 12, 11, 12, 13, 12, 12
9.3 En el Ejercicio 9.2, suponga que el dueño del viverosabe que hay aproximadamente 2600 arbolitos en
el terreno. Use esta información adicional para estimar la altura promedio y establezca en límite
para el error de estimación.
9.4 Una cadena de supermercados tiene tiendas en 32 ciudades. Un director de la compañía quiere
estimar la proporción de tiendas en la cadena que no satisfacen un criterio de limpieza
específico. Las tiendas dentro de cada ciudad al parecer poseen caracterfsticassimilares; por lo
tanto el director decide seleccionar una muestra por conglomerados en dos etapas conteniendo
la mitad de las tiendas dentro de cada una de 4 ciudades. El muestreo por conglomerados es
conveniente en esta situación debido al costo de traslado. Los datos recolectados se presentan
en la tabla adjunta. Estime la proporción de tiendas que no satisfacen el criterio de limpieza y es•
tablezca un límite para el error de estimación.
25
2 10 5 1
3 18 9 4
4 16 8 2
9.5 Repita el Ejercicio 9.4 dado que la cadena contiene 450 tiendas.
9.6 Para mejorar el servicio telefónico, el ejecutivo de cierta compañia quiere estimar el número total de
llamadas por teléfono realizadas por las secretarias de la compañía durante un día. compañfa
tiene 12 departamentos, efectuandocada uno aproximadamenteel mismo númerode llamadas por
día. Cada departamento emplep un promedio. de 20 secretarias y el número de llamadas varía
considerablemente de una secretaria a otra. El ejecutivo decide aplicar un
EJERCiC10S 254
Número de
1 21 10 15.5 2.8
2 23 10 15.8 3.1
3 20 10 17.0 3.5
4 20 10 14.9 3.4
9.7 La comisión de zonificación de una ciudad quiere estimar la proporción de dueños de bienes inmuebles en
cierta sección cle la ciudad que apoyan un cambio de zonificación propuesto. 141 sección está dividida
en siete áreas residenciales distintas, cada una conteniendo residentes similares. A causa de que los
resultados deben ser obtenidos en un periodo de tiempo cono, se usa un muestreo por conglomerados
en dos etapas. Tres de las siete áreas son seleccionadas al azar y un 20 % de los dueños de bienes
inmuebles son muestreados en cada una. I_a cifra de 20% parece razonable porque la gente que vive
dentro de cada área parece estar en la misma clase socioeconómica y por lo tanto tiende a tener
opiniones similares sobre el tema de la zonificación. Los resultados se presentan en la tabla adjunta.
Estime la proporción de dueños de bienes inmuebles que favorecen el cambio de zonificación propuesto
y establezca un límite para el error de estimaclón.
46 9
2 67 13 2
3 93 20 2
Número de
Número de Número de árboles
Área lote
tos) escogidos aleatoriamente de cada una. (Cada cuadrilla puede inspeccionar un área por
dfa. ) Los datos se presentan en la tabla adjunta. Estime el número total de árboles
infestados en el condado y establezca un límite para el error de atimación.
9.9 Una compañfa está probando una nuwa emboteliadora. Durante un ensayo la máquina llena 24
cajas, cada una con 12 botellas. La compañía desea estimar el número promedio de onzas
de contenido por botella. Se emplea un muestreo por conglomerados en dos etapas usando
6 cajas (conglomerados) con 4 botellas (elementos) seleccionadas aleatoriamente de cada
caja. Los resultados se presentan en la tabla adjunta. Estime el número de onzas promedio
por botella y establezca un límite para el error de estimación.
7.9
2 8.0 0.12
3 7.8 0.09
4 7.9 0.11
5 8.1 0.10
6 7.9 0.12
9.10 Cierta planta industrial tiene 40 máquinas y todas producen el mismo artículo (por ejemplo,
cajas de cereal). Se desea estimar la proporción de productos defectuosos (por ejemplo,
cajas con menor contenido) u n día Analice los méritos relativos del muestreo por
conglomerados en dos etapas (las máquinas como cajas) y el muestreo aleatorio
estratificado (las máquinas como estratos) como posibles para este estudio.
Una empresa de investigación de mercados ideó un plan de muestreo para estimar las ventas
manales de un cereal de la marca A en un área geogr Ca. La empresa decidió
muestrearciudades dentro del área y luego supermercados dentro de ciudades. La medición
de interés es el número de cajas vendidas del cereal de la marca A en una semana
específica. Cinco ciudades son muestreadas de entre las 20 en el área. Usando los datos
presentados en la tabla adjunta, estime las ventas promedio de todos los supermercadosen
el área para la semana específica. Establezca un límite para el error de estimación. ¿E
insesgado el estimador que se utilizó?
Número de
1 45 9 102 20
2 36 7 90 16
3 20 4 76 22
4 18 4 94 26
5 28 6 120 12
9.12 el Ejercicio 9.11 , ¿se tiene suficiente información para estimar el número total de cajas de
cereal vendidas en todos los supermercados del área durante la semana?Si es así, explique
cómo estimaría usted este total, y establezca un limite para el error de estimación.
9.13 Si un estudio semejante al descrito en el Ejercicio 9.11 se llevara a cabo nuevamente,
(recomendarla usted que las ciudades se muestrearan con probabilidades proporcionales al
número de sus supermercados?¿Por qué?
EXPERIENCIAS CON DATOS REALES 253
9.14 Suponga que un quiere estimar el número total de personasjubiladas que viven en una ciudad. El
sociológo decide muestrear manzanas y después casas dentro de las manzanas. (Las estadísticas de
manzana de la Oficina del Censo ayudan en la determinación del número de casas en cada manzana.)
Cuatro manzanas son seleccionadas aleatoriamente de entre las 300 de la ciudad. De acuerdo con
datos de la tabla adjunta, estime el número total de residentesjubilados en la ciudad y establezca un
límite para el error de estimación.
9.15 Usando ICY; datos del Ejercici09.14, estime el número promedio de residentes jubilados por casa y
establezca un límite para el error de estimación.
9.16 De acuerdo con los datos del Ejercicio 9.14, ¿puede usted estimar el número promedio de residentes
jubilados por manzana? ¿Cómo puede realizarse esta estimación y establecer un límite para el error
de estimación?
9.17 la estimación de la cantidad de impulezas en un producto a granel, como el azúcar, el procedimiento de
muestreo puede seleccionar costales de azúcar de un almacén y luego seleccionar muestras de
prueba pequeñas de cada costal. Las muestras de prueba son analizadas para la cantidad de
impurezas. Analice cómo podría seleccionar el número de costales a muestrear y el número y
tamaño de las muestras de prueba tomados de cada costal.
9.18 Un programa para asegurarla calidad de productosfabricados requiere del muestreo de éstos tal como
vienen en las Ifneas de montaje de una planta de producción. Se podría tratar las unas de montaje
como conglomerados o como estratos. Analice los méritos relativos de estas dos opciones, y diseñe
un plan de muestreo para cada caso.
9.1 Refiérase a los datos de la población de Estados Unidos en el Apéndice. Planee un muestreo por
conglomerados en dos etapas para estimar la población rural total de Estados Unidos en 1980,
muestreando primero divisiones y luego estados dentro de éstas. Muestree cuatro de las nueve
divisiones y al menos dos estados dentmde cada división muestreada. Efectúe una estimación de la
varianza vinculada al estimador. ¿E recomendable este procedimiento sobre el muestreo aleatorio
estratificado? ¿Por qué?
9.2 Generalmentecuando muestrea gente, las marcos naturales involucran pelsonas agrupadas en
conglomerados. Por lo tanto el muestreo por conglomerados en dos etapas suele utilizarsecomo una
cuestión de conveniencia económica. Por ejemplo, trate de estimar el número total de libros de
biblioteca comúnmente tomados en préstamo por 106 estudiantes de una '.miversidad. (Cualquiera
otra variable numérica de interés puede ser su*ituida por el número de libros de biblioteca.)
conglomerados de estudiantes que ocurren en forma natural se dan en residencias estudiantiles,
salones de clases, fraternidadesy hermandades, y en directoriosestudiantiles. ((Puede pensar usted en
otros ?)Estime el total de interés y establezca un límite para el error de estimación usando los
siguientes procedimientos :
9 CONGLOMERADOS
Cualquiera que sea el método que usted seleccione, piense cuidadosamente acerca de ICF tamaños de
muestra relativos para la primera y segunda etapas. Si el experimento no es aplicable para tal situación, un
problema más simple de llevar a cabo es estimar el número de palabrasen este (o cualquier otro) libro
muestreando aleatoriamente páginas y luego líneas dentro de cada página. ¿Debe ser diferente el esquema de
muestreo en dos etapas para un libro de estadística con fórmulas y tablas del esquema para una novela?
ESTIMACIÓN Da
TAMAÑO DE LA
POBLACIÓN
ESTUDIO DE CASO
¿CUÁNTAS AL
reportera de cierto periódico quiere e<imar el número de que aSsEn a
cn concierto gratuito de rock y sohcita entonces el consejo de un
estadísfico. observa we d periódico esá obsequiando color naranja a
algunos tentes y pregunta cuántos han sich obsequiados. Sabierxdo esto,
sugiere el sig.liente escuerna de estimación:
Si4)órvase que subgrupo de N asstentes usand) t somtxeros.
de que empieza el concierto selecdonan aleatoriamente n personas, y
Óserva d número s de q-lienes usan sonbreros. Ahora la proporción
muestral de aquelbs que portan somb-eros,p = s/n, es un de la proporción
çoblacional t/N. palabras,
nN
nt
o bien
S
255
10 ESTIMACÕN CE LA POBLACIÓN
40.4 INTRODUCCIÓN
ESTIMACIÓNCR 257
p puede ser estimado por p, la proporción de animales marcada en la segunda muestra.
Entonces el número de animales marcados la proporción de animales marcados en la segunda
muestra o bien,
La segunda técnica es muestreo inverso. Es similar al muestreo directo, pero esta muestra
no es fija. Esto es, se continúa el muestreohasta que se observa un número fijo de animales
marcados. Mediante este procedimiento podemos también obtener una estimación de N, el
tamaño de la población, usando
Ñ=—
La tercera técnica depende de estimar en primer lugar la densidad de elementos en la
población y luego multiplicar ésta por una medida apropiada del área. Si estimamos que ha
animales por unidad de área y el área de interés contiene A unidades, entonces nos proporciona
una estimación del tamaño de la población.
El cuarto método es similar al tercero pero depende expresamente de la capacidad para
identificar la presencia o ausencia de animales en las parcelas muestreadas. Entonces, con
ciertas condiciones, la densidad y el número total de animales pueden aún ser estimados.
El muestreo directo puede ser usado para estimar el tamaño de una población móvil. Primero, se
selecciona una muestra aleatoria de tamaño t en la población. Días después se selecciona una
muestra de tamaño n. Por ejemplo, supóngase que un ecologista interesa por la evidente
disminución del número de focas en Alaska. Se dispone de estimaciones del tamaño de la
población en años previos. Para determinar si ha ocurrido o no una reducción, se captura una
muestra aleatoria de t = 200 focas, se marcan y luego se retornan a la población. Al mes se
obtiene una muestra de tamaño n = 100. Usando estos datos (frecuentementellamadosde
recaptura), podemos estimar N, el tamaño de la población.
Sea S el número de focas marcadas que se observa en la segunda muestra. La proporción
de animales marcados en la muestra es
Sn
Un estimador de N es dado por
Varianza estimada de N:
(10.2)
S
Límite para el error de.estimación:
Nótese que s debe ser mayor que cero para que las Ecuaciones (10.1), (10.2)
y (10.3) sean bien definidas. Vamos a suponer que n es lo suficientemente grande
para que S sea mayor que cero con elta—robabilidad.
También debe notarse que N , que se presenta en la Ecuación (IO. l), no es un
estimador insesgado de N. Para s > 0
nt
Por lo que, para tamaños de muestrasuficientementegrandes, esto es, t y n grandes,
el termino
nt
EJEMPLO 10.4
SOLUCIÓN
la Ecuación (10. l), tenemos
A nt
200(300)= 967.74
62
o bien N = 968
10.2
ESTIMACIÓN CE 259
(62)3 = 204.18
Entonces la comisióncinegética estima que el número total de venados es 968, con un límite para
el error de estimación de aproximadamente 205 venados.
Usted puede estar interesado en la magnitud del límite para el error de estimación en este
ejemplo; pero podemos obtener un estimador más exacto de N mediante el incrementode los
dos tamanosde muestra (n y t). En la Sección 10.4 se presenta más información acerca de la
elección de n y t.
pero
Estimador de N :
nt
(10.4) s
Varianza atinada de N: t2 n(n — s) 2 (10.5)
s(s l)
Límite para el error de estimación:
Nótese que las Ecuaciones (10.4), (10.5) y (10.6) son validas únicamente para S > O. Esta
restricción no ofrece ninguna dificultad, simplemente especificamos que n debe ser mayor que
0, y muestreamos hasta que se recapturan s animales marcados.
10 ESTiMACiÕN
260 Da POBLAC(X
El estimador N = nt/s, obtenido por muestreo inverso, nos provee de un estimador
insesgado de N, y la varianza dada por la Ecuación (10.5)es un estimador insesgado de
la varianza verdadera de N.
La varianza (10.5)para el caso inverso es muy parecida a la varianza (10.2) para el
caso directoy los estimadoresN parecen ser idénticos. Sin embargo, el
muestreoinverso ofrece las ventajas de poder fijar s de antemano, el Ñ es insesgado y
se dispone de un estimador insesgado de la varianza verdadera de N .
EJEMPLO 40.2
SOLUCIÓN
Mediante la Ecuación (10.4), estimamos N con
A nt 100(150)
= 428.57
35
Un límite para el error de estimación se encuentra usando la Ecuación (10.6) como
sigue:
t 2 n(n —
s)
s 2(s + 1)
= 115.173
Por lo que estimamos que hay 429 pájaros de esta especie en la reservación. Es
bastante probable que nuestra estimación esté cercana aproximadamente a 116
pájaros del tamaño verdadero de la población.
10.2
Hemos estado estudiandolas técnicas de muestreo directo y de muestreoinverso.
Seguramente se pregunta cuál es mejor. Se puede usar cualquier método. El muestreo
inverso nos proporciona información más precisa que el muestreo directo, siempre y
cuando el segundo tamaño de muestra n —requerido para recapturar S elementos
marcados— sea pequeño con respecto al tamaño de la población N. Sin embargo, si
desconoce todo acerca del tamaño N, una elección deficiente de t podría hacer n
bastante grande cuando se use muestreo inverso. Por ejemplo si N = 10,000 y se
extrae
264
EJEMPLO 40.3
10 ESTiMACiÕN
La comisión cinegética del Ejemplo 10.1 cree que el tamaño de la población de
venados este año es aproximadamente la misma que el año pasado, cuando hubo entre
800 y 1000 venados. Determine el límite para el error de estimación asociado con las
fracciones de muestreode Pl = 0.25 y = 0.25.
SOLUCIÓN
Tomamos el mayor de los dos números ( N aproximadamente 1000) para obtener una
estimación conservadora de V(N) (una mayor de lo que podría esperarse). Vemos en
CE
la figura 10.1 (o dela Tabla loa ) que las fracciones demuestreo dep, —— t,'N = 0.25
= 0.25 nos dan
= 12
Al tomar N = 1000, tenemos
s = P2N
animales marcados sean recapturados. Los correspondienteslímites del error de
estimación para N serán aceptables siempre que el estimador original de N haya sido
razonable.
Las anteriores técnicas de marcado-recaptura pueden ampliarse a más de dos
etapas. En la segunda etapa puede marcarse los (n — s) animales no marcados y
retornarse todos los n a la población. En fecha posterior puede tomar una tercera
CE TAMAÑO LA
269
9.0
8.0
7.0
6.0
5.0
4.0
3.0
2.0
1.0
sea el número total de elementos en la población (con área A). Sea también
Estimador de la densidad X:
(10.7)
Varianza estimada de A :
(10.8)
Límite para el error de estimación:
Varianza estimada d M:
t(ú) = A2 t(Â) = (10.11)
Límite para el error de estimación:
EJEMPLO 40.4
En una plantación de pino de 200 acres en el sur del país, va a
estimar la densidad de árboles que presentan hongos parásitos. Se
toma una muestra den = 10 cuadros de 0.5 acres cada uno. Las diez
parcelas muestreadas tuvieron un promedio ñ de 2.8 árboles
infectados por cuadro. Estime la densidad de árboles infectados y
establezca un límite para el error de estimación.
SOLUCIÓN
Mediante la Ecuación (10.7) con a = 0.5, determinamos la
densidad estimada como
A ñ 28
5.6
árboles por
acre a 0.5
El límite para el error, usando la Ecuación (10.9), es
5.6
2 = 2.1
Entonces estimamos que la densidad es de 5.6 ± 2.1, o bien de 3.5 a 7.7
árboles infectados por acre. Este intervalo es grande debido a que el tamaño de
muestra es relativamente pequeño.
EJEMPLO 40.5
72 10 ESTIMACÕN POBLACiÕN
Para la situación y datos en el Ejemplo 10.4, estime el total de
árboles infectados en los 200 acres de la plantación. Establezca un
límite para el error de estimación.
SOLUCIÓN
Mediante la Ecuación (IO. IO), vemos que el total estimado es
19 = ÑA = = 1120
árboles
10.6 ESTIMACIÓN USANDO WADRDSCARGADOS
In
C) e) (10.1
(In denota logaritmo natural.)
Varianza estimada de A :
(10.16
Varianza estimada de M:
SOLUCIÓN
la Ecuación (10.13) vemos que la densidad es estimada por
(al )
In
e)
1 4
— In — = 3.2 árboles por
acre (0.5) 20
1)
= 1.8
ú = 640
y el límite para el error, usando la Ecuación (IO. 18), es
275
Nuestra estimación del número total de árboles infectados e; 640
± 360, o bien de 280 a 1000.
1.6
40.7 RESUMEN
ANÁLISIS
s•n-D0 CASO
ESTIMACIÓN A IN CONCIERTO
el ejemplo planteado para introducir este capítulo, la reportera del
periódico dice al estadísfico que dieron t = 500 color naranja.
Desde asientos en balcón, el estadísficoy la reportera localizan n = 200 de
una manera aleatoria. 200 asientos observan s = 40 de kE sont:xetos
anaranjados.
Ahora, el tamano de la multitud, N estima que
nt 200<500)
- 2500
S 40
El límite para el error de dado por esfimadón
= 707
EJERCICIOS
ESTIOMCIÓNCE CELA
piezan a trabajar en una segunda muestra den = 75. Atrapan 10 ardillas que fueron marcadas
previamente. Estime N, y establezca un límite para el error de estimación.
10.12 Suponga que los costos por tomar una observación son los mismos en la primera y en la segunda
muestras. Determine qué es lo más deseable: tener t > n, t n, o t < para un costo fijo de obtención de las
dos muestras. (Sugerencia: consulte las Figuras 10.1 y 10.2.)
10.13 Un equipo de ecólogos de vida en estado salvaje está interesado en la efectividad de un fármaco contra la
fertilidad para controlar el crecimiento de la población de palomas. Para medir la efectivídadse va a
estimar el tamaño de la población de este año y comparar con el tamaño estimado el año anterior. Se
construyó una gran trampa para el experimento. Ésta fue entonces cebada con alimento de maíz
mezclado con una cantidad fija del fármaco. Se atrapó una muestra inicial de t = 120 palomas y se les
permitió comer del alimento preparado. Cada ave es entonces marcada en su pata y liberada. En fecha
posterior se atrapa una segunda muestra den = 100 palomas. Supóngase que 48 tienen marcas (S = 48).
Estime el tamaño de la población de palomas y establezca un límite para el error de estimación.
10.14 Se toman periódicamente muestras de 100 centímetros cúbicos del aire en una área industrial de la
ciudad. La densidad de cierto tipo de partícula dañina es el parámetrode interés. Supóngase que 15
muestras dieron un promedio de 210 partículas por muestra. Estime la densidad de la partícula por
centímetro cúbico y establezca un límite para el error de estimación.
10.15 Suponga que en el muestreo de aire del Ejercicio 10.14 es fácil detectar la presencia o ausencia de las
partículas, pero que el conteo de las mismas es difícil. De entre 500 de esas muestras, 410 mostraron la
presencia de la partícula. Estime la densidad de la partícula y establezca un límite para el error de
estimación.
10.16 Se contaron los automóviles que pasaron a través de una intersección —durante intervalos de diez
minutos— seleccionados aleatoriamente durante el periodo de trabajo de un día. En veinte de estas
muestras hubo un promedio de 40 automóviles por intervalo. Estime, con un límite para el error, el
número de vehículcx que usted espera pasarán por la intersección en un periodo de ocho horas.
10.17 ¿Recomendaría usted el uso del método de cuadros cargados para contar los automóviles del Ejercicio
10.162
10.18 Analice el problema de la estimación de poblaciones de animales altamente migratorios mediante el uso
de muestreo por cuadros.
10.19 Tm datos de la tabla acompañante muestran el número de colonias de bacterias observadas en 240
campos microscópicos. Estime, con un límite para el error de estimación, la densidad de coIonias por
campo. ¿Qué suposiciones son necesarias para este procedimiento?
11
37
2 64
3 55
4 37
6 24
6 12
1020 Describa cómo puede estimar el número de automóvilesque transitan en una ciudad durante las horas de
trabajo de un día. Compare cuatro métodos diferentes para realizar esta estimación. ¿Cuál de los cuatro
considera que es el mejor? ¿Por qué?
10.1 Simule la técnica de marca-recaptura para poblaciones animales en la realización del siguiente
experimento. Ponga un número conocido N de bolitas en una jarra. Marque t de ellas de modo que se
puedan distinguiry mézclelas bien. Entonces muestree n bolitas, registre el númerode las "marcadas", y
estime N con el método directo. fijando un límite para el error de estimación. (Incluye el intervalo
resultante su N conocido?
Reemplace las n bolitas y repita el muestreo, usando el método inverso (continúe muestreando
hasta que tengas bolitas marcadas), y establezca un límite para el error. ¿Incluye este intervalo a N?
Pueden realizarse vanos tamaños de muestras y vanos grados de mezcla. ¿Cómo escogería usted
un tamaño de muestra apropiado? ¿Qué piensa usted que pasará si las bolitas marcadas no son
completamente mezcladas con las otras ? ¿Cree usted que esta cuestión sugiere una dificultad práctica
con el método de marca-recaptura?
102 La estructura de los problemas tratados en este capítulo requiere que haya t unidades marcadas, distribuidas
aleatoriamente entre las N de una población. Si t es conocido, una muestra aleatoria de n proveerá
información para estimar N. siempre que aparezcan algunas unidades marcadas en la muestra. Las
marcadas pueden ser incorporadas a la poblaciónsin tomar una muestra inicial.
Trate la siguiente técnica para la estimación del tamaño de una multitud que asiste a un evento
deportivo, conferencia, cine u otro espectáculo. Obtenga los nombres y descripcionesde t personas que
usted sabe que van a asistir a él. Solicíteles que se distribuyan aleatoriamente entre la multitud.
Entonces, tome una muestra aleatoria de n personas, quizás al tiempo que las personas abandonan el
edificio. Cuente el número de las t personas seleccionadasoriginalmenteque aparecen en su muestra, y
estime N. (Aquítambién se puede usar el método de ir—.)
10.3 Estimeel número de palabras de tres letras que hay en este libro, estimando inicialmentela densidad de
palabras de tres letras por página. Establezca un límite para el error de estimación. Trate dos técnicas
diferentes para efectuar esta estimación. ¿En su opinión qué método es mejor? ¿Qué suposicionesson
necesarias para que estos métodos sean adecuados?
TEMAS
281
4 1 .2 SUBMUESTRAS INTERPENETRANTES
un entrevistado en una escala de 0 a 5, con O denotando mala salud. La obtención de este tipo de
información requiere habilidad para hacer la entrevista y un juicio subjetivo por parte del
entrevistador. Puede ser que un entrevistador no obtenga suficiente información y tienda a calificar
muy alto la salud de un individuo, mientras que otro puede obtener información detallada y
calificar muy bajo la salud.
Se puede obtener una buena estimación de la media poblacional aplicando la siguiente
técnica. Divida aleatoriamente los n elementos muestralesen k submuestras de m elementos cada
una, y asigne un entrevistadora cada una de las k submuestras. Nótese que m = n/k y n puede ser
siempreelegido de tal manera que m sea entero. Consideramos a la primera submuestra como una
muestra irrestricta aleatoria de tamaño m seleccionada de los n elementos en la muestra total. La
segunda submuestra es entonces una muestra irrestricta aleatoria seleccionada de los (n - m)
elementos restantes. Se continúa este proceso hasta que los n elementos han sido divididos
aleatoriamente en k submuestras. A estas últimas se les llama algunas veces submuestras
interpenetrantes.
Esperamos que algunos entrevistadoresden mediciones que son muy pequeñas y algunas muy
grandes, pero que el promedio de todas las mediciones esté cercano a la media poblacional. Es
decir, esperamos que los sesgos de los entrevistadores tengan una media que esté muy cercana a
cero. Entonces la media muestral y es el mejor estimador de la media poblacional g, a pesar que los
mediciones estén sesgadas.
Usamos la siguiente notación. Sea y, la j-ésima observación en la i-ésima muestra, j = l , 2, .
1, 2, . . . , k. Entonces ji, dada por
(11.1)
res. Esto es, la varianza estimada dada en la Ecuación (11.3) es comúnmente mayor que el
estimador estándar de la vananza de la media muestral obtenida en muestreo irrestricto
aleatorio debido a los sesgos presentes en las mediciones.
Un sociólogo quiere estimar la estatura promedio de los varones adultos en una comunidad
que tiene 800 hombres. Cuenta con diez asistentes. cada uno con su propio equipo para
tomar las medidas. Ya que el experimentador cree que sus asistentes obtendrán mediciones
ligeramente sesgadas. decide tomar una muestra irrestricta aleatoria de n = 80 varones y
dividir aleatoriamente la muestra en diez submuestras de ocho personas cada una. Cada
asistente es entonces asignado a una submuestra. Las mediciones producen las siguientes
medias submuestrales (mediciones en pies):
ñ = 5.9 ñ = 5.7
ñ = 5.8 17= 5 8
ñ = 6.1 5.6
6.0 5.9
ñ = 6.1 ño = 6.0
Estime la estatura media de los varones adultos en la comunidad y establezca un límite
para el error de estimación.
SOLUCIÓN
El mejor estimador de la media poblacional es la media muestral f. Entonces, de la
Ecuación (11.2),
Debemos estimar ahora la varianza de usando la Ecuación (ll, 3), Se puede establecer la
siguiente identidad:
Al sustituir, obtenemos
(58.9)2
=347.17- —
0.25
10
11 corviPLHv1ffffARlOS
Entonces
278
= 0.0025
(11.5)
nt FI
11.3 ESTWIAO(X CE SUBPOBLACIONES 279 Varianza
estimada de n:
(11.6)
Límite para el error de estimación:
(11.7)
2
=$1720 72,200
Estime la cantidad promedio semanal gastada en comida por todas las familias con niños
y establezca un límite para el error de estimación.
SOLUCIÓN
El estimador de la media poblacionales ñ , dado por la Ecuación (11.5). los cálculos
producen
1
Ytj =—(1720) = 40.95 42
Tenemos la igualdad
y sustituyendo nos da
280
250 - 50
1762
250 42(41)
— 0.819
Varianza estimada de N, j t:
= N, t(jl) = N? (11.9)
Límite para el error de estimación:
EJEMPLO 44.3
Un estudio preliminar reciente del municipio del Ejemplo 11.2 revela que N, = 205
familias con niños. Usando esta información y los datos del ejemplo mencionado,
estime la cantidad semanal total gastada en comida por estas familias. (Nota: N , va
a variar con el tiempo. Suponerrws que el valor de N, usado en este análisis es
correcto.)
11.3 ESTIMACIÓN CE 284
SOLUCIÓN
El mejor estimador del total es NIFt, dado en la Ecuación (11.8), el cual da una estimación
de
= 205(40.95) = 8394.75
f(N1ñ)
= 34.191.19
La estimación de la cantidad total que las familias gastan en comida por semana, dada
con un límite para el error de estimación, es
8394.75 ± 369.82
Varianza estimada de fl :
(11.12)
1 IHvPS COvR-HVñJTP.ROS
EJEMPLO 4 4.4
SOLUCION
El estimador del total que no depende de Npes Ti, dado por la Ecuación (11.11).
Entonces
250
Ylj=
(1720) = 8600
Sustituyendo en la Ecuación (11.12) nos da la varianza estimada de :
= 265,960
Entonces la estimación de la cantidad total semanal gastada en comida, con un
límite para el error de estimación, es
0 sea
o sea 8600 ± 1031.44
Este intervalo es un límite grande para el error de estimación y debe ser reducido
mediante el incremento del tamaño de muestra n.
Nótese que la varianza de r 1 , calculada en el Ejemplo 1 1.4, es mucho mayor
que la de Ni FI, calculada en el Ejemplo 11.3. La varianza de Tl mayor porquela
información proporcionada por Ni es usada en pero no en Tl. Entonces, si conocido,
o si puede determinarse con poco costo adicional, se debe usar el estimador NIñ.
1.— personas que son entrevistadas a menudo se niegan a contestar o dan una
respuesta incorrecta a preguntas inconvenientes que las ponen en aprietos o que les
pueden
RESPUESTAALEATORIZADA
ser dañinas en algún sentido. Por ejemplo, algunas personas pueden no respondercon la
verdad a cuestiones políticas, tales como: " ¿Es usted fascista?" En esta sección vamos
a presentar un método para estimar la proporción de personas que tienen alguna
característica de interés, sin obtener respuestas directas de las personas entrevistadas. H
método es debido a S. L. Warner (1965).
Designe a las personas de la población que tienen o no alguna característica de
interés, como grupos A y B, respectivamente. Entoncescada persona está en uno de los
grupos A o B. Sea p la proporción de personasen el grupo A. El objetivo es estimar p
sin preguntar a cada persona directamente si pertenece o no al grupo A. Podemos
estimar p usando un artificio llamado modelo de respuesta aleatorizada. Empezamos
con un mazo de cartas idénticas, excepto que una fracción de ellas, 6, está marcada con
una A yla fracción restante, (1 — 9), con B. Se selecciona una muestra irrestricta
aleatoria de n personas de la población. A cada una se le solicita que seleccione
aleatoriamente una carta del mazo y que diga "sí" cuando la letra en la carta
seleccionada concuerdecon el grupo al cual pertenece, o '"no" cuando la letra en la
carta seleccionada no concuerde con el grupo al cual pertenece. La carta es
reemplazada antes de que la siguiente persona seleccione la suya. El entrevistadorno ve
la carta y simplemente registra si la respuesta es "4" o "no". Sea n, el número de
personasen la muestra que responden "d" . Un estimador insesgado F de la proporción
poblacionalP es dado en la Ecuación (11.14).
(11.14)
Varianza estimada de p:
(11.15)
EJEMPLO 41.5
285
SOLUCIÓN
la Ecuación (11.14)
La varianza estimada
400
La estimación de p, con un límite para el error de estimación, es entonces
44.5
Como se explicó anteriormente, la no respuesta es un problema importante que se
debe considerar en cualquierencuesta. Si en una muestra aleatoria de tamaño n se ob
tienen Unicamente ni(ttl < n) respuestas, entonces los dos grupos (respuesta y no
11.5 SELECCIÓN PEENTPEVISTAS
respuesta) pueden ser manejados como una muestra aleatoria estratificada con dos
estratos. Nótese que esta situación no propiamente un muestreo aleatorio estratificado,
ya que n, y = fi — n, son variables aleatorias, cuyos valoresson determinados
únicamente después de que el muestreo inicial es completado. cualquier manera,
pensando en términos de muestreo estratificado, nos pennite encontrar reglas óptimas
aproximadas para la asignación de recursos a las reentrevistas.
Supóngase que de entrevistados con no respuesta, decidirnos hacer entrevistas
intensivas en r de ellos, donde r = nz/k para la constante k > 1. Suponga también que se
tiene un costo de C 1 dólares para obtener una respuesta estándar y C dólares ('2 > ct)
para una respuesta de reentrevista, con co denotando el costo inicial del muestreo de
cada elemento. Entonces el costo total es
C = nco + rc2
Si denota el promedio de las respuestas iniciales y el promedio de las r respuestas
de reentrevista, entonces
1
(11.17)
es un estimador insesgado de la media poblacional
Se puede derivar una expresión teórica para la varianza de y entonces podemos
encontrar los valores de k y n , que minimizan él costo esperado del muestreo para un
valor fijo deseado de V(y ), por ejemplo Vo. Los valores óptimos de k y n son
aproximadamente, para N grande,
(11.18)
n(11.19)
2
NVo + cr
EJEMPLO 44.6
riencias pasadas se anticipa que la tasa de no respuesta es alrededor del . Se piensa que
120 y 80. (El grupo de no respuesta tiende a ser aquellos que no están interesadosen
diversionesy por eso gastan menos y tienen una menor variación en sus hábitos de
gastos.) Suponga co = 0, Cl = l, y c2 = 4y que se usa inicialmente una muestra
irrestricta aleatoria. Encuentren y k de tal manera que la varianza del estimador
resultante sea aproximadamente igual a cinco unidades.
SOLUCIÓN
Obsérvese que W2 = 1 — WI = 0.4. Entonces de las Ecuaciones (11.18) y (11.19)
- 2.71
1000[120 +
= 34.1 0 bien 35
1000(5) + 120
Ya queE(n2) = n W2 = 35(0.4) = 14, podemosesperar que aproximadamente21
personas respondan inicialmente, y
14 — 5.2 0 bien 6
k 2.71
reentrevistasse van a tener que hacer.
44.6 RESUMEN
EJERCICIOS
11.1 Un investigador está interesado en estimar el promedio anual de gastos médicos por familia. en
una comunidad de 545 familias. El investigador tiene disponibles ocho asistentes para hacer el
trabajo de campo. Se requiere habilidad para obtener información exacta porque algunos
entrevistados se rehúsan a proporcionar información detallada sobre su salud. Ya que los
asistentes difieren en habilidades para entrevistar, el investigador decide usar ocho
submuestras interpenetrantes de cinco familias cada una, con un asistente asignado a cada
submuestra. Es por esto que se selecciona una muestra irrestricta aleatona de 40 familias y se
divide en ocho submuestras aleatorias. Se realizan las entrevistas y se obtienen las resultados
que se indican en la tabla acompañante. Estime el promedio de gastos médicos por familia del
año pasado, y establezca un límite para el error de estimación
11.2 Se diseña un experimento para medir la reacción emocional provocada por una decisión
gubernamental sobre desegregación escolar. Se entrevista una muestra irrestricta aleatoria de
50 personas y se obtienen las reacciones emocionales en términos de registros de I a IO. La
escala sobre la cual se asignaron los registros va de enojo extremo hasta alegría extrema.
emplean diez entrevistadores para hacer las preguntas y el registro, con cada entrevistador
trabajando una submuestra aleatona (submuestra interpenetrante) de cinco personas. Las
submuestras interpenetrantesson usadas debido a la naturaleza flexible de los registros. Los
resultados se dan en la tabla siguiente. Estime el registro promedio por persona en la ciudad y
establezca un límite para el error de estimación.
289
288
11.3 Un tendero quiere estimar la cantidad promedio de todas las cuentas vencidas. La lista disponible
es obsoleta porque algunas cuantas han sido pagadas. Pero, debido a que es costosa la
elaboraci&-l de una nueva lista, la tienda usa esta lista. Se selecciona una muestra
aleatoria de 20 cuentas de la lista que contiene 95. De las 20 cuentasmuestreadas, 4 han sido
pagadas. Las 16 vencidas contienen las siguientes cantidades (en dólares): 3.65, 15.98, 40.70,
2.98, 50.00, 60.31, 67.21, 14.98, 10.20, 14.32, 1.87, 32.60, 19.80, 15.98, 12.20, 15.00. Estime
la cantidad promedio de las cuentas vencidas para la tienda y establezca un límite para el error
de estima-
11.4 Para el Ejercicio 11.3, estime la cantidad total de las cuentas vencidasde la tienda y establezca
un límite para el error de estimación.
11.5 Un empleado de la tienda del Ejercicio 11.3 decide revisar la lista de las cuentas vencidas y marcar
aquellas que han sido pagadas. Encuentra que 83 de las 95 están vencidas. Estime la cantidad
total de las cuentas vencidas usando esta información adicional y los datos del Ejercicio 11.3.
Establezca un límite para el error de estimación.
11.6 Se realiza un estudio para estimar el número promedio de millas que hay de la casa al trabajo de
jefes de familia que viven en cierta área suburbana. Se selecciona una muestra irrestricta
aleatoria de 30 jefes de familia de los 493 del área. Al realizar las entrevistas, el
experimentador encuentra que gunosjefes dé familia no son apropiados para el estudio porque
están retirados o no acuden al trabajo por diversas razones. De los SO muestreados, 24 son
apropiados para el estudio, y los datos que indican las millas de distancia son los siguientes:
8.5 10.2 25.1 5.0 6.3 7.9 15.8 2.1
9.2 4.2 8.3 4.2 6.7 10.1 15.6 22.1
10.0 6.1 7.9 1.5 8.0 11.0 20.2 9.3
Etirne la distancia promedioentre la casa y el lugar de trabajo para los jefes de familia que
asisten a su trabajo. Establezca un límite para el error de estimación.
11.7 Para los datos del Ejercicio 11.16 estime la distancia total de viaje entre la casa y el lugar de
trabajo de todos los jefes de familia del área suburbana. Establezca un límite para el error de
estimacón.
11.8 Suponga que usted sabe que 420 de las 493 jefes de familia (Ejercicio 1 1.6) trasladan hasta su
trabajo. Estime la distancia total de viaje para todos los jefes de familia en esta área suburbana
haciendo uso de esta información adicional. Establezca un límite para el error de estimación.
11.9 Un perito en salud pública quiere estimar la proporción de dueños de perrX que han llevado a sus
animales a vacunar contra la rabia, en una ciudad. Él sabe que estos señores frecuentemente
dan información incorrecta por temor a que algo pueda pasar a sus ERrrossi no se han aplicado
las vacunas. Entonces el perito decide usar una técnica de respuesta aleatorizada. Dispone de
un mazo de barajas con 0.8 de las cartas marcadas A para el grupo que tiene las vacunas y 0.2
marcadas B para el grupo que no las tiene. selecciona una muestra irrestricta aleatoria de 200
dueños de perros. Cada uno es entrevistado y se le pide extraer una carta del mazo y responder
"sí" cuando la letra en la carta coincida con el grupo a que pertenece. El perito obtuvo 145
lespuestas "sí". Estime la proporción de dueños de perros que tienen vacunados a sus animales
y tablezca un límite para el error de estimación. Suponga que el número de dueños de perros
en la ciudad es muy grande.
11.10 Un ejecutivo de cierta corporación quiere estimar la proporción de empleados que han sido
convictos de un delito menor. Ya que ellos no contestarían directamente la pregunta, el
ejecutivo usa una técnica de respuesta aleatorizada. Se selecciona una muestra irrestricta
aleatoria de 300 personas de un gran número de empleados de la corporación. En entrevistas
separadas, cada empleado extrae una carta de un mazo que tiene 0.7 de las cartas marcadas con
' 'convicto" y 0.3 marcadas con "no convicto". El empleado responde "sí" cuando la carta
concuerda con su categoríao "no" cuando difiere. El ejecutivoobtiene 105 respuestas '"si".
Estime la proporción de empleados que han sido convictos de un delito menor, y establezca un
límite para el error de estimaclón.
EXPERIENCIAS DATOS REALES
Seleccione una muestra irrestncta aleatoria de la población apropiada en al menos una de las
situaciones mencionadas abajo. Estime la proporción o promedio indicado y establezca un para el
error usando los resultados apropiados de la Sección 11.3 que trata subpoblaciones. En cada caso
suponga que los objetos en la subpoblación no pueden ser clasificados como tales hasta después que
han sido observados.
11.1 Estime la proporción de votantes que favorecen cierta proposición del gobierno local entre aquellos que
votaron en la más reciente elección.
11.4 Estime la proporción de estudiantes en su escuela que favorecen el sistema trimestral entre aquelkx que
han sido estudiantes de la universidad en el sistema y al menos otro sistema.
11.3 Estime la cantidad promedio gastado en durante el mes pasado por dueños de en un vecindario.
11.4 el número promedio de palabras por página entre las páginas que no contienen enmarcadas o
tablas en este libro.
291
RESUMEN
42.4 RESUMEN DE LOS DISEÑOS Y
MÉTODOS
sociales, negocios, y manejo de recursos naturales que los hacen diferentes del tipo tradicional de
experimento realizado en el laboratorio. Estas peculiaridades principalmente involucran el muestreo de
poblaciones finitas junto con ciertas dificultades que ocurren en la selección de muestras de poblaciones
humanas. El muestreo de poblaciones finitas requiere la modificación de las fórmulas de los límites para el
error de estimación que se encuentran en un curso introductorio de estadística. Las dificultades asociadas
con el muestreo de poblaciones humanas sugieren diseños específicos de encuestas por muestreo que
reducen el costo de adquisición de una cantidad especifica de información.
En los Capítulos 4, 5, 7 , 8 y 9 consideramos los diseños específicos de encuentas por muestreo y sus
métodos de estimación asociados. H diseño de encuestas por muestreo básico, muestreo irrestncto
aleatorio, se presenta en el Capftulo 4. Para este diseño la muestra es selecionada de manera que cada
muestra de tamaño n en la población tiene una misma probabilidad de ser seleccionada. El diseño no
pretende reducir de modo concretoel costo de la cantidad deseada de información. Es el tipo de diseño de
encuestas por muestreo más elemental y todos los otros diseños se contrastan con él.
El segundo tipo de diseño, muestreo aleatorio estratificado (Capftulo 5), divide a la población en
grupos homogéneos denominados estratos. Este procedimiento usualmente produce un estimador que
posee una varianza más pequeña que la que puede ser obtenida por muestreo irrestricto aleatorio. Por lo
tanto el costo de la encuesta puede reducirse seleccionando pocos elementos a fin de alcanzar un límite
equivalente para el error de estimación.
H tercer tipo de diseño experimental es el muestreo sistemático (Capitulo 7), el cual generalmente se
aplica a los elementos de la población que están disponibles en una lista o sucesión, tal como los nombres
en tarjetas ordenadas en un archiveroo personas que salen de una fábrica. Se selecciona un punto de inicio
aleatorio y posteriormente se muestrea cada k-ésimo elemento. El muestreo sistemático suele realizarse
cuando recolectar una muestra irrestricta aleatoria o una muestra aleatoria estratificada es extremadamente
costoso o imposible. Una vez más, la reducción en el costo de la encuesta se relaciona principalmente con
el costo de recolección de la muestra.
El cuarto tipo de diseño de encuestas por muestreo es el muestreo por conglomerados, el cual se
presenta en los Capftulos 8 y 9. El muestreo por conglomerados puede reducir el costo porque cada
unidad de muestreoes una colección de elementos usualmente seleccionados con el fin de que estén juntos
fisicamente. El muestreo por conglomerados suele realizarse cuando no se dispone de un marco que liste
todos los elementos de la población o cuando los costos de transporte de un elemento a otro son
considerables. El muestreo por conglomerados reduce el costo de la encuesta principalmente reduciendo
el costo de recolección de los datos.
En la tercera parte del material, Capitulo 6, se presenta un análisis de los estimadores de razón,
regresión y diferencia, los cuales utilizan la información de una variable auxiliar. El estimador de razón
ilustra cómo la información adicional, frecuentemente adquirida a bajo costo, puede ser usada para reducir
la varianza del estimador y, consecuentemente, para reducir el costo global de la encuesta. También
sugiere la posibilidad de obtener estimadores más sofisticados usando la información en más de una
variable auxiliar. Este capitulosobre estimación de razón sigue naturalmente al análisis sobre el muestreo
irrestricto aleatorio del Capftulo 4. Esto es, usted puede tomar una medición de y, la respuesta de interés,
para cada elemento de la
12.2 COMPARACIONES ENTRE LOS DISEÑOS Y MÉTODOS 293
especificaciones del fabricante se satisfacen en esta remesa? (Cada acumulador contiene 24 placas
positivas.)
12.2 El Departamento de Rentas Públicas en un estado cuidaduamente lu cifra del ünpuesto sobre ventas de
las tiendas con ventas al menudm. Si el departamentoconsidera que una empre ea e-gtá reportando menos
de sus ventu grayabl", puede ordenar una auditorfa de lu cuenta de
296 12
la empresa. Una auditoria semejante fue ordenada para una empresa con muchas sucursales de
ventas al menudeo a trave del estado. Los datos sobre las ventas gravables fueron conservados para
cada tienda. Por lo tanto los auditores decidieron muestrear aleatoriamente las ventas por meses-
tienda. Esto es, los datos de las ventas fueron obtenidos para los meses seleccionados
aleatoriamente en las tiendas seleccionadas aleatoriamente. Luego los auditores registraron el total
de las ventas gravables para compararlo con las ventas gravables reportadas por la tienda. El
Departamento de Rentas Públicas quiere estimar el incremento proporcional en las ventas gravables
revisadas sobre las ventas gravables reportadas. ¿Cómo puede usted hacer esta estimación, con un
límite para el error, según los datos que se presentan en la tabla adjunta para 15
Ven Venta.
1 31.5 23.2
2 31.8 22.9
3 21.1 17.6
4 34.7 29.8
5 21 .o 16.8
6 40.8 35.1
7 21.3 23.3
8 31.3 26.1
9 19.9 18.8
10 30.9 25.7
11 32.2 29.6
12 32.4 27.1
13 31.7 29.9
14 28.8 31.5
15 30.7 28.4
PESUVEN
12.8 La Oficina de Estudios del Departamento de Asuntos Internos de Estados Unidos mo. nitorea
el flujo de agua en los ríos de Estados Unidos. Los datos que se presentan en la Tabla 12.2
muestran las proporciones medias del flujo diario, en pies cúbicos por segundo, para una estación
de control específica en cierto río de Florida para un pediodo de dos años, 1977-1979. (a) Tome
una muestra de 20 medicionesde los datos para calcular una estimación rápida de la proporción
promedio del flujo diario para el periodo de dos años. Establezca un límite para el error de
estimación.
(b) Estime la razón de la proporción promediode flujo en abril con la proporción promedio de flujo
m septiembre, y establezca un límite para el error de estimación. ¿Considera que aquí necesita
datos de más años para hacer una buena etimación?
12.4 Los guardabosques estiman el volumen neto de los arboles en pie midiendo el diámetro a la altura del
pecho y la altura del arbol y, posteriormente, observando los defectos visibles y otras
caracteristicas del árbol. H volumen real de madera útil solamente puede encontrarse después de
que el árbol es dembado y procesado en tablazón. Para una muestra de 20 arboles, los datos el
volumen estimado y el volumen real están registrados, junto con la especie del árbol, en la tabla
adjunta. El volumen total estimado para todos los 180 arboles es 60,000 pies de tabla. Use los datos
de la tabla para resolverlos problemas siguientes.
(a) Estime el total real de pies de tabla para los 180 árboles.
(b) Estime la proporción de arboles de abeto balsámico para el sitio completo.
TABLA 42.2 cb agua [en pes cúbicos por segundo), de octubre 1977 a septiembre de 1978 (valores medios]
1977-1978
0.56
Ι9-7&Ι979
11 4.6 0.70 3.0 7.5 16 44 275 14 6.2 150 150
12 5.6 0.76 3.4 27 16 37 12 6.8 490 145
13 0.74 3.1 59 15 33 9.9 185 11 11 379 226
3
F.E•te: U. S. Dcprtmcnt of Interior, Gcologial Survcy.
300 12 RESUMEN
210
195 236
CL n,
CL 50,
Malathion 0.5 0.9
DDT 0.8 1.8
Parathion 4.5 2.1
Endrin 5.5 1.3
Azinphosrriethyl 1.2 0.2
DDT 3.5 2.3
Parathion 5.0 1.5
Endrin 0.5 3.2
Zectran 83.0 12.0
Chlordane 4.0 10.0
Fenthion 5.8 12.0
Malathion 12.0 90.0
Fuente: Federal Rqister, Vol. 43. No. 97; mayo, 18, 1978.
12.9 Remítase al Ejercicio 12.8. ¿Puede usted sugerir algunas mejoras en el muestreo para obtener una
mejor estimación del factor de conversión?
12.10 Vuelva al Ejercicio 12.2. {Puede usted sugerir un mejor diseño para el muestreo de las tiendas con
ventas al menudeo? Tenga presenteque las ventas varfan de una tienda a otra y de un mes a otro.
302 12 RESUMEN
12.11 Un agricultor entrega a un ingenio azúcar bruto a granel, transportado en grandes camiones
tanque. La cantidad que el ingenio paga por la carga de azúcar de un camión depende del
contenido de azúcar puro en la carga. Este contenido de azúcar puro se determina
mediante el análisis de muestras pequeñas de prueba en el laboratorio; cada muestra de
prueba contiene su ficiente azúcar bruto para llenar un tubo de ensayo. Analice los
diseños de muestreo posibles para obtener estas muestras de prueba. (Solamente
pueden realizarse unos pocos muestreos de prueba por carga de azúcar de un camión.)
14.12 La lana de Australia es inspeccionada tal como llega a Estados Unidos y se paga un impuesto
de importación con base en el contenido de lana pura. De la parte central de fardos se
toman muestras que son analizadas para determinarla proprci6n de lana pura en el fardo.
Analice los diseños de muestreo posibles para la estimación del contenido de lana pura
en un cargamento de fardos.
1213 La Comisión de Servicios Públicos de Florida exige a las compañías expendedoras de gas
natural asegurarse de que los medidores conectados a las casas y edificios comerciales
estén operando correctamente. Sin embargo, las compañías aprueban un plan de
inspección por muestreo más bien que un anual detallado de cada medidor.
Suponga que un 20% de los medido• res propiedad de una compañía deben ser
inspeccionados cada año, y la proporción de los medi dores de la compañfa que etán
operando correctamente debe ser estimada. (Si la proporción es baja, se obligara a la
empresa a revisar más medidores.) Sugiera un plan de muestreo para esta política de
inspección, teniendo en cuenta los puntos siguientes: (1 ) Los medidores son de años
variables; (2) el consumo de gas varía considerablementede un usuario a otro y (S) los
medidores son conectadas y desconectados continuamente.
APÉNDICE
BIBLIOGRAFIA
Mendenhall, W. 1983. Zntroduction to Bobability and Statistics. 6a. ed. Boston: Duxbury Press.
Mosby, H. S. , ed. 1969. Wildlife Investigational Techniques. 3a. ed. Washington, D.C.: Wildlife
Society.
Raj, Des. 1968. Sampling Theory. New York: McGraw-Hill.
Ray, A. A. , ed. 1982. SAS Users Guide: Statistics. Cary, N.C.: SAS Institute.
Roberts, D. 1978. Statistical Auditing. New York: American Institute of Certified Accountants.
Ryan, T. A.; Joiner, B. L.; y Ryan, B. F. 1976. Minitab Student Handbook. Boston: Duxbury
Press.
Schuman, Howard y Presser, Stanley. 1981. Questions and Answers in Attitude Surveys. New
York: Academic Press.
Stephan, Frederick F. y McCarthy, Philip M. 1958. Sampling Opinions, An Analysis of Survey
Procedure. New York: Wiley.
Sudman, Seymour. 1976. Applied Sampling. New York: Academic Press.
Swindel, B. F. 1983. "Choice of Size and Number of Quadrats to Density from Frequency in
Poisson and Binomially Dispersed Populations". Biometrics, 39:455.
Tanur,J. M.; Moste11er,F.•, Kruskal, W. H.; Pieters, R. S.; yRising, G. R. eds. 1972. Statistics: A
Guide to the Unknown. San Francisco: Holden—Day.
Wamer, S. L. 1965. "Randomized Response: A Survey Technique for Eliminating Evasive
Answer Bias". Journal of the American Statistical Association,
Weeks, M. F.; Jones, B. L.; Folsom, R. E.; y Benrud, C. H. 1980. "Optirna_l Times to Contact
Sample Households". Public Opinion Quaterly, 44:101— 114 Williams, B. 1978. A Sampler on
Sampling. New York: Wiley.
TABLAS 305
T ABlAS
TABLA 1 Areas de h curva normal
0.0 ο.οοοο 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 01103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 α 1915 0.1950 0.1985 0.2019 0.2054 0.2088 02123 0.2157 0.2190 0.2224
0.6 02257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.261 ι 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 ύ62Ι
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 03907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.41 15 0.4131 0.4147 0.4162 0.4177
0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4645
1.7 0.4554 0.4564 0.4573 0.4682 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4867
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.8 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4919 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4982 0.4984 0.4984 0.4985 0.4986 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207 20969 99570 91291 90700
2 22368 46573 25595 85393 30995 89198 27982 53402 93965 34095 52666 19174 39615 99505
3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081 30680 19655 63348 58629
4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004 00849 74917 97758 16379
5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672 14110 06927 01263 54613
6 77921 06907 11008 42751 27756 53498 18602 70659 90655 15053 21916 81825 44394 42880
7 99562 72905 56420 69994 98872 31016 71194 18738 44013 48840 63213 21069 10634 12952
8 96301 91977 05463 07972 18876 20922 94595 56869 69014 60045 18425 84903 42508 32307
9 89579 14342 63661 10281 17453 18103 57740 84378 25331 12566 58678 44947 05585 56941
10 85475 36857 53342 53988 53060 59533 38867 62300 08158 17983 16439 11458 18593 64952
11 28918 69578 88231 33276 70997 79936 56865 05859 90106 31595 01547 85590 91610 78188
12 63553 40961 48235 03427 49626 69445 18663 72695 52180 20847 12234 90511 33703 90322
13 09429 93969 52636 92737 88974 33488 36320 17617 30015 08272 84115 27156 30613 74952
14 10365 61129 87529 85689 48237 52267 67689 93394 01511 26358 85104 20285 29975 89868
15 07119 97336 71048 08178 77233 13916 47564 81056 97735 85977 29372 74461 28551 90707
16 51085 12765 51821 51259 77452 16308 60756 92144 49442 53900 70960 63990 75601 40719
17 02368 21382 52404 60268 89368 19885 55322 44819 01188 65255 64835 44919 05944 55157
18 01011 54092 33362 94904 31273 04146 18594 29852 71585 85030 51132 01915 92747 64951
19 52162 53916 46369 58586 23216 14513 83149 98736 23495 64350 94738 17752 35156 35749
20 07056 97628 33787 09998 42698 06691 76988 13602 51851 46104 88916 19509 25625 58104
21 48663 91245 85828 14346 09172 30168 90229 04734 59193 22178 30421 61666 99904 32812
22 54164 58492 22421 74103 47070 25306 76468 26384 58151 06646 21524 15227 96909 44592
23 32639 32363 05597 24200 13363 38005 94342 28728 35806 06912 17012 64161 18296 22851
24 27001 87637 87308 58731 00256 45834 15398 46557 41135 10367 07684 36188 18510
25 33062 28834 07351 19731 92420 60952 61280 50001 67658 32586 86679 50720 94953
2681525 72295 04839 96423 24878 82651 66566 14778 76797 14780 13300 87074 79666 95725
2729676 20591 68086 26432 46901 20849 89768 81536 86645 12659 92259 57102 80428 25280
2800742 57392 39064 66432 84673 40027 32832 61362 98947 96067 64760 64584 96096 98253
2905366 04213 2%69 26422 44407 44048 37937 63904 45766 66134 75470 66520 34693 90449
3091921 26418 64117 94305 26766 25940 39972 22209 71500 64568 91402 42416 07844 69618
3100582 04711 87917 77341 42206 35126 74087 99547 81817 42607 43808 76655 62028 76630
3200725 69884 62797 56170 86324 88072 76222 36086 84637 93161 76038 65855 77919 88006
33690M 65795 95876 55293 18988 27354 26575 08625 40801 59920 29841 80150 12777 48501
3425976 57948 29888 88604 67917 48708 18912 82271 65424 69774 33611 54262 85963 03547
3509763 83473 73577 12908 30883 18317 28290 35797 05998 41688 34952 37888 38917 88050
3691567 42595 27958 30134 04024 86385 29880 99730 55536 84855 29080 09250 79656 73211
3717955 $349 90999 49127 20044 59931 06115 20542 18059 02008 73708 83517 36103 42791
3846503 18584 18845 49618 02304 51038 20655 58727 28168 15475 56942 53389 20562 87338
3992157 89634 94824 78171 84610 82834 09922 25417 44137 48413 25555 21246 35509 20468
4014577 62765 81263 39667 47358 56873 56307 61607 49518 89656 2mö3 77490 18062
4198427 07523 33362 64270 01638 92477 66969 98420 04880 45585 46565 04102 46880 45709
4234914 63976 88720 82765 34476 17032 87589 40836 32427 70002 70663 88863 77775 69348
4370060 28277 39475 46473 23219 53416 94970 25832 69975 94884 19661 72828 00102 66794
4453976 54914 06990 67245 68350 82948 11398 42878 80287 88267 47363 46634 0654 L 97809
4576072 29515 40980 07391 58745 25774 22987 80059 39911 96189 41151 14222 60697 59583
4690725 52210 83974 29992 65831 38857 83765 55657 14361 31720 57375 $228 41546
4764364 67412 33339 31926 14883 24413 59744 92351 97473 89286 35931 04no 23726 51900
4808962 00358 31662 25388 61642 34072 81249 35648 56891 69352 48373 45578 78547 81788
4995012 68379 93526 70765 10592 04542 76463 54328 02349 17247 28865 14777 62730 92277
5015664 10493 20492 38391 91132 21999 59516 81652 27195 48223 46751 22923 32261 85653
5116408 81899 04153 53381 79401 21438 83035 92350 36693 31238 59649 91754 72772
5218629 81953 05520 91962 04739 13092 97662 24822 94730 06496 35090 04822 86774 98289
5373115 35101 47498 87637 99m6 71060 88824 71013 18735 20286 23153 72924 35165 43040
5457491 16703 23167 49323 45021 33132 12544 41035 80780 45393 44812 12515 98931 91202
5530405 83946 23792 14422 15059 45799 22716 19792 09983 74353 68668 30429 70735
Continüa
TABLA 2 Continuaciön
Reng16n/ col. (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) (13)
(14)
16631 35006 85900 98275 32388 52390 16815 69298 82732 38480 73817 32523 41961 44437
57 96773 20206 42559 78985 05300 22164 24369 54224 35083 19687 11052 91491 60383 19746
58 38935 64202 14349 82674 66523 44133 00697 35552 35970 19124 63318 29686 03387 59846
59 31624 76384 17403 53363 44167 64486 64758 75366 76554 31601 12614 33072 60332 92325
60 78919 19474 23632 27889 47914 02584 37680 20801 72152 39339 34806 08930 85001 87820
61 03931 33309 57047 74211 63445 17361 62825 39908 05607 91284 68833 25570 38818 46920
62 74426 33278 43972 10119 89917 15665 52872 73823 73144 88662 88970 74492 51805 99378
63 09066 00903 20795 95452 92648 45454 09552 88815 16553 51125 79375 97596 16296 66092
64 42238 12426 87025 14267 20979 04508 64535 31355 86064 29472 47689 05974 52468 16834
€5 16153 08002 26504
29820
66 21457 40742
02050
67 21581 57802 83197
68 55612 78095 99324
69 44657 66999 46949
70 91340 84979
31935
71 91227 21199 66321
72 50001 38140 72958
73 65390 05224 83944
74 27504 96131 39117
75 37169 94851
76 11508 70225 06694
77 37449 30362 85922
78 46515 70331 42416
30986 46583
79 81223
80 63798 64995
41744 81959 65642 74240 56302 00033 67107 77510 70625 28725 34191
96783 29400 21840 15035 34537 33310 06116 95240 15957 16572 06004
89728 17937 37621 47075 42080 97403 48626 68995 43805 33386 21597
33732 05810 24813 86902 60397 16489 03264 88525 42786 05269 92532
51281 84463 60563 79312 93454 68876 25471 93911 25650 12682 73572
81973 37949 61023 43997 15263 80644 43942 89203 71795 99533 50501
27022 84067 05462 35216 14486 29891 68607 41867 14951 91696 85065
19924 72163 09538 12151 06878 91903 18749 34405 56087 82790 70925
28609 81406 39147 25549 48542 42627 45233 57202 94617 23772 07896
41575 10573 08619 64482 73923 36152 05184 94142 25299 84387 34925
89632 00959 16487 65536 49071 39782 17095 02330 74301 00275 48280
38351 19444 66499 71945 05422 13442 78675 84081 66938 93654 59894
54690 04052 53115 62757 95348 78662 11163 81651 50245 34971 52924
38329 57015 15765 97161 17869 45349 61796 66345 81073 49106 79860
58353 21532 30502 32305 86482 05174 07901 54339 58861 74818 46942
09785 44160 78128 83991 42865 92520 83531 80377 35909 81250 54238
8182486 84846 99254 67632 43218 50076 21361 64816 51202 88124 41870 52689 51275 83556
8221885 32906 92431 09060 64297 51674 64126 62570 26123 05155 59194 52799 28225 85762
8360336 98782 07408 53458 13564 59089 26445 29789 85205 41001 12535 12133 14645 23541
8443937 46891 24010 25560 86355 33941 25786 54990 71899 15475 95434 98227 21824 19585
8597656 63175 89303 16275 07100 92063 21942 18611 47348 20203 18534 03862 78095 50136
8603299 01221 05418 38982 55758 92237 26759 86367 21216 98442 08303 56613 91511 75928
8779626 06486 03574 17668 07785 76020 79924 25651 83325 88428 85076 72811 22717 50585
8885636 68335 47539 03129 65651 11977 02510 26113 99447 68645 34327 15152 55230 93448
8918039 14367 61337 06177 12143 46609 32989 74014 64708 00533 35398 58408 13261 47908
9008362 15656 60627 36478 65648 16764 53412 09013 07832 41574 17639 82163 60859 75567
9179556 29068 04142 16268 15387 12856 66227 38358 22478 73373 88732 09443 82558 05250
9292608 82674 27072 32534 17075 27698 98204 63863 11951 34648 88022 56148 34925 57031
9323982 25835 40055 67006 12293 02753 14827 23235 35071 99704 37543 11601 35503 85171
9409915 96306 05908 97901 28395 14186 00821 80703 70426 75647 76310 88717 37890 40129
9559037 33300 26695 62247 69927 76123 50842 43834 86654 70959 79725 93872 28117 19233
9642488 78077 69882 61657 34136 79180 97526 43092 04098 73571 80799 76536 71255 64239
9746764 86273 63003 93017 31204 36692 40202 35275 57306 55543 53203 18098 47625 88684
9803237 45430 55417 63282 90816 17349 88298 90183 36600 78406 06216 95787 42579 90730
9986591 81482 52667 61582 14972 90053 89534 76036 49199 43716 97548 04379 46370 28672
10038534 01715 94964 87288 65680 43772 39560 12918 86537 62738 19636 51132 25739 56947
Veni6n abreviada de Handboohof Tablesfor hobabiEty and Statetics, Segunda Edici6n. editadopor William H. Beyer (Cleveland: The Chemical
Rubber Publishing Company. 1968). Reproducida con autorizaci6n. Copyright CRC Pre", Inc., Boca Raton. FL
TABLA 3 Poblaciön de Esta%s Lhüs
Estados Unidos 226,505 203,302 11.4 15.3 8.8 13.8 2.0 1.1.2 73 11.5 $5,751
Noreste 49.137 49.061 0.2 12.9 13.1 —3.7 12.1 9.2 5,882
Nueva 12,348 11.847 12.5 11.4 0.0 12.0 82 8.6 5.814
Maine 1,125 994 13.2 14.5 9.3 10.4 5.2 12.3 30 0.2 4,627
New Hampshire 921 738 24.8 14.3 8.5 10.4 14.3 11.10.2 5,365 Verrnont 511 445
15.0 14.613.6 5.0 11.30.2 4,770 Massachusetts 5,737 5,689 0.8 11.911.1 —1.6 12.33.3
5,826 Rhode Island 947 950 —0.3 12.413.6 -5.2 13.22.7 5,589 3,108 3.032 2.5
12.0 11.6 —1.2 92 6,564
Atlåntico Medio 36.788 37,213 —1.1 13.0 9.6 13.7 12.1 11.0 5,904
New York 17.557 18.241 -3.8 13.2 14.0 —7.1 12.0 88 12.5 5,849
New Jersey 7,364 7,171 12.8 9.0 13.0 11.5 10.8 6492
t 1,867 1 t,801 0.6 12.9 10.2 13.7 12.7 8.7
5,622
Norte Central 58,854 56,500 4.0 15.3 8.9 13.6 -2.8 11.25,868
N. Central 41,670 40.263 3.5 15.2 13.8 —3.7 10.6 77 10.4 6,003
Ohio 10,797 10,657 15.0 9.0 13.3 —5.3 10.6 co 9.4 5,796
5,490 5,195 5.7 15.5 8.8 13.1 —2.9 10.6 70 6.7 5.751
Illinois 11,418 11,110 2.8 15.5 9.2 15.7 10.9 81 15.4 6.358
Michigan 9,258 8,882 4.2 15.2 13.8 9.6 6,130
Wisconsin 4,705 4,418 6.5 14.7 11.2 1.2 11.8 63 3.2 5.660
N. Central Oeste 17,184 16,328 5.2 15.5 9.3 13.212.6 53 5.0
5.523 4,077 3,806 15.4 12.0 11.6 1.3 5,778 2,913
2,825 3.1 15.312.613.1 37 5.439 Missouri 4,917 4.678
10.
15.0 14.8 13.0 11.8 5.493 North Dakota 653 618 5.6 17.3
2
Nebraska 1,570 1,485 5.7 16.0 9.2 13.0 0.0 13.0 45 5.326
2,353 2.249 15.7 9.2 12.5 —0.2 12.7 46 5.6 5,861
Sur 75.349 62,893 20.0 16.0 9.0 15.3 6.6 11.3 18.8 5,289
Atlåntico Sur 36,943 30,679 20.4 14.6 15.5 7.8 11.9 20.8 5,516
13.5 12.1 35 0.3 4,856 South Dakota 690 3.6 17.713.5 —3.5 13.1 28
4,529
Delaware 595 548 8.6 14.9 13.2 13.4
5,883
i
Maryland 4.216 3,924 7.5 13.3 8.0 14.7 0.1 9.220.7 6,561 D. of Columbia 638 757 —15.7 14.0 10.5 27.3 — 17.4 11.171.7
7.074 Virginia 5,3464.651 14.9 14.2 7.9 13.815.9 5,883
West Virginia 1,950 1.744 11.8 15.7 10.6 15.1 2.7 12.0 36 4,851
N. Carolina 5,874 5,084 15.5 14.8 16.6 3.0 10.2 45 22.4 4,876
S. Carolina f 8.6
2.591 20.4 17.1 4.0 9.2 31.6 4,628
S. Central Fste 14,663 12,808 14.5 t 6.4 15.4 11.9 52 20.6 €686
3,661 3.221 13.7 16.4 9.6 12.7 11.2 4,851
Tennessee 4,591 3.926 16.9 15.4 8.9 14.8 11 2 16.4 4,845
Alabama 3,890 3,444 12.9 16.2 9.3 16.1 2.2 11.2 26.7 4,712
Mississippi 2,521 2,217 13.7 18.4 9.7 18.7 0.3 35.6 4,120
S. Central Oeste 23,743 19,326 22.9 17.8 8.6 15.0 7.2 10.4 14.6 5,313
Arbnsas 2.286. 1,923 18.8 16.1 10.1 16.4 7.1 13.7 4,443
Louisana 4.204 3,645 15.3 18.8 17.3 28.6 4,790
Oklahoma 3,025 Z559 18.2 16.1 9.8 14.3 6.9 12.5 6.7 5245
Texas 14.22> 27.1 18.2 8.0 14.3 9.3 9.7 5,633
li.6
43,165 34,838 23.9 17.0 7.7 9.5 10.0 5.3 6,238
i2.i
Montana 11.368 8.290 37.1 19.5 7.2 12.2 16.6 9.5 61
Montana -787 694 13.3 17.4 11.6 10.6 24 5.288
Idaho 944 713 32.4 22.0 11.7 14.0 10.0 17 0.0 3.072
Wyoming 471 332 41.6 20.4 7.3 13.0 24.2 6,454
Colorado 2,889 2,210 30.7 16.3 6.8 11.2 15,8 8.6 6.118
New Mexico 1,300 1,017 27.8 19.8 7.0 14.1 1.7 4,Éy
2.718 1,775 53.1 18.2 13.1 26.1 11.8 75 5.545
Uåh 1,461 1059 37.9 29.5 6.0 11.4 7.6 7.7 0.7 5.135
Nevada 799 489 63.5 16.5 7.6 12.5 33.8 8.6 6.3 6,533
31.797 26.548 19.8 16.1 7.8 12.0 10.2
6,459
Washington 4,130 3,413 210 15.5 8.0 12.5 10.6 71 6.394
2,633 A092 25.9 15.9 12.9 14.6 11.6 59 1.3 6.018
Califomia 23.669 19.971 18.5 16.0 11.8 6.2 10.2 7.8
303 32.4 21.6 14.4 15.6 2.6 9.170
Hawaii 965 770 253 18.6 11.1 4.6 0.7
Fuente: Reproducido con autorizaci6n de Po*ion Reference Bureau, Inc„ Washington, D.C.
312 APÉNDICE
En esta sección presentamos la deducción matemática de algunas de las fórmulas
importantes usadas a través del texto. Suponemos que el lector tiene algún
conocimiento sobre teoría de la probabilidad, de manera que las esperanzas,
varianzasy covarianzas pueden ser manipuladas con poca explicación.
Sea y, una variable aleatoria con distribución de probabilidad p(y). Entonces
de la teoría elemental de la probabilidad tenemos la siguiente definición:
= E (y — = 0-2
donde E denota el valor esperado, V denota la varianza y g(y) es una función de y.
Suponga que y„ h, . . . , y, denota una muestra de tamaño n y que al, . . . , a,
son constantes. Si
(A.3)
MUESTREO IRRESTRICTO
Suponga que Y" • • • denota una muestra irrestricta aleatoria de una población
de valores {u„ u.z, . . • , Considerando por d misma (una muestra irrestricta
aleatoria de tamano uno), tenemos
34,
E(s2) E
344
Por lo tanto