Está en la página 1de 34
Otros temas de muestreo* Casi todos los estados han dewelto sus censos. Le envo los resultados, con tnta negra si estén basados (en la medida de lo posible) en los datos reales, y con tina rojasi no son los datos regresados, aunque bastante conocidos. Con un pequefio margen para as omisiones, somos més de cuatro millones, aunque de hecho sabemos que las omisiones han sido muy grandes. —Thomas Jefferson, carta a David Humphreys, 23 de agosto de 1791 luestreo en dos etapas En ocasiones, tal vez se desee utilizar la estratificacién, el muestreo con probabilidades diferentes o la estimaci6n por proporcién para aumentar la precisién de su estimador, pero el marco de muestreo no tiene informacién de variables auxiliares ttiles. Por ejemplo, su- Ponga que quiere obtener una muestra.de empresas con probabilidad proporcional al ingre- So, pero que no tiene informacién del ingreso en el marco de muestreo. O bien, tal vez quiera estimar el volumen total de madera cortado en un bosque, midiendo el volumen total en una muestra de carga de camiones con troncos. El volumen de madera en un camién est relacionado con el peso de la carga, de modo que esperaria tener mayor precisién usando la estimacién por proporcién con y, igual al volumen de madera en el camion i y x, igual al peso del camién i. Pero la estimacién por proporcién é,, =1,/, /i, requiere conocer el peso total de todas las cargas y no es prictico pesar cada camién de la poblacién. El muestreo en dos etapas, también llamado muestreo doble, brinda una solucién. El muestreo en dos etapas, introducido por Neyman (1938), es util cuando es relativamente caro medir la variable de interés y, pero es posible medir facilmente una variable correlacionada x y usarla para mejorar la precisién del estimador de ¢,. Suponga que la poblacién tiene N unidades de observacién. La muestra se extrae en dos tapas: 1 Muestra de la primera etapa. Extraemos una muestra de probabilidad de n‘ unidades, conocida como muestra de la primera etapa. Medimos las variables auxiliares x para cada unidad de la muestra de la primera etapa. En la encuesta de empresas, se deberia extraer una muestra aleatoria de declaraciones de impuestos y registrar el ingreso reportado por cada ‘empresa de la muestra. Para medir el volumen de madera se podria pesar una muestra de 5 EJEMPLO 12.1 316 Capitulo 12: Otros temas de muestreo* camiones seleccionados al azar o con probabilidad proporcional al volumen de madera es- timado, La muestra de la primera etapa es por lo general relativamente grande (y puede serlo, pues no es caro obtener la informacién auxiliar) y debe brindar informacién precisa acerca de la distribucién de las x. 2. Muestra de la segunda etapa. Ahora active como si la muestra de la primera etapa fuese una poblacién y seleccione una muestra de probabilidad de la muestra de la primera etapa. Mida las variables de interés para cada unidad de la submuestra, conocida como muestra de Ja segunda etapa. Puesto que se esta considerando la muestra de la primera etapa como la poblacién de la cual se extrae la muestra de Ia segunda etapa, se puede utilizar la informa- cién auxiliar recogida en la primera etapa al disefiar la muestra de la segunda etapa. Se podria seleccionar las empresas con las cuales establecer contacto con probabilidad propor- cional al ingreso medido en la muestra de la primera etapa, o bien, utilizar Ia informacion de ingreso para estratificar las empresas de la muestra de la primera etapa y Iuego establecer contacto con un subconjunto seleccionado al azar de las empresas en cada estrato de ingreso para obtener la informacién deseada sobre variables como los gastos totales. Se podrian seleccionar las cargas en las que el volumen de madera se mediré con probabilidad propor- cional al peso, o bien, utilizar la informacién de la muestra de la primera etapa para obtener una mejor estimacién del peso total y emplear la estimaci6n por proporcién. En cada caso. es relativamente caro medir las variables y, pero y esté correlacionada con x. El muestreo en dos etapas puede ahorrar tiempo y dinero si es barato obtener la infor- ‘macién auxiliary si contar con informacién auxiliar puede aumentar la precisién de las estimaciones para las cantidades de interés. Stockford y Page (1984) utilizaron el muestreo en dos etapas para estimar el porcentaje de veteranos de la guerra de Vietnam residentes de los hospitales de la Oficina de Veteranos (VA) de Estados Unidos que realmente combatieron en Vietnam. EI Censo Anual de Pacientes (APC) de la VA en 1982 incluyé una muestra aleatoria de 20% de los internos en hospitales de la VA. Se incluyé la siguiente pregunta: “Si el periodo de servicio es la guerra de Vietnam, estaba de servicio en Vietnam?” con las categorias de respuestas “si”, “no” y “no disponible”. Se obtuvieron las respuestas a esta pregunta me- diante los registros médicos de los pacientes. Sin embargo, esa respuesta podria ser impre- cisa por varias razones: (1) Gran parte de los registros médicos fueron llenados por el propio paciente, quien podria no recordar la ubicacién de su servicio debido a problemas médicos, © estar confundido acerca de la definicién de servicio en Vietnam (algunos pilotos cuye estacién de trabajo estaba oficialmente en Tailandia realizaron misiones sobre Vietnam); (2) un paciente podria afirmar erréneamente un servicio en Vietnam al suponer que la respuesta podria afectar los beneficios de la VA; o (3) puede haber errores al registrar la respuesta en el registro médico. Ademés, muchos pacientes no estuvieron “disponibles” para la respues- ta. Asi, la respuesta a la pregunta sobre el servicio en Vietnam de la encuesta APC fue insatisfactoria para estimar el porcentaje de veteranos de la guerra de Vietnam en hospitales de la VA que estuvieron de servicio en ese pais. Stockford y Page verificaron los registros militares para una submuestra estratificada de veteranos hospitalizados para determinar la clasificacién real del servicio en Vietnam. La informacién de la encuesta original se utiliz6 para la estratificacién, ya que se esperaban distintos porcentajes de servicio en los grupos “si”, “no” y “no disponible” en la encuesta APC. Se verificaron los registros militares de todos los pacientes en el estrato “no disponi- le”. Se esperaba que las varianzas dentro de los estratos fuesen relativamente bajas en los 12.1 Muestreo en dos tapas 31) estratos “sf” y “no” pues, aunque los datos de la encuesta APC eran imprecisos, seria de esperar que un mayor porcentaje de personas que respondieron “si” haya realizado su servi- cio en Vietnam que quienes respondieron “no”; se verificaron los registros militares de una submuestra de 10% para cada uno de estos dos estratos. ‘Los resultados de la pregunta “;Estuvo de servicio en Vietnam?” fueron las siguientes: Grupo Clasificaciénen Tamafiode —_ Servicio en Vietnam APC laencuesta APC _lasubmuestra en Ja submuestra Si 155 67 49 No 804 2 u No disponible 505 305 2u1 Total 2064 644 21 Como era de esperar, el porcentaje de veteranos con servicio en Vietnam diferia en los ‘tres grupos: de los veteranos con respuesta “si” a la pregunta de la encuesta APC, 73% realmente sirvieron alli, en comparacién con 15% para el grupo “no” y 42% para los vetera- nos cuya informacién no estaba disponible, EJEMPLO 12.2 Frecuentemente, el muestreo en dos etapas se utiliza en los estudios de silvicultura. Se dispone de fotografias aéreas y sistemdticamente se distribuyen puntos en las fotogratias. Se estudian las dreas alrededor de los puntos de las fotografias y se clasifican de acuerdo conel tipo de terreno: bosque, bosque improductivo, area no de bosque y agua. Entonces, se extrae una muestra de la primera etapa de puntos en la reticula con una fraccién de muestreo mayor para los puntos de la reticula clasificados como bosque que los clasificados como no de bosque. Las dreas de la muestra de la primera etapa se examinan con més cuidado, para clasificarlas segiin el tamatio y densidad de los drboles. Luego, se extrae una submuestra de Jos puntos de la muestra de la primera etapa y se realizan medicines como uso del suelo, volumen y mortalidad; el porcentaje de area de bosque de la muestra de la segunda etapa puede diferir un poco de la estimacién fotogréfica de la primera etapa y la estimacién por proporcién se puede usar en la muestra de la segunda etapa para aumentar su precision, EJEMPLO 12.3 Enlaseccién 8.3 estudiamos el uso del muestreo en dos etapas en el ajuste por la ausencia de respuestas. Se extrac una muestra de probabilidad de la poblacién; las unidades de la muestra se dividen en los dos estratos de las personas que responden y las que no. Luego, se extrae una submuestra de las personas que no responden, La muestra de la primera etapa es la muestra de probabilidad original. La variable f si la observacién i responde (0. sila observacién i es una persona que no responde se analiza para cada elemento de la muestra de la primera etapa. Luego, se emplea la informacién relativa a x, en la muestra de la segunda etapa. Observamos el valor de inte- rés y, para todas las observaciones con x, = 1; se extrae una submuestra para las observa- ciones conx,=0. = I21.1 Teoria de muestreo en dos etapas Primero estableceremos los resultados en general y luego para el caso en que las muestras de la primera y la segunda etapa son aleatorias simples. Un marco de referencia general para el muestreo en dos etapas aparece en Sirndal y Swensson (1987).

También podría gustarte