Está en la página 1de 332
ELEMENTOS DE MUESTREO Saas SCHEAFFER MENDENHALL OTT Grupo Editorial Iberoamérica eS ELEMENTOS DE MUESTREO RICHARD L. SCHEAFFER University of Florida WILLIAM MENDENHALL LYMAN OTT Merrell Research Center Traductores: Dr. GILBERTO RENDON SANCHEZ Dr. JOSE ROBERTO GOMEZ AGUILAR duados tica y Calculo - Seccién de Muestreo Chapingo, México Revisor Técnico y Consultor Editorial: M. en C. SERGIO VARGAS GALINDO Instituto Tecnolégico Auténomo de México (ITAM) - México Grupo Editorial Iberoamérica S&S ws Rio Atou 32- aio Mesa DE - Td 2g ELEVENTOS DE MUESTRED Version en espafiol de la obra Elementary Survey Sampling ~ Third Edition, por Richard L. Scheaffer, William Mendenhall & Lyman Ott Edicion original en inglés publicada por PWS Publishers, Copyright © 1986, en Estados Unidos de América. ISBN 0-87150-943-1 D. R.© 1987 por Grupo Baitorial Toeroaniiva, S.A. de CY. y/o Wadsworth Ineernacional/Iberoamriea, Belmont, Califomia 94002. Ninguna parte de este libro puede set reproducida, archivada o tranemitida en fouma alguna o mediante algdn sistema, ya sea electsniee. meednico, de fotorreproduccion, de alnacenamiento en memoria o cvalguier otro, nel previo yexpreso permiso por escrito de Grupo Fuitorial Iberoamérica y/o Wadsworth Interacional/Iberoamésies,divisicn de Wadsworth, Ine ISBN 968-7270-20-9 Impresoien México Bitar: Nicola Grepe P. Producior: Ouwalda Onis R- Cubierta: lige Kaiser Pintura de Wa cubleria: “Visetion”® por Miche! Lasuchin, D.R. Reproduida con augorinacin del artista Grupo Editorial Iberoamérica, S.A. de C.V. Rio Atoyac No. 32 - Col. Cuauhtémoc - 06500 México, D.P. Apdo. 5-192 - Tels, 2113128, 5530798 Reg. CNIEM 1382 PROLOGO La obra Elementos de Muestreo es un texto introductorio sobre el disefio y anilisis, deencuestas por muestreo, dirigidoa estudiantes de administraci6n, cienciassocialesy ciencias biolégicas. El nico requisito es haber tomado un curso elemental de estadistica. La gran cantidad de ejemplos, con soluciones, lo hace también adecuado para usarse como un texto adicional para cursos de mayor nivel. ‘Ya que el texto esta dirigido a estudiantes con limitada preparacién en matemd- ticas, se hace hincapié en los aspectos pricticos de los problemas de las encuestas. Cada capitulo presenta un diseito de muestreo de encuestas o un método viable de esti- macién, mediante la descripcién de un problema practico pertinente, y luego explica la conveniencia de la metodologfa propuesta. Esta introduccién va seguida de un pro- cedimiento de estimacién apropiado y de una presentacién resumida de las formulas, para luego resolver un problema préctico. La naturaleza de este texto no es en su Lott lidad un recetario de cocina. Se presentan explicacionesque apelan a la intuicin de los estudiantes para justificar muchas de las fSrmulas y para fundamentar Ia cleccidn de un disefio de muestreo particular. Se han seleccionado ejemplos y ejercicios de muchos campos de aplicaci6n, Las respuestas, dadas para algunos ejercicios selecciona- dos, pueden estar sujetas a pequeiios errores de redondeo debido a la complejidad de algunas de las formulas. Las secciones de "Experienciascon datos reales", que se encuentran al final de la mayorfa de los capitulos, sugieren maneras de como puede el estudiante resolver problemasde muesireo reales. Los proyectos de estos problemas pueden ser grandes 0 Pequefios; algunos requieren célculos por computadora. Hemos visto que son expe> riencias de aprendizaje valiosas para estudiantes que toman un curso de muestreo, El trabajo en proyectos reales obliga al estudiante a considerartodos los aspectos de laren-— = Ve= PROLOGO. cuesta y le motiva a percatarse de que ciertosconceptos que parecen simplesen el libro de texto, no son tan faciles de llevar a cabo en la practica. El texto incluye una revisién de conceptos elementales (Capitulos 1 y 2) y una descripcién de términos relacionados con muestreo de encuestas, aunado a un andlisis de los diseftos de'cuestionarios y métodos de recoleccién de datos (Capitulo 8), Los Capftulos4, 5, 7 y8 presentan los cuatro disefiosde muestreo de encuestas més comu- nes —es decir, muestreo irrestricto aleatorio, muestreo aleatorio estratificado, muestreo sistematico y muestreo por conglomerados, respectivamente—. El Capitulo 6 presenta la estimacin de razén y de regresiGn. Los capftulos restantes tratan de muestreo por conglomeradosen dos etapas, muestreo de poblaciones animales y otros problemas especializados que ocurren en muestreo de encue La tercera edici6n de este texto destaca los aspectos pricticos en la realizaciénde encuestas por muestreo, con nuevas secciones sobre fuentes de error en las encuestas, métodos de recoleccién de datos, disefio de cuestionarios y sugerencias en la planea- cidn de encuestas. Casi todos los capitulos contienen ahora més ejemplos de cémo los diversos disefios de muestreo son us: los en Ia préctica. Se han incluido en tres capitulos muchas aplicaciones practicas de encuestas que emplean muestreo con pro- babilidades proporcionalesa los tamafios y discusiones de este método. Otros temas nuevos en la tercera edicién incluyen estratificaci6n después de ta seleccién de la muestra, determinacién del tamafo de muestra en muestreo por conglomeradosen dos etapas y un estudio mas amplio sobre la estimacién de tamafios de pob! Se han aitadido ejercicios nuevos a casi todos los capitulos, y el Capitulo 12 tiene ahora un conjunto de ejercicios que puede requerir atencién cuidadosa en la seleccién del andlisis apropiado. Estos ejercicios pueden servir como una revisién de los métodos principales presentados en el libro. Se incluye en el Apéndice gran cantidad de datos reales que sirven de base a muchos ejercicios. Se tiene en preparacién un manual de soluciones. EI Apéndice incluye también las deducciones matematicas de muchos de los re- sultados principales del texto. El entendimiento de muchas de estas deducciones requiere un conocimiento a buen nivel de la teoria elemental de probabilidad. Deseamos expresar nuestro sincero reconocimientoa muchasde las personas que han ayudadoen la preparacion de esta obra. En particular queremos dar las gracias a Jos revisores por sus atinados comentarios, que fueron de mucha ayuda en esta labor. Se agradece también al profesor A. Hald por su amable autorizacién para usar la tabla de areas de la curva normal que se reproduce en el Apéndice, Estamos también pro- fundamente agradecidos con las mecandgrafas que dedicaron gran parte de su tiempo en la preparaci6n del original: Judith Donnelley, MaryJackson, Catherine Kennedy y Shirley Morley. Finalmente, agradecemos a nuestras familias su asistencia y estimulo durante 1a realizacidn de esta obra lacion. Richard L. Scheaffer William Mendenhall Lyman Ott PROLOGO LA EDICION EN ESPANOL Hasta ahora el empleo del muestreo probabilistico ha requeridoespecialistas muy bien preparadosen la estadistica matemitica, con amplio dominio de los aspectos tedricos y con una gran intuicién derivada de la préctica y experiencia profesionales. Sin embar- go, la correcta utilizacién de las técnicas del muestreose ha hecho indispensable para los profesionales de las ciencias sociales, la administraci6n, las ciencias biolégicas y otras en donde cada d ir y profundizar los estu- dios, y dondeel muestreo juega un papel de gran importancia y utilidad por su caré~- ter de rapidez y economia. ste libro es un intento afortunado de proporcionar una conexién entre el andi sis de a informacion estadistica para la toma de decisiones y el problema practico de la obtencién de datos, al que necesariamentese enfrenta el estudiante y el investigador en las diversas areas del conocimiento. El lector quedard convencidode la importancia de la correcta apli diferentes técnicas del muestreo probabilistico para obtener los datos necesarios para cas correctas, es decir, con una validez cientifica s¢ Los autores presentan las tcnicas y los problemas del muestreo con ejemplos y aplicaciones en una gran variedad de disciplinas, lo cual estimula al estudiante y le —proporciona una idea clara sobre qué hacer en la yida real para llegar a soluciones Practicas, econ6micas y eficientes. El libro es entonces un valioso complemento de consulta para otros que tratan el muestreocon mayor profundidad y formalidad tebrica. La presentacién del contenido, con poca profundidad matemitica, es cla hace el mayor Enfasis en los aspectos prdcticos que se deben resolver en las encusstas por muestreo. El tratamiento de los temas es gradual; inicia con los conceptos elemen- les, contintia con la presentaci6nde los diferentes disefios generales del muestreg: el umenta la necesidad de diversitica 6m de las viii FROLOGO A TAEDICION ENESPANOL irrestricto aleatorio, el estratificado, el sistematico, el de conglomerados, y una buena exposicién acerca de los estimadoresde raz6n yde regresién. Otra virtud del libro es la de incluir algunas técnicas desarrolladasrecientemente, como la de respuestaaleatori- zada y la descripcisn de otros disefios relativamentecomplejos. Al final presenta un re~ sumen que resulta de gran utilidad, pues revisa tanto las técnicas como las estrategias para la seleccién del método adecuado a cada caso. La obra es motivante para el estudiante y para el investigador; invita a dejar a un lado elyauestreo no probabilistico al contar con la opcidn de los diferentes disefios probabilfsticos que producen resultados cuya precision puede ser medida estadfs- ticamente. Grupo Editorial Iberoamérica, al publicar este libro en espaiiol, contribuye a la difusion eficaz de] conocimiento del muestreo entre los clentifices sociales y admi- nistradores y, por Jo tanto, a 1a solucién eficiente de muchos problemas que se presen- tan en la vida diaria profesional. La publicacién ha sido posible gracias a la dedicacion y esfuerzo de los doctores Gilberto Rendén y Roberto Gémez, quienes han hecho un trabajo de traduccién de excepcional calidad. Fl dominio del lenguaje, para Ia ilo, a cargo de la maestra Ana Maria Varela, ha sido definitivo para la presentacién de las ideas de Ja manera mis clara y comprensible. Para mf ha sido un privilegioy una gran satisfaccién participar en la produccién de esta obra, correcci6n del Sergio Vargas Galindo Consultor Editorial CONTENIDO 21 22 2.8 24 2.5 2.6 3.1 3.2 3.3 34 35 3.6 3.7 38 Prélogo Al estudiante INTRODUCCION REVISION DE CONCEPTOS BASICOS Introduccion Resumen dela informaciénen poblaciones y muestras Distribuciones de muestreo correla Resumen Ejercicios ELEIMENTOS DEL PROBLEMA DE MUESTRED Introduceién ‘Términostécnicos Como seleccionar la muestra: el disefio de la encuesta pormuestreo Fuentes de error en las encuestas Métodos de recoleccién de datos Disefio de un cuestionario Planeaciénde una encuesta Resumen. Ejercicios conn a & 13 14 16 16 419 19 20 CONTENDO. 4 4d 42 43 44 45 46 47 5.1 of. 53 5A 55 56 5.7 58 5.9 5.10 5.11 64 6.2 63 64 65 6.6 MUESTREO IRRESTRICTO ALEATORIO Introduccion Como seleccionar una muestra irrestricta aleatoria Estimacién de una media y un total poblacionales, Selecci6n del tamafio de muestra para la estimacién de las medias ¥ totales poblacionales Estimacionde una proporcisn poblacional Muestreo con probabilidades proporcionales al tamaiio Resumen Ejercicios Experiencias con datos reales MUESTREO ALEATORIOESTRATIFICADO Introduccién Cémo seleccionar una muestra aleatoria estratificada Estimacién de una media y un total poblacionales Seleccién del tamafio de muestra para estimar las medias y totales poblacionales Asignacion de la muestra Estimacién de una proporeién poblacional Seleccién del tamaiio de muestra y asignacién de la muestra para asignar proporciones Comentarios adicionales sobre muestreo estratificado Una regla 6ptima para formar los estratos Estratificacién después de seleccionarla muestra Resumen Ejercicios Experiencias con datos reales ESTIMACIONDE RAZON, REGRESION Y DIFERENCIA Introduccién, Encues que requieren el uso de estimadores de razon Estimacion de razon usando muestreo irrestricto aleatorio Selecci6n del tamano de la muestra Cuando usar estimacién de raz6n Estimacién de raz6n en muestreo aleatorioestratificado 39 40 42 43 52 55 60 66 67 4 77 88a 85 88 96 98 108 107 109 i nz 118 123 124 125 127 135 143 144 6.7 6.8 6.9 71 72 7.3 74 75 7.6 17 8.1 8.2 8.3 8.4 8.5 8.6 8.7 8.8 8.9 91 9.2 CONTENIDO xl Estimacionde regresion Estimacion de diferencia Resumen Ejercicios Experienciascon datos reales MUESTREO SISTEMATICO Introduceién Cémo seleccionaruna muestra sistemitica Estimacién de una media y un total poblacionales Estimacién de una proporcién poblacional Scleccién del tamaiio de muestra Muestreosistematico replicado Resumen Ejercicios Experienciascon datos reales MUESTREO POR CONGLOMERADOS Introduce n Como seleccionar una muestra por conglomerados Estimacién de una media y un total poblacionales Selecci6n del tamafio de muestra para la estimacién de medias y totales poblacionales Estimacién de una proporeién poblacional Selecci6n del tamafo de muestra para la estim: de proporciones Muestreo por conglomeradoscombinado con estratificacién Muestreo por conglomerados con probabilidades proporcionales al tamafio Resumen Ejercicios Experienciascon datos reales MUESTREO FOR CONGLOMERADOS EN DOS ETAPAS Introduccion Cémoseleccionaruna muestra por conglomeradosen dos ctapas 147 150 153 155 163 167 168 im 172 178 180 182 186, 187 193 195 196 198 200 207 21 213 214 217 220 221 229 231 282 233 ENDO 9.3 Bstimacién insesgadade una media y un total poblacionales 234 94 naci6n de razén de una media poblacional 238 9.§ _ Estimaci6n de una proporcién poblacional 240 9.6 Selecci6n de tamafios de muestra 243, 9.7 Muestreo por conglomerados en dos etapas con probabilidades proporcionales al tamafio 245 9.8 Resumen 248 Ejercicios 249 ‘periencias con datos reales 253 40 EstimACION DEL TAMANO DELA POBLACION 255 10.1 Introduccién 256 10.2. Estimaciéndel tamafio de la poblacién usando muestreo directo 257 10.3 Estimaciéndel tamafio de la poblacién usando muestreo inverso 259 10.4 Seleccisn de tamafios de muestra para muestreo directo y Para muestreo inverso 260 10.5 Estimacién de la densidad y el tamafio de la poblacién usando muestreo por cuadros 264 10.6 Estimacién de la densidad y el tamafio de la poblacién usando cuadros cargados 267 10.7 Resumen 269 Ejercicios 270 Experiencias con datos reales 278 44 TEMAS COMPLEMENTARIOS 275 11.1 Introduccién 275 11.2 Submuestras interpenetrantes 275 11.3. Estimacién de medias y totales en subpoblaciones 278 11.4 Modelo de respuesta aleatorizada 282 11.5 — Seleccién del nimero de reentrevistas 284 11.6 Resumen 286 Ejercicios 287 Experiencias con datos reales 289 12 RESUMEN 294 12.1 Resumen de los disefios y métodos 291 12.2. Comparacién entre los disefios y métodos 298 Ejercicios 294 APENDICE Bibliografia Tablas Deduccién de algunos resultadosimportantes Respuestas seleccionadas INDICE CONTENDO xl 303 803 305 312 318 320 AL ESTUDIANTE Grupo Editorial Iberoamérica en su esfuerzo perma- nente por producir cada vez mejores textos, pone en tus ‘manos esta nueva obra en la que se ha puesto la més alta calidad en los aspectos teérico y diddctico, ast como en di- Seto y presentacién, con el objetivo de proporcionarte la mejor herramienta, no sélo para facilitarte el aprendizaje sino también para hacerlo més estimulante. Este, como cualquiera de nuestros libros, ha sido cui- dadosamente seleccionado para que encuentres en él un pi- lar de tu preparacion, y un complemento ideal a la ense- jianza del maestro. Lo diddctico de la presentacién de sus temas hace que lo consideres el mejor auxiliar, y el que Ie- vas a todas partes. Lo anterior es parte de nuestro propésito de ser parti. cipes en una mejor preparacion de profesionales, contribu- yendo asia la urgente necesidad de un mayor desarrollo de nuestros paises hispanohablantes. Sabemos que esta obra seré fundamental en tu biblio- teca, y tal vez la mds inmediata y permanente fuente de consulta. Como uno de nuestros intereses principales es hacer mejores libros en equipo con profesores y estudiantes, agra- deceremos tus comentarios y sugerencias 0 cualquier obser: vacion que coniribuya al enriquecimiento de nuestras pu- blicaciones. Grupo Biitorial Iberoamérica = + presente en tu formacién profesional xiv INTRODUCCION Los cursos introductorios enfatizan que ica moderna es una teorfa de la in formacién con la inferencia como su objetivo. El objetivo de nuestra curiosidad es un conjunto de mediciones, una poblacidn, que de hecho existe o que puede ser generada por experimentacisn repetida. El medio para Ia inferenciaes la muestra, Ia cual es un subconjunto de mediciones seleccionadas de la poblacién. Deseamos hacer una infe- rencia acerca de la poblacién sobre la base de las caracterfsticas de la muestra — 0, equivalentemente, la informacién contenida en la muestra— Por ejemplo, supéngase que una cadena de tiendas mantiene un registro de las cuentas de sus clientes. La cantidad que se adeuda a la compaiifa va a variar dia a dfa, conformese efectiien nuevos cargos y se paguen algunas cuentas. Ciertamente, el con- junto de cantidades que se deben a la compania en un determinado dia representan una poblacién de medicionesde considerableinterés para la gerencia. La caracterfsti- ca poblacional de interés es el total de todas las medicionesen la poblaci6n o, equiva- lentemente, la carga total de crédito diario, EI mantener actualizados los créditos totales diarios asociados con las cuentas, puede ser una tarea simple para una computadora electronica, Sin embargo, los datos, deben ser actualizados diariamente y esta actividad consume tiempo. Un método mas sencillo para determinar la carga total de crédito asociada con las cuentas es mues- trear aleatoriamente Ia poblacin de cuentas en un determinado dia, estimar el im- porte promedioadeudado por cada cuenta y multiplicar por el mimero de cuentas. En otras palabras, empleamos un estimador estadistico para hacer una inferencia acerca del total de la poblacién. La estadistica elemental nos dice que esta estimacin se puede hacer tan exacta como queramos simplemente al incrementar el tamatio de la muestra. La estimacién resultante puede ser acompagiada por un Ifmite para el error de estimacién (Mendenhall, 1983, Capftulo 8) 0 bien expresada como un intervalo de confianza, Entonces la informaciénen la muestra se utiliza para hacer una inferencia acerca de la poblacién. La informacién obtenida de las encuestas por muestreo afecta casi todos los as pectos de nuestra vida cotidiana. Tal informacién determina las politicasdel gobierno 4 enn 4) INTROQUCCION tespecto, por ejemplo, al control de la economia y la promocién de programas so- ciales. Las encuestas de opinién son Ia base de muchas de las noticias que divulgan los diversos medio noticiosos. El ntimero de personas que ven los programas de televisi6 determina cudles programas seran presentados en el futuro. Comtinmentese piensa que el Censo de E.U. de Norteaméricaestablece contacto con cada uno de los hogaresen el pafsRealmente, en el censo de 1980 solamente se hi- cieron 14 preguntas a todos los hogares. La informaciénsobre 42 preguntas adiciona- les fue obtenida tinicamente de una muestra de hogares. La informaci6n resultante la utiliza el gobierno federal para determinar la asignaci6n de fondos a los estados y ciudades. Esta informaciénla utilizael comercio parael prondsticode ventas, manejo de personal, y para determinar los domicilios de futuros establecimientos. La utilizan Jos planificadores urbanos y regionales para programar el uso de la tierra; agencias de transporte, y consumo de energia. Es usada por cientificos sociales para estudiar con- diciones econdmicas, balance racial y otros espectos de calidad de la vida. La Oficina de Estadisticasdel Trabajo de E.U.A. realiza rutinariamente mas de 20 encuestas, Algunas de las mas conocidas y mas ampliamente utilizadas son las encuestas que establecen los indices de precios al consumidor (IPC). El IPC es una me- dida del cambio del precio en el tiempo de una canasta de mercado fija de bienes y ser- vicios, Fs usado como una medida de inflacién y sirve como un indicador econémico para las politicas del gobierno, Las empresas tienen tasas de salarios y planes de pen- sién basados en el IPC. Los programas federales de salud y bienestar puiblicos, asi como muchos programas estatales y locales, ajustan sus bases de elegibilidad al IPC Las cldusulas de contratos en rentas e hipotecas estén basadas en el IPC. As, podemos ver que este indice, determinado sobre la base de una encuesta por muestreo, desem- pefia un papel importante en nuestra sociedad Muchas otras encuestas realizadas por la Oficina de Estadisticas del Trabajo (ET) son cruciales para la sociedad. La encuesta de poblacién continua mensual es- in basica sobre la fuerza de trabajo, empleo y desempleo. cuestas sobre gastos del consumidor recolectan datos sobre gastos de la familia en bienes y servicios usados en el consumo diario. La encuesta de establecimientosretine informacién sobre horas trabajadas y percepciones para establecimientosen negocios no agricolas. La encuesta sobre aspectos ocupacionales proporciona informacion sobre futuras oportunidades de empleo para una diversidad de ocupaciones, proyectadas aproximadamente para los siguientes diez afios. Otras actividades de la OFT se en. cuentran en el Manual de Métodos de la OET (1982). Las encuestas de opinion estan constantemente en las noticias, y los nombres de Gallup y Harris han legado a ser muy conocidos por todos. Estas encuestas por muestreo reflejan las actitudes y opiniones de ciudadanos en aspectos que van desde politica y religidn a deportes y entretenimiento, Las clasificaciones Nielsen determi- nan el éxito o fracaso de programas de TV Los comercios realizan encuestas por muestreo para sus operaciones internas, ademiés de utilizar las encuestas del gobierno para decisionesadministrativas cruciales. Los auditores estiman balances de cuentas y verifican el cumplimiento con reglas de operacién por medio del muestreo de cuentas. El control de calidad de procesos de manufacturarecae fuertemente en las técnicas de muestreo. Un que depende de actividades de muestreo detalladas es el anilisis de mercados. Las decisiones sobre qué productos co- merciar, dénde comerciarlos y cmo anunciarlos son frecuentemente hechas sobre la tablece informaci en: articular de actividad comercial A INTRODLCCION = 3 base de informacién de encuestas por muestreo. Los datos pueden venir de encuestas. efectuadas por la firma que manufactura el producto o pueden ser adquiridos de empresas que realizan encuestas especializadas sobre informacién de mercados. Las actividades de tres de tales empresas son esbozadas a continuacién. El indice de precios al menudeo de Nielsen es menos conocido que las clasifica- ciones de programas de televisién de Nielsen, pero es muy importante para las empre- sas que comercian con productos para la venta al menudeo. Este {ndice suministra informaci6n constante sobre ventas de alimentos, cosméticos, productos farmacéuti cos, bebidas y muchas otras clases de productos. Puede proporcionar estimaciones de ventas totales para una clase de productos, ventas para los clientes de una marca parti- cular, ventas para una marca competidora, informacién sobre precios al menudeo y mayoreo y el porcentaje de tiendas que venden un determinado producto. Los datos procedende auditorfas de inventarios y ventas en 1600 tiendas distribuidas en todo Es- tados Unidos cada 60 dias. Selling Areas—Marketing, Ine. (SAMD) retine informacién sobre el movimiento de productos de almacenes y vendedores al mayoreo. La informacion es obtenida en 36 grandes areas de mercado de televisin, que contienen el 74% de las ventas na- nales de alimento y comprende 425 categorias de productos. La Corporacién de Investigacin de Mereados de América proporciona muchos tipos de informacién de mereado a través del uso de encuestas, pero alguno de los re- sultados mds interesantes proviene de su Censo de Menti Nacional. Esta encuesta muestrea familias y estudia sus costumbres alimenticiaspor dos semanas. Tantas como cuatro mil familias pueden participar durante un afio. Se obtiene informaciénsobre el niimero de veces que un determinado alimento es servido, cémo es servido, eusntas personas lo comen y muchos otros detalles, incluyendo qué pasa con los sobrantes de comida, Tales detalles son importantes para el desarrollo y publicidad de los productos. Muchos ejemplos interesantes de los usos pricticos de la estadistica en general y del muestreo en particular, pueden consullarse en Statistics: A Guide to the Unknown (véase la Bibliografia en el Apéndice). En este libro usted puede encontrar algunos de los métodos y usos de las encuestas de opinidn discutidos en los articulos "Opinion Pollingin a Democracy" por George Gallup y "Election Night on Television” por R. F. Link. Quienes se interesen en ecologia silvestre deberian leer "The Plight of the Whales” por D. G. Chapman. Descubra cmo se mangjan en forma econémica las ventas de boletosentre las lineas de ferrocarriles y lineas aéreas, a través de muestreo, con Ia lectura de "How Accountants Save Money by Sampling", por John Neter. Ya que el objetivo de la estadistica moderna es 1a inferencia, usted puede pre- guntar qué aspecto particular de La estadistica se tratard en un curso sobre diseiio de encuestas por muestreo. La respuesta. esta pregunta cubre dos aspectos. Primero, nos abocaremosa la economfa de adquirir una cantidad especffica de informacién. Mas especificamente, ge6mo podemos disefiar procedimientos de muestreo que reduzean el costo de una cantidad fija de informacién? Aunque los cursos introductoriosen esta- distica reconocen Ia importancia de esta materia, destacan los conceptos bisicos y cOmo hacer inferenciasen situaciones especificas después de que los datos han sido re- colectados. La segunda caracteristica distintiva de nuestro tema es que estd dirigidoa los tipos particulares de situaciones de muestreo y problemas de inferencia que se en- cuentran mas frecuentemente en el comercio, las ciencias sociales y Ia administracin de recursos naturales (madera, vida silvestre y recreacin), mas que en las ciencias 4. INTRODUCCION Aun Ia terminologfa de los cientificos sociales difiere de la de los cientificos fisicos. Los cientificos sociales realizan encuestas para recolectar una muestra, mientras que los cientificas fisicos llevan a cabo experimentos. Entonces reconocemos que existen diferenciasde un campo a otro de la ciencia en la naturaleza de las pobla- ciones y la manera en que una muestra puede ser extraida. Por ejemplo, poblaciones de votantes, cuentas financieras, o animales de una especie particular pueden conte- ner tinicamente un pequefio numero de elementos. En contraste, las poblacionescon- ceptuales de respuestas generadas por la medicién del producto de un proceso quimico son ciertamente muy grandes. (Usted puede recordar que las propiedades de los esti madoresy pruebas esadisticastratadas en 1a mayoria de los cursos introductoriossupo- nen que la poblaci6n de interés es grande con respecto a la muestra.) Las limitaciones establecidasen el procedimientode muestreo también varfan de un rea de la ciencia a otra. El muestreoen las ciencias bioldgicas y fisicas puede ser frecuentementeejecu- tado bajo condiciones experimentalescontroladas. Tal control es frecuentemente im- posible en las ciencias sociales, comercio y manejo de recursos naturales. Por ejemplo, un investigador en medicina puede comparar el crecimiento de ratas sometidas a dos firmacos diferentes. Para este experimento los pesos iniciales de las ratas y la ingesta diaria de alimento pueden ser controlados para reducir una variaci6n indeseable en el experimento. En contraste, muy pocas variables pueden ser controladas al comparar el efecto de dos diferentes anuncios de televisién sobre ventas para un determinado producto. No es posibles ningtin control al estudiar el efecto de las condiciones am. bientales sobre el numero de focas en el Océano Pacifico Norte. En resumen, este texto trata de las peculiaridades de muestreo e inferenciaco- mtinmente encontrados en el comercio, las ciencias sociales y la administracién de re- cursos naturales, Espeefficamente, consideraremos métodos para la seleccién de la muestra de una poblacién existente y maneras de evitar las diversas dificultades que surjan. Los métodos para disefar encuestas que toman en cuenta las earacteristicasde 1a poblaci6n se presentariin junto con los estimadores asociados para reducir el costo de una estimaci6n con exactitud especificada. El Capitulo 2 revisa algunos de los conceptos basicos tratados en la estadistica elemental, incluyendo el papel fundamental que desempefia la probabilidad al hacer inferencias. EL Capitulo 8 presenta algo de la tenninologia basica del muestreo, ast como una discusién de problemas que aparecen en el diseito de encuestas por muestreo. FI muestreo irrestricto aleatorio, que ya conoce el estudiante novel, es pre- sentado cuidadosamente en el Capitulo 4; el cual incluye procedimientos fisicos para la selecci6n real de la muestra. Los siguientes capitulos abarean métodos econémicos para seleccionar una muestra y métodos asociados para la estimacién de parametros poblacionales. Al leer este texto, tenga presente que el objetivo primordial de cada capitulo es 1a inferencia. Identifique el procedimiento de muestreo asociado con cada capitulo, los parametros poblacionales de interés, sus estimadores y los limites asociados a los errores de estimacién. Desarrolle una comprensién intuitiva y una apreciacidn de los beneficios que se derivan de los procedimientos de muestreoespecializados. Ponga atenciénen los conceptos generales. y no se desconcierte por las formulas de los esti- madores y varianzas que algunas veces son inevitablemente complicadas. En conereto, ponga atenciGn en el bosque mas que en los drboles. Resuelva algunos ejercicios y los detalles tomardn su lugar respectivo. 2 REVISION DE CONCEPTOS BASICOS 2.4 INTRODUCCION El conocimiento de los conceptos basicos de estadistica es un requisito para el estudio de los disefios de encuestas por muestreo. Es por eso que en este capitulo revisaremos algunos de estos conceptos basicos. EI objetivo fundamental de la estadistica es hacer inferencias acerea de una poblacién con base en Ia informacién contenida en una muestra, El objetivo de nuestra inferencia, la poblaci6n, es un conjunto de mediciones, finito o infinite, real 0 conceptual. Es por eso que el primer paso en estadfstica es encontrar una manera de expresar una inferencia acerca de una poblacién 0, equivalentemente, describir un Conjunto de mediciones. Entonces, distribucionesde frecuencia y medidasdescriptivas numéricas son el primer tema de nuestra revisién, El segundo paso en estadistica es considerar la forma en que se puede hacer la in- ferencia acerca de la poblacién con base en la informacién contenida en la muestra. Para este paso debemos considerar distribuciones de probabilidad de cantidades muestrales 0 distribuciones derivadas del muestreo. El conocimientode distribucion de probabilidad asociada con la muestra nos permite seleccionar los procedimientos adecuados para hacer la inferencia y asignar medidas de bondad a tales inferencias. EI método de inferencia empleado principalmente en el comercio y las ciencias sociales es la estimacin. Fs posible estimar el total de actives de una corporacién, la fracciGnde votantesque estéa favor del candidat Garefa, 0 el némero de excursioni . tas que utilizaron un parque del gobierno durante cierto periodo. Es por eso que debe- mos entender los conceptos basicos que fundamentan la selecci6n de un estimador de un pardmetro poblacional, el métodode evaluar su bondad y los conceptos relacion dos con la estimacién por intervalo, Debido a que el sesgo y Ia varianza de los estima- dores determinan su bondad, necesitamos revisar los conceptos basi¢os relacionados con la esperanza de una variable aleatoria y las nociones de varianza y covarianza 5 a 2. REVISICN DE CONCEPTOS BASICOS Las secciones subsecuentes siguen el plan general que se acaba de presentar. Em- pezamos con una revisién del problema primario, es decir, como deseribir un conjunto de mediciones. Enseguida se da una tevisién répida del modelo probabilhtico para la repeticién de un experimento. Explicamos cémo puede ser usado el modelo para infe- rir las caracteristicas de una poblacién y discutimos variables aleatorias,distribuciones. de probabilidad y esperanzas. Finalmente, presentamos los conceptos biisicos aso- ciados con estimacién puntual y estimacién por intervalo. 2.2 RESUMEN DE LA INFORMACION EN POBLACIONES Y IMUESTRAS Debido a que es diffeil percatarse de las caracteristicas esencialesde un conjunto gran- de de mediciones al observar un listado de mimeros, usualmente debemos resumir las medicionesa través del uso de graficaso técnicas numéricas. Aun cuando noes posible contar con todas las mediciones para una poblacién en estudio, podemos ser capaces de suponer alguna forma razonable para realizar la grifica de la distribucién de fre- cuencias relativas de esta poblacién. Por supuesto, podemos siempre construir un his- tograma de frecuenciaso de frecuencias relativas para una muestra, ya que las medi ciones de la muestra son conocidas, y usar éste para hacer una estimacinempfrica dé Ia forma de Ia poblacién. Una vez que se ha establecido una distribucin de frecuencia relativa para poblacién, podemos, mediante argumentos probabilisticos, calcular medidas numéri- cas que nos resuman la informaci6n, tales como la media, varianza y desviacién estan- dar. Cantidades similares pueden ser calculadas directamente de las medicionesen la muestra. Con fines de ilustracién, supongamos que una poblacién consiste en una gran cantidad de ntimeros enteros, 0, 1, 2, » +. . 9, em proporciones iguales. Podemos pensar que esos niimeros han sido escritos en pequefias hojas de papel y mezclados en caja, que han sido escritosen una tabla (como una tabla de niimeros aleatorios)o que han sido generadosen un archivo de computadora. Ya que todos los digitos ocurrenen wo! Frecuencia relative tobe bt ba o 1 2 3 4 5 6 7 8 9 Fiura 2.4 Distrbucién de una poblacién que contiene bs niimeros 0 a 9 con ja misma. frecuencia 2.2. FEBLMEN EE LA INFORMACION EN POBLAGIONES Y MESIRAG 7 igual proporcisn, el histograma de frecuencia relativa, el cual muestrala distribucién de las mediciones de la poblacién, es como se muestra en Ia Figura 2.1. Estas frecuencias relativas pueden ser interpretadas en términos probabilisticos. Sise selecciona un mimeroal azar (por ejemplosi alguien extrae una pieza de papel de Ia caja, sin ejercer ninguna preferencia),entonces la probabilidad de que el mimero extrafdo sea un 4 es 7b, Suponga que un numero se va a seleccionar al azar de una poblacién en estudio, y denote su valor por y. Entonces los posibles valores paray (0, 1, 2, «9, em este caso) y las probabilidades asociadas con tales valores (75 para cada uno en este caso) constituyenla distribucién de probabilidad para la variable aleatoria y. La probabilidad asociadacon y es denotada algunas veces por p(y), Entonces, para esta poblacién () = p(l) = + + + = p(8) = 29) = 35 Las medidas numéricas usadas para resumirlas caracteristicas de una poblaci6n son definidas como valores esperados de y 0 una funcién de y. Por definicidn, el valor esperado dey, E(y),esté dado por Ey) =L yp) a donde la sumatoria incluye todos los valores de y para los cuales p(y) > 0. Para la poblacién y variable aleatoria y en estudio, EW) =E wy) 7 = 0p(0) + 1p(1) + 2p(2) +++ + + 8p(8) + 9p(9) (45) = 4.5 Se puede ver que E(y)es igual ai valor promedio, 0 valor medio, de todas las me- diciones de nuestra poblaci6n conceptual. En general, una media poblacional sera de- notada por 2, por lo que w= Ey) donde y es el valor de una medicién individual seleccionada de la poblacién al azar. La variabilidad de las medicionesen una poblacion puede ser medida por la va- ‘rianza, 1a cual se define como el valor esperado, o valor promedio, del cuadrado de la desviacién entre una medici6n y seleccionada aleatoriamentey su valor medio P. En- tonces la varianza de y, V(y), est dada por Vane EQ - HP =E— H)°P0) Para la poblacién usada como ejemplo en esta secci Viy) = Ey — HP = Ly - yp) 7 = (0 ~ 4.5)°G5) #(1 = 4.5/5) +++ +9 — 4.5770) THl(0 — 4.5)? + (1 - 4.5)? + °° +9 - 4.5)9] 10(82.5) = 8.25 La varianza V(y) es comtinmente denotada por o? 2 REVISION DE OONDEPTOS BASIOOS La desviacién estdndar se define como la raiz cuadrada de la v: ta por g = ¥@?, Para la poblacién especifica en estudio, o = B25 =2.9 za y se deno- En estudiosestadisticos la poblacién de interés consiste en medicionesdesconoci- das; es por es que tinicamente podemos especular acerca de a naturaleza del histograma de frecuencia relativa o del tamaiio de yt y cr-Para obtener alguna infor- macién acerca de la poblacisn, seleccionamos una muestra de mediciones y estu- diamos las propiedades de esta muestra. A partir de lo que observamos en In muestra inferimos las caracteristicas de la poblacién, Las medicionesen la muestra sern deno- tadas en general por Yo Jo «++ Yo Siguiendo el patrdn establecido para resumir la informacién en una poblacién, podemos calcular la media, Ia varianza y la desviaciGn esténdarde una muestra. Estas medidas descriptivas numéricas estén dadas, respectivamente, por y Nétese que $* tiene divisor m - 1 en lugar den. Para la poblacién de enterosQ, 1, . « ., 9 en igual proporci6n, se seleccioné una muestra de 1 = 10 mediciones. Cada una de las 10 mediciones fue seleccionada al azar con reemplazo. (Piense en la seleccién de 10 papeletas de una caja conteniendo una gran cantidad de ellas, cada una marcada con un entero entre 0 y 9.) Las medi- ciones muestrales fueron 6,9, 3,8, 1,7, 8, 8, 4,0 Para esta muestra = TO F94+34+++ +440) 454) =5.4 1 Li n—t =4(6 - 5.4)? +9 - 5.4 +++ +(0-5.4)7] = 492.4) = 10.27 y s=V3 =J10.17 =3.2 La utilizaci6n de estas cantidades mues tard en las siguientes dos sec- ciones, pero podemos ver que F podrfa ser una naciGn razonable para 2 si po 2.3 DSTRBLOCNES CE MEST fuera desconocida. De la misma manera, s* podria ser una aproximacién razonable para g? sig? fuera desconocida, ys podria ser una aproximaci6n razonable para a. 2.3 DISTRIBUCIONESDE MUESTREO En los siguientes capltulos, cantidades muestrales —tales como 7— serdn utilizadas extensivamente para realizar inferencias acerca de cantidades poblacionales descono- cidas; por ello debemos estudiar las propiedades de ciertas funciones de las observa- ciones muestrales, Este estudio empieza con una ilustracién numérica, la cual va a ser generalizada para incluir una amplia variedad de situaciones de muestreo. Considérese 1a poblacién discutida en la Seccién 2.2, en la cual los enteros Q, 4, .. «, 9estuvieron representadosen la misma proporci6n. Se seleccionan cincuenta muestras de tamafio n = 10 de esta poblacion; cada muestra es seleccionada de una manera similar al método utilizado al final de la Seccién 2.2. Las medias muestrales 7 para estas 50 muestras se presentan en orden numérico ascendente en la Tabla 2.1, TABLA 2.4 Medias muestrales de 50 muestras, cada una de tamanon = 10 230 36 41 43 48 260 37 41 430 48 260 3700 44 4 4B 32037 0 4t 45 0 49 330 38 4204.7 5.0 340390 434 SA 35 40 4300 4.70 53 35 44 430 48 55 36 41 43° 48 60 360 41 430 48 66 Un histograma de frecuencias para las 50 medias muestrales es presentadoen la Figura 2.2. Esta distribuci6n es una aproximaci6n a la distribucion de muestreo tedri: cade, ya que nos muestra la manera en que las f ienden a distribuirse cuandose to- man muestras repetidas. La distribucién de muestreo puede ser considerada como una distribucién de probabilidad para 7. Notese que la distribuciGn de las ¥ tiende a con- centrarse cerca de la media poblacional t= 4.5, con mucha menor dispersion (0 variabilidad) que las mediciones originales de la poblacién, y tiene una forma monti- cular, en lugar de una forma plana como la de la distribuciGn poblacional. Desde el punto de vista de un curso elemental de estadistica (véase Mendenhall, 1988), sabemos que la distribucién de muestreo de # debe tener una media 42, una desviaci6n estandar o/ Vn, y una forma como la de una curva normal (una curva si- métrica en forma de campana). Esta distribucién de 50 medias muestrales tiene un promedio de 4.22 (el cual estd cercanoa yz = 4.5) y una desviacién esténdar de 0.79 (a cual est cercanaa o/¥n = 2.9/V10 = 0.92). El histograma de frecuencia tiene también una forma aproximada de campana, aunque no es muy simétrica. Estos 40 2 REVISION DE CONCEPTOS BASICOS 0 25] 20) Frecuencia 13] 10| 1. Po 10 FiGuRA 2.2. Distribucién de 50 medias muestrales conn = 50 para cada muestra hechos concernientes al comportamiento de las medias muestrales sern importantes en el desarrollo de los procedimientos de inferencia. De propiedadles conocidas de la curva normal se deduce que aproximadamente 68% de los valores de 7, en muestreo repetido, debe caer dentro de una desviaci6n es- t4ndar de la media de la distribucién de muestreo de las 7. Aproximadamente, 95% de los valores de J, en muestreo repetido, debe caer dentro de dos desviaciones estan- dar de la media, Para verificar estas aseveracionesen la muestra observacla de 507, ve- mos que 411 £079 osea (3.43,5.01) contiene 39 de 50 (78%) de los valores de 7 en la muestra, y 4.22 £20.79) osea (2.64, 5.80) contiene 45 de 56 (90%)de las 7. Estos porcentajesestdn razonablemente cerca de los valores tebricos de 68% y 959%. (Recuérdese que estamos considerando Gnicamente una aproximacién, basada en 50 muestras, con respecto a la verdadera distribucién de muestreo de Y.) Si la distribuciGn de muestreo de alguna cantidad muestral no sigue una distr. buciGn normal, al menos aproximadamente, entonces la interpretaciénde la frecuencia relativa puede atin ser abtenida considerandoe! teorema de Tchehysheff. Este teore- ma establece que para cualquier k = 1 al menos (1 ~ 1/k) de las mediciones en cualquier conjunto deben exer dentro de k desvinciones esténdar de su media, Por ejemplo, haciendo k =2 se obtiene que al menos (I~ }°)=(1 ~ 3)=3 de cualquier conjunto de mediciones debe caer dentro de 2 desviaciones estindar de su media. Usualmente. esta fraccion es mucho mas grande que f. 2.3 DISIRIBUCIONES DE MUESTREO 44 Hallo procentaje de mediciones que cae dentro de dos desviacionesesténdar de la media, considerandola distribuci6n normal o el teorema de Tchebysheff, sugiere que'la amplitud de cualquier conjunto de mediciones contiene poco més que cuatro desviaciones esténdar, usualmente, En otras palabras, Ia desviacion esténdar de un conjunto de mediciones puede ser aproximada como 1/4 de la amplitud de ese conjun- to de mediciones. La discusién de las distribuciones de muestreo hi este punto se ha basado en que las muestras fueron seleccionadas de una poblaciGn esencialmente infinita. Pero nosotros podemos desear trabajar con poblaciones de N mediciones, donde N puede ser relativamente pequefia. ¢Se mantiene atin bajo estas circunstancias la normalidad aproximada de la distribuciénde 7? A continuacién presentaroslos resultados de dos investigaciones empiricas sobre esta cuestién. Una poblaci6n de N = 100 mediciones fue generada por computadora y presen- t6 una distribucion como la que se muestraen la Figura 2.3. Se seleccioné una muestra Fe + > o 0 © 3 4 50 «© 70 80 % 100 Fiqura 2.3 _Distribucionde una pobiccién con N = 100 den = 20 mediciones de esta poblaci6n, de tal manera que cada muestra posible de tamaiio 20 tuviera una misma probabilidad de ser seleccionada (véase Capitulo 4). Este proceso se repiti6 hasta que fueron seleccionadas 50 de tales muestras. Se calcul6 la media 7 para cada muestra; la distribucién de estas medias muestrales se indica en la igura 2.4, Notese la tendencia de este histograma a la forma de campana, aunque no perfectamente simétrica. Una poblacin de N = 20 mediciones fue generada posteriormente, presentan- do la distribucién que se indica en la Figura 2.5. Se seleccionaron 50 muestras de tamafio n = 15 cada una, siguiendo la metodologia esbozada anteriormente. La distribucién de las 50 medias muestrales se presenta en la Figura 2.6. Notese nueva- mente una tendencia hacia una distribucién en forma de campana un tanto simétrica. Sin embargo, esta distribuciGn difiere considerablemente de 1a presentadaen la Figu- las medias muestralesestin agrupadas muy cerca alrededor de la media al, como debia esperarse, ya que el tamaiio de muestra de 15 es muy similar al tamafio de la poblacién de 20. Se podria sugerir que la distribuciénen la Figura 2.6 2 REVISION DE CONCEPTOS BASICOS 18 to Frecuencia o 0 2 30 4 50 6 70 4) 90 100 7 FiGURA 2.4 Distiibucién de medias muestales para N = 100yn = 20 o 3 10 15 20 FiGURA 2.5 _Distrisucién de una poblacién con N = 20 15 \: 5 78 oT Wz 15 20 7 FIGURA 2.6 Distribucion de medias muestrales para N = 20 yn = 15 2.4 COVARIANZAY CORRELACION 13, no se asemeja tanto a la distribucién normal como en la distribuci6n de la Figura 2.4, En resumen, la distribuci6n de F debe tener una distribucién muy semejante a la distribucién normal, sim no es mayor que 20% de N. Esta observaciGn es especialmen- te cierta si m = 30, Cuando es un porcentaje muy alto de N, 1a distribuci6n de muestreo dej est agrupada alrededor de Ia media poblacional atin mas de lo que se podria esperar. 2.4 COVARIANZA Y CORRELACION Frecuentemente, en un experimento se obtiene informacién acerca de mas de una va- riable aleatoria de interés. Por ejemplo, el psiedlogo mide més de una caracteristica por individuo en un estudio sobre el comportamiento humano. Variables tipicas puedenser una medida de inteligencia, ,, una medida de personalidad. y otras va- riables que representan el valor obtenido en ciertas pruebas o medidas de earactertsti- cas fisicas, Generalmente estamos interesadosen la simple dependencia de un par de variables, tal como la relacion que existe entre personalidad e inteligencia, o entre el aprendizaje y las calificaciones en la escuela, En particular, nos interesa saber silos da- tos que representan observaciones pareadas de y, yy, en un cierto ntimero de gente implican una dependencia entre las dos variables. Si es asi, ¢qué tan intensa es la de pendencia? Intuitivamente, concebimos la dependencia de dos variables, y, yy, indicando que una de ellas, digamos y,, se incrementa o disminuye como una consecuenciade un cambio en y,. Vamos a confiar nuestra atencién a dos medidas de dependencia,1a co- varianza y el coeficiente simple de correlacién lineal, y vamos a utilizar las Figuras 2.7(a) y 2.7(b) para justificar la eleccién de ellas como medidas de dependencia. Estas figuras nos representan puntos graficados para dos muestras (aleatorias) de nm = 10 unidades experimentales seleccionadas de una poblacion. Las mediciones de y, y y, fueron hechasen cada unidad experimental. Si todos los puntos caen sobre una linea indica en la Figura 2.7(a),y, y yz son obviamente dependientes. En contraste, la Figura 2.7(b) nos indica poca o nula dependencia entre J, y yp. Supdngase que conocemos p1 ¥ 1a, las medias de y, y y, respectivamente, y lo- calizamoseste punto en las gréficas de la Figura 2.7. Ahora se localiza un punto en la t t recta, como s nh (eta) o® n 5 . wpe . . . . ~ ue n n @ ) FiGURA 2.7 Puntos graficados para dos muestras

También podría gustarte