Está en la página 1de 17
CAPITULO, VEINTICINCO MUESTREO DE POBLACIONES FINITAS 25.1 Introduccion El muestreo éstudiado hasta ahora se ha referido a experimentos en los cuales lis unidades experimentales no se obtuvieron gencralmente por procedimientos aleatorios. La aleatori- zucion se us6 para asignar tratamientos a unidades y las poblaciones eran hipotéticas en tanto que las unidades diferian por errores aleatorios. Ahora dirigimos nuestra atencién a poblaciones que ya no son te6ricas sino a poblaciones cuyas unidades experimentales pue- den enumerarse y, en consecuencia, se pueden muestrear aleatoriamente. Por ejemplo, los silos se muestrean para determinar los residuos de insecticidas, las suclos para andlisis qui- micos, las poblaciones de plantas, con propdsitos taxanomicos, las frutas, para determinar calidad, los campos de trigo, para estimaciones de rendimientos y calidad antes de la cose- cha, las razas primitives, para analizar muchas caracteristicas, las personas, para conocer sus opiniones, y asi sucesivamente. En todos estos ejemplos, las poblaciones que interesan son infinitas. ‘Un problema nuevo se presenta en el muestreo de pablaciones finitas. Por ejemplo, si deseamos obtener informacién de muestra de distribuidores de semillas al por mayor en un estado, estaremos muestreando una poblacidn finita. Sila muestra es grande, como ddigamos 25 por ciento de los distribuidores de semillas al por mayor, hay que saber si las ‘téenicas existentes se pueden aplicar o si serd necesario desarrollar otras nuevas. Al muestrear pob laciones finitas hay tres maneras bien distintas de hacer la seleceién. Estas son 1. Muestreo aleatorio 2. Muestreo sistematico. 3. Muestreo autoritario £I muestreo aleatorio seti nuestra mayor preocupaci6n. La aleatorizacién puede introducirse en el procedimiento de muestreo de varias maneras que nos dan diversos dise- sat 542 BIOESTADISTICA: PRINCIPIOS ¥ PROCEDIMIENTOS fios de muestras. Gracias a la aleatorizacién pueden obtenerse estimaciones validas del error. Se puede aplicar la teoria de la probabilidad y se pueden sacar conclusiones validas. El muestreo sistemdtico se usa cuando cada k¢simo individuo de la poblacién se incluye en le muestra, Tal procedimiento es siempre muy facil, pero evidentemente insa- tisfactorio si en la poblacién se presentan tendencias o ciclos no reconocidos ain. Dado que las poblaciones se deben enumerar antes del muestreo, pueden introducirse en forma inconsciente ciertas relaciones entre una o mis de las caracteristicas investigadas y orden de enumeracion, En general, no es seguro suponer que no existe tal relacion, El muestreo sistemitico puede efectuarse en forma tal, que puede obtencrse una estimacion no sesgada del error de muestreo. Esto requiere de mas de una muestra siste- matica, Para und sola muestra sistematica, las formulas de que se dispone para estimar la vaianza de una media suponen el conocimicnto de La forma de la poblacién. FI muestreo autoritario exige que una persona, bien familiarizada con el material que va a muestrearse, extraiga la muestra sin tener en cucnta la aleatorizaciGn, Tal proce- dimiento depende completamente del conocimiento y pericia de la persona que hace el muestreo, Puede producir buenos resultados en algunos casos, pero rara ver se recomienda, 25.2 Onganizacién del estudio Un considerable esfuerzo debe dedicars a la planeacién y cjecucion de un estudio mues- tral, ademas de al muestreo efectivo. Vamos a hacer arbitrariamente una lista de cinco eta- pas para efectuar un muestreo. Aclaracién de objetivos DefiniciOn de la unidad de muestreo y de la poblacién Seleccién de la muestra Realizacion del estudio Analisis de los datos caePe ‘Se exponen estas etapas en forma breve. 1, Aclaracién de los objétivos Esto consiste, ante todo, en establecer objetivos tan conci- samente como sea posible, en que cada objetivo se enuncia como una hipétesis que va a probarse, un intervalo de confianza que ha de calcularse, o una decisién que debe tomarse. Con este objetive primario en mente, consideremos qué datos deben recolectarse. Cuando se tienen varios objetivos en mente, tal vez haya que modificar nuestras ideas res pecto a qué datos deben recolectarse con el propésito de lograr todos los objetivos. Hasta podemos modificar nuestros objetivos de modo que el estudio no se vuelva demasiado complejo y costosa. Usualmente, el grupo de estudio contard con un presupuesta fijo y deseard maximi- zat la cantidad de informacién por cada peso gastado. O bien, los objetivos incluirdn una declaracién sobre la cantidad de informacion deseada, generalmente en la formia del tama fio de un intervalo de confianza y tendremos que minimizar el costo, 2. Definicién de la unidad de muestreo y de la poblacién Hasta cierto punto esto se ha hecho en la etapa 1. Para el muestreo, la poblacién debe dividirse en unidades de mues MUESTREO DE POBLACIONES FINITAS $43 freo que, en conjunto, constituyen Ia poblacién. Pueden existir varias posibilidades de escoger las unidades de mucstreo. La eleccién final puede ser un tanto arbitraria, pero dehe ser utilizable. Si estamos muestreando personas, podemos escoger el individuo, la familia, o Jos ocupantes de alguna viviends especifica como unidad de muestreo, Cual- quiera que sea la seleccién hay que localizar e identificar la unidad sobre el terreno. Para el muestreo aleatorio, debemos poder emumerar todas las unidades de muestreo, y tener una lista de todas las unidades, Puede ser necesario revisar las unidades existentes, por ejemplo, listas de aifios escolares, granjeros. etc...0 bien hacer nuevas listas, lo que pa- reaca mids factible y econémico. Se pueden juxtaponer cuadriculas sobre los mapas del terreno, 0 bosques u otras zonas de las cuales se necesite obtener muestras de cultivos o informacién respecto a la cobertura de la vido silvestre. Aqui, puede'ser necesario tener inventiva y hasta arbitrariedad, especialmente si tenemos que hacer ef muestrea en un area de forma irregular. Mientras se decide sobre la unidad de muestreo, es necesario considerar qué va a medirse y qué métodos de medida detien usarse. (Estamos midiendo estatura, peso u opi- nin? Si asi es, ;como Io vamos a hacer” {Puede usarse un cuestionario para medir cstrés emocional? Si asi es, {pueden emplearse como entrevistadores estudiantes universitarios que buscan un trabajo de tiempo pureial? {Se les puede adiestrar en unos dias? {Puede ser de igual utilidad tun eandidato a ingeniero que un estudiante de premedicina’ 4. Seleccién de la muestra Las formas en que pueden extraerse una muestra se llaman dé: sefios muestrates, De ellos se hablara en secciones posteriores de este capitulo, La scleccién del tamafio de la muestra se relaciona, en parte, con los recursos dis. ponibles; si son inadecuados para obtener una muestra lo suficientemente grande para lograr los objetivos propuestos, deben revisarse los objetivos o retardar el estudio hasta cuando se tengan los fondos suficientes. Eldiseno y el tamano de la muestra darin una buena idea respecto a Is extension y naturaleza de las tablas y calculos necesarios. 4, Realizacién del estudio Probablemente, seri necesario adiestrar a parte del personal con el objeto de lograr uniformidad en {a localizaci6n o identificacion de las unidades de muestreo y en el registro de las respuestas a cuestionarios u otros datos. Sera necesario un cronograma de actividades. Generalmente, se requiere de un esquema pars una verifica- eién temprana de la validez de los datos registrados en los diversas formatos. Debe prever- se qué hacer en caso de que haya que tomar decisiones rapidss frente a hechos inesperados, 5. Andlisis de Jos datos Primero, sera necesatio corregir los datos en cuanto a errores de registro ¢ invalidez. Finalmente, el estudio muestral se deberd revisar en cuanto a maneras posibles de mejorar estudjos futuros. 25.3 Muestreo probabilistico. Supéngase que nuestra poblacién se ha definido claramente y que se ha hecho un listado de las unidades de muestreo. Ahora también podemos hacer una lista de todas las posibles muestras. Usamos el término muestreo probabilistico cuando 544 BIOESTADISTICA: PRINCIPIOS Y PROCEDIMIFNTOS 1, Cada unidad de muestreo tiene, o se le ha: asignado, una probabilidad conocida de estat en la muestra. 2. Hay seleccin aleatoria en alguna etapa del procedimiento de muestreo y esta direc- tamente relacionado con probabilidades conocidas. La seleccion aleatoria supone un procedimiento. mecanico para seleccionar las unidades que deben incluirse cn la muestra. 3, El método de calculo de una estimacién de una media se establece claramente y¥ lle. vari aun solo valor de Ia entimacién, Esto es parte del anilisis de los datas. Al esti- mar una media, usamos las probabilidades de seleccién asignadas a las unidades mestrales, Estas suministrarin ponderaciones, cada una de las cuales seri cierto miltiplo constante del inverso de Ie probabilidad Cuando se cumplen estos criterios, puede asignarse una probabilidad de seleccién a cada muestra y a cada estimacién, Por tanto, podemos construir una distribucién de pro- babilidades de las estimaciones dadas por nuestro plan de muestreo; De esta manera, po- demos evaluar el valor de nuestro plan y compararlo con otros planes de muestreo proba- bilfstico. La evaluacién consiste en mediz ta exactitud de toda estimacién por la magnitud de su desviacion estindtar. Cuando fas probabilidades asignadas » cada unidad de musstreo son iguales, enton- ces los pesos que han de usarse en el cilculo de las estimaciones de las medias son todas iguales. Realmeme no necesitamos pensar concretamente en las ponderaciones, ya. que la muestra es auteponderada. Aunque tales muestras son faciles de analizar, carecen de cier- tas ventajas que poseen otros planes de muestreo probabilistico, ventajas tales como faci- lidad y bajo costo de administracion por unidad de informacién'y ls capacidad de obtener estimaciones para estratos individuales (ver sec, 25,5), ‘Una muestra probabilistica no garantiza que todas questras estimaciones sean no sesgadas, Ya hemos visto que en el muestreo aleatorio a partir ¢e una poblacién normal, ‘optamos por utilizar 5 = SV (Y —¥F/(n— 1) si bien es una estimacion sesgada de a. También se vsan estimaciones: sesgadas en estudios muestrales. Deben usarse, natural- ‘mente, con precaucién, ya que pueden introducir distorsiones en las unidades prababilis- ticas. En particular, cuando se promedian estimaciones sesgadas (no necesariamente arit- méticamente), el efecto sobre el promedio y su uso posterior puede no ser clara, Ahora se exponen Varios tipos de muestrea probabilistico, 25.4 Muestreo aleatorio simple Para el muestreo aleatorio, se have un listado de la poblacién y se fija el plan y tamafio de la muestra, Para el muesireo alearorio stmple, cada muestra posible tiene la misma proba- billdad de ser seleccionads. Este es el criterio importante. En el proceso efectivo de seleccién de las unidades muestrales en una poblacion fi: nita, se usa una tabla de nimeros aleatorios y el muestreo se hace sin reemplazo. Aparte de esto, fas unidades de muestreo se extraen independientemente. Notaciin y definiciones Como ahora estamos tratarido principalmente con poblaciones finitas, se requieren nueva notacion y definiciones. La notacién y las definiciones, como MUFSTREO DE POBLACIONES FINITAS 345 se verd, no son del todo coherentes en la literatura del muestreo, Trataremos de usar letras maytisculas para cantidades de poblacién y letras mindsculas para cantidades muestrales; también se usa a? Para comenzar, sea ¥; la observacion i¢sima ea la poblacién, También usimos ¥, para describir la iésima observacin muestral cuando no hay confusi6n posible. Tamafo de la poblacién:.V Tamafio de Ia muestra:n Media de la poblacién variable continua Pe proporcién Para una proporcién ¥, = 0.6 1; ¥ Y/N esta proporeién de individuos que poseen una caracteristica especifica, asi que puede servir también como unadefinicién de la media de Ja poblacién. Es comin remplazar J, ¥, por A, Para un poroentaje la media apropiada es 100P. ‘Media muestral: yu =t_ 4, variable continua nt . a , Pap=". — proporcion. Para una proporcién, @ templaza J, ¥,. Coma los totales de poblacién y sus estimacio- fies son-a menudo de interés, son bien corrientes las cantidades ¥, A, Y,,a, Varianza de la poblacién: y(y- FF (25.1) Usamos Ia ec. (25.1) para definir la varianza de la poblacion, ya que nuestra definicién de s?,ec. (25.4), da una estimacion no sesgada de S*. Varianza de la poblacién de una media = a (25.2) 546 BIOESTADISTICA: PRINCIPIOS ¥ PROCEDIMIFNTOS PO/N—n donde Q=1-P Varianza muestral: dex, -5¥ . una estimacion insesgada de 5? (254) nad El numerador se calcula como ¥ ¥? — (¥. ¥ Varianza muestral de una media aly) (ss) pq N—n a—1 WN donde q = (25.6) La ecuacion (25.6) da una estimacion insesgada de $2, pero generalmente no se usa cuan- do se caleulan intervalos de confianza. La forma mds familiar esta implicita en la ec. (23.8) La cantidad (W — n/N se conoce como correccién de poblacion finita o cpt. Tam- bién puede escribir | — n/Ny a n/N ce le llama fracetom de muestrea, Si la fraccién de muestrea es pequefia, digamos menos del 3 por ciento, puede omitirse. Es de interés ob- servar que gpi(m — 1)-es una estimacin no sesgadi de la varianza de la poblacion indepen: dientemente de que la poblacién sea finita 0 no, 0 sea que usamos una éstimacion inses gada de Ia varianza de la poblacién en los caps. 20 a 23 cuando usamos p(1 — pin. (Re- cuérdese que en los caps. 20 3 23 p se usa como paramerso yp como estimaciGn), Elintervala de confianza para una media esté dado por la ec. (25.7). Obsérvese que se hace uso de la epf. Obviamente estamos suponiendo que j se distribuye normalmente, sabiendo que la pobla- Gién de los ¥ no.es normal, ya que es una poblacion finita. Ademis, se muestrea sin rem- plaze. El intervalo de confianza para una proporcidn exige una distribucian hipergeometti ca, sec. 23.2, si ha de ser completamente valido, El investigador interesado puede remitir- se a los grificos de Chung y DeLury (25.3), Una aproximacién corriente es (25.8) MUESTREO DE POBLACIONES FINITAS 547. Obsérvese que la desviacién estindar estimada no es la que da Ia ec. (25.6), pero es com- parable con la cantidad poblacional dada por la ec. (25.3). La estimacién usade en la ec. (25,8) es la més comin, La tabla 21.1 puede usarse para juzgar lo apropiado de la ec. (25.8). El muestreo aleatorio simple se usa cuando se sabe que la poblacién noes muy va+ riable cuando la verdadera poblacién cae entre el 20 y el 80 por ciento, Cuando hay varia- ciém considerable, las unidades de muestreo deberin agruparse en estratos de tal modo que puede esperarse que Ia variacién dentro de los estratos sea inferior a la variacion entre estratos, Esto Heva al muestreo estratificado. Idea muy parecida ¢s la que lleva a un andli- sis de la varianza entre grupos y dentro de grupos. Ejetcicio 25.4.1 Considérexe la poblaciéa finita que consiste en los mimeros 1, 2... 6. Caleular lh meds y Ia varinnea, Considéreme todas las poubles mucstras de dos obserracioncs cuando se mucattea esta poblacion sin remplazo. Hacer una tabla de mediat y varianrat muestrales y Ia fre curnoia de ocurrencia de cada uno de los valotes, Demostrar que la media y varlanea muostrales de la co, (25 5) som estimaciones insesgadas de ta media y varlanza poblacionales de la ec. (25.1), Si el gjercicin hubiese dicho “muestra con remplazo” ,qué cambios te tequerirfun en los cilcutos? Ejercicio 25.4.2 Seva amuesttear una poblacidn consistente en 6,000 compradares de musbles, mediante un cuiestionatio enviado por correo en relacion con au preferencia por determinado musble, Se Toma una muestra aleatoria de 250 personas y se envian los cuestionarios, Como la Plefetencia se refiete 3 un acceiono poco costoso, x¢ previn slo respucstas si o no. Todos lox ‘curstiontrios fueron devueltos con 187 respuestas i, Estimar la verdadera proporcién de tes- pucstat si cn la poblacién mediante wn intervalo de confianea Wel 9S por canto. Ejereicio 254.3 Con La misma poblacion del ejercicio 2$ 4.2. se envid un cuestionario mas largo a Und musstra alcatoria de 7S0 compradores. S6lo fueron devucttos 469 cucstionarios, Estimar la verdadera proporsion de los que respondigron en la poblacion mediante un intervale- de confianza de! 90 por ciento. 25.5 Muestreo estratificado La varianza estimada de una media de poblacién esta dada por la ec. (25.5) y, para una proporcion, por la ec. (25.6) @ la alternativa mas frecuente que implica la ec. (25.8), Para disminuir la longitud def intervalo de confianza que estima la media de poblacién, pode- mos aumentar 1 0 disminuir la varianza de la poblacién. Obviamente, ambas posibilidades eben considerarse. 1a forma obvia de disminuir una varianza de poblacién es construir estratos con las unidades de muestreo, asi que Ia variacion total se particiona de tal manera que la mayor parte posible se asigne a diferencia entre estratos. Asi que la variacién dentro de los estra- tos se mantiene baja, La variacion entre medias de estratos en la poblacin no contribuye al error de muestreo dé Ia estimacién de la media de la poblacién. Ver la ec. (25.15). La reduceién en Ia variscién de la estimacién de la media de poblacion es una razén muy importante para la estratificacién. Pero en muchos estudios entran varias variables y una buena estratificacion para una variable puede no serlo para otra. Asi vemos que los estratos a menudo se construyen con base puramente geogrifica. En general, esto da resul- tado, y asi encontramos municipios, condades y zonas de recursos de tierra usados como estratos. Este tipo de estratificacion a menudo es canveniente por razones administrativas, $48 BIOESTADISTICA: PRINCIPIOS ¥ PROCEDIMIENTOS ya que es posible obtener la cooperacian de organismos, municipios, condados u otros organismos convenientemente localizados, Ademis de aumentar la precisién con la cual se miden las medias; la estratificacion permite un trabajo cficiente de asignacion de recursos ya que podemos usar cualquier mé- todo para decidir cudntas unidsdes de muestreo se han de tomar de cada estrato. Se supo- he que se hard muestreo en cada estrato. A menudo se desean estimaciones de medias de estratos y, en tales casos. la estratificacion es esencial. Notacién ¥ definiciones La notaciin y definiciones para el muestreo aleatorio estratifica- do estin obviamente relacionadas y son extensiones de las ya dadas en la sec. 25.4 bajo el mismo encabezamiento. Sea ¥,; la observacin é4sima cn el estrato késimo, k= 1... & Los tamaos de lox estratos, medias y varianzas se designaran mediante oP, y S? con los valores muestrales correspondientesm,, i, 0 Py ¥ Sb La media y la Varianza de losestratos son % rh y segdn la ec. (25.1) La media y la varianza muestral para el estrato késimo = segiin Ia ee, (25.4) Tambign se necesitarin parimetros y estad igrafos para la poblacién completa Sean N=DM oy a= En z MUESTREO DE POBLACIONES FINITAS 549 Larazbn N,/N se presenta con bastante frecuencia y se la representa con Wy, esto es W, = Ny /Ndonde W! corresponde a la ponderacin Media de poblaciGn (est significa estratificado): EA Fea a DK nw 74 Estimacién de ta media de poblacion TMi — = x Woy Wm al (Las medias muestrales son F= Ym Rin y p=Toaa in) ‘La varianza de la estimacin de la media de poblacién: Si Nama m ON y (% TAN 1 St TMM at ; Comparese fa ec. (25.5) con la primera expresién para 4*( ject). Comparese Ia varianza dada en la ec. (25.3) con 7(p.,,). La varianza muestral de ta estimacién de la media de poblacion 25.9) (25.10) (35.11) (25.12) (25.13) (25.14) (25.15) 550 BIOESTADISTICA; PRINCIPIOS ¥ PROCEDIMIENTOS, La primera forma se abtiene de la ec. (25,13) sustituyendo parametros por ¢stimadores. Es una estimacién no sesgada de o7(V',,,). La segunda forma puede usarse para ediculas. pwn Nom 25.16) % Mica (25.16) 5*(Pext) = Esta ceuaciOn se obtiene de la ec, (25.14), Da una estimacion sesgada de 07(p, .,}, pero es de uso comin, Si la correccién de poblacin finita es pequefla, se omite cuando se calculan los in- tervalos de confianza Al estimar la media de la poblacién, se usan ponderaciones, Por esta razdn, la estie macion de la media de In poblacion y de la media muestral,',.) ¥ V, respectivamente, no tienen que ser lay mismas. Sin embargo, my /My nN, = AJ, entonces Veg =). A ésto se le llama asignacion proporcional y xe dice que la muestra es autoponderada, Cuando se usa la asignacién proporcional y las varianwas dentra de ios estratos son ‘homogéness, los resultados relativos a las varianzas sc pueden resumir en una tabla de and- lisis de Ia varianza con las fuentes de variaciOn para ¢l total, entre y dentro de estratos, El valor de la estratificacion particular puede estimarse comparando la desviacién estindar de gg, calculada a partir del cuadrado medio dentro de estratos, con lade ¥), ealculada a partir del cuadrado medio total, Cochran (25.2) y Hansen y otros (25.4) dan proedi- mientos exactos, Ejercicio 25.5.1 11 problema de los que no respanden e3 general, y de él padecen tos uuarionde cuestionarios enviados por correo y ain fos entrevisiadares. Supéngase que se escogen al azar 91) compradores de wna poblacion de 6,000, Se reciben respucstas de 250 y, de éstos, 195 esti 4 favor de uns migerencia, Eqtimar Ia proparciéa de “for que estén favor" en la pobta- cién de lox que responden; utilizar un intervalo de confianza del 95 por ciento. De lot que no responden conoeidas, se extrac una muestra aleatoria dc $0 y s¢-entrevistan, De éstos, “a favor” hay. 30 en ts mueytra de ta poblacign de los que na responden, Fstimar me- diante un intervalo de confianza del 95 por ciento, la proparcién de los que responden “a favor" enesta poblacion. ‘A veces la respuesta ¥ no respuesta a los cuestionariss enviados par correo $e usin eoimo stiterio de estatificacion. Supénease que fos resultados anteriores se consideran como prove- nnientes de tales estratos, Estimar la proporcidn de Is poblacidn de los que extn “a favoz™ y la dewiscién estindar de ba estimacion, Dar un juicio critic prictico y dos tedricos sobre el provedimiento, {Come se podrian usar los resultados de la mucsira para contrastar si los dos estratos dife- san 0 no en respuesta aa sagerencia? 25.6 Asignacién éptima La estratificacién generalmente produce una disminucion en la varianza de la estimacin de la media de la poblaciOn, Sin embargo, la asignacion proporcional no siempre es. una asignacién optima y, por esto, puede necesitarse una fraccién muestra! variable. Costa fijo En algunos expérimentos en muesireo, el costo de obtener una observacion a partir de una unidad de muestreo rio varia nada de un estrato a otro, y se puede omitir al determinar las fracciones muestrales para los diferentes estratos. El problema estd en mi- ‘MUESTREO DE POBLACIONES FINITAS. 551 nimizar o7(}g,,) tal como aparece en Ia ec, (25.13) 0 07(M,,,) dada por la ec. (25.14). Las fracciones muestrales se determinan por el tamaiio del estrato y su variabilidad, y es bien claro que un estrato mayor implica un mimero de observaciones mayor, como ocurti- ria con Un estrato con alts variabilidad. Se ha demostrado que la asignacién Sptima se obtiene cuando ef niimero de obsorvaciones tomadas en un estrato se determina mediante (25.17) Obsérvese que el denominador es la suma extendida a todos los estrates. Aunque ia aplicacion de esta formula necesita de los parametros $,,4 = 1, ..., 5, a menudo es necesario usar estimaciones. Asi, se desea informacion muestral para fos aflos entre censos, se pueden usar desviaciones estindar con respecto al censo precedente mas vercano, En otros casos, puede ser necesario hacer uso de informacion de otros studios mucstrales relacionados. Cuando no se dispone de estimaciones de S, , se recomienda la asignacién pro porcionsl ‘A veces, la couacibn (25.17), dard uno o mis valores de a, mayores que sus co- rrespondicntes N, . En tales casos, ¢! 100 por ciento del muestreo se hace en estos estratos y lag restantes fracciones muestrales se ajustan de modo que la muestra total sea del tama- ‘Ao planeado originalmente. Por ejemplo, si n, > N, al aplicar ta ec, (25.17), entonces se hace 11, = N, para propésitos del muestreo y recalculamos los restantes », con la ecusciOn py = MINS IMS, of Cuando el muestreo estratificado es para proporciones, elm, se puede determinar mediante (25.18) Lay 7 Esta ecuacién es una aproximacién; es similar a la ec. (25.17), si bien ésta.no es una apro- ximacion, Lo que se gana en precision como resultado del uso de una asignacion optima en vez de una proporcional, probablemente no 2s tanto para estimar proporciones como para estimar medias de variables continuas. Como la asignacién proporcional ofrece la comodi- dad de las muestras autoponderadas, frecuentemente se recomienda cuando se han de esti- mar proporciones. Costo variable Cuando e| costo para obtener una observacion varia de estrato en estrato, se necesita cieria funcidn de costo que dé el costo total. Una sencilla funcidn de costo. es a dada por Coto=C=a+T am (25.19) $32 BIOESTADISTICA: PRINCIPIOS ¥ PROCEDIMIENTOS donde a ¢s un costo fijo, independientemente del tipo de:asignacion del muestieo a los estratos, y c, representa el costo por observacion en el estrato k. Para esta funcion de costo, la o* (gq) minima se obtiene si tomamos una muestra grande en un estrato gran- de, una muestra grande cuando la varianza del estrato es alta, y una muestra pequena cuando ef costo del estrato es alto. Es decir, el taniafio de la muestra para todo estrato es proporeional aN, S, ic - En un estudio efectivo tal vez tengamos qile operar con un presupuesto fijo o bien haya que estimar la varianza de la media de poblacién con una precision especificada. El Ultimo requisito determina el tamafio de Ia muestra Y¥.a Su tuo, el presupuesto. Para un presupuesto fio, el tamafio de muestra Sptimo para cada estrato es _ NSuyete — ay 25.20) EMS Ja 520) 7 mm Para una varianza fifa, la cc. (25.21) da et tamafio Optime de la muestra para cada estrato, En este caso, minimizamos ¢l costo para una varianza fija o predeterminada, (25.21) donde W, = N,N Las estimaciones aproximadas de los $7 y o, suelen ser bastante adecuadas para estimar tamafios de muestra Optimos para los estratos, Cuando el muestreo es para estimar Proporciones, S, puede remplazarse por ./P,Q, en las ecs. (25.20) y (25.21) para tener n aproximadamente optimas, Blercicio 25.6.1 Demuéstsese quc ls ecs. (25.17) y (25.20) dan tos mismos resultados que la asienacion proporcional cuando las Varianzas de los extratas son homogéneos y el costo no varia, Hereicio 25.6.2 Los sigvientes datos proviencn de R. J. Jessen (25.4), Las estzator son tipos de teas de cultivo, N, el rimero de granjas ruraes,'53(1) es una varianza pata el nimero de porch nos y Si(2) es una varianza para el nimero de orcjas. Los N corresponden a datos del censo de 1939, micnitras que Jos Sj se hun obtenido de una muestra tomada en 1939 y son solamente estimaciones, Para cada conjunto de datos, cakular los tamados de muestra utlitando ‘sxignacianes pro porcional y ptima para un temas de mucttra total de 800. Compatar los resultadon, MUESTREO DE POBLACIONES FINITAS 553. Estrato | 2 3 4 Entade 38412 44017-46935 41.832— 200,770. NM ». SHU) 1926-2382 1967 2.403 us sia) Te 2 sik 8 25.7 Muestreo multictipica o por conglomerados En ciertos esquemas de muestreo, las unidades de muestreo estin en grupos de igual o desigual tamafo y los grupos, en vez de unidades, son los que se muestran aleatoriamente. A tales grupos se les llama wridades primarias de muestreo 0 wpm. Las observaciones pue- den obtenerse sobre todas las unidades clementales o éstas, a su vez, pueden ser muestrea- das. Por ejemplo, podemos estar interesados en individuos, las unidades elementales, y podemos obtenerlas extrayendo una muestra aleatoria de familias, las unidades primnarias de muestreo, y observar dentro de cllas todas las unidades, sto seria un plan de muestreo por conglomerados simple o un plan de muestreo de una etapa, Al muestreat el suela 6n un terreno para evar a cabo un experimento, pademos dividir el terreno en parcelas experimentales, colocar una cuadricula encima de cada parcela para definit las unidades de muestreo, y luego obtener varias observaciones de cada parcela. Esto seria un muestreo en das etapas 0 sebmuestreo, en ¢l que la primera etapa era esencialmente un-censo ‘Obviamente pueden idearse muchos tipos de muestreo par conglomerados, La ma- yoria tendra ciertas ventajas obvias en relacion con ¢l casto y Ia aplicabilidad, ya que el costo de pasar de una upmaotra ¢s probablemente mayor que el de pasar de una subunidad a otra, porque la identificacidn de los upm puede ser mds simple que identificar Is subuni- dad, Cuando un conglomerado se define por asociaciOn con un area, tenemos muestred dé irea. Por sjemplo, podemos muestrear secciones de a cuarto de milla cuadrada de 4rea, el conglomerado 0 Upm, ¥ enumerar todas las granjas en la upm. Sup6ngase que una poblacin consiste enV upm, de la cual sacamos una muestra aleatoria de tamaiio.n; cada upm consiste en Mf subunidades, de las cuales extraemos una muestra de tamafio m para cada unade las m upm, (Las letras.M y N, ym y mse intercam- bian a menudo en Ja literatura de muestreo), Ahora hay MA elementos en la poblacién y mn on ta muestra. El plan es de muestreo en dos etapas 0 de submuestreo, Los cflculos usualmente s efectitan por elementos, tal como s¢ acostumbra en cl anilisis de la varianza. Una observacién se denota mediante ¥,,, donde j se refiere al cle+ mento ¢ fala upm. La media de todos los elementos en una upm se designa ¥;. 0 simple- mente ¥;, y la media de poblecion por ¥. 0 simplemente 7. Las medias muestrales correspondientes estin dadas por los simbolos J, © j, yj oF Supongamos ahora que V y M son infinitos y definimos un elemento par Fitey (25.22) Este es un modelo lineal tal como se expuso en las sees, 7.6 y 7.7 con notacién algo dife- rente, Si denotamos la varianza de los 4 por 5? y las de los ¢ por S2, entonces los cuadra- dos medios muestrales definidos como en la tabla 25.1 som estimaciones de las cantidades $4 BIOESTADISTICA: PRINCIPIOS ¥ PROCEDIMIENTOS ‘en la columna de valor esperado. Obsérves que no s¢ intenta que s? sea una estimacién de St ‘Las sumas de cuadrados se caleulan usualmente a partir de las siguientes formulas de ealeulo y no por las formulas de definicion de la tabla 25.1. 2 eee Entre las upm: (n= 1)s3 = Dentro de lasupm: nfm — 1}s2 = z(= ¥i- Thi ° = SC{total) — SC{dentro de las upm) se(toraly =F yi — G tam Si relacionamosl anilisis de la varianza dado en Ia tabla 25.1 con las sees. 7.6 y 7.8, vemos que el cuadrado medio dentro de las upm puede Mlamarse error muestral y que cl cuadrado medio entre upm puede Hamarse error experimental. El error experimental en lugsr del error muestral es el spropiado en cuanto alaesti- macién de ¥ mediante un intervalo de confianza. El error experimental se basa en la uni dad escogida al azar en Ia primera ctapa de muestreo y cortesponde a la parcela a la cual se aplica un tratamiento en forma aleatoria en un experimento en el terreno o de lubora- torio, En el curso corriente de los sucesos, seria de esperar que el error muestral fuese Menor qué el error experimental ya que esperariamos mas homogeneidad dentro de lay lupm que entre las upm. Asi, el error muestral no seria apropiado para calcula un interva- lo de confianza para Y. La Varianza de la media muestral, s7(j), se estima mediante <2 /nm, estimacion no sesgada de Ia verdadera varianza, Ahora podemos estimar tanto $3, come S$? y construir Tabla 25.1 Anillisis de Ia varianza y valores esperados en muestreo endos etspas Fuente de Valores experados del variseién al cauadrado medio Entre las ump a-t Sh + mSE Dentro las ump x i ‘Total mm -1 mmol MUESTREO DE POBLACIONES FINITAS 555 estimaciones de las varianzas de las medias de tratamientos para las diferentes asignaciones de nuestros esfuerzos. As!, para el esquema presente, 2 33 oGy= is No se disminuye Sj /n tomando mis submuestras, pero $3 proablemente sea lo que mas contrihuya a.a4(j}), Si fuésemos a muestrear n, entonces disminuiriamos ambas cantribus clones, Asi, en teoria, la mejor asignacion a nuestro estuerzo. es tomar tantas. upm como sea posible y tomar muy pocos ¢lementos dentro de cada upm si ella implica un esfuereo considerable; naturalmente, necesitamos dos de tales elementos de cada upm si tenemos que estumar bien sea $20 $2 conservundo faciidad de caileule, También se dispoae de la teoria pari poblaciones finitas y cuanda las upny diferent, en el namero de elementos que contienen. FI lector interesado puede consultar Cochran (25.279 a Hansen et al, (23.4), Al muestsear pata proporciones con WV conglomerados y M elementos por conglomie- tails, extriiganse st conglomerados y cnumérense completamente. Entonces una propor: cién observada es una proporcion verdudera F, pars el vonglamerado F-ésimo y no esta sujet a varwcidn muestral, Estimamios la proporsia de poblacidn por SF y su varlanza por Cuando el esquema de muestreo supone tomar silo m de los Mf elementos en un conglo- merado, entonces solo se estima P; y debe introducirse um término para fa variacién mues- tral dentro de conglomerados en la varianza de la estimacion de la propercién de pobla- cion P, Ahora tenemos . sypeMom om Ls wm ERP ee ee ee Ladell (25.6) y Cochran (25.1) describen un interesante experimento de muestreo donde se impone un control local, em forma de una restriceién sobre el submuestrco. En 586 BIOESTADISTICA: PRINCIPIOS Y PROCEDIMIENTOS ‘Tabla 25.2 Analisis de la varianza de los datos de cienpiés Fuente J Sumede cusdrados Cuadrado medio as 4 sises 12886 Columns 4 St34e 1306 Error experimental 16 435) Entre mitadesde parcelas 25 90.76 Fitot muestral too wea Totales 149 clejemplo particulat interving Ia superimposicion de un disen de cuadrad lacino, iniciak mente sin tratamientos. sobre un area experimental y la obtencidin de seis mueatras de suelos de cada parcela, En estas muestras de suelosse hicieron recuentos de cienpids. Se uso de manera que se tomaron tres muestras de cada una de las mitades norte y sur de {a parcela. En consecueneia, las diferencias no akeatorias en el ndmera de cienpiés entre las mitades no influyen €a las comparacionies de tratamientos o en él error experimental, Los resultados se presertan en Ia tabla 25.2; aqui combinados el “error experimental” usual y “tratamientos” ys que no hubo verdaderos tratamientos. Es claro que “el control local” aument upreciablemente la precision del experimento, Hiercicio 28.7.1 Suponga que deseamos hacet un estimacion antes de la cosecha del rend}: mignto do trigo en un estado donde te cultivs trigo, Elirea sembrada de trigo ro divide, para los fines del muestreo, en parcelas de-un acte. Se toma una muestsa aleatotia de 250 parcclas ye Obtienen dos submuestras de cada una de las 250 parcelas, Cada submuestea es de 2 ples cua Grados, aproximadamente 1/10,000de acre, asi que no se necesita aplicar la teorin del Aivesteco finito. Ebanalisis de la vattanza da un error muettral de 20 (dentzo de las ump) y un error expert mental de 70 (entre Jas ump). (Lox rendarmientas fueron canvestide's a bushels por acre), Efe. war el andlisis de is Varianca, Estimaz as eomponentes de la varianza, Caleular la varlanea de tena medi de tratamiento, Estima la Varianza de una media de tzatamiento,suponiendlo que la tase de submuestreo se dobla (cuatro submusitiens, en ver de dos), ;Da esto una apreciable ga- tancla en precisiin? (Expresar ta varionza estimada como un porcentaje de la ob etvads) Berelcio 25.7.2, Utilizat loy datos de ta table 25.2 para calculi ef error experimental vimo a} no se hubiese stpttrampuesto un Gischo a las parcelas, (Us42 na media pondernda de cuadrados medios de filss, columnas y error experimental), ;Cuil habeia side ef ettor de muestieo i no ec hubiera ueado ningiin control local? (Lsar una media ponderada de los cuadeados medios de ine fitades de las parcelas y el error de muerttco). {Cudl habria sido et error experimental sin ¢1 GiteRo y sine] coniral local” (Surmar los valores que se acaban de ealcular para los errores expe mental y muestral. Este incluye el error muestzal stn control Local dos veccs de modo que el Cifor_muestzal con como} tatal debe restarse ahora). Catcular ba desviaciin estandur de-cada luna de las tres vatianzas que sc acaba de-calcular Hercicio 25.7.3 (Cua ex ct minimo nimero de submuestras por média pateela de contol focal si #e necesita estimat ¢l error de mucstrea y. al mismo tiempo, mo perder li facilidad de vileulo? MUESTREO DE POBLACIONES FINITAS $57 Referencias 28.4, 28.2: 25.3. 25.8. as. 356, Cochtan, W. G.: “The information supplind by the sampling tesults."' Ama, Appl. Biol, 25; 385:589 (1938). Cochran, W.G.. Sompline Techniques, Wiley, Nueva York, 1953, Ghana. J, Ho yD. B, Detury: Confidence Limits for the Hyperseometric Distribution, Univer. Aity of Toronto Press, Toronto, Ontario, 1950. Hanwen, M. H.W, N. Hurwite, y WG, Midow. Semple Suevey Methids anid Theory, 2 vols, Wiley. Nueva York, 1953 Jose, RJ: “Statistical investigation of a sample survey for obtaining farm facts," fowa Agr. Esp. Sta, Rex Bull, 04, 1942. Lagell, W. R. S.. "Field experiments on the control of wireworms,"* Aina, Appl diol, 28, 341 352 (1938)

También podría gustarte