Está en la página 1de 55
9.4 Una sola muestea: estimacién de la media 269 valor posit de una fraccién que queramos specifier. Si, por ejemplo, caleulamas 6 Ty 6,, tales que PO, <0<8y) para 0 < ar< I, tenemos entonces tna probablidad de I~ de seleccionar una muestra aleatoria que produzca un intervalo que contenga 8. El intervalo 6,.< 0 < 6, que 3¢ calcula a partir dela muestra seleccionada, se llama entonces intervalo de conflaniza del 100(1 ~ a)% la fraceién 1 ~ ar se denomina eoefciente de confianza o grado de con- fianza,y los extremos, 6, y 6, se denominan limites de confianza inferior y superior ‘Asi, cuando «= 0.05, tenemos un intervalo de confanza del 95%, y cuando a= 0.01 ‘btenemos un intervalo de confianza més amplio del 99%. Cuanto més amplio sea el inervalo de confianza, més confiaremos en que contiene el parsmetro desconocido Desde luego, es mejor tener un 95% de confianza en que la vida promedio de cierto ‘eansistor de un televisor est ente los 6 y los ?aios, que tener un 99% de confianza en ‘que est6 entre los 3 y Tos 10 aos. De manera ideal, preferimos un intervalo corto con un grado de confianza alto. Algunas veces las resrigeiones en el tamafo de nuestra muestra ‘os impiden tener intervalos cortos sin sactificat cierto grado de confanza, las siguientes seccionesestudiaremos los conceptos de estimacién puntual y por intervals, yen cada seccin presentaremos un caso especial diferente. E lector deberfa notar que, aunque la estimaciGn puntual y por intervalos tepresentan diferentes aproxi- maciones para oblener informacién respecto a un parémeto, estén relacionadas debido ‘que los estimadores del intervato de confianza se basan en estimadores puntuales, En la siguiente secei6n, por ejemplo, veremos que Xes un estimador puntual de pe muy razonable, Como resultado, el importante estimador del intervalo de confianza de jt depende del conocimiento de la distibucién muestra de Empezaremos la siguiente secci6n con el caso més sencillo de un intervalo de con- fianza, en donde el escenario es simple pero poco reslista. Nos interesa estimar una media dela poblacién cuando o todavia se desconace. Bvidentemente, si se desconoce jes muy improbable que se conozea a. Cualquierinformacién histérica que produzca datos suficientes para permis suponer que se conoce o probablemtente kabria producido informacion similar acerca de j. A pesar de este argumentoiniciamos con este caso porque los conceptos y los mecanismos resultantes asociados con Ia estimacién del intevalo de confanza también estarén asociados con las stuaciones més realistas que presentaremos més adelante en la seccin 9.4 y ls siguientes 9.4 Una sola muestra: estimacién de la media La distribucién muestral de X esté centrada en py en la mayorfa de las aplicaciones la varianza es més pequefia que la de cualesquiera otros estimadores de 4, Por lo tanto, se utilizard la media muestral £ como una estimacién puntual para la media de la poblacién 1. Recuerde que a} ='/n, por lo que una muestra grande produciré un valor de X procedente de una distribucién muestral con varianza pequetia. Por consiguicate, es pro- ‘able que ¥ sea una estimacién muy precisa de p cuando n es grande. CConsideremos ahora la estimacién por inlervalos de j1. Si seleccionamos nuestra muestra a partir de una poblacién normal o, a falta de ésta, sin es suficientemente grat de, podemos establecer un intervalo de confianza pata 1 considerando la distribucién muestral de X. www.FreeLibros.me 210 Capitulo 9 Problemas de estimacisn de una y dos muestras De acuerdo con el teorema del limite centtal, podemos esperar que la disuibucién muestral de X esté distribuida de forma aproximadamente normal con media jlg=/t y dlesviasiGn estindar oy = c/n Al escribir 2, pasa el valor 2 por auiba del cual, encontramos una érea de a/2 bajo la cutva normal, en la figura 9.2 podemos ver que P(-ta)2 30, en las que la forma de las distribuciones no esté muy sesgada, Ia teo- ria de muestreo garantiza buenos resultados. — ‘Queda claro que los valores de las variables aleatorias ©, y @,,, las cuales se defi- injeron en la seccién 9.3, son los limites de contianza 4, a: y by =F 420 ‘Ve Mostss difrones robin valers diferentes dey, po la tans, producti dife- rentes estimaciones por intervaos de pardmetvo pt, como se muestaenl hgura.3. Los puntos enc ento de cada intrvao indian la possi de a estimacidn punta para Eada mucsraaleatora, Observe que todos los intervals tienen el mismo ancho, pues tstodepende s6le dela eleccign de, na Yex que se detemuna F. Cuanto mis grande seal valor de 2, queljamos. masanchesharemes toes os intervales,y podtemos tencr mas confatea en que Ia musta particular que sleccionemes producté un ine fate que contenga el pametto desconocioj. Bn general, para ana eletci6a de 100(1 a) % dels intervalos contend Mucetea Figura 9.3: Estimaciones por intervalos de jz para muestzas diferentes. Ejemplo 92:1Se encuentra que la concentracién promedio de zine que se obtiene en una muestra de Solucién: ediciones en 36 sitios diferentes de un rio es de 2.6 gramos por mililitro. Caleule los intervalos de confianza del 95% y 99% para la concentracién media de zinc en el rfo Suponga que la desviacién estindar de la poblacidn es de 0.3 gramos por mililitr. Laestimacién puntual de jes ¥ = 2.6. Bl valor z que deja una drea de 0,025 a la derecha y, por lo tanto, una area de 0.975 a la izquierda es z,,., = 1.96 (véase la tabla A.3). En consecuencia, el intervalo de conflanza del 95% es (23) 2.6~ (1.96) 7) << 26+ (1.96) Vie. www.FreeLibros.me 2m ‘Teorema 9.1 Teorema 9.2: Capitulo 9 Problemas de estimacisn de una y dos muestras que se reduce a 2.50 < p< 2.70, Paracalcular un inervalo de confianza del 99% encon- tramos el valor z que deja una érea de 0.005 a la derecha y de 0.995 a la izquierda. Por Jo tanto, usando la tabla A.3 nuevamente, Z,.,, = 2.575 y el intervalo de confianza de 99% es as as (2) 30 para propor- ccionar una estimacién de o. Después, usando s como aproximacién para g en el teore- ‘ma 9.2, podemos determinar aproximadamente cuéntas observaciones necesitamos para bbrindar el grado de precisién deseado. jemplo 9.3: 1 {Qué tan grande debe ser Ia muestra del ejemplo 9.2 si queremos tener 95% de confian- ‘2a en que nuestra estimacién de js diferiré por menos de 0.057 Solucién: La desviaci6n estindar de a poblacién es & = 0.3, Entonces, por medio del teorema 9.2 2.96(0.3) 005 Por lo tanto, podemos tener 95% de confianza en que una muestra aleatoria de tamaio 139 proporcionard una estimacién ¥ que diferii de pen una cantidad menor que 0.05. | = 8s Limites de confianza unilaterales Los intervalos de confianza y los limites de confianza resultantes que hasta ahora hemos ‘analizado en realidad son bilaterales, es decir, tienen limites superior e inferior. Sin em- Dargo, hay muchas aplicaciones en las que s6lo se requiere un limite. Por ejemplo, si a ‘un ingeniero le interesara determinar una medida de resistencia a la tensi6n, la informa- ceién que més le ayudaria a lograt su objetivo sera la del limite inferior, ya que éste indi- cca el escenario del “peor caso”, es decir, el de la menor resistencia, Por otro lado, si se bbuscara determinar una medida para la cual un valor de 1 relativamente grande no fuera redituable o deseable, entonces la medida que resultara de interés seria la del limite de cconfianza superior. Un ejemplo en el que la medida del Ifmite superior seria muy infor- ‘mativa es el caso en el que se necesita hacer inferencias para determinar la composicién media de mercurio en el agua de un ri. Los limites de confianza unilaterales se desarrollan de la misma forma que los inter- valos bilaterales. Sin embargo, la fuente es un enunciado de probabilidad unilateral que utiliza el teorema del limite central Raw ) (5 ce, ( one Entonces, es posible manipular el enunciado de probabilidad de forma muy similar a ‘como 86 hizo anteriormente para obtener PU>X —ra0/yn) ‘Una maniptlacién similar de P (2=£ > 20) Pek + 20/yn) Como resultado, se obtienen ls siguientes nites uniaterales superior e inferior. Limites de confianza unilater cuando ales de jx Si_X es la media de una muestra aleatoria de tamaho m a partir de una poblacién con varianza o7, los limites de confianza unilaterales del 100(1 ~ a para yt son dados por limite unilateral superior: + 2007/ yf elvalorde o* __ limite unilateral inferior: —2ao/yh www.FreeLibros.me 214 Capitulo 9 Problemas de estimacisn de una y dos muestras Ejemplo 9.4:] En un experimento de pruebas psicolégicas se seleccionan al azar 25 sujetos y se miden Solucién: sus tiempos de reaccién, en segundos, ante un estimulo particular: La experiencia sugie~ ze que la varianza en los tiempos de reaccién ante los diferentes tipos de estimulos es de 4.3¢y que la distribucién del tiempo de reaccién es aproximadamente normal. El tiempo promedio para los sujetos fue de 6.2 segundos. Calcule un limite superior del 95% para cl tiempo medio de reaccién, Lo que da el Iimite superior del 95% es Fb 2qa/Vi = 6.2 + (1.645) TPB = 62 + 0.658 6.858 segundos. En consecuencia, tenemos un 95% de conlianza en que el tiempo promedio de reaccién ce menor que 6.858 segundos 4 El caso en que se desconoce o Con frecuencia debemos tratar de estimar Ia media de una poblacién sin conocer la va- rianza. El lector deberia recordar que en el capitulo 8 aprendié que, si tenemos una ‘muestra alestoria a patir de una distribucién normal, entonces la vatiable aleatoria, Xu STV tiene wna distibucion ¢ de Sent con n—1 grados de bert. Aqui Ses In desvincién estindar de a muestra. En esta situacién, en laque se desconoce ose puode wtlizar T para construc un intevalo de confianza para. El procedimiento es igual que cuando se onoce a, sélo que en este caso a se reemplaza con $y Ia dstibucién normal estdndar se reemplaza con la distribucién Sinos remitimos aa figra 9.5, podemos afimnar que Plrtayr 30, ase puede reemplazar con s para poder wilizar clintervalo de confianza Fenny ‘A menudo se hace referencia a esto como un intervalo de conflanza para una muestra ‘grande. La justificacién para esto reside s6lo en la presuncién de que, con una mues- ia tan grande como 30 y una distribuci6a de la poblacién no muy sesgada, + estars muy cerca de la 6 verdadera y, de esta manera, el teorema del limite central continuard siendo vilido, Se deberfa destacar que esto es s6lo una aproximacién y que Ia calidad de los resultados mejora a medida que aumenta el tamaio de la muestra, Tjemplo 9.621 Se obtienen las calificaciones de mateméticas del Examen de Aptitudes Hscolares (SAT, Solucién: [por sus siglas en inglés) de una muestra aleatoria de 500 estudiantes del sitimo aio de preparatoria del estado de Texas. Se calculan la media y ta desviacién esténdar muestra- les, que son SO1 y 112, respectivamente. Calcule un intervalo de confianza del 99% de la calificacién promedio de mateméticas en el SAT para los estudiantes del sitimo aio de preparatoria del estado de Texas. ‘Como el tamafio de la muestra es grande, es razonable utilizar Ia aproximacién normal. Si utilizamos la tabla A.3, encontramos z,,.. = 2.575. Por lo tanto, un intervalo de con- fianza del 99% para pes 501 + 2.515) (=) que da como resultado 488.1 < ju < 5139. 4 501 + 12.9, 9.5 Error estandar de una estimacién puntual Hicimos una distineién muy clara entre los objetivos de las estimaciones puntuales y las cestimaciones del intervalo de confianza. Las primeras proporcionan un solo nGmero que se extrae de un conjunto de datos experimentales,y las segundas proporcionan un inter- vvalo razonable para el parimetro, dados los datos experimentales; es decir, 100{1 —a)% de tales intervalos que se calcula “cubren'” el parimetzo, Estos dos métodos de estimacién se relacionan entre sf El elemento en comin es la distribucién muestral del estimador puntual. Considere, por ejemplo, el estimador X de cuando se conoce 0, Indicamos antes que una medida de la ealidad de un estimador insesgado es su varianza, La varianza de X es at www.FreeLibros.me 9.6 Intervalos de prediceién 277 ‘De esta forma, la desviacién estindar de X 0 error estdndar de X es o//n. En términos simples, el error estindar de un estimador es su desviacidn esténdar, Para el caso de X el limite de confianza que se calcula ¥ + 2uj2—Z se escribe como ¥ + 24/2 6.0. (8) ve donde “ee.” es el error estindar, Fl punto importante es que el ancho det intervalo de cconfianza de 1 depende de la calidad del estimador puntual a través de su error estandar. En el caso en que se desconoce oy Ia muestra proviene de una distribucién normal, s reemplaza aa y se incluye el error esténdar estimado S/n. Por consiguiente, los mites de confianza de p1 son: Limites de cconfianza para p euando se desconoce o° fly p at thar ee) De nuevo, el intervalo de confianza no es mejor (cn términos de anchura) que la calidad de la estimacin puntual, en este caso a través de su error estindar estimado. A menudo el software de computacién se refiere a los errores estindar estimados simplemente ‘como “errores estinda ‘A medida que avanzamos a intervalos de confianza més complejos, prevalece el cconcepto de que el ancho de los intervalos de confianza se acorta cuando mejora la cali- dad de la estimacién puntual correspondiente, aunque no siempre es tan sencillo como aquf se ilustra. Se puede argumentar que un intervalo de conlianza es tan sélo una am- pliacién de la estimacidn puntual para tomar en cuenta la exactitud de dicha estimacién. 9.6 Intervalos de prediccién La estimacin puntual y la estimacién por intervalos de la media que se expusieron en las secciones 9.4 y 9.5 proporcionan buena informacién del parmetro desconocido jt de una distribucién normal, o de una distribucién no normal a partir de la cual se toma uuna muestra grande. Algunas veces, ademés de la media de la poblacién, el experimen- tador podria estar interesado en predecir cl valor posible de una observacién futura Por ejemplo, en el contvol de calidad el experimentador podria necesitar wilizat los datos dobservados para predecir una nueva observaci6n. Un proceso de manufactura de una ppieza de metal se podria evaluar basandose en si la pieza cumple con la especificaciones de resistencia a la Censién. En ciertas ocasiones un cliente podrfa estar interesado en ‘comprar una sola pieza, En este caso un intervalo de confianza de la resistencia media 2 [a tensién no cubnrfa la informacién requerida. El cliente necesitarfa una aseveracién respecto a la incertidumbse de una sola observacién. Este tipo de requerimiento se sa- lisface muy bien construyendo un intervalo de prediccién, Es muy sencillo obtener un intervalo de prediccién para las situaciones que hemos ‘considerado hasta el momento, Suponga que la muestra aleatoria se tomé de una pobla- ccién normal con media ps desconocida y varianza a* conocida. Un estimador puntwal natural de una nueva observaciéa es X. En la seccién 8.4 se aprendis que la vatianza de X es 0%/n, Sin embargo, para predecir una nueva observacién no basta con explicar la variacién debida a la estimacién de Ja media, también tendriamos que explicar la varia- cidn de una observacién futura, A partir de la suposicién sabemos que la varianza del www.FreeLibros.me 218 Capitulo 9 Problemas de estimacisn de una y dos muestras error aleatorio en una nueva observacién es o?, El desarrollo de un intervalo de predic ign se representa mejor empezando con una variable aleatoria normal x, — Z, donde s, cs la nueva observacidn y ¥ se toma de la muestra, Como x, y ¥ son independiente, bemos que JP+O In alten ces n(z; 0,1). Como resultado, i uilizamos el enunciado de probabilidad P-tajn $2 + 5, Sf — < ate 2) + tay rsp) ambas varianzas V donde s, es la estimacién agrupada de la desviaci6n estandar de la poblacién yt, es el valor # on v =2 grados de libertad, que deja una dea de a/2 a la derecha, Ejemplo 9.111 En el anticulo “Estructura comunitaria de los macroinvertebrados como un indicador de la contaminacign de mings écidas”, publicado en el Journal of Environmental Pollution, se informa sobre una investigacién realizada en Cane Creek, Alabama, para determinar la relacién entre pardmeteos fisioguimicos seleccionados y diversas mediciones de la estructura de la comunidad de mavroinvertebrados. Una faceta de la investigacién con- sistié en evaluar Ia efectividad de un indice numérice de Ia diversidad de especies para indicar la degradacién del agua debida al desague écido de una mina, Conceptualmente, un indice elevado de Ia diversidad de especies macroinvertebradas deberia indicar un sistema acudtico no contaminado; mientras que un indice bajo de esta diversidad indica- ria un sistema acudtico contaminado, Se eligieron 2 estaciones de muestreo independientes para este estudio: una que se localiza coniente abajo del punto de descarga écida de la mina y la otta ubicada coniente arriba. Para 12 muestras mensuales reunidas en la estacién cortiente abajo el indice de di- versidad de especies tuvo un valor medio de ¥, = 3.11 y una desviacién estandar de 5, =0.771; mientras que 10 muestras reunidas mensualmente en la estacin cortiente ati- ‘ba tuvieron un valor medio del indice £, = 2.04 y una desviacién estandar de s,= 0.448, Calculemos un intervalo de confianza del 90% para la diferencia entre las medias de la poblacién de los dos sitios, suponiendo que las poblaciones se distribuyen de forma aproximadamente normal y que tienen varianzas iguals. Solucién: Representemes con fy f, las medias de la poblacisn para los indices de diversidad de es- pevies en las estaciones corriente abajo y corriente arriba, espectivamente, Deseamos en- ccontrar un intervalo de confianza del 90% para 1, La estimacidn puntual def, ~ 4 es Ry Fy = 3.112004 = 107 El estimado agrupado,s}, de a varianza comin, 0, es — 1.71) +0 970.448) 9 4 Ta+10—2 ‘Al savar la raz cuadrada obtenemos 5, = 0.646, Si usamos a = 0.1, encontramos en la tabla A4 que f,.,= 1.725 para v = m,"+ n, ~ 2 = 20 grados de libertad, Por lo tanto, el incervalo de confianza del 90% para pt, — Jt, e8 1.07 ~ (1.725)0.646) 75 + 75 que se simplitica 0.59% < 1,—p, < 1547. 4 www.FreeLibros.me 9.8 Dos muestras:estimacién de la diferencia entre dos medias 289 Interpretacién del intervalo de confianza Para el caso de un solo pardmetro el intervalo de confianza simplemente produce limites de error del parémetro, Los valores contenidos en el intervalo se deberian ver como va- lores razonables, dados los datos experimentales. En el caso de una diferencia entre dos ‘medias, Ia interpretacién se puede extender a una comparacién de las dos medias. Por ejemplo, si tenemos gran confianza en que una diferencia 1, ~ 1, es positiva, sin duda Inferiremos que 44, > #, con poco riesgo de incurrir en un ertor. Asi, en el ejemplo 9.11 tenemos un 90% de coniianza en que el intervalo de 0.593 a 1,547 comtiene la diferencia de las medias de la poblacién para valores del indice de diversidad de especies en las dos ‘estaciones. Fl hecho de que ambos limites de confianza sean positivos indica que, en promedio, el indice para laestacidn que se localiza corriente abajo del punto de descarga ‘es mayor que el indice para la estacién que se localiza corriente arriba, Muestras de tamaiios iguales El procedimiento para construirintervalos de confianza para pt, p,cuando 0, = 0, pero ésta se desconoce, requiere suponer que las pablaciones son normales, Desviacio- rs ligeras de la suposicién de varianzas iguales o de normalidad no alteran seriamente cl grado de confianza en nuestro intervalo. (En el capitulo 10 se estudia un procedimiento para prabar Ia igualdad de dos varianzas poblacionales desconocidas con base en la in- formacién que proporcionan las varianzas muestrales). Si las varianzas de la poblacién son considerablemente diferentes, ain obtenemos resultados razonables cuando las poblaciones son normales, siempre y cuando n, = n,. Por lo tanto, al planear un experi- ‘mento se deberfa hacer ua esiuerzo por igualar el tamaio de las muestra. Varianzas desconocidas y distintas ‘Consideremos ahora el problema de calcula el estimado de un intervalo de pz, ~ 1, cuando ro es probable que las varianzas de la poblacién desconocidas sean iguales. Hl esladistico ‘que se utiliza con mayor frecuencia cn este caso es MSF Im) + (S3/may {que tiene aproximadamente una distribucién t con v grados de libertad, donde ve (sifmy + s/s)? TT TmD Tons — D+ UsE/may* 7m — DI) ‘Como » rata vez es un entero, lo redondeams al mimero entero menor mis cercano. BI ‘estimado anterior de los grados de libertad se denomina aproximacién de Satterthwaite (Satterthwaite, 1946, en la bibliografia. Con el estadistico 7’, escribimos P(taj2 <7!

También podría gustarte