Está en la página 1de 53
Capitulo 9 Problemas de estimaci6n de una y dos muestras 9.1 Introduccién En los capitulos anteriores destacamos las propiedades del muestreo de 1a media y de 1a varianza muestrales, También destacamos las representaciones de datos en varias for- mas. El propésito de estas presentaciones es establecer las bases que permitan a los es- tadisticos sacar conclusiones acerca de los parimetros de poblaciones tomadas de datos experimentales. Por ejemplo, el eoxema del Iimite centeal brinda informacién sobre la distribucién de la media muestral X. La distibucién incluye la media de la poblacisn p Por consiguiente, cualesquicra conclusiones respecto a jz, extraidas de un promedio imuestral observado, deben depender de lo que se sabe acerca de su distibuciéa mues- tral, Se podria decir algo similar en lo que se refiere a $* y o%, Como es evidente, es muy probable que cualquier conclusién que saquemos acerca de la varianza de una distribu- ‘cién normal implique la distribucién muestral de S' En este capitulo comenzaremos por presentar de manera formal el propésito de 1 inferencia estadistica, Continuaremos con el andlisis del problema de la estima- cin de los parémetros de la poblacién. Restringiremos nuestros desarrollos formales de los procedimientos de estimacién especfficos a problemas que impliquen una y dos rauesteas 9.2 Inferencia estadistica En el capitulo 1 presentamos la filosoffa general de la inferencia estadistica formal. La inferencia estadistica consta de los métodos mediante los cuales se hacen inferencias 0 sciones acerca de una poblacién, La tendencia actual es distinguir entre el mé- 6n de un parémetro de la poblacidn, donde las inferencias se ‘basan estrictamente en informacién obtenida de una muestra aleatoria seleccionada de la poblacién, y cl método bayesiano, cl cual utiliza cl conocimiento subjetivo que ya se posee sobre la distibucién de probabilidad de los pardmetos desconocides junto con la informacién que proporcionan los datos de la muestra, En la mayor parte de este capstu- lo utilizaremos los métodos clisicos para estimar los pardmetros de La poblacién desco- rnocidos, como la media, la proporeisn y la varianza, mediante el cilculo de estadisticos «de muestras aleatorias y la aplicacién de la teoria de la distribuciones muestrales, gran 265 266 9.3 Capitulo 9 Problemas de estimacisn de una y dos muestras parte de lo cual se estudis en el capitulo 8, La estimacién bayesiana se analizaré en el capitulo 18, La inferencia estadistica se puede dividir en dos Areas principales: estimacién y pruebas de hipdtesis. Trataremos estas dos dzeas por separado: en este capitulo veremos Ia teoria y las aplicaciones de la estimacisn, y en cl capitulo 10 revisaremos la prueba de hipécesis. Para distinguir claramente un érea de la otra, considete los siguientes ejemplos. ‘Un candidate a un cargo pablico podrfa estar interesado en estimar la verdadera proporcién de votantes que lo favorecerin mediante la obtencién de las opiniones de una muestra aleatoria de 100 de ellos. La parte de votantes en la muestta que favorecersin al candidato se podria utilizar como un estimada de la verdadera proporcién en la poblacién de votan- tes. El.conocimiento dela distribucién muestral de una proporcién nos permite establecer cl grado de exactitud de ta estimado, Este problema cae en el rea de Ia estimacién, Considere ahora cl caso de alguien & quien le interesa averiguar sila marca A de cera para piso es mas resistente al desgaste que la marca B. Se podria planteat la hip6tesis de {que Ia marca A es mejor que la marca B y, después de la prueba adecuada, aceplar 0 re- chazar dicha hip6tesis, En este ejemplo no intentamos estimar un parsimetto, sino legar ‘a una decisién correcta acerca de una hipétesis planteada previamente, Una vex mis, dependemos de la teoria del muestreo y de utilizar datos que nos proporcionen alguna ‘medida del grado de exactitud de nuestea decisién, Métodos de estimacién clasicos La estimacign puntual de algsn parémetro de Ia poblacién @ ¢s un solo valor 6 de un extadistico ©. Por ejemplo, el valor T del estadisico X, que se calcula a parti de una muestra de tamaio n, es una estimacién puntual del parimetro de la poblacién De manera similar, p= x/n es una estimacin puntual de la verdadera proporcign p para un experimento binomial No se espera que un estimador logreestimar el parémetzo de Ia poblacin sin error. No se espera que Xestime j con exacttud, lo que en realidad se espera es que no esté ‘muy alejada. Para una muestra especffica, Ia manera en que se podria obtener un estima- ddo mas eercano de gt es tlizando la mediana de Ia muestra X como estimador. Consi- dete, por ejemplo, una muestra que consta de los valores 2,5 y 11 de una poblacign cuya ‘media es 4 lacus, supuestamente, se desconoce. Poiamos estimar para que sea ¥ = 6 usando la media muesual como auesuo estimado, o bien, # = 5 vulizando la mediana ‘muestra En este caso el esimador X produce una estimaci6n ms cercana al pardimetio verdadero que la que produce el estimador X”. Por otro lado, si nuestra muestra aleatoria contiene los valores 2, 6 y 7, entonces ¥ = Sy # = 6, de manera que el mejor estima- dor es %. Cuando no conocemos el valor real de ps, lenemos que comenzar pot decidir ue estimador iilizaremos, si X-0 X Estimador insesgado {Cafes son las propiedades que una “buena” funcién de decisién deheria tener para Poder infuir en nuestra eleceiin de un estimador en vez de otro? Sea © un estmador tayo valor es una estimaciGn puntual de alga pardmeto de la poblacién descono- cide 8 Sin duda deseariamos que la dstribucién muestra de © tuviera‘una media igual, Sl pardmero estimado. Al estimador que tuviera esta propiedad se le lamatia estimador insesgado 9.3 Métodos de estimacién clasicos 267 Definician 9.1 Se dice que un estadistco © es un estimador insesgado del parimetro 0 si Ha = E(8) = 0. Ejemplo 9.1; |Demuesire que S* es un estimador insesgado del parimetro o* ‘Soluci6n: En la seccién 8.5, en la pagina 244, demostramos que Ye =) = ex, = 19? = nck =? Entonces, Por Io tanto, 4 Aunque Ses un estimador insesgado de 0, S, por otro lado, suele ser un estimador sesgado de oF, un sesgo que en el caso de muestras grandes se vuelve insignificante, Este ejemplo ilustra por qué dividimos entre n ~ 1 en vez de entce n cuando estimamos la Varianza de un estimador puntual Definicién 9.2: Si, y 8, son dos esimadoresinsesgas del mismo pardmetro de la poblacin 0, de- seams ele el estimadorcuya stibacién muestal tenga lamer varanza, Pot lo tanto, si oO, < oj. decimos que ©, es un estimador mis eficaz de @ que ©, Si consideramos todos los posibles estimadores insesgados de algin pardmetso 0, al gue tiene Ia menor varianza lo llamamos estimador més eficaz de 8, En la figura 9.1 seilustran ls distibuciones muestrales de tes estimadoresdiferen- tes 6,6, y ©, todos para 0, Fs evidente que solo ©, y ©, no son sesgados, ya que sus dlistibuciones esti centradas en 8, El estimador ©, tiene una varianza menor que ©, por lo tanto, es més eficaz, En consecuencia el estimador de @ que elegtfamos, entre los tres que estamos considerand, seria ©, ~_ Para poblaciones normales e puede demostar que tanto X como X son estimadores insesgados de la media de la poblaci6n 1, pero la varianza de X es més pequefia que la varianza de X. Por consiguiene, los estimados 7 y ¥ serén, en promedio, iguales a 268 Capitulo 9 Problemas de estimacisn de una y dos muestras Figura 9.1: Distribuciones muestrales de diferentes estimadores de 8, Ja media de la poblacidn 1, aunque podria ser que J esté més cerea de yu para una mues- ‘ra dada y, por lo tanto, que X sea mas eficaz que X. Estimacién por intervalo Interpretacién de las estimac Posi sor que nicl esiador insesgado més eles estime con exactitud el parimetro de la poblacién, Es cierto que la exactitud de Ia estimacién aumenta cuando las muesteas son grandes; pro incluso asf no tenemos razones para esperar que una estimacién pun- tual de-una mivesta dada sea exactamente igual al parimetro de la poblacién que 3= supone debe estimar. Hay muchas situaciones en que es preferible deteminar un inter- valo dentro del cual esperarfamos encontrar el valor del parémetro, Tal intervao se co- noce como estimacién por interval, ‘Una estimacién por intervalo de un pardmeto de la poblacién @ es un intervalo de Informa 6, < 0 < Oy, donde 6,y 6, dependen del valor del estadistico © para una mves- tra specifica, y también de la distibucién de muesteo de ©. Por ejemplo, ana muestra Aeatoria de calificaciones verbales de la prucha SAT para estudiantes universitarios de primer afo produciria un intervalo de 530 a 550, dentro del cual esperamos encontrar cl promedio verdadero de todas las calificaiones verbales de la prueba SAT para ese gru- po. Los valores de los puntos extremos, 530 y 550, dependerén de la media muestal calculada 7 y de la distibucién de muesteo de X. A medida que aummenta el amano de la muestra, sabemos que a3 = o°/n disminuye y, en consecuencia, abe la posibilidad dle que nuestra estimacién se acerque ms al parsimetro plo cual darfa como resultado ‘un inervalo mds corto, De esta manera, el inervalo de la estimacién indica, por su lon- fied, Ia precisi6n de la esimacién puntual. Un ingeniero abtendef informacicn acerca de In proporcién de la poblacin de artiulos defectuoses tomando una muestra y cal- culando la proporcién muestal defectuosa sin embargo, una estacin por intervalo podria ser més informativa nes por intervalo ‘Como muestas distntassuelen producit valores diferentes de © y, por lo tanto, valores diferentes de 6, y 6, estos puntos extremes del intervalo son valores de las variables alestorias coméspondientes 8, y ©,. De la distibucién muestal de © sexemos capaces de doterminar ©, y 6, de manera que (Or < @ < Gx) sea igual a cualquier 9.4 Una sola muestea: estimacién de la media 269 valor positivo de una fraccién que queramos especies. Si, por ejempl, caleulames 6 Ty 6,, tales que PO, <0< 8p) para 0 < ar< I, tenemos entonces una probablidad de I~ de seleccionar una muestra Aleatoria que produzca un intervalo que contenga 8. El intervalo 6,< #< 6, que 3¢ calcula a partir dela muestra seleccionada,se llama entonces intervalo de conflaniza del 100(1 ~ a)% la faceién 1 ~ ar se denomina eoefciente de confianza o grado de con- fianza,y los extremos, 6, y 6, se denominan limites de confianza inferior y superior Asi, cuando «= 0.05, tenemos un inervalo de confanza del 95%, y cuando a= 0,01 ‘obtenemos un intervalo de confianza més amplio del 99%. Cuanto més amplio sea el inervalo de contin, mds confiaremos en que contiene el pardmetro desconocido Desde luego, ¢s mejor tener un 95% de confianza en que la vida promedio de cierto ‘eansistor de un televisor esté ene los 6 y los ?aiios, que tener un 99% de confianza en ‘que ext6 entre los 3 y Tos 10 fos, De manera ideal, preferimos un intervato corto con un grado de confianza alto, Algunas veces las resrigeiones en el tamafo de nuestra muestra ‘os impiden tener intervaloscortos sin sactificat cierto grado de confanza, las siguienes seccionesestudiaremos los concepts de estimacién puntual y por intervals, yen cada secci presentaremos un caso especial diferente. E lector deberta notar que, aunque la estimaciGn puntual y por intervalos tepresentan diferentes aproxi- maciones para oblener informacién respecto a un parmeto, estén relacionadas debido ‘que los estimadores del intervato de confianza se basan en estimadores puntuales, En la siguiente secei6n, por ejemplo, veremos que Xes un estimador puntual de pe muy razonable. Como resultado, cl importante estimador del intervalo de confianza de jt depend del conocimiento de la dstibucién muestral de X Empearemos a siguiente secci6n con el caso més sencllo de un intervalo de con- fianza, en donde el escenario es simple pero poco reslista. Nos interesa estimar una media dela poblacién p cuando o todavia se desconace. Evidentemente, x se desconoce jes may improbable que se conozea a. Cualquierinformacién histérica que produzca datos suliients para perma suponer que se conoce o probablement habria producido informacion similar acerca de pl. A pesar de este argumentoiniciamos con este caso porque los conceptos y los mecanismos resultantes asociados con Ia estimacién del intervalo de confanza también estarén asociados con las stuaciones més realistas que presentaremos més adelante en la seccién 9.4 y ls siguientes 9.4 Una sola muestra: estimacién de la media La distribucién muestral de X est4 centrada en pt y en la mayorfa de las aplicaciones la varianza es més pequefia que la de cualesquiera otros estimadores de 4, Por lo tanto, se utilizard la media muestral £ como una estimacién puntual para la media de la poblacién . Recuerde que oj =<'/n, por lo que una muestra grande produeité un valor de X procedente de una distribucién muestral con varianza pequetia. Por consiguicate, es pro- ‘able que ¥ sea una estimacién muy precisa de p cuando n es grande. Consideremos ahora la estimacién por inlervalos de j1. Si seleccionamos nuestra muestra a partir de una poblacién normal o, a falta de ésta, sin es suficientemente grat de, podemos establecer un intervalo de confianza para 1 considerando la distribucisn rmuestral de X. 270 Capitulo 9 Problemas de estimacisn de una y dos muestras De acuerdo con el teorema del limite centtal, podemos esperar que la disuibucién muestral de X esté distribuida de forma aproximadamente normal con media jlg=t y AlesviaciGn estindar oy = c/n Al escribir 2, pasa el Valor? por auiba del cual encontramos una érea de a/2 bajo la curva normal, en la figura 9.2 podemos ver que P(-taj2 30, en las que la forma de las distribuciones no esté muy sesgada, Ia teo- ria de muestreo garantiza buenos resultados. — ‘Queda claro que los valores de Ias variables aleatorias ©, y @,,, las cuales se defi- injeron en la seccién 9.3, son los limites de congianza 4, a: y by =F 420 Ve Mostes difrones robin valers diferentes dey, po la tans, producti dife- Tentes estimaciones por intervals de parimeto como se muestaenf hgura.3. Los puntos enc ento de cada intrvao indian Ia possi de Ia estimacidn punta? para ada mucsraleatora, Observe que todos los intervals tienen el mismo ancho, pues esto depende sole dela eleccin de, na Yez que se determina F. Cuanto mis grande seal valor de 7, queljamos. mas'anchesharemes toes os intervales,Y podtemos tencr mas confatea en que Ia musta particular que sleccionemes producré un ine fate que contenga el paimetto desconocioj. Bn general, para ana eletci6a de 100(1 0) % dels intervalos contends Mucstea Figura 9.3: Estimaciones por intervalos de jz para muestzas diferentes. Ejemplo 92:1Se encuentra que la concentracién promedio de zinc que se obtiene en una muestra de Solucién: ediciones en 96 sitios diferentes de un rio es de 2.6 gramos por mililitro. Caleule los intervalos de confianza del 95% y 99% para la concentracién media de zinc en el rfo Suponga que la desviacién estindar de la poblacidn es de 0.3 gramos por mililitr Laestimacién puntual de jes ¥ = 2.6. Bl valor z que deja una drea de 0,025 a la derecha y, por lo tanto, una area de 0.975 a la izquierda es z,,.. = 1.96 (véase la tabla A.3). En consecuencia, el intervalo de conflanza del 95% es (23) 2.6~ (1.96) 7) << 26+ (1.96) Vie. 2m ‘Teorema 9.1 Teorema 9.2: Capitulo 9 Problemas de estimacisn de una y dos muestras que se reduce a 2.50 < p< 2.70, Paracalcular un intervalo de confianza del 99% encon- ‘amos el valor z que deja una érea de 0.005 a la derecha y de 0.995 a la izquierda. Por Jo tanto, usando la tabla A.3 nuevamente, Z,,,. = 2.575 y el intervalo de confianza de 99% es as as (2) 30 para propor- ccionat una estimacién de o, Después, usando s como aproximacién para o en el teore- ‘ma 9.2, podemos determinar aproximadamente cuéntas observaciones necesitamos para brindar el grado de precisién deseado, Ejemplo 9.3: 1 {Qué tan grande debe ser la muestra del ejemplo 9.2 si queremos tener 95% de confian- Solucion: za en que nuestra estimacién de j1 diferia por menos de 0.057 La desviacién esténdar de la poblacidn es o = 0.3, Entonces, por medio del teorema 9.2 2.96(0.3) 005 ] = Por lo tanto, podemos tener 95% de confianza en que una muestra aleatoria de tamaio 139 proporcionard una estimacién ¥ que diferiré de jen una cantidad menor que 0.05. Limites de confianza unilaterales Los intervalos de confianza y los limites de confianza resultantes que hasta ahora hemos analizado en realidad son bilaterales, es decir, tienen limites superior e inferior. Sin em- Dargo, hay muchas aplicaciones en las que s6lo se requiere un limite. Por ejemplo, si a ‘un ingeniero le interesara determinar una medida de resistencia a Ia tensién, la informa- ceién que més le ayudaria a lograr su objetivo serfa la del limite inferior, ya que éste indi- cea el escenario del “peor caso”, es decir, el de la menor resistencia, Por otro lado, si se buscara determinar una medida para la cual un valor de je relativamente grande no fuera redituable o deseable, entonces la medida que resultara de interés seria la del limite de ‘confianza superior. Un ejemplo en el que la medida del limite superior seria muy inf ‘mativa es el caso en el que se necesita hacer inferencias para determinar la composicién media de mercurio en el agua de un ri. Los limites de confianza unilaterales se desarrollan de la misma forma que los inter- valos bilaterales. Sin embargo, la fuente es un enunciado de probabilidad unilateral que utiliza el teorema del limite central fap ) p(X-# c2,) = (ie Entonces, es posible manipular el enunciado de prohabilidad de forma muy similar 8 ‘como se hizo anteriormente para cbtener P(s> X ~2a0/Vn) = Una manip similar de? (E<8 > —2,) = Puck + coh = Como resultado, se obtinen los siguientes Hiitesuniaterales superior e inferior Limites de confianza vniaterales de jo cuando SiX es Ia media de una muestra aleatoria de tamafo ma partir de una poblacién con varianza @°, los limites de confianza unilaterales del 100(1 — a)% para son dados por limite unilateral superior: ¥ + 240/ fi elvalorde o* __Mimite unilateral inferior: —2ao/yh 214 Capitulo 9 Problemas de estimacisn de una y dos muestras Ejemplo 9.4:] En un experimento de pruebas psicolégicas se seleccionan al azar 25 sujetos y se miden Solucién: sus tiempos de reaccién, en segundos, ante un estimulo particular: La experiencia sugie~ ze que la varianza en los tiempos de reaccién ante los diferentes tipos de estimulos es de 4.3%y que la distribucién del tiempo de reaccién es aproximadamente normal. El tiempo promedio para los sujetos fue de 6.2 segundos. Calcule un limite superior del 95% para cl tiempo medio de reaccién, Lo que da el Iimite superior del 95% es Fb 2qa/Yi = 62 + (1.645) VFB = 62 + 0.658 6.858 segundos. En consecuencia, tenemos un 95% de confianza en que el tiempo promedio de reaccién ce menor que 6.858 segundos 4 El caso en que se desconoce o Con frecuencia debemos tratar de estimar Ia media de una poblacién sin conocer la va- rianza. El lector deberia recordar que en el capitulo 8 aprendié que, si tenemos una -uestza aleatoria a patir de una distribucién normal, entonces la variable aleatoria, Xap STV tiene wna distibucién ¢ de Student con n—1 grados de bert. Aqui Ses In desvincién estindar de a muestra. En esta situacda, en la que se desconoce a, se pucde wlizar T para construc un intervalo de confianza para. El procedimiento es igual que cuando onoce a, sélo que en este caso a se reemplaza con $y Ia dstibucién normal estdndar se reemplaza con la distubucién Sinos remitimos ala figura 9.5, podemos afimnar que Plrtayr 30, «se puede reemplazar con s para poder wilizar clintervalo de confianza Rt ta ve ‘A menudo se hace referencia a esto como un intervalo de conflanza para una muestra ‘grande. La justificacién para esto reside s6lo en la presuncién de que, con una mues- ia tan grande como 30 y una distribuci6a de la poblacién no muy sesgada, s estars muy cerca de la o verdadera y, de esta manera, el teorema del limite central continuard siendo vilido, Se deberfa destacar que esto es sélo una aproximacién y que Ia calidad de los resultados mejora a medida que aumenta el tamaio de la muestra. Tjemplo 9.621 Se obtienen las calificaciones de mateméticas del Examen de Aptitudes Escolares (SAT, Solucién: por sus siglas en inglés) de una muestra aleatoria de 500 estudiantes del sitimo aio de preparatoria del estado de Texas. Se calculan la media y ta desviacién esténdar muestra- les, que son SO1 y 112, respectivamente. Calcule un intervalo de confianza del 99% de la calificacién promedio de mateméticas en cl SAT para los estudiantes del sitio ao de preparatoria del estado de Texas. ‘Como el tamaio de la muestra es grande, es razonable utilizar Ia aproximacién normal. Si utilizamos la tabla A.3, encontramos z,,.. = 2.575. Por lo tanto, un intervalo de con- fianza del 99% para pes 501 + 2.515) (=) que da como resultado 488.1 < ju < 5139, 4 501 + 12.9, 9.5 Error estandar de una estimacién puntual Hicimos una distineién muy clara entre los objetivos de las estimaciones puntuales y las cestimaciones del intervalo de confianza. Las primeras proporcionan un solo nmero que se extrae de un conjunto de datos experimentales,y las segundas proporcionan un inter- valo razonable para el parimetro, dados los datos experimentales; es decir, 100{1 —a)% de tales intervalos que se calcula “cubren'” el parimetso, Estos dos métodos de estimacién se relacionan entre sf. El elemento en comin es la distribucién muestral del estimador puntual. Considere, por ejemplo, el estimador X de cuando se conoce 0” Indicamos antes que una medida de la ealidad de un estimador insesgado es su varianza, La varianza de X es =e 9.6 Intervalos de prediceién 277 De esta forma, la desviacién estindae de X o error estndar de Res a/fn. En érminos simples, el error estindar de un estimador es su desviacién estindar, Para el caso de ¥ el limite de confianza que se calcula ¥ + 2uj2—Z se escribe como F + 24/2 6.0. (8) ve donde “ee.” es el error estindar. Fl punto importante es que el ancho de! intervalo de cconfianza de jz depende de la calidad del estimador puntual a través de su error estindar. Enel caso en que se desconoce o y Ia muestra proviene de una distribucién normal, sreemplaza aa y se incluye el error esténdar estimado S/n. Por consiguiente, los mites de confianza de p1 son: Limites de confianza para p ewando se desconoce o° f bly Sp at thay ee) De nuevo, el intervalo de confianza no es mejor (en términos de anchura) que la calidad de la estimacin puntual, en este caso a través de su error estindar estimado. A menudo el software de computacién se refiere a los errores estindar estimados simplemente ‘como “errores estindar ‘A medida que avanzamos a intervalos de confianza més complejos, prevalece el cconcepto de que el ancho de los intervalos de confianza se acorta cuando mejora la cali- ddad de la estimacién puntual correspondiente, aunque no siempre es tan sencillo como aqut se ilustra. Se puede argumentar que un intervalo de confianza es tan sélo una am- pliacién de la estimacidn puntual para tomar en cuenta la exactitud de dicha estimacién. 9.6 Intervalos de prediccién La estimacién puntual y la estimacién por intervalos de la media que se expusieron en las secciones 9.4 y 9.5 proporcionan buena informacién del parmetro desconocid jt de una distribucién normal, o de una distribucién no normal a partir de la cual se toma uuna muestra grande. Algunas veces, ademés de la media de la poblacién, el experimen- tador podria estar interesado en predecir el valor posible de una observacién futura Por ejemplo, en el contvol de calidad el experimentador podsia necesitar wilizat los datos dobservados para predecir una nueva observaci6n. Un proceso de manufactura de una pieza de metal se podria evaluar basdndose en si la pieza cumple con las especificaciones de resistencia a la Censién. En ciertas ocasiones un cliente podrfa estar interesado en ‘comprar una sola pieza, En este caso un intervalo de confianza de la resistencia media 2 Ja tensi6n no cubrirfa la informacién requerida. Bl cliente necesitarfa una aseveracién respecto a la incertidumbre de una sola observacién. Este tipo de requerimicnto se sa- lisface muy bien construyendo un intervalo de prediccién, Es muy sencillo obtener un intervalo de prediccién para las situaciones que hemos cconsiderado hasta el momento, Suponga que la muestra aleatoria se tomé de una pobla- ccién normal con media ps desconocida y varianza a* conocida. Un estimador puntwal natural de una nueva observacida es X. En la seccién 8.4 se aprendis que la vatianza de X es 0%/n, Sin embargo, para predecir una nueva observacién no basta con explicar Ia variacién debida a la estimacién de Ja media, también tendriamos que explicar la varia~ cidn de una observacién futura, A partir de la suposicién sabemos que la varianza del 218 Capitulo 9 Problemas de estimacisn de una y dos muestras error aleatorio en una nueva observacién es o?, El desarrollo de un intervalo de predic ign se representa mejor empezando con una variable aleatoria normal s, — Z, donde s, cs la nueva observacidn y ¥ se toma de la muestra, Como x, y ¥ son independientes, bbemos que JP+O In altsiyn ces n(z; 0,1), Como resultado, i uilizamos el enunciado de probabilidad Pl-tajn $2 < tqjs)= 1a con el estadistico < anterior, y si colocamos x, en el centro del enunciado de probabili- dad, tenemos que la probabilidad de que ocurra el siguiente evento es I ~ a Fea. aV/TF Mh < x9 <¥ + 20201 FR ‘Como resultado, el intervalo de predicci6n caleulado se formaliza como sigue Tntervalo de prediceién para una observacién furara cuando se ara una distribucién normal de mediciones con media jt desconocida y varianza 07 conocida, un intervalo de prediccién del 100(1 — a)% de una observacién futura x, es to OVTF Tn < xy <2 t2qaVvT> ym, sel valor z que deja una érea de 7/2 a la devecha ‘mplo 9.71 Debido a la disminucién en las tasas de interés el First Citizens Bank recibié muchas Solucin: solicitudes para hipoteca. Una muestra reciente de $0 créditos hipotecarios dio como resultado un promedio en Ia cantidad de préstamos de $257,300. Suponga una desvia- ci6n estindar de Ia poblacién de $25,000. En el caso del siguiente cliente que lena una solicitud de crédito hipotecatio calcule un intervalo de predicei6n del 95% para la canti- dad del erédito, La prediccién puntual de la cantidad del crédito del siguiente cliente es ¥ = $257,300. EL valor 2 aqui es 2,,., = 1.96. Por lo tanto, un intervalo de predicei6a del 95% pata la cantidad de un crédito futuro es 257, 300 — (1.96)(25,000) /T+1]50 2e, 9.38 Compare S* y $* (véase el jercicio 9.29), los dos esimadores de a”, para determinar cusl es més ef- ceaz. Suponga que ests estimadares se obtienen usando Ny, Nyoor Ny las vatiables aleatorias independientes de tls fio), {Cudl es el estimador mis eficaz si se consi- era slo la varianza de los estimadores? [Sugerencta: Utlice el teorema 8.4 y el hecho de que la varianza de X¢ es 2v, de la secci6n 6:7] 934 Considere el ejercicio 9.33. Uillice el EME que 6 estudi6 nel ejercicio 9.28 para determinas qué esi- amador es més eficaz. Escriba EME (S") EME (S*) 9.8 Dos muestras: estimacién de la diferencia entre dos medias Si tenemos dos poblaciones con medias #, y 1, y varianzas a y 0, respectivamente, elestadistico que da un est dor puntual de la difer cia entze py 1, es X, — X, Por To tanto, para obtener una estimacién puntual de f1, ~ .,, se seleceionan dos muestras aleatorias independientes, una de cada poblacién, de tamatios n, y n,.y se calcula ¥, — la diferenciade las medias muestrales. Evidentemente, debemos consideras la distibu- ign muestra de X, — X, De acuerdo con el teorema 8.3, podemos esperar que la distribucién muestral de X, — X,esté distribuida de forma aproximadamente normal con media ply, = Vat /n, +03/m. Por lo tanto, podemes asegurar, y'desviacién estindar o,_ mm ‘con una probabilidad de I'— @, que la Variable normal estindar ccaerd entre -2, (= ¥2) = =m) votim + a3 /n2 Si nos remitimos una vex mis ala figura 9.2, eseribimos P(-2aj2 AA susttuir 5} en el estadistico 7, obtenemos la forma menos engorrosa: X= Xa) = hs =o: SpVGfnny + Ofna) Si usamos el estadtstico 7, eenemos Pltays #, con poco riesgo de incurrir en un ertor. Asi, en el ejemplo 9.11 tenemos un 90% de coniianza en que el intervalo de 0.593 a 1,547 comtiene la diferencia de las medias de la poblacién para valores del indice de diversidad de especies en las dos ‘estaciones. El hecho de que ambos limites de confianza sean positives indica que, en promedio, el indice para laestacidn que se localiza corriente abajo del punto de descarga ‘es mayor que el indice para la estacién que se localiza corriente arriba, Muestras de tamaiios iguales El procedimiento para construirintervalos de confianza para pt, j,cuando 0, = 0, pero ésta se desconace, requiere suponer que las pablaciones son normales, Desviacio- rs ligeras de la suposicién de varianzas iguales o de normalidad no alteran seriamente el grado de confianza en nuestro intervalo. (En el capitulo 10 se estudia un procedimiento para probar la igualdad de dos varianzas poblacionales desconocidas con base en Ia in- formacién que proporcionan las varianzas muestrales). Si las varianzas de la poblacién son considerablemente diferentes, ain obtenemos resultados razonables cuando las poblaciones son normales, siempre y cuando n, = n,. Por lo tanto, al planear un experi- ‘mento se deberfa hacer ua esfuerzo por igualar el tamaio de las muestra. Varianzas desconocidas y distintas ‘Consideremos ahora el problema de calcula el estimado de un intervalo de pz, ~ 1, cuando ro es probable que las varianzas de la poblacién desconoidas sean iguales. Hl estadistico ‘que se utiliza con mayor frecuencia en este caso es MSE Im) + (S3/may {que tiene aproximadamente una distribucién t con v grados de libertad, donde ve (sifmy + s/s) TT Tm* ons — D+ sE/may* 7m — DI) ‘Como » rata vez es un entero, lo redondeamos al mimero entero menor més cercano. Bl cestimado anterior de los grados de libertad se denomina aproximacién de Satterthwaite (Satterthwaite, 1946, en la bibliografia. Con el estadistico 7’, escribimos Pltaj2 <7!

También podría gustarte