Está en la página 1de 14
TA 260 Estimacion de paradmetros PLAN GENERAL DEL CAPITULO 7.1 INFERENCIA ESTADISTICA 73.4 Estimacion bootstrap (cargador iniial) del error estindar 72 MUESTREO ALEATORIO 73 PROPIEDADES DE LOS 73.5 Error cuadrado medio de un estimador ESTIMADORES 7-4 METODO DE MAXIMA VEROSIMILITUD 73.1 Estimadores insesgados 75. DISTRIBUCIONES DE MUESTREO 73.2. Varianza de un estimador puntual 7-6 DISTRIBUCIONES DE MUESTREO DE MEDIAS 73.3. Error estindar: reporte de una estimacién puntual 7-1 INTRODUCCION A LOS INTERVALOS DE CONFIANZA INFERENCIA ESTADISTICA El campo de la inferencia estadistica se compone de los métodos que se utilizan para tomar decisiones o sacar conclusiones acerca de una poblacién. Estos métodos emplean la informa- cién contenida en una muestra de la poblacién para sacar conclusiones (véase la figura 7-1, donde se muestra la relacién entre una poblacién y una muestra). En este capftulo se inicia el estudio de los métodos estadisticos que se emplean para hacer inferencias y tomar decisiones. LLainferencia estadistica puede dividirse en dos éreas principales: estimacién de pardmetros y prueba de hipétesis. Como ejemplo de un problema de estimacién de parémetros, suponga {que un ingeniero esta analizando la resistencia a la tensiOn de un componente usado en un chasis, automotriz. Puesto que la variabilidad de ta resistencia a la tensién se encuentra presente MUESTREO ALEATORIO 261 Promedio muestral x “> Desviacién esténdar muestral s Lr 4 Histograma hee eS Figura 7-1 Relacién entre una poblacién y una muestra, de manera natural entre los componentes individuales, debido a las diferencias en los lotes de ‘materias primas, los procesos de manufactura y los procedimientos de mediciGn (entre otros factores), al ingeniero le interesa hacer una estimaci6n de la media de la resistencia a la tensi6n de los componentes, En la préctica, el ingeniero usard datos muestrales para calcular el ntimero ‘que, en cierto sentido, sea un valor (0 una conjetura) razonable de la media real. A este ntime- 10 se le llama estimacién puntual. Mas adelante se verd que es posible determinar la precisi6n de Ia estimaci6n. Considérese ahora una situacién en la que pueden usarse dos temperaturas de reaccién diferentes en un proceso quimico, digamos f, y t,. El ingeniero conjetura que t, produce rendi- mientos més altos que 1,, La prueba de hip6tesis estadfstica es el marco de referencia para resol- ver problemas de este tipo. En este caso, la hip6tesis serfa que el rendimiento medio utilizando Ja temperatura t, es mayor que el rendimiento medio utilizando la temperatura 1,. Obsérvese que no se hace énfasis en la estimacién de los rendimientos; més bien, la atenci6n se centra en sacar conclusiones acerca de una hipstesis propuesta. EI capitulo se inicia con el andlisis de las muestras aleatorias, un concepto clave de la inferencia estadistica, y después se presentan los métodos para la estimacién de pardmetros. Se exponen asimismo algunas de las propiedades més importantes de los estimadores y se indica cémo evaluar la precisién de la estimacién de un pardmetro con un intervalo de confianza, Por ‘iltimo, se concluye con una introduccién a las distribuciones de muestreo, las cuales constitu- yen el fundamento de Jas técnicas para probar hipdtesis y las técnicas para la estimacién de pardmetros que se presentan en los capftulos 8 y 9. 7-2 MUESTREO ALEATORIO En la mayorfa de los problemas de estadistica es necesario usar una muestra de las observaciones de Ja poblacién de interés para sacar conclusiones acerca de la poblacién. Estos conceptos ya se co- ‘mentaron; sin embargo, se presentan ahora las definiciones formales de algunos de estos términos. 262 ESTIMACION DE PARAMETROS sObseryaciones que son motivo de _ | En cualquier problema particular, la poblaci6n puede ser pequefia, grande, pero finita, 0 infinita. Al niimero de observaciones que hay en la poblacin se le llama el tamaiio de la pobla- cién, Por ejemplo, el nfimero de botellas con un Henado incompleto que se producen en un dia en una embotelladora de refrescos es una poblacién de tamaifo finito. Las observaciones obteni- das al medir el nivel diario de monéxido de carbono es una poblacién de tamatio infinito. Es comiin usar una distribucién de probabilidad como modelo de una poblacién. Por ejemplo, un ingeniero de estructuras automotrices podria considerar que la poblacién de resistencias a la tensién de un elemento estructural del chasis sigue ula distribucién normal con media ty varianza 62, Podria hacerse referencia a ésta como una poblacién normal o poblacién distribui- da normalmente. En la mayoria de los problemas de inferencia estadistica es imposible 0 poco préctico ob- servarla poblaci6n completa. Por ejemplo, quizé no se pruebe la resistencia a la tensién de todos los elementos estructurales del chasis porque se necesitarfa una gran cantidad de tiempo y seria costoso. Ademés, algunos (quizé muchos) de estos elementos estructurales atin no existen en el momento de tomar una decisién, por lo que la poblacién debe considerarse, en gran medida, conceptual. Por lo tanto, dependeremos de un subconjunto de observaciones de la poblacién que nos ayude a tomar decisiones sobre 1a poblacién. eT ara que las inferencias sean vélidas, la muestra debe ser representativa de la poblacién. ‘Muchas veces resulta tentador seleccionar como muestra las observaciones que estén mds a la ‘mano 0 ejercitar un juicio para seleccionar una muestra. Estos procedimientos suelen introducir sesgos en la muestra y, como resultado, el parémetro de interés se subestimaré (0 sobreestimard) consistentemente al utilizarla, Ademés, el comportamiento de una muestra dirigida no puede describirse estadisticamente. Para evitar estas dificultades, es deseable seleccionar una muestra aleatoria que resulte de algdn mecanismo de azar. Por consiguiente, la selecciGn de una mues- tra es un experimento aleatorio, y cada observaci6n de la muestra es el valor observado de una variable aleatoria. Las observaciones que hay en la poblacién determinan la distribucién de probabilidad de la variable aleatoria. Para definir una muestra aleatoria, sea X una variable aleatoria que representa el resultado dde una selecci6n de una observacién de la poblacién. Sea que f(x) denote la funcién de densidad de probabilidad de X. Suponga que cada observacién de la muestra se obtiene de manera indepen- diente, bajo las mismas condiciones. Es decir, las observaciones para la muestra se obtienen MUESTREO ALEATORIO. 263 observando X de manera independiente y bajo condiciones sin cambios, digamos, n veces. Sea que X, denote la variable aleatoria que representa la repetici6n i. Entonces X,, X,, ... X, consti- tuyen una muestra aleatoria y los valores numéricos obtenidos se denotan como x, Xp.» Xp Li variables aleatorias de una muestra aleatoria son independientes y tienen la misma distribucién de probabilidad f(x) debido a las condiciones idénticas bajo las cuales se obtiene cada observa- cién, Es decir, la funcién de densidad de probabilidad marginal de X,, X5,... X, €8,f(%), fla), « ‘(%,), respectivamente, y por la independencia, la funci6n de densidad de probabilidad conjunta dde la muestra aleatoria €5 fyzyp xq (%1» 25-0» %y) = fl) fl) «fl _, Las variables aleatorias (X), Xp.» X,) Sof Jas X; son variables ‘leatorias independiest 4 *ci6n de probabilidad. ek y Oye Para ilustrar esta definici6n, suponga que’se esté investigando la vida de servicio efectivo de un componente electrénico usado en un marcapasos cardiaco y que la vida del componente esté distribuida normalmente. Se esperaria entonces que cada una de las observaciones de la vida del componente X,, X,,... X,, €n una muestra aleatoria de n componentes, sea una variable aleatoria independiente con exactamente la misma distribucién normal. Después de recabar los datos, los valores numéricos de la vida itil observada se denotan como 555.» X, El objetivo principal al tomar una muestra aleatoria es obtener informacién acerca de los pardmetros desconocidos de la poblacién. Suponga, por ejemplo, que se quiere Hegar a una conclusién acerca de la proporcién de la poblaciGn de Estados Unidos que prefiere una marca de refresco particular. Sea que p represente el valor desconocido de esta proporcién. No es préctico preguntarle a cada individuo de la poblacién para determinar el valor real de p. Para hacer una inferencia respecto a la proporcién real p, un procedimiento més razonable seria seleccionar tuna muestra aleatoria (de un tamafio apropiado) y usar la proporcién observada j de las per- sonas de esta muestra que prefieren la marca de refresco. La proporcién muestral, j , se calcula dividiendo el mimero de individuos de la muestra que prefieren la marca de refresco entre el tamaiio total de la muestra n. Por tanto, es una funcién de los valores observados en la muestra aleatoria. Puesto que es posible seleccionar muchas muestras de una poblacién, el valor de ji variaré de una muestra a otra. Es decir, jes una varia- ble aleatoria. A esta variable aleatoria se le llama estadistico. faciones de una muestra aleatori Nos hemos encontrado ya con estadisticos. Por ejemplo, si X,, Xp, ... X, es una muestra aleatoria de tamafio 1, entonces la media muestral X, la varianza muestral S*, y la desviacién 264 ESTIMACION DE PARAMETROS estindar muestral S son estadisticos. Estos estadisticos se usan ampliamente en el proceso de sacar conclusiones acerca de poblaciones con base en datos muestrales. Puesto que un estadistico es una variable aleatoria, tiene una distribucién de probabilidad. A la distribucién de probabilidad de un estadistico se le lama distribucién de muestreo. El concepto de distribucién de muestreo es muy importante y se revisaré y ejemplificaré més ade- Jante en este capitulo. Una aplicacién muy importante de los estadisticos es para obtener estimaciones puntuales de par4metros tales como la media poblacional y la varianza poblacional. Cuando se analizan problemas de inferencia, es conveniente tener un simbolo general que represente el parémetro de interés. Se usard la letra griega 6 (theta) para representar el parémetro, El objetivo de una estimaci6n puntual es seleccionar, con base en los datos muestrales, un solo némero que sea el valor més recomendable de 9. Se usar4 el valor numérico de un estadistico muestral como la cestimacién puntual. En general, si X es una variable aleatoria con distribucién de probabilidad f(x), caracteriza- da por el pardmetro desconocido @, y si X,, X,, .., X, es una muestra aleatoria de tamafio n de X, entonces al estadistico @ = h(X,, Xqy » X,) Se le llama un estimador puntual de 0. Obsérvese que 6 es una variable aleatoria, ya que es una funcién de variables aleatorias. Después de selec cionar la muestra, © toma un valor numérico particular @ llamado la estimacién puntual de @. Tay | el Valor numérico particu- Como ejemplo, suponga que la variable aleatoria X tiene una distribucién normal con una ‘media desconocida 1. La media muestral es un estimador puntual de la media poblacional des- conocida pL. Es decir, i= X . Después de seleccionar la muestra, el valor numérico X es la esti- macién puntual de 1. Por tanto, si x, = 25, x, = 30, x, = 29, y x,= 31, entonces la estimacién puntual de jt es +3042 4 De manera similar, si la varianza poblacional 6? también es desconocida, un estimador puntual de 6? es la varianza muestral S*, y al valor numérico s? = 6.9, calculado a partir de los datos muestrales, se le lama la estimacién puntual de 0”. En la ingenierfa son comunes los problemas de estimacién. Con frecuencia es necesario estimar: + La media 1 de una sola poblacién. + La varianza 0? (o la desviaci6n estdndar 6) de una sola poblacién. + La proporci6n p de elementos de una poblacién que pertenecen a una clase de interés. * La diferencia en las medias de dos poblaciones, [ty ~ Hy. + La diferencia en las proporciones de dos poblaciones, p, ~ p,- = 28.75 PROPIEDADES DE LOS ESTIMADORES 265 Estimaciones razonables de estos pardmetros son las siguientes: + Para p, la estimacién es i = X , la media muestral. + Para 0, la estimacién es 6? = 5°, la varianza muestra. + Para p, la estimacién es =.x/n, la proporcién muestral, donde x es el ntimero de elemen- tos de una muestra aleatoria de tamafio n que pertenecen a la clase de interés. + Para [1, ~ jy Ia estimacién esfi, ~fi, = ¥, —¥,,, la diferencia entre las medias mues- trales de dos muestras aleatorias independientes. + Para p, ~ py la estimacién es, ~ p, . Ia diferencia entre dos proporciones muestrales calculadas a partir de dos muestras aleatorias independientes. Puede haber varias opciones diferentes para el estimador puntual de un parémetro. Por ejemplo, si quiere estimarse la media de una poblacién, podrian considerarse como estimadores puntuales la media muestral, la mediana muestral o quizé el promedio de las observaciones menor y mayor de la muestra. Para decidir cudl de los estimadores puntuales de un pardmetro particular es el més adecuado, es necesario examinar sus propiedades estadisticas y desarrollar algunos criterios para comparar estimadores. 7-3. PROPIEDADES DE LOS ESTIMADORES 7-3.1 Estimadores insesgados Un estimador deberd estar en algtin sentido “cerca” del valor real del parémetro desconocido, En términos formales, se dice que © es un estimador insesgado de @ si el valor esperado de © es igual a 0. Esto es equivalente a decir que la media de la distribucién de probabilidad de © (0 la media de la distribucién de muestreo de 6) es igual a 6. El estimador puntual 6 es un éstimador Cuando un estimador es insesgado, el sesgo es cero; es decir, (6) - 6 = 0. 266 ESTIMACION DE PARAMETROS EJEMPLO 7-1 Suponga que X es una variable aleatoria con media 1 y varianza 0%, Sea X,, Xp. a. X, una muestra aleatoria de tamaiio n de la poblaciGn representada por X. Demuestre que la me- dia muestral X y la varianza muestral S? son estimadores insesgados de jt y 6°, respectivamente. Considérese primero la media muestral. En la ecuaciGn 6-38 del capitulo 6 se estableci6 que E(X ) = J. Por lo tanto, la media muestral X es un estimador insesgado de la media poblacional p. Considérese ahora la varianza muestral. Se tiene Se0,-¥ ES?) = 5] n-1 n-1 ED O,-xY ia 1 y2 0x =—LkY (x? +¥?-2¥x,)= EX Or+ ) n= elie = ER =i(Eeen nE(X ) ro La titima igualdad se sigue de la ecuacién 6-36 del capitulo 6. Sin embargo, puesto que E(X?)= p+ o%y E(X?)=2 + o%n, se tiene BS)= 1] Yu? +02)- ny? +orm] nile (np? +o? — np? —0?) Por Jo tanto, la varianza muestral $? es un estimador insesgado de la varianza poblacional 6”. Sin embargo, puede demostrarse que la desviaci6n esténdar muestral S es un estimador sesgado de la desviaci6n esténdar poblacional. Para muestras grandes este sesgo es despreciable. En ocasiones hay varios estimadores insesgados del parémetro poblacional. Por ejemplo, suponga que se toma una muestra aleatoria de tamafio n = 10 de una poblacién normal y se obtienen los datos x, = 12.8, x, = 9.4, x, = 1.6, 5 = 13.1, xg=9.8, x, = 14.1, x,=8.5, 2.1, X39 = 10.3. Entonces la media muestral es 12.849.448.7+11.6+13.1+9.8+14.1485412.1410.3 10 1.04 PROPIEDADES DE LOS ESTIMADORES 267 Ja mediana muestral es 10.3+11.6 2 y una media recortada al 10% (Ia cual se obtiene descartando el 10% més pequefio y més grande de la muestra antes de calcular el promedio) es =10.95 5. 8.7494 498-+10.3411.6 412.14 12.8-413.1 ret) 8 Puede demostrarse que todas éstas son estimaciones insesgadas de |1. Puesto que no existe un ‘estimador insesgado tinico, no es posible confiar tan sélo en la propiedad de la ausencia de sesgo para seleccionar el estimador. Se necesita un método para escoger entre los estimadores insesgados. En la secci6n siguiente se sugiere un método. 7-3.2, Varianza de un estimador puntual Suponga que6, y6,son estimadores insesgados de 0. Esto indica que la distribucién de cada uno de los estimadores tiene su centro en el valor real de 0. Sin embargo, las varianzas de estas distribuciones pueden ser diferentes. En la figura 7-2 se ilustra esta situacién. Puesto que 6, tiene una varianza menor que 6,, el estimador 6, tiene mayores posibilidades de producir una estima- ci6n que esté préxima al valor real de @. Un principio l6gico de la estimacién, cuando se escoge entre varios estimadores, es elegir el estimador que tenga la varianza minima. Definicién: Sl pe considera tape oh, estimadores insgad menor se le lami el estimador insesgado de varia Diseibacin de 6, Distribucién de @, Figura 7-2 Las distribuciones de muestreo de dos estimadores insesgados 6, y6,. 268 73.3 ESTIMACION DE PARAMETROS En cierto sentido, el MVUE es el estimador que tiene las mayores posibilidades de producir una estimaci6n 6 que esté préxima al valor real de 0. Se ha podido desarrollar una metodologia para identificar el MVUE en muchas situaciones précticas. Si bien esta metodologia esté fuera del alcance del presente libro, se presenta un resultado muy importante relacionado con la distribu- cién normal, Incluso en situaciones en las que no se sabe si existe un MVUE podrfa usarse el principio de la varianza minima para elegir entre los posibles estimadores. Suponga, por ejemplo, que se ‘quiere estimar la media de una poblacién (no necesariamente una poblacién normal). Se tie- ne una muestra aleatoria de n observaciones X;, Xp, ... X, y Se quieren comparar dos posibles estimadores de j1: la media muestral X y una observacién particular de la muestra, digamos, X, Obsérvese que tanto X como X, son estimadores insesgados de H; para la media muestral se tiene V(X ) = 0%n, por la ‘ecuaci6n 6-38, y la varianza de cualquier observacién es V(X) = 07. Puesto que V(X ) < V(X) para cualquier tamafio de la muestra n 2 2, se concluirfa que Ia media muestral es un mejor estimador de Ht que una observacién simple X,, Error estandar: reporte de una estimacién puntual ‘Cuando se reporta’el valor numérico o estimacién puntual de un parémetro, suele ser convenien- te dar cierta idea de la precisién de la estimacién. La medida de la precisién que se usa general- mente es el error esténdar del estimador que se ha usado. En ocasiones el error estindar estimado se denota porsg 0 se(6). Suponga que se hace un muestreo de una distribucién normal con media yy varianza 0, Entonces la distribucin de X es normal con media} y varianza 62/n, por lo que el error esténdar deX es PROPIEDADES DE LOS ESTIMADORES 269) Si no se conoce 6, pero se sustituye la desviacién esténdar muestral $ en la ecuacién anterior, entonces el error estdndar estimado de X es 6; vn Cuando el estimador sigue una distribucién normal, como en la situacién anterior, puede tenerse una seguridad razonable de que el valor real del pardmetro esté entre dos errores estindar de Ia estimacién. Puesto que muchos estimadores puntuales tienen una distribucién normal (al ‘menos aproximadamente) para n grande, este resultado es muy titil. Incluso en casos en que el estimador puntual no tiene una distribucién normal puede afirmarse que, en tanto el estimador sea insesgado, la estimaci6n del parémetro tendré una desviacién del valor real de hasta cuatro errores estindar a lo sumo 6% de las veces. Asf, una afirmacién muy conservadora es que el valor real del pardmetro difiere de la estimacién puntual en a lo sumo cuatro errores estandar. EJEMPLO 7-2 Un articulo del Journal of Heat Transfer (Trans. ASME, Secc. C, 96, p. 59) describfa un nuevo método para medir la conductividad térmica del hierro Armco. Utilizando una temperatura de 100°F y una alimentacién de energfa de 550 W, se obtuvieron las siguientes 10 mediciones de la conductividad térmica (en Buw/hr-pie-*F); 41.60, 41.48, 42.34, 41.95, 41.86, 42.18, 41.72, 42.26, 41.81, 42.04 Una estimacién puntual de la conductividad térmica media a 100°F y 550 W es la media mues- tralo = 41,924 Btuhhr-pie-"F El error esténdar de la media muestral es 6 =G/\/n , y puesto que no se conoce 6, puede sustituirse con la desviacién esténdar muestral s = 0.284 para obtener el error esténdar estimado de X como s _0.284 10 = 0.0898 Obsérvese que el error estndar es aproximadamente 0.2% de la media muestral, lo cual implica que se ha obtenido una estimacién puntual relativamente precisa de la conductividad térmica. Si puede suponerse que la conductividad térmica tiene una distribuci6n normal, enton- ces dos veces el error esténdar es 26, = 2(0.0898) = 0.1796, y se tiene una gran confianza en que la conductividad térmica media real esté en el intervalo 41.924 + 0.1756, o entre 41.744 y 42.104, 270 + ESTIMACION DE PARAMETROS 7-3.4 Estimacién bootstrap (cargador inicial) del error estandar Hay situaciones en las que no se conoce el error estindar del estimador puntual. Por lo general, se trata de casos en que la forma de © es complicada, y es dificil aplicar los operadores conven- cionales de expectativa y varianza, Una técnica de computadora llamada bootstrap (cargador inicial) que se desarroll6 en afios recientes puede usarse para este problema. ‘Suponga que se est4 haciendo el muestreo de una poblacién que puede modelarse con la distribuci6n de probabilidad f(x; 6). La muestra aleatoria da como resultado los valores numéri- 208 X)y 35 «=n %, Y Se Obtiene 6 como la estimacién puntual de @. Ahora se usarfa una computado- ra para obtener muestras bootstrap de la distribuci6n f(x; 6), y para cada una de estas muestras se calcula la estimacién bootstrap 6" de @. Se obtiene asf: B x35 Por lo general se toman B= 100 0 200 de estas muestras bootstrap. Sea 0" = (1/B) Des; 1a ‘media muestral de las estimaciones bootstrap. La estimaci6n bootstrap del error esténdar de © es simplemente la desviacién esténdar de las 8, 0 ane -0 " a (73) \= BI En la literatura bootstrap, es comin reemplazar el término B - 1 de la ecuacién 7-3 con B. Sin ‘embargo, para los valores grandes que suelen emplearse para B, hay poca diferencia en la esti- macién obtenida des; 5 EJEMPLO 7-3 EI tiempo de falla de un médulo electrénico usado en el controlador del motor de un automévil se prueba a alta temperatura a fin de acelerar el mecanismo de falla. El tiempo de falla tiene una distribucién exponencial con pardmetro A, desconocido. Se seleccionan ocho unidades al azar y se someten a prueba, con los tiempos de falla resultantes (en horas): x, = 11.96, x, = 5.03, x, = 67.40, x, = 16.07, x, = 31.50, x, = 7.73, x, = 11.10 y x, = 22.38. Ahora bien, la media de una distribucién exponencial es pl = 1/2, pot Io que E(X) = 1/A,y el valor esperado del promedio ‘muestral es E(X) = I/A. Por lo tanto, una forma razonable de estimar 4 es con =1/X. Para la PROPIEDADES DE LOS ESTIMADORES = -271 muestra en cuestién, x= 21.65, por lo que la estimacién de 4 es = 1/21.65 = 0.0462. Para encontrar el error estindar bootstrap se obtendrian B = 200 muestras (por ejemplo) de n = 8 observaciones cada una, de una distribucién exponencial con parimetro 2, = 0.0462. Se presen- tan a continuacién algunos de estos resultados: {Muestra Bootstrap Estimacion booistrap : 8.01, 28.85, 14.14, 59.12, 3.11, 32.19, 5.26, 14.17 os 0.0485 2 33.27, 2.10, 40.17, 32.43, 6.94, 30.66, 18.99, 5.61 0.0470, 200 40.26, 39.26, 19.59, 43.53, 9.55, 7.07, 6.03, 8.94 __Kryp = 0.0459 El promedio muestral de las Ai (las estimaciones bootstrap) es 0.0513, y la desviacién esténdar de estas estimaciones bootstrap es 0.020. Por lo tanto, el error esténdar bootstrap de ‘es 0.020. Entonces, en este caso resulta que, al estimar el pardmetro 4 en una distribucién exponencial, la varianza del estimador que se us6,. ies -conocida. Cuando n es grande, va) = 22in, Por lo tanto, el error esténdar estimado de ives \/A?/n = ./(0.0462)?/8 = 0.016. Obsérvese ‘que este resultado concuerda razonablemente con el error estdndar bootstrap. En ocasiones quiere aplicarse el bootstrap en situaciones en que no se conoce la forma de la distribucién de probabilidad. En estos casos, se toman como poblacién las n observaciones de Ja muestra y se seleccionan B muestras aleatorias de tamafio n cada una, con reemplazo, de esta poblaci6n. Entonces puede aplicarse la ecuacién 7-3 como se describié arriba. El libro de Efron y Tibshirani es una excelente introduccién al bootstrap. 73.5 Error cuadrado medio de un estimador En ocasiones es necesario usar un estimador sesgado. En tales casos, el error cuadrado medio del estimador puede ser importante. El error cuadrado medio de un estimador @ es el valor esperado de la diferencia al cuadrado entre © y 8. er eee Ms (O56 )= 0)" 272 ESTIMACION DE PARAMETROS Distribucién de®, Distribucién de ©, 8 Figura 723 Unestimadorsesgado 8, que tone tuna varianza menor que un esti dor insesgado @, El error cuadrado medio puede reescribirse de la siguiente manera: MSE(6)= E16 - E(@)P +(0-E6)}? = V(6)+ (bias)? Es decir, el error cuadrado medio de 6 es igual a la varianza del estimador més el cuadrado del sesgo. SiO es un estimador insesgado de @, el error cuadrado medio de 6 es igual a la varianza deo. __ El error cuadrado medio es un criterio importante para comparar dos estimadores. Sean 6, yO, dos estimadores del parimetro 8, y sean MSE(@, ) y MSE(@, ) los errores cuadrados medios de, y ©, . Entonces, la eficiencia relativa de, con respecto a6, se define como MSE ( ‘MSE (6,) C. Si esta eficiencia relativa es menor que uno, se concluirfa que 6s un estimador més eficiente de @ que, , en el sentido de que tiene un error cuadrado medio menor. En ocasiones se encuentra que los estimadores sesgados son preferibles a los insesgados debido a que tienen un error cuadrado medio menor. Es decir, puede conseguirse una reduccién considerable en la varianza del estimador introduciendo una cantidad relativamente pequefia de sesgo. Siempre que la reducci6n en la varianza sea mayor que el cuadrado del sesgo, el resultado seré un estimador mejorado desde el punto de vista del error cuadrado medio. Por ‘ejemplo, en la figura 7-3 se muestra la distribucién de probabilidad de un estimador sesgado ©, que tiene una varianza menor que el estimador insesgado ©, . Una estimacién basada en ©, tendria mayo- res posibilidades de estar cerca del valor real de @ que una estimacin basada en ©, . El andlisis de regresiGn lineal (capitulos 10 y 11) es un campo donde se usan ocasionalmente estimadores sesgados. Alestimador © que tiene un error cuadrado medio que es menor o igual que el error cuadra- do medio de cualquier otro estimador, para todos los valores del pardmetro 8, se le llama estima- dor 6ptimo de 6. Los estimadores 6ptimos rara vez existen. EJERCICIOS DE LA SECCION 7-3 TA. 72. 7-1. 78. ‘Suponga que se tiene una muestra aleatoria de tamafio 2n de una poblacién denotada por X.y B00 =p, VOX) = 6°. Sean an, dos estimadores de p.. {Cudl es el mejor estimador de 1? Explique su eleccién. Sea que X;, Xp... X; denote una muestra aleatoria de una poblacién que tiene media ty varianza 6?, Considérense los siguientes cestimadores de i: 6, ohh: Xx. Ky -Xet Xe 2 8) {Alguno de los dos estimadores es insesga- 0? b) {Cul estimador es el mejor? {En que sen- tido es mejor? ‘Suponga que ©, y , son estimadores inses- gados del pardmetro 8, Se sabe que V(®,) = 10y V(O,)=4, ;CuAl estimador es mejor y en qué sentido lo es? Calcule Ia eficiencia relativa de los dos esti- adores del ejercicio 7-2. Calcule la eficiencia relativa de los dos esti- adores del ejercicio 7- Suponga que ©, y 6 son estimadores del pa- rimetro 0. Se sabe que E( 6,) = 8, E(@,)= 62, (6, )= 10y WO,)=4, {Cusl esti- rador es mejor? En qué sentido es mejor? Suponga que ©, , 0, y ©, son estimadores ) Encuentre la cantidad de sesgo en el esti- mador. ©) {Qué ocurre con el sesgo cuando el tama- fio de Ia muestra se incrementa? Sea X;, Xp) oy X, una muestra aleatoria de tamafio n. a) Demuestre que ¥? es un estimador sesga- do dew, ») Encuentre la cantidad de sesgo en este estimador. ©) {Qué ocurre con el sesgo cuando el tama- fio de la muestra n se incrementa? Se piensa que los defectos de un tablero me- télico usado en la manufactura de automéviles sigue una distribucién de Poisson, Se cuentan Jos defectos en 10 tableros con los siguientes 2.327.352 15,242 8,52 Hg = 6, y= 3, By = Ts Hy = 3, Ng = 4. En cuentre una estimacién puntual del paréme- tro de Poisson 2. Encuentre el error estindar bootstrap de i. Se extraen 10 observaciones al azar de una poblacién con distribueién de probabilidad desconocida, Las observaciones son x, = 48, y= 57,5 = 53, £4 = 53, 25 = 58, %6= 39,4 46, x5 = 45, x = 61 y x39 = 49. Encuentre ‘una media recortada al 10% de estos datos (remftase al ejercicio 2-38). Suponga que ésta ‘es una estimacién razonable de la media poblacional pt. Encuentre el error esténdar bootstrap de la media recortada. Considere de nuevo las observaciones del ejer- cicio 7-12. Caleule las desviaciones estindar rmuestrales de estas observaciones. Estaes una estimaciGn razonable de la desviacién estén- darpoblacional 6. Encuentre el error estandar bootstrap de s Considere de nuevo las observaciones del ejer- jo 7-12. Calcule el rango muestral de es- tas observaciones. Encuentre el error esténdar bootstrap del rango muestra

También podría gustarte