Documentos de Académico
Documentos de Profesional
Documentos de Cultura
L I C E N C I A D O EN E S T A D S T I C A
P R E S E N T A:
Esta tesis fue realizada por Morales Reyes Lzaro, bajo la direccin del Doctor Eduardo
Gutirrez Gonzlez. Fue revisada y aprobada por el siguiente Comit Revisor y Jurado
Examinador, para obtener el ttulo de Licenciado en Estadstica.
PRESIDENTE.
Dr. Eduardo Gutirrez Gonzlez
_______________________________
SECRETARIO.
M.C. Alejandro Corona Ambriz
______________________________
VOCAL.
Dr. Gerardo Terrazas Gonzlez
______________________________
SUPLENTE.
Dr. Antonio Villanueva Morales
______________________________
SUPLENTE.
Lic. Margarito Soriano Montero
______________________________
Contenido
NDICE DE FIGURAS .................................................................................................................. vi
NDICE DE TABLAS .................................................................................................................. viii
RESUMEN ...................................................................................................................................... ix
SUMMARY ...................................................................................................................................... x
INTRODUCCIN ........................................................................................................................... 1
PLANTEAMIENTO ....................................................................................................................... 2
OBJETIVOS .................................................................................................................................... 4
CAPTULO 1 ........................................................................................................................................................................ 5
Conceptos bsicos de las pruebas de hiptesis estadsticas ................... 5
Introduccin....................................................................................................................................... 5
1.1 Hiptesis estadstica .................................................................................................................... 6
1.2 Conjunto de realizaciones de una hiptesis estadstica ............................................................... 7
1.3 Prueba estadstica de una hiptesis.............................................................................................. 7
1.4 Tipos de errores en una prueba de hiptesis: tipo I y tipo II ....................................................... 9
1.5 La mejor prueba: potencia de la prueba .................................................................................... 11
1.6 Funcin potencia de la prueba. .................................................................................................. 15
1.7 Tamao de la prueba y nivel de significancia ........................................................................... 16
1.8 Aplicaciones para el clculo del tamao y potencia de la prueba en el caso de un parmetro. 19
CAPTULO2....................................................................................................................................................................... 33
Pruebas de hiptesis y lema de Neyman-Pearson ......................................... 33
Introduccin..................................................................................................................................... 33
2.1 Prueba simple contra simple ...................................................................................................... 33
2.2 Pruebas puras y aleatorizadas .................................................................................................... 36
2.3 El lema de Neyman-Pearson para pruebas simple contra simple .............................................. 38
2.4 Hiptesis nula simple contra hiptesis alterna simple ............................................................... 41
2.4.1 Metodologa para el caso continuo .................................................................................... 41
2.4.2 Metodologa para el caso discreto ..................................................................................... 53
Teorema 2.1......................................................................................................................... 58
2.5 Pruebas simple contra compuesta .............................................................................................. 59
2.6 Pruebas compuesta contra simple .............................................................................................. 62
2.7 Pruebas compuesta contra compuesta ....................................................................................... 66
2.8 Pruebas compuesta contra compuesta para poblaciones de variables discretas ........................ 71
Teorema 2.2......................................................................................................................... 71
iii
CAPTULO 3...................................................................................................................................................................... 75
Pruebas de razn de verosimilitud generalizada ............................................ 75
Introduccin..................................................................................................................................... 75
3.1 Familias de distribucin con razn de verosimilitud montona ................................................ 75
Teorema 3.1......................................................................................................................... 76
Teorema 3.2......................................................................................................................... 85
3.2 Pruebas insesgadas .................................................................................................................... 86
Teorema 3.3......................................................................................................................... 87
3.3 Mtodo de prueba de la razn de verosimilitud generalizada ................................................... 89
3.4 Propiedad asinttica de las pruebas de razn de verosimilitud generalizadas ........................ 104
3.5 Razn de verosimilitud generalizada en muestras independientes .......................................... 107
CAPTULO 4.................................................................................................................................................................... 121
Pruebas de hiptesis para los parmetros de una distribucin normal121
Introduccin................................................................................................................................... 121
4.1 Metodologa para probar una hiptesis estadstica .................................................................. 121
4.2 Pruebas de hiptesis para medias ............................................................................................ 122
4.2.1 Pruebas de hiptesis para medias de poblaciones aproximadamente normales cuando se
conoce .................................................................................................................................. 122
Teorema 4.1....................................................................................................................... 122
4.2.2 Pruebas de hiptesis para la media de poblaciones aproximadamente normales cuando se
desconoce ............................................................................................................................. 128
Teorema 4.2....................................................................................................................... 128
4.3 Pruebas para la diferencia de medias de poblaciones normales .............................................. 132
4.3.1 Pruebas de hiptesis para la diferencia de medias sobre poblaciones aproximadamente
normales cuando se conocen 12 y 22 ................................................................................... 133
Teorema 4.3....................................................................................................................... 133
4.3.2 Pruebas de hiptesis para la diferencia de medias sobre poblaciones aproximadamente
normales cuando se desconocen 12 y 22 pero 12 22 ....................................................... 137
Teorema 4.4....................................................................................................................... 137
4.3.3 Pruebas de hiptesis para la diferencia de medias sobre poblaciones aproximadamente
normales cuando se desconocen 12 y 22 pero 12 22 ...................................................... 140
Teorema 4.5....................................................................................................................... 141
4.3.4 Pruebas de hiptesis para la diferencia de medias de observaciones pareadas con
diferencias normales ................................................................................................................. 144
Teorema 4.6....................................................................................................................... 145
4.4 Pruebas para las varianzas de poblaciones normales .............................................................. 148
Teorema 4.7....................................................................................................................... 148
Teorema 4.8....................................................................................................................... 152
4.5 Pruebas para poblaciones tipo Bernoulli, proporciones .......................................................... 155
4.5.1 Pruebas para proporciones muestras grandes .................................................................. 155
Teorema 4.9....................................................................................................................... 156
Teorema 4.10..................................................................................................................... 159
iv
ndice de figuras
Figura 1.1 Probabilidades de errores tipo I y II .............................................................................. 11
Figura 1.2 Diferentes pruebas de tamao .................................................................................. 12
Figura 1.3 Diferentes funciones de potencia de la prueba.............................................................. 17
Figura 1.4 Situacin cuando no est en la regin de rechazo del ejemplo 1.5 d) ...................... 18
Figura 1.5 Situacin cuando est en la regin de rechazo del ejemplo 1.5 e) ........................... 19
Figura 1.6 Funcin de potencia de la prueba para el valor crtico 4.2 del ejemplo 1.6. ......... 21
Figura 1.7 Grfica de la funcin potencia de la prueba del ejemplo 1.11 ...................................... 26
Figura 1.8 Grfica de la funcin potencia de la prueba del ejemplo 1.13. ..................................... 28
Figura 1.9 Regin crtica establecida C {( x1 , x2 ) : (3 4) x1 x2 } del ejemplo 1.14 ...................... 29
Figura 1.10 Grfica de la funcin potencia de la prueba del ejemplo 1.17 .................................... 32
Figura 2.1 Probabilidades de los errores tipo I y II de las 8 pruebas posibles del ejemplo 2.1 ...... 36
Figura 2.2 Conjunto convexo de las pruebas aleatorizadas del ejemplo 2.1 .................................. 37
Figura 2.3 Pruebas admisibles para el ejemplo 2.1 ........................................................................ 38
Figura 2.4 Limites de la transformacin para el ejemplo 2.6 ......................................................... 49
Figura 2.5 Regin de rechazo para el ejemplo 2.11 ....................................................................... 59
Figura 2.6 Conjunto de todas las pruebas de tamao ............................................................ 64
Figura 2.7 Ilustracin de P(Y b) 1
42n (b) del ejemplo 2.17 ............................................ 70
Figura 2.8 Regin de rechazo para el ejemplo 2.18 ....................................................................... 73
Figura 2.9 Regin de rechazo para el ejemplo 2.19 ....................................................................... 74
Figura 3.1 Comportamiento de la funcin
( ) de la prueba...................................................... 77
Figura 3.2 Grfica de la funcin de potencia de la prueba del ejemplo 3.3 ................................... 80
Figura 3.3 Funcin de potencia de la prueba del ejemplo 3.5 ........................................................ 83
Figura 3.4 Comportamiento de las pruebas insesgadas 1 y 2* .................................................... 86
Figura 3.5 Ilustracin de P{X ln X k } del ejemplo 3.10 ..................................................... 92
Figura 3.6 Ilustracin de P{g (Y ) k1 } donde Y ~ 22n del ejemplo 3.11 ................................ 94
Figura 3.7 Espacio de parmetros para y del ejemplo 3.14 .................................................. 97
Figura 3.8 Grfica de la funcin g ( y) donde se desea encontrar a y b tales que g (a) g (b) k 98
Figura 3.9 Grfica de (x) h(T 2 ) del ejemplo 3.15 .................................................................. 103
Figura 3.10 Grfica de una T ~ t n
1 tales que Ftn
1 (
t1
2 ) 1
Ftn
1 (t1
2 ) del ejemplo 3.15104
Figura 3.11 Espacio de parmetros para y del ejemplo 3.17 ............................................... 108
Figura 3.12 Grfica de una t nm
2 tales que
t n* m
2,1
2 1
t n* m
2,1
2 del ejemplo 3.19 .. 116
Figura 3.13 Grfica de la funcin g (F ) donde g (a) g (b) k del ejemplo 3.21 ...................... 118
Figura 3.14 Grfica de la funcin 1
P{a F b} del ejemplo 3.22 .................................... 119
Figura 4.1. Regin de no rechazo y rechazo para el ejemplo 4.1 ................................................. 123
Figura 4.2. Regin de no rechazo y rechazo para el ejemplo 4.2 ................................................. 124
vi
Figura 4.3. Regin de no rechazo y rechazo para el ejemplo 4.2 ................................................. 125
Figura 4.4. Regin de no rechazo y rechazo para el ejemplo 4.3 ................................................. 126
Figura 4.5. Regin de no rechazo y rechazo para el ejemplo 4.4 ................................................. 127
Figura 4.6. Regin de no rechazo y rechazo para el ejemplo 4.5 ................................................. 129
Figura 4.7. Regin de no rechazo y rechazo para el ejemplo 4.6 ................................................. 131
Figura 4.8. Regin de no rechazo y rechazo para el ejemplo 4.7 ................................................. 132
Figura 4.9. Regin de no rechazo y rechazo para el ejemplo 4.8 ................................................. 135
Figura 4.10. Regin de no rechazo y rechazo para el ejemplo 4.10 ............................................. 138
Figura 4.11. Regin de no rechazo y rechazo para el ejemplo 4.11 ............................................. 140
Figura 4.12. Regin de no rechazo y rechazo para el ejemplo 4.12 ............................................. 143
Figura 4.13. Regin de no rechazo y rechazo para el ejemplo 4.13 ............................................. 144
Figura 4.14. Regin de no rechazo y rechazo para el ejemplo 4.14 ............................................. 146
Figura 4.15. Regin de no rechazo y rechazo para el ejemplo 4.15 ............................................. 148
Figura 4.16. Regin de no rechazo y rechazo para el ejemplo 4.16 ............................................. 150
Figura 4.17. Regin de no rechazo y rechazo para el ejemplo 4.17 ............................................. 151
Figura 4.18. Regin de no rechazo y rechazo para el ejemplo 4.18 ............................................. 153
Figura 4.19. Regin de no rechazo y rechazo para el ejemplo 4.19 ............................................. 155
Figura 4.20. Regin de no rechazo y rechazo para el ejemplo 4.20 ............................................. 157
Figura 4.21. Regin de no rechazo y rechazo para el ejemplo 4.21 ............................................. 158
Figura 4.22. Regin de no rechazo y rechazo para el ejemplo 4.22 ............................................. 162
Figura 4.23. Regin de no rechazo y rechazo para el ejemplo 4.22 ............................................. 162
Figura 4.24. Regin de no rechazo y rechazo para el ejemplo 4.23 ............................................. 164
Figura 5.1. Zona de rechazo y punto crtico de la prueba ji-cuadrada ......................................... 168
Figura 5.2. Histograma de las clases de frecuencia para los datos de la muestra del ejemplo 5.1170
Figura 5.3. Histograma de las clases de frecuencia para los datos de la muestra del ejemplo 5.2173
Figura 5.4. Histograma de las clases de frecuencia para los datos de la muestra del ejemplo 5.3175
Figura 5.5. Distribucin terica y emprica de la prueba de Kolmogorov-Smirnov .................... 177
vii
ndice de tablas
Tabla 1.1 Valores de la funcin potencia de la prueba dado ....................................................... 26
Tabla 1.2 Valores de la funcin potencia de la prueba dado p ....................................................... 28
Tabla 1.3 Valores de la funcin potencia de la prueba dado ....................................................... 32
Tabla 2.1 Posibles pruebas para cuando X {0,1,2} y clculo de los errores tipo I y II del ejemplo
2.1 .................................................................................................................................................... 35
Tabla 3.1 Valores de teta con su respectivo valor de potencia de la prueba del ejemplo 3.3 ......... 80
Tabla 3.2 Valores de la potencia de la prueba del ejemplo 3.5. ..................................................... 83
Tabla 4.1 Intervalos de clase y frecuencia de una m.a. para el problema 4.4 .............................. 127
Tabla 4.2 Datos de resistencia en tensin de dos tipos de rosca................................................... 138
Tabla 4.3 Nmero de latidos del corazn antes y despus de un experimento en animales ........ 145
Tabla 4.4 Diferencia del nmero de latidos del corazn antes y despus de un experimento en
animales ......................................................................................................................................... 146
Tabla 4.5 Datos de resistencia en tensin de dos tipos de rosca................................................... 147
Tabla 4.6 Diferencia de la resistencia en tensin de dos tipos de rosca ....................................... 148
Tabla 4.7 Resistencia en tensin de dos tipos de tornillos ........................................................... 152
Tabla 5.1 Datos de la muestra para probar normalidad del ejemplo 5.1 ...................................... 170
Tabla 5.2 Clases de frecuencia para los datos de la muestra del ejemplo 5.1 .............................. 170
Tabla 5.3 Valores tericos y muestrales para la prueba de bondad de ajuste de los datos
muestrales del ejemplo 5.1 ............................................................................................................ 171
Tabla 5.4 Valores tericos y muestrales para la prueba de bondad de ajuste de los datos
muestrales del ejemplo 5.1 ............................................................................................................ 172
Tabla 5.5 Datos de la muestra para probar exponencialidad del ejemplo 5.2 .............................. 172
Tabla 5.6 Clases de frecuencia para los datos de la muestra del ejemplo 5.2 .............................. 173
Tabla 5.7 Valores tericos y muestrales para la prueba de bondad de ajuste de los datos
muestrales del ejemplo 5.2 ............................................................................................................ 174
Tabla 5.8 Datos de la muestra para probar si tienen distribucin geomtrica del ejemplo 5.3 .... 174
Tabla 5.9 Clases de frecuencia para los datos de la muestra del ejemplo 5.3 .............................. 175
Tabla 5.10 Valores tericos y muestrales para la prueba de bondad de ajuste de los datos
muestrales del ejemplo 5.3 ............................................................................................................ 175
Tabla 5.11 Datos de la muestra para probar si tienen distribucin normal del ejemplo 5.4 ......... 177
Tabla 5.12 Frecuencias tericas y muestrales para la prueba de bondad de ajuste de los datos
muestrales del ejemplo 5.4 ............................................................................................................ 178
Tabla 5.13 Datos muestrales para probar si tienen distribucin uniforme del ejemplo 5.5 ......... 179
Tabla 5.14 Frecuencias tericas y muestrales para la prueba de bondad de ajuste de los datos
muestrales del ejemplo 5.5 ............................................................................................................ 179
Tabla 5.15 Frecuencias tericas y muestrales para la prueba de bondad de ajuste de los datos
muestrales del ejemplo 5.6 ............................................................................................................ 180
viii
Resumen
En la actualidad, el uso de las pruebas de hiptesis es una de las principales herramientas para
la toma de decisiones. El presente trabajo plantea la metodologa que se sigue para la
elaboracin de dichas pruebas; para ello, el trabajo se ha divido en cinco captulos.
En el captulo uno se da una introduccin a los conceptos bsicos de las pruebas de
hiptesis estadsticas, los errores que se pueden cometer al momento de realizar dichas
pruebas, la mejor prueba, su tamao, su potencia y su nivel de significancia.
En el captulo dos se dan las bases tericas de las pruebas de hiptesis, para ello se
estudia el lema de Neyman-Pearson o lema fundamental de prueba de hiptesis. Seguido de
esto, se dan las metodologas para las pruebas con hiptesis simples, compuestas y sus
posibles combinaciones.
El captulo tres se generaliza la idea del lema de Neyman-Pearson.
En el captulo cuatro se dan a conocer las pruebas para los parmetros de una
distribucin normal, ya sea cuando se conoce o no la varianza, pruebas para diferencia de
medias, para el cociente de varianzas, etctera. Adems se explica la relacin que existe entre
las pruebas de hiptesis y los intervalos de confianza, dado que ambos son herramientas de la
Inferencia Estadstica.
Por ltimo, en el captulo cinco se dan a conocer tres de las pruebas de bondad de ajuste
ms importantes a saber: prueba Ji-cuadrada (paramtrica), prueba de Kolmogorov-Smirnov
(no paramtrica) y prueba de normalidad de Shapiro-Wilk.
Es importante sealar que el presente trabajo contiene ejemplos prcticos en cada uno de
los captulos donde se aplican dichas metodologas en diversas reas del saber.
ix
Summary
At present, the use of hypothesis testing is one of the main tools for decision making.
This work reviews the methodology for developing such tests, for this, the work has been
divided into five chapters.
Chapter one provides an introduction to the basic concepts of statistical hypothesis
testing, errors can be made at the time of these tests, the best test, its size, its power and its
significance level.
Chapter two the theoretical basis of hypothesis testing is given, the Neyman-Pearson
lema or fundamental lema of hypothesis testing is explored. Methodologies are given for
testing with simple hypothesis, compound hypothesis and their possible combinations.
Chapter three generalizes the idea of Neyman-Pearson lema.
Chapter four presents tests for the parameters of a normal distribution when variance is
known or unknown, testing for mean difference, for the variance ratio, etc. Besides, the
relationship between hypothesis testing and confidence intervals are explained.
Finally, in chapter five are released three of the most important goodness of fit tests,
namely Chi-square test (parametric), Kolmogorov-Smirnov (nonparametric) test and ShapiroWilk normality test.
This work contains practical examples in each of the chapters that apply these
methodologies in different areas of knowledge.
Introduccin
Al hablar de Estadstica, se suele pensar slo en colecciones de datos; sin embargo, se deja a
un lado el llamado Mtodo estadstico considerado como una disciplina cientfica con
entidad propia.
La razn principal de que este Mtodo Estadstico se haya desarrollado en los ltimos
aos dentro de las ciencias experimentales es que estas ciencias estn sujetas a razonamientos
de tipo inductivo que van de lo particular a lo general; por lo que el nico mtodo cientfico
para validar tales extensiones es el Mtodo Estadstico, pues precisamente esa es la causa de
su existencia.
As el objetivo de este mtodo es hacer inferencias acerca de los parmetros,
desconocidos, de las poblaciones basadas solamente en la informacin obtenida mediante
datos muestrales. Estas inferencias se expresan en una de dos maneras: como estimaciones de
los parmetros respectivos o como pruebas de hiptesis referentes a sus valores.
Son muchas las situaciones donde el Mtodo Estadstico se convierte en la nica
herramienta que, hoy por hoy, permite dar luz y obtener resultados en cualquier tipo de
estudio; por ejemplo, un investigador en medicina propone la hiptesis de que un nuevo
medicamento es ms efectivo que otro para curar cierta enfermedad ; un tcnico de control de
calidad puede proponer la hiptesis de que un nuevo mtodo de montaje produce solamente
5% de artculos defectuosos; un educador puede afirmar que dos mtodos para ensear a leer
tienen la misma eficacia; un candidato poltico puede afirmar que la mayora de los votantes
estn de su parte; etc.
Los escenarios mencionados corresponden a inferencias expresadas en trminos de
pruebas de hiptesis; as, las pruebas de hiptesis se realizan en todos los mbitos en los que
puede contrastar la teora frente a la observacin.
Por lo expuesto anteriormente, la expansin del Mtodo Estadstico es tal que, de
todas las disciplinas que se estudian, la Estadstica es prcticamente la nica que se tendr
como asignatura en la mayor parte de las carreras universitarias; desde las tpicamente
consideradas experimentales, como la Medicina o la Biologa hasta carreras consideradas
como de letras como la Psicologa, Sociologa o incluso la Geografa.
Derivado de todo esto; surge la oportunidad de exponer, en este trabajo, las
metodologas estadsticas que se aplican en las ciencias experimentales o en algn problema
en particular donde la Estadstica permite dar solucin al escenario que se tenga.
Son muchas las herramientas de la Estadstica que se pueden emplear en la solucin de
diversos problemas; que van desde la teora de estimacin, curvas de ajuste por medio de
regresin y correlacin; anlisis de varianza; etc. Pero son sin duda, los mtodos de las
pruebas de hiptesis estadsticas, los que validan los resultados que arrojan las tcnicas
mencionadas anteriormente.
1
En este contexto y dado que las pruebas de hiptesis estadsticas ocupan un papel
central, se muestran, aunque de manera modesta en este trabajo, las metodologas que se
aplican en la estimacin por medio de pruebas de hiptesis tan usadas en todas las ciencias del
saber.
En primer lugar, se habla de los conceptos elementales para concebir una prueba de
hiptesis junto con todos los elementos que rodean a estas pruebas. Teniendo ya las bases
fundamentales, se prosigue a enunciar las distintas pruebas que se pueden realizar para
contrastar las observaciones que se tienen de un proceso junto con los teoremas que sustentan
los procedimientos empleados para el contraste de estas hiptesis; es decir las pruebas de
razn de verosimilitud.
Asumiendo la asimilacin de las metodologas empleadas en las pruebas mencionadas,
se prosigue a generalizar la idea de las pruebas de razn para dos o ms parmetros de cierta
poblacin.
Teniendo estos procedimientos; se aterriza la idea para los parmetros de una de las
distribuciones ms importantes, o incluso la ms importante, dentro de la Estadstica, que es la
distribucin normal. Adems de que tambin se abordan los procedimientos para poblaciones
de tipo Bernoulli.
Por ltimo, y dado que en todos los captulos se trabaja con poblaciones donde se asume
que stas tienen cierta distribucin, se habla de tres de las pruebas ms importantes de bondad
de ajuste, a saber: la prueba ji-cuadrada, la prueba de Kolmogorov-Smirnov y la prueba de
Shapiro Wilk. stas con la finalidad de que, al tener las observaciones de un fenmeno dado,
se puedan emplear estas pruebas para saber el tipo de poblacin a la que pertenecen y as,
poder utilizar de manera adecuada las herramientas que se proponen en este trabajo.
Planteamiento
Supngase que se quiere basar un experimento en Mtodos estadsticos; es razonable
preguntarnos Cuntas observaciones necesito para tener lo que deseo obtener del estudio?,
Qu tan poderoso es el estadstico de una prueba para detectar un efecto significativo, dado
un tamao de prueba, nivel de significancia y un tamao de efecto estandarizado? Estos
anlisis examinan la sensibilidad del poder estadstico y el tamao de muestra hacia otros
componentes que habilitan al decisor como un investigador para utilizar eficientemente los
recursos y llevar a cabo una buena toma de decisiones.
La comprensin de estos y muchos otros conceptos ms deben ser necesarios para una
verdadera investigacin de un problema en particular. Sin embargo, la importancia de la
metodologa Estadstica no implica que algunos de los conceptos que se manejen sean de
inmediata comprensin, ya que se requiere de cierta madurez intelectual para su cabal
asimilacin.
En relacin a la Estadstica, se han escrito cientos de libros de texto dirigidos a lectores
que emprenden en el estudio de esta materia. Sin embargo, esos cientos se reducen a unas
cuantas docenas al restringirse el campo a los escritos originalmente en espaol incluso los
pocos traducidos.
Ahora, existen mltiples maneras de abordar a la Estadstica; que van desde formas
puramente tericas hasta aquellas en las que pareciera que la metodologa consiste en una serie
de pasos haciendo a un lado el sentido intrnseco de la Estadstica.
Es por ello que investigadores, estudiantes en Estadstica o afines, presentan una
problemtica seria al momento de adentrarse en el estudio de esta materia. No existen escritos
tericos bsicos en donde el estudiante no se pierda dada su poca formacin matemtica
aunado a la complejidad que tiene la comprensin de muchos conceptos bsicos.
En consecuencia, este trabajo aborda las bases tericas elementales para el desarrollo de
la teora de prueba de hiptesis junto con su metodologa que es la que hace aterrizar todos los
conceptos desde un punto de vista prctico. As, estudiantes que cuenten con los elementos
bsicos de probabilidad y clculo no presenten problemas al momento de afrontar el estudio de
esta materia.
Objetivos
Los objetivos que se han planteado en el presente trabajo para los alumnos e investigadores de
Estadstica o disciplinas afines, son los siguientes:
Captulo1
Conceptos bsicos de
hiptesis estadsticas
las
pruebas
de
Introduccin
Casella George and Berger L. Roger. Statistical Inference. 2da edicin. pp. 373
En los textos metodolgicos sobre pruebas de hiptesis la formulacin de las hiptesis nula y
alterna es un poco confusa, ya que se quieren establecer reglas que no consideran la esencia de la teora
sobre la qu estn cimentadas las pruebas de hiptesis. Por consiguiente, antes de proseguir y tratar de
dar respuesta a la pregunta anterior, sern revisados los conceptos necesarios para dar una respuesta
satisfactoria a la pregunta y explicar el porqu de dicha eleccin.
1.2 CONJUNTO DE REALIZACIONES DE UNA HIPTESIS ESTADSTICA
Suponga que el decisor se encuentra ante el problema de la duracin promedio de los focos
(mencionado arriba), en donde la poblacin tiene un comportamiento descrito por la funcin de
densidad f ( x; ) , donde el parmetro tiene un espacio paramtrico 0, ( tiempo de vida
de los focos, luego 0 ). De tal forma que con las condiciones del ejemplo se puede establecer el
siguiente contraste de hiptesis (an no se ha explicado cmo establecer la hiptesis nula y alterna):
H 0 : 750
H 1 : 750
Es decir, el espacio paramtrico 0, es particionado en dos regiones que son denotadas,
para la regin correspondiente al parmetro en la hiptesis nula y (
) a la regin
correspondiente al parmetro en la hiptesis alterna. De esta forma se puede establecer el contraste de
hiptesis anterior en forma ms general y equivalente a
H 0 :
H1 :
Hasta el momento no se ha hablado sobre el problema que ser de inters en forma prctica, es
decir, qu hacer cuando se tengan nicamente datos para decidir cul de las hiptesis es valida, ms
an, qu se entender por una prueba de hiptesis.
Continuando con el ejemplo del problema de la prueba de hiptesis para la vida promedio de los
focos y que cada foco tiene un tiempo de vida descrito por una variable aleatoria con funcin de
densidad f ( x; ) . Por otro lado, se tiene una muestra aleatoria de tales variables ( X 1 , X 2 , , X n )
denotada por el vector X . Pero como en todo problema concreto se requiere trabajar no con la
muestra aleatoria, sino con sus realizaciones, as R representa el conjunto de todas las realizaciones de
X . Luego,
R x | x es una realizacin de X.
As, que en un problema prctico es posible particionar al conjunto R y tomar una decisin sobre
la valides de la hiptesis nula con base en los resultados de las observaciones.
1.3 PRUEBA ESTADSTICA DE UNA HIPTESIS
Si en el supuesto de que una hiptesis determinada es cierta, se encuentra que los resultados
observados en una muestra aleatoria difieren marcadamente de aquellos que caba esperar con la
hiptesis y con la variacin propia del muestreo, se dira que las diferencias observadas son
significativas y se estara en condiciones de rechazar la hiptesis. Por ejemplo, si en 20 lanzamientos
de una moneda se obtienen 16 caras, se estara inclinado a rechazar la hiptesis de que la moneda no
est cargada, aunque sera posible que fuese un rechazo errneo.
Los procedimientos que facilitan el decidir si una hiptesis se rechaza o no, as como el
determinar si las muestras observadas difieren significativamente de los resultados esperados se llaman
pruebas de hiptesis, ensayos de significancia o reglas de decisin.
Definicin 1.2
Se llama Prueba de hiptesis, para probar H 0 contra H 1 , a una particin de R en dos
subconjuntos, que son denotados por Ra y Rr y que se llaman regin de no rechazo y regin
de rechazo o regin crtica, respectivamente2.
Note que a partir de la definicin anterior se puede establecer un procedimiento de tal forma que
con base en la realizacin de una muestra aleatoria se podr decidir si H 0 es verdadera o no.
Cmo determinar cundo una hiptesis nula debe ser rechazada o no?
Para el contraste de hiptesis de un parmetro , en general
H 0 :
H1 :
NOTA
Observe que y
no son iguales a Ra y Rr , porque los primeros dos
subconjuntos forman una particin del espacio paramtrico, mientras que los segundos
son una particin del conjunto de realizaciones. As, la regla de decisin est dada con
base en las realizaciones.
Por ejemplo, para el caso particular del tiempo de vida promedio de los focos, se tiene
H 0 : 750
H 1 : 750
De donde se observa que para cada valor elegido de 0 se tiene una prueba de hiptesis o
particin de R, al valor 0 que divide las regiones de rechazo y no rechazo, a este valor se le suele
llamar valor crtico. Por ejemplo, es posible considerar el valor crtico 0 760 horas, quedando
establecidas de esta forma las regiones de no rechazo (para promedios menores o iguales a 760) y
rechazo o regin crtica (para promedios mayores a 760). Lo ms probable es que surja la pregunta
cmo se determinaron las regiones? En est caso, la cantidad de 760 se ha elegido como un ejemplo
ilustrativo de que son las regiones de rechazo y no rechazo. Pero como se ver en la seccin siguiente
estas regiones estn vinculadas o dependen del tamao del error que se cometa al rechazar o no la
hiptesis nula.
As, se ha visto que es posible tener una infinidad de pruebas y desde luego, surgen las preguntas
Cul de todas las pruebas sera una buena prueba?
Se podr establecer una prueba que sea la mejor?
Con respecto a las respuestas, stas se vern ms adelante.
2
Similarmente se tiene
P(Error tipo II usando Ra | H1 ) Probabilidad de cometer el error tipo II, con H 1 verdadera.
Note que el clculo de probabilidades para el error tipo I tambin se puede llevar a la regin de
aceptacin por medio del complemento
P(Error tipo I usando Rr | H 0 ) 1
P(Error tipo I usando Ra | H 0 )
Note tambin que el clculo de probabilidades para el error tipo II tambin se puede llevar a la
regin de rechazo por medio del complemento
P(Error tipo II usando Ra | H 1 ) 1
P(Error tipo II usando Rr | H 1 ) .
EJEMPLO 1.1
Suponga que el tiempo de vida de los focos, stos tienen una desviacin estndar de vida igual a 50
horas, considerando una muestra de 49 focos se desea probar la hiptesis:
H 0 : 750 ,
H 1 : 750 ,
con la regin de rechazo establecida para promedios de vida mayores a 760 horas. Calcule
a) la probabilidad de cometer un error tipo I para el caso en que 740 .
b) la probabilidad de cometer el error tipo II para el caso en que 755 .
3
DeGroot H. Morris, Schervish J. Mark. 2001. Probability and Statistics. pp. 442
Antes de resolver el problema note que en el clculo del error tipo I, la hiptesis nula tiene que
ser verdadera, 750 . Es decir, para calcular la probabilidad del error tipo I se tiene una infinidad de
valores del parmetro media, por tal razn es elegido uno, en particular 740 . Similarmente para
calcular la probabilidad del error tipo II es elegido el valor 755 , que cumple con la condicin
750 , cuando H 1 es verdadera.
Solucin
a) Para calcular las probabilidades se tiene que la regin de rechazo est dada por X 760 , por otro
lado, el tamao de la muestra es n 49 , luego es posible utilizar el Teorema de Limite Central.
# X
760
#
760
740
P(Error tipo I con Rr | H 0 ) P( X 760 | 750) P!
| 740 P! Z
! n 50 49
!
50 49
"
"
PZ 2.8 0.0026
b) Similarmente para calcular la probabilidad del error tipo II, se usa el Teorema de Limite Central y
el hecho de que Ra est dada por X 760 .
# X
760
#
760
755
P( II usando Ra | H 1 ) P( X 760 | 750) P!
| 755 P! Z
! n 50 49
!
50 49
"
"
PZ 0.70 0.7580
Luego,
P(Error tipo II usando Ra | H 1 ) 1
P(Error tipo II usando Rr | H 1 ) 1
P( X 760 | 750)
#
# X
760
760
755
| 755 1
P! Z
1
P!
!
! n 50 49
50 49
"
"
1
PZ 0.70 0.7580
Suponga que en el ejemplo anterior, se considera la regin de rechazo para promedios de vida mayores
a 752 horas. Calcule
a) la probabilidad de cometer un error tipo I para el caso en que 740 .
b) la probabilidad de cometer el error tipo II para el caso en que 755 .
Solucin
a) Continuando con la misma metodologa de clculos de probabilidades resulta.
# X
752
P(Error tipoI usando Rr | H 0 ) P( X 752 | 750) P!
| 740
! n 50 49
"
#
752
740
P! Z
PZ 1.68 0.0465
!
50 49
"
b) Para calcular la probabilidad del error tipo II, con Ra dada por X 752 .
10
# X
752
#
752
755
P( error tipo II usando Ra | H 1 ) P( X 752 | 750) P!
| 755 P! Z
! n 50 49
!
50 49
"
"
PZ
0.42 0.3372
Comparando las dos pruebas anteriores, X 760 con X 752 , se concluye que es mejor la
prueba para la particin X 752 y X 752 de R. Puesto que la probabilidad del error tipo I es
pequea (alrededor del 5%), mientras que la probabilidad del error tipo II disminuy considerablemente, comparada con la correspondiente particin X 760 .
Del ejemplo anterior y las definiciones de pruebas de hiptesis y la particin del conjunto R, se
tiene que el problema de encontrar una buena prueba se puede trabajar como la determinacin de una
buena particin del conjunto R, ms an, note que una prueba queda completamente especificada con
la sola definicin de la regin de rechazo, Rr . As, a cada prueba le corresponde una pareja de
probabilidades P(I | Rr ) y P(II | Rr ) las cuales se pueden graficar en el plano cartesiano
P ( I | Rr )
1
*
* *
**
*
**
* *
*
**
*
*
*
*
*
P(II | Rr )
probabilidades P(II |
Rr* ), P(I |
Rr* )
11
Grficamente la definicin anterior, representa lo siguiente, sea (0, 1) y trace una lnea
horizontal, que deje por debajo a todas las pruebas de tamao , se elige la que tenga menor valor de
la probabilidad del error tipo II, P(II | Rr ) .
P ( I | Rr )
1
*
** *
** *
*
***
**
*
* *
*
** * **
*
**
**
La mejor prueba de
tamao de todas
las mostradas
P(II | Rr )
Se puede observar que en caso de tener una prueba de tamao y * (0,1) , tal que * ,
entonces la prueba tambin es de tamao * . Esto se deduce inmediatamente del hecho que
P ( I | Rr ) * .
EJEMPLO 1.3
Determine qu tipo de prueba se trata, con respecto al tamao , resultante en cada uno de los dos
ejemplos anteriores.
Solucin
En el ejemplo 1.1, se encontr que con la particin X 760 y X 760 , la probabilidad del error tipo I
P(Error tipo I usando Rr | H 0 ) 0.0026.
As, es posible considerar que se trata de una prueba de tamao , para cualquier (0.0026, 1) .
En el ejemplo 1.2, se encontr que la particin X 752 y X 752 , la probabilidad del error tipo I
P(Error tipo I usando Rr | H 0 ) 0.0465.
Luego, es posible considerar que se trata de una prueba de tamao , para cualquier (0.0465, 1) .
De los ejemplos anteriores se puede observar que cada clculo de probabilidades se basa en la
particin del conjunto de realizaciones, la cual queda determinada por una acotacin con respecto a una
estadstica, en los ejemplos anteriores se us X .
Definicin 1.5
Sea el contraste de hiptesis para el parmetro
H 0 :
H1 :
Se llama estadstica de prueba, a la estadstica que se usa para determinar la regin de rechazo
y al valor que acota a la estadstica de prueba en la determinacin de la regin de rechazo se le
llama valor crtico5.
Casella George and Berger L. Roger. Statistical Inference. 2da Edicin pp. 374
12
Considere el tiempo de vida de los focos, stos tienen una distribucin normal N ( ,502 ) y se desea
obtener la mejor prueba para el contraste de hiptesis
H 0 : 750
H 1 : 750 ,
considerando una muestra aleatoria de 49 focos y como estadstica de prueba a X .
Solucin
Se detallarn los pasos de solucin que se repetirn para cualquier otra situacin.
Paso 1. Siempre que sea posible la estadstica de prueba deber ser uno de los estimadores puntuales
del parmetro involucrado en las hiptesis. Obviamente, se recomienda buscar entre los
estimadores de mxima verosimilitud, o entre aquellos que cumplan propiedades deseables de
un estimador puntual. En este ejemplo, el parmetro es la media de una distribucin normal,
luego es recomendable utilizar como estadstica de prueba a X .
Paso 2. A partir de la hiptesis nula se establece una regin de rechazo que sea razonable con la
prueba, estar basada en la hiptesis H 1 y la estadstica de prueba. En este caso se denota al
valor crtico por a, luego Rr (a) x | x a.
Paso 3. Determinando la expresin para la probabilidad del error tipo I, con ella se encuentran todas
las pruebas de tamao .
En el ejemplo que se est resolviendo para el clculo de probabilidades se tiene que la regin de
rechazo est dada por X a , por otro lado, el tamao de la muestra es n 49 , en este caso es posible
utilizar el Teorema de Limite Central.
#X
a
P(Error tipo I usando Rr | H 0 ) P( X a | 750) P!
| 750
! n 50 49
"
#
# #a
#a
P!! Z 7!
| 750 1
$!! 7!
para 750
" 50
"
" " 50
As, todas las pruebas de tamao para el problema estn dadas por:
# #a
1
$!! 7!
, para 750 .
" " 50
13
A partir de la expresin para calcular la probabilidad del error tipo I, se tiene tanto, al valor de a
como el de desconocidos, los cuales se buscan de tal manera que la prueba sea de tamao y
adems resulte la mejor prueba de tamao .
Paso 4. Para determinar los valores de a y que hagan a la prueba la mejor de tamao , se fija el
valor de a y con los valores del parmetro se acota el valor de a.
En esta parte se pueden utilizar las propiedades de las funciones montonas crecientes o
decrecientes para acotar los valores de a.
NOTA
Entre algunas otras propiedades de las funciones montonas se tienen las siguientes:
Si h(x) es una funcin montona creciente o decreciente, entonces tiene inversa.
Si h(x) es una funcin montona creciente, entonces h
1 (%) es montona creciente.
Si
Si
Si
Si
Si
50
1
$ (1
) para 750 .
7
Luego, buscando un valor de tal que la cota de a se cumpla para todos los valores 750 ,
def
50
1
$ (1
) 750 a * ( ) .
7
Paso 5. Determinando la expresin para obtener la probabilidad del error tipo II y todas las pruebas
de tamao que minimizan la probabilidad del error tipo II.
#X
a
P(Error tipo II usando Ra | H 1 ) P( X a | 750) P!
| 750
! n 50 49
"
a
#
# #a
#a
P!! Z 7!
| 750 $!! 7!
para 750
" 50
"
" " 50
Fijando y variando a para determinar el valor que minimiza la expresin para la probabilidad
# #a
del error tipo II, para toda 750 . Esto se logra determinando que $!! 7!
es decreciente
" " 50
para 750 , luego su mximo lo alcanza cuando es mnimo. Es decir,
14
# # a
750
# #a
# #a
$!! 7!
.
$!! 7!
max $!! 7!
" " 50
" " 50 750 " " 50
# # a
750
Buscando el valor de a que haga a la funcin $!! 7!
mnima para toda 750 , ya
" " 50
que esto minimiza la probabilidad del error tipo II. Lo cual ocurre para el valor ms pequeo de a, que
result a a * ( ) .
(x) ( x1 , x 2 , , x n ) )
NOTA
Rr (x) Rr ( x1 , x 2 , , x n ) )
Alexander M. Mood, Franklin A. Graybill y Duane C. BoesIntroduction to the Theory of Statistics.pp. 403
15
Definicin 1.7
Se llama funcin de potencia de la prueba7 a
( ) : ' 0,1, cuando
De la definicin resulta que a cada funcin de potencia le corresponde una prueba y viceversa.
Note que la funcin de potencia de la prueba se puede representar por el valor esperado de la
funcin de prueba con parmetro , puesto que
E (X) 1 % P (X) 1 | 0 % P (X) 0 | P (X) 1 |
( ) .
Para que una prueba de hiptesis sea buena, se debe disear de una forma que minimice los
errores de decisin. Esto no es tan sencillo como puede parecer, puesto que para un tamao de
muestra dado, el intento en disminuir un tipo de error va generalmente acompaado por un
incremento en el otro tipo de error. En la prctica, un tipo de error puede tener ms
importancia que el otro, luego, el decisor tiene que elegir el tipo de error que se fijar dndole
una mayor importancia. Una forma de reducir al mismo tiempo ambos tipos de errores es
incrementar el tamao de la muestra, lo cual no siempre puede ser posible.
Definicin 1.8
Una prueba se llama prueba de tamao , si (0,1) y sup
( ) y cuando se cumple
( ) P (X) 1 |
1
P (X) 0 |
1
P(Error tipo II | H 1 ) .
P(Error tipo II | H1 ) .
Definicin 1.9
Se llama potencia de la prueba a 1
, en donde
P(Error tipo II | H1 ) . Es decir,
Potencia de la prueba 1
( ) para
9.
De la definicin anterior, se puede notar que la potencia de la prueba es buena cuando la
probabilidad del error tipo II es pequea.
7
16
Note que la potencia de la prueba coincide con el valor de la funcin de potencia cuando el
parmetro
.
Qu representa la potencia de la prueba?
La potencia de la prueba cuantifica la probabilidad de rechazar la hiptesis nula cuando
sta es falsa. Es decir, rechazar la hiptesis nula acertadamente.
Del comentario anterior se puede notar que al llevar a cabo una prueba de hiptesis ser
recomendable trabajar, no slo con el tamao de la prueba, sino tambin con la potencia de la prueba.
Ahora es posible establecer cul ser la prueba ms deseable. Al llevar a cabo una prueba de
hiptesis la mejor funcin de prueba, dentese por * , es aquella cuya funcin de potencia
* ( )
es de tamao y su funcin de potencia resulte uniformemente mxima a todas las pruebas de
tamao . Es decir, * debe cumplir
1) sup
* ( ) .
2)
* ( )
( ) para
y toda funcin de prueba de tamao ( sup
( ) ).
Note que si se cumple la condicin 2), entonces es la funcin de prueba que tiene la mnima
*
probabilidad de error tipo II. Por otro lado, si existe tal prueba * , entonces se dice que * es la
prueba uniformemente ms potente de tamao (UMP())10. Grficamente se ilustra lo ocurrido
en la figura 1.3.
Ntese que en todas las pruebas son de tamao , mientras que en
la funcin de
prueba
* ( ) es superior a las dems funciones de prueba; por lo tanto, es mejor que las otras.
1
* ( )
retomando el caso de la vida promedio de los focos, stos tienen una distribucin normal N ( ,502 ) ,
considerando una muestra de 49 focos y las hiptesis
H 0 : 750 ,
H 1 : 750 ,
con la regin de rechazo establecida para medias mayores a 760. Es decir, con estadstica de prueba
T (X) X y el valor crtico a 760 , con (x) 1 si x 760 . Determinar:
a) La funcin de potencia de la prueba.
10
Alexander M. Mood, Franklin A. Graybill y Duane C. Boes. Introduction to the Theory of Statistics. pp. 411
17
b)
c)
d)
e)
Nivel de significancia.
Una expresin para la probabilidad del error tipo II.
Calcular la potencia de la prueba cuando 755 e interprete el resultado.
Calcular la potencia de la prueba cuando 770
e interprete el resultado.
Solucin
a) Se calcular la funcin de potencia, para esto se requiere la regin crtica Rr x | x R y x 760 .
En donde, la estadstica de prueba es T (X) X , resultando
# # 760
Es decir, la funcin de potencia es
( ) 1
$!! !
7 .
" " 50
b) El nivel de significancia
*
0
# # 760
# # 760
# # 760
750
sup
( ) sup )1
$!! !
7 / 1
inf $!! !
7 1
$!! !
7 0.081.
750
75050
" " 50 ""
" " 50
(
.
c) La probabilidad del error tipo II
Se sabe que la funcin de potencia,
( ) 1
para 750 , despejando a
.
6
# # 760
54
""
1
( ) 1
41
$!! !
50
3
# # 760
7 1 $!! !
7 para 750 .
21
" " 50
Regin de rechazo de
la prueba
750
755
760
Figura 1.4 Situacin cuando no est en la regin de rechazo del ejemplo 1.5 d)
Fuente: Elaboracin propia
18
Se espera que la mayora de los promedios muestrales estn alrededor de 755 . En estas
situaciones se dice que la prueba elegida no fue la ms adecuada.
e) La potencia de la prueba cuando 770
, ser
# # 760
770
1
(770) 1
$!! !
7 1
$(
1.40) 0.9192.
50
""
La interpretacin es similar a la del inciso anterior, pero considerando que la verdadera vida
promedio de los focos es de 770 horas, esto quiere decir que al tomar realizaciones de la muestra su
vida promedio estar en las proximidades de 770 y en la mayora de los casos se tendr que rechazar la
hiptesis nula al calcular la potencia. Por consiguiente, la potencia de la prueba ser alta, ver figura
1.5. Lo anterior resulta debido a que en la mayora de las realizaciones que se calcule la vida promedio
de los focos sta resultar mayor a las 760 horas (valor crtico).
Regin de rechazo de la prueba
750
760
770
Figura 1.5 Situacin cuando est en la regin de rechazo del ejemplo 1.5 e)
Fuente: Elaboracin propia
En estas situaciones se dice que la prueba elegida fue buena para un nivel de significancia del
8.1%.
1.8 APLICACIONES PARA EL CLCULO DEL TAMAO Y POTENCIA DE LA PRUEBA
EN EL CASO DE UN PARMETRO.
Note que en los ejemplos dados siempre se hace referencia a la estadstica de prueba como una
informacin del problema. Pero en la prctica, el conocimiento de dicha estadstica, en general, es
nulo. De hecho encontrar la estadstica de prueba en un problema, es uno de los temas centrales en las
pruebas de hiptesis. Como se ver en el captulo siguiente existen diferentes mtodos que pueden
llevar al decisor a determinar una estadstica de prueba. Pero, aunque ya se tiene una teora bien
estructurada sobre las pruebas de hiptesis resulta demasiado complicado encontrarla y an despus de
encontrarla puede ocurrir que no se tenga conocimiento sobre su distribucin, necesitando recurrir a la
Simulacin para establecer los valores crticos de la prueba. De hecho, dependiendo del problema que
se tenga la determinacin de la estadstica de prueba y sus valores crticos pueden ser temas de alguna
publicacin estadstica.
El objetivo de la presente seccin consiste en determinar, en casos simples, la estadstica de
prueba y sus valores crticos. Para tal efecto se har uso de las estadsticas suficientes de los
parmetros, mientras que para la prueba se considerar la que sea la ms lgica con respecto a la
hiptesis alterna y la estadstica de prueba.
EJEMPLO 1.6
Supngase que se tiene X 1 , X 2 , , X 10 una muestra aleatoria de variables uniformes en (0, ) y que
el decisor a formulado el contraste de hiptesis
H 0 : 5
H1 : 5
19
i 1
i 1
10
10
i 1
i 1
10
7 I ( xi , ) 7 I (0, xi )
10
xi , )
7 I (max
i
i 1
*# 4.2 1 0
10
# 4.2
, 4.2
( ) FYn (4.2; ) !
I ( 0, ) (4.2) )!"
"
- 1,
4.2
(
20
Figura 1.6 Funcin de potencia de la prueba para el valor crtico a 4.2 del ejemplo 1.6
Fuente: Elaboracin propia
c) Nivel de significancia
10
# 4.2
# 4.2
I ( 0, ) (4.2) !
5 "
" 5
10
sup
( ) sup !
0.1749
Esto se debe a que 1 es una funcin decreciente en , luego su mximo lo alcanza cuando
es mnimo.
d) La probabilidad del error tipo II
Se sabe que la funcin de potencia,
( ) 1
para 5 , despejando a
10
# 4.2
I ( 0, ) (4.2) , para 5 .
"
1
( ) 1
!
Es decir,
* # 4.2 1 0
)1
!" , para 4.2 5
4.2
0,
(
(4.79) !
10
0.2686 .
EJEMPLO 1.7
En el ejemplo anterior, suponga que el decisor establece un nivel de significancia del 5% y quiere
determinar el valor crtico correspondiente.
Solucin
21
Sea a el valor crtico, de forma similar al inciso (b) del ejemplo anterior se encuentra la funcin de
potencia de la prueba.
*# a 10
10
#a
( ) FYn (a; ) ! I ( 0, ) (a) )!" , a
"
- 1,
a
(
Luego, utilizando el resultado del inciso (c) del ejemplo anterior se tiene el nivel de significancia
de la prueba
10
10
#a
#a
sup
( ) sup ! I ( 0, ) (a) ! 0.05 .
5 "
"5
a 5 10 0.05 3.706 .
EJEMPLO 1.8
Suponga que el jefe de la delegacin Iztacalco del D.F. afirma que menos del 30% de sus habitantes
estn en contra de su nuevo proyecto para combatir la delincuencia. Considere que se realiza una
entrevista a una muestra de 25 habitantes y las hiptesis
H 0 : p 0.30
H 1 : p 0.30
Calcule:
a) la probabilidad de cometer el error tipo I cuando p 0.32 .
b) la probabilidad de cometer el error tipo II cuando p 0.28 .
Para esto defina las variables aleatorias X i para i 1, 2, ,25 , la persona entrevistada est en
25
8X
7.
i 1
Solucin
25
a) Para calcular las probabilidades, se tiene que la regin de rechazo est dada por T
8X
7 y la
i 1
b) Similarmente para calcular la probabilidad del error tipo II con Ra dada por T
8X
7.
i 1
Similarmente al inciso (a) para los clculos se utiliza la distribucin binomial acumulada
1
PT 7 | p 0.28 1
C025 (0.28) 0 (0.72) 25 C625 (0.28) 6 (0.72)19 9 1
0.4247 0.5753.
22
Suponga que se tiene una poblacin con distribucin normal de la que se conoce su varianza igual a 30
u2 y el contraste de hiptesis; H 0 : 54 contra H 1 : 54 . Adems se ha establecido la regin de
rechazo para x a .
a) Cul debe ser el valor crtico de la prueba, a, y de qu tamao se debe seleccionar la muestra
aleatoria si se quiere un nivel de significancia igual a 0.05 y una probabilidad de error tipo II de
0.01 cuando 50 ?
b) Qu papel toma la informacin referente al nivel de significancia.
Solucin
a) Este tipo de problemas tienen un grado de complejidad ligeramente superior a los anteriores, pero se
resuelve planteando las dos probabilidades que se dan como datos y con ellas se obtiene un sistema
de dos ecuaciones con dos incgnitas (valor crtico y tamao de la muestra). Luego, en este caso
resulta
#
# a
54
a
54
0.05 sup PRechazar H 0 | 54 P X a | 54 P! Z
n .
$!!
!
54
30 n
" 30
"
Note que el supremo de la probabilidad se alcanza en el extremo (justo por eso algunos autores
piden que los espacios paramtricos en la hiptesis nula sean cerrados), por tal razn se usa 54 .
Similarmente, para la probabilidad del error tipo II.
#
# a
50
a
50
1
$!!
0.01 1
PRechazar H 0 | 54 50 1
P X a | 50 1
P! Z
n .
!
30
n
30
"
"
Es decir,
# a
50
# a
50
0.01 1
$!!
n & $!!
n 1
0.01 0.99 .
30
30
"
"
Simplificando, las dos ecuaciones anteriores resulta el siguiente sistema de dos ecuaciones con
dos incgnitas.
*
# a
54
n
-0.05 $!!
" 30
)
# a
50
!
$
n
0
.
99
!
30
"
(
23
a
54
* $
1 (0.05) 30
*
1
n
n
-$ (0.05)
30
a
54
&
)
)
1
- $ (0.99) 30
-$
1 (0.99) a
50 n
n
-(
-(
30
a
50
$
(0.05)
$
1 (0.99) a 50$
1 (0.05)
54$
1 (0.99)
Finalmente,
a
50$
1 (0.05)
54$
1 (0.99)
$ (0.05)
$ (0.99)
50(
1.6449)
54(2.3263)
52.34 .
1.6449
2.3263
Ahora para el tamao de la muestra se utiliza alguna de las dos ecuaciones originales, por
ejemplo
$
1 (0.99) 30
n
a
50
# 2.3263: 30
29.65 .
& n!
! 52.34
50
"
Concluyendo que la constante crtica debe ser igual a 52.34, mientras que el tamao de la
muestra de 30.
b) La informacin sobre el nivel de significancia da un valor del parmetro para calcular la
probabilidad del error tipo I. Es decir, la informacin sobre el nivel de significancia se puede sustituir
por algn valor del parmetro dentro de , mientras cumpla con H 0 .
EJEMPLO 1.10
Suponga que X 1 , X 2 ,, X n constituyen una muestra aleatoria de una distribucin uniforme sobre el
intervalo (0, ) y se han de contrastar las siguientes hiptesis.
H 0 : 2
H1 : 2
n
1
Recuerde que F ( y ) ;
0
dx
( y)
#1 # y
( y ) n! !
" "
n
1
# 1
n! n y n
1 .
"
De tal forma
1.5
( ) ; n
0
n
1
yn
dy n %
n
n
1.5
0
1.5n #! 1.5
n
"
.
H 0 :
H1 :
Como H 0 : si y slo si 2
n
# 1.5
Del inciso a) resulta que
( ) ! , esta funcin es montona decreciente con respecto a
"
, por lo tanto, el mximo se alcanza en el valor ms pequeo de , en este caso cuando 2 , luego
n
# 1.5
n
max
! 0.75 ,
" 2
( x) )
y 7 y 1
2 y6
( p) P ( X) 1 p P 7 Y 1
PY 7 PY 1 1
PY 6 PY 1
6
# 20
20
y
1
8 !! p y 1
p
y 2 " y
Grficamente quedara de la siguiente manera:
25
p
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Potencia
1.000
0.394
0.156
0.400
0.751
0.942
0.994
1.000
1.000
1.000
1.000
Figura 11.77 G
Fi
Grfica
fi dde la
l ffuncin
i dde potencia
t i dde la
l
prueba del ejemplo 1.11
Fuente: Elaboracin propia
6
# 20
Como
( p) 1
8 !! p y (1
p) 20
y y consiste de un solo valor, p 0.2 , resulta que el
y 2 " y
tamao de prueba es:
6
# 20
(0.2) 1
8 !! 0.2 y 0.820
y 1
0.9133
0.0692, 1
0.8441 0.1559
y 2 " y
EJEMPLO 1.12
Suponga que X 1 , X 2 , , X n constituyen una muestra aleatoria de una distribucin normal cuya media
es desconocida y con varianza 1. Adems, 0 un nmero especfico y se han de contrastar las
siguientes hiptesis
H 0 : 0
H1 : 0
Finalmente, supngase que el tamao muestral n es 25 y considere un procedimiento de
contraste, tal que no se rechace H 0 cuando | xn
0 | c . Determine el valor de c tal que el tamao del
contraste sea 0.05.
Solucin
La funcin de prueba para este caso queda para una realizacin x n de X n es
*1, si | xn
0 | c
(0 si | xn
0 | c
( x) )
P X 1 P| X n
0 | c
1
P| X n
0 | c
# 1
Como X i ~ N ,1 resulta que X n ~ N ! , , luego
" n
26
*- X
n
0
1
P )
-( 1
c 0/
1 n -.
1
n c
n c ,
1
n c
1
n c ,
2
2 n c 2
n c
1
P | Z | n c
Ahora se calcula el tamao de la prueba. Para esto se desea calcular max ( ) , como
1 #
nc ! & c
"2
#
1 !
" 2
n
2
, luego
EJEMPLO 1.13
Solucin
i) La funcin de prueba es:
n
*
1
,
si
xi 6
8
-i 1
( x) )
n
-0, si 8 xi 5
-(
i 1
Entonces la funcin de potencia resulta ser
* 10
0
* 10
0
( ) P ( X) 1 P )8 X i 6 / 1
P )8 X i 5 / .
( i 1
.
( i 1
.
10
# 10
1
8 !! y 1
10
y
y 0
"y
27
0.02
0.04
0.06
0.08
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
Potencia
0.0000
0.0000
0.0000
0.0000
0.0001
0.0064
0.0473
0.1662
0.3770
0.6331
0.8497
0.9672
0.9984
1.0000
ii) Para el tamao de la prueba se tiene que calcular max
( ) , como H 0 : y 1 2 , entonces
EJEMPLO 1.14
Solucin
La funcin de prueba es
*1, si x C
(0, si x < C
x )
El contraste de hiptesis resulta
H 0 : 1
H1 : 1
28
x2
1
x2 34 x1
34
12
14
14
12
1 x1
34
( ) PX C ;
;f
x1 , x2
( )dx2 dx1 .
0 3
x1
4
Como se trata de una muestra aleatoria, se tiene que la funcin de densidad conjunta
,
f X1 X 2 (x; ) f X1 ( x1 ; ) f X 2 ( x 2 ; ) x1
1 I 0,1 ( x1 ) x 2
1 I 0,1 ( x 2 )
2 x1
1 x 2
1 I 0,1 ( x1 ) I 0,1 ( x 2 )
# x 2
( ) ; ; 2 x1
1 x 2
1 dx2 dx1 ; 2 x1
1 !!
0 3
x1
4
"
1
3 4 x1
dx1
; x1
1 1
34 x1 dx1 ; x1
1
3 4 x12
1 dx1
0
2
6
3
1
x
4 x1
= 3 4 1 1 10 1
3 4
2
2
=
5
2
Para el tamao de la prueba se obtiene el mximo de la funcin de la funcin de potencia:
* 1
0
max
( ) max
( ) max)1
3 4 / .
1
1 (
2
.
*
(
alcanza su mnimo, 1 .
1
3 4 0/ se alcanza cuando 3 4
2
.
1
* 1
0
max
max)1
3 4 / 1
3 4 1
3 8 5 8 .
>
1 (
2
2
.
29
NOTA
As J
1
*w x1 x2
*x u
Sea T )
; entonces T
1 ) 1
(u x1
( x2 u w
u w 2 , por lo tanto la funcin de densidad conjunta
f W ,U (w; u) 2
u 2
1
, 0uw
w 1
12
0
1
1 2 .
max 1
1 2
se alcanza cuando 1 2
alcanza su mnimo, 1
1
1
30
EJEMPLO 1.16
1 1 . Para la prueba
H 0 : 0
H1 : 0
( x) )
Por otro lado,
H 0 : 0
H1 : 0
Realizando los clculos para la funcin de potencia resulta
( ) P ( X) 1 PX 1 2 1
PX 1 2 1
1
x 1
x
2
1
1 2
12
0
1
4
12
; 2x 1
dx
, 1
1 2,
0
1
2
1
4
1 2 14
1, 0 ,
0
EJEMPLO 1.17
,
,
,
,
( ) P ( X) 1 P Yn < 0 , 0 1
P Yn 0 , 0 1
;f
Yn
( y )dy .
0 n
31
Como se sabe
f Yn ( y ) nf ( y ) F n
1 ( y ) n
1#y
!
"
n
1
n
y n
1
, sustituyendo en la expresin
anterior, se tiene
( ) 1
0 n
ny n
1
n= y n
dy 1
n
n=
0
0 n
n
0
n
0
0n
#
1
n [
] 1
n (1
) 1
!! 0 (1
) .
"
1
Note que 0 n 1
, se obtiene al resolver
( ) 0 .
b) Para trazar la grfica se evala la funcin de potencia sustituyendo los valores dados,
0.95
obteniendo
( ) 1
6 , para 6 0.95 .
Potencia
1.00
1.10
1.20
1.30
1.40
1.50
1.60
1.70
1.80
1.90
2.00
2.10
2.20
2.30
2.40
2.50
2.60
2.70
2.80
0.0500
0.4637
0.6818
0.8032
0.8738
0.9166
0.9434
0.9606
0.9721
0.9798
0.9852
0.9889
0.9916
0.9936
0.9950
0.9961
0.9969
0.9975
0.9980
32
Captulo 2
Pruebas de hiptesis y lema de NeymanPearson
Introduccin
33
Definicin 2.1
Una hiptesis se llama simple, si el conjunto de parmetros que le corresponde contiene un slo
elemento. Por ejemplo, H 0 : se llama hiptesis simple si 0 , similarmente
H1 :
es una hiptesis simple si
1 21.
Se dice que se tiene un juego de hiptesis simple contra simple. Luego, si es una funcin de
prueba, entonces las probabilidades de los errores estn dadas de la siguiente forma:
P(Error tipo I, usando ) P( ( X) 1 | 0 )
P(Error tipo II, usando ) P( ( X) 0 | 1 )
A partir de la presente seccin inicia la formulacin y prueba de hiptesis. Por tal razn, ha
llegado el momento de dar respuesta a la pregunta:
Cmo establecer las hiptesis nula y alterna en un problema particular?
Cuando se habla sobre la mejor prueba se tienen algunos aspectos muy importantes:
1) La prueba se encuentra con base en la filosofa de rechazar la hiptesis nula (ver tamao de la
prueba). Puesto que se busca la probabilidad de cometer el error tipo I, rechazar la hiptesis nula
siendo que es verdadera.
2) Para determinar el nivel de significancia de la prueba, ste se ha definido con base en el supremo
sup
* ( ) , aunque en algunas literaturas emplean el mximo en lugar del supremo, en cuyos
casos es importante establecer la parte del espacio paramtrico bajo la hiptesis nula, , puesto que
si el conjunto es abierto y la funcin de potencia
( ) es montona, entonces no tendr mximo,
puesto que ste se encuentra en la frontera del conjunto, situacin que no ocurre con el supremo. En
el captulo previo se hizo notar que en caso de conjuntos cerrados supremo y mximo coinciden.
3) Posteriormente, de dichas pruebas se elige la que tenga mayor potencia.
As, del aspecto 1 anterior, el investigador est trabajando con la filosofa de rechazar H 0 , por
consiguiente en la hiptesis alterna plantea la conjetura que quiere probar. Por otro lado, del
aspecto 2 hay que tener cuidado de establecer un conjunto cerrado en , razn que da origen a
proponer la hiptesis nula con la aseveracin del parmetro con el signo de relacin , .
EJEMPLO 2.1
Sea una variable aleatoria con distribucin binomial X ~ Bin(2, ) y el espacio 0.25, 0.60 y se
desea probar que 0.60 .
a) Plantee el juego de hiptesis del problema.
b) Determine cuntas y cules pruebas se pueden construir para el problema, que resulten de la
combinacin de valores de la variable X 0, 1, 2 .
Solucin
a) Se desea probar que 0.60 , luego el contraste de hiptesis ser:
21
Alexander M. Mood, Franklin A. Graybill y Duane C. Boes. Introduction to the Theory of Statistics. pp. 415
34
H 0 : 0.25
H 1 : 0.60
b) Como la variable aleatoria X tiene una cantidad finita de resultados y el espacio paramtrico tambin
es finito, 0.25, 0.60 , esto quiere decir que la cantidad de particiones que se pueden formar es
finita. Adems, cada particin tiene dos opciones rechazar o no rechazar. Luego, la cantidad de
pruebas que se pueden construir est dada, por 2 #( X ) , en donde # ( X ) representa la cardinalidad de
X. Es decir, si X 0, 1, 2 , entonces se tiene 2 3 8 pruebas, las que es posible listar y calcular
las probabilidades de los errores tipo I y II, tal y como se muestra en la tabla 2.1
.
P( (X) 0 | 0.60)
Prueba
nunca
*1,
(0, x 0, 1, 2
*1, x 0
(0, x 1, 2
x 1
*1,
(0, x 0, 2
*1, x 2
(0, x 0, 1
*1, x 0, 1
(0, x 2
*1, x 0, 2
x 1
(0,
*1, x 1, 2
(0, x 0
*1, x 0, 1,2
(0, nunca
1 ( x) )
2 ( x) )
3 ( x) )
4 ( x) )
5 ( x) )
6 ( x) )
7 ( x) )
8 ( x ) )
Tabla 2.1 Posibles pruebas para cuando X 0, 1, 2 y clculo de los errores tipo I y II del ejemplo 2.1
35
Grficamente se pueden representar las pruebas anteriores, si en el eje de las abscisas se ponen
las probabilidades del error tipo II y en el eje de las ordenadas las probabilidades del error tipo I. Ver
figura 2.1.
Figura 2.1. Probabilidades de los errores tipo I y II de las 8 pruebas posibles del ejemplo 2.1
Fuente: Elaboracin propia
? 8 ? i i con
i 1
8? i 1 y ? i 0
i 1
Definicin 2.2
La prueba se llama pura, si los nicos valores que puede tomar son 0 y 1,
: R ' 0, 1 , y se llama prueba aleatorizada cuando ? : R ' 0, 1, 22.
Note que el conjunto de todas las pruebas aleatorizadas es un conjunto convexo, en el caso
anterior el conjunto convexo de pruebas aleatorizadas se muestra en la figura 2.2.
22
36
Figura 2.2. Conjunto convexo de las pruebas aleatorizadas del ejemplo 2.1
Fuente: Elaboracin propia
En general, una funcin de prueba ser tal que : R ' 0, 1, y el valor de (X) se puede
interpretar como la probabilidad de rechazar H 0 . Es decir, si en una prueba aleatorizada:
Con las pruebas aleatorizadas es posible reconocer a las pruebas admisibles, entendiendo por
stas a todas las pruebas aleatorizadas que se encuentran en la frontera del conjunto convexo que estn
del lado del origen de coordenadas en la grfica de las probabilidades de los errores I y II. Ver figura
2.3 para el ejemplo de la distribucin binomial.
37
Para esto se requiere de un mtodo que sea estadsticamente razonable en la comparacin de las
verosimilitudes de las hiptesis nula y alterna. Luego, recordando los estimadores de mxima
verosimilitud, que involucran a los parmetros y las variables aleatorias, parece lgico proponer una
razn de verosimilitudes entre las funciones de verosimilitud para cada uno de los valores de los
parmetros segn sea la hiptesis nula o alterna. Es decir, se debe estudiar la razn
( x)
Lx ( 0 )
Lx (1 )
f (x; 0 )
f (x;1 )
( x) )
38
En donde, k es el valor crtico, note que (X) es la estadstica de prueba con la que se tomar la
decisin de rechazar o no la hiptesis nula.
Definicin 2.3
Una prueba basada en una realizacin x de X, con X ~ f (x; ) para probar
H 0 : 0
H 1 : 1
Se llama prueba de razn de verosimilitudes de tamao 23, si existen dos valores k 0 y
c 0, 1, , tales que
*1, si (x) k
*1, si (x) k
(x) )c, si (x) k para X discreta; (x) )
para X continua
(0, si (x) k
-0, si (x) k
(
H 0 : X ~ f (x; 0 )
H 1 : X ~ f (x; 1 )
f (x; 0 )
f (x; 1 )
NOTA
El lema da respuesta a la existencia de la prueba MP(), pero no indica cmo encontrar los
valores c y k, as como la distribucin de la estadstica de prueba (X) , problema que en la
prctica suele complicarse.
Demostracin
Denotando f (x; 0 ) f 0 (x) y f (x;1 ) f1 (x) . Luego para fijada y tomado el valor de k tal que
P X k f 0 P X k f 0 P X k f 0 P X k f 0 .
Con el valor k que da solucin a las desigualdades, existe c 0,1, , tal que
23
24
39
NOTA
1.
2.
De esta forma sencilla se est introduciendo una tcnica que sirve para calcular las
constantes crticas k y c.
Cuando (x) es continua, la P X k f 0 0 y P X k f 0 .
Observe que
f 0 , puesto que por definicin
Es decir, se tiene una prueba de tamao para . Falta demostrar que para cualquier otra
prueba de tamao su potencia no podr ser mayor a la de .
Suponga que es otra prueba de tamao ; es decir, E f 0 [ (X)] , y defina los conjuntos
que formen una particin de X .
A x X : (x) k
B x X : (x) k
D x X : (x) k
Considere la diferencia de las funciones de potencia
(x)f (x)dx
f 1
f 1 E f1 ( X)
E f1 ( X) E f1 ( X)
( X)
; ( x)
X
; (x)
(x) f 1 (x)dx ; (x)
(x) f 1 (x)dx ; (x)
(x) f 1 (x)dx
A
; (x)
f 0 ( x)
f ( x)
f ( x)
, luego
& 0
k & f 1 ( x) 0
f 1 ( x)
f 1 ( x)
k
f k(x) dx 1k ; (x)
(x) f 0 (x)dx .
Para la integral en B
Se sabe que B x X : (x) k y (x)
; (x)
f 0 ( x)
f ( x)
f ( x)
, luego
& 0
k & f 1 ( x) 0
f 1 ( x)
f 1 ( x)
k
(x) f1 (x)dx
1
(x)
(x) f 0 (x)dx .
;
kB
Para la integral en D
Primeramente note que en D, (x) k , por consiguiente (x) 0 , luego
f ( x)
f ( x)
f ( x)
f ( x)
& 0
k & f 1 ( x) 0
&
f 1 ( x)
0
( x) 0
, as se tendr
f 1 ( x)
f 1 ( x)
k
k
; (x)
(x) f1 (x)dx ; 0
(x) f1 (x)dx
D
1
(x)
(x) f 0 (x)dx .
;
kD
f1
f1
1
1
1
(x)
(x) f 0 (x)dx ; (x)
(x) f 0 (x)dx ; (x)
(x) f 0 (x)dx
;
kA
kB
kD
1
1
1
(x)
(x) f 0 (x)dx E f 0 ( X)
( X)
0
;
kX
k
k
Con la siguiente metodologa es posible determinar las pruebas MP() para el caso de variables
aleatorias continuas.
Metodologa para determinar la estadstica de prueba y el valor crtico de un contraste
H 0 : 0 contra H 1 : 1 ; simple contra simple para variables aleatorias continuas
Paso1. Determine la funcin de verosimilitud Lx ( ) f (x; ) .
Paso 2. Encuentre la razn de verosimilitudes, (x)
Lx ( 0 )
Lx (1 )
f (x; 0 )
f (x;1 )
Paso 3. A partir de (x) k y transformaciones elementales determine una estadstica de prueba que
tenga una distribucin conocida. Generalmente al aplicar este mtodo la estadstica de prueba
coincide con la estadstica suficiente para el parmetro.
Paso 4. Con base en la estadstica de prueba encontrada en el paso anterior y el hecho de que
Sea X 1 , X 2 , , X n una muestra aleatoria de @(4,
) y suponga que el espacio paramtrico de inters
est dado por 2, 3 y se desea probar el contraste de hiptesis
H0 :
2
H1 :
3
a) Siguiendo los pasos mencionados arriba para determinar tanto el estadstico de prueba como la
constante crtica.
Paso1. La funcin de verosimilitud
xi4
1e
xi
8 xi
xi3
I (0 x i ) .
7
4
4 n i 1 @(4)
i 1
i 1 @( 4)
Note que es de inters conocer los factores que contienen al parmetro, puesto que aquellos
factores que no los tengan sern eliminados al tomar la razn de verosimilitud, por tales razones en la
prctica no se ponen en forma explcita, simplemente se representan por medio de una funcin. Por
n
xi3
ejemplo, en este caso se puede denotar por: A (x) 7
I (0 xi ) , luego
i 1 @( 4)
n
L( ; x) f (x; ) 7 f ( xi ; ) 7
I (0 x i )
f (x; )
i 1
8 xi
i 1
A ( x) .
4n
4n
e
L (2) f (x;2)
( x) X
LX (3) f (x;3)
i 1
A ( x)
i 1
34n
3 2 e
4n
8 xi 13 8 xi
i 1
i 1
3 2 e
4n
8 xi
i 1
xi
A ( x)
(x) 3 2 e
4n
8 xi
i 1
& e
8 xi
i 1
k , con k k 2 3
i 1
i 1
4n
&
Luego, una posible estadstica de prueba sera 8 X i , para considerarla como estadstica de
i 1
prueba se tiene que conocer su distribucin, o seguirla transformando hasta encontrar una estadstica
con distribucin conocida.
NOTA
En caso de no conocer la distribucin es cuando el problema suele complicarse y aunque se
sabe, por lema de Neyman-Pearson, que la prueba MP() existe es posible que no se pueda
localizar y en estos casos se suele hacer uso de la simulacin.
De las distribuciones muestrales es conocido que si X i ~ @(4,
) , entonces para una muestra
n
el nico problema reside que en general no se tienen tablas estadsticas para esta distribucin, pero si es
transformada a una ji-cuadrada de ella si existen tablas estadsticas. Luego,
n
i 1
8 X i ~ @(4n, ) +
2
8 X i ~ @(8n 2 ,2) 8n Ji cuadrada con 8n grados de libertad.
i 1
42
Finalmente, asignndole un valor a
(esto se debe a que una estadstica no debe depender del
parmetro), resulta la estadstica de prueba
i 1
0
* 2 n
2
Rr )x | 8 xi k * / , bajo H 0 , en donde k * k .
.
(
i 1
Paso 4. Con base en la estadstica de prueba encontrada en el paso anterior, y el hecho de que
"
"
i 1
i 1
1
F 2 (k )
*
8n
Es decir, F 2 (k * ) 1
, finalmente k * F
21 (1
) .
8n
8n
As, del lema de Neyman-Pearson se concluye que dada una realizacin x, la prueba MP(), para
el contraste de hiptesis
H0 :
2
H1 :
3
Rechazar H 0 :
2 , si 8 xi k * F
21 (1
) .
i 1
8n
80
10
10
*
8 xi 72.267 k 101.88
i 1
Por lo tanto, con los datos de la realizacin no se tienen evidencias para rechazar H 0 :
2 .
EJEMPLO 2.3
Suponga que para el investigador del ejemplo anterior es fundamental trabajar con distribuciones
gamma, por consiguiente l quisiera tener una frmula para decidir de forma metdica su problema.
Es decir, sea X 1 , X 2 , , X n una muestra aleatoria de @( 0 ,
) y suponga que el espacio paramtrico
de inters est dado por a, b y se desea probar el contraste de hiptesis
H0 :
a
H1 :
b
Encuentre una regla de decisin para las pruebas de tamao , en donde 0 , a, b y n son
valores conocidos de antemano y positivos, adems a b .
Solucin
Siguiendo los pasos mencionados arriba para el estadstico de prueba y la constante crtica.
Paso1. La funcin de verosimilitud
43
i 1
i 1
L( 0 , ; x) 7 f ( xi ; 0 , ) 7
xi
I (0 x i )
@( 0 ) 0
8 xi
i 1
0n
xi 0
1
I (0 x i )
7
i 1 @ ( 0 )
n
8 xi
i 1
A ( x, 0 )
0n
xi 0
1
i 1
@( 0 )
( x)
0
1
xi
f (x; 0 , a)
f (x; 0 , b)
1 n
xi
a i 1
a
I (0 x i )
0n
1 n
xi
b i 1
A (x, 0 )
b 0n
#b
!
"a
0n
1 n
1 n
xi
xi
a i 1
b i 1
#b
!
"a
0n
b
a n
xi
a b i 1
A ( x, 0 )
(x) ba
0n
b
a n
xi
a b i 1
& e
b
a n
xi
a b i 1
k , con k k a b
0n
&
b
a n
8 xi k , con k ln(k )
ab i 1
En donde resultan dos casos.
ab
*n
-- 8 xi k , si b a con k
b
a k
i 1
)n
- 8 x k , si b a con k
ab k
-(i 1 i
b
a
n
*
0
Rr *
)x | 8 xi k , si b a / , bajo H 0 .
( i 1
.
n
n
*
0
Rr *
)x | 8 xi k , si b a / , bajo H 0 .
( i 1
.
Paso 4. Con base en la estadstica de prueba encontrada en el paso anterior, la regla de decisin:
Caso 1. Si b a
44
#n
" i 1
( a ) P ( ( X ) k |
a ) P ! 8 X i k * |
a , y b a
#n
1
P! 8 X i k * |
a, y b a 1
F@ ( n 0 ,a ) (k * )
" i 1
Rechazar H 0 :
a , si 8 xi k * F@
(1n 0 ,a ) (1
) .
i 1
Caso 2. Si b a
" i 1
F@
(1n 0 ,a ) (
Rechazar H 0 :
a , si 8 xi k * F@
(1n 0 ,a ) ( ) .
i 1
EJEMPLO 2.4
Sea X 1 , X 2 ,, X n una muestra aleatoria de @(2,
) ,
{1,2} se desea probar la hiptesis
(simple contra simple)
H0 :
1
H1 :
2
Solucin
Utilizando el resultado anterior con 0 2 , a 1 y b 2 , se cumplen las condiciones del caso 1,
luego la regla de decisin
n
Rechazar H 0 :
1 , si 8 xi k * F@
(12 n,1) (1
) .
i 1
En caso de desear trabajar con la distribucin Ji-cuadrada, note que la prueba (x) 1 si
n
i 1
2
4n
i 1
i 1
P )28 X i k1
1/ 1
P )28 X i k1
1/ .
45
* n
0
Luego, P )28 X i k1
1/ 1
F 2 k1 & k1 42n (1
) FY 42n (1
) .
4n
( i 1
.
2
Es el percentil 1
de la distribucin 4n , es decir 1
P Y 42n (1
) , donde Y ~ 42n
RESUMEN
a) El problema consiste en como plantear la prueba, para que en base a una estadstica se encuentre k.
b) Cuando la distribucin es continua, c 0, no as en la discreta.
c) Generalmente, la prueba de la razn de verosimilitud va a estar en funcin de la estadstica
suficiente.
EJEMPLO 2.5
Sea
X 1 , X 2 , , X n
f ( x; ) xe
2
H0 : 1
H1 : 2
Solucin
Paso1. Se determina la funcin de verosimilitud
n
L X ( ) 7 f ( xi ; ) 7 2 xi e
xi I ( 0, ) ( xi ) 2 n e
8 xi
i 1
A ( x)
i 1
i 1
Lx ( 0 )
Lx (1 )
f (x; 0 )
f (x;1 )
8 xi
8 xi
8 xi
L ( 1) 12 n e i 1 A (x)
( x) X
2
2 n e i 1 4
n e i 1
n
L X ( 2)
2 8 xi
2 2 n e i 1 A (x)
8 xi
4
n e i 1 k & 8 xi k ; k ln(4 n k )
i 1
8 X i ~ @(2n,1 )
i 1
i 1
i 1
i 1
1 & 8 X i ~ @(2n,1) & 28 X i ~ @(4n 2 ,2) 42n & P{2 8 X i k } 42n (k )
Despejando a la constante crtica, resulta k 4
n1 ( ) . Finalmente la regla funcin de prueba para la
MP() es
*1, si
(0, si
( x) )
y 4
n1 ( )
;
y 4
n1 ( )
Y 28 X i ~ 42n
i 1
EJEMPLO 2.6
i 1
i 1
LX ( ) 7 f ( xi ; ) 7 xi
Lx ( 0 )
Lx (1 )
n#
I ( 0,1) ( xi ) !! 7 xi A (x)
" i 1
f (x; 0 )
f (x;1 )
, con n 2
( x)
Lx (1)
L x ( 2)
# 2
12 !! 7 xi A (x)
" i 1
2
# 2
2 2 !! 7 xi A (x)
" i 1
1
2 % x1 % x 2
2
1
4k , resulta
x1 % x 2
ln(x1 % x2 ) ln(4k ) k1 +
ln(x1 )
ln(x2 ) k1
De las relaciones entre las transformaciones de la distribucin beta y gama, se sabe que
X ~ Beta( ,1) +
ln( X ) ~ @(1,1 ) .
47
f Y ( y) f (e
y )e
y (e
y )
1 e
y e
y & Y ~ @(1,1 ) .
Que es la acumulada de la 42 .
Aproximando, se encuentra el valor de k 2 1.386296. As
*1, si
2(ln(x1 ) ln(x 2 )) 1.3863
(0, si
2(ln(x1 ) ln(x 2 )) 1.3863
( x) )
[
xe
e ] | 1
k1 e
k1
0
k1
k1
12 (1
log(2))
Resolviendo la ecuacin 1
k1e
k1
e
k1 12 (1
ln(2)) resulta k1 9 0.693147. Luego,
*1, si
ln(x1 )
ln(x 2 ) 0.693147
(0, si
ln(x1 )
ln(x 2 ) 0.693147
( x) )
( x) )
( x) )
Con k 2 e
k1
48
P{Error tipo . I | 1} P{ X 1 X 2 k 2 | 1}
P{Error tipo II | 2} P{ X 1 X 2 k 2 | 2}
Para calcular las probabilidades se necesita la distribucin de X 1 X 2 . Para esto se realiza la
transformacin
* Y X1
T:) 1
(Y2 X 1 X 2
por lo que J T
1
X 2 Y2 Y1
y2 y
2
1
1 y1
1 y1 .
Para determinar los lmites se utiliza la grfica de la transformacin, para esto ntese que
x1 [0,1] & y1 [0,1]; x2 [0,1] & 0 y2 y1 1 & 0 y2 y1 .
X2
Y2
Y1 Y2
X1
Y1
f Y2 ( y 2 ) ; 2 ( y 2 )
1 %
y2
dy1
y1
2 y 2
1 % ln y1 |1y2
2 y 2
1 ln y 2 .
49
P{ X 1 X 2 k 2 | 1} P{Y2 k 2 | 1}
; ln y 2 dy2
[ y 2 ln y 2
y 2 ] k
1
k2
[0
1] [k 2 ln k 2
k 2 ] 1
k 2 k 2 ln(k 2 )
k2
P{ X 1 X 2 k 2 | 2} P{Y2 k 2 | 2} ; (
4 y 2 ln y 2 )dy2
0
4[ y ln y 2 2
y
2
2
2
2
4]
k2
y 2 '0
4[k 22 ln k 2 2
k 22 4] 4[0
0]
k 22
2k 22 ln(k 2 )
Se quiere maximizar y
.
En general max(a, b) ((a b) | a
b |) 2 , en particular como y
son mayores o iguales a
cero, entonces max( ,
) ((
) |
|) 2 se obtiene cuando
0 &
.
De esta forma resulta la ecuacin:
1
k 2 k 2 ln(k 2 ) k 22
2k 22 ln(k 2 )
( x) )
x1 x 2 0.312118719
x1 x 2 0.312118719
( x) )
Adems que
log( X 1 )
log( X 2 ) Z ~ @(2,1 ) , de tal forma que:
*1, si z k1
(0, si z k1
( x) )
k1
P{Z k1 | 1} ; ze
z dz 1
k1e
k1
e
k1
0
P{Z k1 | 2} ; 4 ze
2 z dz 2k1e
2 k1 e
2 k1
k1
Por la misma razn que en este inciso el mnimo del ms grande de y
, se obtiene cuando
, es decir
1
k1e
k1
e
k1 2k1e
2 k1 e
2 k1 .
50
Como
ln(x1 x2 ) k1 y x1 x2 (0,1) , entonces ln(x1 x2 ) 0 , luego
ln(x1 x2 ) 0 , y finalmente
k1 9 1.164152296 .
Lo cual coincide con la relacin k 2 e
k1 e
1.164152296 0.31218719 .
EJEMPLO 2.7
encuentre la prueba que minimice
, donde y
son los tamaos de los errores tipo I y tipo
II, respectivamente.
Solucin. El desarrollo para esta distribucin ya se hizo, de tal forma se simplifican los clculos.
a) Ntese que se tiene una prueba simple contra simple, as, por el lema de Neyman y Pearson resulta
*1, si (x) k
( x) )
(0, si (x) k
En este caso, c 0 por ser continua la funcin de densidad. En donde
1
Lx ( 0 ) f (x; 2) x 2
( x)
2 x k & x k 2 k1
Lx ( 1 )
f (x; 1) x
1
1
E 2 { ( X)} P{ X k 2 | 2} ;
k 2
;
k 2
(x
1 )
2
dx
(2 x)dx x 2 | 0k 2 x 2 | 0k 2 k1
k12
(x) )
b) Del inciso anterior se obtuvo
*1, si x k1
(0, si x k1
( x) )
Por otro lado, por definicin de los errores
51
k1
; 2 xdx ; dx k12 1
k1 k12
k1 1
Para minimizar este valor se tiene que k12
k1 1 (k1
1 2) 2 3 4 es una parbola que abre
hacia arriba, por lo tanto, en k1 1 2 se tiene un mnimo. As,
tiene un mnimo en k1 1 2 y
vale 3 4 .
NOTA
El problema se puede resolver aplicando la metodologa del Clculo, es decir encontrando
d (
)
por mnimos y mximos relativos. Se tiene que
2k1
1 0 & k1 1 2 . Ahora, si
dk1
se quiere saber si es mximo o mnimo se aplica el criterio de la segunda derivada, a saber,
d 2 (
)
2 0 & k1 1 2 , se trata de un mnimo y vale (1 2) 2
1 2 1 3 4 .
2
dk1
EJEMPLO 2.8
1 1 .
encuentre el contraste que minimice
, donde y
son los respectivos tamaos de los errores
tipo I y tipo II.
Solucin. Se trata de una sola observacin y Lx ( ) f ( x; ) , los clculos se simplifican.
a) Se trata de una prueba simple contra simple, as por el lema de Neyman y Pearson resulta
*1, si (x) k
(0, si (x) k
( x) )
En donde
( x)
Lx ( 0 ) f (x; 0) (2x 1
) | 0
1
k & x 1 k1
2k
Lx (1 ) f (x; 1) (2x 1
) | 1 2 x
Luego,
*1, si x k1
(0, si x k1
( x) )
Para calcular k1 , se tiene
k1
k1
E 0 { ( X)} P{ X k1 | 0} ; (2x 1
) | 0 dx ; dx 1
k1
52
de donde k1 1
. Por lo tanto, la prueba ms potente es
*1, si x 1
(0, si x 1
( x) )
b) De forma similar que en (6b) resulta
*1, si x k1
(0, si x k1
( x) )
Adems,
P{ ( X) 1 | 0} P{ X k1 | 0} ; dx 1
k1
k1
k1
( x) )
53
c
P( ( X) k | 0 )
.
P( ( X) k | 0 )
Las expresiones anteriores se pueden sustituir por sus equivalentes al determinar la estadstica de
prueba, T (X) , puede ocurrir que (X) k sea equivalente alguno de los siguientes casos.
Caso 1. Cuando (X) k + T (X) k * , entonces los valores de la constante crtica, k * y el de
c, se obtienen de la siguiente forma.
La constante crtica k * es un valor de la variable aleatoria de la estadstica de prueba, tal que
P ( ( X) k
1 | 0 ) P ( ( X) k | 0 ) +
P(T ( X) k *
1 | 0 ) P(T ( X) k * | 0 )
P(T ( X) k *
1 | 0 )
P( ( X) k
1 | 0 )
c
.
P( ( X) k | 0 )
P(T ( X) k * | 0 )
P(T ( X) k * 1 | 0 )
P( ( X) k
1 | 0 )
c
P( ( X) k | 0 )
P(T ( X) k * | 0 )
c
1
P(T ( X) k *
1 | 0 )
P(T ( X) k * | 0 )
Sea X 1 , X 2 ,, X n una muestra aleatoria de una distribucin Bernoulli, Ber( ) , 1 3,1 4 . El
decisor supone que la probabilidad de xito es 1 4 .
a).- Plantee un contraste de hiptesis adecuado y determine la prueba MP().
b).- Resolver para k y c, cuando n 10 y 0.05 .
c).- En el inciso anterior y con la realizacin 1, 0, 0 ,1, 0, 0, 1, 0, 1, 0 determine si rechaza la suposicin
del decisor al 5% de significancia.
Solucin
a).- Se plantea el juego de hiptesis
54
H 0 : 1 3
H1 : 1 4
i 1
i 1
L X ( ) 7 f ( xi ; ) 7 xi 1
1
xi
8 xi
8 xi
# i 1
n
xi
1
n
i 1 1
8
!
i 1
"1
Lx ( 0 )
Lx (1 )
f (x; 0 )
f (x;1 )
i
# 1/ 3 8
n
i 1
1
1 / 3n
!
n
8 xi
LX (1 / 3) " 1
1 / 3
# 3 i 1 # 8
!
( x)
!
n
LX (1 / 4)
"2
"9
xi
8
# 1 / 4 i 1
n
1
1 / 4
!
"1
1/ 4
Paso 3. La estadstica de prueba. Recordando que (x) k + ln( (x)) ln(k ) k1 , es decir,
n
Luego,
n
ln 3 28 xi k 2
(k 2 k1
n ln(8 9)) .
i 1
8x
k3
(k 3 k 2 ln(3 2)) .
i 1
Es decir, resulta una situacin como en el caso 2 de la metodologa expuesta en la seccin 2.4.2.
n
8X
~ Bin(n, ) .
i 1
Paso 4. Note que bajo H 0 , T 8 X i ~ Binn,1 3 , luego para un tamao de prueba el valor de k *
i 1
55
*
-1 si
(x) )c si
-0 si
(
xi k *
8
i 1
n
xi k *
8
i 1
n
xi k *
8
i 1
De tal forma que 0.9234 P(T 5) 0.95 P(T 6) 0.9803, luego k * 6 . Ahora con este valor se
determina el valor de c:
1
P(T k *
1) 0.95
P(T 5) 0.95
0.9234
c
0.1947 .
P(T 5)
0.1366
P(T k * )
Luego, la regla de decisin queda
*
si
-1
(x) )0.1947 si
si
-0
(
xi 6
8
i 1
n
xi 6
8
i 1
n
xi 6
8
i 1
n
8 xi 4 . As, al 5% de significancia
i 1
se rechaza H 0 : 1 3 y concluye que con la realizacin obtenida no hay evidencias para rechazar la
suposicin del decisor.
EJEMPLO 2.10
56
*1, si (x) k
(x) )c, si (x) k
-0, si (x) k
(
n
8 xi
i 1
1
n
8 xi
# 1 2 i 1
10
!
1
1 2n 8n xi n
10
xi
8
Lx ( 0 ) f (x; 1 2) !" 1
1 2
#2
#2
i 1
i 1
3
( x)
3
!
!
n
Lx ( 1 ) f (x; 1 4)
"3
"3
8 xi
# 1 4 i 1
n
!!
1
1 4
"1
1 4
10
8 xk
Si (x) k , resulta 2 3 3 k 1
10
10
8 xk
k + 3 k 1
3 2 k k1 + 8 x k
10
10
k 1
ln(k1 )
ln(3)
k 2 . Luego,
10
P(T ( X) k *
1 | 0 ) P(T ( X) k * | 0 )
P(T k *
1 | 0.5, n 10) 0.0547 P(T k * | 0.5, n 10)
10
P(T ( X) k *
1 | 0 )
P(T ( X) k | 0 )
*
0.0547
P(T 1 | 0.5) 0.0547
0.0107
1.
0.0440
P(T 2 | 0.5)
Es decir, la prueba ms potente de tamao est dada por la siguiente funcin de prueba
*
-1, si
(x) )1, si
-0, si
(
ii)
10
8x
2
2
k 1
10
8x
k 1
10
8x
*
--1, si
)
-0, si
-(
10
8x
2
2
k 1
10
8x
k 1
k 1
mx ( ) P ( X) 1 1 4 P T k * | 0.25
{1 4}
1 4
57
Los ejemplos anteriores se pueden generalizar por medio del siguiente resultado.
TEOREMA 2.1
Sea X 1 , X 2 ,, X n una muestra aleatoria de Ber( p) , entonces se pueden tener alguno de los
siguientes contraste de hiptesis
a) H 0 : p p0 contra H1 : p p1 , con p0 p1 entonces la prueba de tamao MP ( ) , para
(0, 1) estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn
Rechazar H 0 : p p0 , con probabilidad 1, si t k en donde k se encuentra de
P(T k
1 | p p0 ) P(T k | p p0 ) .
P(T k
1 | p p 0 )
P(T k | p p 0 )
1
P(T k
1 | p p 0 )
P(T k | p p 0 )
Despus de revisar la distribucin discreta tipo Bernoulli se puede ampliar la metodologa propuesta en
el Teorema 2.1 a cualquier distribucin discreta que se conozca la distribucin para la suma de
variables. Por otro lado, en Inferencia Estadstica antes del tema de prueba de hiptesis se ven las
distribuciones discretas y continuas junto con las distribuciones de sus sumas.
n
8X
i 1
El dueo de un comercio estableci que la llegada de clientes a su negocio tiene una distribucin de
Poisson con una razn 2, 3 clientes cada 15 minutos, para esto propone el contraste de hiptesis
58
Solucin
Se est ante una situacin similar a la del inciso b del Teorema 2.1. Luego, se requiere calcular la
constante crtica, k que se encuentra de P(T k
1 | 0 ) 1
P(T k | 0 ) .
Por otro lado, se tiene que T ~ Poisson(n0 ) Poisson(100 ) . De esta forma se tiene que
encontrar un valor entero no negativo de k que cumpla:
P(T k
1 | 2) 1
P(T k | 2)
En este caso la razn de la distribucin de T es 20 y se puede recurrir a las tablas de la
distribucin Poisson. As,
27
8
i 0
e
20 20i
0.9475 0.95 0.9657
i!
28
8
i 0
e
20 20i
.
i!
1
P(T k
1 | 0 ) 1
0.05
P(T 28
1 | 2)
0.95
0.9475
0.1367 .
P(T k | 0 )
P(T 28 | 2)
0.9657
0.9475
regin de rechazo R r
Por ltimo se aplica la regla de decisin, para esto se recuerda que t 37 28 y, con lo cual se
concluye que con la realizacin tomada se rechaza H 0 : 2 al 5% de significancia.
2.5 PRUEBAS SIMPLE CONTRA COMPUESTA
Se revis un resultado poderoso, pero sencillo, sobre las pruebas de hiptesis simple contra simple, el
Lema de Neyman-Pearson. Este resultado garantiza la existencia de la prueba MP() cuando se utiliza
la razn de verosimilitudes para el caso simple contra simple.
Qu pasa cuando alguna de las hiptesis no es simple?
Definicin 2.4
Una hiptesis se llama compuesta, si el conjunto de parmetros que le corresponde contiene
ms de un elemento. Por ejemplo, H 0 : se llama hiptesis compuesta si contiene ms
de un elemento, similarmente H1 :
es una hiptesis compuesta si
contiene
ms de un elemento25.
Luego, el contraste de hiptesis
25
Alexander M. Mood, Franklin A. Graybill y Duane C. Boes. Introduction to the Theory of Statistics. pp. 402
59
H 0 : 0 , para 0
H1 :
En donde
contiene ms de un elemento se le da el nombre de hiptesis simple contra
compuesta. En esta situacin la prueba deseable de encontrar debe ser de tamao y que tenga la
mayor potencia con respecto a todas las otras pruebas del mismo tamao, si la funcin de prueba
con tales caractersticas existe se le llama la prueba uniformemente ms potente de tamao , y se
denota por UMP().
Cmo obtener la prueba UMP() para el caso simple contra compuesta?
En general, no existe algn resultado, como el lema de Neyman-Pearson en el caso simple contra
simple para determinar la prueba UMP() para el caso simple contra compuesta, ya que de hecho
puede ser que sta no exista. Sin embargo, para tratar de encontrar la prueba UMP() en el caso
simple contra compuesta se puede seguir la siguiente metodologa.
Paso 1. Se elige un valor del parmetro 1
y se establece el contraste de hiptesis reducido,
simple contra simple.
H 0 : 0
H 1* : 1
10.45, 13.40, 9.45, 12.23, 8.50, 8.10, 14.20, 12.85, 10.90, 9.15
Aplique la regla de decisin del inciso anterior al 5% de significancia e indique si existe
evidencia para rechazar H 0 .
c) Cmo quedara el problema formulado en una situacin general?
Solucin
a) Siguiendo los pasos anteriores.
Paso 1. Se elige 1 10 y se estable el contraste de hiptesis reducido
H 0 : 10
H 1* : 1
60
f (x; , 4) 7 f ( xi ; , 4) 7
i 1
i 1
1
2 2?
( xi
) 2
2( 4)
e
1
8
8 (
2 xi 2 )
i 1
72
i 1
1 xi2
8
2?
e
n
#
xi n 2
1 8!
2
!
i 1
"
A ( x) .
1 xi2
8
2 2?
n
#
1 8!
2:1 0 xi n1 0 0
!
i 1
"
( x)
f (x; 10, 4) e
A ( x)
e
n
#
2
f (x; 1 , 4)
1 8!
2 1 8 xi n1
!
A ( x)
e " i 1
n
#
1 8! 2 ( 1
1 0) xi (1 0 0
12 ) n
!
i 1
"
(x) e
( 1
10)
4
n
#
1 8! 2 ( 1
10) 8 xi (100
12 ) n
!
i 1
"
& e
i 1
( 1
10) n
8 xi
4
i 1
&
k , con k
(100
12 ) n
ke 8
i 1
&
4
k
1
10
de las distribuciones muestrales se sabe que en el caso de variables aleatorias con distribucin normal,
el promedio X ~ N , 4 n . Es decir, se obtuvo una estadstica con distribucin conocida. Finalmente,
de la estadstica de prueba X y la regin de rechazo para las realizaciones
6# k *
10
3
n 1 1
, finalmente despejando la constante crtica de esta expresin
Es decir, $ 4!!
45" 2 12
k * 10
2
n
$
1 (1
) 10
2
n
Z 1
.
En donde, Z 1
representa el cuantil 1
de la distribucin normal estndar, dado por
$ (1
) . As, del lema de Neyman-Pearson y una realizacin x se concluye que la prueba ,
MP(), para el contraste de hiptesis
H 0 : 10
H 1* : 1
n Z1
.
H 0 : 10
H 1 : 10
n Z1
.
2
n
Z 1
10
2
10
Z 0.95 11.04 .
Rechazar H 0 : 0 , si x 0
0
n
Z 1
0
0
n
$
1(1
) .
En donde, Z1
representa el cuantil (1
) de la distribucin normal estndar donde
0, 1, .
EJEMPLO 2.13
1
1
1
1
Z1
Z1
62
( x) )
H 1 : 1 , para
1
(1)
Usando las ideas del mtodo anterior para el caso simple contra compuesta, es posible obtener la
prueba MP(), para el juego de hiptesis expuesto en (1).
Paso 1. Se elige un valor del parmetro 0 y se estable el contraste de hiptesis reducido,
simple contra simple.
H 0* : 0
H 1 : 1
(2)
0 , ( 0 ) & $ * .
63
Por otro lado, si * $ , entonces * es la prueba MP() para el contraste de hiptesis (1), de
~
lo contrario, entonces existe otra prueba $ ms potente que * . Pero del hecho de que
~
$ D $ * , resulta * $ * y $ * , pero * es la prueba MP() para (2), esto contradice que
~
$ es ms potente que * .
Es decir, se demostr que la prueba MP(),
$
$
EJEMPLO 2.14
16.45, 13.40, 9.45, 12.23, 8.50, 15.10, 14.20, 12.85, 10.90, 14.15
Aplique la regla de decisin del inciso anterior al 5% de significancia e indique si existe
evidencia para rechazar H 0 .
c) Cmo quedara el problema formulado en una situacin general?
Solucin
a) Siguiendo los pasos anteriores.
Paso 1. Eligiendo 0 12 el contraste de hiptesis reducido queda
H 0* : 0
H 1 : 10
Paso 2. Aplicando el lema de Neyman-Pearson al contraste de hiptesis encontrado
1. La funcin de verosimilitud
n
f (x; , 2 ) 7 f ( xi ; , 2 ) 7
i 1
i 1
2?
( xi
) 2
2
e
n
1 #!
xi n 2
2
2!
2 "
i 1
1
2
8 ( xi ) 2
2 i 1
7
i 1
1
2?
8 ( xi ) 2
2 2 i 1
7
i 1
1
2?
.
64
( x)
f (x; 0 , 2 )
f (x;10, 2 )
n
1 #!
2 0
xi n 02
2!
2 "
i 1
A ( x, )
n
1 #!
2:1 0 xi n1 0 0
2!
2 "
i 1
e
n
1 #!
2 (1 0
0 ) xi ( 02
1 0 0) n
2!
2 "
i 1
A ( x, )
(x) e
(10
0 )
n
1 #!
2 (10
0 ) 8 xi ( 02
100) n
2!
2 "
i 1
& e
8 xi
i 1
( 02
100) n
k , con k ke
&
i 1
(10
0 )
i 1
2 2
0
10
k
&
( 0 ) P ( ( X) k | 0 ) P X k * | 0
#
X
0
!
!
k *
0
n
P!
2
S n
1 n
! (n
1) S n
1
(n
1)
!
2
"
#
#
k *
0
k *
0
Z
P! T
P!
!
!
2
S n
1 n
S n
1 n
"
" n
1 (n
1)
#
k *
0
Es decir, P! T
, finalmente despejando la constante crtica de esta expresin
!
S n
1 n
"
k * 0
s n
1
Ftn
11 ( ) 0
s n
1
t (n
1) .
n
n
En donde, t (n
1) representa el cuantil de la distribucin t-student. Luego, del lema de
Neyman-Pearson, y una realizacin x la prueba , MP(), para el contraste de hiptesis
H 0* : 0
H 1 : 10
s n
1
n
t (n
1) .
P! T
!
"
k *
0
,
S n
1 n
es mximo, esto ocurre cuando 0 es mnimo (da una mayor probabilidad porque est restando),
luego 0 12 y la prueba MP() para
65
H 0 : 12
H 1 : 10
Rechazar H 0 : 12 , si x 12
s n
1
n
t (n
1) .
s n
1
n
Finalmente, resulta x 12
t (n
1) 12
2.502
10
s n
1
t (n
1) de donde se concluye que con los datos de la
n
realizacin no hay evidencias para rechazar H 0 : 12 .
s n
1
n
t (n
1) .
En donde, s n
1 es la desviacin estndar de la varianza muestral correspondiente a la
realizacin de la muestra aleatoria y t (n
1) representa el cuantil de la distribucin tstudent con n
1 grados de libertad, para 0, 1, .
(1)
H1 :
En donde, tanto como
contienen ms de un elemento, al problema se le da el nombre
de hiptesis compuesta contra compuesta.
66
Usando las ideas de los mtodos anterior es posible obtener la prueba UMP(). Es decir, a partir
del problema original expuesto en (1) resultan dos opciones.
a) Resolverlo como un problema de hiptesis compuesta contra simple eligiendo un valor
1
H 0 :
H 1* : 1
(2)
Posteriormente, determinar la prueba MP() del problema reducido (2) y si est no depende
del valor elegido 1 , entonces necesariamente es la prueba UMP() para el problema original (1).
b) Resolverlo como un problema de hiptesis simple contra compuesto, eligiendo un valor
0
H 0* : 0
H1 :
(3)
Posteriormente, determinar la prueba UMP() del problema reducido (3) y si est no depende
del valor elegido 0 , entonces necesariamente es la prueba UMP() para el problema original (1).
EJEMPLO 2.15
Solucin
Sea 0 0 y el problema simple contra compuesta
H 0* : 0
H1 : 0
Del ejemplo 2.13 se obtuvo que la funcin de prueba es
*1, si x 1.65
( x) )
(0, si x 1.65
esto es para un 0.05 ya que la prueba ms potente de tamao del problema reducido
H 0 : 0 vs H 1 : 1 (o cualquier valor mayor a 0) y adems no depende de 1 1 . Por lo tanto,
es UMP().
EJEMPLO 2.16
Solucin
67
a) Ntese que el problema es similar al de la seccin anterior, para el caso compuesta contra simple.
Luego, se utilizar el resultado encontrado, para esto se reduce a una prueba compuesta contra
simple.
Se elige 1 12 y se prueba el contraste de hiptesis
H 0 : 12
H 1* : 1
P! T
!
"
k *
0
.
S n
1 n
#
k *
0
, y finalmente despejando la constante crtica de esta expresin
Es decir, P! T
!
S n
1 n
"
s
s
k * 0 n
1 Ftn
11 ( ) 0 n
1 t (n
1) .
n
n
En donde, t (n
1) representa el cuantil de la distribucin t-student. As, se concluye del
lema de Neyman-Pearson, y una realizacin x la prueba , MP(), para el contraste de hiptesis
reducido con 0 12
H 0 : 12
H 1* : 1
s n
1
t (n
1) .
n
Pero se observa que la prueba no depende del valor elegido 1 12 . Por lo tanto, se ha
encontrado la prueba UMP() para
H 0 : 12
H 1 : 12
s n
1
n
t (n
1) , con 0 12 .
s n
1
n
t (n
1) .
68
En donde, s n
1 es la desviacin estndar de la varianza muestral correspondiente a la
realizacin de la muestra aleatoria y t (n
1) representa el cuantil de la distribucin tstudent con n
1 grados de libertad, para 0, 1, .
EJEMPLO 2.17
Sea
X 1 , X 2 , , X n
f ( x; ) xe
2
I ( 0 , ) ( x) .
Pruebe si existe una prueba uniformemente ms potente de tamao para el juego de hiptesis
H0 : 1
H1 : 1
Solucin
Se va a trasladar a una prueba simple contra compuesta
H 0 : 0 ; 0 1
H1 : 1
L X ( ) 7 f ( xi ; ) 7 xi e
2
xi
i 1
i 1
Lx ( 0 )
8 xi
i 1
A ( x)
f (x; 0 )
Lx (1 )
I ( 0, ) ( x i ) e
2n
f (x;1 )
n
0 8 xi
(1
0 ) 8 xi
A ( x) # 0
i 1
!
e
( x)
n
!
LX (1 )
1 8 xi
" 1
(1 ) 2 n e i 1 A (x)
LX ( 0 )
( 0 ) e
2n
2n
i 1
k1 ln(k )
2n ln( 0 1 ) ( 1
0 )8 x i k1
i 1
n
( 1
0 )8 x i k 2 ;
k 2 k1
2n ln( 0 1 )
i 1
8x
k3 ;
k3
i 1
k2
; ( 1 0 )
1
0
i 1
i 1
i 1
2
Figura 2.7 Ilustracin de P(Y b) 1
4n (b) del ejemplo 2.17
Fuente: Elaboracin propia
70
Nota
*H 0 : 1
Se pudo haber iniciado con la prueba compuesta contra simple )
( H 1 : 2
*H 0 : 1
Se pasa a una prueba simple contra simple )
( H 1 : 2
Donde
n
( x)
f (x; 1)
f (x; 2)
7 (x e
xi
i 1
7 (2
i 1
I ( 0, ) ( xi ))
8 xi
4
2 n e i 1
xi e
2 xi I ( 0, ) ( xi ))
Luego
n
( x) k + 4
2n
8 xi
8 xi
e i 1 k + e i 1 k1 + 8 xi k 2
(k1 4 2 n k ; k 2 log(4 2 n k ))
i 1
8X
i 1
2)
3)
4)
5)
1)
TEOREMA 2.2
Sea X 1 , X 2 , , X n una muestra aleatoria del tipo 1, 2, 3 4 mencionados anteriormente, entonces
se pueden tener alguno de los siguientes contraste de hiptesis
a) H 0 : 0 contra H1 : 0 , entonces la prueba de tamao UMP(), para (0, 1) estar
dada por la siguiente regla de decisin para una realizacin x1 , x 2 , , xn
Rechazar H 0 : 0 , con probabilidad 1, si t k en donde k se encuentra de
P(T k
1 | 0 ) P(T k | 0 ) .
P(T k
1 | 0 )
.
P(T k | 0 )
71
1
P(T k
1 | 0 )
P(T k | 0 )
2
P(T k1
1 | 0 )
1
2
P(T k 2
1 | 0 )
y c2
.
P(T k1 | 0 )
P(T k 2 | 0 )
8x
i 1
Donde:
EP: Estadstico de prueba
CC: Constante crtica
EJEMPLO 2.18
Resuelva el problema del canal televisivo cuyo director asegura que la proporcin de audiencia que ve
cierto programa el sbado por la noche es mayor al 40%, con una muestra de 100 televidentes a
quienes se entrevisto, resultando que 45 de ellos vean el programa. Sin utilizar la aproximacin.
a) Plantee un contraste de hiptesis adecuado para el problema.
b) Al nivel de significancia del 2.5% pruebe si la afirmacin es vlida.
c) Calcule la potencia de la prueba, suponiendo que p 0.60 .
Solucin
a) El contraste de hiptesis es: H 1 : p 0.40 y su opuesta H 0 : p 0.40 .
b) Siguiendo los pasos de la metodologa
i)
8C
i 0
100
i
(0.4) (0.6)
100
i
0.975
8C
100
i
(0.4) i (0.6)100
i
i 0
72
Para realizar estos clculos es obvio que se requiere del apoyo de algn paquete estadstico. As,
49
C i100(0.4) i (0.6)100
i 0.9729 0.975 0.9832
i 0
50
8C
100
i
(0.4) i (0.6)100
i
i 0
1
P(T k
1 | p p 0 )
P(T k | p p 0 )
1
0.025
P(T 50
1 | p 0.4) 0.975
0.9729
0.2524 .
0.9832
0.9729
P(T 50 | p 0.4)
regin de rechazo R r
iv) Por ltimo se aplica la regla de decisin, para esto se recuerda que t 45 50 . As, se
concluye que, con la realizacin tomada no hay evidencias para rechazar H 0 : p 0.40 al
2.5% de significancia.
Conclusin: Al 2.5% de significancia y la realizacin obtenida no existen evidencias para validar
la afirmacin del director de la televisora que p 0.40 .
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo
PRechazar H 0 | p 0.40 PT 50 | p 0.60 1
PT 50 | 0.6 1
0.0271 0.9729 .
Valor muy prximo al encontrado con la aproximacin 0.983.
Comentarios finales de la seccin: En el caso de una diferencia de proporciones se tiene el
problema de la distribucin de la estadstica de prueba, ya que se trata de una diferencia de
distribuciones binomiales con diferentes parmetros y no se conoce que distribucin tiene.
EJEMPLO 2.19
El dueo de un comercio estableci que la llegada de clientes a su negocio tiene una distribucin de
Poisson con una razn de ms de dos clientes cada 15 minutos. Para probar su afirmacin el
negociante realiza un muestreo de 10 intervalos independientes de 15 minutos y anota la cantidad de
clientes que llegan a su negocio, obteniendo: 3, 6, 1, 3, 7, 6, 3, 1, 4 y 3. Justifique estadsticamente la
afirmacin del dueo.
a) Plantee un contraste de hiptesis adecuado para el problema.
b) Al nivel de significancia del 5% pruebe si la afirmacin es valida.
c) Calcule la potencia de la prueba, suponiendo que 3 .
Solucin
a) El dueo del negocio afirma que la razn 2 clientes 15minutos , luego las hiptesis sern:
H 0 : 2 y su opuesta H 1 : 2 .
b) Siguiendo los pasos de la metodologa
i)
H 0 : 2 contra H 1 : 2 .
iii) Se est ante una situacin similar a la del inciso b del Teorema 2.2. Luego, se requiere
calcular la CC, k que se encuentra de P(T k
1 | 0 ) 1
P(T k | 0 ) .
Por otro lado, se tiene que T ~ Poi(n0 ) Poi(100 ) . De esta forma se tiene que encontrar un
valor entero no negativo de k que cumpla:
P(T k
1 | 2) 1
P(T k | 2)
En este caso la razn de la distribucin de T es 20 y se puede recurrir a las tablas de la distribucin
Poisson. As,
27
8
i 0
e
20 20i
0.9475 0.95 0.9657
i!
28
8
i 0
e
20 20i
.
i!
1
P(T k
1 | 0 )
P(T k | 0 )
1
0.05
P(T 28
1 | 2)
P(T 28 | 2)
0.95
0.9475
0.1374.
0.9657
0.9475
regin de rechazo R r
iv) Por ltimo se aplica la regla de decisin, para esto se recuerda que t 37 28 y, con lo
cual se concluye que con la realizacin tomada se rechaza H 0 : 2 al 5% de
significancia.
As, se concluye que al 5% de significancia y la realizacin obtenida es vlida la afirmacin del
dueo.
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo
PRechazar H 0 | T 2 PT 28 | T 3 1
PT 27 | T 30 1
0.3329 0.6671.
74
Captulo 3
Pruebas de razn de verosimilitud
generalizada
INTRODUCCIN
n el captulo anterior se analizaron las pruebas de hiptesis utilizando el mtodo de la razn
de verosimilitud, basado en el lema de Neyman-Pearson, para determinar la mejor prueba.
Para ello se explic la metodologa para los posibles juegos de hiptesis: hiptesis simple
contra simple, simple contra compuesta, compuesta contra simple y compuesta contra
compuesta.
En el presente captulo continuar el estudio de las pruebas de hiptesis, introduciendo nuevos
mtodos para determinar la prueba UMP ( ) . Se empezar definiendo a las familias con razn de
verosimilitud montona y a partir de sta se enunciar un Teorema para encontrar la prueba
UMP ( ) .
Tambin, se abordar el caso de las pruebas insesgadas, en donde el parmetro que se quiere
probar en el juego de hiptesis est delimitado en un intervalo dado, y de cmo encontrar la mejor
prueba para este tipo de casos.
Finalmente, como una generalizacin a la prueba de Neyman-Pearson, se revisar el mtodo de
la razn de verosimilitud generalizada en donde los contrastes de hiptesis que se desea probar no
necesariamente tienen un slo parmetro, sino que pueden tener varios parmetros. Por ejemplo, la
distribucin normal con dos parmetros desconocidos, en donde se revisarn los resultados para la
media cuando se desconoce la varianza, la prueba para la varianza y en el caso de dos muestras para la
razn entre varianzas. Los resultados encontrados sern utilizados en el siguiente captulo sobre la
metodologa de las pruebas de hiptesis para la distribucin normal.
3.1 FAMILIAS DE DISTRIBUCIN CON RAZN DE VEROSIMILITUD MONTONA
En el caso de los contrastes de hiptesis compuesta contra compuesta obtener la prueba UMP ( ) con
el mtodo del lema de Neyman-Pearson resulta un poco laborioso, de tal manera y debido a su
importancia del tema se buscan nuevos mtodos que sean ms fciles de manejar para determinar la
prueba UMP ( ) en el caso de hiptesis compuesta contra compuesta. En general el problema es
complicado, pero sin embargo existen distribuciones que tienen propiedades buenas para determinar la
75
prueba UMP ( ) , algunas de estas distribuciones pertenecen a las familias que se enunciarn
enseguida.
Definicin 3.1
Se dice que una familia de distribuciones
{ f (x; ), D R}
Tiene razn de verosimilitud montona en si existe una funcin real T(x) tal que para
f (x; )
las densidades f (x; ) y f (x; ) son distintas y la razn
es una funcin no decreciente
f (x; )
f (x; )
de T(x) . Es decir
RT (x) , en donde R es una funcin no decreciente de T(x) 31.
f (x; )
EJEMPLO 3.1
2?
1
2?
e
e
( x
) 2
2
( x
) 2
2
exp[x(
)
1 2 ( 2
2 )] R(x) ,
TEOREMA 3.1
Sea X ~ f ( x; ) , donde D R tal que la familia de densidades tiene razn de verosimilitud
montona en T(x) , entonces existe la prueba UMP ( ) para probar:
a)
*H 0 : 0
*H 0 : 0
b) )
)
(H1 : 0
(H1 : 0
*H 0 : 0
*H 0 : 0
)
)
(H1 : 0
(H1 : 0
*1, si T (x) k
(x) )c, si T (x) k
-0, si T (x) k
(
Donde
c (0,1)
k 0
tales
E0 { (X)} .
Note que T(X) es la estadstica de prueba.
31
32
*1, si T (x) k
(x) )c, si T (x) k
-0, si T (x) k
(
que
Donde
c (0,1)
k 0
tales
que
E0 { (X)} .
Note que T(X) es la estadstica de prueba32.
76
El Teorema se deduce usando las tcnicas de reduccin de hiptesis donde se puede ver que la
funcin
( ) de la prueba del Teorema es montona no decreciente, luego se obtiene la prueba
UMP ( ) , ver figura 3.1.
La parte (a) del Teorema se puede apreciar en la figura 3.1, similarmente se puede trazar la
grfica para la parte (b).
1
( )
( )
0
H
Solucin
Si se aplica la razn de familias montonas se elige , tal que
f (x; ) 2 x 1
.
f (x; )
2x 1
Para ver si es montona creciente, se toma la derivada con respecto a x
d 6 f ( x; ) 3 (2x 1
)(2 )
(2 x 1
)(2 ) 4 x
4 x 2 (1
)
2 (1
)
4
1
dx 5 f ( x; ) 2
(2x 1
) 2
(2x 1
) 2
2(
)
(2x 1
) 2
0
2 x 1
, por el Teorema de familias montonas se sabe que
2x 1
existe una prueba UMP ( ) dada por:
xk
xk
*1, si
(0, si
(x) )
E 0 { ( X)} P{ X k | 0} ; 1dx 1
k ,
k
( x) )
x 1
x 1
EJEMPLO 3.3
(1
)
H 0 : 0
H1 : 0
7 i (0,1) i
7
i
n
3
6
f (x; ) i 1 "
n
i 1
x
n
7
i
1
4
n
(1
)
f (x; )
# 1 (1
)
n
5 i 1 2
! xi I ( 0,1) ( xi ) 1 7 xi
7
i 1
i 1 "
n
# n
n ln 6
3!!
8 ln(x i )
45 12" i 1
0
0
*H 0 : 0
, dada por
prueba UMP ( ) para probar )
(H 1 : 0
78
8
-i 1
(x) )
n
-0, si
8 ln(xi ) k
-(
i 1
n
tiene
20
2n
*
2
--1, si
0
( x) )
-0, si
2
0
-(
8 ln(x ) k
i
i 1
n
8 ln(x ) k
i
i 1
i 1
i 1
E0 { ( X)}
( ) P{
20 8 ln( X i ) k1 | 0 } 1
P{
20 8 ln( X i ) k1 | 0 }
De donde P{
20
8 log( X
) k1 | 0 } 1
& 22n (k1 ) 1
, es decir
i 1
n
*
0
--1, si
8 ln(xi ) 2 k1
i 1
( x) )
n
-0, si
8 ln(xi ) 20 k1
i 1
(-
2
.
k es el (1
) percentil de 2n
b) Potencia de la prueba
( ) P{
2 ln( X 1 , X 2 ) k1 | 0 } 1
P{
2 ln( X 1 , X 2 ) k1 | 1} 1
P{Y k1 | 1} 0.05
donde Y ~ 42,0.25 , de tal forma que evaluando para diferentes valores del parmetro, se tiene
79
Potencia
1.21E-19
4.9
0.74747915
0.5 0.000794718
5.3
0.77428627
0.9 0.032224419
5.7
0.79715319
1.3 0.120941658
6.1
0.81679101
1.7 0.232699298
6.5
0.83376402
2.1 0.340422497
6.9
0.84852256
2.5 0.434446882
7.3
0.86142833
2.9 0.513439683
7.7
0.87277375
3.3 0.578945182
8.1
0.88279691
3.7 0.633168806
8.5
0.89169292
4.1 0.678206739
8.9
0.89962271
4.5
9.3
0.90671986
0.1
Potencia
0.71583224
Potencia
EJEMPLO 3.4
Sea X 1 , X 2 , , X n una muestra aleatoria de la distribucin Poisson con parmetro ( Poi( ) ) donde
0 . Se desea probar:
H0 : 1
H1 : 1
f (x; ) 7
i 1
e
xi
xi !
e
n
6 n xi 3
4 8
1
i 1
1
%4 n
4
1
4 7 x i !1
5 i 1 2
Para
80
f (x; )
f (x; )
8 xi
n
i 1
7x !
i
i 1
8
e
n i 1
xi
7x !
8 xi
n (
) # i 1
e
R(T (x))
!
"
i 1
Donde
n
T (x) 8 xi y
i 1
#
Note que R(y ) e n (
) ! es una funcin no decreciente en y, la base es mayor a 1 y los
"
valores de T son positivos (o considera el logaritmo de la funcin, lnR(y) n(
) y ln , que
es no decreciente en y, luego la funcin original tambin es no decreciente (como resultado de una
funcin montona creciente). Por lo tanto, la familia tiene razn de verosimilitud montona en
y
T (x) 8 xi .
i 1
Entonces, por el Teorema 3.1, existe una prueba UMP ( ) dada por:
*
-1, si
(x) )c, si
-0, si
(
8x
( i 1
k
k
i 1
n
8x
i 1
n
8x
i 1
E0 ( X) 1 % P )8 X i k | 1/ c % P )8 X i k | 1/ 0
( i 1
Donde
8X
~ Poi(10 : 1)
i 1
0.05
0.0487
0.0375
0.0347
e
x
I ( 0,1, 2,) ( x) .
x!
8X
~ Poi(n ) pertenece a la
i 1
familia montona. Por el Teorema 3.1 existe una prueba UMP ( ) tal que
*
-1, si
(x) )c, si
-0, si
(
8x
k
k
i 1
n
8x
i 1
n
8x
i 1
c
P{8 X i k | 0 }
i 1
P{8 X i k | 0 }
i 1
82
* FP25 (k
1) 1
FP25 (k )
*n
0
-0.05
P )8 xi k | 1/
)c
( i 1
.
*n
0
P )8 xi k | 1/
-(
( i 1
.
FP ( 25) (32) 0.9420
0.05
0.04
5
/ & k 33; c
FP ( 25) (33) 0.960.
0.960
0.942 9
k 33 y c 5 9
*# k
n 0
B )Z n !!
-(
" n 0
*# k
n 0
0/ B )Z !
! n
-(
-.
0
"
0/
-.
0
-/
.
Potencia
0.1
0.000
0.2
0.000
0.3
0.000
0.4
0.000
0.5
0.000
0.6
0.000
0.7
0.000
0.8
0.003
0.9
0.014
1.0
0.050
Potencia
1.1
0.128
1.2
0.256
1.3
0.419
1.4
0.590
1.5
0.738
1.6
0.849
1.7
0.920
1.8
0.962
1.9
0.983
2
0.993
83
EJEMPLO 3.6
Solucin
Para darle solucin se utilizar el mtodo de familias montonas.
Sea y la razn de verosimilitud
1
f (x; ) x I ( 0,1) ( x) #
1
! x
R(T (x))
f (x; ) x I ( 0,1) ( x) "
*1, si
(0, si
(x) )
Esto es
E0 2 { (X)} P{ X k | 2} ; 2 x 2
1 dx x 2
k
0
k2 &k ,
(x) )
x
x
EJEMPLO 3.7
Solucin
Sea y la razn de verosimilitud
(x)
f ( x; ) (1 ) x # 1
!
R(T (x))
x
f ( x; ) (1 ) x " 1
84
*1, si
(0, si
( x) )
( x) k
( x) k
Para cualquier k
1
E 0 { ( X)} P{ X k | 0} ; dx 1
k & k 1
k
( x) )
TEOREMA 3.2
(1
)
H 0 : 0
H1 : 0
8 ln(xi )
# n
!
LX ( ) #! 1 !! 7 xi e " i 1
" " i 1
n
a) Entonces LX ( ) pertenece a una familia exponencial. Por lo tanto, tiene una prueba UMP ( ) para
H 0 : 0
Como
33
85
Luego
*
P )
8 ln( X i ) k | 0 / P{W k | 0 } 1
P{W k | 0 } 1
FW (k | 0 )
( i 1
.
& FW (k | 0 ) 1
& k FW
1 (1
) | 0
P{W k | 0 } P{ 20 W 20 k | 0 } 1
P{ 22n 20 k}
~ @ ( n, 2)
& 0 k F 2 (1
) & k
2
2n
0
2
F
21 (1
)
2n
8 ln(x i ) FW
1 (1
)
i 1
n
8 ln(xi ) FW
1 (1
)
i 1
FW ( w) ;
0
2 xe
x
@(2)
1 w
dx ; xe
x dx 1
e
w ( w 1)
0
FW (k ) 0.95 1
e (k 1) & k 4.744
k
F
21 (1
)
2 2n
1
k F
21 (0.95) 12 (9.4877) 4.74385
2 4
As la funcin potencia para esta prueba es:
( ) P{W 4.744 | } 1
P{W 4.744 | }
4.744e
4.744 e
4.744
e
4.744 ( 4.744)
A este tipo de pruebas se les llama de dos colas o bilaterales, que a diferencia de las pruebas
anteriores (de una cola izquierda, H1 : 1 , o derecha, H 1 : 1 ) su funcin de potencia no podr
permanecer por debajo de la lnea del nivel de significancia, como se muestra en la figura 3.4.
86
1
2
2
Definicin 3.2
Se dice que es una prueba insesgada34, si
1)
( ) para
2)
( ) para
Cuando se dese aprobar
H0 :
H1 :
Para hiptesis de dos colas es deseable encontrar la prueba UMP ( ) . Es decir, se busca la
prueba que satisface 1) y 2) tal que
( )
( ) ,
para
y cualquier otra prueba insesgada, la prueba que cumple con la desigualdad se le
llama prueba uniformemente ms potente insesgada de tamao y se denota por UMPI ( ) .
TEOREMA 3.3
Sea X ~ f ( x; ) , D R , donde f ( x; ) c( )h(x)e ( )T ( x) , donde ( ) es una funcin
montona. Entonces existe una prueba para UMPI ( ) para probar:
H 0 : 1 2
H 1 : 1 2
34
87
si
T ( x ) k1
T ( x) k 2
si
T ( x ) k1
si
T ( x) k 2
si k1 T ( x) k 2
E1 (X) E2 (X)
Si T (x) es continua, entonces c1 c2 0 .
EJEMPLO 3.9
Solucin
n
f (x; ) 7
2?
i 1
1 ( xi
)
2
1
e
(2? ) n 2
1
2
8 ( xi
) 2
i 1
2
2
1
2
8 xi2
8 xi
1
i 1
i 1
% e % e .
e
n 2
(2? )
h(x)
e ( ) T ( x )
c ( )
De donde, T (x) 8 xi por el Teorema 3.3 la prueba UMPI ( ) estar dada por
i 1
*
-1
-0
( x) )
-0
-0
(
8x
si
k1
i 1
n
8x
i 1
8 x i k1
si
i 1
n
8x
si
k2
i 1
k2
n
n
*
x
k
xi k 2
1
,
si
8
8
i
1
-i 1
i 1
)
n
-0,
si k1 8 x i k 2
-(
i 1
si k1 8 x i k 2
i 1
Luego,
n
i 1
i 1
P! Z
k1
n
# k
2n
# ( k
n)
1
!! 2
P! Z
!! 1
!
1 n
n
n
n
"
"
"
1
2
k2
n
88
# ( k1
n)
!!
"
& k1 n
1 ( ) n
# k
2n
& k 2 n
1 (1
) 2n
1
!! 2
n
"
8 xi n
1 ( ) n 8 xi n
1 (1
) 2n
i 1
i 1
si n ( ) n 8 xi n
1 (1
) 2n
i 1
( x) )
Por tales razones se va a introducir una tcnica para construir una prueba de hiptesis, ms
general que las estudiadas en el captulo previo.
Para esto considere la funcin de verosimilitud LX () , LX () f (x; ) .
NOTA
(x)
LX ( )
,
L (
)
X
89
*1, si (x) k
(x) )c, si (x) k
-0, si (x) k
(
( )
Para que (x) sea una prueba de tamao ; es decir, se deben encontrar las constantes c y k
que hagan que se cumpla () .
Note que 0 (x) . Adems que este tipo de prueba es una generalizacin directa de las
pruebas de Neyman-Pearson en el caso simple contra simple.
Generalmente, las pruebas de razn de verosimilitud generalizada estn basadas en:
( x)
LX ( )
,
L ( )
X
*1, si (x) k
(x) )c, si (x) k
-0, si (x) k
(
A veces, (x) resulta ser una funcin montona de una estadstica sencilla y por lo tanto, es
conveniente basar la prueba en esa estadstica.
Para aplicar el mtodo de razn de verosimilitud generalizada en la prueba de hiptesis se
recomienda seguir los siguientes pasos.
Metodologa para la aplicacin del mtodo de razn de verosimilitud generalizada
Sea X 1 , X 2 ,, X n una muestra aleatoria con funcin de densidad
f ( x; ) en donde
H0 :
H1 :
LX ( )
.
L ( )
X
90
LX ( )
y por medio de reducciones encontrar una estadstica de
L ( )
prueba e intentar que sta tenga una distribucin conocida. En esta etapa se requiere de bastante
habilidad y arte, para obtener una buena estadstica de prueba, ver los ejemplos.
Paso 5. Con la estadstica de prueba calcular la constante crtica al nivel de significancia
indicado y establecer la regla de decisin.
Nota: En caso de que la estadstica de prueba no tenga distribucin conocida, se hace uso de
simulacin.
EJEMPLO 3.10
Solucin
Paso 1. . Se observa que (0, ) R
LX ( ) x
1 I (0,1) ( x) o X ( ) ln( ) (
1) ln(x) ln(I (0,1) ( x))
Paso 2. El estimador de mxima verosimilitud, bajo todo (0, ) R se obtienen derivando con
respecto al parmetro la funcin de verosimilitud o log-verosimilitud
d X ( ) 1
1
ln(x) 0 &
d
ln(x)
( x)
L X ( 1)
L () |
X
1
(
1
ln(x )
)x
1
1
ln(x )
ln(x) % x ln(x )
1
T (x)
(ln(x))x ln(x )
Pero su distribucin no es conocida, por tal razn es conveniente seguir reducindola. Tomando
el logaritmo en ambos lados
ln(x) % x % x 1 ln(x ) k 0 ;
ln(
x ln(x)) (
1
ln(x )
) ln(x) k1 ;
0 k0 1
k1 ln(k 0 ) 0
91
Reduciendo
ln(
x ln(x)) k 2 ;
x ln(x) k 3 ;
k 2 k1
1
k 3 e k2 0
P{ (X) k} P{
X ln( X ) k 3 } P{X ln( X ) k}
Si se denota g ( x) x ln(x) , se tiene una funcin como la mostrada en la figura 3.5, y la
bsqueda de la constante crtica es equivalente a buscar los valores de a y b que hace
g ( x) k + x a x b .
2
1
P( X a) 1
P( X b) 1 FX (a)
FX (b)
En donde
x
FX ( x) ; w
1 dw x .
0
1 a
b
As, la bsqueda de a y b es complica porque se tiene una sola ecuacin con dos incgnitas y
determinar cul eleccin es mejor no resulta sencillo. Pero se tiene otra condicin que deben cumplir a
y b, esta consiste en que g (a) g (b) + a ln(a) b ln(b)
a ln(a)
b ln(b) 0
a
b 1
( x) )
EJEMPLO 3.11
Solucin
Paso 1.Se identifica a y y se obtiene la funcin de verosimilitud. En este caso:
H 0 : 1 & (0,1]
H 1 : 1 &
(1, )
As R
LX ( ) 7 e
xi I ( 0, ) ( xi ) n e
8 xi
i 1
i 1
7I
i 1
( 0, )
( xi ) .
Paso 2. Se determina el estimador de mxima verosimilitud bajo . Para esto se aplica la funcin
log-verosimilitud
n
ln(LX ( )) n ln( )
8 x i 0
i 1
d
n n
n
ln(LX ( ))
8 x i 0 & n
i 1
d
8 xi
i 1
Luego
n
LX ( ) e
8 xi
i 1
#
!! n
"
8 xi
i 1
%e
n
n
#
!!
n 8 xi 8 xi
i 1 i 1
"
n n e
n
# n
!! 8 xi
" i 1
ln(LX ( )) n ln( )
8 xi 0 con 1
i 1
93
d
n n
ln(LX ( ))
8 xi 0 con 1
d
i 1
Luego, su mximo lo alcanza cuando 1 es mximo, es decir 1 , con esto
n
LX ( ) e
8 xi
i 1
xi
i 1
# n
e
n n n !! 8 xi
" i 1
8 xi
# n
!! 8 xi e i 1
i 1
"
n
n
n e
n
1 2!! 2 8 xi
# n
2!! 8 xi e " i 1
" i 1
2n n e
n
i 1
i 1
1 y
1
*1, si (x) k
y n e
1 2 y
y ne 2
n
2 y
( x)
k
y
e
&
+
k1 & ( x) )
n
n
n
n
2n e
2n e
(0, si (x) k
1 y
2
1 y
2
Figura 3.6 Ilustracin de P{g (Y ) k1} donde Y ~ 22n del ejemplo 3.11
P{Y b} 1
; en donde b es el percentil 22n,1
.
EJEMPLO 3.12
Solucin
Paso 1. Se identifica a y , y se obtiene la funcin de verosimilitud. Aqu {0} ; (
1, )
Para la funcin de verosimilitud
LX ( ) (1 ) x .
ln(x)
1
1 ln(x)
ln1(x )
1
( x)
1
(1 ) x (1
1
1
ln(x )
1) x
1
1
ln(x )
ln(x) x ln(x )
1
k0 .
ln(x) % x % x ln(x ) k 0 ;
ln(
x ln(x))
1
ln (x )
ln(x) k1 ;
ln(
x ln(x)) k 2 ;
1 k0 0
k1 ln(k ) 0
k 2 k1
1
x ln(x) k 3 ;
k 3 e k2 0
x ln(x) k
k
k 3 0
P{ ( X) k 0 } P{ X ln( X ) k}
Se determina la funcin g ( x) x ln(x) , como la mostrada en la figura 3.5, y la bsqueda de la
constante crtica es equivalente a buscar los valores de a y b que hace
g ( x) k + x a x b .
P{X ln X k} {X a X b} P( X a) P( X b) .
Luego,
P( X a) 1
P( X b) 1 FX (a)
FX (b) .
En donde
x
FX ( x) ; (1 ) w dw x 1 .
0
1 a
b .
As, la bsqueda de a y b se obtiene del sistema
*a ln(a)
b ln(b) 0
)
a
b 1
(
( x) )
EJEMPLO 3.13
Solucin
Paso 1. Se observa que [
1,1] y {0} . Por otro lado, la funcin de verosimilitud es
LX ( ) (2x 1
) I [ 0,1] ( x) [ (2 x
1) 1]I [ 0,1] ( x) .
d
LX ( ) 2 x
1 0 . Es decir,
d
* 1, si 2 x
1 0 & x
1 2 0
(
1, si 2 x
1 0 & x
1 2 0
max L X ( ) max { (2 x
1) 1}I [ 0,1] ( x) )
[
1,1]
( x)
~
LX ( )
1
.
LX ( ) LX ( )
P 0 {| X
1 2 | k} & P 0 {| X
1 2 | k} 1
k 1 2
; dx (k 1 2)
(
k 1 2) 2k 1
& k
k 1 2
1
2
Finalmente,
1
*
-1, si | x
1 2 | 2
( x) )
.
1
-0, si | x
1 2 |
2
(
EJEMPLO 3.14
Solucin
Paso 1. Note que el espacio de parmetros R : R y R : {1} {( , 2 ) : R, 2 1}
R
LX ( ; 2 ) 7
i 1
1
2? 2
1
1
1 n
#
#
2
exp!
( xi
) 2
exp!
8 ( xi
)
2
2 n 2
" 2
(2? )
" 2 2 i 1
n
n
1 n
2
X ( ; 2 )
ln( 2 )
8 ( xi
)
ln(2? )
2
2
2
2 i 1
97
E X ( ; 2 )
1 n
2 8 ( xi
) 0 & x
E
i 1
n
E X ( ; 2 )
n
1
1
( xi
) 2 0 &
8
2
2
2 2
2
2( ) i 1
2( 2 ) 2
E
6 n ( x
) 2
n 2 3 0
i
45i8
12
1
& 2
2
8 ( x i
)
i 1
1
(2? ) n
# 1 n
exp!
8 ( xi
) 2 ,
" 2 i 1
maximizando
dLX ( ;1)
d
1
(2? )
n 2
n
n
# 1 n
exp!
8 ( xi
) 2 8 ( xi
) 0 & 8 ( xi
) 0 .
i 1
" 2 i 1
i 1
8 ( xi
x )
n 2
2
(
1
)
i
1
LX ( x ,1)
(2? (1))
e
y 2
"
( x)
,
1
# 1 n
LX ( x , s n2 )
( ny )
n 2 e
n 2
2
exp!
2 8 ( xi
x )
(2?s n2 ) n 2
" 2s i 1
n
donde y 8 ( xi
x ) 2 nsn2 . Simplificando
i 1
(x) ( ny ) n 2 exp
( y 2
n) .
Para obtener una buena estadstica de prueba, primero se requiere conocer la distribucin de Y.
n
~ n2
1 . Pero qu distribucin tiene T
Yn n 2 exp
(Y 2
n) .
i 1
g ( y) ( n ) n 2 exp{
( y
n) 2} y trace su grfica
98
Figura 3.8 Grfica de la funcin g ( y ) donde se desea encontrar a y b tales que g (a) g (b) k
(x) ( ny ) n 2 exp
( y
2 n) k es equivalente a determinar los valores del argumento de la funcin
g ( y) , para que g ( y) k en la figura 3.8 se denotaron por a y b, pero el argumento es y, que como
y b] ,
max P{Y a, Y b | } y Y 8 ( X i
X ) 2 ,
i 1
max P{Y a, Y b | } .
P{Y a, Y b | 2 1} .
Bajo la restriccin g (a) g (b) . As de las tablas de la 2 se puede calcular la constante crtica
y la prueba (x) es equivalente a:
*1, si y a y b
si a y b
(0,
(x) )
Falta determinar las constantes a y b, las cuales deben cumplir g (a) g (b) k .
Con
R
2 1
99
1
P{a Y b | 2 1} .
Como
g ( y) ( ny ) n 2 exp{
( y
2 n) } .
NOTA
1)
EJEMPLO 3.15
Solucin
Intuicin: Como 2 es desconocida, se tiene que buscar en una distribucin t, cuando se quiere probar
sobre la varianza se usa la distribucin 2 .
Paso 1. Se identifica a y y se obtiene la funcin de verosimilitud. En este caso { 0 } : R ,
R : R . La funcin de verosimilitud es
n
# 1
1
exp*
LX ( , ) !
)
2
!
2
( 2
" 2?
2
8 (x
i 1
)2 / .
.
# 1
1
exp*
Bajo : LX ( 0 , ) !
)
2
!
2
( 2
" 2?
2
8 (x
i 1
0 )2 / .
.
donde 2
1
n
8 (x
0 )2 .
i 1
Por otro lado, se observa que en , los estimadores de mxima verosimilitud son
n
#
( 0 , 2 ) !! 0 , 1n 8 ( xi
0 ) 2 .
i 1
"
Paso 4. La razn de verosimilitudes
# 1
LX ( 0 , 2 ) !!
2
" 2?
n 2
* 1
exp)
2
( 2
( xi
0 ) 2 /
8
i 1
6
3
4
1
1
1
4
n
4
2 1
4 2? % 1 n 8 ( xi
0 ) 1
i 1
5
2
n 2
0
*
-n
1
2exp)
(
x
)
%
/
8
i
0
n
- 2(1 n)8 ( x
) 2 i 1
i
0
-.
-(
i 1
n 2
n
6
2 3
4 2? % 8 ( xi
0 ) 1
i 1
1
exp{
n 2}
4
n
4
1
4
1
5
2
n 2
~
n
6 2?y 3
~
exp{
n
2
};
y
( xi
0 ) 2
4
8
1
n
2
5
i 1
n 2
exp{
n 2};
y 8 ( xi
x ) 2
i 1
n 2
y3
6 2?~
exp{
n 2}
n 2
LX ( 0 , 2 ) 45 n 12
y )
n 2 # y
(~
( x)
! .
n 2
y
( y )
n 2 !" ~
LX ( x , s 2 )
6 2?y 3
n
exp{
2
}
4 n 1
5
2
Paso 5. Determinar la constante crtica.
#y
Procediendo con el mtodo, falta conocer la distribucin de !! ~ , pero no resulta fcil. Por lo
"y
que se debe hacer un anlisis del problema. Se tiene que encontrar max
() basadas en (x) .
101
6 n
2 3
4 8 ( xi
x ) 1
1
4 ni 1
4
2 1
4 8 ( xi
0 ) 1
5 i 1
2
n 2
(x) !! ~
n 2
n
6
3
( xi
x ) 2
8
1
4
1
4 n i 1
4
2 1
4 8 ( xi
x x
0 ) 1
5 i 1
2
6
3
n
4
1
( xi
x ) 2
4
1
8
i 1
1
4 n
n
4
2
2 1
4 8 ( x i
x ) 2( x
0 )8 ( xi
x ) ( x
0 ) n 1
i 1
4 i 1
1
0
5
2
n 2
n 2
n
6
32
( xi
x ) 2
n 2
8
4
1
i 1
1 #! 1
4 n
2
4
"1 T
2
2 1
(
x
x
)
n
(
x
)
0
48 i
1
5 i 1
2
2
h(T )
Donde, T 2
n( x
0 ) 2
n
8 (x
x)
,y
i 1
# 1
Finalmente, (x) k & !
2
"1 T
n 2
k&
1
k1 & 1 T 2 k 2 & T 2 k
2
1 T
T
n( x
0 )
n
8 ( xi
x ) 2
i 1
Z
Y
x
0
1 n 8 ( xi
x ) 2
i 1
Z
n
1
Y
n
1
1
n
1
x
0
s
n (x
0 )
ns 2
2
* n (x
0 )
~ N (0,1)
; pero )
2
- ns
2
-( 2 ~ n
1
%T
102
Z
Y
ns
2
Z
Y
n
1
~ t n
1
Note que [T 2 k ] y
P{T 2 k | 0 , 2 0} 1
P{T 2 k | 0 , 2 0} 1
P{
k T k | 0 , 2 0}
1
P{
k T
1
n
1
k | 0 , 2 0}
1
P{
k (n
1) T k (n
1) | 0 , 2 0}
0
2 0
Como 0 y 2 0 , T ~ t n
1 , se observa que la parte derecha no depende de y 2
1
P{
k (n
1) T k (n
1) }
P{T
k (n
1)
T k (n
1) }
Donde T ~ t n
1 .
Por lo tanto, k debe ser tal que P{
k (n
1) T k (n
1)} 1
.
De las tablas de t n
1 se buscan los valores de t1
tales que
Ftn
1 (t1
2 )
Ftn
1 (
t1
2 ) 1
Ftn
1 (t1
2 )
(1
Ftn
1 (t1
2 )) .
103
1
F
t
n
1
(
t1*
2 )
F
t
n
1
(t1*
2 )
1
n
1
(t1
2 ) 2 .
Por lo tanto,
2
*
-1, si T
( x) )
2
(0, si T
1
n
1
1
n
1
(t1
2 ) 2
(t1
2 ) 2
T t1*
2 .
Pero, si la funcin de prueba se basa en (x) , se tiene que regresar a las expresiones iniciales.
NOTA
n (x
0 )
ns (n
1)
2
no depende de 2 .
H0 :
H1 :
es consistente, si
lim
n ( ) 1 F
n'
En donde,
n ( ) 1
P{Error tipo II | }
Note que si { n }n1 es consistente, entonces P{Error tipo II cuando n } GnG'
0 . Por lo tanto,
'
en ocasiones se dice que n es consistente en probabilidad.
CLASE DE HIPTESIS SIMPLES
n ( x)
LX ( 0 )
LX ( )
Para probar
H 0 : 0
H1 : 0
n ( x) )
es consistente, adems para 0
2 ln n (x) ~% r2 ,
n'
[
2 ln n (x) k ] + [n (x) k ]
Por lo tanto, para una dada, es posible obtener el valor crtico k cuando la distribucin
asinttica de la estadstica de prueba es:
2 ln n (x)
bajo H 0
En este caso, k r sobre los primeros k parmetros, donde, 10 , , k0 son valores conocidos. Note
que bajo H 0 , toma valores de la forma
(10 , , k0 , k01 , , r0 )
libres
2 ln n (x) ~% k2
105
*1, si
2 ln n (x) k
(0, si
2 ln n (x) k
n ( x) )
es consistente.
EJEMPLO 3.16
Solucin
Paso 1. Se identifica a y , se obtiene la funcin de verosimilitud.
En este caso {0} : {1} y R : R . Para la funcin de verosimilitud se tiene
n
n
0
*
# 1
exp-)
1 8 ( x
) 2 -/
LX ( , ) !
2
!
2
-. .
-( 2 i 1 i
" 2?
n
n
1 n
2
X ( ; 2 )
ln( 2 )
8 ( x i
)
ln(2? )
2
1
i
2
2
2
2
8
2
2
2 2
2
2( ) i 1
2( 2 ) 2
E
6 n ( x
) 2
n 2 3 0
i
45i8
12
1
& 2
2
8 ( x i
)
i 1
1
n
8 (x
x)2 .
i 1
x
(
)
8
)
/
i
" 2?
.
( 2 i 1
1
2?
exp*-)-
1
2
Se tiene que ,
2 ln( n (x))
n ln(s 2 ) 8 xi2
n ~% 22 , cuando 0, 2 1, n ' .
n
i 1
P{
2 ln n ( X) k | 0, 2 1}
1
P{Y k}, Y ~ 22
1
,
si
n
ln(
s
)
xi2
n 22,1
8
-i 1
n ( x) )
n
-0, si
n ln(s 2 ) 8 x i2
n 22,1
-(
i 1
NOTA
j 1,2, , n
b) Muestre que la razn de verosimilitud generalizada para el juego de hiptesis anterior puede ser
expresada en trminos del siguiente estadstico
m
T
8u
i 1
i 1
j 1
8 ui 8 v j
Solucin a)
Paso 1. Se identifica a y y se obtiene la funcin de verosimilitud.
En este caso {(1 ; 2 ) : 1 2 } y R : R
107
LX,Y ( 1 , 2 ) f X ( x; 1 ) f Y (y; 2 ) 7 1 x i1
1 I ( 0,1) ( x i ) % 7 2 y j 2
1 I ( 0,1) ( y j )
i 1
# m
1m !! 7 x i
" i 1
1
1
# m
!! 7 x i
" i 1
m
1
j 1
# n
% 2n !! 7 y j
" j 1
1
1
n
2
# n
!7 y j
! j 1
"
2
1
2
1
m 1 8 ln(x i ) 0 & 1
i 1
m
m
8 ln(x )
i
i 1
E ln(LX,Y ( 1 , 2 ))
E 2
n 2 8 ln( y j ) 0 & 2
j 1
n
n
8 ln( y
j 1
E2
E2
ln(LXY () )
ln(LXY ( ) ) 0 y las segundas
E1E 2
E 2 E1
derivadas son negativas y los menores cambian de signo de menos a ms. Es decir, los estimadores de
mxima verosimilitud bajo todo el espacio paramtrico son:
m
*
;
- 1 m
ui
8
i 1
)
n
-2 n
;
vj
8
j 1
(
u i
ln(xi )
v j
ln( y j )
108
mn
LX,Y ( 1 , 2 ) |
n
# m
! 7 xi 7 y j
! i 1 j 1
"
n
6m
3
ln(LX,Y ( 1 , 2 ) | ) (m n) ln( ) (
1) 48 ln(xi ) 8 ln( y j )1
j 1
5 i 1
2
E ln(LX,Y ( 1 , 2 ))
E
mn
n
6m
3
48 ln(x i ) 8 ln( y j )1 0
j 1
5 i 1
2
mn
m
i 1
j 1
8 ln(xi )
8 ln( y j )
mn
8u 8v
i
i 1
j 1
( x, y )
~
L X ,Y ( )
L ( )
X ,Y
n
~ # m
m n !! 7 xi 7 y j
" i 1 j 1
#
!m n
!
"
"
i 1
mn
i 1
m
#
#
!! m 8 u i !! n
i 1
"
"
8u 8v
#
!m n
!
"
1m2n !! 7 xi
j 1
# n
!7 y j
!
" j 1
2
1
; como a e ln a
#
n
# m
! m n ! 8 u 8 v
1
! i 1 i j 1 j
"
n
6 *m
03 !"
% 4exp)8 ln(xi ) 8 ln( y j )/1
j 1
.21
54 ( i 1
m
#
! m 8 ui
1
i 1
!
6 *m
03 "
exp
ln(
)
v
x
)8
8
j 4
i /1
j 1
.2
5 ( i 1
n
#
! 8 ui 8 v j
! i 1
j 1
"
m
1
1
mn
##
m
n
! ! m n 8 u 8 v
1
i
j
i 1
j 1
#
8m ui
8n v j !" !"
! e i 1 % e j 1
!
"
m
#
!! m 8 ui
1
i 1
#
8m ui "
#
#
!! m 8 u i !! n 8 v j ! e i 1
i 1
" j 1 !"
"
m
( m n) m n
mmnn
# n
!8v j
! j 1
%"
( m n) m n
mmnn
8 ui
# m
% !! 8 u i
" i 1
n
#
! n 8 v j
1
j 1
#
8n v j !"
! e j 1
!
"
3
4 m n
8 ui
8 v j 1
# m
i 1
j 1 21
!! 8 u i % e 54
" i 1
e
m e i 1 e
n e
n
#
! n 8 v j
1
j 1
6 *n
03 !"
exp
ln(
)
y
4 )8
j /1
45 ( j 1
.12
n
n
# m
8 v j !! 8 ui 8 v j
j 1 " i 1
j 1
mn
n
# n
8 u i 8 v j !! 8 v j
i 1
j 1
" j 1
m
n
m
8 u i 8 v j
i 1
j 1
109
8v
j 1
8u 8v
i
i 1
(x, y )
, quedar
j 1
( m n) m n
% T m (1
T ) n
mmnn
(x, y ) )
*
( m n) m n
1
,
si
% T m (1
T ) n k
m n
-m
n
)
mn
-0, si (m n)
% T m (1
T ) n k
-(
mmnn
*1, si T m (1
T ) n k
mmnn
k
;
)
k
m
n
( m n) m n
(0, si T (1
T ) k
EJEMPLO 3.18
T
8x
i 1
8x 8y
i
i 1
j 1
Solucin a)
Paso 1. Se identifica a y y se obtiene la funcin de verosimilitud.
En este caso, R : R , {(1 , 2 );1 2 } , y la funcin de verosimilitud es
m
i 1
j 1
LXY () 7 1e
1xi I ( 0, ) ( x i ) % 7 2 e
1m 2n e
(1
2 y j
I ( 0, ) ( y j )
8 xi 2 8 y j ) # m
# n
i 1
j 1
!! 7 I ( 0, ) ( xi ) ! 7 I ( 0, ) ( y j )
!
" i 1
" j 1
110
i 1
j 1
LXY () 7 1 e
1xi I ( 0, ) ( x i ) % 7 2 e
1m 2n e
(1
2 y j
I ( 0, ) ( y j )
8 xi 2 8 y j ) # m
# n
i 1
j 1
!! 7 I ( 0, ) ( xi ) ! 7 I ( 0, ) ( y j )
!
" i 1
" j 1
ln(LXY () )
j 1
j 1
8 y j 0 & 2 n 8 y j
E2
E2
ln(LXY () )
ln(LXY ( ) ) 0 y las segundas
E1E 2
E 2 E1
derivadas son negativas y los menores cambian de signo de menos a ms. Es decir, los estimadores de
mxima verosimilitud bajo todo el espacio paramtrico son:
1
m
m
8 xi
1
x
1
y
i 1
2
n
n
8 yj
j 1
i 1
j 1
LXY () 7 e
xi I ( 0, ) ( xi ) % 7 e
mn e
y j
I ( 0 , ) ( y j )
8 xi 8 y j ) # m
# n
i 1
j 1
!! 7 I ( 0, ) ( x i ) ! 7 I ( 0, ) ( y j )
!
" i 1
" j 1
( 8 xi 8 y j )
ln(LXY () )
i 1
j 1
d
mn
m
i 1
j 1
8 xi 8 y j
111
8 xi 8 y j )
LXY ( )
m n e i 1 j 1
m
n
LXY ( )
1 8 xi
2 8 y j )
j 1
m n e i 1
(x, y )
Sustituyendo , 1 , y 2
6
4
4
4
4
4
5
(x, y )
3
# m
1
n
!
nm
x 8 y 11
8
!
i
j
j 1 11
"i 1
2
6
4#
4!
4!
4 !"
4
5
m#
!
!
i
!!
i 1
"
m
m 8x
n
n 8 y
j
j 1
n m
n3
1
1
1
1
1
2
Sustituyendo
m
X 8 X i ~ @(m,1 1 )
i 1
Y 8 Y j ~ @ ( n, 1 2 )
j 1
Se obtiene
#mn
!!
x y
"
(x, y )
#m
!
"x
mn
#n
!!
" y
xm yn
k1 ;
( x y) nm
( m n) m n
xm yn
%
( x y) nm
mmnn
con k1 k %
mmnn
.
(n m) n m
a) De la prueba anterior
# x
xm yn
!!
nm
( x y)
"x
# y
!!
y "x
y
x
x
; si T
1
T m (1
T ) n
y
y
x y
x y
x y
Finalmente,
*1, si T m (1
T ) n k1
m
n
(0, si T (1
T ) k1
(x, y ) )
112
EJEMPLO 3.19
Supngase que se tienen dos muestras aleatorias independientes tales que X 1 , X 2 ,, X n una muestra
aleatoria que se distribuyen N ( 1 , 12 ) y Y1 , Y2 , , Ym una muestra aleatoria que se distribuye
N ( 2 , 22 ) . Se desea probar:
H 0 : 1 2
H 1 : 1 2
b)
NOTA
n
* 1 n
20
2? 2 exp)
8 ( x i
1 ) /
2
( 2 i 1
.
f (y; 2 , 2 ) #!1
"
m
* 1 m
20
2? 2 exp)
8 ( yi
2 ) /
2
( 2 i 1
.
Luego,
LX,Y (1 , 2 , 2 ) f X (x; 1 , 2 ) % f Y (y; 2 , 2 )
(x, y )
n m
m
*
30
- 1 6n
2
2 exp)
(
x
)
(
y
)
4
1/
8
8
i
1
j
2
2
j 1
2( 2 5 i 1
.
Paso 2. Se obtienen los estimadores de mxima verosimilitud, bajo todo . Despus de calcular el
logaritmo natural, derivando parcialmente y resolviendo el sistema de ecuaciones, se obtiene que
113
1 x , 2 y y 2
m
0
1 *
-n
2
2)8 ( xi
x ) 8 ( y j
y ) / .
nmj 1
( i 1
.
n m
m
*
30
- 1 6n
exp)
~ 2 48 ( xi
~1 ) 2 8 ( y j
~2 ) 2 1 /
j 1
2( 2 5 i 1
.
~1
(8 x i 8 y j )
2
i 1
j 1
nm
m
1 6n
~ 2
~ 23
~ 2
48 ( x i
1 ) 8 ( y j
1 ) 1
n m 45 i 1
12
j 1
m
3
1 6n
nm
2
2
(x y) 2 1
48 ( x i
x ) 8 ( y j
y )
n m 54 i 1
nm
12
j 1
nm 2
( n m 2~ 2 )~ 2
# 1
!
!
~2
" 2?
nm 2
# 1
!
!
2
" 2?
nm 2
e
( n m ) 2 .
Bajo todo
# 1
LX,Y ( 1 , 2 , ) !
!
2
" 2?
2
nm 2
( n m 2 2 ) 2
e
( n m ) 2 .
Por lo tanto
# 2
n (x, y ) !! ~ 2
"
( n m ) 2
6
3
nm
#
4 2 ! 2
( x
y ) 2 1
nm
"
2
5
( n m ) 2
1 1 z
( n m ) 2
Donde
z
nm (n m) ( x
y ) 2 nm( x
y ) 2
(n m) 2
2
nm( x
y ) 2
n
i 1
j 1
8 ( xi
x ) 2 8 ( y j
y ) 2
Paso 5. Determinar la constante crtica. Note que los eventos son equivalentes
n (x, y) k + z k
Puesto que
# 1
"1 z
n (x, y ) !
nm 2
k +
1
1
k 2 n m k1 + k 2 1 z + z k 2
1 k .
1 z
k1
114
max P{Z k | 1 , 2 , 2 }
1 2
2 0
H 0 : 1 2 , note que
m
X
Y ~ N (0, 2 ( nnm
)) . De tal forma que al estandarizar resulta
X
Y
(n m) nm
~ N (0,1) .
( xi
x )
8
i 1
~ n2
1 y
8(y
y) 2
j 1
~ m2
1 ,
como
m
8 ( xi
x ) 2
i 1
2
8(y
y) 2
j 1
2
8 ( xi
x ) 2
i 1
Por lo tanto,
2
8(y
y) 2
j 1
~ n2 m
2 y es independiente de X
Y .
2
nm x
y
nm
n
8 (x
i 1
x) 8 ( y j
y)
2
~ t n m
2
(n m
2)
2
j 1
T2
. Como la distribucin de Z bajo H 0 no depende de 1 2 , entonces
nm
2
k debe ser tal que
Luego, Z
0
T2
k /
(n m
2
.
P)
1
P{T 2 k ( n m
2)}
1
P{
k ( n m
2) T k (n m
2) }
As
P
k (n m
2) T k (n m
2) 1
115
1
tm
n
2,1
2
*
tm
n
2,1
2
1
t n*m
2,1
k (n m
2) y si se quiere la prueba en base a k se tiene
k
t n* m
2,1
nm
2
(x, y ) )
EJEMPLO 3.20
En las condiciones del ejemplo anterior, sean X 1 , X 2 , , X n una muestra aleatoria N ( 1 , 2 ) y sean
Y1 , Y2 ,, Ym una muestra aleatoria N ( 2 , 2 ) . Qu pasa, cuando se quiere probar la siguiente
hiptesis?
H 0 : 1 2 , 2 0
H 1 : 1 2 , 0
2
H 0 : 1
2 0
H 1 : 1
2 0
Solucin
En este caso ( H1 : 1
2 0 ) es razonable plantear una pregunta de una cola, basada en T de la forma
Luego, T ~ t nm
2 & c t nm
2, .
116
EJEMPLO 3.21
X 1 , X 2 , , X n
H 0 : 12 22 , 1 , 2 R
H 1 : 12 22 , 1 , 2 R
Solucin
Paso 1. Se identifica a y y se obtiene la funcin de verosimilitud. Se tiene que
R 2 ' R 2 y {( 12 , 22 ) : 12 22 } : R 2 .
En este caso, hay cuatro parmetros 1 , 2 , 1 , 2 de tal forma que la funcin de verosimilitud es
LX,Y ( 1 , 2 , 12 , 22 ) f X (x; 1 , 12 ) f Y (y; 2 , 22 )
# 1
!
! 2? 2
1
"
n 2
8 ( xi
1 ) 2 # 1
%!
! 2? 2
2
"
m 2
2 12 i 1
8 ( yi
2 ) 2
2 22 i 1
Paso 2. Se obtienen los estimadores de mxima verosimilitud, bajo todo R 2 ' R 2 , se puede ver
como en el ejemplo19 que:
1 x , 2 y , 12
Paso
3.
Se
obtienen
los
2
2
2
2
2
{( 1 , 2 ) : 1 2 } : R .
1 m
1 n
( xi
x ) 2 y 22 8 ( y j
y ) 2 .
8
n i 1
m j 1
estimadores
de
mxima
verosimilitud,
bajo
todo
Note que bajo H 0 cada vez que se calcula la funcin de mxima verosimilitud, bajo H 0 es como si se
tuviera otro problema. Adems en este caso se puede apreciar que bajo H 0 : ( 12 22 ) se est en el
caso del ejemplo 3.19, en donde se obtuvo que ~1 x; ~2 y
~ 2
m
0
1 *n
2
2
)8 ( xi
x ) 8 ( y j
y ) /
n m ( i 1
j 1
.
Paso 4. La razn de verosimilitudes. Con estos estimadores de mxima verosimilitud, se puede calcular
la razn
L ( ~ , ~ , ~ 2 , ~ 2 )
(x, y ) X,Y 1 2 12 22 .
LX,Y ( 1 , 2 , 1 , 2 )
Con la sustitucin de los estimadores y simplificando se obtiene
( n m) 2
* nm 0
)
/
2? ( z1 z 2 ) .
(
(x, y )
.
n 2
m 2
# n
# m
!
!
! 2?z ! 2?z
1
2
"
"
Donde
n
i 1
I 1
z1 8 ( xi
x ) 2 ; z 2 8 ( y j
y ) 2 .
117
Z1
~ n2
1 y
Z2
2
~ m2
1 y adems son independientes.
Z
Z
2 n
1 Z1 (n
1)
~ Fn
1,m
1
2 m
1 Z 2 (m
1)
(x, y )
((n
1) (m
1) F ) n 2
( m n) ( m n ) 2
%
mm 2nn 2
(1 (n
1) (m
1) F ) ( m n )
g (F ) .
Figura 3.13 Grfica de la funcin g (F ) donde g (a) g (b) k del ejemplo 3.21
max
P{F a o F b | 1 , 2 , 12 , 22 } , falta encontrar a y b que satisfagan lo anterior, para
2
2
1 2
1 ni de 2 , 12 , 22 , luego
Donde FF
* FF (b)
FF (a) 1
)
( g (b)
g (a) 0
es la funcin de distribucin de la distribucin Fn
1,m
1 . Resolviendo el sistema
(x, y ) )
y b Fn
1,m
1,1
2 ; 1
P(a F b) FF (b)
FF (a) , pero
2
2
X 1 , X 2 , , X n
Se desea probar
H 0 : 12 22 , 1 , 2
H 1 : 12 22 , 1 , 2
H 0 : 12 22 1
H 1 : 12 22 1
(x, y ) )
120
Captulo 4
Pruebas de hiptesis para los parmetros de una
distribucin normal
Introduccin
n captulos anteriores se revisaron los mtodos para llevar a cabo las pruebas de hiptesis,
sus metodologas y algunos casos particulares que se presentan al momento de contrastar un
juego de hiptesis dado.
As, en el primer captulo se exponen los conceptos bsicos para la construccin de
hiptesis estadsticas; en el segundo, por medio del lema de Neyman-Pearson, se abordan dichas
hiptesis utilizando la metodologa de las pruebas de razn de verosimilitud simple y en el tercer
captulo se habl de las pruebas de razn de verosimilitud generalizada.
En el campo de las distribuciones; la distribucin normal ocupa un lugar muy especial, ya que
gracias al teorema de lmite central, prcticamente cualquier distribucin (bajo ciertas restricciones),
con un tamao de muestras grande se aproxima a la distribucin normal. En este contexto, en el
presente captulo se ver la parte metodolgica de las pruebas de hiptesis para los parmetros de esta
distribucin, es decir, su media y su varianza.
Se abordar el estudio de poblaciones con distribucin normal o aproximadamente normal, por
ejemplo las distribuciones tipo Bernoulli o binomial, de la siguiente manera. Dada una realizacin de la
muestra aleatoria con la que se est trabajando, se utilizarn los resultados vistos en los captulos
anteriores, por ejemplo, las pruebas MP(), UMP() y UMPI(), para obtener las reglas de decisin
para el juego de hiptesis con el que se est trabajando.
4.1 METODOLOGA PARA PROBAR UNA HIPTESIS ESTADSTICA
Para las pruebas de hiptesis que se realizarn en las siguientes secciones se recomienda seguir los
siguientes pasos.
i)
Establecer la hiptesis nula y la hiptesis alterna. Las hiptesis nula y alterna se establecen
con base en las reglas mencionadas en el captulo anterior.
121
Los resultados de las pruebas que se establezcan en las metodologas que se revisarn estn dadas
para el caso compuesta contra compuesta, se pueden usar para las situaciones restantes: simple contra
simple, simple contra compuesta o compuesta contra simple. Adems, aunque ya no se
mencionar, las frmulas que utilicen la distribucin normal se pueden aplicar a poblaciones que no
sean normales, pero slo con muestras grandes.
4.2 PRUEBAS DE HIPTESIS PARA MEDIAS
Hasta el momento se ha revisado que una de las principales distribuciones en el comportamiento de las
poblaciones se refiere a la normal y que sta tiene dos parmetros, la media ( ) y la varianza ( 2 ).
Por tal razn, el desarrollo metodolgico para las pruebas de hiptesis iniciar con el parmetro media,
sobre el que se analizarn dos situaciones. En este momento cabe aclarar que la aplicacin de los casos
que se analizarn, se restringen a poblaciones normales o aproximadamente normales.
4.2.1 PRUEBAS DE HIPTESIS PARA LA MEDIA DE POBLACIONES APROXIMADAMENTE
NORMALES CUANDO SE CONOCE
TEOREMA 4.1
Sea X 1 , X 2 , , X n una muestra aleatoria de N ( , 02 ) entonces se pueden tener alguno de los
siguientes contraste de hiptesis
a) H 0 : 0 contra H 1 : 0 , entonces la prueba UMP(), para (0, 1) estar dada por la
siguiente regla de decisin para una realizacin x1 , x 2 , , xn
Rechazar H 0 : 0 , si x 0
0
n
$
1 ( ) x 0
0
n
Z .
# 2
X
0
~ N (0, 1) y CC: 0 0 $
1 ( )
EP: X ~ N !! , 0 Z
n
n
0 n
"
0
n
$
1 (1
) x 0
0
n
Z .
# 2
X
0
~ N (0, 1) y CC: 0 0 $
1 (1
)
EP: X ~ N !! , 0 Z
n
0 n
n
"
0
n
0
n
$
1 ( 2) 0
0
n
$
1 (1
2) 1
Z
0
n
Z 2 .
# 2
#
#
EP: X ~ N !! , 0 y CC: 0 0 $
1 ! y 1 0 $
1 !1
n
2
"
"2
n
n
"
122
Una mquina produce piezas metlicas de forma cilndrica. Se toma una muestra de 9 piezas cuyos
dimetros son 9.8, 9.5, 9.8, 11.5, 9.0, 10.4, 9.8, 10.1 y 11.2 milmetros. Supngase que los dimetros
tienen una distribucin aproximadamente normal con una varianza de 0.64 milmetros 2. Si el
fabricante de dichas piezas afirma que el dimetro promedio de stas es de 10 milmetros.
d) Si el valor de 10.5 milmetros calcule la potencia de la prueba con la regla de decisin (b).
Despus de calcular la potencia de la prueba cambiara su impresin de la afirmacin sobre la
prueba.
Solucin
a) Se pide una prueba de hiptesis para la media, en donde se desea probar que la media de las piezas
metlicas es igual a 10 milmetros (espacio paramtrico cerrado), H 0 : 10 . Luego, la hiptesis
alterna ser el opuesto, es decir diferente de 10, H 1 : 10 .
b) Siguiendo los pasos para una prueba de hiptesis.
i)
H 0 : 10 contra H 1 : 10 .
n
n
porcentuales para la distribucin normal estndar, $
1 (0.01 2) $
1 (0.5%)
2.5758, y
$
1 (1
0.01 2) $
1 (99.5%) 2.5758. Por otro lado, 0 0.64 0.80 , n 9 y 0 10 .
Finalmente, la regla de decisin.
Rechazar: H 0 : 10 , si x 0
x 0
0
n
0
n
$
1 ( 2) 10
0.80
9
$
1 (1
2) 10
(2.5758) 9.31
0.80
9
(2.5758) 10.69 .
regin de rechazo Rr
9.31
regin de no rechazo Ra
10.69
123
iv) Por ltimo se aplica la regla de decisin y para esto se calcula el valor de la estadstica de
prueba segn la realizacin, obteniendo x 10.12 y, con esto se concluye que H 0 : 10 no
se rechaza al 1% de significancia.
c) Al 1% de significancia se puede concluir, que con la realizacin obtenida no existen evidencias para
rechazar la hiptesis nula.
d) Para calcular la potencia de la prueba se utiliza la regin de rechazo
#
9.31
10.50
10.69
10.50
PRechazar H 0 | 10 PX 9.31 X 10.69 | 10.5 P! Z
Z
!
0.80 9
0.80 9
"
PZ
4.46 P Z 0.71 0.2389
Aunque la prueba es la UMPI(0.01), en el caso de que la verdadera media sea 10.5, la potencia
es baja y la prueba no es muy adecuada. Luego, surgen las preguntas
Se puede aumentar la potencia?, en caso afirmativo cmo aumentar la potencia?
Resulta que, en cualquier situacin la potencia puede aumentarse de varias formas; una
aumentando el nivel de significancia y la otra aumentando la informacin, ya que mientras ms
informacin se tiene de un problema la incertidumbre disminuye.
EJEMPLO 4.2
i) H 0 : 10 contra H 1 : 10 .
ii) Nivel de significancia 0.10 .
iii) Se requiere calcular la CC: 0
0
$
1 ( 2) y 0
0
$
1 (1
2) . As, de las tablas
n
n
1
porcentuales para la distribucin normal estndar, $ (0.10 2) $
1 (5%)
1.6449, y
$
1 (95%) 1.6449 . Por otro lado, 0 0.64 0.80 , n 9 y 0 10 . Finalmente, la regla
de decisin.
Rechazar: H 0 : 10 , si x 10
0.80
9
(1.6449) 9.561 x 10
0.80
9
(1.6449) 10.439 .
regin de rechazo Rr
9.561
regin de no rechazo Ra
10.439
124
iv) Por ltimo se aplica la regla de decisin y para esto se calcula el valor de la estadstica de prueba
correspondiente a la realizacin, obteniendo x 10.12 , y con lo cual se concluye que
H 0 : 10 no se rechaza al 1% de significancia.
La potencia en estas condiciones sera:
#
9.561
10.5
10.439
10.5
PRechazar H 0 | 10 PX 9.561 X 10.439 | 10.5 P! Z
Z
!
0.80 9
0.80 9
"
PZ
3.52 P Z
0.23 0.5912
i) H 0 : 10 contra H 1 : 10 .
ii) Nivel de significancia 0.01.
iii) En el ejemplo anterior se encontr $
1 (0.01 2)
2.5758, y $
1 (99.5%) 2.5758. Por otro
lado, 0 0.64 0.80 , n 25 y 0 10 . Finalmente, la regla de decisin.
Rechazar: H 0 : 10 , si x 10
0.80
25
(2.5758) 9.59 x 10
0.80
25
(2.5758) 10.41 .
regin de rechazo Rr
9.59
regin de no rechazo Ra
10.41
iv) Por ltimo se aplica la regla de decisin, para esto se calcula el valor de la estadstica de prueba
correspondiente a la realizacin, obteniendo x 10.09 y, con lo cual se concluye que
H 0 : 10 no se rechaza al 1% de significancia.
Para calcular la potencia de la prueba se utiliza la regin de rechazo
#
#
9.59
10.5
10.41
10.5
P!! Z
PRechazar H 0 | 10 PX 9.59 X 10.41 | 10.5 P!! Z
0.80 5
0.80 5
"
"
PZ
5.69 P Z
0.56 0.7123
Los encargados de un centro de atencin ciudadana en donde se encuentra localizada una mquina de
refrescos ha estado recibiendo constantemente quejas por parte de los usuarios de la mquina indicando
que despacha menos lquido que el estipulado en las instrucciones (2.40 decilitros de refresco en
promedio). Ellos deciden cambiar la mquina si al revisar una muestra aleatoria y llevar a cabo una
prueba de hiptesis al 5% de significancia se decide estadsticamente que es valida la afirmacin de los
usuarios. Suponiendo que la cantidad de lquido despachada por la mquina tiene una distribucin
aproximadamente normal con una desviacin estndar igual a 0.15 decilitros,
a) Plantee un contraste de hiptesis adecuado para el problema y lleve a cabo la prueba si una muestra
aleatoria de 36 refrescos arroja un contenido promedio de 2.25 decilitros.
b) Calcule la potencia de la prueba, suponiendo que 2.3 0 decilitros.
125
c) Explique cmo apoya el resultado obtenido estadsticamente a una toma de decisiones sobre el
retiro o no de la mquina.
Solucin
a) Se pide una prueba de hiptesis para la media, en donde los usuarios afirman que la mquina
despacha menos de 2.40 decilitros en promedio, luego el signo de igualdad se encuentra en la
afirmacin del fabricante. As, se tendr lo siguiente.
1
normal estndar, $ (0.05) $
1 (5%)
1.6449. Por otro lado, 0 0.15 , n 36 y
0
n
$
1 ( ) 2.40
0.15
36
(1.6449) 2.359 .
iv) Por ltimo se aplica la regla de decisin, recordando que x 2.25 Rr . As, se concluye que
H 0 : 2.40 se rechaza al 5% de significancia.
Por lo tanto, al 5% de significancia y la realizacin obtenida no existen evidencias para refutar la
afirmacin de los clientes de que 2.40 .
b) Para calcular la potencia de la prueba se utiliza la regin de rechazo
#
2.359
2.30
PRechazar H 0 | 2.40 P X 2.359 | 2.30 P! Z
PZ 2.36 0.991 .
!
0
.
15
36
"
Si la verdadera media fuera 2.30decilitros la prueba tendra una potencia muy elevada.
c) El resultado ayuda estadsticamente a tomar la decisin de retirar la mquina despachadora de
refresco, ya que a un nivel de significancia razonablemente bajo (5%), se rechaza la hiptesis nula, que
concuerda con la afirmacin del fabricante, en apoyo de la hiptesis del consumidor. Adems, la
potencia de la prueba es bastante elevada y de teora se sabe que esta prueba es la UMP(0.05), es decir,
en estas condiciones no existe otra prueba ms potente.
Cmo realizar una prueba de hiptesis cuando se tiene una tabla de frecuencias?
126
EJEMPLO 4.4
Una mquina de refrescos est ajustada de tal manera que la cantidad de lquido despachado se
distribuye aproximadamente normal con una desviacin estndar de 15 mililitros. Se elige una muestra
de tamao 60, y un trabajador registra el lquido despachado por clases de frecuencia, resultando
Intervalos de clase
Frecuencias ( n i )
[239, 241)
[241, 243)
10
[243, 245)
20
[245, 247)
11
[247, 249)
12
[249, 251]
Tabla 4.1 Intervalos de clase y frecuencia de una m.a. para el problema 4.4
El fabricante afirma que la mquina despacha en promedio 240 mililitros. A un nivel de
significancia del 5% pruebe si es valida la afirmacin del fabricante.
Solucin
Para la solucin se siguen los mismos pasos que para datos no agrupados, slo cambian las frmulas
para calcular los valores muestrales requeridos, en este caso se est refiriendo al promedio.
Calculando la media por clases de frecuencias, x f
1 m m
1 6 m
x i ni
8
8 x i ni .
60 i 1
n i 1
Las marcas de clase, se obtienen de la tabla anterior: 240, 242, 244, 246, 248 y 250. As,
1
xf
(240 : 4 242 : 10 244 : 20 246 : 11 248 : 12 250 : 3) 244.8667 .
60
Para el planteamiento del contraste de hiptesis se nota que la afirmacin del fabricante se
refiere a una igualdad de media 240, el conjunto paramtrico es cerrado, luego la hiptesis nula
ser 240.
Siguiendo los pasos de la metodologa para pruebas de hiptesis.
n
n
1
distribucin normal estndar, $ (0.025)
1.96 y $
1 (1
0.02) 1.96 . Por otro lado,
0
n
0
n
$
1 ( 2) 240
$
1 ( 2) 240
15
60
15
60
(1.96) 236.20 o
(1.96) 243.80 .
127
regin de rechazo Rr
regin de no rechazo Ra
236.2
243.8
iv Por ltimo se aplica la regla de decisin, recordando que x f 244.87 . As, se concluye
que al 5% de significancia hay evidencias para rechazar H 0 : 240 .
4.2.2 PRUEBAS DE HIPTESIS PARA LA MEDIA DE POBLACIONES APROXIMADAMENTE
NORMALES CUANDO SE DESCONOCE
TEOREMA 4.2
Sea X 1 , X 2 , , X n una muestra aleatoria de N ( , 2 ) entonces se pueden tener alguno de los
siguientes contraste de hiptesis
a) H 0 : 0 contra H 1 : 0 , entonces la prueba UMP(), para (0, 1) estar dada por la
siguiente regla de decisin para una realizacin x1 , x2 , , xn
Rechazar H 0 : 0 , si x 0
s n
1
n
Ftn
11 ( ) x 0
s n
1
n
t (n
1) .
# 2
X
0
s
T
~ t n
1 y CC: 0 n
1 Ftn
11 ( )
EP: X ~ N !! ,
n
S n
1 n
n
"
s n
1
n
Ftn
11 (1
)
x 0
s n
1
n
t (n
1) .
# 2
X
0
s
T
~ t n
1 y CC: 0 n
1 Ftn
11 (1
)
EP: X ~ N !! ,
n
n
S n
1 n
"
s n
1
n
s n
1
n
Ftn
11 ( 2) 0
s n
1
Ftn
11 (1
2) 1
t 2 (n
1) o
s n
1
n
t 2 (n
1)
# 2
s
s
y CC: 0 n
1 Ft
1 #! y 1 n
1 Ft
1 #!1
EP: X ~ N !! ,
n
1
n
1
n
2
"2
"
n
n
"
11 (H ) representa el cuantil H de la
distribucin t-student con n
1 grados de libertad para H (0, 1) , t H representa el valor de la
variable t-student con n
1 grados de libertad cuya rea derecha es H (0, 1) .
128
EJEMPLO 4.5
El gerente de ventas de una empresa productora de focos en su reunin con los representantes de
diferentes centros comerciales, afirma que su producto tiene una duracin mayor a 800 horas. Los
representantes de los centros comerciales antes de realizar la compra deciden comprobar
estadsticamente la afirmacin del fabricante. Ellos eligieron una muestra de tamao 26 y obtuvieron
un tiempo de vida promedio de x 810 horas con una desviacin estndar muestral de 45 horas.
a) Plantee un contraste de hiptesis adecuado para el problema, con un nivel de significancia del 5% y
suponiendo normalidad en el tiempo de vida de los focos justifique si es o no valida la afirmacin
de los fabricantes de focos.
b) Calcule la potencia de la prueba, suponiendo que 820 horas.
c) Explique como apoya el resultado obtenido estadsticamente a una toma de decisiones a los
representantes de los centros comerciales sobre la afirmacin del fabricante de focos.
Solucin
a) Para plantear el contraste de hiptesis se toma en cuenta que la afirmacin del fabricante es
800 horas y no es un conjunto cerrado. Luego,
s n
1
n
Ftn
11 (1
) . As, de las tablas porcentuales para la distribucin t-student con
1
(1
0.05) 1.708 .
n
1 26
1 25 grados de libertad, Ft25
s n
1
n
Ftn
11 (1
) 800
45
26
(1.708) 815.1 .
815.1
iv) Por ltimo se aplica la regla de decisin, para esto no olvide que x 810 815.1 , y con lo
cual se concluye que al 5% de significancia y la realizacin tomada no hay evidencias para
rechazar H 0 : 800 .
As, se concluye que al 5% de significancia y la realizacin obtenida no es valida la afirmacin
del fabricante de que 800 .
b) Para calcular la potencia de la prueba se utiliza la regin de rechazo
#
815.1
820
PRechazar H 0 | 800 P X 815.1 | 820 P! T
PT
0.5552 0.7082.
!
45 26
"
c) El resultado ayuda estadsticamente a tomar la decisin sobre las compra de focos, en este caso los
compradores deberan tomar la decisin de no comprar los focos o tomar varias realizaciones ms
129
para corroborar su toma de decisiones. Adems, de la teora se sabe que esta prueba es la
UMP(0.05), es decir, en estas condiciones no existe otra prueba ms potente.
NOTA
1.- Para calcular el valor de la probabilidad se puede utilizar cualquier paquete estadstico,
por ejemplo, Excel. En la pestaa de funcin escribir: =1-DISTR.T(0.552,25,1) . 0.5552 es
el valor de la variable con el que se va a calcular la probabilidad a la derecha (slo valores
positivos), 25 son los grados de libertad y 1 se refiere a una cola.
2.- En el paquete R y la simetra de la distribucin T, P(T
0.5552) P(T 0.5552) ,
luego la funcin de probabilidad acumulada para la distribucin T, pt(0.5552, 25), da
como resultado 0.7082.
3.- En caso de no tener un paquete estadstico se usan las tablas con los valores ms
prximos a 0.5552, obteniendo con 25 grados de libertad P(T 0.6844) 0.25 y
P(T 0.5312) 0.30 , se interpola P(T 0.5552) , obteniendo P(T 0.5552) 9 0.2922 .
Finalmente, P(T
0.5552) P(T 0.5552) 9 0.7078 valor muy prximo al encontrado
directamente con los paquetes, 0.7082 (4 diez milsimas de diferencia).
EJEMPLO 4.6
Los fabricantes de mquinas despachadoras de bebida afirman que sus mquinas despachan entre
225, 245, mililitros de bebida. Para probar tal afirmacin los consumidores toman una muestra
aleatoria de 30 servicios de la mquina de bebidas obteniendo un contenido promedio de 229 mililitros,
con una desviacin estndar de 25 mililitros. Suponiendo normalidad en la cantidad de lquido
despachada por la mquina y con base en una prueba estadstica al nivel de significancia del 0.04
a) Plantee un contraste adecuado de hiptesis para el problema y justifique si es o no valida la
afirmacin de los fabricantes de mquinas despachadoras de bebida.
b) Explique como apoya el resultado obtenido estadsticamente a una toma de decisiones sobre la
afirmacin del fabricante de estas mquinas.
Solucin
a) Para el planteamiento del contraste de hiptesis se nota que la afirmacin del fabricante es que
225, 245, , pero por otro lado, en la regla que se dio en la seccin 4.1 para formular los
contrastes de hiptesis se tiene que el conjunto paramtrico 225, 245, es cerrado en ambos
extremos, luego la hiptesis nula ser 225 245 . As, se tendrn los pasos para la prueba:
s n
1
n
Ftn
11 ( 2) y 1
s n
1
n
Ftn
11 (1
2) . As, de tablas de la distribucin t-student
1
(0.02)
2.150 y Ft29
(1
0.02) 2.150 . Por otro
con n
1 30
1 29 grados de libertad, Ft29
lado, s n
1 25 , 0 225 y 1 245 . Finalmente, la regla de decisin.
130
s n
1
n
s n
1
n
Ftn
11 ( 2) 225
25
30
Ftn
11 (1
2) 245
(2.150) 215.2 o
25
30
(2.150) 254.8 .
regin de rechazo Rr
215.2
regin de no rechazo Ra
254.8
Por ltimo se aplica la regla de decisin, recordando que x 229 215.2, 254.8, , y con lo cual
se concluye que al 4% de significancia y la realizacin tomada no hay evidencias para rechazar
H 0 : 225 245 .
b) El resultado ayuda estadsticamente a tomar la decisin sobre la validez de la afirmacin del
fabricante, ya que con un nivel de significancia del 4% y la realizacin elegida se puede concluir
que no existe evidencias para refutar la afirmacin del fabricante. Adems, de la teora se sabe que
esta prueba es la UMPI(0.04), es decir, en estas condiciones no existe otra prueba ms potente.
Como se puede apreciar el uso del Teorema 4.2, est limitado a las tablas de la distribucin tstudent. En general dichas tablas estn elaboradas para valores de n 30 , por consiguiente surge la
pregunta
Qu hacer cuando se desconoce y el tamao de la muestra es mayor a 30 ?
Se puede aproximar la distribucin t-student con la distribucin normal para grados de libertad
grandes si no se cuenta con tablas de la distribucin t- student.
EJEMPLO 4.7
De acuerdo con las normas establecidas para un examen de aptitud mecnica, las personas de 18 aos
deberan promediar al menos 73.2. Si 45 personas de esa edad elegidas aleatoriamente promediaron
66.7 con desviacin estndar de 8.6, pruebe el contraste de hiptesis para la media poblacional
H 0 : 73.2 contra H 1 : 73.2
131
la CC: 0
s n
1
n
$
1 ( ) .
$
1 (0.05)
1.6449 . Por otro lado, s n
1 8.6 y 0 73.2 . Finalmente, la regla de decisin.
Rechazar: H 0 : 73.2 , si x 0
s n
1
n
$
1 ( ) 73.2
8.6
45
(1.6449) 71.09 .
71.09
iv) Por ltimo se aplica la regla de decisin, recordando que x 66.7 71.09 . As se concluye al 5%
de significancia y la realizacin tomada que hay evidencias para rechazar H 0 : 73.2 .
b) Los pasos i) y ii) son iguales al inciso (a), slo cambiar el inciso iii), ya que en lugar de
1
(0.05)
1.6802 . De tal forma que la regla de decisin es:
$
1 (0.05)
1.6449 , se utiliza Ft44
Rechazar: H 0 : 73.2 , si x 0
s n
1
n
1
Ft44
(0.05) 73.2
8.6
45
(1.6802) 71.05 .
1
(0.05)
1.6802 se emplea una interpolacin,
c) Aqu en lugar de utilizar $
1 (0.05)
1.6449 o Ft44
para
1
Ft44
(0.05)
con
sus
valores
ms
prximos
de
tablas;
1
Ft40
(0.05)
1.684
1
Ft50
(0.05)
1.676 . Obteniendo Ft44
(0.05) 9
1.6808, valor que se diferencia del encontrado con
NOTA
Con este ejemplo se ha mostrado que cuando se trate de pruebas de hiptesis para la media
en donde no se conozca la varianza muestral, pero el tamao de muestra sea grande se puede
utilizar la aproximacin por la normal.
4.3 PRUEBAS PARA LA DIFERENCIA DE MEDIAS DE POBLACIONES NORMALES
El problema de la prueba de hiptesis para la diferencia de medias tiene las mismas ideas en su
aplicacin que los intervalos de confianza y se pueden utilizar para hacer afirmaciones sobre la
superioridad de algn producto sobre otro, la menor o mayor duracin de un proceso, etc.
El problema se puede plantear de la siguiente forma: Sean dos poblaciones independientes con
distribucin normal, N (1 , 12 ) y N ( 2 , 22 ) , que representan el comportamiento de dos fenmenos
de inters que se desea comparar. Por ejemplo, el aprovechamiento de un grupo en dos materias
diferentes, la produccin de leche por vacas de dos establos diferentes, la duracin de refrigeradores
similares de dos marcas diferentes, etctera y se desea conocer si existe igualdad en sus medias.
Originalmente el problema se planteo para la afirmacin de que son iguales
H 0 : 1 2 contra H 1 : 1 2
Luego, se generaliz para afirmaciones en donde una media es mejor que la otra
132
H 0 : 1 2 contra H 1 : 1 2 H 0 : 1 2 contra H 1 : 1 2 .
Este caso se deduce fcilmente de las distribuciones muestrales, puesto que la diferencia de las medias
muestrales de poblaciones con distribucin normal tiene una distribucin normal con media 1
2 y
varianza
120
n1
220
n2
conocida ( 120 y 220 conocidas). Luego, la estadstica de prueba estar dada por.
Z
( X
Y )
( 1
2 )
102
n1
202
n2
TEOREMA 4.3
Sean X 1 , X 2 , , X n1 y Y1 , Y2 , , Yn2 dos muestras aleatorias independientes de N (1 , 102 ) y
2
N ( 2 , 20
) , entonces se pueden tener alguno de los siguientes contraste de hiptesis
133
H 0 : 1
2 d 0 contra H 1 : 1
2 d 0 , entonces la prueba UMP(), para (0, 1)
estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn1 y y1 , y 2 , , y n2
a)
Rechazar H 0 : 1
2 d 0 , si CC: x
y d 0 $
1 ( )
102
n1
202
n2
d 0
Z
102
n1
202
n2
b) H 0 : 1
2 d 0 contra H 1 : 1
2 d 0 , entonces la prueba UMP(), para (0, 1) estar
dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn1 y y1 , y 2 , , y n2
Rechazar H 0 : 1
2 d 0 , si CC: x
y d 0 $
1 (1
)
102
n1
202
n2
d 0 Z
102
n1
202
n2
H 0 : d 0 1
2 d1 contra H 1 : 1
2 d 0 o 1
2 d1 entonces la prueba
UMPI(), para (0, 1) estar dada por la siguiente regla de decisin para una realizacin
x1 , x2 , , xn1 y y1 , y 2 , , y n2 :
c)
Rechazar H 0 : d 0 1
2 d1 , CC:
2
2
102 202
#
x
y d 0 $
1 ! 10 20 d 0
Z
n2
n1
n2
" 2 n1
2
o
2
2
102 202
#
x
y d1 $
1 !1
10 20 d1 Z
.
2 n1
n2
n1
n2
"
2
2
Con d 0 , d1 R , 102 y 20
valores conocidos de antemano. En donde, $
1 (H ) representa el cuantil
Los fabricantes de tornillos tipo A y B aseguran que los tornillos tipo A tienen en promedio una mayor
resistencia a la tensin que los tornillos tipo B en ms de 3 kilogramos. Para probar su afirmacin los
fabricantes prueban de forma independiente 100 piezas de cada tipo de cuerda bajo condiciones
similares, obteniendo los siguientes resultados; el tipo A, tuvo una resistencia promedio de 88
kilogramos, mientras que el tipo B una resistencia promedio de 83 Kilogramos. Suponiendo que la
resistencia a la tensin de los tornillos se distribuye normalmente con X A ~ N ( A , 25) y
X B ~ N ( B , 81) realice una prueba estadstica para verificar la afirmacin de los fabricantes.
i)
H 0 : A
B 3 contra H 1 : A
B 3 .
A2
nA
B2
nB
Rechazar: H 0 : A
B 3 , si x A
x B d 0 $
1 (1
)
A2
nA
B2
nB
3 1.6449
25
81
4.69 .
100 100
Es decir, rechazar H 0 : A
B 3 si x A
x B 4.69 . Grficamente se tiene:
regin de no rechazo R a
4.69 regin de rechazo Rr
Figura 4.9. Regin de no rechazo y rechazo para el ejemplo 4.8
Fuente: Elaboracin propia
iv) Por
ltimo
se
aplica
la
regla
de
decisin,
con
x A 88 ,
x B 83 ,
x A
x B 88
83 5 4.69 . As, se concluye que H 0 : A
B 3 se rechaza al 5% de
significancia.
Es decir, al 5% de significancia y la realizacin obtenida no existen evidencias para refutar la
afirmacin de los fabricantes que A B 3 , la cuerda de los tornillos tipo A tiene una resistencia
promedio mayor a la del tipo B en ms de 3 Kilogramos.
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo
PRechazar H 0 | A
B 3 P X A
X B 4.69 | A
B 4
#
#
!
!
! X
X
(
) 4.69
(
)
!
A
B
A
B
A
B
!
| A
B 4
P
P! Z
2
2
2
2
!
A B
A B
!
!
!
!
"
n
n
n
n
A
B
A
B
"
PZ 0.67 0.2514
25 81
100 100
4.69
4
Si la verdadera diferencia de medias fuera 4 kilogramos la prueba tendra una potencia baja.
EJEMPLO 4.9
i) H 0 :1 1
2 3 contra H1 : 1
2 1 o 1
2 3 .
ii) Nivel de significancia 0.04 .
iii)Se est ante una situacin similar a la del inciso c del Teorema 4.3. Luego, se requiere calcular
2
2
2
2
#
#
la CC: d 0 $
1 ! 10 20 y d1 $
1 !1
10 20 . As, de las tablas porcentuales
"2
n1
"
n2
2
n1
n2
Rechazar: H 0 :1 1
2 3 , si
2
2
4.41 2.25
#
x1
x 2 d 0 $
1 ! 10 20 1
2.0537
0.58 o
n2
12
10
" 2 n1
2
2
4.41 2.25
#
x1
x 2 d 1 $
1 !1
10 20 3 2.0537
4.58 .
n
n
2
12
10
"
1
2
Es decir, rechazar H 0 :1 1
2 3 si x1
x2
0.58 o x1
x2 4.58 .
iv) Por ltimo se aplica la regla de decisin, para esto recuerde que x1 16 y x 2 11, luego
x1
x2 16
11 5 y se concluye rechazar H 0 :1 1
2 3 al 4% de significancia.
As, se concluye que al 4% de significancia y la realizacin obtenida no existen evidencias para
aceptar la afirmacin de la persona que realiza el experimento de que 1 1
2 3 .
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo
PRechazar H 0 | 1
2 < 1,3, P ( X 1
X 2
0.58) I ( X 1
X 2 4.58) | 1
2 5
P X 1
X 2
0.58 | 1
2 P X 1
X 2 4.58 | 1
2 5
#
#
!
!
5
X
X
0.58
5
! X1
X 2
5
! 1
2
P!
P!
4
.
41
2
.
25
4
.
41
2
.
25
4
.
41
2
.
25
!
!
!
!
10
10
12
10
" 12
" 12
P( Z
7.25) P( Z
0.55) 0.7088
4.41 2.25
12
10
4.58
5
12 22
El problema de la comparacin de medias para el caso de igualdad de varianzas se le conoce como el
problema de Behrens-Fisher y fue desarrollado entre 1935-1939. En este caso la estadstica de
prueba encontrada tiene una distribucin t-student con n1 n2
2 grados de libertad y est dada por:
T
X
Y
( 1
2 )
Sp
1
1
n1 n 2
, en donde S p2
(n1
1) S12 (n2
1) S 22
n1 n2
2
TEOREMA 4.4
Sean X 1 , X 2 , , X n1 y Y1 , Y2 , , Yn2 dos muestras aleatorias independientes de N (1 , 12 ) y
N ( 2 , 22 ) , entonces se pueden tener alguno de los siguientes contraste de hiptesis
H 0 : 1
2 d 0 contra H 1 : 1
2 d 0 , entonces la prueba UMP(), para (0, 1)
estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn1 y y1 , y 2 , , y n2
a)
1
1
1
1
d 0
t s p
.
n1 n 2
n1 n 2
Rechazar H 0 : 1
2 d 0 , si CC: x
y d 0 Ft
( n11 n2
2) ( ) s p
b) H 0 : 1
2 d 0 contra H 1 : 1
2 d 0 , entonces la prueba UMP(), para (0, 1)
estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn1 y y1 , y 2 , , y n2
Rechazar H 0 : 1
2 d 0 , si CC: x
y d 0 Ft
( n11 n2
2) (1
) s p
1
1
1
1
.
d 0 t s p
n1 n 2
n1 n 2
c) H 0 : d 0 1
2 d1 contra H 1 : 1
2 d 0 o 1
2 d1 entonces la prueba UMPI(),
para (0, 1) estar dada por la siguiente regla de decisin para una realizacin x1 , x 2 , , xn1 y
y1 , y 2 , , y n2 :
#
Rechazar H 0 : d0 1
2 d1 , CC: x
y d 0 Ft
( n11 n2
2) ! s p
"2
1
1
1
1
o
d0
t s p
n1 n 2
n1 n 2
2
1
1
1
1
#
x
y d 1 Ft
( n11 n2
2) !1
s p
d1 t s p
n1 n 2
n1 n 2
2
"
2
Se comparan dos tipos de rosca de tornillo para ver su resistencia a la tensin. Se prueban
independientemente 12 piezas de cada tipo de cuerda bajo condiciones similares, obtenindose los
siguientes resultados, en kilogramos:
137
Tipo de rosca
10
11
12
78
76
80
79
78
80
82
81
79
83
80
82
83
80
82
83
81
80
79
80
82
78
79
81
i)
H 0 : 1
2 0 contra H 1 : 1
2 0 .
1
t ( 22)
t-student
con
1
1
. As, de las tablas porcentuales para la
n1 n2
n1 n2
2 12 12
2 22
grados
de
libertad,
(0.025)
2.074 . Por otro lado, d 0 0 , n1 n2 12 , para obtener la regla de
(n1
1) s12 (n 2
1) s 22
n1 n 2
2
(12
1)3.9697 (12
1)2.6061
1.8133
12 12
2
n2
12 12
Es decir, rechazar H 0 : 1
2 0 si x1
x2
1.54 . Grficamente se tiene:
regin de rechazo Rr
1.54
regin de no rechazo Ra
138
iv) Por ltimo se aplica la regla de decisin, para esto recuerde que x1 79.8333 y x2 80.6667 ,
luego x1
x2 79.83
80.67
0.84 con lo cual se concluye que H 0 : 1
2 0 no se
rechaza al 2.5% de significancia.
Dicho valor se encuentra en la regin de no rechazo, por tal razn a partir de la realizacin dada
no hay evidencias para rechazar H 0 : 1
2 0 a un nivel de significancia del 2.5%. Luego, la
resistencia promedio a la tensin de los tornillos tipo I no es menor a la de los tornillos tipo II.
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo
PRechazar H 0 | 1
2 0 P X 1
X 2
1.54 | 1
2
2
#
#
!
!
! X
Y
( 1
2 )
1.54
( 1
2 )
1.54
(
2)
!
| 1
2
2 P! T2 2
P!
1
1
1
1
1
1
!
!
1.8133
Sp
!
! Sp n n
12 12
n1 n 2
"
1
2
"
PT2 2 0.621 9 0.7295
2
1 5 la hiptesis nula.
b) Siguiendo los pasos de la metodologa para realizar la comprobacin y determinar la prueba
UMP(0.05), se tendr:
i) H 0 : 2
1 5 contra H1 : 2
1 5 .
ii) Nivel de significancia 0.05 .
139
iii)Se est ante una situacin similar a la del inciso b del Teorema 4.4. Se requiere calcular la CC:
d 0 Ft
( n11 n2
2 ) (1
) s p
1
1
.
n1 n 2
1
student con n1 n2
2 10 8
2 16 grados de libertad, Ft
(16
) (0.95) 1.746 . Por otro lado,
(n1
1) s12 (n 2
1) s 22
n1 n 2
2
(10
1)7.50 (8
1)2.68
2.32
10 8
2
n2
10 8
Es decir, rechazar H 0 : 2
1 5 si x2
x1 6.92 . Grficamente se tiene:
regin de no rechazo R a
6.92
regin de rechazo R r
iv) Por ltimo se aplica la regla de decisin, para esto recuerde que x1 14.29 y x2 22.09 , luego
x2
x1 22.09
14.29 7.8 . As, se concluye que H 0 : 2
1 5 se rechaza al 5% de
significancia. Es decir, el recubrimiento si aumenta la resistencia a la ruptura de la soldadura en
ms de 5 libras.
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo
#
!
6.92
8
! X
X1
8
PRechazar H 0 | 2
1 5 P X 2
X 1 6.92 | 2
1 8 P! 2
! 2.32 1 1 2.32 1 1
!
10 8
10 8
"
PT1 6
0.9814 0.8295
Si la verdadera diferencia de medias fuera 8 libras la prueba tendra una potencia elevada.
4.3.3 PRUEBAS DE HIPTESIS PARA LA DIFERENCIA DE MEDIAS SOBRE POBLACIONES
2
2
2
2
APROXIMADAMENTE NORMALES CUANDO SE DESCONOCEN 1 Y 2 PERO 1 2
Cuando las distribuciones de la poblacin son normales con varianzas desconocidas y diferentes,
Esther Welch (1937) o Satterthwaite (1946) encontraron pruebas ms potentes que la del Teorema 4.4,
pero en general la prueba de Welch es ms recomendable y ser la que se explicar en esta subseccin,
aunque se aclara que en esta situacin no se tiene la prueba UMP (). La prueba de Welch no es
robusta en ausencia de la condicin de normalidad (hecho demostrado por Yuen en 1974 y Cressie
& Whitford, en 1986).
Formulacin de la prueba de Welch-Aspin (Aspin, 1948).
140
T
X
Y
( 1
2 )
S12
n1
S 22
n2
# S12 S 22
!
!n n
2
" 1
# S12
# S 22
1
1
!
!
! n n
1 ! n n
1
" 1 1
" 2 2
a) H 0 : 1
2 d 0 contra H 1 : 1
2 d 0 , entonces la prueba de tamao , para (0, 1)
estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn1 y y1 , y 2 , , y n2
Rechazar H 0 : 1
2 d 0 , si CC: x
y d 0 Ft
(J1) ( )
s12
n1
s 22
n2
s12
d 0
t
n1
s 22
n2
b) H 0 : 1
2 d 0 contra H 1 : 1
2 d 0 , entonces la prueba de tamao , para (0, 1)
estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn1 y y1 , y 2 , , y n2
Rechazar H 0 : 1
2 d 0 , si CC: x
y d 0 Ft
(J1) (1
)
s12
n1
s 22
n2
d 0 t
s12
n1
s 22
n2
c) H 0 : d 0 1
2 d1 contra H 1 : 1
2 d 0 1
2 d1 entonces la prueba de
tamao , para (0, 1) estar dada por la siguiente regla de decisin para una realizacin
x1 , x2 , , xn1 y y1 , y 2 , , y n2 :
2
s2
# s
Rechazar H0 : d0 1
2 d1 , CC: x
y d 0 Ft
(J1) ! 1 2 d 0
t
" 2 n1 n 2
2
2
s2
# s
x
y d 1 Ft
(J1) !1
1 2 d 1 t
2 n1 n 2
"
2
s12
n1
s12
n1
s 22
n2
s 22
n2
141
EJEMPLO 4.12
i)
H 0 : 1
2 4 contra H 1 : 1
2 4 .
s12
" 2 n1
s 22
n2
2
2
o d 1 Ft
(J1) #!1
s1 s 2 .
"
2 n1
n2
6 1 3.24 3
412 10 1
5
2
J
13.49469 13
2
2
2
2
# s12 # 1
# s22 # 1
#1 # 1
# 3.24 # 1
! !
!
!
! !
! !
! n ! n
1 ! n ! n
1 " 12 " 12
1 " 10 " 10
1
" 2 " 2
" 1 " 1
As, de las tablas porcentuales para la distribucin t-student con J 13 grados de libertad, y
1
1
2 0.05 , se tendr Ft
(13
) (0.05)
1.771 y Ft (13) (0.95) 1.771 . Por otro lado, d 0 d1 4 , n1 12
y n2 10 . Para obtener la regla de decisin se requieren calcular de la realizacin sus promedios y
varianzas insesgadas: x1 16 , s12 1 ; x 2 11, s 22 3.24 . Finalmente, la regla de decisin.
2
s2
1 3.24
# s
Rechazar: H 0 : 1
2 4 , si x1
x 2 d 0 Ft
(J1) ! 1 2 4
1.771
2.87 o
" 2 n1
n2
12
10
2
s2
1 3.24
# s
x1
x 2 d 0 Ft
(J1) !1
1 2 4 1.771
5.13
n
n
2
12
10
"
1
2
Es decir, rechazar H 0 : 1
2 4 si x1
x2 2.87 o x1
x2 5.13 . Grficamente se tiene:
142
regin de rechazo R r
regin de rechazo R r
regin de no rechazo R a
2.87
5.13
iv) Por ltimo se aplica la regla de decisin, para esto no olvide que x1 16 y x 2 11, luego
x1
x2 16
11 5 con lo cual se concluye que H 0 : 1
2 4 no se rechaza al 10%
de significancia.
Dicho valor se encuentra en la regin de no rechazo, se dice que a partir de la realizacin dada
no hay evidencias para rechazar H 0 : 1
2 4 a un nivel de significancia del 10%. Luego, el
rendimiento promedio de los autos Toyota es superior al rendimiento promedio de los autos
Volkswagen en 4 kilmetros.
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo
5
P Rechazar H 0 | 1
2 4 P ( X 1
X 2 2.87) I ( X 1
X 2 5.13) | 1
2 5
P X 1
X 2 2.87 | 1
2 5 P X 1
X 2 5.13 | 1
2
#
#
!
!
! ( X
X )
(
)
! ( X
X )
(
)
2
.
87
5
2
1
2
2
1
2
P! 1
P! 1
2
2
2
2
!
!
1 3.24
S1 S 2
S
S
1
!
2
!
!
!
12 10
n
n
n
n2
1
2
1
"
"
P T1 3
3.34 P T1 3 0.20 9 0.0026 0.4223 0.4249
5.13
5
1 3.24
12 10
Si la verdadera diferencia de medias fuera 5 kilmetros la prueba tendra una potencia media.
EJEMPLO 4.13
Resuelva el ejemplo del fabricante de soldadura que ha creado un recubrimiento y afirma que ste
incrementa la resistencia a la traccin en ms de 5 libras. Pero ahora suponga que las varianzas
poblacionales son diferentes y compare la respuesta con la obtenida en el ejemplo 4.11. En estas
condiciones el inciso (a) no se altera, es decir, 2
1 5 ser la hiptesis alterna y la contrapuesta
2
1 5 la hiptesis nula.
Solucin
b) Siguiendo los pasos de la metodologa para realizar la comprobacin y determinar la prueba de
tamao 0.05, se tendr:
i) H 0 : 2
1 5 contra H1 : 2
1 5 .
ii) Nivel de significancia 0.05 .
iii) Se est ante una situacin similar a la del inciso b del Teorema 4.5. Luego, la CC:
d 0 Ft
(J1) (1
)
s12
n1
s 22
n2
2
6 s12 s22 3
6 7.50 2.68 3
4 1
4 10
8 12
5
5 n1 n2 2
J
14.99 9 15
2
2
2
2
2
2
# 2.68 # 1
# 7.50 # 1
# s1 # 1
# s2 # 1
!
!
!
!
! !
!
!
! n ! n
1 ! n ! n
1 " 10 " 10
1 " 8 " 8
1
" 2 " 2
" 1 " 1
143
1
t (15)
n1
10
n2
Es decir, rechazar H 0 : 2
1 5 si x2
x1 6.83 . Grficamente se tiene:
regin de no rechazo R a
regin de rechazo R r
6.83
iv) Por ltimo se aplica la regla de decisin, para esto no olvide que x1 14.29 y
x2 22.09 , luego x2
x1 22.09
14.29 7.8 . As, se concluye que H 0 : 2
1 5
se rechaza al 5% de significancia. Es decir, el recubrimiento si aumenta la resistencia a la
ruptura de la soldadura en ms de 5 libras.
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo
#
!
! X
X1
8
PRechazar H 0 | 2
1 5 P X 2
X 1 6.83 | 2
1 8 P! 2
! 7.5 2.68
!
8
" 10
PT1 5
1.123 0.8605
7.5 2.68
10
8
6.83
8
Si la verdadera diferencia de medias fuera 8 libras la prueba tendra una potencia elevada.
Al comparar con la respuesta del ejemplo 4.11 se observa que la potencia aument ligeramente,
luego, es lgico pensar que la mejor suposicin entre varianzas iguales y varianzas diferentes, es ms
fuerte esta ltima, hecho que se confirmar en la subseccin de razn entre varianzas.
4.3.4 PRUEBAS DE HIPTESIS PARA LA DIFERENCIA DE MEDIAS DE OBSERVACIONES
PAREADAS CON DIFERENCIAS NORMALES
En Inferencia Estadstica tambin se estudia detenidamente a los intervalos de confianza para la
diferencia de medias de muestras dependientes, con observaciones pareadas, las mismas que se
explicaron con detalle. Ahora sean ( X 1 , Y1 ), ( X 2 , Y2 ), , ( X n , Yn ) las parejas de las variables
8d
i 1
estimar a D
1
y s
n
1
2
d
8 (d
x d ) 2 estimar a D2 .
i 1
144
X d
d
Sd
libertad.
TEOREMA 4.6
Si x d y s d son la media y la desviacin estndar muestrales de la diferencia de n pares
independientes de realizaciones de muestras aleatorias pareadas, tomadas de mediciones de las
cuales se desconoce X2 y Y2 , entonces se pueden tener alguno de los siguientes contraste de
hiptesis
11 ( ) x d 0
d t (n
1) .
n
n
b) H 0 : d 0 contra H 1 : d 0 , entonces la prueba UMP(), para (0, 1) estar dada
por la siguiente regla de decisin para una realizacin x1 , x2 , , xn y y1 , y 2 , , y n :
a)
Rechazar H 0 : d 0 , si CC: x d 0
sd
n
sd
Ftn
11 (1
) x d 0
t (n
1) .
c)
Rechazar H 0 : 0 d 1 , si CC: x d 0
xd 1
sd
sd
n
Ft n
11 ( 2) 0
Ftn
11 (1
2) 1
sd
n
t 2 (n
1) o
sd
t 2 (n
1)
n
n
Con 0 , 1 R valores conocidos de antemano. En donde, Ftn
11 (H ) representa el cuantil H de la
Un veterinario realiz un experimento con diez animales que fueron sometidos a condiciones que
simulaban una enfermedad. l registr el nmero de latidos del corazn, antes y despus del
experimento, obteniendo los siguientes datos:
Antes
70
120
98
110
105
100
110
96
69
86
Despus
105
130
112
120
158
118
124
118
92
104
145
i) H 0 : d 15 contra H 1 : d 15 .
ii) Nivel de significancia 0.05 .
iii) Se est ante una situacin como la del inciso (b) del Teorema 4.6. Es decir, se tiene que calcular la
CC: 0
sd
Ftn
11 (1
) . As, de las tablas para la distribucin t-student con n
1 10
1 9
n
grados de libertad, Ft9
1 (1
0.05) 1.833 . Por otro lado, para calcular la media y varianza muestral
105
130
112
110
138
118
124
118
92
104
Antes
70
120
98
110
105
100
110
96
69
86
Diferencia
35
10
14
10
33
18
14
22
23
18
Tabla 4.4 Diferencia del nmero de latidos del corazn antes y despus de un
experimento en animales
Ahora se calcularn su promedio y desviacin estndar de las diferencias, obteniendo:
xd 17.7 y s d 12.62
sd
n
Ftn
11 (1
) 15
12.62
10
(1.833) 22.32 .
22.32
iv) Por ltimo se aplica la regla de decisin, para esto no olvide que xd 17.7 22.32 . Luego, al 5%
de significancia y la realizacin tomada no hay evidencias para rechazar H 0 : d 15 .
146
Recuerde el ejemplo 4.10 en donde se comparan dos tipos de rosca de tornillo para ver su resistencia a
la tensin, pero ahora se agregar la siguiente informacin; los dos tipos de tornillos son fabricados
bajo condiciones muy similares. Se prueban 12 piezas de cada tipo de cuerda bajo condiciones
similares, obtenindose los siguientes resultados, en kilogramos:
Tipo de rosca
10
11
12
78
76
80
79
78
80
82
81
79
83
80
82
83
80
82
83
81
80
79
80
82
78
79
81
sd
Ftn
n
n
1 12
1 11 grados de libertad, Ft9
1 (0.025)
2.201 . Por otro lado, para calcular la
10
11
12
147
78
76
80
79
78
80
82
81
79
83
80
82
83
80
82
83
81
80
79
80
82
78
79
81
Diferencias
sd
n
Ftn
11 ( ) 0
3.13
12
(2.201)
1.99 .
Es decir, rechazar H 0 : d 15 si xd
1.99 . Grficamente se tiene:
regin de no rechazo R a
regin de rechazo Rr
1.99
iv) Por ltimo se aplica la regla de decisin, para esto no olvide que xd
0.833
1.99.
Luego, al 2.5% de significancia y la realizacin tomada no hay evidencias para rechazar
H 0 : d 0 .
As, se concluye al 2.5% de significancia y la realizacin obtenida que no es valida la afirmacin
de que la resistencia promedio de los tornillos tipo I sea menor a la resistencia promedio tipo II.
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo
#
1.99
(
2)
PRechazar H 0 | d 0 P X d
1.99 | d
2 P! T11
PT11 0.011 9 0.5043.
!
3.13 12
"
148
Rechazar H 0 : 2 02 , si CC: s n2
1
b)
02
n
1
F
21 ( ) s n2
1
n
1
02
n
1
n2
1 (1
) .
02
n
1
F
21 (1
) s n2
1
n
1
02
n
1
n2
1 ( ) .
c)
Rechazar H 0 : 02 2 12 , si CC: s n2
1
02
n
1
F
21 ( 2) s n2
1
n
1
12
n
1
F
21 (1
2) .
n
1
Una mquina produce piezas metlicas de forma cilndrica. Se toma una muestra de 9 piezas cuyos
dimetros son 9.8, 9.5, 9.8, 11.5, 9.0, 10.4, 9.8, 10.1 y 11.2 milmetros. Suponga que los dimetros de
las piezas tienen una distribucin aproximadamente normal. Si el fabricante de dichas piezas afirma
que el dimetro promedio de stas tiene una varianza menor a 1 milmetro2.
a) Plantee el contraste de hiptesis adecuado al problema para probar la afirmacin del fabricante.
b) Aplique la metodologa indicada arriba y determine la prueba de tamao 0.01.
c) Qu puede usted indicar con respecto a la afirmacin del fabricante con un nivel de significancia
de 0.01?
i) H 0 : 2 1 contra H 1 : 2 1 .
ii) Nivel de significancia 0.01.
iii) Se est ante una situacin como la del inciso a del Teorema 4.7. Luego, se requiere calcular la
02
1
F 2 ( ) . As, de las tablas porcentuales para la distribucin ji-cuadrada con
CC:
n
1 n
1
n
1 9
1 8 grados de libertad, F
21 (0.01) 1.6465 . Por otro lado, 02 1 . Finalmente,
n
1
la regla de decisin.
149
Rechazar: H 0 : 2 1 , si CC: s n2
1
02
n
1
F
21 ( )
n
1
1
(1.6465) 0.206.
9
1
Es decir, rechazar H 0 : 2 1 , si s n2
1 0.206 . Grficamente se tiene:
regin de rechazo R r
0.206 regin de no rechazo R a
iv) Por ltimo se aplica la regla de decisin y para esto se calcula el valor de la estadstica de
prueba segn la realizacin, obteniendo s n2
1 0.637 y, con lo cual se concluye que
H 0 : 2 1 no se rechaza al 1% de significancia.
NOTA
1.- Para las probabilidades se puede utilizar cualquier paquete estadstico, por ejemplo,
Excel. En la pestaa de funcin escribir: =1 - DISTR.CHI( 3.296, 8) . 3.296 es el valor
del cuantil con el que se va a calcular la probabilidad a la derecha, 8 son los grados de
libertad y se toma el complemento (Excel calcula probabilidades a la derecha).
2.- En el paquete R, la funcin de probabilidad acumulada para la distribucin ji cuadrada
es, pchisq(3.296, 8), da como resultado 0.085567
3.- En caso de no tener un paquete estadstico se usan las tablas con los valores ms
prximos a 3.296 con 8 grados de libertad:
P( 82 3.2881) 0.085 y
P( 82 3.3570) 0.090 , interpolando P( 82 3.296) , se obtiene P( 82 3.296) 9 0.08557 ,
valor muy prximo al encontrado directamente con los paquetes, 0.085567.
EJEMPLO 4.17
Los fabricantes de mquinas despachadoras de caf afirman que sus mquinas despachan la bebida con
una desviacin estndar igual a 20 mililitros. Para probar tal afirmacin los consumidores toman una
muestra aleatoria de 30 servicios de la mquina de caf obteniendo un contenido promedio de 229
mililitros, con una desviacin estndar de 25 mililitros. Suponga normalidad en la cantidad de caf
despachada por la mquina.
a) Plantee un contraste de hiptesis adecuado para el problema y justifique si es o no valida la
afirmacin de los fabricantes de mquinas despachadoras a un nivel de significancia de 0.04.
150
n
1 n
1
n
1 n
1
porcentuales para la distribucin ji-cuadrada con n
1 30
1 29 grados de libertad,
F
21 (0.02) 15.5745 y F
21 (1
0.02) 46.6926 . Por otro lado, s n2
1 252 625 .
n
1
n
1
02
F
21 ( 2)
400
(15.5745) 214.82 o
30
1
F
21 (1
2)
400
(46.6926) 644.04 .
30
1
n
1
12
n
1
n
1
n
1
regin de rechazo R r
214.82
regin de no rechazo R a
644.04
P Rechazar H 0 | 2 400 P S n2
1 214.82 I S n2
1 644.04 | 2 282
# (n
1) S n2
1 (30
1)214.82
# (n
1) S n2
1 (30
1)644.04
P!
P!
2
2
!
!
784
784
"
"
P 229 7.946 1
P 229 23.823 0.00004 0.73761 0.73765
151
f
n21
1
n22
1
# S n21
1
1
! 2 2 2 ,
! S n
1 1 2
" 2
TEOREMA 4.8
Sean X 1 , X 2 , , X n1
y Y1 , Y2 , , Yn2
N ( 2 , 22 ) , respectivamente,
hiptesis
12
12
r
contra
H
:
r0 , entonces la prueba de tamao , para (0, 1) estar dada
0
1
22
22
por la siguiente regla de decisin para una realizacin x1 , x2 , , xn1 y y1 , y 2 , , y n2
a) H 0 :
s n21
1
s n21
1
12
1
Rechazar H 0 : 2 r0 , si CC: 2 r0 F f ( n1
1, n2
1) ( ) 2 r0 f 1
(n1
1, n 2
1) .
s n2
1
s n2
1
2
12
12
r
contra
H
:
r0 , entonces la prueba de tamao , para (0, 1) estar dada
0
1
22
22
por la siguiente regla de decisin para una realizacin x1 , x2 , , xn1 y y1 , y 2 , , y n2
b) H 0 :
Rechazar H 0 :
c) H 0 : r0
s n21
1
s n21
1
12
1
r
F
(
1
)
r0 f (n1
1, n 2
1) .
r
,
si
CC:
0 f ( n1
1, n2
1)
0
s n22
1
s n22
1
22
12
12
12
r
contra
H
:
r
(0, 1) estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn y
y1 , y 2 , , y n2
Rechazar H 0 : r0
12
22
r1 , si CC:
s n21
1
s n22
1
r0 F
1
f ( n1
1, n2
1)
( 2)
s n21
1
s n22
1
r1 F f
(1n1
1, n2
1) (1
2) .
Ntese que con esta metodologa se respuesta a preguntas ms generales sobre la relacin entre
dos varianzas, ya que se utilizar la razn r0 que puede ser igual, mayor o menor a 1.
EJEMPLO 4.18
Se comparan dos tipos de rosca de tornillo para ver su resistencia a la tensin. Se prueban 12 piezas de
cada tipo de cuerda bajo condiciones similares, obtenindose los siguientes resultados, en kilogramos:
152
Tipo de rosca
10
11
12
78
76
80
79
78
80
82
81
79
83
80
82
83
80
82
83
81
80
79
80
82
78
79
81
i)
H0 :
12
12
1
H
:
1.
contra
1
22
22
1
F
1
f (11,11)
(1
0.025)
1
.
3.474
s n21
1
12
1
r0 F f
(1n1
1,n2
1) ( 2) 1 :
0.2879 o
1
,
si
la
CC:
2
2
3.474
s n2
1
2
s n21
1
s
Es decir, rechazar H 0 :
r0 F f
(1n1
1, n2
1) ( ) 1 : 3.474 3.474 .
s n21
1
s n21
1
12
0
.
2879
3.474 . Grficamente se tiene:
1
si
CC:
o
s n22
1
s n22
1
22
Regin de rechazo R r
2
n2
1
0.2879
regin de rechazo R r
Regin de no rechazo R a 3.474
153
iv) Por ltimo se aplica la regla de decisin, para esto no olvide que s12 3.97 y s 22 2.61 .
De donde
s n21
1
s
2
n2
1
3.97
1.52 0.2879, 3.474, , luego se concluye que no se rechaza
2.61
12
# s n2
1
s n2
1
#
2
2
P! Rechazar H 0 | 12 1 P! 21 0.2879I 21 3.474 | 12 2
!
! s n
1
2
2
s n2
1
"
" 2
2
2
#
# s n21
1 # 1
s
# 1
# 1
0.2879!
| 1 2 P! n1
1 !
P! 2 ! 2
2
2
! 2
! 2 2 2
!
! s n
1 ! 1 22
2
2
" 1
" s n2
1 " 1 2
" 2 "
# 1
3.474!
! 2 2
2
" 1
| 1 2
2
2
2
#
#
#1
#1
P!! 121,1 1 0.2879! P!! 121,1 1 3.474! P 121,1 1 0.144 P 121,1 1 1.737
" 2
" 2
"
"
0.0016 0.1868 0.1884
Si la verdadera razn entre varianzas fuera 2, la prueba tendra una potencia baja.
NOTA
Para calcular el valor de la probabilidad con la distribucin f, se procede de forma similar
que con las anteriores distribuciones.
1.- En el paquete Excel, en la pestaa de funcin escribir: =1-DISTR.F( 0.144, 11, 11 ) +
DISTR.F( 1.737, 11, 11 ). 0.144 y 1.737 son los valores de los cuantiles con el que se van a
calcular las probabilidades a la derecha (slo valores positivos), 11, 11 son los grados de
libertad del numerador y denominador, respectivamente. Se toma el complemento, porque
Excel calcula las probabilidades a la derecha.
2.- En el paquete R, la funcin de probabilidad acumulada para la distribucin f es,
pf(0.144, 11, 11) + 1- pf(1.737, 11, 11), da como resultado 0.1884.
3.- En caso de no tener un paquete estadstico se usan las tablas con los valores ms
prximos a 0.144 y 1.737 con 11 y 11 grados de libertad, pero en este caso se complica la
bsqueda, porque las tablas estadsticas para la distribucin f slo tienen una pequea gama
de valores. Para P( f11,11 1.737) sus valores ms prximos son: P( f11,11 1.685) 0.20 y
P( f11,11 2.227) 0.10 , interpolando P( f11,11 1.737) (ver tablas al final del presente
En los ejemplos 4.11 y 4.13 se trabaj un problema de un fabricante de soldadura que creo un
recubrimiento. Se hicieron las suposiciones de que las varianzas eran iguales (ejemplo 4.11) y
diferentes (ejemplo 4.13). Se llevar a cabo una prueba de hiptesis para las varianzas, en donde se
afirmar que la varianza de la poblacin 1 es mayor que la varianza de la poblacin 2. Para esto no
olvide que s12 7.50 n1 10 , s 22 2.68 , n2 8 y las poblaciones de soldaduras tienen distribucin
normal.
154
Solucin
a) Se afirm que 12 22 . As, 12 22 ser la hiptesis alterna y la contrapuesta 12 22 la
hiptesis nula.
b) Siguiendo los pasos de la metodologa para realizar la comprobacin y determinar la prueba
i)
H 0 : 12 22 contra H 1 : 12 22 H 0 : 12 22 1 contra H 1 : 12 22 1 .
2
1
1 , si CC:
2
2
Es decir, rechazar H 0 :
2
1
s n21
1
s
1 , si
2
2
2
n2
1
r0 F f
(1n1
1,n2
1) (1
) 1 : 2.725 2.725 .
s n21
1
s n22
1
Regin de no rechazo
0
2.725
regin de rechazo
iv) Por ltimo se aplica la regla de decisin, para esto no olvide que s12 7.50 y s22 2.68 ,
luego s n21
1 s n22
1 7.50 2.68 2.799 . As, se concluye que H 0 : 12 22 1 se rechaza al
10% de significancia.
4.5 PRUEBAS PARA POBLACIONES TIPO BERNOULLI, PROPORCIONES
En la presente seccin se cambiar de distribucin y se trabajar con poblaciones que tienen una
distribucin tipo Bernoulli. Es decir, se revisarn problemas donde las variables aleatorias aparecen en
situaciones en las que el decisor slo tiene dos opciones.
Al entrevistar a una persona para ver si apoya o no la poltica de un gobernante.
Si una ama de casa compra o no un producto determinado.
Si una persona consume o no una pasta de dientes marca A.
Si un estudiante ha consumido droga alguna ocasin.
Por ejemplo, en la situacin poltica muy controvertida del ao 2006 sobre el plantn en la plaza
del Zcalo se pudo entrevistar a un grupo de capitalinos y preguntarles si estn a favor o en contra del
155
plantn, de tal forma que si X representa a la variable aleatoria, la persona est a favor del plantn, el
xito sera que la persona conteste que s est a favor del plantn y el valor de la variable sera 1, en
caso contrario 0. Este tipo de variables aleatorias llamadas dicotmicas son muy comunes en las
investigaciones, puesto que son variables aleatorias muy propicias para realizar estudios sobre
preferencias, y de hecho en una muestra aleatoria lo que de ellas nos interesa son: su suma o su
promedio que lleva el nombre particular de proporcin.
4.5.1 PRUEBAS PARA PROPORCIONES MUESTRAS GRANDES
8X
i 1
parmetros n y p; tambin se vio que la estadstica de prueba para el caso de la distribucin Bernoulli
es la suma o su promedio. Por otro lado, cuando se trabaja con proporciones las muestras estudiadas
son grandes, as para llevar a efecto las pruebas en el caso de una distribucin tipo Bernoulli y muestras
grandes, se acostumbra utilizar una aproximacin con el Teorema de Lmite Central. Luego, se necesita
el valor esperado y la varianza de la suma, E (T ) np y V (T ) npq, o en el caso de proporciones
1
P X T , E ( P ) p y V ( P ) pq n . Finalmente, el estadstico de prueba que aproxima tendr una
n
T
np
npq
(sumas) o Z
P
p
(proporciones).
pq n
TEOREMA 4.9
Sea X 1 , X 2 , , X n una muestra aleatoria de distribuciones tipo Bernullis( p) , entonces se pueden
tener alguno de los siguientes contraste de hiptesis condicionados para n grande.
a) H 0 : p p0 contra H 1 : p p0 , entonces la prueba de tamao , para (0, 1) estar dada
por la siguiente regla de decisin para una realizacin x1 , x 2 , , xn
Rechazar H 0 : p p0 , con la suma CC: t np0 $
1 ( ) np0 q0 t np0
Z np0 q0 .
Con la proporcin muestral, CC: p p 0 $
1 ( )
p0 q0
p p 0
Z
p0 q0
n
p0 q0
n
p p 0 Z
p0 q0
n
(0, 1) estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn :
Rechazar H 0 : p0 p p1 ,con
la
suma
CC: t np0 $
1 ( 2 ) np0 q0
t np1 $
1 (1
2 ) np0 q0
p0 q0
n
p p1 $
1 (1
2)
p0 q0
n
156
Con p0 , p1 0, 1, y q0 1
p0 valores conocidos de antemano; t
8x
y p x
i 1
1
t , $
1 (H )
n
El director general de un canal televisivo asegura que la proporcin de audiencia que ve cierto
programa el sbado por la noche es mayor al 40%. Se eligi una muestra de 100 televidentes a quienes
se entrevisto, resultando que 45 de ellos vean el programa.
a) Plantee un contraste de hiptesis adecuado para el problema.
b) Al nivel de significancia del 2.5% pruebe si la afirmacin es valida, realice la comprobacin con la
suma y con la proporcin y verifique que se obtiene el mismo resultado.
c) Calcule la potencia de la prueba, suponiendo que p 0.60 .
Solucin
a) Se pide una prueba de hiptesis para la proporcin de televidentes que ven un programa el sbado
por la noche, en donde el directo del canal afirma que la proporcin de audiencia para el programa
es mayor a 0.40, luego el signo de igualdad se encuentra en la opuesta. As, la suposicin del
director ser la hiptesis alterna H 1 : p 0.40 y su opuesta H 0 : p 0.40 .
b) Siguiendo los pasos de la metodologa
i)
p0 q0
n
p0 q0
n
0.40 1.96
0.4(0.6)
0.4960 ( 49.6 100).
100
regin de rechazo R r
157
iv) Por ltimo se aplica la regla de decisin, para esto no olvide que t 45 ( p 45 100 0.45 ) y,
con lo cual se concluye que con la realizacin tomada no hay evidencias para rechazar
H 0 : p 0.40 al 2.5% de significancia.
As, se concluye que al 2.5% de significancia y la realizacin obtenida no existen evidencias
para validar la afirmacin del director de la televisora de que p 0.40 .
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo
#
49.6
100(0.6)
PRechazar H 0 | p 0.40 PT 49.6 | p 0.60 P! Z
PZ
2.12 0.983.
!
100
(
0
.
6
)(
0
.
4
)
"
Si la verdadera proporcin fuera 0.6 la prueba tendra una potencia muy elevada.
EJEMPLO 4.21
Una persona quiere probar estadsticamente si una moneda est cargada haca un lado, para esto lanza
la moneda 200 veces, ocurriendo 80 guilas. Se puede concluir que la moneda est cargada?.
a) Plantee un contraste de hiptesis adecuado para el problema.
b) Al nivel de significancia del 5% pruebe si la moneda est cargada.
c) Calcule la potencia de la prueba, suponiendo que p 0.40 .
Solucin
a) Se pide una prueba de hiptesis para la proporcin de resultados de la moneda, por ejemplo de
guilas, para esto supngase que la moneda no est cargada. Luego, la proporcin es 0.5, contra la
alternativa de que la proporcin sea diferente de 0.5. As, la hiptesis nula ser H 0 : p 0.5 y la
alterna H 1 : p 0.5 .
b) Siguiendo los pasos de la metodologa
se
requiere
calcular
la
CC:
Para
la
suma
np0 $
1 ( 2) np0 q0
np0 $
1 (1
2) np0 q0 .
$ (0.975) 1.96 . Por otro lado, p0 0.5 , n 200 . Finalmente, la regla de decisin.
Rechazar: H 0 : p 0.5 , si
t np0 $
1 ( 2) np0 q0 200(0.5)
1.96 200(0.5)(0.5) 86.14
t np0 $
1 (1
2) np0 q0 200(0.5) 1.96 200(0.5)(0.5) 113.86 .
regin de rechazo R r
86.14
regin de no rechazo R a
113.86
158
Si la verdadera proporcin de guilas fuera 0.4 la prueba tendra una potencia elevada.
Cmo comparar proporciones de dos poblaciones?
Con frecuencia se tienen problemas en los que se desean comparar qu producto es ms
aceptado por lo consumidores, el producto A o el B, por tal razn, los investigadores o gerentes de
negocios requieren de resultados estadsticos que justifiquen sus aseveraciones.
Sean dos muestras aleatorias X 1 , X 2 , , X n1 y Y1 , Y2 , , Yn2 independientes de distribuciones
tipo Bernoulli con parmetros p1 y p 2 , respectivamente. Se desea llevar a cabo una prueba de
hiptesis para la diferencia p1
p 2 , en el caso de muestras grandes. Para esto se necesita su estimador,
dado por P1
P2 X
Y y en la aproximacin con el Teorema de Limite Central note que
( P
P2 )
( p1
p 2 )
pq
p q
.
E ( P1
P2 ) p1
p 2 y V ( P1
P2 ) 1 1 2 2 . Finalmente, Z 1
n1
n2
p1 q1 p 2 q 2
n1
n2
( P1
P2 )
( p1
p 2 )
p 1 q1
n1
p 2 q 2
n2
Ntese que en esta situacin slo se consideran las proporciones, ya con que las sumas su
T
T2
(n1 p1
n2 p 2 )
estadstica de prueba ser Z 1
y slo se puede utilizar cuando n1 n2 .
n1 p 1 q1 n2 p 2 q 2
TEOREMA 4.10
Sean X 1 , X 2 , , X n1 y Y1 , Y2 , , Yn2 dos muestras aleatorias independientes de Ber( p1 ) y
Ber( p 2 ) , respectivamente, entonces se pueden tener alguno de los siguientes contraste de hiptesis
con tamaos de muestras grandes.
a) H 0 : p1
p 2 p0 contra H 1 : p1
p 2 p0 , entonces la prueba de tamao , para (0, 1)
estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn1 y y1 , y 2 , , y n2
159
p 1 q1
Rechazar H 0 : p1
p 2 p0 , si CC: p 1
p 2 p 0 $
1 ( )
n1
p 2 q 2
n2
b) H 0 : p1
p 2 p0 contra H 1 : p1
p 2 p0 , entonces la prueba de tamao , para (0, 1)
estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn y y1 , y 2 , , y n2
p 1 q1
Rechazar H 0 : p1
p 2 p0 , si CC: p 1
p 2 p 0 $
1 (1
)
n1
p 2 q 2
n2
c) H 0 : p0 p1
p 2 p01 contra H 1 : p1
p 2 p0 p1
p2 p01 entonces la prueba de
tamao , para (0, 1) estar dada por la siguiente regla de decisin para una realizacin
x1 , x2 , , xn y y1 , y 2 , , y n2 :
Rechazar H 0 : p0 p1
p 2 p01 , si CC: p 1
p 2 p 0 $
1 ( 2)
p 1
p 2 p 01 $
1 (1
2)
p 1 q1
n1
p 1 q1
n1
p 2 q 2
n2
p 2 q 2
n2
Se pueden usar otras formas para obtener una estimacin puntual de la varianza:
pq
p q
V ( P1
P2 ) 1 1 2 2 .
n1
n2
Sustituyendo
p1 y
p2
( P1
P2 )
( p1
p 2 )
#1
1
pq !!
" n1 n 2
p 1 p 2
2
, se tendra
n p n 2 p 2
t t
~
p 1 1
1 2 , se tendra
n1 n 2
n1 n 2
Z
( P1
P2 )
( p1
p 2 )
#1
1
~
pq~!!
n
n
2
" 1
p 1q1 p 2 q 2
que son mucho muy buenas an cuando existen diferencias
n1
n2
extremas entre p 1 y p 2 . Por ejemplo, si n1 400, t1 40 & p 1 0.1 y n2 200, t 2 160& p 2 0.8
Aproximaciones de
a)
p 1 q1
n1
p 2 q 2
n2
0.1(0.9)
400
(0.8)(0.2)
200
0.001025 0.03202.
160
b) p
p 1 p 2
2
t t
40 160 1
c) ~p 1 2
, luego
n1 n 2
#1
1
1
# 1
0.45(0.55)!
pq !!
0.04308.
" 400 200
" n1 n 2
0.1 0.8
0.45 , luego
2
400 200
#1
1
1#2 # 1
1
~
pq~!!
0.04082
! !
3 " 3 " 400 200
" n1 n 2
Situaciones que mejoran cuando no hay diferencias extremas entre p 1 y p 2 o cuando el tamao
de las muestras aumenta. Por ejemplo, n1 400, t1 200& p 1 0.5 y n2 200, t 2 80 & p 2 0.4
a)
p 1 q1
n1
b) p
p 2 q 2
n2
p 1 p 2
2
0.5(0.5)
400
(0.4)(0.6)
200
0.5 0.4
0.45 , luego
2
t t
200 80
c) ~p 1 2
0.467 , luego
n1 n 2
400 200
0.04272
#1
1
1
# 1
0.45(0.55)!
pq !!
0.04308.
" 400 200
" n1 n 2
#1
1
1
# 1
~
0.4670.533!
pq~!!
0.04321.
" 400 200
" n1 n 2
Es decir, si se quieren utilizar alguna de las otras dos estimaciones para la varianza no se tendrn
diferencias significativas en las pruebas. Para finalizar note que en muchos textos prefieren utilizar el
promedio ponderado de p 1 y p 2 . Si algn lector quiere utilizar este promedio slo necesita cambiar
en el Teorema anterior
p 1q1 p 2 q 2
n1
n2
por
#1
1
~
pq~!! o en su caso por
" n1 n2
#1
1
.
pq !!
" n1 n 2
EJEMPLO 4.22
Una firma manufacturera de cigarros distribuye dos marcas 1 y 2. El gerente de ventas desea saber si
alguna de las marcas aventaja a la otra, para esto realiza dos encuestas independientes, resultando que
56 de 200 fumadores prefieren la marca 1 y que 29 de 150 fumadores prefieren la marca 2. Puede el
gerente concluir que la marca 1 aventaja en ventas a la marca 2?
a) Plantee un contraste de hiptesis adecuado para el problema.
b) Al nivel de significancia del 6% pruebe si es valida la conclusin.
c) Realice la prueba anterior utilizando la media ponderada de las proporciones y verifique que no
existen diferencias significativas con el inciso (b).
d) Calcule la potencia de la prueba, suponiendo que p1
p 2 0.08 .
Solucin
a) Se pide una prueba de hiptesis para una diferencia de proporciones de consumidores de cigarros
de las marcas 1 y 2. La suposicin que se hace es p1 p 2 , as la opuesta ser p1 p 2 (el signo de
igualdad se encuentra en la opuesta). Por tal razn, H 0 : p1 p 2 y H 1 : p1 p 2 .
b) Siguiendo los pasos de la metodologa, pasando las hiptesis a una diferencia de proporciones
i) H 0 : p1
p2 0 contra H1 : p1
p2 0 .
ii) Nivel de significancia 0.06 .
161
iii)Se est ante una situacin similar a la del inciso (b) del Teorema 4.10. Luego, se requiere
calcular la CC: p 0 $
1 (1
)
p 1 q1
n1
p 2 q 2
n2
normal estndar, $
1 (0.94) 1.5548 . Por otro lado, n1 200, t1 56 & p 1 56 200 0.280 y
n2 150, t 2 29 & p 2 29 150 0.193 . Finalmente, la regla de decisin.
Rechazar: H 0 : p1
p 2 0 , si
p 1 q1
p 1
p 2 p 0 $
1 (1
)
n1
p 2 q 2
n2
0.28(0.72) 0.193(0.807)
0.070 .
200
150
0 1.5548
Es decir, rechazar H 0 : p1
p 2 0 si p 1
p 2 0.070 . Grficamente se tiene:
regin de no rechazo R a
0.070
regin de rechazo R r
Rechazar: H 0 : p1
p 2 0 , si
#1
1
1
# 1
p 1
p 2 p 0 $
1 (1
) ~
pq~!! 0 1.5548 0.2429(0.7571)!
0.072 .
" 200 150
" n1 n 2
Es decir, rechazar H 0 : p1
p 2 0 si p 1
p 2 0.070 . Grficamente se tiene:
regin de no rechazo R a
0.072
regin de rechazo R r
PRechazar H 0 | p1
p 2 0 P P1
P2 0.070 | p1
p 2 0.08 P! Z
!
!
"
PZ
0.22 0.5871
0.28(0.72) 0.193(0.807)
200
150
0.070
0.080
162
1
# 1
0.2429(0.7571)!
" 200 150
0.072
0.080
Valor muy prximo al obtenido de 0.5871 con la estimacin previa, con esto se ha verificado
que se puede usar una u otra frmula.
EJEMPLO 4.23
Dos empresas televisivas compiten por la audiencia a una determinada hora, el director de la empresa 1
afirma que la proporcin de televidentes que ve su programa a esa hora excede la proporcin de
televidentes de la empresa 2 exactamente en 0.20. Para probar la afirmacin se realizan dos encuestas
independientes, resultando que 650 de 1000 televidentes prefieren la programacin de la televisora 1 y
que 380 de 800 prefieren la programacin de la televisora 2.
a) Plantee un contraste de hiptesis adecuado para el problema.
b) Al nivel de significancia del 5% pruebe si es valida la afirmacin.
c) Calcule la potencia de la prueba, suponiendo que p1
p 2 0.15 .
Solucin
a) Se pide una prueba de hiptesis para una diferencia de proporciones de audiencia televisiva de las
televisoras 1 y 2. La afirmacin que se hace es p1
p 2 0.20 , as la opuesta ser p1
p 2 0.20 .
Luego, las hiptesis H 0 : p1
p2 0.20 y H 1 : p1
p2 0.20 .
b) Siguiendo los pasos de la metodologa
i) H 0 : p1
p2 0.20 contra H1 : p1
p2 0.20 .
p 1 q1
n1
p 2 q 2
n2
y p 01 $
1 (1
2)
p 1 q1
n1
p 2 q 2
n2
Rechazar: H 0 : p1
p2 0.20 , si
p 1
p 2 p 0 $
1 ( 2)
p 1 q1
n1
p 1
p 2 p 01 $
1 (1
2)
p 2 q 2
p 1 q1
n1
n2
0.20
1.96
p 2 q 2
n2
0.65(0.35) 0.475(0.525)
0.1545 o
1000
800
0.20 1.96
0.65(0.35) 0.475(0.525)
0.2455 .
1000
800
Es decir, rechazar H 0 : p1
p2 0.20 si p 1
p 2 0.1545 o p 1
p 2 0.2455 . Grficamente
se tiene:
163
regin de rechazo R r
regin de rechazo R r
0.1545
regin de no rechazo R a
0.2455
P Rechazar H 0 | p1
p 2 0 P ( P1
P2 0.1545) I ( P1
P2 0.2455) | p1
p 2 0.15
#
!
0.1545
0.15
!
P! Z
0.65(0.35) 0.475(0.525)
!
!
1000
800
"
P Z 0.19 PZ 4.11 0.5754
#
!
!
P! Z
!
!
"
.
0.65(0.35) 0.475(0.525)
1000
800
0.2455
0.15
164
Captulo 5
Pruebas de bondad de ajuste
Introduccin
39
165
la muestra aleatoria X 1 , X 2 ,, X n . Sea Z 0 Z (1) , Z ( 2) ,, Z ( n) una muestra aleatoria ordenada de la
X (i ) Z (i ) , i 1,, n
Una prueba de correlacin compara dos estimadores de 2 . Un ejemplo de este tipo es la prueba
de Shapiro-Wilk(1965) para probar normalidad.
Se pueden mencionar otros algoritmos con los cuales se disean otras pruebas de bondad de
ajuste como las pruebas basadas en la funcin caracterstica emprica, pruebas basadas en momentos,
pruebas basadas en caracterizaciones, etctera. Pero slo es de inters para el estudio las pruebas
mencionadas inicialmente.
5.1 PRUEBA JI-CUADRADA (PARAMTRICA)
Sea X 1 , X 2 ,, X n una muestra aleatoria de tamao n, de alguna funcin de densidad; la prueba jicuadrada (paramtrica) para el juego de hiptesis
H 0 : la distribucin es f ( x; )
H1 : la distribucin no es f ( x; )
Se basa en la comparacin de las frecuencias observadas por clase, contra las frecuencias
esperadas o tericas, suponiendo que H 0 es cierta, es decir, que la distribucin poblacional es f ( x; ) .
Para esta prueba es necesario agrupar o distribuir las observaciones de la muestra en intervalos
de clase, preferentemente del mismo tamao,
El estadstico de prueba est definido por:
k
c2 8
i 1
(ni
npi ) 2
.
npi
166
En donde
2
# Y
np
1
1
Y1
np1 ~ 2 .
~ N (0,1) y Z !
1
! np (1
p )
np1 (1
p1 )
np1 (1
p1 )
1
1
"
Y1
np1
Si se define Y2 como Y2 n
Y1 y p2 1
p1 se tiene que Z 2 se puede representar de la
siguiente manera
2
2
2
2
# Y
np
2
2
Y2
np2 Y1
np1 Y2
np2 ~ 2 .
Z !
1
! np (1
p )
np2 (1
p 2 )
np1
np2
2
2
"
2
Ahora supngase que las observaciones pueden clasificarse no en dos sino en k clasificaciones
mutuamente excluyentes, y sean Yi y p i el nmero de variables que caen en la categora i y la
probabilidad respectiva. La distribucin conjunta de Y1 , Y2 ,, Yk tiene una distribucin multinomial
con parmetros n, p1 , p2 ,, pn ; donde pk 1
p1
p2
pk
1 . Se puede demostrar que la
variable aleatoria Z 2 , definida a continuacin, sigue una distribucin ji-cuadrada con k-m-1 grados de
libertad.
Z2
Y1
np1 2 Y2
np2 2
np1
np2
Yk
npk 2
npk
Yi
npi 2
i 1
npi
8
~ k2
m
1
167
NOTA:
Se debe cuidar que la frecuencia en cada una de las clases construidas en la tabla de
frecuencias sean mayores o iguales a 5, en caso contrario se agrupan las clases contiguas,
para que su frecuencia sea mayor o igual a 5.
La ventaja de esta prueba es que se aplica tanto para variables aleatorias continuas como
discretas
Zona de
Punto crtico
Figura 5.1. Zona de rechazo y punto crtico de la prueba ji-cuadrada
Fuente: Elaboracin propia.
Algunas consideraciones que hay que tener en cuenta con respecto a la aplicacin de esta prueba
son las siguientes:
a) El nmero de intervalos de clase debe ser por lo menos cinco. Para facilidad de los clculos y la
identificacin de la posible distribucin se recomienda que k 20 .
b) El nmero esperado de observaciones en cada intervalo debe ser mayor o igual a cinco, en caso
contrario, deberan agruparse varios intervalos para lograr esto.
c) Al realizar los clculos para p i hay que tener en cuenta los intervalos extremos como casos
especiales, a saber:
Calculo de p1
Aunque el primer intervalo incluye aquellos valores observados que estn entre X 0 y X 1 , slo
corresponde a los resultados de una muestra. El hecho de que no se hayan observado en la muestra
valores X 0 no implica que en la poblacin de donde se toma la muestra no se puedan presentar
valores X 0 . Por lo tanto, el clculo de p1 corresponde a la probabilidad de que la variable aleatoria
sea menor o igual que X 1 , y no nicamente entre X 0 y X 1 . Es decir
p1 P( X x1 ) P(
X x1 )
x1
x1
p1 P( X x1 ) P(
X x1 ) 8 f ( x)dx F ( x1 ) para el caso discreto.
168
Calculo de p n
De manera similar, el ltimo intervalo corresponde no slo a los valores que estn entre X k
1 y
X k , sino que comprende tambin los valores de la poblacin que sean mayores que X k , as stos no
f ( x)dx 1
xk
1
xk
1
; f ( x)dx 1
F ( x
k
1
xk
1
xk
1
p k P( X xk
1 ) P( xk
1 X ) 8 f ( x)dx 1
8 f ( x)dx 1
F ( xk
1 ) para el caso discreto.
EJEMPLO 5.1
29.40
30.30
31.10
31.70
32.60
26.30
29.40
30.30
31.20
31.80
32.60
26.40
29.50
30.30
31.20
31.80
32.60
26.60
29.50
30.40
31.30
31.80
32.70
27.50
29.50
30.50
31.30
31.80
32.70
27.60
29.50
30.50
31.30
31.80
32.70
27.80
29.50
30.50
31.30
31.90
32.70
28.00
29.60
30.50
31.30
31.90
32.70
28.00
29.60
30.50
31.30
31.90
32.70
28.10
29.60
30.50
31.40
31.90
32.70
28.20
29.70
30.50
31.40
31.90
32.80
28.30
29.80
30.50
31.40
31.90
32.80
28.40
29.90
30.60
31.40
32.00
32.80
28.40
29.90
30.60
31.50
32.00
33.00
28.60
29.90
30.70
31.50
32.00
33.00
28.60
29.90
30.70
31.50
32.00
33.10
28.80
29.90
30.70
31.50
32.10
33.10
28.80
30.00
30.70
31.50
32.10
33.20
29.00
30.00
30.70
31.50
32.20
33.30
29.00
30.00
30.70
31.50
32.20
33.40
29.00
30.00
30.80
31.50
32.30
33.50
29.00
30.00
30.80
31.50
32.30
33.50
29.00
30.00
30.90
31.50
32.30
33.50
29.10
30.00
31.00
31.60
32.40
33.60
29.10
30.10
31.00
31.60
32.40
33.60
29.10
30.10
31.00
31.60
32.40
33.60
169
29.20
30.20
31.10
31.60
32.50
33.90
29.20
30.20
31.10
31.60
32.60
34.10
29.40
30.30
31.10
31.70
32.60
35.30
29.40
30.30
31.10
31.70
32.60
35.30
Tabla 5.1 Datos de la muestra para probar normalidad del ejemplo 5.1.
Fuente: Produccin de una boquilla en la fabricacin de pay de nuez empresa
BIMBO.
a) Pruebe si los datos provienen de una distribucin normal e indique sus parmetros, con un nivel de
significancia del 5%.
b) Pruebe si los datos provienen de una distribucin exponencial e indique su parmetro, con un nivel
de significancia del 5%.
Solucin
a) Calculando la media y desviacin estndar, se tiene que 30.9; 1.7 .
El nmero de intervalos de clase es k n 180 13.41 9 13 .
La amplitud del intervalo est dada por: KX
X max
X min 35.3
26.2
0.7 .
k
13
f ( x) N ,
H 0 : la distribucin es f ( x) N , 2
H1 : la distribucin es
En este caso el nmero de intervalos es reducido a 10 debido a que la frecuencia en cada una de
las clases construidas es menor a 5.
Histogram a por clases de frecuencia
35
30
25
20
15
10
5
35.3
33.9
32.5
31.1
29.7
0
28.3
26.9
27.6
28.3
29.0
29.7
30.4
31.1
31.8
32.5
33.2
33.9
34.6
35.3
26.9
26.2
26.9
27.6
28.3
29.0
29.7
30.4
31.1
31.8
32.5
33.2
33.9
34.6
Frecuencia
4
2
6
11
18
23
27
35
21
21
9
1
2
40
Frecuencia
Clases
En la tabla 5.2 se puede observar que algunas clases son menores a 5, por lo tanto se procede a
juntarlas, quedando de las 13 clases, slo 10 clases, que se muestran en la tabla 5.3. Por otro lado, de
la figura 5.2 se puede suponer que los datos tienen una distribucin normal con
x 30.9 y 2 s n2
1 2.763 .
Luego,
En la tabla 5.3 se presentan los valores distribuidos en los intervalos de clase y la frecuencia
absoluta de cada intervalo, correspondientes al nmero de observaciones que caen en l. Igualmente se
presentan los clculos necesarios para realizar la prueba ji cuadrada.
(
, 27.6,
(27.6,28.3]
(28.3, 29.0]
(29.0, 29.7]
(29.7, 30.4]
(30.4, 31.1]
(31.1, 31.8]
(31.8, 32.5]
(32.5, 33.2]
(33.2, )
(ni
npi ) 2
(ni
npi ) 2
npi
ni
pi
npi
6
6
11
18
23
27
35
21
21
0.0236
0.0353
0.0676
0.1087
0.1466
0.1661
0.1580
0.1262
0.0847
4.24
6.36
12.17
19.56
26.39
29.90
28.44
22.72
15.24
3.097
0.130
1.373
2.430
11.493
8.401
43.002
2.956
33.200
0.7304
0.0204
0.1128
0.1243
0.4355
0.2810
1.5119
0.1301
2.1788
12
0.0832
14.98
8.886
0.5932
Suma=
6.1183
Suma=
Tabla 5.3. Valores tericos y muestrales para la prueba de bondad de ajuste de los datos muestrales del
ejemplo 5.1.
El valor crtico con un nivel de significancia del 5% y 7 grados de libertad es de 2 ,7 14.067 ,
mientras que el valor calculado es c2 6.18 . Se concluye que no hay evidencias suficientes para
rechazar la hiptesis nula. Es decir, la distribucin de los datos se considera normal al 5% de
significancia.
b) Suponiendo que los datos fuesen de una distribucin exponencial (aunque grficamente se puede
notar que no es cierto) con parmetro x 30.9 , se tendran los clculos en la tabla siguiente.
Clase Intervalos para
calcular pi
i
1
2
3
4
(0, 27.6,
(27.6,28.3]
(28.3, 29.0]
(29.0, 29.7]
ni
pi
npi
(ni
npi ) 2
(ni
npi ) 2
npi
6
6
11
18
0.5907
0.0092
0.0090
0.0088
106.32
1.65
1.61
1.58
10063.78
18.92
88.11
269.71
94.66
11.46
54.61
170.99
171
5
6
7
8
9
10
(29.7, 30.4]
(30.4, 31.1]
(31.1, 31.8]
(31.8, 32.5]
(32.5, 33.2]
(33.2, )
23
27
35
21
21
0.0086
0.0084
0.0082
0.0080
0.0078
1.54
1.51
1.47
1.44
1.41
460.45
649.87
1124.02
382.57
383.83
298.61
431.11
762.74
265.55
272.53
12
0.3415
61.47
2447.12
39.81
Suma=
Suma=
2362.27
Tabla 5.4. Valores tericos y muestrales para la prueba de bondad de ajuste de los datos muestrales del
ejemplo 5.1.
El valor crtico con un nivel de significancia del 5% y 8 grados de libertad es de 2 ,8 15.507 ,
mientras que el valor calculado es c2 2362.27 . Se concluye que se rechaza la hiptesis nula al 5%
de significancia. Es decir, la distribucin de los datos no es exponencial.
EJEMPLO 5.2
0.9142
0.4052
1.8896
3.5129
0.2703
1.1121
0.9842
2.4456
6.3627
0.4020
1.0659
2.1342
2.6087
1.8993
1.1361
0.5528
10.0600
0.9608
1.9183
2.5227
2.4739
0.1263
0.8246
0.0439
2.7091
3.3162
3.1902
7.6548
0.4082
0.4341
3.3089
1.7738
0.9812
1.7935
0.7223
2.4349
5.7818
12.6327
0.8085
6.0427
1.6509
2.4018
1.8730
1.4850
6.3317
0.5425
0.1868
2.9099
3.9281
0.7962
1.9685
4.9391
3.5320
0.7187
1.4928
3.0997
2.4668
0.9104
0.6239
2.1701
2.4864
0.7407
0.2136
2.1682
3.5661
1.3764
1.4078
1.5430
3.1607
1.3429
2.6892
0.2979
1.1101
0.4778
0.5281
2.5997
0.6529
1.9107
2.3992
1.1489
4.3419
0.6406
5.4144
0.6652
1.7495
21.7329
1.3256
2.4996
2.9409
4.9092
0.4248
107146
12.0092
0.6981
0.7079
1.7472
9.1785
4.9481
4.6458
0.4404
0.7684
5.1640
1.6215
3.3592
1.8849
1.8252
1.0110
0.7266
0.8407
2.5855
0.6398
3.5699
0.8942
4.8111
0.8235
0.6154
8.9375
0.4402
1.2457
1.9802
1.4162
15.2004
1.8998
2.8290
1.2494
1.6052
1.8091
1.6194
0.0011
2.6237
1.0128
0.5550
0.9036
0.3953
1.5186
6.1171
2.4918
1.1412
0.5157
1.8379
2.1157
2.0588
1.0063
1.3339
1.3039
0.1735
4.6516
4.4030
2.8566
0.7313
3.3751
3.3981
5.0624
0.8437
10.9106
0.1591
1.5221
3.1247
1.9061
0.6276
0.0821
1.7820
0.9726
0.6012
0.7986
4.4003
4.3017
0.4536
1.0144
2.1878
0.1636
0.8712
0.3726
1.3185
2.1955
0.0970
2.3348
15.5092
0.2196
0.5087
0.2055
0.2754
1.9262
2.2079
1.0167
0.6547
1.3358
2.3768
0.6039
0.1992
4.2455
0.8065
Tabla 5.5 Datos de la muestra para probar exponencialidad del ejemplo 5.2.
172
Pruebe si los datos provienen de una distribucin exponencial, con un nivel de significancia del 5% e
indique su parmetro.
Solucin
Calculando la media se tiene que 2.39 y por tanto 1 0.418 .
El nmero de intervalos de clase es k n 216 14.69 9 14 .
La amplitud del intervalo est dada por: KX
X max
X min 21.73
0.0011
1.55 .
k
14
En este caso el nmero de intervalos es reducido a 8 debido a que la frecuencia en cada una de
las clases construidas es menor a 5.
clases
Frecuencia
0.001
0.720
52
0.720
1.438
48
1.438
2.157
36
2.157
2.875
26
2.875
3.594
19
3.594
5.031
14
5.031
7.904
11
7.904
11.497
10
En la tabla 5.7 se presentan los valores distribuidos en los intervalos de clase y la frecuencia
absoluta de cada intervalo, correspondientes al nmero de observaciones que caen en l. Igualmente se
presentan los clculos necesarios para realizar la prueba ji cuadrada.
ni
pi
npi
(ni
npi ) 2
(ni
npi ) 2
npi
(
, 0.72,
52
0.259
55.94
15.56
0.28
(0.72, 1.43]
48
0.195
41.04
48.44
1.18
(1.43, 2.15]
36
0.142
30.67
28.39
0.93
(2.15, 2.87]
26
0.105
22.68
11.02
0.49
173
(2.87, 3.59]
19
0.078
16.85
4.63
0.27
(3.59, 5.03]
14
0.100
21.60
57.76
2.67
(5.03, 7.90]
(7.90, )
11
0.085
18.36
54.17
2.95
10
0.036
7.78
4.95
0.64
Suma=
9.41
Suma=
Tabla 5.7. Valores tericos y muestrales para la prueba de bondad de ajuste de los datos muestrales del
ejemplo 5.3.
El valor crtico con un nivel de significancia del 5% y 6 grados de libertad es de 2 ,6 12.59 ,
mientras que el valor calculado es c2 9.41. Se concluye que no hay evidencias suficientes para
rechazar la hiptesis nula. Es decir, la distribucin de los datos es exponencial con 1 0.418 .
EJEMPLO 5.3
1 0 3
1 2
2 0
1 4 0
3 0
1 3 12
1 0 1
0 0
0 1
3 1 5
1 2
2 1
0 8 1
0 0
0 1
2 0 0
1 2
2 0
4 5 0
10
2 4
2 1
0 1 4
10
1 10
5 0
Tabla 5.8 Datos de la muestra para probar si tienen distribucin geomtrica del ejemplo 5.3.
Pruebe si los datos provienen de una distribucin geomtrica, con un nivel de significancia del 5% e
indique su parmetro.
Solucin
Calculando la media se tiene que 1.96 y por tanto p 1 0.5
Se han construido 8 intervalos.
Como la distribucin es discreta, los intervalos son esencialmente subconjuntos de valores de la
variable, en este caso se han elegido:
I1 {0}, I 2 {1}, I 3 {2}, I 4 {3}, I 5 {4}, I 6 {5}, I 7 {6,7,8}, I 8 {9}
174
Intervalo
Frecuencia
{0}
58
{1}
42
{2}
27
{3}
14
{4}
14
{5}
{6,7,8}
{9}
En la tabla 5.10 se presentan los valores distribuidos en los intervalos de clase y la frecuencia
absoluta de cada intervalo, correspondientes al nmero de observaciones que caen en l. Igualmente se
presentan los clculos necesarios para realizar la prueba ji cuadrada.
ni
pi
npi
(ni
npi ) 2
(ni
npi ) 2
npi
{0}
58
0.35
60.90
8.39
0.14
{1}
42
0.23
39.81
4.79
0.12
{2}
27
0.15
26.05
0.91
0.03
{3}
14
0.10
17.04
9.22
0.54
{4}
14
0.06
11.14
8.18
0.73
{5}
0.04
7.29
0.08
0.01
{6,7,8}
0.06
9.93
3.71
0.37
{9}
0.02
3.13
8.22
2.62
Suma=
4.58
Suma=
Tabla 5.10 Valores tericos y muestrales para la prueba de bondad de ajuste de los datos muestrales del
ejemplo 5.3.
175
El valor crtico con un nivel de significancia del 5% y 6 grados de libertad es de 2 ,6 12.59 ,
mientras que el valor calculado es c2 4.58 . Se concluye que no hay evidencias suficientes para
rechazar la hiptesis nula. Es decir, la distribucin de los datos es geomtrica con p 0.50
5.2
H1 : la distribucin no es f ( x; )
Distribucin
terica
Distribucin
observada
1
1
2n
1n
1n
Figura 5.5 Distribucin terica y emprica para la prueba de Kolmogorov-Smirnov.
Fuente: Elaboracin propia.
60.01
60.51
61.46
62.46
63.19
63.69
65.41
65.77
66.54
66.86
67.27
67.9
68.06
68.31
68.54
68.99
69.26
69.63
69.9
Tabla 5.11 Datos de la muestra para probar si tienen distribucin normal del ejemplo 5.4.
Solucin
Los datos no sern agrupados, por tanto su frecuencia ser 1.
n
Datos
frecuencia
Frecuencia relativa
acumulada observada
1
2
3
4
5
59.01
60.01
60.51
61.46
62.46
1
1
1
1
1
0.05
0.10
0.15
0.20
0.25
0.02181
0.04741
0.08007
0.08548
0.06990
177
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
63.19
63.69
65.41
65.77
66.54
66.86
67.27
67.9
68.06
68.31
68.54
68.99
69.26
69.63
69.9
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0.30
0.35
0.40
0.45
0.50
0.55
0.60
0.65
0.70
0.75
0.80
0.85
0.90
0.95
1.00
0.24045
0.28743
0.47378
0.51510
0.60238
0.63744
0.68070
0.74248
0.75712
0.77906
0.79821
0.83267
0.85141
0.87473
0.89004
0.05955
0.06257
0.07378
0.06510
0.10238
0.08744
0.08070
0.09248
0.05712
0.02906
0.00179
0.01733
0.04859
0.07527
0.10996
media 65.6385
D=
0.10996
var 12.0675292
Tabla 5.12 Frecuencias tericas y muestrales para la prueba de bondad de ajuste de los datos muestrales del
ejemplo 5.4.
En este caso, de las tablas de Kolmogorov-Smirnov se tiene que Dt 0.356 . Por lo tanto,
Regin de no rechazo: 0, 0.356, y regin de rechazo (0.356, )
Por lo tanto, no existe evidencia para rechazar que los datos si provienen de una distribucin
normal con media 65.64 y varianza 12.07
EJEMPLO 5.5
0.01930208
0.08600934
0.19802962
0.23479128
0.29327375
0.35045805
0.43035167
0.48374712
0.54372672
0.58981639
0.69773444
0.02416705
0.10822774
0.20449405
0.24315668
0.29350371
0.35479223
0.43340646
0.49453759
0.54927056
0.59471369
0.70016491
0.03334250
0.10959265
0.20750527
0.24834214
0.29629280
0.36493820
0.45559472
0.50673384
0.55120616
0.62810857
0.70315699
0.04345559
0.10983339
0.20974691
0.25188956
0.31222037
0.36744197
0.46117537
0.51121106
0.55547863
0.64963608
0.73646659
0.05879803
0.15240478
0.21435878
0.25350340
0.31687409
0.37056231
0.47075696
0.52362452
0.57449230
0.65142342
0.74148888
0.06442955
0.16979416
0.22751982
0.28079697
0.32209677
0.38840453
0.47581660
0.52519641
0.57614826
0.66204871
0.74606807
178
0.74702262
0.83954884
0.90706542
0.94875365
0.76108793
0.84760715
0.91006137
0.99949998
0.77312248
0.86192507
0.91934849
0.78544249
0.86496178
0.92015583
0.79937620
0.88581105
0.92849640
0.80856901
0.89467445
0.93128253
0.83212724
0.89676235
0.94217073
Tabla 5.13 Datos de la muestra para probar si tienen distribucin uniforme del ejemplo 5.5.
Solucin
De la tabla los datos se agrupan en 10 clases quedando de la siguiente forma:
clase
Datos
frecuencia
Frecuencia
esperada
Valor absoluto
de diferencia
[0.0,0.1)
0.09
0.1
0.01
[0.1,0.2)
0.16
0.2
0.04
[0.2,0.3)
16
0.32
0.3
0.02
[0.3,0.4)
10
0.42
0.4
0.02
[0.4,0.5)
10
0.52
0.5
0.02
[0.5,0.6)
14
0.66
0.6
0.06
[0.6,0.7)
0.72
0.7
0.02
[0.7,0.8)
10
0.82
0.8
0.02
[0.8,0.9)
0.91
0.9
0.01
10
[0.9,1.0]
D=
0.06
Tabla 5.14 Frecuencias tericas y muestrales para la prueba de bondad de ajuste de los datos muestrales del
ejemplo 5.5.
En este caso, de las tablas de Kolmogorov-Smirnov se tiene que Dt 0.163. Por lo tanto,
Regin de no rechazo: 0, 0.163, y regin de rechazo (0.163, ) .
Se concluye que no existe evidencia para rechazar que los datos si provienen de una distribucin
uniforme (0,1) con un nivel de confianza del 5%.
EJEMPLO 5.6
En un periodo de 30 das se registraron 6 das sin accidentes, 2 con un accidente, 1 con dos accidentes,
9 con tres accidentes, 7 con cuatro accidentes, 4 con cinco accidentes y 1 con ocho accidentes.
Realizar la prueba de bondad de ajuste de Kolmogorov-Smirnov, con un nivel de confianza del
1%, para probar si el nmero de accidentes sigue una distribucin Poisson y determine su parmetro.
Solucin
Calculando la media se tiene que
6 % 0 2 %1 1 % 2 9 % 3 7 % 4 4 % 5 1 % 8 87
y por tanto 87 30 2.9
Las hiptesis formuladas son:
H 0 : la distribucin es f ( x) pois( )
179
H1 : la distribucin es f ( x) pois( )
Datos
frecuencia
Frecuencia relativa
acumulada observada
0.200
0.055
0.145
0.267
0.215
0.052
0.300
0.446
0.146
0.600
0.670
0.070
0.833
0.832
0.002
0.967
0.926
0.041
1.000
0.997
0.003
D=
0.146
Tabla 5.15 Frecuencias tericas y muestrales para la prueba de bondad de ajuste de los datos muestrales del
ejemplo 5.6.
En este caso, de las tablas de Kolmogorov-Smirnov se tiene que Dt 0.29 . Luego,
Regin de no rechazo: 0, 0.29, y regin de rechazo (0.29, )
Por lo tanto, no existe evidencia para rechazar que los datos si provienen de una distribucin
Poisson(2.9) con un nivel de confianza del 1%.
5.3 PRUEBA DE NORMALIDAD DE SHAPIRO-WILK
Sea x1 , x2 ,, xn una realizacin de X 1 , X 2 ,, X n y se desea probar la hiptesis de que los datos
provienen de una distribucin normal. Es decir, probar las hiptesis
H 0 : X ~ Normal
H1 : X ~= Normal
Para probar normalidad se tienen varias decenas de pruebas, una de ellas es muy propicia cuando
el tamao de la muestra es pequeo, n 50 , corresponde a los autores Samuel S. Shapiro y Martin B.
Wilk y fue publicada en 1965, actualmente se le conoce como prueba de Shapiro-Wilk.
La prueba de Shapiro-Wilk consiste en calcular la estadstica de prueba W suponiendo que la
muestra aleatoria proveniente de una distribucin normal. La estadstica W est dada por:
2
# n
# k
!! 8 ai x( i )
!! 8 a n
i 1 x( n
i 1)
x(i )
i 1
"
.
Wc n
" i 1
(n
1) S n2
1
2
8 ( xi
x )
i 1
Donde
Las x(i ) son los valores de la i-sima estadstica de orden,
mV
1
.
(mV
1 V
1m)1 2
180
Con m (m1 , m2 ,, mn ) y las m1 , m2 ,, mn son los valores esperados de las estadsticas de
orden de las variables aleatorias independientes e idnticamente distribuidas tomadas de una
distribucin normal estndar de tamao n, y V es la matriz de varianzas y covarianzas de esas
estadsticas de orden y k n 2, .
Para calcular a, es necesario conocer m y V. sin embargo, ya que V slo se conoce para tamaos
de muestra n 20 , Royston (1995) desarroll un algoritmo para calcular una aproximacin de a para
muestras de tamao 3 n 5000 .
Regla de decisin:
ALGUNAS PROPIEDADES DE W
a) W tiene una distribucin la cual slo depende del tamao de muestra n, para muestras de una
distribucin normal.
b) W es estadsticamente independiente de S 2 y de x , para muestras de una distribucin normal.
c) El mnimo valor de W es na12 (n
1)
d) El mximo valor de W es1.
Para calcular el valor de W dado una muestra aleatoria completa de tamao n, x1 , x2 ,, xn se
procede de la siguiente manera:
Paso 1. Ordenar las observaciones obtenidas en a muestra aleatoria de manera creciente
y1 y2 yn .
n
i 1
i 1
Paso 2. Calcular S 2 8 ( yi
y ) 2 8 ( xi
x ) 2
Paso 3.
k
a)
Si n es par, n 2k , calcular b 8 a n
i 1 ( y n
i 1
yi ) .
i 1
0.93, 1.20, 1.10, 1.26, 1.38, 1.24, 1.32, 1.14, 1.24, 1.18
Solucin
Paso 1. Se ordenan las observaciones
0.93 1.1 1.14 1.18
1.2
1.24
1.24
1.26
1.32
1.38
Paso 2. Calcular S 2 8 ( yi
y ) 2 0.14
i 1
a1 0 0.5739
a9 .3291
a8 .2141
a7 .1224
a6 .0399
5
As, b 8 a11
i ( y11
i
yi ) 0.36
i 1
En todos los casos no se rechaza la hiptesis nula, es decir, los datos muestrales siguen una
distribucin normal.
EJEMPLO 5.8
182
a1 1 0.5601
a1 0 0.3315
a9 0.2260
a8 0.1429
a 7 0.0695
En todos los casos no se rechaza la hiptesis nula, es decir, los datos muestrales siguen una
distribucin normal.
5.4 EVALUACIN DE UNA PRUEBA DE BONDAD DE AJUSTE
La forma ms comn de evaluar una prueba de bondad de ajuste consiste en obtener su potencia contra
una distribucin alternativa completamente especificada. Sin embargo, debido a que en muchos casos
es difcil (o no es posible) calcular la potencia de una prueba analtica, tpicamente se recurre al uso de
simulacin de Monte Carlo.
183
Conclusiones
Conclusiones
La Inferencia Estadstica es, realmente, la parte ms interesante y con mayor cantidad de
aplicaciones en problemas concretos; en sta, las pruebas de hiptesis juegan un papel
trascendental como herramienta en mbitos donde se pueden contrastar la teora frente a la
observacin.
De la poca bibliografa en espaol que se tiene a cerca de las pruebas de hiptesis,
aunado a la manera en la que se aborda el contenido de estas pruebas, se puede decir que
existe un problema serio para quienes intentan adentrarse en el estudio de estos mtodos.
En este trabajo se aterrizaron las bases que sostienen la teora de las pruebas de
hiptesis, mediante una descripcin de metodologas, que simplifican las bsquedas de las
mejores pruebas, tamaos y potencia de la prueba. Se menciona lo anterior ya que ello es lo
que diferencia el presente trabajo de los dems escritos con respecto a este tema.
Al abordar los mtodos de pruebas de hiptesis de esta manera, no slo se presenta de
una forma sencilla y prctica este mtodo sino que tambin tiene la ventaja de comprender
muchos de los conceptos fundamentales de esta teora y que causan tantos problemas a los
estudiantes al momento de afrontar esta disciplina, aunque esto no quiera decir que no sea
necesaria cierta madurez intelectual y dedicacin a la materia.
No hay que olvidar mencionar que en los cinco captulos que se abordaron tienen un
nmero considerable de ejercicios resueltos en donde se pretendi mostrar la aplicabilidad de
todos y cada uno de los casos en los que se pueden utilizar las prueba de hiptesis, adems de
que: los ejemplos sirven para ensear el clculo de las pruebas; los ejemplos permiten ver la
aplicacin de las pruebas en diferentes reas del conocimiento y el uso de las metodologas
empleadas en ellos demuestran la lgica que se sigue para la solucin de estas pruebas.
Por ltimo, es necesario hacer una consideracin importante con respecto a las pruebas
de hiptesis y sta es que nunca se sabe con absoluta certeza la verdad o falsedad de una
hiptesis, a no ser que se examine la poblacin entera. Debe quedar claro que el diseo de un
procedimiento de decisin debe llevarse a cabo con la idea de la probabilidad de una
conclusin equivocada.
184
Bibliografa
Bibliografa
[1] Alexander M. Mood, Franklin A. Graybill y Duane C. Boes
Introduction to the Theory of Statistics, Singapore 1986. ISBN 0-07-042864-6
Editorial Mc Graw-Hill
[2] Canavos C. G. 1984. Applied Probability and Statistical Methods. Ed. McGraw-Hill. New
York.
[3] Casella George and Berger L. Roger. 2001. Statistical Inference, Duxbury Press; 2 edition,.
ISBN 978-0534-243-12-8
[4] DeGroot H. Morris, Schervish J. Mark. 2001. Probability and Statistics, 3rd Edition, Addison
Wesley; 3rd edition. ISBN-13: 978-0201524888
[5] Gutirrez Gonzlez Eduardo. 2006. Fundamentos de Estadstica Descriptiva e inferencial para
ingenieria y ciencias. Primera edicin. Ed Nauka-Educacin. ISBN 970-92239-6-8
[6] Hoel G. 1984. Introduction to Mathematical Statistics, Wiley; 5 edition, 448 p. ISBN-13: 9780471890454.
[7] Kreyzig E. 1985: Introductory Mathematical Statistics. Ed John Wiley and Sons. New York,
USA
[8] Lehmann L.E. , Romano P. Joseph. 2008. Testing Statistical Hypotheses, Springer; 3rd edition,
986p. ISBN 978-0387-988-64-1
[9] Mood A. M., Graybill F. A. and Boes D. C. 1975. Introduction to the Theory of Statistics. Ed.
McGraw Hill, New York, USA
[10] Murray R. Spiegel. 1976. Probabilidad y Estadstica. Ed. Schaum-McGraw-Hill. ISBN 968451-102-7
[11] Pliego Lpez F. Javier Martn, Maya Prez Luis Ruiz; Montero Lorenzo Jos Mara. 2005.
Problemas de Inferencia Estadstica, 324p. ISBN 84-973-2355-6
[12] Pliego Lpez F. Javier Martn, Maya Prez Luis Ruiz; Montero Lorenzo Jos Mara. 2007.
Fundamentos de Inferencia Estadstica, 368p. ISBN 84-973-2354-8
185
Bibliografa
[13] Ross M. Sheldon. 2006. Introduction to Probability Models, Academic Press; 9 edition, 800
p. ISBN-13: 978-0125980623
[14] Sidney Siegel. 1978. Estadstica no paramtrica aplicada a las ciencias de la conducta. Ed.
Trillas
[15] Wackerly Dennis, Mendenhall William, Scheaffer L. Richard. 2007. Mathematical Statistics
with Applications, Duxbury Press; 7 edition, 944p. ISBN 978-0495-110-81-1
[16] Zylberberg, Alejandro D. 2005. Probabilidad y Estadstica. 1a ed. Editorial Nueva Librera,
835 p. ISBN 987-1104-33-2
ARTCULOS
[17] S. S. Shapiro and M. B. Wilk. 1965. An Analysis of Variance Test for Normality. Biometrika
Trust
[18] S. S. Shapiro and R. S. Francia. 1972 An Approximate Analysis of Variance Test for
Normality. Journal of the American Statistical Association
186
Anexo
Anexo
TABLA 1. VALORES DE LA DISTRIBUCIN JI-CUADRADA PARA REAS
DERECHAS.
P( 2 )
Grados de
libertad
0.3
0.2
0.15
0.1
0.05
0.02
0.01
0.001
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
3.665
4.878
6.064
7.231
8.383
9.524
10.656
11.781
12.899
14.011
15.119
16.222
17.322
18.418
19.511
20.601
21.689
22.775
23.858
24.939
26.018
27.096
28.172
29.246
30.319
31.391
32.461
33.530
4.642
5.989
7.289
8.558
9.803
11.030
12.242
13.442
14.631
15.812
16.985
18.151
19.311
20.465
21.615
22.760
23.900
25.038
26.171
27.301
28.429
29.553
30.675
31.795
32.912
34.027
35.139
36.250
5.317
6.745
8.115
9.446
10.748
12.027
13.288
14.534
15.767
16.989
18.202
19.406
20.603
21.793
22.977
24.155
25.329
26.498
27.662
28.822
29.979
31.132
32.282
33.429
34.574
35.715
36.854
37.990
6.251
7.779
9.236
10.645
12.017
13.362
14.684
15.987
17.275
18.549
19.812
21.064
22.307
23.542
24.769
25.989
27.204
28.412
29.615
30.813
32.007
33.196
34.382
35.563
36.741
37.916
39.087
40.256
7.815
9.488
11.070
12.592
14.067
15.507
16.919
18.307
19.675
21.026
22.362
23.685
24.996
26.296
27.587
28.869
30.144
31.410
32.671
33.924
35.172
36.415
37.652
38.885
40.113
41.337
42.557
43.773
9.837
11.668
13.388
15.033
16.622
18.168
19.679
21.161
22.618
24.054
25.472
26.873
28.259
29.633
30.995
32.346
33.687
35.020
36.343
37.659
38.968
40.270
41.566
42.856
44.140
45.419
46.693
47.962
11.345
13.277
15.086
16.812
18.475
20.090
21.666
23.209
24.725
26.217
27.688
29.141
30.578
32.000
33.409
34.805
36.191
37.566
38.932
40.289
41.638
42.980
44.314
45.642
46.963
48.278
49.588
50.892
16.266
18.467
20.515
22.458
24.322
26.124
27.877
29.588
31.264
32.909
34.528
36.123
37.697
39.252
40.790
42.312
43.820
45.315
46.797
48.268
49.728
51.179
52.620
54.052
55.476
56.892
58.301
59.703
2 2 (n)
2n
1 que es aproximadamente N (0,1) .
187
Anexo
Tamao de la
muestra (n)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
35
Nivel de significancia
0.2
0.900
0.684
0.565
0.494
0.446
0.410
0.381
0.358
0.339
0.322
0.307
0.295
0.284
0.274
0.266
0.258
0.250
0.244
0.237
0.231
0.210
0.190
0.180
1.07
0.15
0.925
0.726
0.597
0.525
0.474
0.436
0.405
0.381
0.360
0.342
0.326
0.313
0.302
0.292
0.283
0.274
0.266
0.259
0.252
0.246
0.220
0.200
0.190
1.14
0.1
0.950
0.776
0.642
0.564
0.510
0.470
0.438
0.411
0.388
0.368
0.352
0.338
0.325
0.314
0.304
0.295
0.286
0.278
0.272
0.264
0.240
0.220
0.201
1.22
0.05
0.875
0.842
0.708
0.624
0.565
0.521
0.486
0.457
0.432
0.410
0.391
0.375
0.361
0.349
0.338
0.328
0.318
0.309
0.301
0.294
0.270
0.240
0.230
1.36
0.01
0.995
0.929
0.828
0.733
0.669
0.618
0.577
0.543
0.514
0.490
0.468
0.450
0.433
0.418
0.404
0.392
0.381
0.371
0.363
0.356
0.320
0.290
0.270
1.63
188
Anexo
TABLA 3. COEFICIENTES a n
i 1 PARA LA PRUEBA DE NORMALIDAD DE SHAPIROWILK.
i
n
1
2
3
4
5
2
3
4
5
6
7
8
9
10
0.7071 0.7071 0.6872 0.6646 0.6431 0.6233 0.6052 0.5888 0.5739
0.0000 0.1677 0.2413 0.2806 0.3031 0.3164 0.3244 0.3291
0.0000 0.0875 0.1401 0.1743 0.1976 0.2141
0.0000 0.0561 0.9470 0.1224
0.0000 0.0399
i
1
2
3
4
5
6
7
8
9
10
11
0.5601
0.3315
0.2260
0.1429
0.0695
0.0000
-
12
0.5475
0.3325
0.2347
0.1586
0.0922
0.0303
-
13
0.5359
0.3325
0.2412
0.1707
0.1099
0.0539
0.0000
-
14
0.5251
0.3318
0.2460
0.1802
0.1240
0.0727
0.0240
-
15
0.5120
0.3306
0.2495
0.1878
0.1353
0.0880
0.0433
0.0000
-
16
0.5056
0.3290
0.2521
0.1939
0.1447
0.1005
0.0593
0.0196
-
17
0.4968
0.3273
0.2540
0.1988
0.1524
0.1109
0.0725
0.0359
0.0000
-
18
0.4886
0.3253
0.2553
0.2027
0.1587
0.1197
0.0837
0.0496
0.0163
-
19
0.4808
0.3232
0.2561
0.2059
0.1641
0.1271
0.0932
0.0612
0.0303
0.0000
20
0.4734
0.3211
0.2565
0.2085
0.1686
0.1334
0.1013
0.0711
0.0422
0.0140
26
0.4407
0.3043
0.2533
0.2151
0.1836
0.1563
0.1316
0.1089
0.0876
0.0672
0.0476
0.0284
0.0094
-
27
0.4366
0.3018
0.2522
0.2152
0.1848
0.1584
0.1346
0.1128
0.0923
0.0728
0.0540
0.0358
0.1780
0.0000
-
28
0.4328
0.2992
0.2510
0.2151
0.1857
0.1601
0.1372
0.1162
0.0650
0.0778
0.0598
0.0424
0.0253
0.0084
-
29
0.4291
0.2968
0.2499
0.2150
0.1864
0.1616
0.1395
0.1192
0.1002
0.0822
0.0650
0.0483
0.3200
0.0159
0.0000
30
0.4254
0.2944
0.2484
0.2148
0.1870
0.1630
0.1415
0.1219
0.1036
0.0862
0.0697
0.0537
0.0381
0.0227
0.0076
i
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
21
0.4643
0.3185
0.2578
0.2119
0.1736
0.1399
0.1092
0.0804
0.0530
0.0263
0.0000
-
22
0.4590
0.3156
0.2571
0.2131
0.1764
0.1443
0.1150
0.0878
0.0618
0.0368
0.0122
-
23
0.4542
0.3126
0.2563
0.2139
0.1787
0.1480
0.1201
0.0941
0.0696
0.0459
0.0228
0.0000
-
24
0.4493
0.3098
0.2554
0.2145
0.1807
0.1512
0.1245
0.0997
0.0764
0.0539
0.0321
0.0107
-
25
0.4450
0.3069
0.2543
0.2148
0.1822
0.1539
0.1283
0.1046
0.0823
0.0610
0.0403
0.0200
0.0000
-
189
Anexo
TABLA 3. COEFICIENTES a n
i 1 PARA LA PRUEBA DE NORMALIDAD DE SHAPIROWILK. (Continuacin)
i
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
31
0.4220
0.2921
0.2475
0.2145
0.1874
0.1641
0.1433
0.1243
0.1066
0.0899
0.0739
0.0585
0.0435
0.2890
0.1440
0.0000
-
32
0.4188
0.2898
0.2463
0.2141
0.1878
0.1651
0.1449
0.1265
0.1093
0.0931
0.0777
0.0629
0.0485
0.0344
0.0206
0.0068
-
33
0.4156
0.2876
0.2451
0.2137
0.1880
0.1660
0.1463
0.1284
0.1118
0.0961
0.0812
0.0669
0.0530
0.0395
0.0262
0.0131
0.0000
-
34
0.4127
0.2854
0.2439
0.2132
0.1882
0.1667
0.1475
0.1301
0.1140
0.0988
0.0844
0.0706
0.0572
0.0441
0.0314
0.0187
0.0062
-
35
0.4096
0.2831
0.2427
0.2127
0.1883
0.1673
0.1487
0.1317
0.1160
0.1013
0.0873
0.0739
0.0610
0.0484
0.0361
0.0239
0.0119
0.0000
-
36
0.4068
0.2813
0.2415
0.2121
0.1883
0.1678
0.1496
0.1331
0.1179
0.1036
0.0900
0.0770
0.0645
0.0523
0.0404
0.0287
0.0172
0.0057
-
37
0.4040
0.2794
0.2403
0.2116
0.1883
0.1683
0.1505
0.1344
0.1196
0.1056
0.0924
0.0798
0.0677
0.0559
0.0444
0.0331
0.0220
0.0110
0.0000
-
38
0.4015
0.2774
0.2391
0.2110
0.1881
0.1686
0.1513
0.1356
0.1211
0.1075
0.0947
0.0824
0.0706
0.0582
0.0481
0.0372
0.0264
0.0158
0.0053
-
39
0.3989
0.2455
0.2380
0.2101
0.1880
0.1689
0.1520
0.1366
0.1225
0.1092
0.0967
0.0848
0.0733
0.0622
0.0515
0.0409
0.0305
0.0203
0.0101
0.0000
40
0.3964
0.2737
0.2368
0.2098
0.1878
0.1691
0.1526
0.1376
0.1237
0.1108
0.0986
0.0870
0.0759
0.0651
0.0546
0.0444
0.0343
0.0244
0.0146
0.0049
46
0.3830
0.2635
0.2302
0.2058
0.1862
0.1695
0.1548
0.1415
0.1293
0.1180
0.1073
0.0972
0.0876
0.0783
47
0.3808
0.2620
0.2291
0.2052
0.1859
0.1695
0.1550
0.1420
0.1200
0.1189
0.1085
0.0986
0.0892
0.0801
48
0.3789
0.2604
0.2281
0.2045
0.1855
0.1693
0.1551
0.1423
0.1306
0.1197
0.1095
0.0998
0.0906
0.0817
49
0.3770
0.2589
0.2271
0.2038
0.1851
0.1692
0.1553
0.1427
0.1312
0.1205
0.1105
0.1010
0.0919
0.0832
50
0.3751
0.2574
0.2260
0.2032
0.1847
0.1691
0.1554
0.1430
0.1317
0.1212
0.1113
0.1020
0.0932
0.0846
i
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
41
0.3940
0.2719
0.2357
0.2091
0.1876
0.1693
0.1531
0.1384
0.1249
0.1123
0.1004
0.0891
0.0782
0.0677
42
0.3917
0.2701
0.2345
0.2085
0.1874
0.1694
0.1535
0.1392
0.1259
0.1136
0.1020
0.0909
0.0804
0.0701
43
0.3894
0.2684
0.2334
0.2078
0.1871
0.1695
0.1539
0.1398
0.1269
0.1149
0.1035
0.0927
0.0824
0.0724
44
0.3872
0.2667
0.2323
0.2072
0.1868
0.1695
0.1542
0.1405
0.1278
0.1160
0.1049
0.0943
0.0842
0.0745
45
0.3850
0.2651
0.2313
0.2065
0.1865
0.1695
0.1545
0.1410
0.1286
0.1170
0.1062
0.0959
0.0860
0.0765
190
Anexo
i
n
15
16
17
18
19
20
21
22
23
24
25
41
0.0575
0.0476
0.0379
0.0283
0.0188
0.0094
0.0000
-
42
0.0602
0.0506
0.0411
0.0318
0.0227
0.0136
0.0045
-
43
0.0628
0.0534
0.0442
0.0352
0.0263
0.0175
0.0087
0.0000
-
44
0.0651
0.0560
0.0471
0.0383
0.0296
0.0211
0.0126
0.0042
-
45
0.0673
0.0584
0.0497
0.0412
0.0328
0.0245
0.0163
0.0081
0.0000
-
46
0.0694
0.0607
0.0522
0.0439
0.0357
0.0277
0.0197
0.0118
0.0039
-
47
0.0713
0.0628
0.0546
0.0465
0.0385
0.0307
0.0229
0.0153
0.0076
0.0000
-
48
0.0731
0.0648
0.0568
0.0489
0.0411
0.0335
0.0259
0.0185
0.1110
0.0037
-
49
0.0748
0.0667
0.0588
0.0511
0.0436
0.0361
0.0288
0.0215
0.0143
0.0071
0.0000
50
0.0764
0.0685
0.0608
0.0532
0.0459
0.0386
0.0314
0.0244
0.0174
0.0104
0.0035
191