Está en la página 1de 26

Tema 11.

Contrastacin de Hiptesis Paramtricas

Tema 11. Contrastes Paramtricos 11.1. Introduccin...2 11.2. Determinacin de regiones crticas ptimas para el contraste paramtrico con hiptesis alternativas simples. Teorema de Neyman-Pearson...3 Apndice al epgrafe 11.2. 8 11.3. Contrastes para hiptesis compuestas. La funcin de potencia11 11.3.1. Contraste uniformemente ms potente..13 11.3.2. Contrastes de significacin....13 11.3.2.1. Acercamiento intuitivo al mtodo..13 11.3.2.2. Estadstico o Indicador de Discrepancia17 11.3.2.3. Forma de la regin crtica...18 11.3.2.4 Algunos ejemplos de contrastes paramtricos....19 11.3.2.5. Interpretacin de salidas de ordenador. Significado del p-valor [o sig] .23 11.4. Referencias bibliogrficas.26

Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

Tema 11. Contrastacin de Hiptesis Paramtricas

11.1. Introduccin En el presente tema se van a tratar los Contrastes de Hiptesis paramtricos. Partiremos, como siempre de una poblacin, representada por la variable aleatoria , con funcin de probabilidad f(x,). Y en estos contrastes supondremos que la ley de probabilidad es conocida y por tanto, se ponen a prueba el valor o valores que pueden tomar los parmetros poblacionales desconocidos recogidos en la funcin de probabilidad de la variable poblacional. Llamaremos espacio paramtrico, , al conjunto de valores que puede tomar el parmetro. Formulamos, entonces las hiptesis; la hiptesis nula consistir en que el parmetro pertenezca a un subconjunto del espacio paramtrico, 0; y la hiptesis alternativa que pertenezca al subconjunto 1 ( que puede o no ser el complementario de 0). Para el contraste, utilizaremos una muestra aleatoria simple, y la regla de decisin se basar en la construccin de una regin crtica, formada por las muestras que nos llevan a rechazar la hiptesis nula. De forma esquemtica tenemos: Poblacin: Hiptesis: Muestra: : f(x ;) ; suponemos un slo parmetro, pero podra haber ms. H0 : 0 H1 : 1 de tal forma que 0 1 = X: (x1, x2, ,xn), m.a.s.

Regin crtica: X R Rechazamos Los pasos generales a seguir en toda prueba de hiptesis pueden ordenarse y resumirse de la siguiente manera: a. Definir la poblacin y la/s variable/s poblacional/es objeto de estudio, b. Definir las hiptesis nula y alternativa adecuadas a cada caso. c. Obtener el estadstico de contraste adecuado sobre el que se tome la decisin de rechazar o no la hiptesis nula. d. Determinar la forma de la regin crtica a partir del estadstico anterior. e. Especificar el nivel de significacin, , para la prueba. Al valor de tambin se le llama tamao del contraste. f. Usar el nivel de significacin para especificar la regla de decisin que indique los valores del estadstico que conducirn al rechazo de Ho. g. Comparar el valor observado del estadstico de contraste con el o los valores crticos especificados en la regla de rechazo, para determinar si Ho se debe rechazar o no. El presente tema est dividido en dos grandes apartados, segn que las hiptesis nula y alternativa sean o no simples. Si tanto la hiptesis nula como la alternativa son simples, se har uso del teorema de Neyman-Pearson que garantiza la existencia de regin crtica ptima para un nivel de significacin dada y permite determinar la forma de dicha regin. Si las hiptesis son compuestas, aplicaremos otros mtodos, dentro de los cuales se encuentran los contrastes de significacin.
Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

Tema 11. Contrastacin de Hiptesis Paramtricas

11.2 Contrastes paramtricos con hiptesis nula y alternativa simples. Teorema de Neyman-Pearson Cuando la hiptesis nula y la alternativa son simples podemos usar el Teorema de Neyman-Pearson para llevar a cabo el contraste. Puede demostrarse que este teorema garantiza la existencia de regin crtica ptima para un nivel de significacin dado y permite determinar la forma de dicha regin, o lo que es lo mismo, dice cul es la forma de la regin crtica ptima. El planteamiento es el siguiente. La hiptesis nula consistir en que el parmetro tome un valor concreto 0 (este es ahora el conjunto que se llam genricamente 0) y la hiptesis alternativa asigna al parmetro un nico valor 1 (que constituye el subconjunto 1). Los elementos del problema son: Poblacin: Muestra: Hiptesis:
x i : f(x i ; ) X: (x1, x2, ,xn), m.a.s. independencia en probabilidad H0 : = 0 H1 : = 1

: f(x ;)

Al tratarse de hiptesis simples, las distribuciones de probabilidad de la poblacin quedan perfectamente determinadas. As, bajo H0 : : f(x ;0) bajo H1 : : f(x ;1) A partir del planteamiento inicial se puede determinar la Funcin de verosimilitud: L(X;) = f(x1;). f(x2;)... f(xn;). Esta funcin ser distinta bajo cada una de las hiptesis: bajo H0 : L0(X;0) bajo H1 : L1(X;1)
EJEMPLO : El gerente del Banco Manzanares con sucursales presentes por todo el mundo considera que el sueldo anual de sus empleados sigue una distribucin normal de desviacin tpica 5.000 . Asimismo, su conocimiento de la compaa le lleva a afirmar que el sueldo medio es de 32.000 . Sus subordinados ms directos consideran que realmente es superior, concretamente igual a 34.000. El gerente est discutiendo si est o no en lo cierto, para lo cual plantea el siguiente Contraste de Hiptesis: Ho: = 32.000 H1: =34.000

Aunque enfrentar una hiptesis simple con una alternativa simple no es lo ms habitual, este planteamiento ayuda a comenzar la discusin y es punto de partida para contrastes ms habituales. Si seguimos los pasos considerados en el epgrafe anterior: a. Definir la poblacin y la/s variable/s poblacional/es objeto de estudio
En el ejemplo, la variable objeto de estudio = sueldo anual (en euros) de los empleados del BM. En este caso se parte de que : N(, 5.000).
Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

Tema 11. Contrastacin de Hiptesis Paramtricas

b. Definir las hiptesis nula y alternativa adecuadas a cada caso.


Ho: = 32.000 H1: =34.000 Obsrvese que: bajo H0 esto es, si fuera cierta esta hiptesis, : N(32.000, 5.000) y al quedar totalmente definida la distribucin de la variable poblacional, dicha hiptesis nula es simple. Asimismo, bajo H1, : N(34.000, 5.000) y al quedar totalmente definida la distribucin de la variable poblacional, dicha hiptesis alternativa es tambin simple.

c. Obtener el estadstico de contraste adecuado que ser la base sobre el que se tome la decisin de rechazar o no la hiptesis nula, y d. Determinar la forma de la regin crtica a partir del estadstico anterior. Estos dos ltimos pasos, se desarrollan en este contraste con la aplicacin del Teorema de Neyman y Pearson que permite encontrar la MEJOR REGIN CRTICA.

Formalizacin del Teorema de Neyman - Pearson De todas las regiones crticas de un mismo nivel de significacin o de un mismo tamao , la mejor regin crtica o regin crtica ptima es la que verifica que en ella
L 0 (X; 0 ) k, con k > 0 L1 (X; 1 )

de forma que fuera de ella ( regin de aceptacin) dicho cociente es


L 0 (X; 0 ) > k, L1 (X; 1 )

El Teorema ofrece una regla de decisin muy clara: si la verosimilitud de una muestra concreta obtenida bajo la hiptesis nula es menor (en una determinada proporcin, medida por el valor de la constante k) que la verosimilitud obtenida bajo la hiptesis alternativa, nos inclinamos a pensar que la hiptesis alternativa tiene mayor credibilidad y rechazaramos la hiptesis nula. Pero lo fundamental que debe y puede probarse- es, que esta regla de decisin es la que tiene mayor potencia del contraste para cada valor de fijado. O dicho de otro modo, no puede hallarse otra regin critica que, con el mismo nivel de significacin, tenga mayor potencia. Es obvio, que el valor de la constante k, elegida por el decisor, determinar un valor diferente de , y recprocamente. A partir de la desigualdad anterior que es un estadstico, al depender de la muestra- y sin ms que operar debidamente, se puede llegar a expresiones ms manejables de dicha regin crtica ptima.en funcin de estadsticos de menor dimensin- que resuman la informacin muestral.
Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

Tema 11. Contrastacin de Hiptesis Paramtricas

En el ejemplo que venimos discutiendo, tras dicho desarrollo matemtico recogido en el Apndice incluido al final de este epgrafe- se llega a que la forma de la regin crtica ptima es: ax C .Es decir, se rechazar H0 cuando la media muestral sea superior o igual a una constante.

e. Elegir el nivel de significacin, , para la prueba.


En este caso fijamos = 0,05

f. Usar el nivel de significacin para especificar la regla de decisin que indique los valores del estadstico que conducirn al rechazo de Ho. En este caso, determinaremos el valor de la constante C que delimita una regin de la forma anterior tal que el nivel de significacin sea del 0,05. As,
= 0,05 =P(rechazar H0 / H0 cierta)=P(XR / H0 cierta)=P(ax C / = 32.000)

Cuando la variable poblacional es normal, sabemos que a x : N ( ;

) . Obsrvese que: bajo

H0 esto es, si fuera cierta esta hiptesis, al quedar totalmente definida la distribucin de la variable poblacional, por ser dicha hiptesis nula simple, queda totalmente definida la distribucin del estadstico media muestral, y es posible, entonces, determinar la regin crtica.
5.000

En este caso, bajo H0 cierta a x : N ( 32.000 ;


n

) y solamente queda tipificar:

* = 0 ,05 = P a x

C 32.000 5.000 n
C 32.000 5.000 n = 1,645 ,

De la distribucin N(0,1) y para ese se obtiene:

de donde C = 32.000 + 1,645

5.000

, que se calcular una vez conocido n


n

g. Comparar el valor observado del estadstico de contraste con el o los valores crticos especificados en la regla de rechazo, para determinar si Ho se debe rechazar o no.
Supongamos que se ha tomado una m.a.s. de los sueldos de 100 empleados de todo el mundo, X0=(31.2435, 25.456,..34.251), en la que resulta: ax0= 32.675
Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

Tema 11. Contrastacin de Hiptesis Paramtricas

= 32.822 ,5 y, en 100 consecuencia, la regla de decisin ptima obtenida es que se rechazar H0 cuando ax 32.822,5.

Para n=100, el valor de la constante resulta C = 32.000 + 1,645

5.000

En este caso el valor observado es ax0= 32.675< 32.822,5, por lo que se NO se rechaza H0, es decir se acepta la hiptesis de que el salario medio es 32.000

Por ltimo, y a la vista de la decisin anterior, se procede a interpretar la decisin tomada en el marco del problema real de investigacin que ha motivado la realizacin del contraste, concluyendo que: No hay evidencias suficientes al 5% de significacin (o al 95% de confianza) para rechazar el valor de 32.000 como salario medio y parece que no hay pruebas suficientes para negar la opinin del gerente del banco. Lo que nos indica el teorema de Neyman - Pearson es que es imposible encontrar una regin crtica de = 0,05 con una potencia mayor. La potencia de este contraste es: = 1- = P[rechazar H0 / H0 falsa] Tal como se ha planteado el contraste, si la hiptesis nula no se da en la realidad, suponemos que se da la alternativa (H0 falsa es equivalente a que H1 cierta), por ello = 1- = P[rechazar H0 / H0 falsa] = P[XR / H1 ] = P(ax 32.822,5 / = 34.000)
Debe observarse que bajo H1, : N(34.000, 5.000) y al quedar totalmente definida la distribucin de la variable poblacional, por ser dicha hiptesis alternativa simple, queda totalmente definida la distribucin del estadstico media muestral, y es posible, entonces, conocida la regin crtica, calcular la potencia del test. 5.000 En efecto, bajo H1 cierta a x : N (34.000; ) esto es a x : N (34.000;500) , por lo que, n

= 1- = P(ax 32.822,5 / = 34.000) = NOTA IMPORTANTE: como se observa en el ejemplo, conviene distinguir el concepto de forma de la regin crtica (ya sea ptima o no), del concepto de regin critica concreta dado un valor de (ya sea ptima o no). En el ejemplo: - Forma de la regin crtica (en este caso ptima): ax C. Al trabajar con el estadstico media muestral, elegimos de qu manera dividir todo el espacio muestral posible todos los valores posibles del estadstico- en dos zonas excluyentes. Y en este caso, la regin crtica es una semi-recta (la semi recta complementaria es la regin de aceptacin) definida por valores de la media muestral tales que son no menores que una cierta constante , ax C.

Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

Tema 11. Contrastacin de Hiptesis Paramtricas

Regin critica concreta para =0,05 (en este caso ptima): ax 32.822,5. A este valor frontera (en este caso 32.822,5) se le suele llamar valor o nivel crtico porque es la frontera entre regin crtica y regin de aceptacin. Por otro lado, obsrvese que si =0,10, entonces se obtiene: 1,282 =
C 32.000 5.000 n

Y para n=100, C = 32.000 + 1,282

5.000 100

= 32.641

Es decir, al cambiar el nivel de significacin, aunque la forma de la regin crtica no vara, si lo hace el nivel crtico, resultando que se rechazar H0 cuando ax 32.641. En este caso, al ser el valor observado ax0= 32.675 32.641, se rechaza H0, es decir se acepta la hiptesis, sostenida por los subordinados del gerente, de que el salario medio es 34.000.

----------------------------------------------------------------------------------------------------A continuacin se plantean al lector algunas cuestiones que, derivadas de los resultados que proporciona la aplicacin del Teorema de Neyman y Pearson, sern de ayuda para el anlisis y discusin de otros contrastes que se estudiarn posteriormente. a) Que decisin se habra tomado si el tamao muestral hubiera sido 400 (suponiendo que se obtuviera la misma media muestral)?. Analice la razn de su respuesta. b) Qu decisin se habra tomado si las hiptesis se hubieran definido al revs manteniendo el tamao muestral inicial = 100 y el nivel de significacin del 5%?. Es decir, cul ser la regin crtica para el contraste de: Ho: 0= 34.000 y H1: 1 =32.000? Y a la vista de la informacin muestral, ax0= 32.675 Cul es la decisin? Para el ejemplo anterior (Banco Manzanares) con Ho: 0 = 32.000 y =0,05, c) Qu hubiera ocurrido con la regin crtica si la hiptesis alternativa hubiera sido 1= 36.000?. Y si hubiera sido 1 = 40.000? Analice la respuesta e intente formular una conclusin para el caso de que la hiptesis alternativa hubiera sido compuesta de la forma 1 > 32.000. d) Obtener la expresin de la potencia del contraste para el caso de que la hiptesis alternativa sea 1 > 32.000. Se recomienda dar distintos valores a 1. Por ejemplo, 32.500, 33.000, 33.500, 34.000, 35.000.

Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

Tema 11. Contrastacin de Hiptesis Paramtricas

Apndice al epgrafe 11.2 A continuacin se realiza el desarrollo matemtico de la aplicacin del teorema de Neyman-Pearson en los pasos c) y d) del ejemplo del Banco Manzanares.

x i : f(x i ; ) X: (x1, x2, ,xn), m.a.s. independencia en probabilidad Hiptesis simples: H0 : = 0 H1 : = 1

Poblacin: Muestra:

: f(x ;)

Segn el teorema de Neyman Pearson: la mejor regin crtica para cada tamao , viene dada por
L 0 (X; 0 ) k, con k > 0 L1 (X; 1 )

En este ejemplo, : N(, 5.000), pero para mayor generalidad, se parte del caso en que la desviacin tpica es un valor conocido:

( x ) 2 2

2
x

: N(, ), donde f ( x ) =

1 e 2

y es un valor conocido.

Por tanto la funcin de verosimilitud ser:


n ( x )2 i i =1 2 2

L( X , , ) =

2
1

n e

Si llamamos 0 al valor de la media poblacional bajo H0 y 1 al valor de la media poblacional bajo H1, la condicin que ha de cumplir el cociente de las funciones de verosimilitud para que se rechace H0 (tal y como establece el teorema de NeymanPearson) resulta:

Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

Tema 11. Contrastacin de Hiptesis Paramtricas

L( X , , ) 0 L( X , , ) 1

1 2

n e

n ( x )2 i 0 i =1 2 2 k ; k > 0 n ( x )2 i 1 i =1 2 2 X R se rechaza H 0

1 2

n e

Operando en esta expresin, donde todo son constantes excepto las observaciones muestrales,
n ( x )2 i 0 i =1 2 2 n ( x )2 i 1 i =1 2 2 = e n 2 ( xi 0 ) i =1 2 2 + n 2 ( x i 1 ) i =1 2 2

L( X , , ) 0 L( X , , ) 1 = e

n ( x )2 + ( x )2 0 1 i i i =1 = e 2 2

]
= e

x 2 2 + 2 x + x 2 + 2 2 x 0 1 i 0 i i 1 i i =1
n 2 2

2 + 2 + 2 x ( ) 0 1 i 0 1 i =1
n L( X , , ) 0 L( X , , ) 1 = e 2 2 k ; k > 0 X R

Aunque la funcin obtenida ya es un estadstico (funcin de los elementos muestrales) conviene seguir operando para llegar a una funcin ms cmoda. La funcin exponencial se puede eliminar aplicando logaritmos neperianos en ambos lados de la desigualdad (recurdese que los logaritmos son una transformacin montona, por lo que se conserva el signo de la desigualdad; adems en este caso, al ser un cociente de funciones positivas, siempre existir). 9

Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

Tema 11. Contrastacin de Hiptesis Paramtricas

n 2 2 + + 2 x ( ) i 0 1 0 1 i = 1 Ln e 2 2 Ln ( k ) ; k > 0 X R se rechaza H 0

Operando con las constantes de esta expresin,:


2 + 2 + 2 x ( ) 0 1 i 0 1 i = 1
n 2 2

n 2 2 2 Ln ( k ) 0 + 1 + 2 x i ( 0 1 ) Ln ( k ) 2 i =1

+ 1

+ 2( 0 1 )

i =1

x Ln ( k )2 i

2( 0 1 )

i =1

x Ln ( k )2 i

+ 0

Si se pasa el trmino 2(0 - 1) al segundo miembro, hay que observar que se trabaja con una desigualdad y segn que este factor sea positivo o negativo existen dos posibles situaciones: 1: Si 0 - 1 >0 ,entonces el signo de la desigualdad no vara:

i =1

x i

Ln ( k ) 2 2 +

2 0

2 1

2( ) 0 1

= k (puesto que toda la expresin anterior no depende de la muestra) 2

2: Si 0 - 1 < 0 (situacin del ejemplo ya que 32.000 -34.000= -2.000 < 0), entonces el signo de la desigualdad cambia:
n Ln ( k ) 2 2 + 2 0 2 1

i =1

x i

2( ) 0 1

= k (puesto que toda la expresin anterior no depende de la muestra) 2

Es decir, en el ejemplo considerado (en el que 0 - 1 < 0) puede decirse que si:

i =1

x k i 2

X R se rechaza H

Esta es la expresin de la regin crtica ptima (es ptima porque se ha obtenido a partir del teorema de Neyman-Pearson), pero dado que las hiptesis hacen referencia a valores de la media poblacional se puede elegir tambin la expresin de dicha

Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

10

Tema 11. Contrastacin de Hiptesis Paramtricas

regin crtica en funcin de la media muestral1. Para ello basta con dividir por n a ambos lados de la desigualdad
n x k i = 1 i 2 = una nueva constante que puede llamarse C a C x n n se rechaza H

En conclusin, ax C es la regin crtica ptima.

11.3. Contrastes para hiptesis compuestas. La funcin de potencia Plantearemos en este epgrafe, tal como se indic previamente, la contrastacin de hiptesis paramtricas compuestas. El problema es el mismo que se enunci al comienzo del tema, si bien ahora, la hiptesis nula y/o la alternativa son compuestas. Es decir que los subconjuntos denominados 0 y 1 contienen ms de un valor posible del parmetro. De forma esquemtica tenemos: Poblacin: Hiptesis: : f(x ;) ; suponemos un slo parmetro, pero podra haber ms.

H0 : 0 H1 : 1 de tal forma que 0 1 = (puede ser que 0 1 = , siendo las hiptesis, entonces, complementarias) Muestra: X: (x1, x2, ,xn), m.a.s.

Regin crtica: X R Rechazamos La construccin de la regin crtica, debe guiarse por las probabilidades : = P(1) = P [ rechazar H0 / H0 cierta ] = P [X R / H0 cierta ] = P(2) = P [ aceptar H0 / H0 falsa ] = P [X R / H0 falsa ] 1 - = P [ aceptar H0 / H0 cierta ] = P [X R / H0 cierta ] 1 - = P [ rechazar H0 / H0 falsa ] = P [X R / H0 falsa ] pero, puesto que ahora no todas las hiptesis tienen que ser simples, la muestra puede no tener una distribucin nica bajo las hiptesis, y estas probabilidades, en general, no seran nmeros, sino funciones que dependen del valor en concreto que tome el parmetro. (recuerde las cuestiones c) y d) formuladas en la pgina 7) Definimos funcin de potencia del siguiente modo: () = P [X R / ]

Que es un buen estimador de , tal y como se analiz en temas anteriores.


Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

11

Tema 11. Contrastacin de Hiptesis Paramtricas

esto es, la probabilidad de rechazar la hiptesis nula en funcin de los distintos valores del parmetro. La forma deseable de la funcin de potencia sera tal que la probabilidad de rechazar la hiptesis nula cuando esta es cierta fuese pequea, mientras que la probabilidad de rechazarla cuando es falsa fuese grande. () = P [X R / ] ()

La probabilidad de cometer el error de primera especie ser entonces una parte de la funcin de potencia: P(1) = P [ rechazar H0 / H0 cierta ] = P [X R / 0] , luego P(1) = () para 0

Llamaremos nivel de significacin al mximo valor que tome esta funcin: = max ()
0

Parece lgico tomar este valor como nivel de significacin, ya que es la mxima probabilidad de rechazar la hiptesis nula cuando sta es cierta. Y la probabilidad que denominamos potencia del contraste ser: () =1- () = P [rechazar H0 / H0 falsa] = P [X R / 1] , luego () = () para 1 A este tramo de la funcin de potencia se le suele denominar igual que al total, funcin de potencia. ()

P[1]

() *= max ()
0

1 12

Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

Tema 11. Contrastacin de Hiptesis Paramtricas

El proceso para la construccin de la regin crtica es anlogo al seguido para el caso de hiptesis simples: En primer lugar, fijamos el nivel de significacin, , y por la forma de definirlo sabemos que P [X R / 0] . En segundo lugar, tendremos que elegir la mejor regin crtica de tamao . Aqu surge un concepto anlogo al de regin crtica ms potente. Este es el concepto de test uniformemente ms potente. 11.3.1. Contraste uniformemente ms potente Fijado el tamao de un contraste, diremos que es uniformemente ms potente si su regin crtica, Rn, consigue que, para cualquier valor del parmetro, la potencia sea mayor que la que se obtendra con cualquier otra regin crtica R del mismo tamao. Rn Rn () > R (), R()

11.3.2 Contrastes para hiptesis compuestas. Contrastes de significacin El segundo mtodo para contrastar hiptesis compuestas paramtricas o no paramtricas es la elaboracin de tests de significacin. Parten de la elaboracin de un estadstico que compare la informacin muestral con el enunciado de las hiptesis ( en general, estadstico que mide las diferencias o discrepancias entre la afirmacin contenida en la hiptesis y la evidencia muestral) y, basndose en la distribucin de probabilidad de este estadstico se concluye: - que los datos observados aportan evidencia emprica favorable a la hiptesis nula, y que las diferencias que aparecen son lo suficientemente pequeas como para poder aceptar que se deben solo al azar - o bien que aparecen diferencias significativas entre el enunciado de la hiptesis nula y la muestra y, a diferencia del caso anterior, la muestra aporta evidencia favorable a la hiptesis alternativa en contra de la hiptesis nula. 11.3.2.1. Acercamiento intuitivo al mtodo
EJEMPLO I:

Hiptesis nula: H0: poblacin uniforme. Observamos que la hiptesis planteada no es paramtrica. Puesto que no se formula hiptesis alternativa, se entiende que sta es la complementaria, que la poblacin no es uniforme. Muestra: Aspecto del histograma de frecuencias:

Li 13

Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

Tema 11. Contrastacin de Hiptesis Paramtricas

Parece que la muestra no se corresponde con el comportamiento que debera tener una muestra de una poblacin uniforme. Habra que determinar si las diferencias que aparecen se deben al azar o debemos considerarlas estadsticamente significativas.
(este tipo de contraste se plantear en el tema 12) EJEMPLO II:

Supngase la variable aleatoria que da cuenta del nmero de caracteres SMS escritos en un minuto por los jvenes universitarios madrileos cuyo comportamiento se supone normal. Es un estandar considerar que el nmero medio de caracteres en la poblacin espaola en general sea 100, pero se sospecha que entre los jvenes universitarios madrileos dicho valor paramtrico es posible que sea diferente. Sea = nmero de caracteres SMS escritos en un minuto. Se considera que : N(, ). Ho: = 100 H1: 100 (al no estar explcita, esta es la hiptesis alternativa ) Obsrvese que: bajo H0: : N(100, ). Al desconocerse la desviacin tpica poblacional no queda totalmente definida la distribucin de la variable poblacional, y dicha hiptesis nula es compuesta. Asimismo, bajo H1: : N( 100, ) y tampoco queda definida la distribucin de la variable poblacional, dicha hiptesis alternativa es tambin compuesta. Si elegida una m.a.s. resulta ser (90, 87, 95, 97, 83, 92, 95, 88), parece que la muestra no se comporta como correspondera a una poblacin de media 100. Estudiaremos si las diferencias que aparecen pueden ser debidas al azar o son estadsticamente significativas. Como la hiptesis nula se refiere a la media poblacional, puede elegirse a la media muestral como resumen de la muestra a fin de comparar con lo que establece la hiptesis hiptesis. Si se quiere tomar una decisin sobre H0 (0 = 100), un procedimiento adecuado sera comparar ax con 0 (valor del parmetro bajo H0), y si existen grandes discrepancias sera coherente rechazar dicha hiptesis. As, podra proponerse el estadstico: t(X)= ax - o Bajo la hiptesis de poblacin normal, dicho estadstico seguira una distribucin:
N ( 0,

) n

Al igual que ocurra al construir los intervalos de confianza, es til - y necesario para poder determinar el nivel de significacin, la potencia, etc- que el estadstico considerado tenga una distribucin conocida y que no dependa del parmetro , por ello a partir del anterior se propone: D(X)=
ax S 1 n 0

, que bajo H0 se distribuye

como una varable t-Student , tn-1

Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

14

Tema 11. Contrastacin de Hiptesis Paramtricas

a 100 : t n1 (si H0 es cierta) En nuestro ejemplo: D(X) = x S 1 n

El estadstico de contraste , en general, ser una expresin que compare lo que dice la muestra sobre el parmetro objeto del contraste con lo que dice la hiptesis nula acerca de su valor (vase el numerador en el estadstico empleado en este ejemplo). Esa comparacin suele venir expresada en trminos de la precisin con la cual ha sido estimado el parmetro poblacional (vase que aqu el denominador es una estimacin de la desviacin tpica de la media muestral) y adems es necesario que su distribucin de probabilidad bajo H0 cierta sea una distribucin conocida y, a ser posible tabulada (en este caso la t de Student). Para determinar la forma de la regin crtica a partir del estadstico anterior, bastar enunciar qu entenderemos por diferencias significativas. Si se pretende rechazar la hiptesis nula cuando la informacin muestral se aleje mucho de ella, en este caso parece claro que se rechazar H0 cuando el valor de este estadstico sea aleje significativamente de cero, entendiendo por significativo, todo aquello que no se puede atribuir al azar. Es decir, el hecho de que en una muestra la media no coincida con la media poblacional propuesta no debe llevarnos a rechazar dicha hiptesis, a menos que se aleje de ella ms ( dependiendo del nivel de significacin fijado) de lo que sera atribuible por azar. Por esta razn en este ejemplo parece coherente proponer como forma de la regin crtica: O bien los valores de D(X) que alerten de que la media muestral es muy inferior a 100:
a x 100 S1 n k 1

O bien los valores de D(X) que alerten de que la media muestral es muy superior a 100:
ax S1 n k 2

Como ya se ha visto en otros ejemplos los valores crticos k1 y k2 dependern del valor del nivel de significacin, de momento el proceso se ha limitado a obtener la forma de la regin crtica. Si fijamos = 0,05 = 0,05 =P(rechazar H0 / H0 cierta)=P(XR / H0 cierta) y en nuestro caso se tiene:

Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

15

Tema 11. Contrastacin de Hiptesis Paramtricas

a 100 a 100 x x k k / = 100 = 0,05 = P 1 2 S S 1 1 n n

En este caso, bajo H0 cierta el estadstico utilizado se distribuye como una tn-1:
= 0 ,05 = P t n 1 k1 t n - 1 k 2

Si decidimos repartir el nivel de significacin por igual a ambas zonas de la regin crtica,
P t

( n 1 k1 ) = / 2 = 0 ,025 ( n 1 k 2 ) = / 2 = 0 ,025

P t

Al ser la distribucin t simtrica respecto al eje de ordenadas, los valores de k1 y k2 sern iguales en valor absoluto, pero con signo contrario y puede ponerse:
P t

( n 1 ) = = 0 ,05

donde k1 = - y k2 =

Para dicho valor de , el valor de depender del tamao muestral n. Se toma una m.a.s. de los SMS escritos en un minuto por 8 alumnos: X0=(120, 127, 105, 107, 93, 102, 125, 98) en la que resulta: ax0 = 109,6 , (desviacin tpica muestral)sx0 = 11,96 y (cuasidesviacin tpica muestral)S10=12,78 Para n=8 se tiene: P t8 1 = = 0 ,05 , de donde =2,365
a 100 a x 100 Luego se rechazar H0 cuando: x 2,365 , o bien cuando: 2,365 S 1 n S 1 n

En este caso: D(X0) =

109,6 100 12,78 8

= 2,12 < 2,365

Por lo que NO se rechaza la hiptesis de que el nmero medio de caracteres de SMS es 100: la informacin muestral obtenida pertenece a la zona de aceptacin de la hiptesis. No hay evidencias suficientes al 5% de significacin (o al 95% de confianza) para rechazar que los jvenes universitarios madrileos se comportan de acuerdo al estndar espaol en cuanto al nmero medio de caracteres de SMS escritos en un minuto.

Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

16

Tema 11. Contrastacin de Hiptesis Paramtricas

Obsrvese que, aunque la media muestral ha sido 109,6, bastante alejado aparentemente de 100, las diferencias pueden atribuirse perfectamente al azar al nivel de significacin fijado, dado que nos hemos limitado a observar a 8 personas que podan haber sido otras. Adems la desviacin tpica de la muestra (2,365), junto con su tamao da idea de cmo podra haber fluctuado esta media muestral en otras muestras de tamao 8. Es decir 4,52 es la estimacin de la desviacin tpica de ax , lo que supone que 109,6 sera un valor relativamente probable bajo el supuesto de que realmente la media poblacional fuese 100. 11.3.2.2. Estadstico o Indicador de Discrepancia Como se observa en el ejemplo anterior los contrastes de significacin parten de la elaboracin o bsqueda de un estadstico que compare la informacin muestral con el enunciado de las hiptesis, lo que se denominar estadstico de contraste o estadstico o indicador de discrepancia. Dicho estadstico se puede denotar como: D(X) D, o bien Id Id(X). La seleccin del estadstico de contraste es el problema principal de un contraste de significacin. En general, para los contrastes paramtricos, las condiciones que deben seguirse para la eleccin de un estadstico que sirva para contrastar son las siguientes: - que recoja la informacin que tiene la muestra acerca del parmetro poblacional desconocido, - que dependa de la hiptesis nula, - y que bajo H0 tenga una distribucin de probabilidad conocida. En el caso de que las hiptesis sean paramtricas, frecuentemente, aparecen similitudes importantes con los utilizados para la construccin de intervalos de confianza2. En otras palabras, este estadstico mide la discrepancia entre el valor del parmetro propugnado por la Ho [0], y el que se podra asignar fundamentndose en la evidencia muestral X, (valor que suele identificarse con una adecuada estimacin del parmetro, *). Es decir, el estadstico de discrepancia depende tanto del valor que toma bajo la Ho como de una adecuada estimacin del parmetro poblacional desconocido *. As, si denotamos por D al estadstico de discrepancia, este va a depender de 0 y *, es decir, D=D (0, *). La forma analtica de este estadstico puede ser muy diversa, as puede venir expresado en forma de una simple diferencia, en termino de desviaciones absolutas, desviaciones cuadrticas, desviaciones tipificadas, etc. Lo que si es importante es que la medida D tiene que tener una distribucin de probabilidad conocida bajo el supuesto de que Ho sea cierta. Puesto que el estadstico en que se basa la regin crtica tiene una distribucin de probablidad nica y conocida bajo la hiptesis nula, la determinacin del nivel crtico para el nivel de significacin fijado es inmediata.

De hecho se emplea el mismo estadstico pivote, cuyos distintos casos se recogieron en forma de cuadro para los intervalos de confianza ms habituales.
Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

17

Tema 11. Contrastacin de Hiptesis Paramtricas

Teniendo en cuenta la exigencia de que el estadstico elegido debe tener distribucin de probabilidad nica y conocida bajo la hiptesis nula, parece que estos contrastes sean directamente aplicables a los casos en los que la hiptesis nula es simple. La alternativa ser siempre compuesta; recordamos la conveniencia de fijar una hiptesis alternativa ms amplia que la nula. Partiremos, por ello, de contrastes de hiptesis nula simple frente a hiptesis alternativa compuesta, pero inmediatamente obtendremos el procedimiento a seguir para algunos tipos de contraste de hiptesis nula compuesta frente a alternativa compuesta.
ax S 1 n 0

En el Ejemplo II: D(X)=

que se distribuye como una tn-1 cuando H0 es cierta

11.3.2.3. Forma de la regin crtica Como se observa en el desarrollo del ejemplo II, una vez obtenido el Indicador de Discrepancias es necesario determinar razonadamente que valores del mismo entran en contradiccin con la hiptesis nula y, por tanto, llevan a rechazarla.
En el ejemplo II, teniendo en cuenta las hiptesis de partida y la distribucin simtrica de D(X), dicha forma sera:

a 100 x , el valor de dependa finalmente del tamao muestral. S 1 n

Aunque podra desarrollarse toda una casustica de la forma de la regin crtica en funcin de la de las hiptesis nula y alternativa, los contrastes de significacin ms usuales para distintos tipos de hiptesis paramtricas que se pueden encontrar son los siguientes: H0: = 0 H0: = 0 H0: 0 H0: < 0 H1: H1: > 0 H1: < 0 H1: > 0 Hiptesis nula simple. Alternativa bilateral. Hiptesis nula simple. Alternativa unilateral Hiptesis nula compuesta. Alternativa unilateral Hiptesis nula compuesta. Alternativa unilateral

Si la hiptesis alternativa en el ejemplo II hubiera sido: 100; se habra rechazado Ho cuando la media muestral fuera muy superior a 100 y la forma de la regin crtica hubiera sido:
a x 100 S 1 n decir, se hubiera mantenido el estadstico de contraste pero habra cambiado la forma de la regin crtica que ahora tendra solamente una rama. k . Es

Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

18

Tema 11. Contrastacin de Hiptesis Paramtricas

11.3.2.4. Algunos casos de contrastes de significacin paramtricos Se recogen a continuacin algunos casos de elaboracin del contraste de significacin paramtricos, y se proponen otros para su desarrollo por los alumnos. Contrastes de significacin para la media de una poblacin normal a) con varianza conocida Poblacin : N( ; 0) 02 conocida Muestra X: (x1,x2,,xn) tomada por m.a.s. para contrastar al nivel de significacin hiptesis sobre , cuando intervienen hiptesis compuestas. Hiptesis a2 H0 : = 0 a1 H0 : = 0 H1 : > 0 H1 : < 0 a3 H0 = 0 H1 : 0

(a x - 0 )
Estadstico Regin crtica:

n
: N(0;1) si H0 es cierta

0
a1 XR si

( a x - 0 )

( a x - 0 )
a2 XR si

( a x - 0 )
a3 XR si

con valores que aseguren el nivel de significacin fijado (Nota: en cada caso debe elegirse cmo se asigna dicho nivel de significacin a la o las ramas del test) Estas regiones crticas se podran escribir tambin en la forma: a1 XR si ax k, donde k = 0 +

0 n

a2 XR si ax C,

donde C = +

0 n
19

Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

Tema 11. Contrastacin de Hiptesis Paramtricas

a3 XR si ax k1 o ax k2,

0
donde k1 = 0 -

n
n

y k2 = 0 +

b) con varianza desconocida Poblacin : N( ; 0) 02 desconocida Muestra X: (x1,x2,,xn) tomada por m.a.s. para contrastar al nivel de significacin hiptesis sobre , cuando intervienen hiptesis compuestas. Hiptesis a1 H0 : = 0 a2 H0 : = 0 H1 : > 0 H1 : < 0 a3 H0 = 0 H1 : 0

El alumno desarrollar este caso (ver ejercicio n 12 )


Contrastes de significacin para la varianza de una poblacin normal a) con media conocida Poblacin : N(0 ; ) 0 conocida

Muestra X: (x1,x2,,xn) tomada por m.a.s. para contrastar al nivel de significacin hiptesis sobre 2, cuando intervienen hiptesis compuestas. Hiptesis a1 H0 : 2 = 02 H1 : 2 > 02
n

a2 H0 : 2 = 02 H1 : 2 < 02

a3 H0 : 2 = 02 H1 : 2 02

Estadstico

i =1

( x i 0 ) 2
2 0

nT = 2 = n2 si H0 es cierta 0

Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

20

Tema 11. Contrastacin de Hiptesis Paramtricas

Regin crtica: Elegido el estadstico podemos observar que los valores del mismo en torno a n estn apoyando la hiptesis nula, ya que si se cumple H0, la E(T) =02. Valores muy grandes del estadstico apoyan que la varianza es mayor que 02 y valores muy pequeos que la varianza es menor que 02. Por lo que la regin crtica, en los distintos casos tendra la forma que se plantea a continuacin:
a1 XR si a2 XR si a3 XR si

nT 2 0 nT

2 2 0 con valores que aseguren el nivel de significacin fijado. 2 0 Puesto que la distribucin 2 no es simtrica, en el caso a3 tendremos que tomar un criterio para la eleccin de 1 y 2; como ya es habitual, repartiremos el nivel de significacin a partes iguales entre las dos ramas de la regin crtica, de manera que: nT nT P[ 2 1 ] = P[ 2 2 ] = /2. 0 0 Estas regiones crticas se podran escribir tambin en la forma: 2 a1 XR si T k, donde k = 0 n a2 XR si T C, a3 XR si T k1 o T k2 Hiptesis a4 H0 : 2 02 H1 : 2 > 02 equivalente al caso a1
b) con media desconocida a5 H0 : 2 02 H1 : 2 < 02 equivalente al caso a2

2 0 nT

1 nT

Poblacin : N( ; ) desconocida Muestra X: (x1,x2,,xn) tomada por m.a.s. para contrastar al nivel de significacin hiptesis sobre , cuando intervienen hiptesis compuestas. Hiptesis
b1 H0 : 2 = 02 H1 : 2 > 02 b2 H0 : 2 = 02 H1 : 2 < 02 b3 H0 : 2 = 02 H1 : 2 02

El alumno desarrollar este caso (ver ejercicio n 8 )


Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

21

Tema 11. Contrastacin de Hiptesis Paramtricas

Contrastes de significacin para igualdad de varianzas de poblaciones normales a) Con medias conocidas

Poblaciones. 1 : N(1,1); 2: N(2 ,2), independientes Muestras: X = (x1,..., xn) m.a.s. Y = (y1,..., yn) m.a.s. Hiptesis a1 H0 : 12 = 22 a2 H0 : 12= 22 a3 H0 : 12= 22 H1 : 12 > 22 H1 : 12 < 22 H1 : 12 22 Estadstico Observamos que, en los tres casos planteados, si la hiptesis nula es cierta, el cociente entre varianzas poblacionales es igual a la unidad, por lo que es inmediato comprobar que el siguiente estadstico verifica los requisitos:
i =1 n

( x i 1 ) 2
n T = 1 = Fn ,m T2 2

i =1

( x i 2 )

si H0 es cierta

m Regin crtica: Elegido el estadstico podemos observar que los valores del mismo muy grandes del estadstico apoyan que la varianza de la primera poblacin es mayor que la varianza de la segunda y valores muy pequeos que la varianza de la primera poblacin es menor que la varianza de la segunda. Por lo que la regin crtica, en los distintos casos tendra la forma que se plantea a continuacin: T a1 XR si 1 T2 T a2 XR si 1 T2 T T1 a3 XR si 1 1 2 T2 T2 con valores que aseguren el nivel de significacin fijado.

Puesto que la distribucin F de Snedecor no es simtrica, en el caso a3 repartiremos el nivel de significacin a partes iguales entre las dos ramas de la regin crtica, de manera que: T T P[ 1 1 ] = P[ 1 2 ] = /2. T2 T2 Hiptesis a4 H0 : 12 22 H1 : 12 > 22 equivalente al caso a1
a5

H0 : 12 22 H1 : 12 < 22 equivalente al caso a2 22

Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

Tema 11. Contrastacin de Hiptesis Paramtricas

b) Con medias desconocidas

Poblaciones. Muestras:

1 : N(1,1); X = (x1,..., xn) m.a.s.


b2 H0 : 12= 22 H1 : 12 < 22

2: N(2 ,2),

independientes 1,2 desconocidas Y = (y1,..., yn) m.a.s.


b3 H0 : 12= 22 H1 : 12 22

Hiptesis b1 H0 : 12 = 22 H1 : 12 > 22

El alumno desarrollar este caso (ver ejercicio n 14 )


11.3.2.5. sig] Interpretacin de salidas de ordenador. Significado del p-valor [o

A la hora de realizar contrastes de hiptesis es habitual que los clculos sean realizados por ordenador, usando algn programa estadstico como SPSS. Los ordenadores no suelen preguntar al usuario a qu nivel de significacin desea Vd realizar el contraste?, sino que en su lugar, proporcionan un valor numrico para cada prueba que es llamado p-value, p-valor, probabilidad asociada o sig segn los diferentes programas. El p-valor o probabilidad asociada al valor de un estadstico de contraste es la probabilidad de que, siendo realmente cierta Ho, el estadstico de contraste tome el valor que ha tomado o incluso otro ms desfavorable respecto de dicha hiptesis nula, entendiendo como ms desfavorable, segn los casos, mayor que, menor que o ms lejos de un determinado centro en cualquier direccin. Por ejemplo, si se est realizando un contraste de hiptesis (cualquiera que este sea, aqu est una de las claves del uso del p-valor) y la probabilidad asociada al valor del estadstico de contraste (cualquiera que sea su frmula o expresin y su distribucin de probabilidad bajo Ho cierta, sin que sea necesario conocerla) obtenido es p=0,48, esto significa que hay un 48% de probabilidades de que, siendo realmente cierta Ho, se haya obtenido ese valor concreto del estadstico (cualquiera que sea) o uno ms desfavorable a Ho. Parece por tanto que el valor del estadstico es bastante compatible con Ho; la muestra no aporta evidencias suficientes en su contra como para rechazarla3 Si al realizar otro contraste p=0,0001, en este caso el valor del estadstico de contraste obtenido (o uno ms desfavorable respecto de Ho) es muy poco probable haberlo obtenido si Ho fuese realmente cierta, por lo que parece que, o bien estamos ante una muestra muy rara respecto a las que proceden de la poblacin definida por la Ho o bien lo que sucede es que Ho no es cierta.
3

No est de ms insistir en que la situacin que describe la hiptesis nula es la que se va a mantener como cierta salvo que existan suficientes evidencias empricas en su contra; la veracidad de la hiptesis nula nunca se demuestra, sino que es una verdad transitoria que intenta falsarse continuamente (probar que no es cierta, que no es compatible con la realidad) [vease falsacin y el mtodo cientfico en http://es.wikipedia.org/wiki/Falsacionismo].
Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

23

Tema 11. Contrastacin de Hiptesis Paramtricas

Por lo tanto, valores altos del p-valor parecen compatibles con Ho y su mantenimiento como verdad provisional, mientras que valores bajos parece que juegan a favor de su rechazo, debido a la incongruencia entre lo observado empricamente y lo que propone dicha hiptesis. Cmo decidir entonces entre mantener o no Ho (que nunca se acepta como cierta, sino que no se ha podido rechazar an)?Cundo considerar que un p-valor es lo suficientemente alto como para no rechazar Ho o lo suficientemente pequeo como para mantenerla? En este punto, recurdese que an siendo realmente cierta Ho, es posible obtener muestras aparentemente raras respecto de la poblacin especificada por Ho, que conllevan valores del estadstico de contraste muy grandes y que, aparentemente llevaran a rechazarla, por aportar suficiente evidencia muestral en su contra. Obviamente, si el decisor no quisiera equivocarse al rechazar Ho, nunca la rechazara a pesar de que existieran fuertes evidencias en su contra, puesto que siempre uno puede pensar que la muestra que ha obtenido es uno de esos casos raros posibles (aunque no probables) y compatibles con Ho (cul es el nivel de significacin en este caso?) Sin embargo, la discusin lgica de la hiptesis requiere arriesgarse y, en un determinado punto, atreverse a rechazar Ho. Ese punto viene determinado por el nivel de riesgo que el investigador est dispuesto a asumir de cometer el error tipo I, esto es, por el nivel de significacin (). Obviamente, los resultados de un contraste son idnticos si se opera comparando el valor del estadstico con el valor crtico de tablas que si se compara el nivel de significacin con el p-valor. En un caso se comparan entre s valores de la distribucin del estadstico de contraste y en el otro probabilidades (o reas bajo la curva de su funcin de densidad). Esta equivalencia de procedimientos queda patente en las siguientes grficas:

f[D(x,0, )]

A
p-valor Do

Valor crtico

Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

24

Tema 11. Contrastacin de Hiptesis Paramtricas

De esta manera, si el p-valor es superior a , resulta entonces que el mximo riesgo de cometer error tipo (I) [otra forma de interpretar el p-valor] es mayor que el mximo nivel de riesgo que el investigador est dispuesto a asumir (medido por , y fijado de forma subjetiva por el investigador, aunque el nivel habitual es el 5%), es mejor no arriesgarse a rechazar y se mantiene Ho.

f[D(x,0, )]

p-valor Do

Valor crtico

A la inversa, si el p-valor es inferior a , existe un riesgo mximo de cometer el error tipo I menor que el que se est dispuesto a asumir; en este caso, merece la pena arriesgarse y rechazar Ho. Resumiendo: Si p-valor < entonces X R, y entonces rechazamos la Ho.
As si = 0,05, la regla de decisin quedara: Si p-valor < 0,05 entonces X R, y rechazamos la Ho.

Algunas ventajas del uso del p-valor para la realizacin de contrastes de hiptesis:

Realizar contrastes de hiptesis utilizando el p valor es mucho ms sencillo: nicamente basta con conocer cules son las hiptesis que se estn contrastando (nula y alternativa) y conocer el p-valor (o probabilidad asociada) correspondiente. Es posible analizar en trminos de probabilidades si el rechazo o no rechazo de la hiptesis nula ha sido por poco o por mucho, lo que puede proporcionar mayor seguridad en la toma de la decisin (si ha sido por mucho).
Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

25

Tema 11. Contrastacin de Hiptesis Paramtricas

Distintos investigadores pueden querer realizar un contraste de hiptesis con diferente nivel de significacin: los programas informticos no preguntan qu alfa queremos usar ni nos proporcionan el valor crtico correspondiente; nos muestran el p-valor que corresponde al valor obtenido por el estadstico de contraste para se pueda comparar con el o los niveles de significacin que desee emplear el investigador. En este punto es interesante recordar que un contraste puede llevar a no rechazar Ho al 1% de significacin mientras que puede rechazarse al 5% o al 10% (niveles ms habituales empleados). En todo caso, habitualmente el p-valor es o muy alto (en cuyo caso no hay evidencias para poder rechazar la hiptesis nula) o muy bajo (en cuyo caso parece razonable rechazarla, de hecho los programas suelen dar 4 decimales y 0,0000 sera el menor valor posible que proporcionaran).

11.4. Referencias bibliogrficas

* Casas Snchez, J.M. (1996) Inferencia Estadstica para Economa y Administracin de Empresas. Ed. Centro de Estudios Ramn Areces. * Casas Snchez, J.M.; Garca Prez, C.; Rivera Galicia, L.; Zamora Sanz, A. (2006) Ejercicios de inferencia, estadstica y muestreo para economa y administracin de empresas. Ed. Pirmide * Ferran Aranaz, M. SPSS para WINDOWS programacin y anlisis estadstico. Serie McGraw-Hill de informtica. 1997. * Lpez de la Manzanara Barbero, J. (1990) Problemas de Estadstica. Ed. Pirmide * Martn Pliego, J; Ruiz Maya, L. (2004) Estadstica I: Probabilidad (2 edicin) y (2004) Estadstica II: Inferencia (2 edicin). Ed. Thomson-Paraninfo.

Francisco Borrs; Leandro Escobar; Carlos Martnez de Ibarreta; Antonio Ra. M Josefa Peralta; Lourdes Fernndez Dpto. de Mtodos Cuantitativos. Facultad CCEE y EE. Univ. Pontificia Comillas Madrid. Marzo 2008.

26