Está en la página 1de 10

Probabilidad y Estadstica

Pruebas de hiptesis

1 1

PRUEBAS DE HIPTESIS CON MUESTRAS GRANDES INTRODUCCIN. Recordemos que el objetivo de la estadstica inferencial es conocer caractersticas de la poblacin a partir de la informacin contenida en una muestra. En particular, se hacen inferencias acerca de los parmetros poblacionales desconocidos, basadas en la informacin contenida en una muestra. En Estadstica Inferencial hay dos formas de realizar inferencias acerca de un parmetro poblacional: podemos estimar su valor que es lo que vimos la clase pasada, o bien, probar (o comprobar) una hiptesis acerca de su valor, que es lo que vamos ver esta clase. En la clase pasada vimos dos tipos de estimaciones: Puntual: En este caso para estimar el valor de un parmetro poblacional , usamos un estimador puntual insesgado y podemos calcular la probabilidad de que P(| | < c) que es una medida del error que cometemos al usar para estimar . Por intervalo: En este caso para estimar el valor de un parmetro poblacional , usamos un estimador puntual insesgado, como para determinar un intervalo [ , + c ] c donde es la desviacin estndar de la distribucin muestral de . En particular, si z /2 es tal que P(z /2 < z ) = /2, o equivalentemente, P(0 < z < z /2) = (1 ) / 2 entonces [ /2 , + z /2 ] es un intervalo de confianza de 1 . z es decir, P([ /2 , + z /2 ] contenga a ) =1 . z Para calcular las probabilidades anteriores, se usa la distribucin muestral de . Se supuso que se trabajaba con muestras grandes para que esta distribucin fuera aproximadamente normal. Hoy vamos a ver como se puede realizar una inferencia acerca de un parmetro poblacional probando (o comprobando) una hiptesis acerca de su valor. Veamos algunos ejemplos en donde se puede usar una prueba de hiptesis: Un investigador en medicina propone la hiptesis de que un medicamento A es ms efectivo que otro B para curar una cierta enfermedad. Un tcnico de control de calidad propone la hiptesis de que un nuevo mtodo de montaje produce slo 5% de artculos defectuosos. Un educador afirma que dos mtodos para ensear tiene la misma eficacia. Un candidato poltico afirma que la mayora de los votantes estn de su parte.

En todos estos casos la hiptesis o afirmacin se somete a una prueba estadstica para compararla con los resultados de los datos muestrales. Vamos a ver: Qu funcin de las mediciones muestrales debe utilizarse para realizar la prueba. Cmo se decide si una muestra no concuerda con la hiptesis Cundo debe rechazarse la hiptesis, aceptarse la hiptesis o no decidir nada acerca de la hiptesis. Cul es la probabilidad de tomar una decisin equivocada. ______________________________________________________________________ ELEMENTOS DE UNA PRUEBA DE HIPTESIS

Probabilidad y Estadstica

Pruebas de hiptesis

1 2

El objetivo de toda prueba de hiptesis es probar una hiptesis acerca del valor de un parmetro poblacional. Entonces el primer elemento de la prueba de hiptesis es la afirmacin o hiptesis sobre el valor de uno o ms parmetros poblacionales y recibe el nombre de hiptesis alternativa. Hiptesis alternativa, Ha: afirmacin o hiptesis sobre el valor de uno o ms parmetros poblacionales. Se denota con Ha. El segundo elemento es la hiptesis nula que es una negacin de la hiptesis alternativa. Hiptesis nula, H0: negacin de la hiptesis alternativa. El soporte para la validez de la hiptesis alternativa H a se obtiene mostrando, usando los valores muestrales como evidencia, que la hiptesis nula H0 es falsa. As el soporte de una hiptesis se obtiene mostrando la falta de soporte para la otra. Ejemplo. a) Se cree que no ms del 50% de los consumidores prefiere un producto de marca A. Se propone como hiptesis alternativa que la proporcin p de consumidores que prefieren la marca A es mayor que 50% = 0.5 Ha: p > 0.5 Se propone adems H0: p = 0.5 La decisin de rechazar H0 y de aceptar Ha, se basa en la informacin contenida en una muestra de n mediciones, tomadas de una poblacin. b) Se seleccionan 100 consumidores y se les pregunta si prefieren la marca A. En este caso la muestra se extrae de una poblacin binomial con parmetro p. En funcin de los datos de una muestra se obtiene un nmero llamando la estadstica de prueba (que puede ser un estimador). c) Por ejemplo, se obtiene x la cantidad de consumidores que prefieren A de los 100 de la muestra. El conjunto de todos los valores que puede tomar la estadstica de prueba se divide en dos subconjuntos o regiones: regin de rechazo regin de aceptacin Si la estadstica cae en la regin de rechazo, se rechaza H0 a favor de Ha. Si la estadstica cae en la regin de aceptacin, se acepta H0. La regin de rechazo debe contener valores que apoyen Ha. d) Como 0 x 100, es decir, x [0, 100], Ha: p > 0.5 y H0: p = 0.5 se podra tener regin de rechazo: [60, 100] regin de aceptacin: [0, 60) (observar que la regin de rechazo contiene valores 60 que apoyan Ha). Supongamos que x = 99. Como x est en la regin de rechazo, rechazamos H 0 a favor de Ha y concluimos que la proporcin p de consumidores que prefieren la marca A es mayor a 0.5. En general, la regin de rechazo incluye valores de x que apoyan H a . En ese ejemplo, Ha: p > 0.5, por lo tanto la regin de rechazo incluye valores de x grandes, que son los que hacen poco probable que p 0.5. La regin de aceptacin y que por lo tanto apoya H 0 incluye entonces valores de x chicos. Ms all de estas consideraciones, la determinacin de las regiones de rechazo y aceptacin depende de la probabilidad de cometer errores con la que se quiera trabajar. Antes de ver esto, resumamos cuales son los elementos de una prueba de hiptesis.

Probabilidad y Estadstica

Pruebas de hiptesis

1 3

Resumiendo Elementos de una prueba estadstica. 1. Hiptesis alternativa. 2. Hiptesis nula. 3. Estadstica de prueba. 4. Regin de rechazo. Analicemos los errores que se pueden cometer al aceptar o rechazar H0, cuales son las probabilidades de cometer cada uno de ellos y como se usa esto para determinar las regiones de rechazo y aceptacin. La hiptesis nula H0 puede ser verdadera o falsa, cosa que no conocemos. Si H0 es verdadera y la rechazamos se comete un error llamado de tipo I. Si H0 es falsa y la aceptamos se comete un error llamado de tipo II.

Tabla de decisiones. Decisin Rechazar H0 Aceptar H0 Verdadera Error tipo I Decisin correcta Hiptesis nula Falsa Decisin correcta Error tipo II

La validez o bondad de una prueba de hiptesis se mide mediante las probabilidades de cometer cada uno de estos errores probabilidad de cometer un error de tipo I probabilidad de cometer un error de tipo II corresponde a la regin de rechazo. corresponde a la regin de aceptacin. Volvamos al ejemplo que estbamos considerando. Ejemplo. Sea p la proporcin de consumidores que prefieren la marca A. a) Ha: p > 0.5 H0: p = 0.5 b) Se seleccionan 100 consumidores y se les pregunta si prefieren la marca A. En este caso la muestra se extrae de una poblacin binomial con parmetro p. c) Estadstica de prueba: x la cantidad de consumidores que prefieren A de los 100 de la muestra. Error tipo I: Supongamos que H0 es verdadera, es decir, se cumple que p = 0.5. Entonces se puede cometer un error tipo I, cuando se rechaza H0. Veamos como se calcula . Como H0 es verdadera, x tiene una distribucin binomial con parmetro p = 0.5. Como el tamao n = 100 de la muestra es grande se puede suponer normal con x = n p = 100 (0.5) = 50 p 0 x = n q = 1 0 (0.5)( 1 0.5) = 5 Si se define como regin de rechazo: x + 2 = 60, la probabilidad de cometer un error tipo I, es decir de rechazar H0 siendo esta verdadera es

Probabilidad y Estadstica

Pruebas de hiptesis

1 4

= P( x 60 ) = 0.025. Es decir x caer en la regin de rechazo 2.5% de las veces, cometindose un error al rechazar H0 siendo verdadera. Vemos adems que el valor de queda fijo al fijar la regin de rechazo.

Error tipo II: Supongamos que H0 es falsa, es decir, se cumple que p tipo II.

0.5. Entonces se puede cometer un error

Como H0 es falsa, x tiene una distribucin binomial con parmetro p desconocido. Como el tamao n = 100 de la muestra es grande se puede suponer normal con = n p = 100 p 0 = npq = 1 0 p (1 p ) Aunque sabemos que la distribucin de x es normal, como desconocemos p no es imposible calcular la probabilidad de x que caiga en un determinado intervalo, y por ende .

Sin embargo, podemos ver como se comporta de acuerdo a si p se encuentra cerca o lejos del valor estipulado en H0, que es 0.5. Si p = 0.9, en la muestra de 100 consumidores casi la totalidad estar a favor de la marca A, con lo cual x estara bastante cerca de 100. De este modo, tendramos una evidencia muy fuerte para rechazar H 0: p = 0.5, y por ende de no equivocarnos. Es decir, en este caso es chico.

Probabilidad y Estadstica

Pruebas de hiptesis

1 5

Si p = 0.55, en la muestra de 100 consumidores casi la mitad estara a favor de la marca A. De este modo, tendramos evidencia como para aceptar H0: p = 0.5, y por ende de equivocarnos. Es decir, en este caso es grande. En definitiva, mientras mayor sea la diferencia entre p real y el que propone H0, menor es probabilidad de cometer un error tipo II, es decir, menor es . Relacin entre los dos tipos de errores. corresponde a la regin de rechazo. corresponde a la regin de aceptacin. Mientras ms grande (chica) es la regin de rechazo ms chica (grande) es la regin de aceptacin. Si crece (disminuye) entonces disminuye (crece). En general se tiene, Propiedades de y 1. El valor de se fija al escoger la regin de rechazo. 2. El valor de depender del valor que se use para definir H0. Mientras ms grande (chica) sea la diferencia entre el valor que se use para definir H 0 y el valor real del parmetro, menor (mayor) ser . 3. Si crece (disminuye) entonces disminuye (crece). 4. Si se aumenta el tamao de la muestra y disminuyen. Al idear una prueba de hiptesis se consideran los valores y que se quieren tolerar. Los pasos que se suelen seguir son: 1. Se especifica . 2. En funcin de , se determina la regin de rechazo. 3. Se selecciona un tamao n de muestra para lograr un adecuado. El ltimo paso es el que en general no se puede llevar a cabo porque es necesario conocer los distintos valores de para diferentes valores del parmetro en prueba. En la prctica, si la estadstica de prueba cae en la regin de rechazo, podemos cometer un error tipo I y sabemos cual es la probabilidad de cometerlo. Si la estadstica de prueba cae en la regin de aceptacin, con lo cual se est en riesgo de cometer un error de tipo II, no se toma decisin alguna y se recolectan ms datos. ___________________________________________________________________________ PRUEBA ESTADSTICA PARA MUESTRAS GRANDES Ahora enunciaremos lo anterior, que se vio para un ejemplo concreto (parmetro p de una poblacin binomial), de modo general. Recordemos que una estadstica de prueba es un nmero que se obtiene en funcin de los datos de una muestra. Se puede usar como estadstica de prueba un estimador puntual insesgado que tenga una distribucin de muestreo aproximadamente normal para tamaos grandes de muestra como los que vimos la clase pasada: La media muestral x es un estimador insesgado de la media poblacional . La proporcin muestral p es un estimador insesgado del parmetro p. x 1 x 2 es un estimador insesgado del parmetro 1 2. p 1 p 2 es un estimador insesgado del parmetro p1 p2. En general, sea es un estimador insesgado de un parmetro . Se supone que es un estimador insesgado que tiene una distribucin de muestreo aproximadamente normal. Supongamos que se quiere probar que el parmetro poblacional es mayor que un cierto valor 0, es decir Ha: > 0 Se propone entonces como hiptesis nula

Probabilidad y Estadstica

Pruebas de hiptesis

1 6

H 0: = 0 Estadstico de prueba: La regin de rechazo debe contener valores de que apoyen Ha, > 0. As se elige un C > 0, y se define regin de rechazo: { > 0 + C}. 0 + C valor crtico de la estadstica de prueba (separa la regin de rechazo de la regin de prueba). Si se quiere probar que el parmetro poblacional es menor que un cierto valor 0, Ha: < 0 H0: = 0 Estadstico de prueba: La regin de rechazo debe contener valores de que apoyen Ha, < 0. regin de rechazo: { < 0 C}

En ambos casos se dice que es una prueba estadstica de una extremidad o cola pues la regin de rechazo se localiza en un slo extremo de la distribucin muestral de la estadstica de prueba. Si se quiere probar que el parmetro poblacional es distinto de cierto valor 0, se tendra Ha: 0 H0: = 0 Estadstico de prueba: regin de rechazo: { < 0 C} o { > 0 + C} y se dice que es una prueba estadstica de dos extremidades o colas pues la regin de rechazo se localiza en ambos extremos de la distribucin muestral de la estadstica de prueba.

Probabilidad de un error tipo I. Es la probabilidad de que caiga en la regin de rechazo siendo H0 verdadera. Luego es el rea, correspondiente a la regin de rechazo, bajo la curva de la distribucin muestral de , que es normal con media = 0 y desviacin estndar . En el caso de una prueba de dos colas, a cada mitad de la regin le corresponde una probabilidad / 2. Para pruebas de una cola: Ha: > 0, P({ > 0 + C}) = (ver Figura 7.3, p. 243) < 0 C}) = Ha: < 0, P({ Para pruebas de dos colas: Ha: 0 P({ < 0 C} { > 0 + C}) = P({ < 0 C}) + P({ > 0 + C}) = P({ < 0 C}) = P({ > 0 + C}) = /2 (ver Figura 7.4, p. 243) Probabilidad de un error tipo II. Es la probabilidad de que caiga en la regin de aceptacin siendo H0 falsa. Supongamos que H0 es falsa y que en realidad = a siendo a desconocido. Luego la distribucin muestral de , es normal con media a y desviacin estndar . Con esta distribucin de probabilidad se tiene (ver Figura 7.5, p. 244) Para pruebas de una cola: Ha: > 0, P({ < 0 + C}) = Ha: < 0, P({ > 0 C}) = Para pruebas de dos colas: Ha: 0, P({ 0 C < < 0 + C}) = (ya no hay simetra respecto a 0, sino respecto a a). Si se utiliza como estadstico de prueba la variable z=

que es la desviacin de una variable aleatoria , respecto a 0, expresada en unidades de .

Probabilidad y Estadstica
si

Pruebas de hiptesis

1 7

= P(error tipo I), se pueden reescribir las pruebas anteriores como Prueba estadstica para muestras grandes 1. Hiptesis nula. H0: = 0. 2. Hiptesis alternativa. Prueba de una extremidad (o cola) Ha: > 0 ( < 0) Prueba de dos extremidades (o colas) Ha: 0. 3. Estadstica de prueba. z =

4. Regin de rechazo. Prueba de una extremidad (o cola): z > z (z < ) z z es tal que P(z > z ) = P(z < ) = . z Prueba de dos extremidades (o cola): z > z /2 o z < /2. z z /2 es tal que P(z > z /2) = P(z < /2) = /2. z (ver figuras del recuadro p. 245) Suposicin: Se seleccion una muestra aleatoria de tamao grande n ( 30). En particular se tiene ___________________________________________________________________________ PRUEBA DE HIPTESIS PARA UNA MEDIA POBLACIONAL Prueba estadstica para en el caso de muestras grandes 1. Hiptesis nula. H0: = 0. 2. Hiptesis alternativa. Prueba de una extremidad (o cola) Ha: > 0 ( < 0) Prueba de dos extremidades (o cola) Ha: 0. x 0 x 0 3. Estadstica de prueba. z = = x / n Si no se conoce se sustituye por s. 4. Regin de rechazo. Prueba de una extremidad (o cola): z > z (z < ) z z es tal que P(z > z ) = P(z < ) = . z Prueba de dos extremidades (o cola): z > z /2 o z < /2. z z /2 es tal que P(z > z /2) = P(z < /2) = /2. z Suposicin: Se seleccion una muestra aleatoria de tamao n 30.

Ejemplo. La produccin diaria de una planta industrial qumica registrada durante n = 50 das tiene una media x = 871 toneladas y una desviacin estndar s = 21 toneladas. (a) Probar la hiptesis de que el promedio de la produccin diaria es = 880 toneladas por da contra la alternativa de que es mayor o menor a 880 toneladas por da. Hiptesis nula. H0: = 880. Hiptesis alternativa. Prueba de dos extremidades (o cola) Ha:

880.

Probabilidad y Estadstica
x 0

Pruebas de hiptesis
x 880 x 880 s/ 50 x 880 21 / 50

1 8
x 880 2.97

Estadstica de prueba. z =

/ n

/ 50

Regin de rechazo. Prueba de dos extremidades (o cola): z > z /2 o z < /2. z Si se quiere = 0.05, entonces z /2 = 1.96. Luego Regin de rechazo. z > 1.96 o z < 1.96 (ver Figura 7.6, p. 246) Como x = 871, entonces z = 3.03 que cae en la regin de rechazo. As rechazamos que el promedio de la produccin diaria es = 880 toneladas por da y la probabilidad de equivocarnos es de 5%. Si usramos intervalos de confianza tendramos que el intervalo x z /2 / n 871 5.82 tiene un coeficiente de confianza 1 = 0.95 = 95%. Hay un 95% de probabilidad de que este intervalo contenga a . Entonces rechazaramos = 880 pues no cae en este intervalo. Como x = 871 < 880, se sospechara que en realidad < 880. (b) Cul es la probabilidad de aceptar H0 si el valor real de fuera 870 toneladas?. Regin de aceptacin. 21 21 x 880 z 1.96 ( x 880) 1.96 1.96 + 880 1.96 x 50 50 21 / 50 x de 874.18 a 885.82 es el rea, correspondiente a la regin de aceptacin, bajo la curva normal que tiene 21 media = 870 desviacin estndar x = = 2.97 50 = 0.0793 (ver Figura 7.7, p. 247) As si fuera en realidad 870 toneladas, la probabilidad de aceptar H0: = 880 es 7.9%. ________________________________________________________________________________ PRUEBA DE HIPTESIS PARA LA DIFERENCIA DE DOS MEDIAS POBLACIONALES Prueba estadstica para 1 2 en el caso de muestras grandes 1. Hiptesis nula. H0: 1 2 = D0. 2. Hiptesis alternativa. Prueba de una extremidad (o cola) Ha: 1 2 > D0 ( 1 2 < D0) Prueba de dos extremidades (o cola) Ha: 1 2 D0. 3. Estadstica de prueba. z =

x 1 x 2 D0

x 1 x 2 D0
=
2 12 2 + n1 n2

x x
1

Si no se conocen 1 y 2 se sustituyen por s1 y s2. 4. Regin de rechazo. Prueba de una extremidad (o cola): z > z (z < ) z z es tal que P(z > z ) = P(z < ) = . z Prueba de dos extremidades (o cola): z > z /2 o z < /2. z z /2 es tal que P(z > z /2) = P(z < /2) = /2. z Suposicin: Los dos muestreos son aleatorios e independientes de tamaos n1 30 y n2 30.

Probabilidad y Estadstica

Pruebas de hiptesis

1 9

___________________________________________________________________________ PRUEBA DE HIPTESIS PARA LA PROPORCIN POBLACIONAL Prueba estadstica para p en el caso de muestras grandes 1. Hiptesis nula. H0: p = p0. 2. Hiptesis alternativa. Prueba de una extremidad (o cola) Ha: p > p0 (p < p0) Prueba de dos extremidades (o cola) Ha: p p0. 3. Estadstica de prueba. z =

p p0

p p0 p0 q0 n

4. Regin de rechazo. Prueba de una extremidad (o cola): z > z (z < ) z z es tal que P(z > z ) = P(z < ) = . z Prueba de dos extremidades (o cola): z > z /2 o z < /2. z z /2 es tal que P(z > z /2) = P(z < /2) = /2. z Suposicin: El muestreo aleatorio satisface las caractersticas de un experimento binomial y el tamao de la muestra n 30. ___________________________________________________________________________ PRUEBA DE HIPTESIS PARA LA DIFERENCIA DE DOS PROPORCIONES POBLACIONALES Prueba estadstica para p1 p2 en el caso de muestras grandes 1. Hiptesis nula. H0: p1 p2 = D0. 2. Hiptesis alternativa. Prueba de una extremidad (o cola) Ha: p1 p2 > D0 (p1 p2 < D0) Prueba de dos extremidades (o cola) Ha: p1 p2 D0.

p1 p 2 D0 3. Estadstica de prueba. z = = p1 p2
Como p1 y p2 se desconoce, p1 p 2 Si D0 = 0, z =

p1 p 2 D0

p1 q1 p 2 q 2 + n1 n2

1 1 pq + n1 n 2

x + x2 , donde p = 1 . n1 + n 2

Si D0

p1 p 2 D0 p q 0, z = p1 q1 + 2 2 n1 n2

4. Regin de rechazo. Prueba de una extremidad (o cola): z > z (z < ) z z es tal que P(z > z ) = P(z < ) = . z Prueba de dos extremidades (o cola): z > z /2 o z < /2. z z /2 es tal que P(z > z /2) = P(z < /2) = /2. z Suposicin: Los dos muestreos son aleatorios e independientes, satisfacen las caractersticas de experimentos binomiales y los tamaos de las muestras son n1 30 y n2 30. ___________________________________________________________________________ VALORES p

Probabilidad y Estadstica

Pruebas de hiptesis

1 10

En lo que sigue p no se refiere al parmetro de una poblacin binomial. La probabilidad de un error tipo I, , suele denominarse nivel de significacin asociada a una prueba estadstica. El valor p, es el mnimo nivel de significacin para el cual los datos observados indican que se tendra que rechazar la hiptesis. El mnimo nivel de significacin p se determina en funcin de la mnima regin de rechazo que se puede considerar teniendo en cuenta que se ha observado un determinado valor para la estadstica de prueba. La idea es que un valor observado de la estadstica de prueba distinto al que afirma H0, apoya el rechazo de H0. Por lo tanto, la regin de rechazo debera contener mnimamente este valor observado de la estadstica de prueba. Ejemplo. La produccin diaria de una planta industrial qumica registrada durante n = 50 das tiene una media x = 871 toneladas y una desviacin estndar s = 21 toneladas. Hiptesis nula. H0: = 880. Hiptesis alternativa. Prueba de dos extremidades (o cola) Ha: 880. x 0 x 880 x 880 x 880 Estadstica de prueba. z = = = s / 50 21 / 50 / n / 50 Se tiene el valor x = 871, entonces z = 3.03 es un valor observado de z. Regin de rechazo. Prueba de dos extremidades (o cola): z > z /2 o z < /2. z (Antes se us = 0.05, entonces z /2 = 1.96. Luego Regin de rechazo. z > 1.96 o z < 1.96) Veamos como se determina el valor p de esta prueba. z= 3.03 es un valor observado de z. La regin de rechazo de H 0, a favor de Ha, debera incluir mnimamente este valor, por lo tanto la mnima regin de rechazo posible sera z > 3.03 o z < 3.03 p es la probabilidad de cometer un error tipo I con esta regin de rechazo p = P(z 3.03) + P(z 3.03) = 0.0024. Por lo tanto, al utilizar esta prueba estadstica se elegirn valores de 0.0024.

También podría gustarte