Está en la página 1de 35

Pruebas de hiptesis.

Refs: Apuntes de Estadstica, Mtra Leticia de la Torre Instituto Tecnolgico de Chiuhuahua, Apuntes de Estadstica , Dr. Pedro Juan Rodrguez Esquerdo, Departamento de Matemticas, Recinto de Ro Piedras, Universidad de Puerto Rico

Las secciones anteriores han mostrado cmo puede estimarse un parmetro a partir de los datos contenidos en una muestra. Puede encontrarse ya sea un slo nmero (estimador puntual) o un intervalo de valores posibles (intervalo de confianza). Sin embargo, muchos problemas de ingeniera, ciencia, y administracin, requieren que se tome una decisin entre aceptar o rechazar una proposicin sobre algn parmetro. Esta proposicin recibe el nombre de hiptesis. Este es uno de los tesis aspectos ms tiles de la inferencia estadstica, puesto que muchos tipos de problemas de toma de decisiones, pruebas o experimentos en el mundo de la ingeniera, pueden formularse como problemas de prueba de hiptesis. tesis

Una hiptesis estadstica es una proposicin o supuesto sobre los parmetros de una o ms poblaciones. Suponga que se tiene inters en la rapidez de combustin de un agente propulsor slido utilizado en los sistemas de salida de emergencia para la tripulacin de aeronaves. El inters se centra sobre la rapidez de combustin promedio. De manera especfica, el inters recae en decir si la rapidez de combustin promedio es o no 50 cm/s. Esto puede expresarse de manera formal como dos alternativas o hiptesis: Ho; = 50 cm/s H1; 50 cm/s La proposicin Ho; = 50 cm/s se conoce como hiptesis nula (PENSAR: NO HAY DIFERENCIA) , mientras que la proposicin H1; 50 cm/s, recibe el nombre de hiptesis alternativa (PENSAR: S HAY DIFERENCIA).

Ahora bien, se podra considerar slo un caso en la hiptesis alternativa o sea que la hiptesis alternativa especifique valores de que pueden ser mayores o menores que 50 cm/s, esto tambin se conoce como hiptesis alternativa de dos colas o bilateral. En algunas situaciones, lo que se desea bilateral es formular una hiptesis alternativa unilateral, como en los casos:

Ho; = 50 cm/s H1; > 50 cm/s o Ho; = 50 cm/s H1; < 50 cm/s

Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin o distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del parmetro de la poblacin muestra especificado en la hiptesis nula se determina en una de tres maneras diferentes: 1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces el objetivo de la prueba de hiptesis usualmente es determinar si ha cambiado el valor del parmetro. 2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el proceso bajo estudio. En este caso, el objetivo de la prueba de hiptesis es verificar la teora o modelo.

3. Cuando el valor del parmetro proviene de consideraciones externas tales como las especificaciones de diseo o ingeniera, o de obligaciones contractuales. En esta situacin, el objetivo usual de la prueba de hiptesis es probar el cumplimiento de las especificaciones.

Un procedimiento que conduce a una decisin sobre una hiptesis en particular recibe el nombre de prueba de hiptesis. Los procedimientos tesis de prueba de hiptesis dependen del empleo de la informacin contenida en la muestra aleatoria de la poblacin de inters. Si esta informacin es consistente con la hiptesis, se concluye que sta es verdadera; sin embargo si esta informacin es inconsistente con la hiptesis, se concluye que esta es falsa. Debe hacerse hincapi en que la verdad o falsedad de una hiptesis en particular nunca puede conocerse con certidumbre, a menos que pueda examinarse a toda la poblacin. Usualmente esto es imposible en muchas situaciones prcticas. Por tanto, es necesario desarrollar un procedimiento de prueba de hiptesis teniendo en cuenta la probabilidad de llegar a una conclusin equivocada.

La hiptesis nula, representada por Ho, es la afirmacin sobre una o ms nula Ho caractersticas de poblaciones que al inicio se supone cierta (es decir, la creencia a priori). La hiptesis alternativa, representada por H1, es la afirmacin alternativa contradictoria a Ho, y sta generalmente es la hiptesis a investigar. investigar La hiptesis nula se rechaza en favor de la hiptesis alternativa, slo si la evidencia muestral sugiere que Ho es falsa. Si la muestra no contradice decididamente a Ho, se contina creyendo en la validez de la hiptesis nula. Entonces, las dos conclusiones posibles de un anlisis por prueba de hiptesis son:

Rechazar Ho o No rechazar Ho.

Prueba de una Hiptesis Para ilustrar los conceptos generales, considere el problema anterior de la rapidez de combustin. La hiptesis nula podra ser que la rapidez promedio de combustin es 50 cm/s, mientras que la hiptesis alternativa es que sta no es igual a 50 cm/s. Esto es, como se mencion al principio, lo que se desea probar es: Ho; = 50 cm/s H1; 50 cm/s Supngase que se realiza una prueba sobre una muestra de 10 especmenes, y que se observa cual es la rapidez de combustin promedio muestral. La media muestral es un estimador de la media verdadera de la poblacin. Un valor de la media muestral x que est prximo al valor x hipottico = 50 cm/s es una evidencia de que el verdadero valor de la media es realmente 50 cm/s; esto es, que apoya la hiptesis nula Ho. Por otra parte, una media muestral muy diferente de 50 cm/s constituye una evidencia que apoya la hiptesis alternativa H1. Por tanto, en este caso, la media muestral es el estadstico de prueba.

La media muestral puede tomar muchos valores diferentes. Supngase que si 48.5 x 51.5, entonces no se rechaza la hiptesis nula Ho; = 50 x cm/s, y que si x < 48.5 x >51.5, entonces se acepta la hiptesis alternativa H1; 50 cm/s. Los valores de x que son menores que 48.5 o mayores que 51.5 constituyen la regin crtica de la prueba, mientras que todos los valores x que estn en el intervalo 48.5 x 51.5 forman la regin de aceptacin de la hiptesis nula. Las fronteras entre las regiones crtica y de aceptacin reciben el nombre de valores crticos. ticos La costumbre es establecer conclusiones con respecto a la hiptesis nula Ho. Por tanto, se rechaza Ho en favor de H1 si el estadstico de prueba cae en la regin crtica, de lo contrario, no se rechaza Ho. Puedes ver la similitud de esto con los intervalos de confianza?

Este procedimiento de decisin puede conducir a una de dos conclusiones errneas. Por ejemplo, es posible que el valor verdadero de la rapidez promedio de combustin del agente propulsor sea igual a 50 cm/s. Sin embargo, para todos los especmenes bajo prueba, bien puede observarse un valor del estadstico de prueba x que cae en la regin crtica. En este caso, la hiptesis nula Ho ser rechazada en favor de la alternativa H1 cuando, de hecho, Ho en realidad es verdadera. Este tipo de conclusin equivocada se conoce como error tipo I.

El error tipo I se define como el rechazo de la hiptesis nula Ho cuando sta es verdadera.

Para probar si cometemos un error del tipo I consideramos un nivel de significancia que nos ayuda a determinar la probabilidad de cometer este tipo de error. A este nivel se denomina con la letra . Si tuviramos un nivel de confianza del 95% entonces el nivel de significancia sera del 5%. Anlogamente si se tiene un nivel de confianza del 90% entonces el nivel de significancia sera del 10%.

Ahora supngase que la verdadera rapidez promedio de combustin es diferente de 50 cm/s, aunque la media muestral x cae por error de muestreo dentro de la regin de aceptacin. En este caso se acepta Ho cuando sta es falsa. Este tipo de conclusin recibe el nombre de error tipo II. II A la probabilidad de tener un error de tipo II se denomina con la letra .

El error tipo II se define como la aceptacin de la hiptesis nula cuando sta es falsa.

Tipos de Pruebas de Hiptesis Se pueden presentar dos tipos de pruebas de hiptesis que son: 1. De dos colas, o bilateral.

2.

De una cola, o uniilateral. Este ltimo puede ser de cola derecha o izquierda.

El tipo de prueba depende de lo que se necesite probar. 1. De una cola derecha. El investigador desea comprobar la hiptesis de un valor mayor en el parmetro que el de la hiptesis nula, en este caso el nivel de significancia se carga todo hacia el lado derecho, para definir las regiones de aceptacin y de rechazo. Prueba de hiptesis: Ho; Parmetro x H1; Parmetro > x

2. De una cola izquierda: El investigador desea comprobar la hiptesis de que el parmetro sea menor que el de la hiptesis nula, en este caso el nivel de significancia se carga todo hacia el lado izquierdo, para definir las regiones de aceptacin y de rechazo. Prueba de hiptesis: Ho; Parmetro x H1; Parmetro < x

De dos colas: El investigador desea comprobar la hiptesis de un cambio en el parmetro. El nivel de significancia se divide en dos y existen dos regiones de rechazo. Prueba de hiptesis: Ho; Parmetro = x H1; Parmetro x

Una Regla para Rechazar H0

Seleciona la probabilidad de error tipo I: (nivel de significancia). Encuentra el valor estadstico crtico correspondiente (z en la tabla de la distribucin normal estndar o t en la distribucin t de student). Calcula el valor del estadstico para la muestra Si Z o t cae en el rango crtico z ,t entonces, rechaza H0

EJEMPLOS. 1. Una muestra aleatoria de 100 muertes registradas en Estados Unidos el ao pasado muestra una vida promedio de 71.8 aos. Suponga una desviacin estndar poblacional de 8.9 aos. Queremos probar si la vida media hoy en da es mayor a 70 aos con base en esa muestra. La muestra parecera indicar que es as pero Cul es la probabilidad de que la media de la muestra no refleje la verdadera media de la poblacin? Utilizar un nivel de significancia de 0.05.

Solucin:

Se trata de una distribucin muestral de medias con desviacin estndar conocida. 1.Datos: =70 aos s = 8.9 aos x = 71.8 aos n = 100 = 0.05

2. Establecemos la hiptesis Ho; = 70 aos. H1; > 70 aos. 3. Nivel de significancia = 0.05, z = 1.645 4. Regla de decisin: Si z 1.645 no se rechaza Ho. Si z > 1.645 se rechaza Ho. 5. Clculos:

6. Decisin y justificacin. Como 2.02 >1.645 se rechaza Ho y se concluye con un nivel de significancia del 0.05 que la vida media hoy en da es mayor que 70 aos.

2. Una empresa elctrica fabrica bateras de celular que tienen una duracin que se distribuye de forma aproximadamente normal con una media de 800 horas y una desviacin estndar de 40 horas. Si una muestra aleatoria de 30 bateras tiene una duracin promedio de 788 horas, muestran los datos suficiente evidencia para decir que la duracin media no es 800? Utilice un nivel de significancia del 0.04.

Solucin:

1. Se trata de una distribucin muestral de medias con desviacin estndar conocida. 2. Datos: =800 horas s = 40 horas x = 788 horas n = 30 = 0.04 3. Prueba de hiptesis Ho; = 800 horas H1; 800 horas

3. Nivel de significancia = 0.04, z = 2.052 4. Regla de decisin: Si 2.052 z 2.052 no se rechaza Ho. Si z > 2.052 o z < -2.052 se rechaza Ho. 5. Clculos:

6. Decisin y justificacin Como 2.052 -1.643 2.052 por lo tanto, no se rechaza Ho y se concluye con un nivel de significancia del 0.04 que la duracin media de las bateras no ha cambiado.

3. Ejemplo del uso de la distribucin t de student en pruebas de hiptesis.

1995

Gasto en salud per capita [dlares]


Francia 1,972 Irlanda Alemania 2,134 Italia Grecia 703 Luxemburgo Hungra 562 Holanda Islandia 1,774 Noruega 1,106 1,507 2,206 1,728 1,821 Portugal Espaa Suecia Suiza Reino Unido 1,035 1,075 1,360 2,412 1,246

Austria 1,634 Blgica 1,665 Checoslovaquia 749 Dinamarca 1,368 Finlandia 1,373

Estados Unidos: $3,633 Se desea saber si el gasto per cpita promedio en servicios de salud en estos pases es significativamente menor que el gasto en los Estados Unidos.

La Hiptesis que se plantea es:

H0: = 3,633 Ha: < 3,633 Si H0 es cierta de EU representa la media poblacional de los gastos en salud de los 20 pases. Premisas: varianza poblacional desconocida, usamos entonces la varianza de la muestra como aproximacin s2 = 261,200.79 se calcula con la frmula:

( xi x ) s2 =
n 1

los datos tienen una distribucin normal. los datos son independientes. el tamao de la muestra es < 30

Cmo se efecta la Prueba de hiptesis

Datos: Conociendo:

n = 20, gl = n-1 = 19
x = 1,471.50

= s2 = 511.08

Puede concluirse que < 3,633 y por lo tanto rechazar H0? Lo que se busca es que se debe tener una seguridad razonable de que el valor estimado de = 1,471.50 no ocurri por azar.

Distribucin de la media muestral


Si H0 es cierta la media muestral tendr una distribucin normal con media = $3,633 s= = 114.28 y desviacin estndar muestral n

Se rechaza H0 si

x es mucho menor que 0

Pero cunto es mucho menor?

NOTAR: Que an siendo cierta H0 se pueden observar valores pequeos de x .

Prueba de hiptesis
Para comparar x con 0 usamos ahora la distribucin t. x 0 t=
n
Por qu?

Se rechaza H0 si t es mucho menor que 0. Cunto es mucho menor? Eso nos lo dice el nivel de significancia

Pasos de la Prueba de hiptesis


Si H0 es cierta: P( t < -1.72913) = .05 (t para 19 gl) P( t < -2.09302) = .025 P( t < -2.53948) = .01 En general, si H0 es cierta: P( t < t) = . Donde es: mximo de probabilidad permisible de observar un valor de t muy pequeo cuando H0 es cierta (nivel de significancia). mnimo de evidencia admisible contra H0. probabilidad de error tipo I

Zona de Rechazo

-t.05 = -1.72913
Si t < -1.7293 rechaza H0 al nivel del 5% de significancia P(t<-1.7293) = .05

-1.7293

Efectuando la prueba

x = 1,47150 = 511.08 .
0 = 3,633
t= x 0

n = 20

1471.5 3633 = 18.91 114.28

1471.50 est a 18.91 desv. est. a la izquierda de 3.633!


Como t = -18.91 < -1.72913 = t.05, se rechaza H0 al nivel de significancia del 5%.

Nivel de significancia Cul es el mximo de probabilidad de error tipo I () que estaramos dispuestos a aceptar?
D is t r ib u c i n N ( 0 ,1 )

f(z)

x100%

-4

-3

-2

-1

0 z

Pruebas de Hiptesis en general


Si es conocida, los datos son normales, o aplicamos el Teorema del Lmite Central:

H0: = 0 H0: = 0 H0: = 0


Se compara

Ha: < 0 Ha: > 0 Ha: 0

z=

x 0

con z/2 z

Zona de rechazo
R : e p ic Hae g l a m<ra 0

Hae g l a m>ra R : e p ic0


f(z)

f(z) -4

Z < -z

-3

-2

-1

0 z

-4

-3

-2

-1

0 z

Z > z

R l m r c a Heag :a e p i0

f(z)

Depende de la hiptesis alternativa!

-4

-3

-2

-1

0 z

|Z| > z/2


4

Valor p de la prueba Es la probabilidad de observar un valor extremo de la estadstica a prueba si se supone que la hiptesis nula es cierta. Si H0 es cierta, y la alternativa es Ha: < 0 Cul es la probabilidad de observar z < -19.41?

Ejemplos de valor p Ha : 0
R e g l a e m p r i c a
f(z)

En los casos en que se observa z = 1.43 z = -1.43.


En todos los casos el rea total roja es igual a
R : e p ic Hae g l a m<ra 0

-4

-3

-2

-1

0 z

Hae g l a m>ra R : e p ic0


f(z) f(z) -4 -3 -2 -1 0 z 1 2 3 4 -4

-3

-2

-1

0 z

Z = 1.43

Z = -1.43

Si es desconocida (la desviacin estndar o varianza de la poblacin) Datos normales, desviacin estndar desconocida, n 30. Usa la prueba

t:

x 0 t= s n

Recordando que La estadstica prueba t tiene una distribucin t de student con n-1 grados de libertad. Cuando n > 30, se usa la tabla de la distribucin normal en vez de la t.

También podría gustarte