Está en la página 1de 19

PRUEBA DE HIPÓTESIS

OBJETIVOS

1. Definir que es una hipótesis y una prueba de hipótesis.


2. Describir el procedimiento de la prueba de hipótesis.
3. Identificar si la prueba es unilateral o bilateral.
4. Realizar pruebas de hipótesis respecto a una media poblacional.
5. Realizar pruebas de hipótesis respecto a una proporción poblacional.
2.1. INTRODUCCION.
Se conoce como prueba de hipótesis a una rama de la Estadística inferencial que podría
verse como un procedimiento especial de toma de decisiones.

LA PRUEBA DE HIPOTESIS COMO UN PROBLEMA DE DECISION.


El problema de decisión a estudiar tendrá:

i) 2 estados de la naturaleza mutuamente excluyentes y exhaustivos (Hipótesis).


Cualquiera de las hipótesis será una negación de la otra.

ii) 2 cursos de acción (Alternativas).

EJEMPLO

Al juzgar a una persona por asesinato, se presume que el acusado es inocente, es decir
no culpable, hasta que se demuestre lo contrario, según la justicia conservadora.

La situación anterior implica que estamos en presencia de un problema de decisión a


resolver que tiene 2 hipótesis que definiremos así:

Inocente
Culpable

Hipótesis estadística.
Le llamaremos hipótesis estadística a un supuesto que se hace acerca del valor de un
parámetro de una población o acerca de valores de parámetros que corresponden a distintas
poblaciones.

EJEMPLO 2.2

Supongamos que cierta región del país cuenta con 200 plantaciones donde se cultiva maíz
sin hacer uso de ningún abono. Por muchos años el rendimiento promedio ha sido de 44
quintales por manzana. El MAG está tratando de convencer a los agricultores de la
aplicación de cierto fertilizante, lo que significaría un mayor rendimiento promedio y por lo
tanto un mejor beneficio económico. A manera de prueba los agricultores usaron el
fertilizante en 36 plantaciones seleccionadas aleatoriamente, obteniéndose un rendimiento
promedio de 47.30 quintales por manzana y una desviación estándar de 6.60 quintales por
manzana.
¿Debemos aplicar el fertilizante a un nivel de significación del 5%?

En este problema los elementos a estudiar son las plantaciones y la característica de


interés X será el rendimiento de las plantaciones en quintales por manzana. Estaremos
interesados en suposiciones que se hagan acerca de la media poblacional  que
representará el rendimiento promedio de las plantaciones.

Observemos que estamos ante un problema de decisión con 2 hipótesis que definimos así:

 = 44
  44

y 2 alternativas que definimos así:

No aplicar el fertilizante.
Aplicar el fertilizante.

Ahora trataremos de desarrollar un procedimiento general de la prueba porque, en


principio, todas las pruebas estadísticas son similares a las que vamos a estudiar en este
tema.

PROCEDIMIENTO DE LA PRUEBA DE HIPOTESIS

Una prueba de hipótesis será un procedimiento en el cual una de las hipótesis que
llamaremos nula se probará contra otra hipótesis que llamaremos alterna, tomando como
base la información proporcionada por una muestra aleatoria, la cual nos permitirá poder
rechazar o no rechazar la hipótesis nula, con el fin de poder seleccionar la alternativa
más adecuada.

Debido al gran parecido que tiene este procedimiento en la manera de razonar con el
empleado en un juicio, retomaremos el ejemplo 2.1 como una motivación al tema.

1. Supongamos que la presunción de inocencia es la hipótesis nula y que la


culpabilidad es la hipótesis alterna. Esto es probaremos las hipótesis:

Inocente
Culpable

2. El juicio presenta 4 situaciones presentadas abajo


Altenativas Estados de la naturaleza
Inocente es V Culpable es
V
Dejarlo libre Correcta Error II
Echarlo preso Error I Correcta

donde pueden cometerse dos tipos de errores:

Error I: Echarlo preso cuando en realidad es inocente.


Error II: Dejarlo libre cuando en realidad es culpable.

¿Cuál de los dos tipos de error se considera más grave?

Naturalmente el error tipo I, motivo por el cual se quiere que la probabilidad de caer en este
error I sea mínima. Por tanto mantendremos la probabilidad de caer en este error I debajo
de una frontera, sin preocuparnos por la probabilidad de caer en el error II.

3. Antes de investigar al acusado las leyes tienen establecida la siguiente regla de


decisión:

i) Si rechazamos la hipótesis nula de inocencia entonces estamos aceptando la hipótesis


alterna de culpabilidad.
ii) Si no podemos rechazar la hipótesis nula de inocencia, entonces “aceptamos” la
hipótesis nula de inocencia.

4. Ahora la acusación trata de recoger y presentar suficiente evidencia (documentos,


testigos oculares, huellas dactilares, retratos hablados, etc) para que sea valorada por el
jurado.

5. Finalmente con la evidencia ya valorada se aplica la regla de decisión que nos permitirá
seleccionar la alternativa más adecuada.

i) Si el jurado valora que hay suficiente evidencia para rechazar la hipótesis nula de
inocencia entonces estamos aceptando la hipótesis alterna de culpabilidad lo cual
implica que debemos seleccionar la alternativa de echarlo preso.

ii) Si el jurado valora que no hay suficiente evidencia para rechazar la hipótesis nula de
inocencia entonces “aceptamos” la hipótesis nula de inocencia, pero débilmente
porque talvez la acusación fue deficiente en la recolección de evidencias, lo cual
implica seleccionar la alternativa de dejarlo libre o bien no tomar ninguna
alternativa y reanudar el jucio en otra ocación.

2.2 PROCEDIMIENTO DE LA PRUEBA ACERCA DE .

Para fines de estudio consideraremos la prueba de hipótesis dividida en los siguientes


pasos:

1. FORMULACION DE LAS HIPOTESIS.


Consiste en especificar las hipótesis e indentificar a una de ellas como la hipótesis nula y a
la otra como las hipótesis alterna.

 Hipótesis nula.
La hipótesis nula será generalmente la que afirma en los problemas ausencia de efecto
alguno para determinadas acción o tratamiento y la denotaremos por Ho.

Como esta hipótesis es la que siempre debe especificarse en una forma más exacta, el signo
= siempre la acompañará.

 Hipótesis alterna.
A cualquier hipótesis que diga lo contrario de la hipótesis nula, esto es que hay presencia
del efecto para la acción o tratamiento, la llamaremos hipótesis alterna y la denotaremos
por H1.

Como esta hipótesis es generalmente especificada con menos exactitud, los signos  ,  o
 la acompañan.

Para el ejemplo 2.1 en que se juzga a una persona por asesinato, podemos ver el juzgar
como la acción y la culpabilidad como el efecto. Por tanto podemos escribir.

H0 : Inocente o no es culpable A0 : Dejarlo libre


H1 : Culpable A1 : Echarlo preso

donde la hipótesis nula H0 está suponiendo ausencia de culpabilidad mientras que la


hipótesis alterna H1 supone presencia de culpabilidad.
Para el ejemplo 2.2 podemos ver la fertilización de las plantaciones como la acción y el
aumento de rendimiento promedio con respecto a 44 como el efecto. Por tanto podemos
escribir.

H0 :  = 44 A0 : No aplicar el
fertilizante
H1 :   44 A1 : Aplicar el fertilizante

donde la hipótesis nula H0 está suponiendo que no hay aumento en el rendimiento


promedio, mientras que la hipótesis alterna H1 supone que hay aumento en el rendimiento
promedio.

La aceptación de cada una de las hipótesis anteriores tendrá asociada una alternativa.
A la aceptación de H0 le corresponderá la alternativa A0 y a la aceptación de H1 le
corresponderá la alternativa A1

 Tipos de pruebas.
De acuerdo a la forma en que pueden estructurarse las hipótesis tendremos:

1) Pruebas unilaterales.
Son aquellas en las cuales la presencia del efecto en la hipótesis alterna se traduce como un
interés por sólo las desviaciones hacia un lado con respecto a un valor supuesto 0 de 

i) Pruebas de cola izquierda ii) Pruebas de cola derecha


H0 :  = 0 (   0 ) H0 :  = 0 (   0 )
H1 :   0 H1 :   0

Note que la hipótesis nula puede también especificarse de una manera menos exacta como
  0 o   0.

2) Pruebas bilaterales.
Son aquellas en las cuales la presencia del efecto en la hipótesis alterna se traduce como un
interés por las desviaciones tanto hacia la izquierda como hacia la derecha con respecto a
un valor supuesto 0 de 

H0 :  = 0
H1 :   0

Para el ejemplo 2.2 observe que la prueba es de cola derecha porque sólo nos interesan
los aumentos en el rendimiento promedio con respecto a 44.
2. ELEGIR UN NIVEL DE SIGNIFICACION

En el procedimiento de la prueba pueden presentarse 4 situaciones indicadas por la


siguiente tabla.

Altenativas Estados de la naturaleza


H0 es V H1 es V
Seleccionar A0 Correcta Error II
Seleccionar A1 Error I Correcta

donde puede observarse que se pueden cometer dos tipos de errores.

Error I : Seleccionar A1 cuando H0 es V


Error II : Seleccionar A0 cuando H1 es V

A la probabilidad máxima de cometer el error I le llamaremos nivel de significación de la


prueba y la denotaremos por . Esto es

P ( error I )  

La probabilidad máxima de cometer un error II, la denotaremos por . Esto es

P ( error II )  

 y  representan los riesgos máximos asociados con alternativas incorrectas.

Los valores  y  son probabilidades condicionales que están estrechamente relacianadas.


Cuando el tamaño de la muesta n es fijo,  y  varían inversamente, esto es, cuando nos
alejamos de un peligro aumentamos el otro. La prueba se llevará acabo controlando  sin
preocuparnos por .

¿Cómo se hará la elección de ?

Generalmente el error I es más grave que el error II, razón por la cual le daremos a  un
valor pequeño, usualmente se toma
 = 0.01 ó  = 0.05 según el caso

En casos en que las consecuencias de cometer un error I son muy graves debemos tomar 
= 0.01 (ó un riesgo aún menor).
Si las consecuencias de cometer el error I no son tan graves podemos tomar  = 0.05 ( ó un
riesgo aún mayor).

Para el ejemplo 2.2

Observemos que el procedimiento de la prueba presenta 4 situaciones indicadas abajo.

Altenativas Hipótesis
H0 :  = 44 es V H1 :   44 es
V
A0: No aplicar el Correcta Error II
fertilizante
A1: Aplicar el fertilizante Error I Correcta

donde podemos observar que:

Error I : Aplicar el fertilizante cuando en realidad no aumenta el rendimiento promedio de


maíz.
Error II : No aplicar el fertilizante cuando en realidad aumenta el rendimiento promedio
de maíz.

Restringiremos el error I suponiendo que

P ( error I )  0.05
Así que hemos elegido un nivel de significación  = 0.05

3. IDENTIFICAR EL ESTADISTICO DE PRUEBA Y ESTABLECER UNA


REGLA DE DECISIÓN.
Si observamos el ejemplo 2.2 notamos que hay una diferencia entre la media muestral X y
el valor supuesto μ 0 , esto es, existe una diferencia que expresamos así X - 0 = 47.30 – 44
= 3.30 quintales por manzana.
La hipótesis nula H0 como representa ausencia de efecto de una acción determinada
mantendrá que la diferencia X - 0 no es significativa.
La hipótesis alterna H1 como representa presencia de efecto de la acción mantendrá que la
diferencia X - 0 es significativa.

¿Cómo saber si esta diferencia X - 0 es significativa o no es significativa ?

Como las hipótesis son suposiciones acerca de  , el estadístico de prueba que utilizaremos
será la media muestral X pero estandarizada, esto es, la diferencia X - 0 expresada en
unidades del error estándar de X , lo cual expresamos así
X  
X

que puede ser igual al estadístico Z o t según la tabla que presentamos abajo.

DISTRIBUCION DE LA POBLACION
Tamaño Normal No Normal
de
muestra n  conocido  desconocido  conocido  desconocido

n  30 Z t

n  30 Z Z Z Z

Esto significa que el valor del estadístico de prueba Z o t se obtendrá de una muestra de
tamaño n y representará en una prueba de hipótesis una diferencia que puede ser
considerada significativamente distinta de cero o no significativamente distinta de cero.
¿Pero cómo sabremos si esta diferencia Z o t es significativamente distinta de cero o no?
Por el momento diremos simplemente si Z o t está suficientemente alejada de cero.
Estableceremos un valor de referencia o valor crítico que dependerá del tipo de prueba y
del nivel de significación 

 Prueba de cola derecha


La diferencia Z es considerada significativamente distinta de cero si existe un valor crítico
z tal que Z  z donde z se determina de P( Z  z ) =  utilizando la tabla Z y su
propiedad de simetría, o bien la diferencia t es considerada significativamente distinta de
cero si existe un valor crítico t tal que t  t donde t se determina de P( t  t ) = 
utilzando la tabla t.

Esto quiere decir que Z o t está suficientemente “alejado” de cero si cae a la derecha de z
o t según se observa en la figura de abajo

Z o
t
0 z
t
NR R

Figura 2.2

Como decir que Z es significativamente distinto de cero es equivalente a decir que


rechazamos H0

La regla de decisión dirá: Rechazamos H0 a un nivel de significación  si

Z  z o t  t

En caso contrario no rechazaremos H0, es decir, "aceptamos" H0

 Prueba de cola izquierda


La diferencia Z es considerada significativamente distinta de cero si existe un valor crítico
-z tal que Z < - z donde -z se determina de P( Z < -z ) =  utilizando la tabla Z,
o bien la diferencia t es considerada significativamente distinta de cero si existe un valor
crítico -t tal que t < -t donde -t se determina de P( t < -t) =  utilizando la tabla t y su
propiedad de simetría.
Esto quiere decir que Z o t está suficientemente “alejado” de cero si cae a la izquierda de -
z o -t según se observa en la figura de abajo

Z o
t
-z 0
-t
R NR

Figura 2.1

Por tanto la regla de decisión dirá: Rechazamos H0 a un nivel de significación  si

Z  - z o t  - t

En caso contrario no rechazaremos H0 , es decir, "aceptamos" H0

Para cada nivel de significación  que nos fijemos en una prueba de una cola existirá un
valor crítico que dividirá el rango de Z o t en dos regiones disjuntas, una región de no
rechazo o “aceptación” y otra de rechazo.

 Prueba de dos colas


La diferencia Z es considerada significativamente distinta de cero si existen dos valores
críticos -z/2 y z/2 tales que Z  -z/2 o Z  z/2 donde -z/2 o z/2 se determinan
-z/2  z/2 
respectivamente partiendo de P( Z < ) = 2 o P(Z  ) = 2 , utilizando la tabla Z
y su propiedad de simetría, o bien la diferencia t es considerada significativamente distinta
de cero si existen dos valores críticos -t/2 y t /2 tales que t  -t/2 o t  t /2 donde -t/2
t /2 t /2 
y se determinan de P(t  ) = 2 utilizando la tabla t y su propiedad de simetría.
Esto quiere decir que Z o t está suficientemente “alejado” de cero si cae a la izquierda de
-z/2 o a la derecha de z/2 ( a la izquierda de -t/2 o a la derecha de t /2 ) según se observa
en la figura de abajo
α
2

2
α
2

Z o
t
- z/2 0 z/2
- t/2 t/2
R NR R

Fig. 2.3

Por tanto la regla de decisión dirá: Rechazamos H0 a un nivel de significación  si

Z  -z/2 o Z  z/2 o bien t  -t/2 o t  t /2

En caso contrario no rechazaremos H0, es decir, "aceptamos" H0

Para cada nivel de significación  que nos fijemos en una prueba de dos colas existirán 2
valores críticos que dividirán el rango de Z o t en tres regiones disjuntas, una región de no
rechazo o “aceptación” y dos regiones de rechazo.

Las reglas de decisión para probar H0 :  = 0 (   0 ,   0 ) contra H1 , pueden


resumirse en la siguiente tabla.

Reglas de decisión
Tipo de Estadístico Z Estadístico t
Prueba según H1 Rechazo H0 si Rechazo H0 si
Cola derecha   0 Z  z t  t
Cola izquierda   0 Z  - z t  - t
Dos colas   0 Z  - z/2 o Z  z/2 t  - t/2 o t  t/2

En caso contrario diremos que no podemos rechazamos H0 ,es decir, “aceptamos” H0.
Cuando a partir de la información muestral H0 sea rechazada con un nivel de significación
 = 0.05, diremos que el resultado de la prueba fue significativo, esto es, que si hicieramos
un muestro repetido podríamos esperar que sólo en 5 ocaciones de 100 cometeriamos el
error I, en otras palabras se tendría un 95% de confianza de que se tomó la alternativa
adecuada.

Cuando H0 sea rechazada a un nivel  = 0.01 diremos que el resultado fue altamente
significativo.

Para ejemplo 2.2


Para una población no normal con  desconocido y n  30 le corresponde una casilla con
Z en la tabla, por tanto el estadístico de prueba será:

X  
Z = ̂ X

Como la prueba es de cola derecha y el nivel de significación es  = 0.05


El valor crítico z se determina de P( Z  z ) =  = 0.05, pero como la tabla de la
distribución de Z sólo proporciona valores de z que tiene a su izquierda el área acumulada
que señala dicha tabla, determinemos el valor z de P( Z < z) = 1 -  = 0.95 así

Los valores más cercanos a 0.95 son 0.9495 y 0.9505. Tomaremos 0.9505 al cual le
corresponde

z = 1.65

Es decir que Z es significativamente distinto de cero si cae a la derecha de 1.65 según se


observa en la figura de abajo

0.05
Z
0 1.65
NR R

Fig. 2.4

Por tanto la regla de decisión dirá:

Rechazo H0 :  = 44 a un nivel de significación  = 0.05 si Z  z = 1.65


En caso contrario no rechazo H0 :  = 44 . “Acepto” H0 :  = 44.

4. TOMAR UNA MUESTRA ALEATORIA Y DETERMINAR EL VALOR DEL


ESTADISTICO DE PRUEBA.
Es importante destacar que la muestra se selecciona después de haber establecido la regla
de decisión. Con la información muestral vamos a valorar el estadístico de prueba

X  
X que puede ser igual a Z o t

Para el ejemplo 2.2.


De una muestra aleatoria de tamaño n = 36 plantaciones se obtuvo un rendimiento
promedio y una desviación estándar dados por
X = 47.30 qq/mz
S = 6.60 qq/mz

Como la población es finita de tamaño N = 200 plantaciones.


El valor del estadístico de prueba es

X   ̂ X S N - n 6.60 200 - 36
Z = ̂ X donde = n N -1 = 36 199 = 0.9986

47.30 - 44 3.30
Así que Z = 0.9986 = 0.9986 = 3.3046
5. SELECCIONAR UNA ALTERNATIVA.

Ahora estamos listos para aplicar la regla de decisión que nos permitirá seleccionar la
alternativa más adecuada.

 Si el valor del estadístico de prueba Z o t cae en la región de rechazo entonces diremos


que
rechazamos H0 a un nivel , esto es, que aceptamos H1
Luego debemos seleccionar la alternativa correspondiente a la aceptación de H1 que es A1
con un nivel de confianza del ( 1 -  ) 100%.

 Si el valor del estadístico de prueba Z o t cae en la región de no rechazo o “aceptación”


entonces diremos que no hay suficiente evidencia para rechazar H0, esto es, “ aceptamos
“ H0 , pero débilmente.
Luego podemos seleccionar la alternativa correspondiente a la aceptación de H0 que es A0

Para el ejemplo 2.2

Como Z = 3.3046, cae en la región de rechazo

Rechazamos H0 :  = 44 a un nivel  = 0.05 ,esto es, aceptamos H1 :   44.

Luego debemos seleccionar la alternativa A1 de aplicar el fertilizante con un nivel de


confianza de 95%.

EJEMPLO 2.3
Suponga que se tiene un proceso de producción de llenado de cajas de cereal del cual se
supone que el peso neto de cereal en las cajas tiene una distribución normal, y que además,
proporciona un peso neto promedio de cereal en las cajas de 2 libras.
Puesto que este proceso está sujeto a inspecciones periódicas por representantes de la
Oficina local de protección a los consumidores, quienes únicamente les interesa la “falta de
peso” en los productos, se tomó una muestra aleatoria de 6 cajas obteniendo los siguientes
pesos netos en libras.

1.85 , 2.10 , 1.95 , 1.83 , 2.18 , 1.97

¿Existe evidencia suficiente para decir que el proceso no está funcionando correctamente a
un nivel de significación del 1%?

1. FORMULACION DE LAS HIPOTESIS


En este problema los elementos a estudiar son las cajas de cereal y la característica de
interés X será el peso neto de cereal en las cajas. Estaremos interesados en suposiciones
que se hagan acerca de la media poblacional  que representará el peso neto promedio de
las cajas.
Podemos ver el proceso de producción de llenado de las cajas como la acción y la
disminución de peso neto promedio de los productos con respecto a las 2 lbs como el
efecto.

Por tanto podemos escribir.

H0 :  = 2 El proceso está funcionando correctamente

H1 :   2 El proceso no está funcionando correctamente

donde H0 :  = 2 está suponiendo que no hay disminución del peso neto promedio con
respecto a las 2 lbs mientras que la hipótesis alterna H1 :   2 supone que hay
disminución del peso neto promedio con respecto a las 2 lbs.

Observe que la prueba es de cola izquierda porque sólo nos interesan las disminuciones en
el peso neto promedio con respecto a 2.

2. ELEGIR UN NIVEL DE SIGNIFICACION.

La prueba presenta 4 situaciones indicadas abajo.

Altenativas Hipótesis
H0:  = 2 es V H1:   2 es
V
El proceso está funcionando correctamente. Correcto Error II
El proceso no está funcionando Error I Correcto
correctamente.

donde el error I consiste en decir que el proceso no está funcionando correctamente


cuando en realidad el proceso está llenando las cajas con un peso neto promedio de 2 lbs.
Controlaremos el error I suponiendo que

P ( error I )  0.01 Así que hemos elegido un nivel de significación  = 0.01

3. IDENTIFICAR EL ESTADISTICO DE PRUEBA Y ESTABLECER UNA REGLA


DE DECISION.

Para una población normal con  desconocida y n  30 le corresponde el estadístico de


prueba t dado por
X  
t = ̂ X

Como la prueba es de cola izquierda y  = 0.01


El valor crítico -t  se determina de P( t < -t ) =  = 0.01, pero como la tabla de la
distribución de t sólo proporciona valores de t que tiene a su derecha el área acumulada que
señala arriba dicha tabla, apliquemos su propiedad de simetría para determinar el valor
positivo t  de P( t > t  ) =  = 0.01 así

Para  = 0.01 y n - 1 = 6 - 1 = 5 g.l.

t  = 3.365 y su opuesto será - t  = - 3.365

Es decir que t es significativamente distinto de cero si cae a la izquierda de - 3.365 según se


observa en la figura de abajo

0.01

- 3.365 0 t

R NR

Fig. 2.5

Por tanto la regla de decisión dirá:

Rechazo H0 :  = 2 a un nivel de significación  = 0.01 si t  - t  = - 3.365


En caso contrario no rechazo H0 :  = 2, es decir “acepto” H0 :  = 2
4. TOMAR UNA MUESTRA ALEATORIA Y DETERMINAR EL VALOR DEL
ESTADISTICO DE PRUEBA.

El análisis de la información muestral proporcionada por n = 6 cajas se da a continuación.

Xi Xi 2

1.85 3.4225
2.10 4.4100
1.95 3.8025
1.83 3.3489
2.18 4.7524
1.97 3.8809
11.88 23.6172

X 
 Xi 
11.88
 1.98 lbs.
n 6

  Xi 2  11.88 2
 Xi 2
-
n
23.6172 -
6
S2  
n -1 5

0.0948
S2   0.01896  S  0.01896  0.1377 lbs
5

Como la población se considera infinita el valor del estadístico de prueba es:

X   X -  1.98 - 2.00 - 0.02


t = ˆ X = S/ n = 0.1377 / 6 = 0.0562 = - 0.3559

5. SELECCIONAR UNA ALTERNATIVA.


Como t cae en la región de no rechazo diremos que no hay suficiente evidencia para
rechazar H0 :  = 2 , es decir, “aceptamos” H0 :  = 2. Luego debemos seleccionar la
alternativa que dice que el proceso de producción está funcionando correctamente.

También podría gustarte