Está en la página 1de 46

Prueba de Hipótesis

Parte I

Cuatrimestre I 2020 Dr. Osmar Vera !1


Hemos visto:

➢Estimación puntual de un parámetro,θ

➢Estimación por IC para un parámetro,θ

Veremos ahora:
➢Contrastes ó comparaciones para ≠ θ

Cuatrimestre I 2020 Dr. Osmar Vera !2


Ejemplo 1: Una empresa de transportes gasta 20 litros
de nafta en promedio cada 200 km, con un desvío de 20
km. Le ofrecen una nueva nafta que según el vendedor
aumentará el rendimiento.

¿Qué hago? ¿Cambio o me quedo con la vieja opción?

Cambiaré en el caso que la nueva nafta aumente


REALMENTE EL RENDIMIENTO

¿Qué procedimiento sigo para tener cierta


“seguridad” en la decisión que tome ?

Cuatrimestre I 2020 Dr. Osmar Vera !3


Tomo una muestra de 25 camiones, les cargo la
nueva nafta y mido el rendimiento promedio.

Observo que en promedio los camiones hacen 220


km con 20 litros!!! Con la vieja nafta hacían 200 km
cada 20 litros!!

¿Existe suficiente evidencia muestral como para


afirmar que la nueva nafta AUMENTA EL
RENDIMIENTO PROMEDIO??

Cuatrimestre I 2020 Dr. Osmar Vera !4


Entonces, en esta situación debemos decidir
entre dos conclusiones ó pretensiones
contradictorias:

«La nueva nafta «La nueva nafta SI


NO aumenta el aumenta el
rendimiento rendimiento
promedio» promedio»

Los métodos para realizar esta toma


de decisión comprenden una parte de
la inferencia estadística, llamada
Prueba de hipótesis.

Cuatrimestre I 2020 Dr. Osmar Vera !5


Existe una analogía conocida del razonamiento en las pruebas
de hipótesis con el que se hace en un juicio criminal.
Una pretensión es la aseveración de que el individuo acusado
es inocente. Esta es la pretensión que inicialmente se cree que
es cierta.

HIPOTESIS INICIAL: EL INDIVIDUO ES INOCENTE

HIPOTESIS ALTERNATIVA: EL INDIVIDUO ES CULPABLE

Sólo frente a una fuerte evidencia que diga lo contrario el


jurado deberá rechazar esta pretensión de inocencia,
a favor de la aseveración alternativa de que el
acusado es culpable.

Cuatrimestre I 2020 Dr. Osmar Vera !6


Entonces, en el juicio criminal, la hipótesis favorecida es
la de inocencia!
Se sospecha que el acusado es culpable (por algo llegamos a
un juicio). Permanecerá inocente hasta que la evidencia pruebe
lo contrario.

La prueba de hipótesis estadística funciona de la misma


forma:

La pretensión inicial que es la favorecida no será


rechazada a favor de la pretensión alternativa a menos
que la evidencia muestral la contradiga y apoye
fuertemente la aseveración alternativa.

Cuatrimestre I 2020 Dr. Osmar Vera !7


Entonces, en nuestro ejemplo:
Hipótesis inicial: rendimiento promedio de la nueva
nafta = rendimiento promedio de la nafta actual
Hipótesis de
No Cambio.
Contradictorias

Hipótesis alternativa: rendimiento promedio de la nueva


nafta es mayor que el rendimiento promedio actual.

Hipótesis que
se sospecha.

Cuatrimestre I 2020 Dr. Osmar Vera !8


Un método conservador es identificar,
Hipótesis inicial: H0

Hipótesis alternativa: H1

En nuestro ejemplo: Se carga la nueva nafta en 25


camiones y se define la variable aleatoria,
X: distancia recorrida por un camión con 20 litros de la
nueva nafta. E(X)=µ
H0: µ = 200 El MISMO rendimiento que con la nafta anterior

H1: µ > 200 MEJOR rendimiento que con la nafta anterior

Cuatrimestre I 2020 Dr. Osmar Vera !9


DEFINICIÓN:
La hipótesis nula denotada con H0, es la pretensión que
inicialmente se supone cierta (la creencia previa). La hipótesis
alternativa H1 (generalmente la hipótesis de trabajo o la que el
investigador quiere probar), es la afirmación contradictoria de
H0.

La hipótesis nula será rechazada a favor de la hipótesis alternativa


solo si la evidencia muestral sugiere que H0 es falsa. Si la muestra
no contradice fuertemente a H0, se continuará creyendo en la
verdad de la hipótesis nula. Las dos posibles conclusiones
derivadas de una prueba de hipótesis son entonces

RECHAZAR H0 O NO RECHAZAR H0 .

Cuatrimestre I 2020 Dr. Osmar Vera !10


Los pasos de este procedimiento:

Hipótesis de trabajo.
Hipótesis estadísticas.
Regla de decisión, se basará en…
Estadístico de prueba, cuya distribución se conoce.
Zona de rechazo, de modo tal que si el estadístico
observado en la muestra pertenece a esta región,
se rechaza H0 .

Cuatrimestre I 2020 Dr. Osmar Vera !11


En nuestro ejemplo: Se carga la nueva nafta en 25
camiones.
X: distancia recorrida por un camión con 20 litros de la
nueva nafta. Si quiero analizar el rendimiento
medio de la nafta nueva, EL
H0: µ = 200 ESTADISTICO DE LA PRUEBA SERÁ EL
H1: µ > 200 ESTIMADOR PUNTUAL DE μ
" , .
Bajo H0

Si al calcular en la muestra de
los 25 camiones, ese valor se
µ = 200 aleja mucho de µ, entonces
RECHAZARÉ H0
¿Cuán lejos deberá estar?
Cuatrimestre I 2020 Dr. Osmar Vera !12
Por un lado tenemos la realidad (que H0 sea
Verdadera o Falsa) y por otro lado tenemos el
hecho de Rechazar H0 o no Rechazar H0
debido a la evidencia muestral.

Entonces, podemos cometer errores:


Rechazar H0 No Rechazar H0
H0 es V Error Tipo I Correcto
H0 es F Correcto Error Tipo II

La base para elegir la región de rechazo radica en la


consideración de los errores que se pueden presentar
al sacar una conclusión.
Cuatrimestre I 2020 Dr. Osmar Vera !13
El mejor de los mundos sería realizar un proceso de
prueba sin cometer errores.
Analicemos cual de los dos errores sería el mas grave.

Rechazar H0 No Rechazar H0

H0 es V Error Tipo I Correcto


H0 es F Correcto Error Tipo II
Llamemos:
Error de Tipo I = error de la acción.
Error de Tipo II = error de la inacción.

α = P(cometer error de tipo I)


β = P(cometer error de tipo II)

Cuatrimestre I 2020 Dr. Osmar Vera !14


¿Alguno de estos dos errores será mas grave?
α = P(cometer error de tipo I)
β = P(cometer error de tipo II)
Entonces vamos a minimizar:
α = P(cometer error de tipo I)=P(Rechazar H0 cuando H0
es Verdadera) = Nivel de significación de la Prueba
β = P(cometer error de tipo II)=P(No rechazar H0 cuando H0
es falsa)
Rechazar H0 No Rechazar H0

H0 es V Error Tipo I Correcto


H0 es F Correcto Error Tipo II

Cuatrimestre I 2020 Dr. Osmar Vera !15


En nuestro ejemplo una prueba para la media de una
población Normal con σ
" conocida.
H0: µ = 200 Con un nivel de significación α
" lo más
H1: µ > 200 chico posible.
Graficamente,

Hay dos distribuciones para : cuando H0 es V y otra cuando


H0 es F Bajo: H0 V Bajo: H0 F

µ=200 µ>200

Cuatrimestre I 2020 Dr. Osmar Vera !16


Si rechazo H0 es porque la muestra me indica que los
valores de la media se alejan del valor de la hipótesis
nula o sea se alejan de 200 para los valores grandes
positivos.

α estará ubicado en la zona que determina la hipótesis


alternativa, o sea en este caso hacia la derecha.
Bajo H0 V
α

µ=200

Cuatrimestre I 2020 Dr. Osmar Vera !17


Bajo H0 V

Zona de No rechazo de H0

Zona de Rechazo de H0

µ=200
µ=200
Bajo H0 F

µ>200

Cuatrimestre I 2020 Dr. Osmar Vera !18


Volviendo a nuestro Bajo: H0 V
Zona de No rechazo de H0 α
problema:
Zona de Rechazo
H0: µ = 200 de H0
H1: µ > 200
µ=200

Minimicemos:
α = P(cometer error de tipo I)=P(Rechazar H0 cuando H0
es Verdadera) = Nivel de significación de la Prueba

Cuatrimestre I 2020 Dr. Osmar Vera !19


Entonces, α = P(Rechazar H0 / H0 es Verdadera)

Gráficamente: Bajo H0 V
Zona de No rechazo de H0 α = pequeño
Zona de Rechazo
de H0

µ=200

Dos formas equivalentes de determinar la


zona de Rechazo de H0

Cuatrimestre I 2020 Dr. Osmar Vera !20


σ Respecto de
n
Bajo H0 V

Zona de No rechazo de H0
α = pequeño
Zona de Rechazo de H0

µ=200
µ=200

Respecto de Z
α = pequeño
Zona de
Rechazo de H0
Z
µ=0 Zα =?

Cuatrimestre I 2020 Dr. Osmar Vera !21


Respecto de Z

El estadístico de la prueba es , estandarizando resulta:

α = 0.05
Zona de
Rechazo de H0

Con µ0=200, σ=20, µ=0


z Z0.05 = 1.64

Zona de Rechazo = { z / z > 1.64} = [1.64; +∞)

Rechazo H0!!
EObservado ∈ Zona de Rechazo

Cuatrimestre I 2020 Dr. Osmar Vera !22


Respecto de Rechazare H0 si resulta muy grande!

Despejando,

RECHAZARÉ H0 si al calcular x α = 0.05


Zona de
e n l a m u e s t ra d e l o s 2 5
Rechazo de H0
camiones, ese valor
supera206.56
µ=200

Rechazo H0!!

Cuatrimestre I 2020 Dr. Osmar Vera !23


Pasos para una Prueba de Hipótesis

1. Definir la variable aleatoria en estudio.


2. Plantear las hipótesis de trabajo.
3. Hacer las suposiciones necesarias.
4. Plantear las hipótesis, H0 y H1.
5. Definir el Estadístico de prueba: E.
6. Dar la distribución del Estadístico E si H0 es
Verdadera.
7. Establecer la región de rechazo de la prueba fijado
α.
8. Calcular el Estadístico Observado y decidir.
9. Interpretar el resultado.

Cuatrimestre I 2020 Dr. Osmar Vera !24


En general, TEST DE GAUSS PARA LA MEDIA DE
UNA POBLACIÓN NORMAL CON σ2 CONOCIDO

Hipótesis del problema


1 2 3

H0: µ = µ0 H0: µ = µ0 H0: µ = µ0


H1: µ > µ0 H1: µ < µ0 H1: µ ≠ µ0

Estadístico de la prueba

Para un nivel de significación α rechazo H0 si EObservado ∈ Zona de Rechazo

Cuatrimestre I 2020 Dr. Osmar Vera !25


1 2 3
H0: µ = µ0 H0: µ = µ0 H0: µ = µ0
H1: µ > µ0 H1: µ < µ0 H1: µ ≠ µ0

Estadístico de la prueba

Región de Rechazo para nivel de significación α


Unilaterales ó Bilateral ó de 2 colas
de una cola

α/2 α/2
α α

R = { z / z > zα } R = { z / z <- zα }

Cuatrimestre I 2020 Dr. Osmar Vera !26


Ejemplo 2:
Se sabe que el tiempo de secado de cierto tipo de pintura está normalmente
distribuido con valor medio 75 min y desviación estándar 9 min. Los técnicos
propusieron un nuevo aditivo para reducir el tiempo de secado. Sea µ el tiempo de
secado promedio verdadero cuando se utiliza el aditivo. Para poner a prueba el
aditivo se miden 25 tiempos de secado, dando por resultado una media muestral
de 70.1 min. Si se considera un nivel de significación de la prueba del 5%, plantee
una prueba para el uso del aditivo y establezca la regla de decisión respecto del
promedio muestral.
Datos:
1. Definir la variable aleatoria en estudio. X: tiempo de secado
2. Plantear la hipótesis de trabajo. X~ N(µ=75,σ =9)
3. Hacer las suposiciones necesarias. n=25
4. Plantear las hipótesis, H0 y H1. α = 0.05. "x = 70.1
5. Definir el Estadístico de prueba: E.
6. Dar la distribución del Estadístico si H0 es Verdadera.
7. Establecer la región de rechazo de la prueba fijado α.
8. Calcular el Estadístico Observado y decidir.
9. Interpretar el resultado.

Cuatrimestre I 2020 Dr. Osmar Vera !27


1. Definir la variable aleatoria en estudio.
X: Tiempo de secado de una pintura.
2. Plantear la hipótesis de trabajo:
Se desea poner a prueba que el nuevo aditivo disminuirá el
tiempo de secado.
3. Hacer las suposiciones necesarias.
X ~ N (µ=75 min,σ=9 min)

4. Plantear las hipótesis, H0 y H1.


H0: µ=75 min H1: µ<75 min
5. Definir el Estadístico de prueba: E.

6. Dar la distribución del Estadístico si H0 es Verdadera.


E~ N(0,1)
7. Establecer la región de rechazo de la prueba fijado α .
8. Calcular el Estadístico Observado y decidir.
9. Interpretar el resultado.
Cuatrimestre I 2020 Dr. Osmar Vera !28
Región de Rechazo para nivel de significación α = 0.05
Respecto de Z
Zona de Rechazare H0 si resulta muy
Rechazo de H0 chico!
α = 0.05

µ=0

Rechazo H0!!
Con un nivel de significación del 5% existe suficiente evidencia muestral
para considerar que el aditivo va a disminuir el tiempo de secado de la
pintura.

Cuatrimestre I 2020 Dr. Osmar Vera !29


Región de Rechazo para nivel de significación α = 0.05
Respecto de
Zona de Rechazare H0 si resulta muy
Rechazo de H0 chico!
α = 0.05

µ=75

Como Rechazo H0!!

Cuatrimestre I 2020 Dr. Osmar Vera !30


PROBABILIDAD ERROR TIPO II
Calculemos el valor de β(72), es decir: β(72) =
= P(error tipo II, cuando μ = 72) = P(H0 no es rechazada cuando es falta porque μ = 72)
= P(X > 75 − 1.64 ⋅ 1.8, μ = 72) = P(X > 72.048, μ = 72) =
X − 72 72.048 − 72
= P( > ) = P(Z > 0.026) = 0.49
1.8 1.8
β(72) = 0.49

72.048 − 70.08
β(70.8) = 1 − ϕ( ) = 1 − ϕ(1.09) = 0.137
1.8
72.048 − 70
β(70) = 1 − ϕ( ) = 0.124
1.8
72.048 − 67
β(67) = 1 − ϕ( ) = 0.0025
1.8

Cuatrimestre I 2020 Dr. Osmar Vera !31


CALCULO DEL TAMAÑO DE LA MUESTRA
Consideremos dos restricciones P(error tipo I ) = α y  β(μ′) = β para α, μ′ y  β especificadas.
Entonces para una prueba de cola inferior, el tamaño de la muestra n deberá ser elegido de forma
tal que satisfaga la siguiente igualdad:

β = β(μ′) = P(error tipo II, cuando μ = μ′) = P(H0 no es rechazada cuando es falsa porque μ = μ′)

X − μ′ (μ0 − μ′) zα ⋅ σ/ n
β = P(X > μ0 − zα ⋅ σ/ n,  cuando μ = μ′) = P( > − )
σ/ n σ/ n σ/ n
μ0 − μ′
β = P(Z > − zα + ) la única incógnita de esta igualdad es n .
σ/ n
Si para el test anterior, H0: µ=75 ; H1: µ<75 se tiene α = 0.05, β = 0.60  y , μ′ = 72, se
tiene que n es tal que:
75 − 72 75 − 72
0.60 = P(Z > − z0.05 + ) ⟹ −1.64 + = − 0.25 ⟹ n = 18
9/ n 9/ n

Cuatrimestre I 2020 Dr. Osmar Vera !32


1. Una empresa desea iniciar una campaña de ventas de aparatos de TV. Se considera que
la decisión de comenzar la campaña debe estar relacionada con los ingresos medios
mensuales por familia, de modo que será afirmativa si estos son iguales o superiores a
$5000 y negativa cuando los ingresos no lleguen a esa suma. Suponer el desvío
poblacional de $200 y que se extrae una muestra de 100 familias, dando un promedio de
ingresos mensuales de $4980. Decidir si se comienza la campaña de venta de aparatos
de TV, con un nivel de significación del 5% . Hallar el p – valor. Calcular la probabilidad
de cometer error de Tipo II cuando la verdadera media es igual a 4970.

Resolver yo este ejercicio. No calcule aun el p-valor

Cuatrimestre I 2020 Dr. Osmar Vera !33


H0 : μ = μ0 H1 : μ > μo
Datos:
X: peso de un tubo de hormigón H0: µ=18 H1: µ>18
X~ N(µ=18,σ2 =4)
n=16
α = 0.05. x" = 18.5 α = 0.05
Zona de
Rechazo de H0

µ=18

Cuatrimestre I 2020 Dr. Osmar Vera !34


H0: µ=18 H1: µ>18

α = 0.05 y z0.05=1.64

µ=18

µ=0

No Rechazo H0!!
Con un nivel de significación del 5% no existe suficiente evidencia
muestral para considerar que el peso medio de los tubos es
significativamente superior al especificado por el fabricante.

Cuatrimestre I 2020 Dr. Osmar Vera !35


P - Valor

α = 0.05 = 5%

µ=0

Eobservado=1

P – Valor = P(Z>1)= 1- $ϕ(1) =1 – 0.84134 = 0.15866 , 16%


Si el p – valor > nivel de significación (α) NO SE RECHAZA H0

Definición de p – valor: Es el área de rechazo para el estadístico


calculado para esa muestra

Cuatrimestre I 2020 Dr. Osmar Vera !36


Un fabricante de sistemas rociadores como protección contra incendios
afirma que la temperatura promedio verdadera de activación del sistema
es de 130°. Una muestra de n=9 sistemas, cuando se someten a prueba
dan una temperatura de activación promedio de 131.08°. Si la
temperatura de activación es normal con un desvió estándar de 1.5°
¿Contradicen los datos la afirmación del fabricante a un nivel de
significación del 1%?

Datos:
X: temperatura de activación del sistema H0: µ=130 vs. H1: µ≠130
X~ N(µ=130,σ =1.5)
n=9 Bilateral ó de 2 colas
α = 0.01

α/2 =0.005 α/2=0.005

µ=0

Cuatrimestre I 2020 Dr. Osmar Vera !37


α/2 = 0.005 α/2 = 0.005

µ=0
No Rechazo H0!!
Región de Rechazo para nivel de significación α = 0.01
Respecto de

Cuatrimestre I 2020 Dr. Osmar Vera !38


P - Valor

Como es una prueba bilateral el p – valor es el área de cada cola:


P – Valor = 2*P(Z>2.16)= 2*(1- ϕ$ (2.16)) =2*(1 – 0.9846) =
=2*0.0154 = 0,03. 3%
Como el p – valor > nivel de significación (α) NO SE RECHAZA H0

Cuatrimestre I 2020 Dr. Osmar Vera !39


4

Encontrar
Datos:
X: Duración de una lampara H0: µ=9.5 H1: µ>9.5
X~ N(µ=9.5,σ)
n=10
α = 0.05
α=0.05

R = { t9 / t9 > t9;α }

Cuatrimestre I 2020 Dr. Osmar Vera !40


Rechazo H0!!
Región de Rechazo para nivel de significación α = 0.05
Respecto de

Cuatrimestre I 2020 Dr. Osmar Vera !41


P - Valor

P – Valor = P(t9 >4.087)=0.00136<0.05

Como el p – valor < nivel de significación (α) SE RECHAZA H0

Cuatrimestre I 2020 Dr. Osmar Vera !42


En general, TEST PARA LA MEDIA DE UNA
POBLACION NORMAL CON σ2 DESCONOCIDO
Hipótesis del problema

1 2 3
H0: µ = µ0 H0: µ = µ0 H0: µ = µ0
H1: µ > µ0 H1: µ < µ0 H1: µ ≠ µ0

Estadístico de la prueba
S

Para un nivel de significación α ,rechazo H0 si EObservado ∈ Zona de Rechazo

Cuatrimestre I 2020 Dr. Osmar Vera !43


1 2 3
H0: µ = µ0 H0: µ = µ0 H0: µ = µ0
H1: µ > µ0 H1: µ < µ0 H1: µ ≠ µ0

Estadístico de la prueba S

Región de Rechazo para nivel de significación α


Unilaterales ó Bilateral ó de 2 colas
de una cola

α/2 α/2
α α

R = { tn-1 / tn-1 > tα; n-1 } R = { tn-1 / tn-1 < -tα; n-1 }

Cuatrimestre I 2020 Dr. Osmar Vera !44


Ejercicio 2 Trabajo Práctico 7: Según un fabricante, la resistencia
media extrema de cierto alambre aleado de Al es de 250 MN/m2 y su
distribución es normal. Un contratista adquiere un lote de alambre y pone
a prueba una muestra de tamaño 25. El valor medio y la desviación
estándar obtenidos a partir de esa muestra son respectivamente 253.4
MN/m2 y 11.2 MN/m2. ¿Es justificable que el contratista concluya que la
remesa tiene una resistencia significativamente diferente a lo especificado
por el fabricante ? Tomar un nivel de significación del 5%. Encontrar el p-
valor.
Datos:
X: resistencia alambre aleado de Al
X~ N(µ=250,σ)
n=25
α = 0.05. x" = 253.4, s = 11.2

H0 : μ = 250, H1 : μ ≠ 250
Finalizarlo yo !

Cuatrimestre I 2020 Dr. Osmar Vera !45


Subir al aula virtual el ejercicio 2 del TP7, enviarlo via mail a:
overa17@gmail.com.

FIN

Cuatrimestre I 2020 Dr. Osmar Vera !46

También podría gustarte