Está en la página 1de 57

Prueba de hipótesis

Parte II

Cuatrimestre II 2020 Dr. Osmar Vera !1


Prueba de hipótesis para la media
poblacional µ de una

Distribución Normal
Establecer las hipótesis estadísticas:

H0: µ=µ0 (ó ≤µ0) contra H1: µ>µ0


H0: µ=µ0 (ó ≥µ0) contra H1: µ<µ0
H0: µ=µ0 contra H1: µ≠µ0

Nivel de significación de la prueba:


P(error de tipo I )= α

Cuatrimestre II 2020 Dr. Osmar Vera !2


Estadístico de prueba
• Que relacione el parámetro y su estimador puntual.

• Que tenga distribución conocida.

Siendo X es N(µ,σ2 ) y σ2 conocida:

Siendo X es N(µ,σ2 ) y σ2 desconocida:

Cuatrimestre II 2020 Dr. Osmar Vera !3


Región de rechazo
Región Crítica
Para Pruebas Unilaterales Con σ2 conocida

Z1-α Zα
Región crítica o Región de Rechazo
[Z1-α ;+∞) (-∞; -Zα ]
Cuatrimestre II 2020 Dr. Osmar Vera !4
Región de rechazo
Región Crítica
Para Pruebas Bilaterales con σ2 es conocida

-Z1-α/2 Z1-α/2
Región crítica o Región de Rechazo
(-∞;-Z1-α/2 ] U [Z1-α/2 ;+∞)
Cuatrimestre II 2020 Dr. Osmar Vera !5
Región de rechazo
Región Crítica
Para Pruebas Unilaterales
Con σ2 desconocida se estima por S2

tn-1;α tn-1;1-α
Región crítica o Región de Rechazo
[tn-1;1-α ;+∞) (-∞; -tn-1;α ]
Cuatrimestre II 2020 Dr. Osmar Vera !6
Región de rechazo
Región Crítica
Para Pruebas Bilaterales con σ2 desconocida, se
estima por S2

-tn-1;1-α/2 tn-1;1-α/2
Región crítica o Región de Rechazo
(-∞;-tn-1;1-α/2 ] U [tn-1;1-α/2 ;+∞)
Cuatrimestre II 2020 Dr. Osmar Vera !7
Regla de decisión
Se rechaza H0 si:

El estadístico calculado bajo H0 en la muestra cae


en la zona de rechazo o Región crítica

Caso σ conocido Caso σ desconocido

Cuatrimestre II 2020 Dr. Osmar Vera !8


Recordemos el siguiente Ejemplo 2:
Se sabe que el tiempo de secado de cierto tipo de pintura está normalmente
distribuido con valor medio 75 min y desviación estándar 9 min. Los técnicos
propusieron un nuevo aditivo para reducir el tiempo de secado. Sea µ el tiempo de
secado promedio verdadero cuando se utiliza el aditivo. Para poner a prueba el
aditivo se miden 25 tiempos de secado, dando por resultado una media muestral
de 70.1 min. Si se considera un nivel de significación de la prueba del 5%, plantee
una prueba para el uso del aditivo y establezca la regla de decisión respecto del
promedio muestral.
Datos:
1. Definir la variable aleatoria en estudio. X: tiempo de secado
2. Plantear la hipótesis de trabajo. X~ N(µ=75,σ =9)
3. Hacer las suposiciones necesarias. n=25
4. Plantear las hipótesis, H0 y H1. α = 0.05. (x = 70.1
5. Definir el Estadístico de prueba: E.
6. Dar la distribución del Estadístico si H0 es Verdadera.
7. Establecer la región de rechazo de la prueba fijado α.
8. Calcular el Estadístico Observado y decidir.
9. Interpretar el resultado.

Cuatrimestre I 2020 Dr. Osmar Vera !9


1. Definir la variable aleatoria en estudio.
X: Tiempo de secado de una pintura.
2. Plantear la hipótesis de trabajo:
Se desea poner a prueba que el nuevo aditivo disminuirá el
tiempo de secado.
3. Hacer las suposiciones necesarias.
X ~ N (µ=75 min,σ=9 min)

4. Plantear las hipótesis, H0 y H1.


H0: µ=75 min H1: µ<75 min
5. Definir el Estadístico de prueba: E.

6. Dar la distribución del Estadístico si H0 es Verdadera.


E~ N(0,1)
7. Establecer la región de rechazo de la prueba fijado α .
8. Calcular el Estadístico Observado y decidir.
9. Interpretar el resultado.
Cuatrimestre I 2020 Dr. Osmar Vera !10
Región de Rechazo para nivel de significación α = 0.05
Respecto de Z
Zona de Rechazare H0 si resulta muy
Rechazo de H0 chico!
α = 0.05

µ=0

Rechazo H0!!
Con un nivel de significación del 5% existe suficiente evidencia muestral
para considerar que el aditivo va a disminuir el tiempo de secado de la
pintura.

Cuatrimestre I 2020 Dr. Osmar Vera !11


Región de Rechazo para nivel de significación α = 0.05
Respecto de
Zona de Rechazare H0 si resulta muy
Rechazo de H0 chico!
α = 0.05

µ=75

Como Rechazo H0!!

Cuatrimestre I 2020 Dr. Osmar Vera !12


PROBABILIDAD ERROR TIPO II
Calculemos el valor de β(72), es decir: β(72) =
= P(error tipo II, cuando μ = 72) = P(H0 no es rechazada cuando es falta porque μ = 72)
= P(X > 75 − 1.64 ⋅ 1.8, μ = 72) = P(X > 72.048, μ = 72) =
X − 72 72.048 − 72
= P( > ) = P(Z > 0.026) = 0.49
1.8 1.8
β(72) = 0.49

72.048 − 70.08
β(70.8) = 1 − ϕ( ) = 1 − ϕ(1.09) = 0.137
1.8
72.048 − 70
β(70) = 1 − ϕ( ) = 0.124
1.8
72.048 − 67
β(67) = 1 − ϕ( ) = 0.0025
1.8

Cuatrimestre I 2020 Dr. Osmar Vera !13


CALCULO DEL TAMAÑO DE LA MUESTRA
Consideremos dos restricciones P(error tipo I ) = α y  β(μ′) = β para α, μ′ y  β especificadas.
Entonces para una prueba de cola inferior, el tamaño de la muestra n deberá ser elegido de forma
tal que satisfaga la siguiente igualdad:

β = β(μ′) = P(error tipo II, cuando μ = μ′) = P(H0 no es rechazada cuando es falsa porque μ = μ′)

X − μ′ (μ0 − μ′) zα ⋅ σ/ n
β = P(X > μ0 − zα ⋅ σ/ n,  cuando μ = μ′) = P( > − )
σ/ n σ/ n σ/ n
μ0 − μ′
β = P(Z > − zα + ) la única incógnita de esta igualdad es n .
σ/ n
Si para el test anterior, H0: µ=75 ; H1: µ<75 se tiene α = 0.05, β = 0.60  y , μ′ = 72, se
tiene que n es tal que:
75 − 72 75 − 72
0.60 = P(Z > − z0.05 + ) ⟹ −1.64 + = − 0.25 ⟹ n = 18
9/ n 9/ n

Cuatrimestre I 2020 Dr. Osmar Vera !14


Una empresa desea iniciar una campaña de ventas de aparatos de TV. Se considera
que la decisión de comenzar la campaña debe estar relacionada con los ingresos
medios mensuales por familia, de modo que será afirmativa si estos son iguales o
superiores a $5000 y negativa cuando los ingresos no lleguen a esa suma. Suponer el
desvío poblacional de $200 y que se extrae una muestra de 100 familias, dando un
promedio de ingresos mensuales de $4980. Decidir si se comienza la campaña de
venta de aparatos de TV, con un nivel de significación del 5% . Hallar el p – valor.
Calcular la probabilidad de cometer error de Tipo II cuando la verdadera media es
igual a 4970. Hallar el tamaño de la muestra, si se quiere que en las condiciones
anteriores, la probabilidad de error Tipo II sea del 53%.

Cuatrimestre I 2020 Dr. Osmar Vera !15


Prueba de hipótesis para la Varianza
poblacional σ2 de una

Distribución Normal con µ desconocida

Supongamos que un investigador quiere


probar que la variabilidad de un
proceso ha cambiado

Cuatrimestre II 2020 Dr. Osmar Vera !16


Como conocemos los pasos de este procedimiento

Hipótesis de trabajo
Hipótesis estadísticas
Nivel de significación de la prueba
Estadístico de prueba
Zona de rechazo o región crítica
Regla de decisión
Conclusión

Cuatrimestre II 2020 Dr. Osmar Vera !17


Hipótesis estadísticas

Nivel de significación de la prueba


P(Error de tipo I) = α

Estadístico de prueba

Cuatrimestre II 2020 Dr. Osmar Vera !18


Recordemos una propiedad importante de una
variable aleatoria con distribución Normal:

Si llamamos U a la variable aleatoria que tiene


distribución chi-cuadrado:

Cuatrimestre II 2020 Dr. Osmar Vera !19


Veamos si cumple las caracteristicas para poder
ser un ESTADISTICO DE PRUEBA

Tiene distribución conocida? SI

Relaciona parámetro y estimador puntual?


SI

Cuatrimestre II 2020 Dr. Osmar Vera !20


Región de rechazo: Como siempre la forma de la
zona de rechazo depende de la hipótesis alternativa.
En este caso, estará dada por

Región de rechazo
(-∞; ]

Se rechazará H0 si:

Cuatrimestre II 2020 Dr. Osmar Vera !21


Región de rechazo: Como siempre la forma de la
zona de rechazo depende de la hipótesis alternativa.
En este caso, estará dada por

Región de rechazo
( ;+∞]

Se rechazará H0 si:

Cuatrimestre II 2020 Dr. Osmar Vera !22


Región de rechazo: Como siempre la forma de la
zona de rechazo depende de la hipótesis alternativa.
En este caso, estará dada por

Región de rechazo
(-∞; ]U[ ;+∞)

Se rechazará
H0 si:
Cuatrimestre II 2020 Dr. Osmar Vera !23
Trabajo Practico 7, ejercicio 10. A veces los productos radioactivos de
desecho industrial van a dar a fuentes de agua que se utilizan para el
consumo de la población. Por eso las agencias estatales de salud vigilan en
forma periódica las fuentes naturales de agua mediante la toma y el análisis
de muestras de agua. La ley establece que la cantidad promedio de
radiación en el agua para beber no debe exceder el valor de 4 picocuries
por litro de agua. Se toma una muestra de tamaño 16 de una fuente
natural en una zona poblada y se obtiene una media muestral de 4.2 y un
desvío muestral de 1.2 picocuries por litro de agua. Suponiendo que la
cantidad de radiación por litro de agua se puede considerar normalmente
distribuida.
a.Existe evidencia significativa para un nivel de significación de 10 % para
suponer que la radiación en el agua de la zona no cumple la ley? Plantee el
teste adecuado, indique la decisión para el nivel pedido y acote el p-valor.
b.¿Existe razón para creer que la varianza en la cantidad de radiación en la
fuente de agua es mayor que 1.25 picocuries cuadrados, para un nivel del 5
%? Plantee el test indicado, la decisión y acote el p-valor

Cuatrimestre II 2020 Dr. Osmar Vera !24


Hipótesis de trabajo: La varianza en la
cantidad de radiación en la fuente de agua
es mayor que 1.25?
Hipótesis estadísticas:
H0: σ2=1.25 pic2 contra H1: σ2>1.25 pic2

Nivel de significación de la prueba


α = 0.05

Estadístico de prueba

Cuatrimestre II 2020 Dr. Osmar Vera !25


Zona de rechazo o región crítica

α = 0.05

=24.996

Zona de rechazo o
región crítica = [24.996;+∞)

Cuatrimestre II 2020 Dr. Osmar Vera !26


Regla de decisión: cálculo del estadístico Bajo H0

Zona de rechazo o
región crítica = [24.996;+∞)
Decisión:
17.28
NO SE RECHAZA H0

H0: σ2=1.25 pic2

24.996
P-valor=P(χ215>17.28) => 0.25<p-valor<0.5
Con R: > pchisq(c(17.28), df=15, lower.tail=FALSE)
[1] 0.3024034
Cuatrimestre II 2020 Dr. Osmar Vera !27
Conclusión:

Con un nivel de significación del 5% no existe


suficiente evidencia muestral para rechazar la
Hipótesis Nula. Por lo tanto, la variabilidad en
la cantidad de radiación en la fuente, no es
mayor que 1.25 pic2

Esto es que a nivel poblacional la variabilidad


de la radiación es 1.25 pic2

Cuatrimestre II 2020 Dr. Osmar Vera !28


Prueba de hipótesis para la Media
poblacional µ de una

Población con distribución desconocida

Cuatrimestre II 2020 Dr. Osmar Vera !29


Recordemos el Teorema Central del Límite
Sean X1, X2, ..., Xn vaiid tales que E(Xi) = µ y V (Xi) = σ2
(finita), cualquiera sea la distribución de Xi, si n es
suficientemente grande, se cumple que,
tiene una distribución APROXIMADAMENTE NORMAL con
parámetros:

Aproximadamente Normal

Cuatrimestre II 2020 Dr. Osmar Vera !30


Prueba de hipótesis para la media
poblacional µ cuando se desconoce la
distribución de los datos
Establecer las hipótesis estadísticas:

H0: µ=µ0 (ó ≤µ0) contra H1: µ>µ0


H0: µ=µ0 (ó ≥µ0) contra H1: µ<µ0
H0: µ=µ0 contra H1: µ≠µ0

Nivel de significación de la prueba:


Probabilidad de cometer error de tipo I = α

Cuatrimestre II 2020 Dr. Osmar Vera !31


Estadístico de prueba

Para valores de n>30,con σ2 conocida:

Además, si σ2 es desconocida:

Cuatrimestre II 2020 Dr. Osmar Vera !32


Entonces se construyen los siguientes test de
nivel aproximado α $
ó Asintótico de nivel $α

H0: µ=µ0 ; H1: µ>µ0 , rechazamos H0 si Wobs ≥ Zα

H0: µ=µ0 ; H1: µ<µ0 , rechazamos H0 si Wobs < -Zα

H0: µ=µ0 ; H1: µ≠µ0 ,


rechazamos H0 si Wobs ≥ Zα/2 ó Wobs < - Zα/2

Cuatrimestre II 2020 Dr. Osmar Vera !33


Ejemplo:
Un procedimiento para producir cemento tiene una resistencia
media a la compresión de 5000 kg/cm2. Se pone a prueba un
nuevo procedimiento para producir cemento que se supone
disminuirá la resistencia a la compresión. Plantear la hipótesis
del problema. Una muestra de 50 probetas de hormigón a las
que se sometió al ensayo y resultó una media de 4970 y un
desvió estandar de 120 kg/cm2. ¿Existe evidencia muestral
para concluir que el nuevo procedimiento disminuirá la
resistencia a la compresión? Considerar un nivel de
significación del 5% Datos
n = 50
=4970 kg/cm2
S= 120 kg/cm2

Cuatrimestre II 2020 Dr. Osmar Vera !34


Hipótesis del problema
H0: µ = 5000 H1: µ < 5000
Estadístico de prueba
Para valores de n>30, con σ2 desconocida:

Región crítica
Región de Rechazo (-∞;-1.64]

Zα =Z 0.05=-1.64

Decisión:
P-valor=P(Z<-1.7677) =0.0384 SE RECHAZA H0
Cuatrimestre II 2020 Dr. Osmar Vera !35
P-valor=P(Z<-1.7677) =0.0384<5%
Si α = 1% = 0.01???

Conclusión:

Con un nivel de significación aproximado


del 5%, existe suficiente evidencia para
rechazar la Hipótesis Nula (H0: µ=5000). Por
lo tanto, se puede afirmar que con el nuevo
procedimiento la resistencia media a la
compresión del cemento será menor a 5000
kg/cm2.
Cuatrimestre II 2020 Dr. Osmar Vera !36
Prueba de hipótesis para el parámetro p
poblacional

de la distribución binomial

Cuatrimestre II 2020 Dr. Osmar Vera !37


Corolario del Teorema Central del Límite
Teorema Central del Límite De-Moivre Laplace

Si n es suficientemente grande por el TCL,

Cuatrimestre II 2020 Dr. Osmar Vera !38


Cuatrimestre II 2020 Dr. Osmar Vera !39
Un test de nivel aproximado α para las hipótesis:
H0: p = p0 contra H1: p > p0
H0: p = p0 contra H1: p < p0
H0: p = p0 contra H1: p ≠ p0

Puede construirse a partir del estadístico, el cual,


suponiendo cierta H0, tiende en distribución a la
normal estándar.

Cuatrimestre II 2020 Dr. Osmar Vera !40


Ejemplo
La proporción de alumnos que recursan alguna de las
materias del CBC es de aproximadamente 35%. Se ha
implementado una nueva estrategia de apoyo y se
cree que es probable que esta proporción haya
disminuido.
Para contrastar esta hipótesis se ha tomado una
muestra aleatoria de 500 alumnos entre los que han
tenido oportunidad de aprovechar la nueva estrategia
y se ha encontrado que 160 han recursado alguna de
las materias.
Considera que hay evidencia de la efectividad del
método utilizando un nivel de significación del 0,05.

Cuatrimestre II 2020 Dr. Osmar Vera !41


Datos del problema
X:numero de alumnos que recursan CBC
La proporción poblacional de alumnos que recursan
alguna de las materias del CBC es de
aproximadamente 35%.
X~B(n,p=0.35)

Muestra de 500 alumnos con nueva estrategia


n=500
Cantidad de alumnos en la muestra, que
recursaron= 160. Entonces

Nivel de significación del α = 0,05.


Cuatrimestre II 2020 Dr. Osmar Vera !42
H0: p = 0,35 contra H1: p < 0,35
Se construye el test de la misma forma que los
tests de nivel exacto, con distribucion Normal.

Pero en este caso el test es ASINTOTICO O DE


NIVEL APROXIMADO α $ .

Estadístico de la prueba, de contraste o


pivotal:

Cuatrimestre II 2020 Dr. Osmar Vera !43


Región crítica o Región de Rechazo:
(-∞; -1.65 ]
La que corresponde a la H1: p<0.35

Z0.05=-1.65

Decisión:
No rechazo H0
P-valor=P(Z<-1.406) =0.0808 ; 8%>5%

Cuatrimestre II 2020 Dr. Osmar Vera !44


Conclusión:

Con un nivel de significación aproximado del


5%, NO existe suficiente evidencia para
rechazar la Hipótesis Nula (H0: p=0.35). Por
lo tanto, NO se puede afirmar que el nuevo
método utilizado para mejorar el porcentaje
de recursantes en el CBC, sea efectivo a nivel
poblacional.

Cuatrimestre II 2020 Dr. Osmar Vera !45


Test de Shapiro Wilks
Para hacer al final del TP de Descriptiva

En muchas ocasiones es imposible sostener el


supuesto de normalidad para una determinada
muestra aleatoria X1, X2, ..., Xn

En este contexto, se utilizan otro tipo de tests


llamados tests de bondad de ajuste que comparan la
distribución empírica con una distribución teórica, en
particular es de interés la comparación con la
distribución normal. Uno de ellos es el test de
Shapiro Wilks, en el que se plantea:
Cuatrimestre II 2020 Dr. Osmar Vera !46
Test de Shapiro Wilks
H0: X ~ N (µ , σ2)
H1: X no tiene distribución normal con parámetros µ y σ2
En R para el ejemplo 08.08 >: Estadisticos – resumenes
– test de Normalidad de Shapiro - Wilks
> data(xmp08.08)

> shapiro.test(xmp08.08$DCP)

Shapiro-Wilk normality test

data: xmp08.08$DCP
W = 0.8901, p-value = 0.0001731

Como el p-valor (0.0001731) es menor que 0.05,


SE RECHAZA LA H0 => X no es N (µ , σ2)
Cuatrimestre II 2020 Dr. Osmar Vera !47
Cuatrimestre II 2020 Dr. Osmar Vera !48
H0: X ~ N (µ , σ2)
H1: X no tiene distribución normal con parámetros µ y σ2
En R para el Ejercicio 01.24 >: Estadisticos –
resumenes – test de Normalidad de Shapiro - Wilks
> data(ex01.24)

> shapiro.test(ex01.24$ShearStr)

Shapiro-Wilk normality test

data: ex01.24$ShearStr
W = 0.9935, p-value = 0.9158

Como el p-valor (0.9158) es mayor que 0.05,


NO SE RECHAZA LA H0 => X ~ N (µ , σ2)
Cuatrimestre II 2020 Dr. Osmar Vera !49
Cuatrimestre II 2020 Dr. Osmar Vera !50
Similitud entre Intervalos de Confianza
y Test Bilaterales

Cuatrimestre II 2020 Dr. Osmar Vera !51


Una prueba de hipótesis bilateral está relacionada
con una estimación estadística por intervalos de
confianza.

Podemos aproximar el procedimiento de prueba


de hipótesis construyendo primero el intervalo de
confianza de nivel (1-α)%

Cuatrimestre II 2020 Dr. Osmar Vera !52


En una planta química industrial se registra diariamente la producción. En
los últimos 20 días se obtuvo una media muestral de 871 toneladas y un
desvío muestral de 12 toneladas. El fabricante afirma que la producción
promedio no es más la obtenida en los últimos años, de 880 toneladas.
Tomar α=0.05 y suponer normalidad.

H0:µ=880 H1:µ≠880
Datos:
X: producción diaria en una planta
X~ N(µ=880,σ2)
n=20
α = 0.05

-tα/2; 19 tα/2;19
Región de Rechazo=(-∞;-tα/2;19 ]U[tα/2;19 ;+∞)
Cuatrimestre II 2020 Dr. Osmar Vera !53
H0:µ=880 H1:µ≠880
Datos:
X: producción diaria en una planta
X~ N(µ=880,σ2 =2480)
n=20
α = 0.05

-tα/2; 19 = -2.093 tα/2;19=2.093

Región de Rechazo=(-∞;-2.093]U[2.093;+∞)
Rechazo H0!!

P- valor = 2*P(t19<-3.358) = 2*0.001 = 0.002


Como α = 0.05 > p – valor, entonces RECHAZO H0
Cuatrimestre II 2020 Dr. Osmar Vera !54
Intervalo de Confianza del 95% para µ

H0: µ=880
µ0
H1: µ≠880 No Pertenece al IC

SE RECHAZA H0

Cuatrimestre II 2020 Dr. Osmar Vera !55


Rechazamos H0
No rechazamos H0
µ0
µ0 1-α

H0: µ = µ0 contra H1: µ ‡ µ0

Cuatrimestre II 2020 Dr. Osmar Vera !56


Cuatrimestre II 2020 Dr. Osmar Vera !57

También podría gustarte