Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Departamento de Estadística
Universidad de Concepción
PRUEBAS DE HIPÓTESIS
2
PRUEBAS DE HIPÓTESIS
Previo a cualquier estudio se debe fijar el nivel de significancia con el cual se trabajará,
que se denota por .
En la mayor parte de los estudios se utiliza =0.05, es decir, cada vez que el valor p de un
test determinado es menor que este valor se dice que se rechaza la hipótesis nula o
simplemente que el test fue significativo.
3
ALGUNOS EJEMPLOS
El Ministerio de Salud ha fijado en 70 el número medio de bacterias
por centímetro cúbico de agua que constituye un nivel máximo
aceptable para las aguas en que se practica la recogida de almejas.
Un valor medio superior a 70 parece peligroso, porque comer almejas
recogidas en tales aguas puede causar hepatitis. A fin de establecer
un patrón gubernamental para las aguas, interesa probar:
4
ALGUNOS EJEMPLOS
Un estudio reciente del ecosistema en un bosque de hoja caduca
indica que, en el bosque natural, el promedio neto de
transformaciones del nitrógeno en nitrato presenta un incremento
promedio de 2 kg por hectárea al año. Los ingenieros forestales
creen que una desfoliación de la maleza del bosque conduciría a
una disminución de este valor promedio. La prueba que interesa
probar es:
5
ALGUNOS EJEMPLOS
6
CONCEPTOS BÁSICOS
Una hipótesis estadística es una afirmación acerca de los
parámetros de una (o más) población, es decir sobre la
distribución de una (o más) variable aleatoria.
7
Región crítica es un subconjunto del espacio muestral que lleva
al rechazo de la hipótesis en consideración.
8
H0: hipótesis nula
Es lo conocido, el no
rechazarla implica que no
hay cambio.
H1: hipótesis alternativa
Es lo que se sospecha.
10
TIPOS DE HIPÓTESIS
11
Hipótesis bilateral
H0 : =0
H1 : 0
Hipótesis unilateral
H0 : =0 H0 : =0
H1 : <0 H1 : >0
12
ERROR TIPO I Y ERROR TIPO II
Aceptar H0 Rechazar H0
H0 verdadera bien Error tipo I
H0 falsa Error tipo II bien
= P(rechazar H0 / H0 verdadera)
= P(aceptar H0 / H0 falsa)
13
valor-p = Probabilidad que la estadística de prueba tome un valor
mayor o igual que el obtenido con base en la muestra aleatoria,
dado que la hipótesis nula es verdadera.
14
Regla de decisión.
Valor-p Conclusión
15
PASOS A SEGUIR:
DEFINIR LA VARIABLE
a) Formular la hipótesis nula y alternativa de acuerdo al problema.
16
PASOS A SEGUIR:
17
PRUEBA DE
HIPÓTESIS PARA UNA
POBLACIÓN.
18
Pruebas de hipótesis para la media
X - 0 X − 0
Z calculado = Tcalculado =
s
n n
0
20
Varianzas desconocidas – Población normal
Este es el estadístico más utilizado cuando la variable tiene distribución
normal.
También lo utilizan los software estadísticos cuando la variable no tiene
distribución normal y el tamaño de la muestra es grande.
0
0
0
21
RESUMEN DE LOS TEST CUANDO EL TAMAÑO DE LA
MUESTRA ES GRANDE O CUANDO LA O LAS
VARIABLES TIENE DISTRIBUCIÓN NORMAL.
Test t de Student para un grupo.
Test t de Student para grupos pareados.
Test t de Student para grupos independientes:
Varianzas poblacionales iguales.
Varianzas poblacionales distintas.
(La prueba de homogeneidad de varianzas debe realizarse antes del test de comparación de
medias).
22
UN GRUPO: COMPARACIÓN CON UN VALOR DE REFERENCIA.
1. Los siguientes datos son los pesos uterinos (en mg) de 20 ratas
extraídas al azar de un grupo grande. ¿Es probable que el peso
promedio de todo el grupo sea 24 mg. un valor observado en estudios
anteriores?
23
Dado que el tamaño de muestra es de n=20, debemos verificar primero si la
variable en estudio tiene distribución normal, esto lo haremos a través del test de
Shapiro-Wilk.
24
Como obtener el valor p asociado al test de Shapiro-Wilk
Aquí las hipótesis son:
H0: X tiene distribución normal
H1: X no tiene distribución normal.
25
H0: = 24 versus H1: 24
Forma
estadística
De manera equivalente:
H0: el peso uterino promedio de ratas es de 24 mg.
H1: el peso uterino promedio de ratas es diferente
de 24 mg.
Forma no
Estadístico de prueba: estadística
n ( X − 0 )
T= tn −1
S
: ]-∞,t1-/2,n-1[ U ]-t1-/2,n-1,+∞[
Región Crítica
26
Observar que esta es una prueba bilateral (dos colas), es decir se
rechaza cuando el valor “se aleja mucho” en ambos sentidos.
Obviamente este “se aleja mucho” se refiere:
27
Test
¿Qué quiere que
bilateral
se imprima en
la salida del test
t de Student
para un grupo?
H0: = 24
28
Conclusión estadística:
Se rechaza la hipótesis nula (valor p=0,0351).
30
Forma estadística:
H0: =22 versus H1: 22
En palabras:
H0: La duración promedio de las visitas por paciente es de 22 minutos.
H1: La duración promedio de las visitas por paciente es MENOR de 22 minutos.
Conclusión:_____________________
31
PRUEBA DE HIPÓTESIS PARA UNA PROPORCIÓN.
Sea X1, X2,....., Xn una muestra aleatoria de tamaño n (n→) de una variable aleatoria X,
con distribución Bernoulli de parámetro p.
X i = 1, si el resultado es éxito
X i = 0, si el resultado es fracaso
32
Pruebas de Hipótesis para proporciones.
34
PRUEBA DE
HIPÓTESIS PARA LA
MEDIA EN DOS
POBLACIÓNES
CORRELACIONADAS
35
DOS GRUPOS PAREADOS.
En este caso tenemos mediciones a n pares de objetos o individuos.
3. A continuación se presenta el
contenido de plomo en tejido
cerebral (mgr/gr), medido con dos
espectrofotómetros distintos en
once muestras, ¿presenta esta
muestra evidencia de que los
promedios de las mediciones son
diferentes?
36
XA: contenido de plomo en tejido cerebral (gr/gr), medido en una
muestra con el espectrofotómetros A.
XB: contenido de plomo en tejido cerebral (gr/gr), medido en una
muestra con el espectrofotómetros B.
D= XA-XB.
37
VERIFICAR NORMALIDAD.
Test de Shapiro Wilk.
H0: D tiene distribución normal
Ha: D no tiene distribución normal.
38
Hipótesis en el contexto del problema:
39
HIPÓTESIS EN EL CONTEXTO DEL PROBLEMA:
En forma estadística:
H0: A=B versus Ha: A B
Resultados
Conclusión: _______________
40
Flecha roja para grupos pareados.
Flecha verde para grupos independientes.
41
PRUEBA DE
HIPÓTESIS PARA LA
MEDIA EN DOS
POBLACIONES
INDEPENDIENTES.
42
COMPARACIÓN DE LAS MEDIAS DE DOS MEDIAS DE
DOS POBLACIONES INDEPENDIENTES
43
Test F para comparar
dos varianzas
44
CASO 1. HAY IGUALDAD DE VARIANZAS
𝑋ത − 𝑌ത − 𝐷0
Estadístico de prueba 𝑇= ~𝑡𝑣
1 1
𝑆𝑃 𝑛 + 𝑛
1 2
Grados de libertad 𝑣 = 𝑛1 + 𝑛2 − 2
𝑛1 − 1 𝑆12 + ቀ 𝑛2 − 1 𝑆22
2
Varianza combinada 𝑆`𝑃 =
𝑛1 + 𝑛2 − 2
45
CASO 2. NO HAY IGUALDAD DE VARIANZAS
𝑋ത − 𝑌ത − 𝐷0
Estadístico de prueba 𝑇= ~𝑡𝑣
𝑆12 𝑆22
𝑛1 + 𝑛2
2
𝑆12 𝑆22
𝑛1 + 𝑛2
Grados de libertad 𝑣= 2 2
𝑆12ൗ 𝑆22ൗ
𝑛1 𝑛2
+
𝑛1 − 1 𝑛2 − 1
46
DOS GRUPOS INDEPENDIENTES.
Si el tamaño de ambos grupos es grande o si ambas variables tienen
distribución normal se prosigue de la manera siguiente:
47
5. Se ensayaron dos tratamientos antirreumáticos administrados al azar, sobre dos
grupos de 10 pacientes, con referencia a una escala convencional (a mayor
puntuación, mayor eficacia), valorada después del tratamiento. Los resultados
fueron:
48
b) Test de igualdad de varianzas poblacionales:
Este test es importante pues nos dice si las variables tienen la misma
“variabilidad” en cada grupo.
49
c) Así las hipótesis son:
En forma estadística:
50
El test correspondiente es el test t de Student para grupos independientes con
varianzas poblacionales iguales. En este caso el estadístico de prueba está dado por:
𝑋ത − 𝑌ത − 𝐷0
𝑇= ~𝑡𝑣
1 1
𝑆𝑃 𝑛 + 𝑛
1 2
𝑛1 − 1 𝑆12 + ቀ 𝑛2 − 1 𝑆22
donde 2
𝑆`𝑃 = es la varianza
𝑛1 + 𝑛2 − 2
combinada.
Observar que en nuestro caso d0=0.
51
Verifiquemos los valores entregados por InfoStat.
𝑛1 −1 𝑆12 +ቀ 𝑛2 −1 𝑆22
𝑆𝑃2 = 𝑛1 +𝑛2 −2
=193.745
ത 𝑌ത −𝐷0
𝑋− 24.1−35.5 −0
𝑇= 1 1
= =-1.83
1 1
𝑆𝑃 + 13.919 +
𝑛1 𝑛2 10 10
Conclusión:…
52
EJEMPLOS.
53
54
PRUEBA DE HIPÓTESIS PARA DOS PROPORCIONES
DE POBLACIONES INDEPENDIENTES.
Supongamos que se dispone de las muestras aleatorias
independientes X1,X2,.....,Xn de una variable aleatoria X, e
Y1,Y2,.....,Ym de una variable aleatoria Y, tal que:
X ~ Bernoulli ( p X ) ; Y ~ Bernoulli ( pY )
55
Pruebas de Hipótesis para 2 proporciones independientes.
( 0,42−0,6
Estadístico de prueba: 𝑍= =-1,73
0,42 (1−0,42) 0,6 (1−0,6)
45
+ 45
57
PRUEBA IGUALDAD DE PROPORCIONES EN
INFOSTAT
58
Prueba de Irwin-Fisher para comparación de proporciones
59