Está en la página 1de 58

FACULTAD DE CIENCIAS FISICAS Y MATEMATICAS

Departamento de Estadística
Universidad de Concepción

PRUEBAS DE HIPÓTESIS

Prof: Andrea Fernández Jerez.


HIPÓTESIS ESTADÍSTICA
Cuando se debe tomar decisiones, es útil hacer suposiciones, o
conjeturas, acerca de las poblaciones relacionadas. Las
suposiciones , que pueden ser verdaderas o no, se llaman
hipótesis estadísticas y, en general son afirmaciones acerca de
la distribución de probabilidad de las poblaciones.

2
PRUEBAS DE HIPÓTESIS
Previo a cualquier estudio se debe fijar el nivel de significancia con el cual se trabajará,
que se denota por .

En la mayor parte de los estudios se utiliza  =0.05, es decir, cada vez que el valor p de un
test determinado es menor que este valor se dice que se rechaza la hipótesis nula o
simplemente que el test fue significativo.

3
ALGUNOS EJEMPLOS
El Ministerio de Salud ha fijado en 70 el número medio de bacterias
por centímetro cúbico de agua que constituye un nivel máximo
aceptable para las aguas en que se practica la recogida de almejas.
Un valor medio superior a 70 parece peligroso, porque comer almejas
recogidas en tales aguas puede causar hepatitis. A fin de establecer
un patrón gubernamental para las aguas, interesa probar:

4
ALGUNOS EJEMPLOS
Un estudio reciente del ecosistema en un bosque de hoja caduca
indica que, en el bosque natural, el promedio neto de
transformaciones del nitrógeno en nitrato presenta un incremento
promedio de 2 kg por hectárea al año. Los ingenieros forestales
creen que una desfoliación de la maleza del bosque conduciría a
una disminución de este valor promedio. La prueba que interesa
probar es:

5
ALGUNOS EJEMPLOS

El promedio total de proteínas en la sangre en un adulto sano es de 7.25 g por decilitro. En un


análisis de sangre, el laborante está probando:

6
CONCEPTOS BÁSICOS
Una hipótesis estadística es una afirmación acerca de los
parámetros de una (o más) población, es decir sobre la
distribución de una (o más) variable aleatoria.

Un test de hipótesis estadística es una regla que lleva a la


decisión de “aceptar” o rechazar una hipótesis nula después
que observamos una muestra.

7
Región crítica es un subconjunto del espacio muestral que lleva
al rechazo de la hipótesis en consideración.

Nivel de significancia de un test (o tamaño de la región crítica)


es el valor máximo de la probabilidad de rechazar H0 cuando
ella es verdadera.

8
H0: hipótesis nula
Es lo conocido, el no
rechazarla implica que no
hay cambio.
H1: hipótesis alternativa
Es lo que se sospecha.

10
TIPOS DE HIPÓTESIS

H0 : =0 (simple) H1 : 0 (simple)


H1 : >0 (compuesta)
H0 : <0 (compuesta)
H1 : <0 (compuesta)
H0 : >0 (compuesta)

11
Hipótesis bilateral
H0 : =0
H1 : 0

Hipótesis unilateral
H0 : =0 H0 : =0
H1 : <0 H1 : >0

12
ERROR TIPO I Y ERROR TIPO II
Aceptar H0 Rechazar H0
H0 verdadera bien Error tipo I
H0 falsa Error tipo II bien
 = P(rechazar H0 / H0 verdadera)

 = P(aceptar H0 / H0 falsa)
13
valor-p = Probabilidad que la estadística de prueba tome un valor
mayor o igual que el obtenido con base en la muestra aleatoria,
dado que la hipótesis nula es verdadera.

14
Regla de decisión.

Valor-p Conclusión

Valor-p < 𝜶 Existe evidencia contra 𝑯𝟎

No existe evidencia contra 𝑯𝟎


Valor-p > 𝜶

15
PASOS A SEGUIR:
DEFINIR LA VARIABLE
a) Formular la hipótesis nula y alternativa de acuerdo al problema.

b) Seleccionar el nivel de significancia .

c) Seleccionar el estadístico de prueba apropiado, cuya distribución


por muestreo sea conocida en el supuesto de que H0 es cierta.

16
PASOS A SEGUIR:

d) Establecer la región crítica, es decir, determinar el valor (o valores)


crítico.

e) Obtener los valores de la prueba estadística de una muestra


aleatoria de tamaño n.

f) Conclusión : rechazar H0 si la estadística tiene un valor en la región


crítica y no rechazar (aceptar), en otro caso.

17
PRUEBA DE
HIPÓTESIS PARA UNA
POBLACIÓN.

18
Pruebas de hipótesis para la media

Varianza conocida Varianza desconocida

Población Normal Muestras grandes Población Normal

X - 0 X − 0
Z calculado = Tcalculado =
 s
n n

También se utilizará para n grande 19


Este estadístico de prueba se utiliza cuando la Varianza es
conocida, lo cual es muy difícil que ocurra en la «vida real».

Hipótesis Estadístico Región


Alternativa de Prueba Crítica
  0
x − 0
Z cal =
  0 
n

  0
20
Varianzas desconocidas – Población normal
Este es el estadístico más utilizado cuando la variable tiene distribución
normal.
También lo utilizan los software estadísticos cuando la variable no tiene
distribución normal y el tamaño de la muestra es grande.

Hipótesis Estadístico Región


Alternativa de Prueba Crítica

  0
  0

  0
21
RESUMEN DE LOS TEST CUANDO EL TAMAÑO DE LA
MUESTRA ES GRANDE O CUANDO LA O LAS
VARIABLES TIENE DISTRIBUCIÓN NORMAL.
Test t de Student para un grupo.
Test t de Student para grupos pareados.
Test t de Student para grupos independientes:
 Varianzas poblacionales iguales.
 Varianzas poblacionales distintas.
(La prueba de homogeneidad de varianzas debe realizarse antes del test de comparación de
medias).

22
UN GRUPO: COMPARACIÓN CON UN VALOR DE REFERENCIA.
1. Los siguientes datos son los pesos uterinos (en mg) de 20 ratas
extraídas al azar de un grupo grande. ¿Es probable que el peso
promedio de todo el grupo sea 24 mg. un valor observado en estudios
anteriores?

X: peso del útero de una rata en mg.

23
Dado que el tamaño de muestra es de n=20, debemos verificar primero si la
variable en estudio tiene distribución normal, esto lo haremos a través del test de
Shapiro-Wilk.

24
Como obtener el valor p asociado al test de Shapiro-Wilk
Aquí las hipótesis son:
H0: X tiene distribución normal
H1: X no tiene distribución normal.

Si el valor p es menor que 0.05 se concluye que la variable en estudio NO tiene


distribución normal.

25
H0:  = 24 versus H1:   24
Forma
estadística
De manera equivalente:
H0: el peso uterino promedio de ratas es de 24 mg.
H1: el peso uterino promedio de ratas es diferente
de 24 mg.

Forma no
Estadístico de prueba: estadística
n ( X − 0 )
T= tn −1
S
: ]-∞,t1-/2,n-1[ U ]-t1-/2,n-1,+∞[
Región Crítica

26
Observar que esta es una prueba bilateral (dos colas), es decir se
rechaza cuando el valor “se aleja mucho” en ambos sentidos.
Obviamente este “se aleja mucho” se refiere:

- Forma antigua de resolver el problema: a que cae en la región de rechazo.


- Forma actual de resolver el problema: el valor p asociado a este test es menor que
el nivel de significancia (=0,05).

27
Test
¿Qué quiere que
bilateral
se imprima en
la salida del test
t de Student
para un grupo?
H0:  = 24

28
Conclusión estadística:
Se rechaza la hipótesis nula (valor p=0,0351).

Conclusión en el contexto del problema planteado:


El promedio del peso uterino de ratas es significativamente
diferente de 24 mg (valor p=0,0351).

Observación… generalmente se le pone la palabra


significativamente cuando se rechaza la hipótesis nula.
29
2. Recientes estudios sobre el ejercicio de la Medicina en centros en los que no actúan
estudiantes, indican que la duración media de la visita por paciente es de 22 minutos.
Se cree que en centros donde con un elevado número de estudiantes en prácticas esta
cifra es menor. Se obtuvieron los siguientes datos sobre las visitas de 20 pacientes
aleatoriamente seleccionados. La duración de la visita está en minutos:

X: duración de una visita en minutos.

30
Forma estadística:
H0: =22 versus H1: 22

En palabras:
H0: La duración promedio de las visitas por paciente es de 22 minutos.
H1: La duración promedio de las visitas por paciente es MENOR de 22 minutos.

Conclusión:_____________________

Observar que esta es una prueba unilateral a izquierda.

31
PRUEBA DE HIPÓTESIS PARA UNA PROPORCIÓN.
Sea X1, X2,....., Xn una muestra aleatoria de tamaño n (n→) de una variable aleatoria X,
con distribución Bernoulli de parámetro p.

 X i = 1, si el resultado es éxito

 X i = 0, si el resultado es fracaso

32
Pruebas de Hipótesis para proporciones.

Hipótesis Estadístico de prueba Región de rechazo


alternativa
𝑝Ƹ − 𝑝0 𝑍𝑜𝑏𝑠 > 𝑍1−𝛼 O 𝑍𝑜𝑏𝑠 < −𝑍1−𝛼
𝑍𝑂𝑏𝑠 = 2 2
𝑝 ≠ 𝑝0 𝑝0 (1 − 𝑝0 )/𝑛

𝑍𝑜𝑏𝑠 > 𝑍1−𝛼


𝑝 > 𝑝0

𝑍𝑜𝑏𝑠 < −𝑍1−𝛼


𝑝 < 𝑝0
EJEMPLO 4:
En una muestra de 105 niños pertenecientes a un Jardín Infantil seleccionados al
azar, se observa que 27 de ellos han tenido inasistencia a causa de un resfrió común.
La Directora de este Jardín Infantil, cree que la proporción de inasistencia por resfrió
común es superior al 35% de los niños en esta época del año. ¿Qué se puede concluir
de la muestra respecto de lo señalado por la Directora del Jardín Infantil? Usar α =
0,05.

34
PRUEBA DE
HIPÓTESIS PARA LA
MEDIA EN DOS
POBLACIÓNES
CORRELACIONADAS
35
DOS GRUPOS PAREADOS.
En este caso tenemos mediciones a n pares de objetos o individuos.

3. A continuación se presenta el
contenido de plomo en tejido
cerebral (mgr/gr), medido con dos
espectrofotómetros distintos en
once muestras, ¿presenta esta
muestra evidencia de que los
promedios de las mediciones son
diferentes?

36
XA: contenido de plomo en tejido cerebral (gr/gr), medido en una
muestra con el espectrofotómetros A.
XB: contenido de plomo en tejido cerebral (gr/gr), medido en una
muestra con el espectrofotómetros B.
D= XA-XB.

Observar que aquí nos interesa determinar si la diferencia, D, tiene


distribución normal, ya que n=11.

37
VERIFICAR NORMALIDAD.
Test de Shapiro Wilk.
H0: D tiene distribución normal
Ha: D no tiene distribución normal.

38
Hipótesis en el contexto del problema:

H0: el contenido promedio de plomo en tejido cerebral medido en ambos


espectrofotómetros es igual.

H1: el contenido promedio de plomo en tejido cerebral medido en ambos


espectrofotómetros es diferente.

39
HIPÓTESIS EN EL CONTEXTO DEL PROBLEMA:

En forma estadística:
H0: A=B versus Ha: A  B

Resultados

Conclusión: _______________

40
Flecha roja para grupos pareados.
Flecha verde para grupos independientes.

41
PRUEBA DE
HIPÓTESIS PARA LA
MEDIA EN DOS
POBLACIONES
INDEPENDIENTES.
42
COMPARACIÓN DE LAS MEDIAS DE DOS MEDIAS DE
DOS POBLACIONES INDEPENDIENTES

Las varianzas poblacionales son desconocidas:


pero son iguales,
pero son distintas.

Luego lo primero que debemos determinar es si hay homogeneidad de varianzas.

43
Test F para comparar
dos varianzas

44
CASO 1. HAY IGUALDAD DE VARIANZAS

𝑋ത − 𝑌ത − 𝐷0
Estadístico de prueba 𝑇= ~𝑡𝑣
1 1
𝑆𝑃 𝑛 + 𝑛
1 2

Grados de libertad 𝑣 = 𝑛1 + 𝑛2 − 2

𝑛1 − 1 𝑆12 + ቀ 𝑛2 − 1 𝑆22
2
Varianza combinada 𝑆`𝑃 =
𝑛1 + 𝑛2 − 2

45
CASO 2. NO HAY IGUALDAD DE VARIANZAS
𝑋ത − 𝑌ത − 𝐷0
Estadístico de prueba 𝑇= ~𝑡𝑣
𝑆12 𝑆22
𝑛1 + 𝑛2

2
𝑆12 𝑆22
𝑛1 + 𝑛2
Grados de libertad 𝑣= 2 2
𝑆12ൗ 𝑆22ൗ
𝑛1 𝑛2
+
𝑛1 − 1 𝑛2 − 1

46
DOS GRUPOS INDEPENDIENTES.
Si el tamaño de ambos grupos es grande o si ambas variables tienen
distribución normal se prosigue de la manera siguiente:

i) Determinar si las varianzas poblacionales son iguales, esto es


determinar el si el valor p del estadístico de prueba de la igualdad de
varianzas es o no menor que 0,05. Comentar.
ii) Determinar si se rechaza la hipótesis nula asociada a las medias.
Veamos esto a través de un ejemplo.

47
5. Se ensayaron dos tratamientos antirreumáticos administrados al azar, sobre dos
grupos de 10 pacientes, con referencia a una escala convencional (a mayor
puntuación, mayor eficacia), valorada después del tratamiento. Los resultados
fueron:

Determinar si los puntajes promedios de cada tratamiento son distintos.

XA: puntaje obtenido por un paciente tras la aplicación del tratamiento A.


XB: puntaje obtenido por un paciente tras la aplicación del tratamiento B.

a) Aplicación de el test de Shapiro-Wilk a cada variable por separado.

48
b) Test de igualdad de varianzas poblacionales:

Este test es importante pues nos dice si las variables tienen la misma
“variabilidad” en cada grupo.

InfoStat entrega este valor en , en nuestro caso se concluye que


las varianzas poblacionales “son iguales”, ya que el valor p asociado a este
test es mayor que 0,05.

49
c) Así las hipótesis son:

En el contexto del problema:


H0: el puntaje promedio tras la aplicación del tratamiento A es igual al puntaje promedio
tras la aplicación del tratamiento B.
H1: el puntaje promedio tras la aplicación del tratamiento A es distinto al puntaje promedio
tras la aplicación del tratamiento B.

En forma estadística:

H0: A=B versus H1: A  B

50
El test correspondiente es el test t de Student para grupos independientes con
varianzas poblacionales iguales. En este caso el estadístico de prueba está dado por:

𝑋ത − 𝑌ത − 𝐷0
𝑇= ~𝑡𝑣
1 1
𝑆𝑃 𝑛 + 𝑛
1 2

𝑛1 − 1 𝑆12 + ቀ 𝑛2 − 1 𝑆22
donde 2
𝑆`𝑃 = es la varianza
𝑛1 + 𝑛2 − 2

combinada.
Observar que en nuestro caso d0=0.

51
Verifiquemos los valores entregados por InfoStat.

𝑛1 −1 𝑆12 +ቀ 𝑛2 −1 𝑆22
𝑆𝑃2 = 𝑛1 +𝑛2 −2
=193.745

ത 𝑌ത −𝐷0
𝑋− 24.1−35.5 −0
𝑇= 1 1
= =-1.83
1 1
𝑆𝑃 + 13.919 +
𝑛1 𝑛2 10 10

Conclusión:…

52
EJEMPLOS.

53
54
PRUEBA DE HIPÓTESIS PARA DOS PROPORCIONES
DE POBLACIONES INDEPENDIENTES.
Supongamos que se dispone de las muestras aleatorias
independientes X1,X2,.....,Xn de una variable aleatoria X, e
Y1,Y2,.....,Ym de una variable aleatoria Y, tal que:

X ~ Bernoulli ( p X ) ; Y ~ Bernoulli ( pY )

55
Pruebas de Hipótesis para 2 proporciones independientes.

Hipótesis Estadístico de prueba Región de rechazo


alternativa
( 𝑝Ƹ 𝑥 − 𝑝Ƹ 𝑦 𝑍𝑜𝑏𝑠 > 𝑍1−𝛼 O 𝑍𝑜𝑏𝑠 < −𝑍1−𝛼
𝑍= 2 2
𝑝𝑥 ≠ 𝑝𝑦
𝑝Ƹ 𝑥 (1 − 𝑝Ƹ 𝑥 ) 𝑝Ƹ 𝑦 (1 − 𝑝Ƹ 𝑦 )
+
𝑛𝑥 𝑛𝑦

𝑍𝑜𝑏𝑠 > 𝑍1−𝛼


𝑝𝑥 > 𝑝𝑦

𝑍𝑜𝑏𝑠 < −𝑍1−𝛼


𝑝𝑥 < 𝑝𝑦
EJEMPLO 5:
En un hospital de Concepción se quiere ver si la proporción de pacientes con hernia
lumbar es igual tanto para hombres como mujeres.
Se tiene una muestra de 90 pacientes atendidos durante el mes de agosto. Considerar
un 95% de confianza.

( 0,42−0,6
Estadístico de prueba: 𝑍= =-1,73
0,42 (1−0,42) 0,6 (1−0,6)
45
+ 45

Zona de rechazo: −1,73 ≯ 1,96 O −1,73 ≮ −1,96

57
PRUEBA IGUALDAD DE PROPORCIONES EN
INFOSTAT

58
Prueba de Irwin-Fisher para comparación de proporciones

Se consideran éxitos a valores: igual que ...(1,000000)

Clasific Variable Grupo 1 Grupo 2 n(1) n(2) p1 p2 p1-p2 p(2 colas)

SEXO HERNIA LUMBAR F M 45 45 0,42 0,60 -0,18 0,0983

59

También podría gustarte