Está en la página 1de 33

BIOESTADÍSTICA

Tema 6. Contrastes de hipótesis

1
Contraste de hipótesis:
Determina el grado de compatibilidad de los
datos con una hipótesis estadística

¿Ha aumentado la proporción de niños obesos


en los últimos diez años?
Contraste de hipótesis:
La hipótesis es una proposición que se
establece acerca de una o más poblaciones.

¿La prevalencia de obesos es igual en niños


que en niñas?
¿El % de obesos es igual en Valladolid que en
Soria?
Contraste de hipótesis:
Estas proposiciones suelen referirse a la
distribución o a los parámetros de esta
(desconocidos).

¿Los datos siguen una distribución normal?

¿Le edad media de marcharse de casa en


los jóvenes se sitúa en torno a los 30 años?
Contraste de hipótesis:
En un contraste de hipótesis se van a tener dos
hipótesis mutuamente excluyentes y
complementarias
¿La prevalencia de hipertensos es igual en
hombres que en mujeres?
Hipótesis nula (H0) :La prevalencia de hipertensos es igual en
hombres que en mujeres

Hipótesis alternativa (H1 ó Ha): La prevalencia de hipertensos


es distinta en hombres que en mujeres
• La hipótesis nula establece la afirmación sometida a
prueba

• La hipótesis alternativa representa una forma de negación


de la hipótesis nula.

• Desde el punto de vista estadístico el establecimiento de


una como nula y la otra como alternativa no es lo mismo
que elegirlas al revés.

• El probar una hipótesis estadística es decidir si la


afirmación se encuentra apoyada por la evidencia
experimental que se obtiene a través de una muestra
aleatoria del estudio.
Ejemplo:
Comparación de un tratamiento nuevo con
el tradicional

• H0: Las diferencias encontradas entre ambos


tratamientos son debidas al azar. Los resultados de
ambos tratamientos pueden considerarse iguales.

• H1: Las diferencias entre ambos son reales. El nuevo


tratamiento proporciona mejores resultados que el
tradicional
Ejemplo:
Comparación de un tratamiento nuevo con
el tradicional

H0: Los resultados de H1: El nuevo


ambos tratamiento
tratamientos proporciona mejores
e !! pueden ! ! resultados que el
o c e nt sad o
¡¡In considerarse ¡Ac
¡ u tradicional
iguales.
Posibles situaciones:
Situación de H0
Verdadera Falsa
No existen Existen
diferencias diferencias

Aceptar H0 Error Tipo II


(1-) ()
Decisión
(Resultado
del test)
Rechazar H0 Error Tipo I
(1-)
()
Elementos de un contraste de hipótesis
• Error tipo I = Rechazar Ho, siendo cierta = α

• Error tipo II = No rechazar Ho, siendo falsa= b

• Nivel de confianza=P(Aceptar Ho siendo cierta)=1- α

• Nivel de significación del test = P( Rechazar Ho siendo


cierta ) = Probabilidad de error de tipo I = α

• Potencia del test = P( Rechazar Ho siendo falsa ) =


= 1-Probabilidad de error de tipo II = 1-b
10
 
Hay que tener en cuenta que:
 
  * y  están inversamente relacionados (al
aumentar uno el otro disminuye)

  *Sólo pueden disminuirse los dos aumentando


el tamaño muestral
 
Normalmente  es controlado por el
experimentador y  (ó 1-) va a ser controlado
por la elección del tamaño de la muestra.
Estadístico de Prueba:

Es el valor (calculado a partir de los valores de la


muestra) que nos va a permitir tomar la decisión
de rechazar o de aceptar la hipótesis nula.

A partir de este estadístico podremos realizar el


cálculo de “p” (grado de significación
estadística) a través de las diferentes pruebas de
significación.
Grado de significación estadística
(p-valor)
Es la probabilidad de obtener un valor tan
extremo o más que el observado. Mide la
discrepancia de los valores observados con la
hipótesis nula.

Cuanto menor sea “p” habrá mayor evidencia


contra la hipótesis nula (o mayor a favor de la
alternativa).
Grado de significación estadística
(p-valor)
De forma arbitraria, y por convenio, suele
utilizarse un valor de =0.05.

Si p > 0.05 no tendríamos evidencias


suficientes para rechazar la hipótesis nula (las
diferencias observadas se deberían al azar)
• Se dice que un resultado es significativo si se
rechaza la hipótesis nula.

p ≤ 0.05

• Se dice que un resultado es no significativo


si no se rechaza la hipótesis nula.

p > 0.05

15
Determinación de las hipótesis: ejemplos

(1) ¿La osteoporosis está relacionada con el sexo?,


esto es:
¿el porcentaje de hombres y mujeres con
osteoporosis es similar?

“Traducido” al lenguaje estadístico:


- Hipótesis nula,
- Hipótesis alternativa,

16
Determinación de las hipótesis: ejemplos

(2) ¿El colesterol medio para la dieta


mediterránea es 6 mmol/l?

“Traducido” al lenguaje estadístico:


- Hipótesis nula,
- Hipótesis alternativa,

17
Determinación de las hipótesis: ejemplos

(3) Se realiza un recuento de bacterias en agua potable


para detectar contaminación, tomando distintas muestras.
Hay motivos de preocupación si la media se sitúa por
encima de un valor umbral , considerado un nivel de
seguridad.
Toda media por debajo de este valor no es problemática.

La solución puede ser realizar un contraste de hipótesis:


- Hipótesis nula,
- Hipótesis alternativa,

18
Ejemplo: ¿Los fumadores pesan más?
En la población de no fumadores, el peso medio es 70 kg.
¿Podríamos “demostrar” que los fumadores pesan más?,
¿unos 5 kg más?
Supongamos que la distribución del peso en los fumadores
y en los no fumadores es normal con la misma varianza, 25.

Hipótesis nula , la media del peso en los fumadores es 70


Hipótesis alternativa , la media del peso en los fumadores es 75

Para simplificar, vamos a considerar los pesos de una muestra aleatoria de tamaño
4 de fumadores, y calcularemos el peso medio… ¿cuál es la situación?

19 19
Razonamiento básico

Si es verdadera, consideramos que valores muy


extremos de son poco probables, de modo que:
Si observamos un valor de “grande”, entonces
rechazamos que sea verdadera (en favor de ).

Por ejemplo, si observamos que = 77, entonces


rechazamos .
68
𝑯 𝟎70 72 74 76 78
Decimos que el resultado es significativo.

Si en cambio observamos que = 72, entonces


NO rechazamos .
No hay ninguna evidencia en contra de .
El resultado NO es significativo.

68 70 72 74
𝑯 𝒂 76 78
Razonamiento básico

NO Rechazo de 𝒄𝟎 Rechazo de

¿Valor crítico?
68
𝑯 𝟎70 72 74

𝒄𝟎
76 78

¿Región crítica? Conjunto de valores de


que no soportan la hipótesis .

68 70 72 74
𝑯 𝒂 76 78
Probabilidades de error y tamaño muestral

n=4 n = 25

68
𝑯 𝟎70 72 74 76 78 68
𝑯 70𝟎 72 74 76 78

68 70 72 74
𝑯 𝒂 76 78 68 70 72 74
𝑯 𝒂 76 78
Estadístico-Test: ¿Los fumadores pesan más?

donde , si es verdadera.
Criterio: se rechaza para valores grandes de .

El valor “observado” de es: {}


Calculada la media, resulta ser , por lo que
el valor “observado” de es: .
¿Se rechaza ?

23
P-valor ¿Los fumadores pesan más?
¿A qué niveles de significación los datos observados no conducen a un rechazo de la
hipótesis nula ?

p-valor: Es la probabilidad de obtener un valor tan extremo o más que el observado,


suponiendo que es verdadera.

El p-valor "mide" la discrepancia de los valores observados con la hipótesis nula.

• Los datos son significativos para tests con niveles > p-valor,
y son no significativos para tests con niveles < p-valor.

Si en el ejemplo anterior el valor “observado” de es: , entonces el p-valor del test es


. ()
Por consiguiente se rechaza .

Si en cambio hubiéramos observado , entonces el p-valor sería 0.212, y no habría


evidencia suficiente en contra de .

24
P-valor
- Es la probabilidad que tendría una región crítica que comenzase exactamente en el
valor observado del estadístico-test obtenido de la muestra.
- Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0.
- Es la probabilidad de que por puro azar (suponiendo cierta la hipótesis nula)
obtengamos una muestra “más extraña” que la obtenida.
- p es conocido después de realizar el experimento aleatorio, depende de los datos.

𝒑 𝒗𝒂𝒍𝒐𝒓 =𝑷 (𝑻 ≥ 𝒕 𝒐𝒃𝒔 ∨𝑯 𝟎)

𝒕 𝒐𝒃𝒔
25
Contraste
H0: m = 70
P-valor
Ha: m > 70
El contraste es
estadísticamente significativo cuando p<a
Se rechaza H0: m = 70
Se acepta Ha: m > 70

a p

𝒙=𝟕𝟓

No se rechaza H0: m = 70
p a

𝒙=𝟕𝟑 26
Resumen: a, p-valor y criterio de rechazo

• Sobre a • Sobre p
– Es número pequeño, – Depende de los datos
elegido al diseñar el observados
experimento
– p determina si el
– a determina la región estadístico-test
crítica observado está en la
región crítica

 Sobre el criterio de rechazo


resultado significativo: si p es menor que a
27
Tests para la media 
• X normal
A1.-  conocida
Estadístico-test: X  0 x  0
T  N (0,1) tobs 
/ n H0 / n
A2.-  desconocida
Estadístico-test: X  0 x  0
T  Tn 1 tobs 
S/ n H0 s/ n

• P-VALOR
, p  PH 0(test
(T de
tobsun) lado)
, p  PH 0 ((test
T  tde un lado)
obs )

, (test de dos lados)


Si , ; Si , p  2 P (T  t ) p  2 PH 0 (T  tobs )
H0 obs

Obsérvese que el p-valor debe calcularse con la distribución N(0, 1) en el caso de conocida, y
con la t-student con n-1 g.d.l. cuando es desconocida.

28
Tests para la media  , n grande

A3 - σ CONOCIDA
X  0 x  0
• Estadístico-Test: T  
H0
N (0,1) tobs 
/ n / n

A4 - σ DESCONOCIDA
X  0 x  0
• Estadístico-Test: T   N (0,1) tobs 
S/ n H0 s/ n

El p-valor se calcula con las mismas expresiones anteriores, pero utilizando la


distribución N(0, 1) como distribución aproximada del estadístico-test T.

En otros problemas de contraste de hipótesis, la forma de actuar es similar,


cambiando el estadístico-test y el cálculo del p-valor.

29
Cálculo del tamaño muestral

• Objetivo. Seleccionar el tamaño de muestra necesario para detectar un valor de la


media relevante.
• Paso 1 – Definir una media relevante, .
– Caso 1: s es conocida aproximadamente o se tiene una buena estimación previa
– Caso 2: s desconocida. Se establece un valor del cociente :  
 0 1

• Paso 2 – Elegir los niveles de error.
• a =  para el test de un lado, y a = /2 para el test de dos lados
2
 ( Z1   Z1 a ) 
n 
  

30
Test para una proporción π
• (nEs
0 un n(1  
5, caso 0 )  5)
particular de A3
p 0
• Estadístico-Test: T   N (0,1)
 0 (1   0 ) H0

n
• p-valor para , (test de un lado) p  valor  PH 0 (T  tobs )

• Para el resto de los casos se procede de forma similar.

• Planificación del tamaño muestral para el contraste de una proporción


2
 1 / 4 Z1   1 / 4 Z1 a 
n 
  0   1 
donde a =  para el test de un lado y a = /2 para el test de dos lados.

31
Pasos a tener en cuenta:
• Plantear las hipótesis
• Especificar la significación
• Calcular el valor crítico y de prueba definiendo
las regiones de aceptación y rechazo

>

1.64 -2.26 2.26


• Decisión y conclusión
32
Confianza Significación Izquierda Derecha Bilateral

90% 10% -1.28 1.28 ± 1.64


95% 5% -1.64 1.64 ±1.96
99% 1% -2.33 2.33 ±2.58

< >

33

También podría gustarte