Está en la página 1de 50

Prueba de Hipótesis

José Moreno, MSc, PhD.


PRUEBAS DE
HIPÓTESIS
 PRUEBA DE HIPOTESIS: busca responder a
una pregunta sobre el valor de un parámetro en
la población (siempre utilizando los resultados
de la muestra).

 Esta pregunta sobre el valor del parámetro en la


población se plantea utilizando hipótesis

 El procedimiento cuantifica en que medida los


datos de la muestra apoyan (o no) la hipótesis
planteada
EN EPIDEMIOLOGÍA

Los métodos estadísticos constituyen las herramientas para el contraste formal


de hipótesis.

Las hipótesis para ser contrastadas con métodos estadísticos deben ser
formuladas de modo particular…
ELEMENTOS
NECESARIOS
 Las hipótesis

 Un procedimiento para responder a la


pregunta o hipótesis utilizando los datos
de la muestra

 Criterios para interpretar los resultados


HIPÓTESIS

Son enunciados formulados como


respuestas tentativas a preguntas de
investigación.

Pregunta de investigación  Hipótesis


MÉTODO CIENTÍFICO
Cómo funciona la Ciencia:
1. Se formula una hipótesis.
2. Se obtienen datos (muestra)
3. La hipótesis es contrastada con la
evidencia de la muestra.
4. Conclusión
• La evidencia proviene de la información de
las observaciones.

• Las observaciones se obtienen de unidades


de estudio (individuos: pacientes),
usualmente de una muestra.
HIPÓTESIS Y MÉTODO
 La pregunta de investigación debe tratar
de expresarse en forma de hipótesis o
conducer a ella.

 El método científico no permite determinar


que una hipótesis es verdadera, solamente
puede determinar si es falsa.

 Por lo tanto debe plantearse una hipótesis


que al ser rechazada dé respuesta a la
pregunta de investigación.
LAS DOS HIPÓTESIS
 Hipótesis nula, H0
Hipótesis de no diferencia o no asociación, es
planteada en forma opuesta a la pregunta de
investigación de interés, definida para ser
rechazada: “la tasa de resistencia a ambos
antimaláricos es similar”

 Hipótesis alternativa o alterna, Ha


Es la pregunta científica de interés. Asumiremos
que Ha es verdadera si los datos sugieren que H0
es falsa: “la tasa de resistencia difiere entre
ambos antimaláricos”
EJEMPLOS
Ho Ha
Riesgo relativo = 1 Riesgo relativo  1
Resistencia  50% Resistencia < 50%
XCD4-intervención = XCD4-estándar XCD4-intervención  XCD4-estándar
Sensibtest1  Sensibtest2 Sensibtest1 > Sensibtest2
Xint1 = Xint2 = Xint3 = Xint4 Algún Xi es diferente
Curaanalgésico1 < Curaanalgésico2 Curaanalgésico1  Curaanalgésico2
LAS HIPÓTESIS SE
PLANTEAN COMO:
 De existencia del EFECTO (de un tratamiento).

 De una DIFERENCIA (de las medias del peso al nacer ó


las proporciones del bajo peso al nacer entre dos
poblaciones).

 De la ASOCIACIÓN (entre el tipo de construcción de


las casas y la distribución del Dengue).
Ejemplos adicionales:

La Altura produce incremento en la frecuencia de


nacimientos prematuros  Existe DIFERENCIA
entre las Edades gestacionales de neonatos en la
Altura a Nivel del Mar.

La sustancia X incrementa la posibilidad de


malformaciones congénitas  Existe
DIFERENCIA en la prevalencia de
malformaciones congénitas entre gestantes
expuestas a X vs. No expuestas.
FORMULACIÓN DE HIPÓTESIS
(CONTINUACIÓN)
Hipótesis Nula (Ho) :
Enunciado formal para el contraste de
hipótesis con métodos estadísticos: No hay
asociación, No hay diferencia, No hay
efecto.

Hipótesis alternativa (H1):


 Hipótesis complementaria a H Si hay
o:

asociación, Si hay diferencia, Si hay efecto.


La Hipótesis nula y la Hipótesis alternativa
habitualmente (p. ej. en Epidemiología) se plantean en
función de una Medida del Efecto.

Medidas del efecto son:


 Diferencias de medias,
 Diferencias de prevalencias
 Razones de riesgo (Riesgos relativos)
HIPÓTESIS DE DOS
COLAS
 Un clínico trata de demostrar que la reacción al
tratamiento es diferente entre el fármaco A y el
fármaco B

 Hipótesis: Ho: A = B (Nula)


Ha: A  B (Alterna)
HIPÓTESIS DE UNA
COLA
 Interés específico en una sola dirección

 No existe interés/relevancia científica si el


efecto se presenta en la otra dirección

 Ejemplo: se quiere demostrar que el fármaco


A tiene mayor efecto que el fármaco B

 Hipótesis: Ho: A  B (Nula)


¿CUÁL HIPÓTESIS ES
VERDADERA (O FALSA)?
 Con los datos de la muestra se calcula un valor
(llamado estadístico de prueba) que sirve para
decidir si Ho es falsa y debe ser rechazada
(única y exclusivamente para eso)

 Los resultados sugieren que se debe rechazar


Ho, entonces automáticamente se asume que
Ha es verdadera.

 Si los resultados no indican que se rechaze Ho


tampoco se puede concluir nada sobre Ha.
USANDO EL ESTADÍSTICO DE
PRUEBA
 Con el estadístico de prueba y una fórmula
matemática (distribución de probabilidades,
que varía según el tipo de hipótesis evaluada),
se calcula una probabilidad, el valor p

 El valor p, “p”, o p-value puede interpretarse


como la probabilidad de que Ho sea verdadera

 Por convención se acepta que si p < 0.05 (5%),


entonces es muy probable que Ho sea falsa y
por lo tanto debe ser rechazada
EJEMPLO

 Queremos determinar si el promedio de peso


en varones es bajo (<70k)

 Ho: Peso  70, Ha: Peso > 70

 En 30 personas, promedio 50kg y D.E. 10 kg


EL VALOR P Y LA
EVIDENCIA
El Valor P ó Significancia estadística es una
medida (cuantitativa) de la fuerza de la evidencia
en contra de la Hipótesis nula.

Escala de grises……

Mientras más pequeño sea el valor P, más fuerte


es la evidencia en contra de la hipótesis nula.
EL VALOR P COMO UNA
PROBABILIDAD
UTILIZANDO EL VALOR
CRÍTICO
Zobservado = -10.96 Tcrítico = -1. 70

Región de
rechazo:
2.5% bajo
la curva
CÁLCULO DE
PROBABILIDAD EXACTA
Zobservado = -10.96

p exacto
= área
bajo la
curva
Una interpretación práctica (aunque no
exacta) del valor P es:

“P es la probabilidad de que la Hipótesis


nula sea cierta”

O, mejor:
“P es la probabilidad de que la Hipótesis nula
no sea falsa”
VALOR P (CONTINUACIÓN)

Si las observaciones en la muestra


soportan la Hipótesis nula. Entonces es
más probable que esta Hipótesis sea
cierta.
REGLAS DE DECISIÓN

Para tomar una decisión sobre rechazar o


no rechazar la hipótesis nula hay que
especificar una Regla de decisión.
Hay que especificar un punto de corte ó
punto crítico:
 Si P es menor que Alfa (), se rechaza H
o
PARA CADA PRUEBA, EL
CÁLCULO DE “P” PUEDE
DIFERIR
Prueba sobre Distribución
Una proporción Binomial o normal (Z)
Diferencia de 2 proporciones Z o chi cuadrado
Diferencia de 2 medias ZoT
Regresión lineal F

La fórmula del estadístico de prueba también cambia!


Normal/Large Sample Data?
Yes
Inference on means?
Yes No
Independent? Inference on variance?
Yes No Yes
Variance Paired t F test for
known? 1 variances
No
Yes Variances equal?

Z test Yes No
T test w/ T test w/
pooled unequal
2 variance variance 3
Normal/Large Sample Data?
No
Binomial?
Yes No

Independent? Nonparametric test


No
Yes
Expected ≥5 McNemar’s test

Yes No

2 sample Z test for Fisher’s Exact


proportions or test
contingency table
Ahora, recordemos que estamos
usando una muestra para
concluir sobre la población
Es posible (poco probable) que
la decisión tomada de rechazar o
no Ho sea errónea
¿Qué error podríamos cometer?
ESCENARIOS
POSIBLES
ESTADO REAL (LA VERDAD)

H0 es falsa y
H0 es verdadera,
Ha es verdadera
No hay diferencia
Hay diferencia

No diferencia NO HAY Error Tipo II


EVIDENCIA/ (No rechaza H0)) ERROR (β)
DATOS DE LA
Hay diferencia
MUESTRA (Rechazar H0 y Error Tipo I NO HAY
aceptar Ha) (α) ERROR
Posibles escenarios
ESTADO REAL (VERDAD)
desconocido
Hay Diferencia No hay diferencia

Diferencia NO HAY Error Tipo I


(Rechazar H0) ERROR
EVIDENCIA
( DATOS) (α)
observados
No diferencia NO HAY
(No rechazar H0) Error Tipo II ERROR
(β)
ERRORES EN LA TOMA DE
DECISIONES
Al tomar una decisión basados en un
punto de corte se pueden cometer uno de
dos errores:

1. Rechazar Ho siendo esta cierta


(Error tipo I).

2. No rechazar Ho siendo esta falsa


(Error tipo II)
ERROR TIPO I (Α)
 PUEDE ocurrir cuando la evidencia (datos de
la muestra) sugiere NO RECHAZAR Ho

 El error consiste en reportar una diferencia o


asociación que realmente no existe

 Puede deberse a un tamaño de muestra muy


grande que detecta diferencias no biológicas

 También puede darse por azar, estimándose


que puede ocurrir con una probabilidad “p”
ERROR TIPO II (Β)
 PUEDE ocurrir cuando la evidencia sugiere
RECHAZAR Ho

 El error consiste en reportar que no hay una


diferencia o asociación cuando si la hay

 Puede deberse a tener una muestra pequeña


que no permite detectar diferencias reales

 También puede darse por azar, aunque el


cálculo de la probabilidad (ß) es muy complejo
Habitualmente (Tradicionalmente) se especifica a

priori un punto de corte ( ) de 0.05. Esto trasladado
a nuestra regla de decisión, significa que el Error
tipo I de la prueba estadística será del 5%.
Una vez especificado el valor de  , tenemos
controlada la magnitud del Error tipo I. El Error tipo

II ( ) se controla modificando el tamaño de la
muestra.
En general   se minimizan con tamaños de
y
muestra grandes.
¿Cómo determinar el tamaño de los errores  y  ?
:Debiera depender de las consecuencias de cometer uno
u otro error ?

EJEMPLOS:
Al investigar una nueva Droga en un estudio in vitro: Si
el resultado es significativo se continua investigando;
caso contrario se abandona el estudio. En este caso tiene
más sentido minimizar  (abandonar para siempre el
estudio de una droga efectiva).
En un ensayo clínico de una Droga para tratar una enfermedad
(que tiene varios otros tratamientos efectivos). Si el resultado es
significativo, la droga entra al mercado; caso contrario el trabajo
en esta droga cesará.

El error  (abandonar el estudio de una droga efectiva para la


que existen varias opciones) no es tan importante como cometer
un error  que implicaría sacar al mercado una droga inútil.

En este caso  tendría prioridad en ser minimizada


ERRORES CONCEPTUALES
COMUNES
 Las inferencias son válidas sólo para las
muestras donde se tomaron los datos

 Si no rechazamos H0 eso significa que H0 es


considerada verdadera (no que lo sea)

 Una diferencia estadísticamente significativa


tiene relevancia biológica

 El valor p mide que tan diferentes son los


promedios/proporciones
SUPUESTOS MÁS COMUNES

 Tamaño de muestra “grande”.

 En variables numéricas, no deben haber


valores extremos o sesgos que limiten la
representatividad del promedio como medida
de tendencia central
EJEMPLO: PRUEBA DE HIPÓTESIS

Un Clínico compara la proporción de pacientes


con Hepatitis crónica que responde
favorablemente a dos tratamientos: A y B.

Hipótesis: Ho: A – B =0 (Nula)


H1: A – B ≠0 (Alterna)
Se llevó a cabo un Ensayo clínico asignando de
manera aleatoria (y ciega) la droga A y la droga
B a 300 pacientes con Hepatitis crónica.

Se observó que en el grupo que recibió la droga


A, 30% tuvieron respuesta favorable. En
contraste con el grupo que recibió la droga B
(17% respondieron favorablemente).
Especificando un punto de corte para significancia: Alfa
() = 0.05

Prueba estadística para comparar proporciones (30%


versus 17%): P=0.015

Conclusión: La diferencia en las respuestas al


tratamiento entre los grupos (droga A vs. droga B) es
significativa.
Dependiendo de la Medida del efecto
empleada (diferencias, odds ratios [OR],
riesgos relativos [RR]) y del tipo de
variables a analizar (promedios,
proporciones, tiempo hasta un evento,
etc...) las hipótesis varian, así como los
métodos estadísticos que se deben usar.
SIGNIFICANCIA ESTADÍSTICA VS.
SIGNIFICANCIA BIOLÓGICA.

La significancia estadística no dice nada acerca de la


verdadera magnitud o la importancia de un ‘efecto’.
En muestras grandes, las diferencias muy pequeñas que
tienen poca o ninguna importancia biológica pueden
resultar significativas.
Las Implicancias de un resultado ‘significativo’ deben
ser juzgados en otro terreno [el Biológico], además del
estadístico.
EJEMPLOS CON STATA (1)
Pregunta de investigación: ¿El sexo influye en
la edad de inicio del consumo de cigarrillos?

Ho: Edadinicio consumo(varones-mujeres)=0


H1: Edadinicio consumo(varones-mujeres)≠0

Datos: Encuesta de drogas


Variables: p59 (Edad de inicio del consumo de
cigarrillos) e inf_sexo (Sexo)
Prueba estadística: Prueba t para dos medias
independientes
EJEMPLOS CON STATA (2)
Pregunta de investigación: ¿Existen diferencias entre
sexos en la prevalencia de consumo de cigarrillos?

Ho: P(varones) –P(mujeres)=0


H1: P(varones) –P(mujeres)≠0

Datos: Encuesta de drogas


Variables: fuma (generada de p58) e inf_sexo (Sexo)
Prueba estadística: Prueba Z para dos proporciones

También podría gustarte