Está en la página 1de 35

Principios de estadística

para ciencias
de la salud

Análisis de variables categóricas II:


Comparación de dos proporciones
La sesión anterior…

La distribución normal:
- Base para el cálculo de intervalos de
confianza y p-valores
- Probabilidad de ocurrencia, estandarización
de variables - ‘puntajes z’

Análisis de variables categóricas:


- Variables binarias: proporción, porcentaje
- Variabilidad muestral – incertidumbre
- Error estándar y IC95% de una proporción
Estadística inferencial

Inferencia de
Recolección parámetros
Calculo de mediante
de datos Población
mediante estadígrafos técnicas
una muestra (estimaciones) estadísticas
apropiadas

La estadística inferencial puede ser utilizada


para dos procedimientos:
- Probar hipótesis
- Para estimar parámetros
Existen dos enfoques básicos para
el análisis estadístico

estimación pruebas de
hipótesis

cuando tomamos
mediciones de una
muestra y queremos
sacar conclusiones
sobre la población
de la cual proviene
esta muestra
estimación

Por ejemplo, queremos conocer el valor promedio de


la presión arterial sistólica en la población de adultos
mayores de 45 años que viven en Teusaquillo.

Para esto, primero tomamos una muestra representativa de


adultos mayores de 45 años que vivan en Teusaquillo. Luego,
estimamos la presión media de esta muestra y utilizo esta
estimación para hacer inferencias acerca de la media de
presión arterial sistólica en la población de adultos mayores
de 45 años, en Teusaquillo. Esto se hace a través del cálculo
de intervalos de confianza.
Existen dos enfoques básicos para
el análisis estadístico

estimación pruebas de
hipótesis

métodos estadísticos utilizados para calcular la


probabilidad de obtener un resultado si la
hipótesis nula fuera cierta.
Esta probabilidad se llama el nivel de
significancia del resultado (valor p).
pruebas de
hipótesis

Por ejemplo, queremos saber si en la población


adulta de Neiva, la proporción de mujeres con
depresión es mayor que la proporción de
hombres con esta misma patología.

Hipótesis nula: no existe diferencia significativa

Hipótesis alternativa: si existe diferencia


Primero calculamos la proporción de hombres y
mujeres con depresión y luego usamos un método
estadístico que permite calcular la probabilidad de
obtener estos resultados si la hipótesis nula (de
ninguna diferencia) fuera cierta.

Si esta probabilidad es menor que un umbral


predefinido (por ejemplo 0.05), entonces la hipótesis
nula es rechazada y se puede concluir que hay una
diferencia significativa entre hombres y mujeres.
Comparando dos
proporciones
La comparación de dos proporciones (o porcentajes) es
muy común en investigaciones de ciencias de la salud.
Morbilidad, mortalidad, alternativas de tto, exposición…

Hoy vamos a ver dos formas de hacer esta comparación:


1. Test de significancia para comparación de
dos proporciones
2. Intervalos de confianza para la diferencia
entre dos proporciones
Hoy vamos a ver dos formas de hacer esta comparación:
1. Test de significancia para comparar dos
proporciones
2. Intervalos de confianza para la diferencia
entre dos proporciones

Además de aprender cómo se calculan estos estadísticos, es


muy importante comprender su interpretación. Si bien hoy
vamos a introducir el tema de test de significancia para un
problema particular que es comparar dos proporciones, la
idea es que esto nos ayude a tener una comprensión de los
test de significancia en diferentes tipos de investigación.
Mujeres
6.1% 9.6% 13.0%

Hombres
12.2% 16.3% 20.4%

Calculamos una medida para la comparación, la


diferencia en prevalencia: 6.7% (16.3% menos 9.6%)

Calculamos un test de significancia estadística o un


intervalo de confianza para esta diferencia.
Test de significancia estadística
1. Definir hipótesis del estudio ~ hipótesis nula

2. Recolectar datos en una muestra representativa

3. Calcular la medida de interés, por ejemplo, la


diferencia de proporciones (o porcentajes)

4. Aplicar el test estadístico adecuado

5. Derivar el valor de p del test estadístico -


utilizando tablas de referencia

6. Comparar este valor de p con un valor de


referencia previamente definido
7. Conclusiones - interpretación
Ejemplo
195 mujeres embarazadas que tenían riesgo de
hipertensión asociada al embarazo participaron
en un ensayo clínico que comparaba 100mg de
aspirina/día contra placebo.

El resultado de interés (variable dependiente)


era la ocurrencia de hipertensión durante el
periodo de seguimiento.

La hipótesis del estudio fue que las mujeres que


recibieron aspirina tendrían menos probabilidad
de desarrollar hipertensión comparadas con las
que no recibieron aspirina.
Resultados del estudio

Recibieron Recibieron
aspirina placebo Total

Hipertensión 12 34 46

No hipertensión 88 61 149

Total 100 95 195

Qué tan fuerte es la evidencia de que la aspirina


es mejor que el placebo? Para responder esta
pregunta haremos un test de significancia
Paso 1 - Definir la hipótesis nula
Como primer paso, necesitamos definir una hipótesis
nula. En la mayoría de casos, la hipótesis nula es lo
opuesto a la hipótesis del estudio.

En nuestro ejemplo, la hipótesis nula es que para la


población de mujeres con riesgo de sufrir hipertensión
asociada al embarazo, la proporción de mujeres que
desarrolla hipertensión es la misma sin importar si
recibieron aspirina o placebo.

H0 : %HTA aspirina - %HTA placebo = 0


La hipótesis alternativa es aquella que ‘contradice’
la hipótesis nula.

H1 : %HTA aspirina - %HTA placebo ≠ 0


Después de definir la hipótesis nula, la pregunta clave
es: “Si la hipótesis nula fuera verdad, ¿cuáles son las
posibilidades de obtener una diferencia entre los dos
porcentajes tan grande (o más) como la observada?"

Para nuestro ejemplo, cuál es la probabilidad de


obtener una diferencia en la ocurrencia hipertensión
tan grande (o más grande) que 12% vs. 35.8%?

Esta probabilidad es el valor de p


Paso 2 - Recolectar los datos

Recibieron Recibieron
aspirina placebo Total

Hipertensión 12 34 46

No hipertensión 88 61 149

Total 100 95 195


Paso 3 - Calcular las medidas de interés
Recibieron Recibieron
aspirina placebo Total

Hipertensión 12 34 46
No hipertensión 88 61 149
Total 100 95 195

En el grupo de mujeres que recibieron aspirina, el


porcentaje que desarrolló hipertensión fue:
p1 = (12/100) x 100 = 12%

En el grupo de mujeres que recibieron placebo, el


porcentaje que desarrolló hipertensión fue:
p2 = (34/95) x 100 = 35.8%
Recibieron Recibieron
aspirina placebo Total
Hipertensión 12 34 46
No hipertensión 88 61 149
Total 100 95 195

Grupo de mujeres que recibieron aspirina:


p1 = (12/100) x 100 = 12%

Grupo de mujeres que recibieron placebo:


p2 = (34/95) x 100 = 35.8%

Diferencia observada entre los dos porcentajes:


p1 - p2 = 12% - 35.8% = -23.8%
Paso 4 - Aplicar el test estadístico
El test estadístico en este caso es el test Z, que es se
obtiene de dividir la diferencia observada entre los
dos porcentajes entre el error estándar de esta
diferencia.

diferencia entre porcentajes observada


Z=
error estándar de la diferencia

p1 – p2
Z=
EE (p1 – p2)
p1 – p2
Z=
EE (p1 – p2)

El valor de Z será más grande si la diferencia entre


porcentajes es mayor relativa a su error estándar
(dando fuerza/peso en contra de la hipótesis nula)

Se obtienen valores de Z más bajos si la diferencia


entre porcentajes es pequeña relativa a su error
estándar (no dando fuerza/peso en contra de
la hipótesis nula)
El error estándar de la diferencia entre los dos
porcentajes, es dado por la fórmula:

p (100 − p) p (100 − p)
EE (p1 – p2) = +
n1 n2

p1 : porcentaje en el grupo 1
p2 : porcentaje en el grupo 2
n1 : tamaño de muestra en el grupo 1
n2 : tamaño de muestra en el grupo 2
: porcentaje total
Para nuestro ejemplo:

12.0 – 35.8
Z= = – 3.91
23.6 × 76.4 23.6 × 76.4
+
100 95

Recibieron Recibieron
aspirina placebo Total

Hipertensión 12 34 46
No hipertensión 88 61 149
Total 100 95 195
Porcentaje total = (46/195) × 100 = 23.6%
Paso 5 - Derivar el valor de p del test estadístico
¿Qué tan grande tiene que ser el valor de Z para
que podamos tener la confianza de rechazar la
hipótesis nula?
Aprovechamos el hecho de que la diferencia entre
dos proporciones tiene aproximadamente una
distribución normal, ya que esto nos permite
convertir cualquier valor de Z en una probabilidad p
Obtuvimos un valor z de: -3.91.
Miramos en la tabla de z, para determinar el p valor
que corresponde a un z = -3.91

0.00005 0.00005

-3.91 3.91

Probabilidad de encontrar un valor de -3.91 o menor = 0.00005


Este es el p valor de una cola. Sin embargo, lo más común es
calcular el p valor de dos colas: probabilidad de encontrar un
valor de 3.91 o mayor/menor en cualquier dirección
2 x 0.00005 = 0.0001
Paso 6 - Comparar el valor de p con una referencia
Usualmente valores de p menores de 0.05 se
consideran indicativos de que hay evidencia
suficiente para rechazar la hipótesis nula.

Como nuestro p valor fue 0.0001, podemos


decir que la diferencia entre porcentajes
es estadísticamente significativa al 5%

>0.1 (ej, 0.20) muy poca evidencia…


0.1 - 0.05 (ej, 0.07) evidencia podría sugerir…
0.05 - 0.01 (ej, 0.04) evidencia sólida…
0.01 - 0.001 (ej, 0.005) evidencia fuerte…
<0.001 (ej, 0.00005) evidencia muy fuerte…
Paso 7 - Conclusiones - interpretación
En nuestro ejemplo el p valor es igual a 0.0001
Eso significa que, si la aspirina y el placebo son
igualmente efectivos [la hipótesis nula], la posibilidad
de obtener una diferencia de porcentajes tan grande
como la de nuestro estudio es menor de 0.001 – muy
improbable.

Entonces podemos decir que tenemos una


muy fuerte evidencia de que el porcentaje de
hipertensión en mujeres tratadas con
aspirina es diferente (menor) que aquel en
mujeres tratadas con placebo.
Test de significancia estadística
1. Definir hipótesis del estudio ~ hipótesis nula

2. Recolectar datos en una muestra representativa

3. Calcular la medida de interés, por ejemplo, la


diferencia de proporciones (o porcentajes)

4. Aplicar el test estadístico adecuado

5. Derivar el valor de p del test estadístico -


utilizando tablas de referencia

6. Comparar este valor de p con un valor de


referencia previamente definido
7. Conclusiones - interpretación
Ejercicio en clase - comparando dos proporciones
siguiendo los pasos del test de significancia

Hombres Mujeres Total


566 313 879 Porcentajes
Si de columna
Fumar (45.1%) (23.8%) (34.2%)
No 690 1001 1691
Total 1256 1314 2570

Queremos evaluar qué tan fuerte es la evidencia


de que los hombres fuman más que las mujeres
IC 95% de la diferencia entre porcentajes

Presentar el p-valor es muy útil, pero también es


necesario prestar atención a la estimación de la
magnitud de la diferencia y expresar la incertidumbre
en tal estimación usando un intervalo de confianza.

El IC 95% para la diferencia entre dos porcentajes es:

Diferencia entre ± 1.96 × error estándar


porcentajes observada de la diferencia
IC 95% de la diferencia entre porcentajes

En el cálculo del intervalo de confianza, la fórmula


para el error estándar de la diferencia no asume la
hipótesis nula de que las dos proporciones son
iguales. Se utiliza una fórmula un poco diferente para
el error estándar:

p1 (100 − p1) p2 (100 − p2)


EE (p1 – p2) = +
n1 n2
En nuestro estudio, el IC 95% para la diferencia de
porcentajes de hipertensión entre mujeres que
recibieron aspirina y placebo:

12 (88) 35.8 (64.2)


(12.0 – 35.8) ± 1.96 × +
100 95

(12.0 – 35.8) ± 1.96 × 5.895

IC95% = -35.3, -12.2

Podemos decir entonces que la diferencia real


en el porcentaje de hipertensión entre aspirina
y placebo está entre -35.3 y -12.2
OJO Si un intervalo de confianza del 95% para
una diferencia de porcentajes incluye el valor de
0.0 (es decir, un límite es positivo y el otro es
negativo), entonces el p-valor es mayor de 0.05.

Y al contrario, si el IC 95% para una diferencia de


porcentajes no incluye el valor de 0.0, entonces
el p-valor es menor de 0.05.

Esto demuestra que existe una estrecha relación entre


los test de significancia y los intervalos de confianza.

También podría gustarte