Está en la página 1de 125

Inferencia

Errores tipo I y II. Pruebas de hipótesis para


medias y proporciones

Bioestadística
Paola Viviani
Angélica Domínguez facultadmedicina.uc.cl
Tabla de Contenidos

1. Introducción
2. Test de hipótesis
3. Error tipo I y tipo II
4. Valor p y significancia
5. Resolución de un test de hipótesis

facultadmedicina.uc.cl 3
Introducción

El método científico: Pregunta de


Investigación
Volver a pensar
Plantear hipótesis
Quese pueda responder

Testear la hipótesis con un


estudio (experimental u
observacional)

Analizar los resultados

Se confirma la hipótesis Se rechaza la hipótesis

Difundir resultados
facultadmedicina.uc.cl 4
Introducción
metodo científico

Estimadores Muestra Población


(conocidos)
Muestra
x 
p̂ Inferencia p

7)
ii.
Análisis Inferencia
descriptivo Parámetros
(desconocidos)

Población

facultadmedicina.uc.cl 5
Introducción

Para responder a una pregunta, el investigador deberá seguir el


siguiente procedimiento:
• Elaborar una hipótesis estadística que refleje la creencia del
investigador acerca del parámetro poblacional de interés.
• Tomar una muestra representativa de la población en estudio y
- -

contrastar sus resultados con lo planteado en la hipótesis.


• Comparar, realizando inferencia, los resultados muestrales con lo
planteado en la hipótesis.

-
• Según lo anterior, rechazar o no rechazar la hipótesis planteada.

facultadmedicina.uc.cl 6
Test de hipótesis

Un test de hipótesis o dócima de hipótesis es un procedimiento


estadístico que permite determinar la veracidad de una hipótesis
planteada.
HO
Contrasta una hipótesis nula [null hypothesis] (𝐻0 ) y una hipótesis
alternativa [alternative hypothesis] (𝐻1 o 𝐻𝐴 ).
HA
𝐻0 : lo que el investigador quiere rechazar. Generalmente refleja la
creencia actual del problema.
𝐻1 : enunciado en desacuerdo con 𝐻0 . Suele reflejar lo que el
investigador sospecha que es verdadero.

facultadmedicina.uc.cl 7
la media ÍNAT
" °
Es distina % muscular
en futbol "
Finista ?
• Es bilateral
-
media

Test de Hipótesis Ht
Ho :

:
nq

Me
= Mt

≠ Mt
.

media % mas a
µ :

- muscular

Ejemplo 1.
Un investigador se pregunta: ¿tienen los niños con Síndrome de Down
(SD) niveles medios de glucosa diferentes a los niños sin Síndrome de
Down ? I 11-1 ( unilateral ) sentido
Pregunta en → va en

Luego, plantea la hipótesis:


𝐻0 : los niveles medios de glucosa de niños con SD son iguales a los niveles de
niños sin Síndrome de Down
𝐻1 : los niveles medios de glucosa de niños con SD son diferentes a los niveles de
( media )
niños sin Síndrome de Down . Para metros prevalencia
o :

Yg
distintas medias
la variable " la media de sin SD
es
"
glucosa il : la media de glucosa de niños cos SD es igual a glucosa
si la variable aleatoria de
es numérica ,
origen
voy a tener como

𝐻0 : 𝜇𝑆𝐷 = 𝜇𝑁𝑆𝐷 vs 𝐻1 : 𝜇𝑆𝐷 ≠ 𝜇𝑁𝑆𝐷


estimador la media muestra l

y come parametro la media poblacional .

categoria voy a tener como


si la variable es

estimador puntual en la muestra la


muestral
proporción y como para metro
proporción poblacional ( igual q en el intervalo de confianza )
'

Donde 𝜇𝑆𝐷 es la media de glicemia de niños con SD y 𝜇𝑁𝑆𝐷 es la media de glicemia de


la

niños sin SD
facultadmedicina.uc.cl
Test de Hipótesis

Los test de hipótesis pueden ser unilaterales o bilaterales.


oh ↓
no
semeja el patito
se preguntan si son
distintos , como el

Ejemplo 1. ejemplo de arriba

• Un investigador se pregunta: ¿tienen los niños con Síndrome de Down


(SD) niveles medios de glucosa diferentes a los niños sin Síndrome de
Down ?
𝐻0 : 𝜇𝑆𝐷 = 𝜇𝑁𝑆𝐷 vs 𝐻1 : 𝜇𝑆𝐷 ≠ 𝜇𝑁𝑆𝐷

• Un investigador se pregunta: ¿tienen los niños con Síndrome de Down


(SD) niveles medios de glucosa superiores a los niños sin Síndrome de
Down ? -
𝐻0 : 𝜇𝑆𝐷o
≤ 𝜇𝑁𝑆𝐷 vs 𝐻1 : 𝜇𝑆𝐷 > 𝜇𝑁𝑆𝐷

Notemos que siempre la igualdad irá en la hipótesis nula 𝐻0 .


facultadmedicina.uc.cl
Para metro no está en la muestra
MP es para metro
:
poblacional
HO : : MP es inocente

11-1 : MP es culpable
-

Ejemplo
ptlacdenatí

Test de Hipótesis M praderas parámetro poblacional


lo
.

portar
Unico
:

q podemos
evidencia estimado
"
hacer
"
es

"

Tipos
atmmNMJMY. BY mmm de
AGATA Mfgm Hipótesis
MMMM

Ejemplos de Hipótesis bilaterales.


bilateral
-
¿Es O
distinta la proporción de HTA en hombres que
en mujeres? 𝐻0: 𝑃𝐻 = 𝑃M
𝐻1: 𝑃𝐻 ≠ 𝑃M
unilateral

¿Cambia la media de presión arterial en


𝐻0: µ𝐴 = µ𝐵
hipertensos usando tratamiento A en
r 𝐻1: µ𝐴 ≠ µ𝐵
comparación con tratamiento B?

Y
¿ Es distinta la media de % muscular en tutbolistoir
masa
Ho :
Mm; Mmt
vs tenistas ?

Variables : % masa muscular numérica


'
asociacion catlnum
HI :
Ump ≠ Mmt
_

- deporte -
categórica
Es bilateral .

g.+↳ ↳
pa.ammaaampa.ar.m.a.am/..magamuga.,a "
,

tenista
i

ii. media :/ masa muscular facultadmedicina.uc.cl


Test de Hipótesis Tipos de Hipótesis

Ejemplos de Hipótesis unilaterales.

¿Es la prevalencia de alcoholismo en hombres 𝐻0: 𝑃𝐻 ≤ 𝑃M


superior a la de mujeres? 𝐻1: 𝑃𝐻 > 𝑃M

La media de presión arterial de hipertensos bajo 𝐻0: µ𝐴 ≥ µ𝐵


tratamiento A, ¿es inferior en comparación con 𝐻1: µ𝐴 < µ𝐵
hipertensos bajo tratamiento B?

facultadmedicina.uc.cl
Error tipo I y tipo II
[Type I and II errors]

Frente a una hipótesis evaluada, se pueden presentar 4 situaciones:


del investigador
la pregunta
"

Ht

va en

.

Hy : concluir equivocadamente la
pregunta
de investigación .

verdad declarar culpable cuando culpable


Redecorar , pero en .
. .
es .

cuando verdadera
Confianza : no rechazar Ho
,
es

decir que las


con el ejemplo de muy arriba , es

medias de % masa muscular es igual en


futbolistas
y tenistas

facultadmedicina.uc.cl 1
2
Error tipo I y tipo II

Notar P se Daba en responder al error tipo 1


y 2

… que inducen dos tipos de errores:


Verdad
H0 Verdadera H0 Falsa
Rechazar H0 α Con firmar la pregunta de investigación
1-β
de forma equivocada .

Error tipo I Correcto (Potencia)


Decisión P menor 0,05
valor
si tengo un

No rechazar H0 1-α β rechazo


HO

Correcto (Confianza) no rechazar HO cuando es


Error tipo II
verdadera

P(Error tipo I): 𝑃 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝐻0 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎 = 𝛼


5%
P(Error tipo II): 𝑃 𝑛𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎 = 𝛽 9

lo declaran
=

culpable
solo

si

1er test estadísticos


se
con error p .

basa
tipo
en
eeee

L y tipo
perder
2
v1
facultadmedicina.uc.cl 13
Error tipo I y tipo II

Ejemplo: Al comparar 𝑃𝑀 y 𝑃𝐻, el la proporción de HTA en hombres y


mujeres, se plantean las hipótesis:

𝐻0: 𝑃𝐻 = 𝑃M vs. 𝐻1: 𝑃𝐻 ≠ 𝑃M

•El error tipo I () equivale a considerar que 𝑃𝐻  𝑃𝑀 (que H y M difieren) cuando
en realidad no hay diferencia en la prevalencia de HTA.
•El error tipo II () equivale a considerar que 𝑃𝐻 = 𝑃𝑀 (que H y M son iguales)
cuando en realidad son distintos.
•La confianza 𝟏 −  equivale a no encontrar diferencias entre H y M cuando
realmente no las hay.
•La potencia 𝟏 −  equivale a encontrar diferencias reales entre los H y M, por
ejemplo, que los H presentan mayor HTA que las mujeres.
facultadmedicina.uc.cl 14
Valor p y significancia
[p value and significance]

El valor p es la probabilidad obtenida, a partir de los datos, de rechazar


calculo
'

valor q para Ho
saber si rechazo cuando Ho es Verd
𝐻0 dado que 𝐻0 es verdadera, es decir,
.

,
"
HO
rechazar
"
equivocadamente
,

si tengo ✗ de 0,05 ,
si
tengo valor p
menor a 0,05 entonces rechazo HO .

valor p=𝑃(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 |𝐻0 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎)

El nivel de significancia α será el máximo valor p para el cual se


rechazará la hipótesis nula.

Se rechazará la hipótesis nula, si el valor p es menor al nivel de


significancia α.

facultadmedicina.uc.cl 15
V. Ala teoria Cat .
estimador →
p muestral
.
si " Mme" ce : • timador =
☒ → " " "anal
prevalencia :
☒ usa con

parámetro
→ P poblacional % proporción
y
.
.
.

Resolución de un test de hipótesis


alta →•
ataja Raja MGM aaa Maa
Ma ooo
MAH Gooooool •as•

Queremos que la probabilidad de rechazar erróneamente 𝐻0 sea a lo


más 𝛼 (que en general es 𝛼 = 0,05). -

valor p = 𝑃 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝐻0 𝐻0 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎 i. INI


i
Si es menor a α (0,05) Si es mayor a α (0,05) no
rechazo 𝐻0 . rechazo 𝐻0 .

Distintos tipos de test de hipótesis se razonan y concluyen de manera '

DNI
'

similar.

facultadmedicina.uc.cl 16
Test de Hipótesis Planteamientos para medias

Posibles planteamientos de Hipótesis para dos medias:

a. 𝐻0 : 𝜇1 = 𝜇2 𝑣𝑠. 𝐻1 : 𝜇1 ≠ 𝜇2 -
.
-

b. 𝐻0 : 𝜇1 ≥ 𝜇2 𝑣𝑠. 𝐻1 : 𝜇1 < 𝜇2 \

c. 𝐻0 : 𝜇1 ≤ 𝜇2 𝑣𝑠. 𝐻1 : 𝜇1 > 𝜇2

Posibles planteamientos de Hipótesis para dos proporciones:

a. 𝐻0 : 𝑃1 = 𝑃2 𝑣𝑠. 𝐻1 : 𝑃1 ≠ 𝑃2
b. 𝐻0 : 𝑃1 ≥ 𝑃2 𝑣𝑠. 𝐻1 : 𝑃1 < 𝑃2
c. 𝐻0 : 𝑃1 ≤ 𝑃2 𝑣𝑠. 𝐻1 : 𝑃1 > 𝑃2

facultadmedicina.uc.cl
Test de Hipótesis
Planteamientos para medias
Tabaquismo y Riesgo coronario en un centro de salud, estudio retrospectivo. Rev Esp Salud Pública. 2017;
Vol. 91; 25 de enero e1-e6.
1) 2 variables
asoc .

Numerical
Edad -

Fumar
-

Cat

2) ilparametror
" M
dittonadores
aquí
-

se asocia con pod


,
Fumadores anti - nde NO Fue
: media Edad en
F
Mq
media de edad en NF
Mnq :

3) .

Ho : MF =
MNF
Hr :
Mf f- MNF

Conclusion : Rechazo GÍ
las medias
sean
iguales
-

de IMC
Calcular el intervalo de confianza


F
para
'

- * ± 1.96

27,9 ± 1.96
.

4.3%7 = 0.49

gjlautvera colesterol total 127.42° .


" '

rechaza 2995 ± 1.46 4,5 /V77 0.3


goncwcraii se
-
.

no

diferencia
Ho ,
: no
hay no hay evidencia
( zonas ; 29.25 )
significativa ,

significativa

facultadmedicina.uc.cl
variable diabetes

1) Diabetes no
T-mua.tn
cát Lat

2) Parámetros .

Proporción :
Prop Diabetes en F
¡ .

Pz :
Prop Diabetes
.
en NF

3) .

Ho :
Pp = Pz
# ve en la
919
)
:
se

la hip . se plantea sobre entonces fabla en C)


la poblacional
Ña
.

0,23
Hp :
P
,
=/ Pa
:

Conclusion
'

solapan ?
:
se

No Rechazo pq es
Aga 0,05
No hay evidencia .

para decir que

son distintas .

tabaco no se asocian
Diabetes y
Test de Hipótesis

Ejercicio:
DESCRIPTIVOS: Comparemos la proporción de hipertensión arterial (HTA) entre
fumadores y no fumadores. ¿qué proporción tienen?
INFERENCIA USANDO TEST DE HIPÓTESIS
1. Escribimos las hipótesis que se están contrastando.
2. Contrastamos el valor p con el nivel de significancia. Concluimos
3. Interpretamos.

INFERENCIA USANDO IC
1. Hacemos el IC 95% de HTA para el grupo de fumadores
2. Hacemos el IC 95% de HTA para el grupo de no fumadores:
3. Comparamos los IC95% ¿se cruzan?

facultadmedicina.uc.cl
Test de Hipótesis

Ejercicio:
DESCRITIVOS: Comparemos la media Colesterol Total entre fumadores y no fumadores.
¿qué medias tienen?

INFERENCIA USANDO TEST DE HIPOTESIS


1. Escribimos las hipótesis que se están contrastando.
2. Contrastamos el valor p con el nivel de significancia. Concluimos
3. Interpretamos.

INFERENCIA USANDO IC
1. Hacemos el IC 95% para la media de CT en el grupo de fumadores
2. Hacemos el IC 95% para la media de CT en el grupo de no fumadores
3. Comparamos los IC95% ¿se cruzan?

facultadmedicina.uc.cl
facultadmedicina.uc.cl
Departamento de Salud Pública

Bioestadística
Inferencia
Asociación de Variables
Tabla de Contenidos

• Introducción

• Tipos de Asociación
Introducción

Nos concentraremos en responder a una pregunta de investigación (o


hipótesis), analizando la asociación de dos variables aleatorias

-
involucradas, lo que se conoce como análisis bivariado.

Para averiguar si existe asociación entre dos variables aleatorias se


debe realizar un test de hipótesis. La elección del test dependerá del
El tipo de test
↑ tipo de variables a relacionar.
O

o
/ Jr
la Dos variables están asociadas si cambios en los valores de una de
ellas produce cambios en los valores de la otra. ¥¥E¥
si una variable aleatoria no produce cambio
en otra , no afecta en her valores de la otra eso
,

es decir
que son independientes
Introducción

• Es común que una Pregunta de Investigación consista en explicar un


determinado fenómeno o “outcome”. Lo que se quiere explicar es
medido por una variable aleatoria, la cual es llamada variable
explicada, dependiente o respuesta (𝒀). → determinado Quemen
"
out come "

• Por otra parte, la búsqueda de una explicación para el fenómeno se


hace a través de otro conjunto de variables que podrían estar
asociadas al problema. Estas son llamadas variables explicatorias,
independientes o factores (𝑿 si es una variable la que explica;
𝑿𝟏 , 𝑿𝟐 , … , 𝑿𝒌 si son 𝑘 variables las que explican el fenómeno de
interés).
Introducción

Ejemplo: Interesa determinar variables asociadas a SM¡ "drone


""

ID Edad NEDU ZONA REGION SEXO EST_CIVIL SIST_SAL Ctotal HDL LDL TG Tab_Act RCV SM
1 42 2 12 1 7 5 4 2
2 16 2 12 1 7 2 2 2
3 25 2 1 13 1 2 1 159 52 91 82 2 1 0
4 61 1 1 13 2 2 5 220 34 141 224 1 3 1
5 52 2 1 13 1 2 5 170 36 81 265 3 2 1
6 57 2 1 13 1 4 5 1 2
7 29 2 1 13 2 2 7 175 49 109 86 3 1 0
8 70 1 1 13 2 6 4 260 50 174 177 3 1 0
9 22 3 1 13 2 7 4 161 43 101 82 4 1 0
10 24 3 1 13 2 7 4 166 62 82 114 4 1 0
11 49 3 1 13 2 7 7 145 42 85 92 3 1 0
sentido cuando la variable
12 17 2 1 13 2 7 4 150 56 84 47 2 1 0 toma
es
mas
modificable .

13 39 2 1 13 2 1 1 210 41 137 161 4 1 1


14 40 2 1 13 1 2 5 1 2
15 53 2 1 13 2 1 9 205 39 120 234 4 2 1
no puedo modificarlas
no

para
podemos
,

hacer nada
modificar las
V. explicada (Y)
Variables explicatorias (X)
Tipos de Asociación

La variable respuesta (Y) y la variable explicatoria (X) pueden ser de tipo


categórica o numérica. De acuerdo a esto, considerando solo
asociaciones bivariadas, una PI puede contener una de las siguientes
asociaciones:

Situación Variable Y Variable X


1 Categórica Categórica
2 Numérica Categórica
3 Categórica Numérica
4 Numérica Numérica

Las situaciones 2 y 3 son tratadas de la misma forma, cambiando sólo la


interpretación de su resultado.
Tipos de Asociación

Pregunta de Investigación Tipo de Asociación

Días de hospitalización de acuerdo a vía de X= admisión


admisión (Programada, Urgencia o Extraord.). Y= Dias de hospitalización

Diferencia entre hombres y mujeres en la X= Hombre o


mujer
prevalencia de diabetes (ENS2009-2010) Y= Diabetes

¿Existe una relación entre la edad de la madre } ambas


son
var .

numericaí
X= edad de la madre
y el aumento de peso durante el embarazo? o Y= aumento de peso
categórica mimen la
X= edad
@ edad.
Diabetes (DM) según
Y= Diabetes
Recuerda : ✗ siempre es
Fija
Y puede variar
Tipos de Asociación

Asociación entre diabetes mellitus tipo 2 y actividad física en personas con


antecedentes familiares de diabetes (Peterman et al. 2018).
-
Tipos de Asociación

Ejercicio:

Para el Resumen del artículo Asociación entre diabetes mellitus tipo 2 y


actividad física en personas con antecedentes familiares de diabetes
(Peterman et al. 2018).

Identifique:

A. Posible Pregunta de Investigación (bivariada).


B. Variables aleatorias.
C. Tipo de asociación.
Tipos de Asociación

La estadística descriptiva que se utilice para mostrar resultados, el


test estadístico que se aplique para contrastar la hipótesis, las
medidas del efecto que se calculen y la interpretación de los
resultados dependen de:

• el tipo de variables que se quiere asociar y

• el diseño del estudio (temporalidad y número de mediciones)

como interpreto el valor p


Asociación de variables
Asociación Categórica- Categórica

Bioestadística
Paola Viviani
Angélica Domínguez facultadmedicina.uc.cl
Tabla de Contenidos

1. Introducción: asociación de dos variables categóricas.


2. Tipos de estudio bi variables

3. Tipos de estudios y asociación de dos variables categóricas


4. Prueba Chi-cuadrado de Pearson
5. Ejemplo.

si no

si es Íat es proporción
es µ
si es numérica

facultadmedicina.uc.cl
facultad media in
3
Introducción

En estudios científicos interesa conocer si se asocian dos o más


variables. Dos variables están relacionadas o asociadas si cambios en
los valores de una de ellas, produce cambios en los valores de la otra.
Para averiguar si existe asociación entre dos variables aleatorias se
debe realizar un test de hipótesis. La elección del test dependerá del
tipo de variables a relacionar.

Situación Variable Y Variable X


1 Categórica Categórica
2 Numérica Categórica
3 Categórica Numérica
4 Numérica Numérica

facultadmedicina.uc.cl 4
Introducción

Se desea determinar la eficiencia de dos intervenciones motivacionales


en adolescentes para conseguir el cese del tabaquismo: O intensiva
(cuatro sesiones de 15 minutos, reducción progresiva del consumo) y
breve (sesión única de 15 minutos, cese inmediato del consumo).
intervención -
cat

cese de tabaquismo Cat -

hace /
"
"
breve

pqpamefgocj.thepoicion%Eese.de
intensiva
tabaco en
quien

A. ¿Tienen la misma eficiencia dos intervenciones motivacionales en


!
adolescentes, para conseguir el cese del tabaquismo? Rinvest
y

B. ¿Es más eficiente una intervención intensiva que una intervención


breve, ambas en adolescentes, para conseguir el cese del tabaquismo?
tipo intervención
Cat Parametros proporción De serie intensiva
Variables
-
:

% breve
:
Cat !
cese tabaquismo -

facultadmedicina.uc.cl 5
UN

Introducción

¿Qué variables hay involucradas en esta pregunta de investigación?


¿A qué tipo de variables corresponden?

I Hay dos variables involucradas: E


• Abstinencia a x tiempo:
Posibles respuestas: sí/no
Corresponde a una
Variable de tipo categórica
asociación de tipo
Variable dependiente o respuesta
Categórica - Categórica
•≥ Tipo de Intervención: E
Posibles respuestas: Intensiva o Breve
Variable de tipo categórica
Variable independiente o explicativa
facultadmedicina.uc.cl 6
Asociación de dos variables categóricas

Cuando se quiere asociar las variables X e Y, ambas categóricas con dos o


más niveles cada una, se puede construir una tabla de contingencia.

El caso más simple es una tabla de 2x2 como la siguiente:


Tar
Aaa

se
Y
escriben
105
(evento de interés)
(+) (-) total
X (+) a b a+b
(exposición) (-) c d c+d
en el ejemplo de arriba
seria la intervención
total a+c b+d n

facultadmedicina.uc.cl 8
Asociación de dos variables categóricas

¿Cómo interpretar cada uno de los posibles % de tabla disponibles?

'

muera dado q
no se de
Tabla construida en Minitab
f) tiene compromiso
conciencia

Comentarios:
"
" ^^

"
"
"
'
T
" en
cnn.ci
Asociación entre X e Y se muestra con % de fila


de
no
muera
o % de columnas. Nunca con % del total.
asociacion entre
Cuando uno quiere
ver

variables ) debe trabajar con la

proporción condicionada hacia al lado


hacia abajo
o la condicionada .

Nunca con la proporción del total

facultadmedicina.uc.cl
9
Asociación de dos variables categóricas

Ejemplo 1.
Interesa determinar si existe asociación entre el compromiso de
conciencia al examen físico (1: Sí; 0: No) y mortalidad a 30 días (1: Sí; 0:
No) por neumonía adquirida en la comunidad (NAC), para un total de
441 personas.
siempre con % ,
¡

Muerte

Sí No Total
27 84
Sí 111
Compromiso (24.3) (75.7)
de conciencia 18 312
No 330
(5.4) (94.5)
Total 45 396 441
facultadmedicina.uc.cl 10
Introducción a tipos de estudios

La estadística descriptiva que se utilice para mostrar resultados, el


test estadístico que se aplique para contrastar la hipótesis, las
medidas del efecto que se calculen y la interpretación de los
resultados dependen de:

• el tipo de variables que se quiere asociar y


• el diseño del estudio (temporalidad y número de mediciones)

facultadmedicina.uc.cl
Tipos de estudios

Existen muchos criterios para clasificar un estudio, en este curso se


revisarán solo según:
tivesiesihesthgpective o prospectivo
Temporalidad hoy conozco
el favor de ex.PK BÁM


Pasado Futuro →

Y : casos de control Retrospectivo Prospectivo


Caleño Y conoce ✗
Hugo que
Tengo que esperar ely
revisar para saber el X

Número de
mediciones sucesivas

Transversal Longitudinal
"
"
Encuesta nacional de salud si Es una Fotó tomo + de una medida
ej : antes
,
durante , después mido el peso

facultadmedicina.uc.cl
Tipos de estudios

Temporalidad

Se mide en relación al momento en que ocurre el evento de interés.

a) Retrospectivo: el evento de interés ya ocurrió, esto separa a los


grupos y el investigador mira hacia atrás.

a) Prospectivo: al momento del estudio el evento aun no ocurre, los


grupos se separan por exposición y se siguen hasta ocurrencia (o
no ocurrencia) del evento.

facultadmedicina.uc.cl
13
Tipos de estudios

Estudio Retrospectivo (Caso-Control)


Se reconstruye su historia buscando
factores asociados
¿Presenta o no el evento de interés?
El investigador fija el n para cada grupo

¿Expuesto o no expuesto?
El investigador puede fijar o no fijar la cantidad de expuestos

Se siguen por un tiempo acotado y se


observa si se presenta el evento
Estudio Prospectivo (Cohorte)
facultadmedicina.uc.cl
Tipos de estudios y asociación de dos variables
categóricas
El diseño del estudio, determina las proporciones que interesa
comparar.
ni //
Presentan
Casos :
#
"
de interés

Estudio prospectivo Presentan aotcan


: no
Controles
Estudio retrospectivo

Y
(evento de interés)
(+) (-) total *
°

𝑎 n° recién
pesan
nacido 9
+
.

delo Aitor
'

𝑝1 =
Intervención

X (+) a b a+b 𝑎+𝑏 total


con
de mujeres
intervención

𝑐
no intervención

(exposición) (-) c d c+d heantoá Mücn nacido r


de v3 kilos

𝑝2 =
Pesan

𝑐+𝑑
sin
En el total de mujeres
intervención

total a+c b+d n 1- alta que P2 significa


𝑎
si
qt toman leche
toman leche, dado tiene pl es

𝑏
'
dado que q
Prop
no
.
de Personas /
tiene esfopororis estropeéis
la intervención sirve

𝑝1 =
que

𝑝2 =
tomo un n

𝑎+𝑐 𝑏+𝑑
hago ejercicio µ
"

Para estudios de cohorte (prospectivos) y de caso-control


(retrospectivos), las proporciones 𝑝1 y 𝑝2 calculadas tendrán leves
modificaciones de interpretación. facultadmedicina.uc.cl 15
Prueba Chi cuadrado de Pearson
[Pearson chi squared test]

Para contrastar si dos variables están asociadas, es necesario realizar


un test de hipótesis. Las hipótesis planteadas para estudios
longitudinales o transversales son equivalentes.

Las hipótesis de interés son:

𝐻0 : 𝑙𝑎𝑠 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑛𝑜 𝑠𝑒 𝑎𝑠𝑜𝑐𝑖𝑎𝑛


𝐻1 : 𝑙𝑎𝑠 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑠𝑒 𝑎𝑠𝑜𝑐𝑖𝑎𝑛
Prueba chi cuadrado de Pearson. La hipótesis
𝐻0 : 𝑝1 = 𝑝2 si me
se
dan iguales es queno
asocian . planteada siempre conducirá a una tabla de
𝐻1 : 𝑝1 ≠ 𝑝2 si existe asociación contingencia. Cualquiera sea la dimensión de
en las 2 variables
esta tabla, la asociación se determina
mediante el test chi-cuadrado.

facultadmedicina.uc.cl 16
Prueba Chi cuadrado de Pearson

En tablas de 2x2 es posible calcular el test Chi-Cuadrado con la siguiente


fórmula:

𝑛 𝑎𝑑 − 𝑏𝑐 2
2
𝜒02 = ∼ 𝜒(1)
(𝑎 + 𝑐)(𝑏 + 𝑑)(𝑎 + 𝑏)(𝑐 + 𝑑)
dado ×
grados de libertad quedan
El valor χ20 sigue una distribución χ2 con 1 g.l. (n filas – 1 x n col. -1)
si la tabla es
de 2 ✗ 2 queda
𝐻0 : 𝑝1 = 𝑝2 1 grado ✗ 1- grado

𝐻1 : 𝑝1 ≠ 𝑝2
2
Si el valor calculado 𝜒02 es mayor al de tabla 𝜒(1,1−𝛼) se rechazará la
hipótesis nula. Para una tabla de 2x2 y una significancia de 0,05, el valor
2 2
de tabla 𝜒(1,1−𝛼) = 𝜒(1;0.95) = 3,84.
facultadmedicina.uc.cl 17
Prueba Chi cuadrado de Pearson

valor
p 519 entonces rechazo Ho ,
sale
Ejemplo 1. ?
si el ,

las variables se asocian


ése significa que las dos
es decir proporciones son, distintas

Interesa determinar si existe asociación entre el compromiso de


conciencia al examen físico (1: Sí; 0: No) y mortalidad a 30 días (1: Sí; 0:
T
No) por neumonía adquirida en la comunidad (NAC), para un total de § U

→q÷÷:÷
existe si asociación entre compromiso de conciencia

441 personas. ◦ no
Es

{ siii
En este caso, ÷:
Retro ↓ Muerte
𝑝1 =
27
111
= 0,243 y 𝑝2 =
18
330 .
= 0,05

Sí No Total
Y las hipótesis a contrastar son:
27 84 𝐻0 : 𝑝1 = 𝑝2
Sí 111
Compromiso (24.3) (75.7) 𝐻1 : 𝑝1 ≠ 𝑝2
de conciencia 18 312
No 330
(5.4) (94.5) Donde 𝑝1 y 𝑝2 representan a los parámetros
Total 45 396 441 poblacionales.
facultadmedicina.uc.cl 18
Prueba Chi cuadrado de Pearson

Como estamos en el caso de una tabla de 2 × 2, el estadístico de prueba


𝜒02 se puede calcular directamente como:
asi se calcula el Chi cuadrado

𝑛 𝑎𝑑 − 𝑏𝑐 2
𝜒02 =
(𝑎 + 𝑐)(𝑏 + 𝑑)(𝑎 + 𝑏)(𝑐 + 𝑑)

2 I
441 ⋅ 27 ⋅ 312 − 84 ⋅ 18
gi en
=
este valor chi cuadrado
.

a 3.94 entonces45 ⋅ 396 ⋅ 111 ⋅ 330


= 32.28 EE
es menor
salir un valor P no significa tiro
va a


rematar Ho

me voy
y

Como 𝜒02 = 32.28 > 3.84, que corresponde a un 𝑣𝑎𝑙𝑜𝑟 𝑝 < 0.001 (entregado
por software), se concluye hay suficiente evidencia para confirmar que las
variables están asociadas (se rechaza 𝐻0 ). Es decir, hay evidencia para
concluir que exista relación entre el compromiso de conciencia y la
mortalidad en pacientes con NAC. Por el valor de las proporciones
muestrales, se puede concluir que…. 19 facultadmedicina.uc.cl
Prueba Chi cuadrado de Pearson

Ejemplo 2. A Partir de los datos de la ENS interesa averiguar si existe


asociación entre Nivel Educacional y presencia de Síndrome Metabólico.
:÷÷÷÷: HO :/
s
NEA

:
¡ °
Hipótesis:
𝐻0: 𝑝1 = 𝑝2 = 𝑝3
distinto es

𝐻1: 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝑝𝑎𝑟 𝑝𝑖 ≠ 𝑝𝑗


.

sii i
: (𝑖, 𝑗 = 1 … 3)
:*:<E-
÷ :
-

Pearson chi2(2) = 128.7084 Pr = 0.000

¡EÉÉgÉ
Se informa como valor-p < 0.001
amague tiene
-1

enfermedad
educación tiene
www.ereaaaltagease-iasindrememetuboticocon
nivel educacional
menor

facultadmedicina.uc.cl 20
Prueba Chi cuadrado de Pearson

Ejemplo 3. Un estudio quiere determinar cómo se relacionan el riesgo de


osteoporosis y los niveles de vitamina D en pacientes infectados por VIH
después de haber iniciado terapia antiretroviral. La siguiente tabla muestra
las características de pacientes infectados comparado con pacientes sanos.

facultadmedicina.uc.cl 21
Resumen

• Una prueba estadística que permite averiguar si dos variables


categóricas están relacionadas, es la prueba Chi cuadrado de
Pearson, donde las hipótesis de interés son:
𝐻0 : 𝑝1 = 𝑝2 (las variables 𝑋 e 𝑌 no se asocian)
𝐻1 : 𝑝1 ≠ 𝑝2 (las variables 𝑋 e 𝑌 se asocian)

• Se rechazará la hipótesis nula si el valor-p encontrado es inferior al


nivel de significancia.

• Si valor − 𝑝 < 𝛼 entonces existe asociación entre 𝑋 e 𝑌.

Prevalencia es una medida de Resumen

de variable aleatoria

facultadmedicina.uc.cl 22
Asociación de dos variables categóricas

Posibles metodologías (test) de acuerdo al objetivo del estudio:


Saber si existe Test Chi-Cuadrado
asociación (Test Exacto de Fisher)

Calcular medidas de OR (Caso-Control)


magnitud del efecto RR (Cohorte)
Objetivo
Saber si existe Test de Kappa
concordancia Test de Mc Nemmar

Evaluar un Test Sensibilidad/Especific


diagnóstico VPP / VPN
facultadmedicina.uc.cl 23
facultadmedicina.uc.cl
Asociación de variables
Asociación Categórica- Categórica
RR y OR

Bioestadística
Paola Viviani
Angélica Domínguez facultadmedicina.uc.cl
Tabla de Contenidos
1. Riesgo Relativo (RR).

2. Intervalo de Confianza para RR.

3. Razón de Chances (OR).

4. Intervalo de Confianza para OR.

5. Relación Test Chi Cuadrado y OR/RR

facultadmedicina.uc.cl 3
Introducción

Posibles metodologías (test) de acuerdo al objetivo del estudio para cat-cat:

Saber si existe Test Chi-Cuadrado


asociación (Test Exacto de Fisher)

Calcular medidas de OR (Caso-Control)


magnitud del efecto RR (Cohorte)
Objetivo
Saber si existe Test de Kappa
concordancia Test de Mc Nemmar

Evaluar un Test Sensibilidad/Especific


diagnóstico VPP / VPN
facultadmedicina.uc.cl 5
Introducción

Consideremos la relación entre la exposición a un factor y la presencia de una


enfermedad (ambos con niveles presente/ausente).

Estudio prospectivo calculo RR


| Estudio prospectivo
si es transversal o retrospectivo OR Estudio de cohorte
Estudio retrospectivo

Y
(evento de interés)
(+) (-) total 𝑎
(+) a b a+b 𝑝1 =
X 𝑎+𝑏
(exposición) (-) c d c+d 𝑐
𝑝2 =
𝑐+𝑑
total a+c b+d n
𝑎 𝑏
Estudio caso-control 𝑝1 = 𝑝2 =
𝑎+𝑐 𝑏+𝑑
facultadmedicina.uc.cl 6
Introducción

Dos indicadores de riesgo para medir la magnitud de asociación son:

• El Riesgo Relativo (RR), que se usa en estudios prospectivos.

• La Razón de Chances también conocida como Odds Ratio (OR), que se


utiliza en estudios retrospectivos o de prevalencia.

En ambos indicadores, se obtiene un valor que permite cuantificar


cómo la Exposición (X) tiene un efecto en el evento de interés (Y).

facultadmedicina.uc.cl 8
Riesgo Relativo

El Riesgo relativo cuantifica el riesgo a través de la razón de la tasa de


incidencia de Y(+) en el grupo que tiene el factor X(+), dividido por la tasa
de incidencia de Y(+) en el grupo X(-).
→ Prob de enfermar
.
dado que está expuesto
𝑎
𝑃(𝑌 = 1|𝑋 = 1) = 𝑝1 =
𝑎+𝑏
p enfermar dado
, que no
notaba expuesto
𝑐
.

𝑃(𝑌 = 1|𝑋 = 0) = 𝑝2 =
𝑐+𝑑

dice que la
si RR es igual a uno
marca la diferencia
𝑝1 exposición no

El Riesgo Relativo se define 𝑅𝑅 = Por lo tanto en el chi 2 sale


p> • es
𝑝2 entonces digo que no Rechace Ho
me se asocian
Y que las Lvariabiers
RR mayor a 1 significa que ptesd apl
lo tanto produce una
mayor
por
proporción facultadmedicina.uc.cl 9
la exposicion piedras enel chofer
Riesgo Relativo

Por la forma como se calcula, el RR siempre es positivo, y se puede


interpretar de la siguiente manera:

• Si RR = 1, significa que la proporción de enfermos es igual en


expuestos y no expuestos, por lo que el factor de exposición no se
)
decir valor P
asocia con la enfermedad. El factor de exposicion
no Y (
se asocia con es no

significativo

=
• Si RR < 1, la variable de exposición es un factor protector de la
enfermedad, ya que 𝑝1 es menor que 𝑝2 .

• Si RR > 1, la variable de exposición es factor de riesgo de la


enfermedad, ya que 𝑝1 es mayor que 𝑝2 .

facultadmedicina.uc.cl 10
Riesgo Relativo

Calcular el intervalo de confianza del RR


Es útil presentar el RR estimado junto al siguiente intervalo de confianza
de nivel 1 − 𝛼 × 100%:

𝑏 𝑑 𝑏 𝑑
exp ln 𝑅𝑅 − 𝑧1−𝛼 + ; exp ln 𝑅𝑅 + 𝑧1−𝛼 +
2 𝑎⋅ 𝑎+𝑏 𝑐⋅ 𝑐+𝑑 2 𝑎⋅ 𝑎+𝑏 𝑐⋅ 𝑐+𝑑

Si el intervalo de confianza cubre al valor 1, entonces diremos que no


existe suficiente evidencia para decir que el riesgo de expuestos y no
expuestos es diferente., con una confianza de (1 − 𝛼) × 100%.

facultadmedicina.uc.cl 11
Riesgo Relativo

Ejemplo 1: En un estudio se quiere determinar el riesgo de morir a los


30 días en pacientes que entran al hospital por una neumonía
adquirida en la comunidad, según si existe compromiso de conciencia
al ingreso.
Estado a 30 días
Muerto Vivo total
Compromiso Sí 27 84 111
de conciencia No 18 312 330
total 45 396 441

facultadmedicina.uc.cl 12
Riesgo Relativo

Para confirmar que es un


factor de
Dado que el estudio es prospectivo, de la tabla se tiene: riesgo falta el
intervalo de confianza

e-
27/111
RR= = 4.46
18/330

Un intervalo al 95% de confianza para riesgo relativo, calculado con la


fórmula descrita antes, es (2,6 ; 7,8).

Luego, el riesgo de morir de pacientes que presentan compromiso de


conciencia al ingreso es 4.46 veces el riesgo de los que no presentan
dicho compromiso.
Interpretación. Con confianza del 95% se puede afirmar que el riesgo de
morir cuando existe compromiso de conciencia es entre 2.6 y 7.8 veces
que cuando no existe compromiso de conciencia.
facultadmedicina.uc.cl 13
Riesgo Relativo

Ejemplo 2. En recién nacidos prematuros, se probó dos terapias para


tratar la insuficiencia respiratoria. Se reportan los RR de sufrir algunas
liando el valor P
complicaciones para los dos tratamientos. 1-
significativo
es , el RR
no
pasa por

" EII
¥: ÷::

facultadmedicina.uc.cl 14
usar el ok
si el estudio es transversal hay que

Razón de Chances
OR
En un estudio retrospectivo (caso control) o transversales, recurriremos
a la definición de Chance de estar expuesto entre quienes están
enfermos y quienes no lo están. Pide estar expuesto ,
dado q
'

soy la no estar
expuesto si es
que soy
casi

𝑃(𝑋 = 1|𝑌 = 1) 𝑝1
𝑂𝑑𝑑𝑠1 = =
𝑃(𝑋 = 0|𝑌 = 1) 1 − 𝑝1

𝑃(𝑋 = 1|𝑌 = 0) 𝑝2
𝑂𝑑𝑑𝑠2 = =
𝑃(𝑋 = 0|𝑌 = 0) 1 − 𝑝2
P de
.

estar expuesto ver contra


. he no estos expuestos en

en
los
controles

Retrospectiva o transversales
estudiar 𝑎 𝑐
Es para
𝑂𝑑𝑑𝑠1 / 𝑎𝑑
Razón de Chances: 𝑂𝑅 = = 𝑎+𝑐
𝑏
𝑎+𝑐
𝑑 =
Producto cruzado 𝑂𝑑𝑑𝑠2 / 𝑏𝑐
𝑏+𝑑 𝑏+𝑑

El OR no cambia si se calcula con las proporciones obtenidas de manera


prospectiva de la tabla.
facultadmedicina.uc.cl 15
Razón
B de Chances

La interpretación de una razón de chances, en estudios transversales


en que se decide considerar el % de fila, es similar (no igual) a la
interpretación de un riesgo relativo:

para al lado ,
significa que la
chance es el obeso dado que no come comida saludable
• Si OR = 1, significa que la chance desarrollar el evento de interés es
similar en expuestos y no expuestos. es la chance de obeso
-> = a ser

en
quienes no

obeso comen
°"
chance de ser obeso en los pacientes que come comida no saludable , es menor de ser
Kar q
'

• Si OR < 1, entonces la chance desarrollar el evento de interés es comida


saludable
menor en los expuestos que en los no expuestos. Luego la
exposición es un factor protector de la enfermedad.
" comen
la chance
de ser obeso en quienes comen comida saludable , es mayor en quienes comida
• Si OR > 1, entonces la chance de desarrollar el evento es mayor en saludable
los expuestos que en los no expuestos. Luego la variable de
exposición es factor de riesgo de la enfermedad.
facultadmedicina.uc.cl 16
Razón de Chances

É La interpretación de una razón de chances, en estudios retrospectivos,


debe hacerse cargo de la temporalidad. Luego:
e.
de comida saludable =
alos casos controles


comer no
chance

• Si OR = 1, significa que la chance de haber estado expuesto es


similar en los que desarrollan y no desarrollan el evento de interés.
la chance de comer comida no saludable es menor en her no obesos que los obesos
• Si OR < 1, entonces la chance de haber estado expuesto en los que
desarrollan el evento de interés es inferior a la chance de haber
estado expuesto en los que no desarrollaron el evento de interés.
Luego la exposición es un factor protector de la enfermedad.
de tomar comida me saludable es
mayor en 1er e besar
la chance
• Si OR > 1, entonces la chance de haber estado expuesto en los que
desarrollan el evento de interés es superior a los que no
desarrollaron el evento de interés. Luego la variable de exposición
es factor de riesgo de la enfermedad. facultadmedicina.uc.cl 17
Razón de Chances

Al igual que en el caso del riesgo relativo, es útil presentar la razón de


chances con el siguiente intervalo de confianza 1 − 𝛼 × 100%.

1 1 1 1 1 1 1 1
exp ln 𝑂𝑅 − 𝑧1−𝛼 + + + ; exp ln 𝑂𝑅 + 𝑧1−𝛼 + + +
2 𝑎 𝑏 𝑐 𝑑 2 𝑎 𝑏 𝑐 𝑑

Para determinar si un estimador de razón de chances es significativo,


basta con verificar que el intervalo de confianza al 1 − 𝛼 × 100% no
pase por el 1, al igual que el caso anterior.

facultadmedicina.uc.cl 18
Retrospectivo Razón de Chances
estudio

Ejemplo 3. Interesa determinar si una alta exposición a contaminación
acústica durante la infancia y la adolescencia aumenta el riesgo de
sordera en adultos mayores.

Para esto, se tomó una muestra aleatoria de 180 adultos mayores de


65 años con uso de audífonos y se comparó con 180 con audición
normal.
En ambos casos se preguntó sobre contaminación acústica en la
infancia. bar pregunto controles Y les
Conozco a los casos y
sobre su exposicion

facultadmedicina.uc.cl 19
Razón de Chances

102× 106 chance de haber estado


expuesto
= 1,87. contaminación
a

La razón de chances estimada es acústica


mayores 87 % en
78× 74 usan audífonos
quienes y

El intervalo al 95% confianza para la razón de chances es


1.23 − 2.86 . Notar que este no contiene al valor 1.

Interpretación: la chance de haber estado expuesto a contaminación


ambiental en quienes requieren audífono después de los 65 años es
87% mayor (o 1,87 veces mayor) a la de haber estado expuesto a
contaminación ambiental en quienes no requieren audífonos.

facultadmedicina.uc.cl 20
Razón de Chances

Ejemplo 4. Gráfico de riesgo ± IC95%. Riesgo de infección por Virus


Papiloma Humano según estado marital. La categoría de referencia fue
“casado”.

OR (IC 95%):
Casado: 1
Viudo: 2,0 (1,02 – 3,9)
Separado: 1,1 (0,5 – 2,3)
Soltero: 2,7 (1,7 – 4,2)

MAÍ chance de presentar


las mujeres viudas tienen 2 veces
at
mujeres casadas
'
-
que
Fuente. Ferreccio et.al. Baseline assessment of prevalence and geographical distribution of HPV types in Chile
using self-collected vaginal samples. BMC Public Health 2008.
facultadmedicina.uc.cl 21
Interpretación del OR y el RR

Para cualquiera de las dos medidas de magnitud del efecto, se debe


interpretar:
* habla en %
• Si 1< OR o RR <2, se interpreta en términos de %. Ej: un OR=1,65
se interpreta como que el evento de interés tiene un 65% más de
chance de ocurrir en expuestos que en no expuestos.

• Si OR o RR >2, se interpreta en “veces”. Ej: un RR =3 indica que los


expuestos tienen tres veces el riesgo de presentar el evento de
interés frente a los no expuestos.

• Si OR o RR < 1, se interpreta en términos de % restado de 1. Ej: un

q
OR =0,65 indica que la chance de haber estado expuesto en los
casos es 35% menor que la chance de haber estado expuesto en
controles. facultadmedicina.uc.cl
22
Relación Test Chi-Cuadrado y RR/OR

No importa si el diseño es Prospectivo, Retrospectivo o Transversal, se


obtienen 𝑝1 y 𝑝2 .
Se plantea la Hipótesis:

𝐻0 : 𝑝1 = 𝑝2 Test Chi-Cuadrado
𝐻1 : 𝑝1 ≠ 𝑝2

Valor-p < α : Valor-p > α :


X e Y se asocian X e Y no se asocian

IC de RR / OR no contiene el 1 IC de RR / OR contiene el 1

facultadmedicina.uc.cl
23
facultadmedicina.uc.cl
Asociación de variables
Asociación entre una variable categórica
y una continua.

Bioestadística
Paola Viviani
Angélica Domínguez facultadmedicina.uc.cl
Tabla de Contenidos

1. Introducción a asociación de variables.

2. Distinguir datos pareados o independientes.

3. Comparación de medias para dos poblaciones. Caso


independiente.

4. Comparación de medias para más de dos poblaciones. Caso


independiente.

5. Comentarios adicionales.

facultadmedicina.uc.cl 3
Introducción

Para averiguar si existe asociación entre dos variables aleatorias


se debe realizar un test de hipótesis. La elección del test
dependerá del tipo de variables a relacionar.
En clases anteriores vimos asociación entre dos variables
categóricas. Ahora veremos asociación entre una categórica y
SE tratan igual
una numérica (situaciones 2 y 3).
Situación Variable Y Variable X
1 Categórica Categórica

2 Numérica Categórica
3 Categórica Numérica
4 Numérica Numérica

facultadmedicina.uc.cl 4
Introducción

Para describir la relación entre una variable continua y otra


categórica, se suele reportar el número de casos, promedio y
desviación estándar de la variable numérica, para cada nivel de
la categórica. §
Asociacion
" " " "" " "
categórica -

numérica .

"" " ""


"

É¡
numérica
d. Estándar de la
ASOCIACIÓN

¡
Cat -
numérica :
• a

"
"
PUEDES
De>vi.
error

intervalo de confianza
}

mhmmtw-t-n.se
°
Ho : Mr MI
Plbl Corporal
"
"

=
"" .

" "
"
" → numen [q
" " '
""
Nllriable peso
"" m

reinara no decir "


tratamiento inicial → Cat
-

evidencia para tratamiento y


concusión : no nay asociacion en

facultadmedicina.uc.cl
no hay

los 2 distintos
media De peso de
-

o
@ q
5
Introducción

Ejemplo 1. Mirando la primera línea de la tabla, correspondiente al


peso de nacimiento: ¿qué variables hay? ¿A qué tipo de variables
corresponden?

Hay dos variables involucradas:


• Peso de nacimiento:
Toma valores entre 500 y 1500 gr
Variable de tipo numérica Corresponde a una
Variable explicativa asociación de tipo
Categórica - Numérica
• Tipo de Intervención:
Toma valores CPAP o VM
Variable de tipo categórica
Variable dependiente o respuesta facultadmedicina.uc.cl
6
si la Cat
se distingue .

distingue
grupos
independientes o
grupos
variador .

Pareados o Independientes?
se distingue si V. categórica distingue grupos independientes e pareado
-
.

Antes de trabajar sobre asociaciones de tipo categórica-numérica,


es necesario distinguir cuando la comparación se realiza con
datos independientes o pareados.

La variable categórica separa la muestra en dos o más grupos.


Trabajaremos siempre bajo el supuesto de independencia dentro
(intra) de cada grupo.

Sin embargo, no siempre hay independencia entre grupos. Los


grupos determinados por la variable categórica pueden ser
independientes, cuando se trata de distintas personas (unidades
muestrales) o pareados, cuando resultan correlacionados.
facultadmedicina.uc.cl
7
Pareados o Independientes?

Independencia entre grupo: se presenta este caso cuando se mide


una variable numérica a dos grupos diferentes de pacientes.
÷:*:* ID Tratamiento Peso
.
¡ 1 1 85

2 1 88 Ejemplo: se compara Tratamiento 1
3
4
1
1
90
78
con Tratamiento 2 en diferentes
5
6
1
1
81
89
pacientes. la mayoría corresponde grupo a

7 1 87
M
independientes .

muestra de :

8 1 85 peso
9
10
1
1
84
88
𝑇𝑟𝑎𝑡 1 = 85,5 ± 3,7
tratamiento t
11 2 90
12 2 92
13 2 91 𝑇𝑟𝑎𝑡 2 = 89,6 ± 3,6
14 2 88 tratamiento 2 .

15 2 86
16 2 95
17 2 93
18 2 85
19 2 84
20 2 92
facultadmedicina.uc.cl
8
Pareados o Independientes?

Dependencia entre grupo: Se presenta este caso cuando se mide


una variable numérica a los mismos pacientes, bajo distintas
gente qi mido h veces
la
misma
condiciones o en distintos tiempos. variado lamisma gente :

ID Medida Peso mida 2 Veces

Ejemplo: se compara Peso Pre y Post

i.
1 1 86

/
2 1 89
3
4
1
1
96
112
intervención
5 1 91
6 1 105 𝑃𝑟𝑒 = 93,7 ± 8,6

:*
7 1 94

¿
8 1 88
9
10
1
1
86
90
𝑃𝑜𝑠𝑡 = 88,6 ± 7,8
Pre Post

§
1 2 80 "" variada

|
a- .

A
2 2 85 G1
intervención en lor 2 grupos
3 2 90 dicion pre

a. .. .
.. .
4 2 101
5 2 91
6 2 94
7 2 95
Haygidistingiursies * • • a

8 2 83
Maham paratión
9
10
2
2
75
92
independiente averiada facultadmedicina.uc.cl 9
-0
Supuestos test de medias 01011*1.io#K**&oIoosogqa
Es necesario distinguir si:
• Se pueda asumir la normalidad de los promedios (por
distribución Normal de la variable original o por TLC).
2 condiciones

• Se pueda asumir homogeneidad de las varianzas


(homocedasticidad)." :&!:{¡¡¡÷

. .

" " " ' "


aioenaisn.y.n.mu .

facultadmedicina.uc.cl
Comparación de medias en dos
poblaciones
Caso 1: comparación de medias para dos poblaciones.
independientes qe asume normalidad de promedio Ya 9M
Son
grupos n > 30 .

T
'

Litiasis=0 (No): n=847


promedio de edad=38.1±13.8
M de edao
.

Litiasis=1 (Sí): n=148


Promedio de edad=43.8±14.2 Ho : Te =
52
Como notar HOY H 1 para
= HA i
T1 =/ TÉ
saber si las varianzas gen distinta ,

Si la categórica tiene 2 niveles, y se puede asumir Normalidad de


los promedios, se comparan los promedios de la numérica con
prueba t de Student para muestras independientes.
Para saber si las variantes son se
iguales • no por el Momnvestral
p, @ medio se asome

facultadmedicina.uc.cl
11
Comparación de medias en dos poblaciones

Hipótesis de interés serán:


𝐻0 : 𝜇𝐴 = 𝜇𝐵 𝐻0 : 𝜇𝐴 − 𝜇𝐵 = 0
𝐻1 : 𝜇𝐴 ≠ 𝜇𝐵 𝐻1 : 𝜇𝐴 − 𝜇𝐵 ≠ 0
o
𝐻0 : 𝜇𝐴 ≥ 𝜇𝐵 𝐻0 : 𝜇𝐴 − 𝜇𝐵 ≥ 0
𝐻1 : 𝜇𝐴 < 𝜇𝐵 𝐻1 : 𝜇𝐴 − 𝜇𝐵 < 0
o también
𝐻0 : 𝜇𝐴 ≤ 𝜇𝐵 𝐻0 : 𝜇𝐴 − 𝜇𝐵 ≤ 0
𝐻1 : 𝜇𝐴 > 𝜇𝐵 𝐻1 : 𝜇𝐴 − 𝜇𝐵 > 0
Cualquiera sea la hipótesis de interés, se toman muestras aleatorias
de tamaño 𝑛𝐴 y 𝑛𝐵 de las poblaciones A y B. Luego, se calcula el
promedio y la desviación estándar de la variable numérica en cada
muestra. facultadmedicina.uc.cl
Comparación de medias en dos poblaciones

Ejemplo 2. La siguiente
tabla muestra las
características de
pacientes infectados
con VIH comparado con
pacientes sanos.

• ¿Cuáles valores p se refieren a asociación de una variable categórica


y otra numérica?
• ¿Cuáles son las variables asociadas? ¿Cuáles son, en cada caso, la
hipótesis nula y alternativa?
• ¿Qué se concluye de cada hipótesis planteada? ¿Cómo se interpreta?
facultadmedicina.uc.cl
Comparación de medias en dos poblaciones

Al aplicar el test de medias, se debe verificar si las varianzas de


ambas poblaciones son iguales (supuesto de homocedasticidad).

Hipótesis de interés:
𝜎𝐴 2
𝐻0 : 𝜎𝐴 2 = 𝜎𝐵 2 Varianzas =
𝐻0 : =1
𝜎𝐵 2
2 2 Uarianrar ≠ 𝜎𝐴 2
𝐻1 : 𝜎𝐴 ≠ 𝜎𝐵 𝐻1 : ≠1
𝜎𝐵 2

Para responder esta Hipótesis, el test más utilizado es el test de


Levene.

facultadmedicina.uc.cl 14
Comparación de medias en dos poblaciones

Ejemplo 3. Para el ejemplo de Edad vs. Litiasis.

Diente
variablepepen

test -

t
: Variable
Independiente
necesito
no
Por
el n
que
distribuye
probar normal

facultadmedicina.uc.cl 15
Comparación de medias en dos poblaciones

Ejemplo 3. Para el ejemplo de Edad vs. Litiasis.


la M de edad es mayor en persona r
que tienen litiasis .

HO significa
:
SE Rechaza ,

Hay cuiden
para conformar que las
.

edades son diferentes .

Distintas
son

variables
' las °

°
q "

asumir "
""

NO
Rechazoeui q
'
permita vamos '
"

asumo
.

-
no Hay
-

ya
ugnq .

-
ay ,

↳ Se cumple .

facultadmedicina.uc.cl
16
Comparación de medias en dos poblaciones

tienen litiasis quienes ha


M de colesterol
'

en personas q y .

Ejemplo 3. En los mismo pacientes, si se compara Colesterol Total de


acuerdo a Litiasis (si/no)
Conclusión : no se rechaza HO , no
hay diferencia significativa
en la media de colesterol .

Site
varia" "
lyvan.am?szinta)
Hay diferencia significativa DE
cuando sale Significativo ,
Hay que mirar

no hay homogeneidad Welch St


'

↑ evidencia las
'

hay q varianzas -

no son

Iguales .

facultadmedicina.uc.cl
17
Comparación de medias en más de dos
poblaciones
si la variable categórica genera + de 2

Caso 2: comparación de medias para más de dos poblaciones.


GE 1: 18-30: n=329 GrupoEdad COLTOT
promedio colesterol total=166±36.8 3 180
1 174
1 129
GE 2: 31-45: n=371 2 265
Promedio colesterol total=187±38.5 1 143
3 191
GE 3: 46-60: n=216 2 234
1 167
Promedio colesterol total=203±39.1 3 237
3 175
GE 4: 61 y más: n=79 1 167
Promedio colesterol total=208±45.0
4m ( et test Ya no )
sirve .

comparar
-

facultadmedicina.uc.cl 18
Comparación de medias en más de dos poblaciones

Si la variable categórica tiene más de 2 niveles, se comparan los


promedios con Análisis de la Varianza (ANOVA). → Esto

se usa

Hipótesis de interés son:


𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 ( 4h iguales
)

𝐻1 : 𝐴𝑙𝑔ú𝑛 𝜇𝑖 ≠ 𝜇𝑗 , con i, j = 1, … 4
Almenar , un par es distinto
.

Si se obtiene un valor p significativo (valor-p<𝛼), entonces al


menos un par de medias difieren entre sí.

Para distinguir qué promedios producen esta diferencia, se debe


realizar un test de comparaciones múltiples.
(test de Tukey, Duncan, Bonferroni, etc.). facultadmedicina.uc.cl 19
Comparación de medias en más de dos poblaciones

Ejemplo 4: Interesa comparar el promedio de Colesterol Total entre


los 4 grupos de edad. El test adecuado es ANOVA.

facultadmedicina.uc.cl
20
Comparación de medias en más de dos poblaciones

Ejemplo 4:
D-
°
F. F-

Y
en el mico grupo que no hay
" "m "" >
Y

Ojo
-

se rechaza
no
'
"
"
TEMOgen .

dias
aire] Jeje
Dice ☒ % parásita
Ho ,

facultadmedicina.uc.cl
21
Comparación de medias en más de dos poblaciones

Ejemplo 4: Es necesario realizar test de comparaciones múltiples.

facultadmedicina.uc.cl
22
Comentarios adicionales

1. Transformaciones.
• Si no se puede asumir normalidad del promedio, pueden usarse
transformaciones de los datos (logaritmo, raíz cuadrada, etc.) y usar los
test descritos antes.
• Si el logaritmo de una variable numérica tiene distribución normal, se
dice que la variable original tiene distribución log-normal.

2. Pruebas no paramétricas.
Si no se puede asumir normalidad del promedio (datos no normales, n
reducido), se usan test no paramétricos:
• Test de Wilcoxon o Mann-Whitney en vez de t de Student para muestras
independientes.
• Test de Kruskal-Wallis en vez de ANOVA.
• Test de Dunn para las comparaciones múltiples. facultadmedicina.uc.cl
Resumen

Sí t-Student asumiendo
Sí varianzas iguales.
No
2 t-Student asumiendo
varianzas diferentes.
Medidas No
Independientes Mann Whitney

+ DE 2
promedio

>2 ANOVA

(Bonferroni, Tukey)

Kruskal Wallis
No
(Duncan)
Número de
niveles de
la variable ¿Normalidad ¿Varianzas
categórica iguales? Prueba estadística
facultadmedicina.uc.cl
de los promedios?
Resumen

T-Student para
Sí medidas repetidas
2
Test de rangos
No signados de
Medidas Wilcoxon
dependientes
ANOVA para
Sí medidas repetidas
>2 (Bonferroni)

No
Test de Friedman

Número de niveles
de la variable
categórica ¿Normalidad de
los promedios? facultadmedicina.uc.cl
Prueba estadística
facultadmedicina.uc.cl
Asociación de variables
Asociación entre dos variables numéricas

Bioestadística
Paola Viviani
Angélica Domínguez facultadmedicina.uc.cl
Tabla de Contenidos

1. Introducción
2. Correlación

facultadmedicina.uc.cl 3
Introducción

Para averiguar si existe asociación entre dos variables aleatorias


se debe realizar un test de hipótesis. La elección del test
dependerá del tipo de variables a relacionar.
En clases anteriores vimos asociación entre dos variables
categóricas y una categórica con otra numérica. Ahora veremos
asociación entre dos numéricas.
Situación Variable Y Variable X
1 Categórica Categórica
2 Numérica Categórica
3 Categórica Numérica
4 Numérica Numérica

facultadmedicina.uc.cl 4
Introducción

Ejemplo 1. La figura fue tomada de un estudio de madres de hijos


prematuros de muy bajo peso de nacimiento ¿qué variables hay?
¿A qué tipo de variables corresponden?
Variable ✗

La autoeficacia (percibida por


la madre) es un indicador de la

1-
confianza que tiene la madre
en sí misma como proveedora
de leche materna, en este
contexto tan adverso.
epe y
La producción de leche
materna indica la cantidad de
ml que la madre se extrae en
total al día.

facultadmedicina.uc.cl 5
Introducción

Ejemplo 1. La figura fue tomada de un estudio de madres de hijos


prematuros de muy bajo peso de nacimiento ¿qué variables hay?
¿A qué tipo de variables corresponden? 2 variables
de tipo
nvmeriea

Hay dos variables involucradas:


• Autoeficacia:
Toma valores entre 0 y 30 puntos
Variable de tipo numérica Corresponde a una
Variable explicativa asociación de tipo
Numérica - Numérica
• Producción de leche materna:
Toma entre 0 y 600 ml
Variable de tipo numérica
Variable dependiente o respuesta facultadmedicina.uc.cl 6
Asociación numérica - numérica

Objetivo del análisis:


si una cambia ,
la Otra tambien ?

• Determinar si dos (o más) variables numéricas están


correlacionadas, es decir, si los valores de una variable tienden a
ser más altos o más bajos para valores más altos o más bajos de la
otra variable.
Cuantificar asociación entre
dos variables numéricas Correlación de Pearson

Determinar si existe Valor p asociado a la


asociación entre dos variables correlación de Pearson +
numéricas valor de la correlación
facultadmedicina.uc.cl 7
Gráfico de Dispersión

Muestra la relación entre dos variables numéricas. Por ejemplo,


interesa determinar si existe asociación entre la Autoeficacia
percibida por la madre y su producción de leche materna.
se ve
'
a medida ql
q
Aumenta la autoeficacia ,

tambien aumenta la
produccion materna

facultadmedicina.uc.cl 8
Gráfico de Dispersión

Los gráficos de dispersión nos permiten detectar si la existe


asociación o no, y en el caso que así sea, ver si es lineal o no
lineal. puntos
Wwe de en medida q
la
' aumenta
y Y , aumenta

No hay asociación lineal Asociación lineal positiva

ha existe
asociacion
lineal
una
.

Asociación lineal negativa No hay asociación lineal


✗ aumenta (sí hay una relación cuadrática)
y disminuye
facultadmedicina.uc.cl 9
Correlación

Existen distintos tipos de correlaciones, pero las más típicas en el


área de la salud son:

Correlación Muestral de Pearson: Se utiliza cuando ambas


variables son numéricas continuas. Se calcula como:

σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത
𝑟 =
σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 2 σ𝑛𝑖=1 𝑦𝑖 − 𝑦ത 2

Correlación por Rangos de Spearman: Se utiliza cuando al menos


una de las variables ellas es de numérica discreta, o en presencia
de valores extremos. hay puntos tremor
en

facultadmedicina.uc.cl 10
Correlación
[correlation]
La correlación de Pearson varía entre -1 y 1.

• Si r es cercano a 1, hay asociación lineal directa entre X e Y.


• Si r es cercano a -1, hay asociación lineal inversa entre X e Y.
• Si r es cercano a 0, no hay asociación lineal entre X e Y. depuntos
Puede corresponder al 1ᵉʳcaso de mire
o al 4to

La correlación muestral se suele denotar con la letra r, mientras


RO

que la correlación poblacional se denota con la letra 𝜌.

Si ρ es la correlación entre X e Y en la población, las hipótesis de


interés son: existe asociación
H0: ρ = 0 - no

H1: ρ ≠ 0 existe asociacion

facultadmedicina.uc.cl 11
Correlación

Una desventaja de la correlación muestral es que tiende a ser más


significativa a medida que aumenta el tamaño de la muestra.

Si fuera de interés determinar si la variable X se asocia con la


variable Y, es mucho más importante la magnitud de la correlación
que su significancia estadística (valor-p).

0 < |𝑟| < 0,25 Existe una mala asociación (de tipo lineal) entre 𝑋 e 𝑌

0,25 < |𝑟| < 0,50 Existe una baja asociación (de tipo lineal) entre 𝑋 e 𝑌

0,50 < |𝑟| < 0,75 Existe una buena asociación (de tipo lineal) entre 𝑋 e 𝑌

0,75 < |𝑟| < 1,00 Existe una excelente asociación (de tipo lineal) entre 𝑋 e 𝑌
facultadmedicina.uc.cl 12
Correlación

Observaciones: |

• Si la correlación es cercana a cero, solo podemos concluir que


no existe una asociación lineal. puede existir asociacion de otro tipo

• El valor del coeficiente de correlación es independiente de


cualquier unidad usada para medir las variables.

• El valor del coeficiente de correlación se altera de forma


importante ante la presencia de un valor extremo.

• La correlación no implica causalidad. asociacion


solo vemos

facultadmedicina.uc.cl 13
Correlación

100

90
Se obtiene r = 0.409
PAD

80

70

60

100 150 200 250


90
COLTOT

80

PAD
Se obtiene r = 0.239 70

60
encuentre ese
'
tan extremo
Depende de q
se
100 150 200 250

valor y el tamaño muestra COLTOT


,
facultadmedicina.uc.cl
Correlación

Ejemplo 2: a partir de la ENS 2016/2017 (n=6233)

facultadmedicina.uc.cl 15
Correlación

CT vs Tgl HDL vs CC
a
Correlación = 0,421 Correlación =O
-0,298
Valor-p <0,001 Valor-p <0,001

facultadmedicina.uc.cl
THE END

facultadmedicina.uc.cl

También podría gustarte