Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. ¿Qué valores toma la variable dependiente cuando se usa un modelo de regresión logística (para
los casos biomédicos usuales)?
Para los casos que vemos en este curso, la variable dependiente es una variable dicotómica cuyos
valores se codifican como 0 y 1. El caso más común es que la variable describa la ocurrencia de una
patología o un factor y que se codifique la presencia como 1 y la ausencia como 0. Esta regresión se
conoce como Regresión Logística Binaria
Existe la posibilidad de utilizar otros modelos de regresión logística en los que la variable dependiente
es una variable categórica nominal o incluso ordinal, con más de dos categorías. Estas regresiones no
las estudiaremos en el curso.
2. ¿Cómo son las variables explicativas (en cuanto a los valores que pueden tomar)?
Las variables explicativas podrán ser tanto cualitativas, como cuantitativas. En el caso de las
cualitativas, si son dicotómicas, se codificarán para el ajuste de la regresión de igual forma que la
variable dependiente, es decir como 1 y 0. En caso de ser variables cualitativas de más de dos
categorías, se crearán variables auxiliares que permitirán codificar todas las categorías. El
procedimiento se verá en los ejemplos de regresión logística múltiple.
Metodología Científica II – Curso 2023
Departamento de Métodos Cuantitativos
3. En un cierto estudio caso-control se ha analizado el eventual riesgo generado por ciertas variables
(A y B) en relación con la ocurrencia de un cierto cáncer (C). Ambas variables A y B son dicotómicas
(presencia (1) o ausencia (cero) del factor). En la tabla siguiente se muestra el resultado del ajuste
de un modelo de regresión logística inicial que considera únicamente al factor A.
El logit es el logaritmo del odds de que ocurra el cáncer. Si comparamos los odds para pacientes con
el factor A y sin el factor A, se puede obtener el odds ratio del factor A para la ocurrencia del cancer:
̂𝐴 ̂
𝑂𝑑𝑑𝑠 𝑒 ln (𝑂𝑑𝑑𝑠𝐴 ) ̂ ̂
̂ =
𝑂𝑅 = = 𝑒 ln(𝑂𝑑𝑑𝑠𝐴 )−ln (𝑂𝑑𝑑𝑠𝐴− ) = 𝑒 (−0.11+0.78−(−0.11)) = 𝑒 0.78 = 2.18
̂
𝑂𝑑𝑑𝑠𝐴− 𝑒 ln ̂
(𝑂𝑑𝑑𝑠𝐴− )
(en la ecuación anterior utilizamos A para la presencia del factor A y A- para la ausencia del factor A).
En definitiva, como se observa del despeje anterior, el OR puede estimarse como la exponencial del
coeficiente estimado para la variable.
Dado que en la tabla de coeficientes estimados del modelo se presenta el error estándar del
coeficiente estimado, se puede también calcular el intervalo de confianza para el OR hallado:
̂ )−1.96×𝐸𝐸(ln(𝑂𝑅
̂ )) ln(𝑂𝑅
𝐼𝐶95% = (𝑒 ln(𝑂𝑅 ; 𝑒 ̂ )−1.96×𝐸𝐸(ln(𝑂𝑅
̂ ))
) = (𝑒 0.78−1.96×0.10 ; 𝑒 0.78+1.96×0.10 )
𝐼𝐶95% = (1.79; 2.65)
Cabe recordar que el intervalo de confianza del OR es simétrico en la escala logarítmica, pero una vez
aplicada la exponencial no se conserva esa simetría. Además, este intervalo asume que los
estimadores (𝛽̂) distribuyen en forma normal, por eso se utiliza el ±1.96 para multiplicar el Error
Estándar del estimador, para construir el intervalo de confianza (valor de la distribución normal
estándar para una probabilidad central de 95%).
Metodología Científica II – Curso 2023
Departamento de Métodos Cuantitativos
Para el cálculo del valor-p para el contraste de hipótesis sobre el estimador, podemos mantener el
mismo supuesto sobre la distribución de los estimadores. De esta forma, en el contraste, la hipótesis
nula es que β=0 y la hipótesis alternativa es que β≠0. El estadístico para esta prueba será:
𝛽̂ − 0 0.78 − 0
𝑧∗ = = = 7.8
𝐸𝐸(𝛽̂ ) 0.10
El valor del OR estimado en este ejemplo es un valor crudo, ya que no toma en consideración ninguna
otra variable.
Metodología Científica II – Curso 2023
Departamento de Métodos Cuantitativos
𝐻0 : 𝛽 = 0
𝐻𝐴 : 𝛽 ≠ 0
Este es el contraste al que corresponde el valor-p previsto en la tabla. Para obtener el valor-p se calcula
el estadístico de prueba igual que en el ejercicio pasado y se supone que este estadístico tiene
distribución aproximadamente normal.
𝛽̂ − 0 0.532 − 0
𝑧∗ = = = 3.77
̂
𝐸𝐸(𝛽 ) 0.141
De los resultados planteados puede concluirse que los antecedentes alérgicos de la madre se asocian
con mayores (coeficiente positivo, OR mayor que 1) chances de desarrollar fenómenos alérgicos en el
niño. Esta asociación es estadísticamente significativa si la evaluamos a un nivel de significación del
5% (valor-p < 0.05; Intervalo de confianza del OR que no incluye al 1). Finalmente, si interpretamos el
valor obtenido para la estimación del OR, se puede decir que aquellos niños cuyas madres tienen
antecedentes alérgicos tendrán un 70% más de chances de presentar fenómenos alérgicos, en
comparación con aquellos cuyas madres no tienen antecedentes alérgicos.
Metodología Científica II – Curso 2023
Departamento de Métodos Cuantitativos
a. Escriba el modelo
b. Interprete el coeficiente
c. Complete la tabla para la variable independiente (considere que la distribución del
estadístico es normal para el cálculo de la significación)
d. Enuncie la hipótesis para el coeficiente y concluya
e. Calcule e interprete el OR y su intervalo al 95% de confianza
𝑝̂
𝐿𝑛 ( ) = 𝐿𝑜𝑔𝑖𝑡(𝑝̂ ) = −0.216 + 0.386 × 𝐹𝑢𝑚𝑎𝑑𝑜𝑟
1 − 𝑝̂
Para completar la tabla, se plantea el contraste de hipótesis sobre el coeficiente de la variable
independiente. Este contraste es el mismo que el planteado en los ejercicios anteriores:
𝐻0 : 𝛽 = 0
𝐻𝐴 : 𝛽 ≠ 0
𝛽̂ − 0 0.386 − 0
𝑧∗ = = = 1.40
𝐸𝐸(𝛽̂ ) 0.276
En este caso observamos que si bien el coeficiente estimado para la variable fumador sugiere que
existe una asociación positiva entre el fumar y el desarrollo del cáncer en estudio (𝛽̂ > 0), si
consideramos la significación estadística (a un nivel de 5%), no existe evidencia suficiente para
descartar la hipótesis nula de ambas variables son independientes (β=0). Esto puede observarse tanto
en el valor-p hallado en el contraste, como en que el intervalo de confianza al 95% para el OR contiene
al 1 (que es equivalente a decir que el intervalo de confianza para β incluye al 0). Por lo tanto,
concluimos que no hay evidencia estadísticamente significativa de asociación entre el fumar y el
desarrollo del cáncer en estudio.