Está en la página 1de 26

ASIGNATURA : MÉTODOS ESTADÍSTICOS

CICLO : III
SEMESTRE ACADEMICO : 2021-1
UNIVERSIDAD PRIVADA SAN JUAN BAUTISTA
FACULTAD DE CIENCIAS DE LA SALUD
ESCUELA PROFESIONAL DE MEDICINA HUMANA
“Dr. Wilfredo Erwin Gardini Tuesta”

ACREDITADA POR SINEACE


RE ACREDITADA INTERNACIONALMENTE POR RIEV

SESIÓN 13
MODELO DE REGRESIÓN LOGÍSTICA

DOCENTES RESPONSABLES DE LA ASIGNATURA

SEDE CHORRILLOS: BAZAN RODRIGUEZ ELSI


SEDE SAN BORJA : AQUINO DOLORIER SARA
SEDE SAN BORJA : VERA NUÑEZ GRISELDA
FILIAL ICA : CORDOVA TELLOS JOSÉ LUIS
FILIAL CHINCHA : PACHAS RAMOS ALLINSON MARINA
COMPETENCIA

CONTENIDO CAPACIDAD PRODUCTO

Regresión logística:
Modelo de regresión, métodos Analiza e interpreta el
de estimación de los efecto (coeficiente o OR) Trabajo grupales y
coeficientes, prueba de de las covariables en la exposición
hipótesis sobre los parámetros.
Estimación de los Odds Ratios variable respuesta binaria.
(OR) y su intervalo de confianza
INTRODUCCIÓN
• Con el nombre de modelos de regresión se incluyen un conjunto de técnicas
estadísticas que tratan de explicar cómo se modifica la variable dependiente o
resultado, cuando cambian otra u otras variables, denominadas independientes o
predictoras. Lo que caracteriza en principio a las distintas clases de modelos de
regresión es la naturaleza de la variable dependiente; así, con variables continuas
la clase de modelos de regresión lineal es la más utilizada; con variables
dicotómicas lo es el modelo de regresión logística.
• La regresión logística (RL) es uno de los instrumentos estadísticos más
expresivos y versátiles de que se dispone para el análisis de datos en clínica y
epidemiología1. Su origen se remonta a la década de los sesenta (Confield,
Gordon y Smith 1961); su uso se universaliza y expande desde principios de los
ochenta debido, especialmente, a las facilidades informáticas con que se cuenta
desde entonces. En los últimos años se ha verificado una presencia muy marcada
de esta técnica, tanto en la literatura orientada a tratar temas metodológicos como
en los artículos científicos biomédicos.

Mª Dolores Fiuza Péreza, J. C.. Rodríguez Pérezb


La regresión logística: una herramienta versátil
REGRESIÓN LÓGISTICA
La regresión logística es el conjunto de modelos estadísticos utilizados
cuando se desea conocer la relación entre:
• Una variable dependiente cualitativa, dicotómica (regresión logística
binaria o binomial) o con más de dos categorías (regresión logística
multinomial).
• Una o más variables explicativas independientes, llamadas covariables,
ya sean cualitativas o cuantitativas.
• Las covariables cualitativas deben ser dicotómicas, tomando valor 0 para
su ausencia y 1 para su presencia. Si la covariable tuviera más de dos
categorías debemos realizar una transformación de la misma en varias
covariables cualitativas dicotómicas ficticias (variables dummy). Al hacer
esta transformación cada categoría de la variable entraría en el modelo de
forma individual.

González-Revaldería, Fernández, García, & Queraltó (2007) y A. Field, Miles, & Field (2012).
FINALIDAD
Los modelos de regresión logística tienen tres finalidades:
• Cuantificar la importancia de la relación existente entre
cada una de las covariables y la variable dependiente.
• Clarificar la existencia de interacción y confusión entre
covariables respecto a la variable dependiente (es decir, los
odds ratio para cada covariable).
• Clasificar individuos dentro de las categorías
(presente/ausente) de la variable dependiente.
Por tanto, el objetivo de la regresión logística no es, como
en regresión lineal, predecir el valor de la variable Y a partir
de una o varias variables predictoras (Xs), sino que queremos
predecir la probabilidad de que ocurra Y conocidos los
valores de las variables Xs.
González-Revaldería, Fernández, García, & Queraltó (2007) y A. Field, Miles, & Field (2012).
REGRESIÓN LÓGISTICA
Por otra parte nos interesa estudiar la relación entre una o más
variables independientes o explicativas: X1, X2, ..., Xp y la
variable Y. El modelo logístico establece la siguiente relación
entre la probabilidad de que ocurra el suceso, dado que el
individuo presenta los valores X1=x1, X2=x2,...,Xp=xp:

Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55 - 10536) Introducción a la regresión logística
EJEMPLOS DE USOS DE LA REGRESIÓN
LOGÍSTICA
ESTUDIOS DESCRIPTIVOS:
La regresión logística puede utilizarse como método descriptivo cuando se desea
estudiar desde una perspectiva epidemiológica la aparición de un determinado evento
en un grupo de individuos, por ejemplo: - los pacientes de una determinada enfermedad
desarrollan un cierto signo propio de ésta. - los niños dejan la lactancia materna
exclusiva. - el fallecimiento de individuos de una cohorte.
EJEMPLO:
Se seleccionan al azar n (300) historias clínicas de enfermos de la patología en estudio,
se determina la fecha de detección de la enfermedad td, si el paciente tiene el signo de
interés se toma la fecha en que apareció ts, si el paciente no tiene el signo se toma la
fecha de la última consulta te. Con estos datos definimos la variable dependiente Y
como 1 si el paciente no tiene el signo, y como 0 si lo tiene, y la variable independiente t
como la diferencia en días de la fecha de aparición.

Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55 - 10536) Introducción a la regresión logística
Modelo Estadístico de Pronóstico
Si se desea estimar la probabilidad de la ocurrencia de un suceso en
función de un grupo de variables explicativas (predictoras) conocidas:
X1, X2, ..., Xp, puede fijarse un modelo logístico, una vez que se
hayan estimado los parámetros α y ßi's, puede calcularse la
probabilidad Pr( y=1/ x1,x2,x3,…,xp) para cualquier individuo cuyos
variables independientes toman valores: x1, x2, ..., xp,
respectivamente. Ejemplos de este tipo de estudios se presentan en
la siguiente tabla:

Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55 - 10536) Introducción a la regresión logística
EJEMPLO
Se desea conocer la probabilidad de que un paciente que se ingresa en
una sala de terapia intensiva sobreviva. Para este tipo de estudios es
recomendable la definición de grupos diagnósticos (conjunto de
entidades o enfermedades que tienen en común afectar a un mismo
sistema del organismo), por tanto en nuestro ejemplo nos limitaremos a
algunas de las variables que puedan influir el pronóstico de la evolución
de pacientes con Enfermedades del Sistema Cardiocirculatorio (ESCC):
Edad (años) X1
Enfermedad Hipertensiva (S/N) X2
Insuficiencia Cardiaca (S/N) X3
Disrritmia (S/N) X4
Infarto Agudo del Miocardio (S/N) X5
Enfermedad Pulmonar Obstructiva Crónica y afecciones afines (S/N) X6
Ingresos anteriores por estas causas (#) X7
Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55 - 10536) Introducción a la regresión logística
Se estudiarán entonces un grupo de pacientes que ingresen a la
sala de terapia intensiva con diagnóstico de ESCC, se les medirán
las variables anteriores, que definiremos como 1 si hay presencia
del problema y como 0 si no. Se espera entonces al egreso de
cada paciente, si egresa vivo la variable Y toma valor 1, en caso
contrario toma valor 0. La matriz de los datos de este estudio
puede ser, por ejemplo:

Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55 - 10536) Introducción a la regresión logística
Análisis de Factores de Riesgo
La regresión logística puede utilizarse como método para la
estimación de la razón de disparidad (odds ratio OR). Veamos como
obtenemos el OR en el caso de una variable independiente X,
tenemos que:

Por tanto probar la hipótesis H0:OR=1 es equivalente a la hipótesis


H0:ß=0. De manera similar se obtiene en el caso de dos o más
variables independientes la siguiente relación:
, donde X=(X1, X2, ...,Xp)

Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55 - 10536) Introducción a la regresión logística
Evaluación de la Interacción
Consideremos dos factores de exposición X1 y X2 (variables
dicotómicas) podemos definir el riesgo Rij=Pr( D=1| X1=i, X2=j )
para los distintos niveles de exposición a X1 y X2, y calcular el OR
para cada uno de estos niveles por:

La hipótesis nula de no interacción bajo un modelo multiplicativo


es: H0:OR11=OR10 OR01, que puede contrastarse utilizando el
siguiente modelo de regresión logística:

Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55 - 10536) Introducción a la regresión logística
EJERCICIOS
Se quiere establecer una relación entre el hecho de tener anticuerpos a
determinado virus con la zona de residencia (norte, sur, este y oeste) y
el factor RH. Para ello, se da la siguiente estructura: variable nominal
Virus (1‐Si, 0‐No), variable nominal Zona (1‐ Norte, 2‐Sur, 3‐Este y
4‐Oeste), variable nominal RH (1‐Positivo, 2‐Negativo) y la variable
escalar Frecuencia. Señalar que la variable nominal Zona tiene cuatro
categorías y debería ser sustituida por 3 variables dummy:

Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55 - 10536) Introducción a la regresión logística
Sin considerar este hecho, introduzcamos los datos en SPSS. Después se ponderan los
datos (Datos/Ponderar casos/frecuencia)

Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55 - 10536) Introducción a la regresión logística
Se selecciona la variable dependiente (Virus) y las
covariables (variables independientes: Zona y
RH). Ahora tenemos que indicarle al SPSS las
variables categóricas, se pulsa el botón
[Categóricas].

Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55 - 10536) Introducción a la regresión logística
Se elige el Método Introducir (procedimiento en el que todas las variables de un bloque se
introducen en un solo paso). Se podía haber utilizado el Método Adelante RV (método
automático por pasos, hacia delante, que utiliza la prueba de la Razón de Verosimilitud para
comprobar las covariables a incluir o excluir), en este modelo se habría anulado la variable RH de
la ecuación.

Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55 - 10536) Introducción a la regresión logística
Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55 - 10536) Introducción a la regresión logística
Análisis estadístico bivariado

Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55 - 10536) Introducción a la regresión logística
Análisis estadístico multivariado

Resumen del modelo

Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55 - 10536) Introducción a la regresión logística
Prueba del ómnibus para ver si la regresión logística binaria es adecuada para
predecir
El p valor debe ser significativa p > 0.05 las variables seleccionadas no puede
predecir valor

Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55 - 10536) Introducción a la regresión logística
Llevando a variables dicotómicas las variables de categoría

Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55 - 10536) Introducción a la regresión logística
Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55 - 10536) Introducción a la regresión logística
Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55 - 10536) Introducción a la regresión logística
Departamento de Estadística Universidad Carlos III de Madrid BIOESTADISTICA (55 - 10536) Introducción a la regresión logística
DESARROLLAR
LA PRACTICA 13

También podría gustarte