Documentos de Académico
Documentos de Profesional
Documentos de Cultura
10 - Regres Logis PDF
10 - Regres Logis PDF
RESUMEN
El siguiente artculo presenta la regresin logstica como un mtodo aplicado a las ciencias de la salud, en especial a la
epidemiologa, con lo que se trabajan los coeficientes del modelo logstico como cuantificadora de riesgo, las variables cualitativas
en el modelo logstico, la interaccin y confusin, la colinealidad, el tamao de la muestra, la seleccin de modelos, el mtodo de
mxima verosimilitud y la prueba de Wald de significacin de los parmetros, en todo este aplicativo se coloca un ejemplo en de
reporte final de regresin logstica binaria en SPSS y su interpretacin .
Palabras Claves: Regresin logstica, epidemiologa.
ABSTRACT
The following article presents the logistic regression like an applied for method the sciences of health, specially to epidemiology, so
that the coefficients of the logistic model like quantifiers of risk, the qualitative variables in the logistic model, the interaction and
confusion, the colineality, the size of sign, the selection of models, the procedure of maximum verisimilitude and Wald's sample of
significance of the parameters, in everything are worked up this application an example is placed in of final report of logistic binary
regression in SPSS and your interpretation.
Key words: Logistic regression, epidemiology.
INTRODUCCIN
No cabe ninguna duda que la regresin logstica es una
de las herramientas estadsticas con mejor capacidad
para el anlisis de datos en investigacin clnica y
epidemiologa, de ah su amplia utilizacin.
El objetivo primordial que resuelve esta tcnica es el de
modelar cmo influye en la probabilidad de aparicin de
un suceso, habitualmente dicotmico, la presencia o no
de diversos factores y el valor o nivel de los mismos.
Tambin puede ser usada para estimar la probabilidad
de aparicin de cada una de las posibilidades de un
suceso con ms de dos categoras (politmico o
multinomial).
De todos es sabido que este tipo de situaciones se
aborda mediante tcnicas de regresin. Sin embargo, la
metodologa de la regresin lineal no es aplicable ya
que ahora la variable respuesta slo presenta dos
valores (nos centraremos en el caso dicotmico), como
puede ser presencia/ausencia de alguna enfermedad o
suceso, por ejemplo hipertensin.
Si clasificamos el valor de la variable respuesta como 0
cuando no se presenta el suceso (ausencia de
1. Doctor of Philosophy in Public Health (Ph. D.). U.M. U.S.A. Docente de Postgrado en Salud de la Universidad Nacional Federico Villareal.
2. Doctor of Philosophy in Public Health (Ph. D.). U.M. U.S.A. Docente de Postgrado en Salud de la Universidad Inca Garcilaso de la Vega.
I2
I3
Nunca fum
Ex- fumador
10 o ms cigarrillos diarios
I2
Respuesta 1
Respuesta 2
Respuesta 3
I2
Respuesta 1
-1
-1
Respuesta 2
Respuesta 3
Interaccin y confusin
Algunas precauciones
La amplia disponibilidad de programas que permiten el
acceso a sofisticadas pruebas estadsticas como el
SPSS, el Epi-Info 2002, Systat entre otros, pueden
conducir a la utilizacin inadecuada y mecnica de
stas. En particular los modelos de regresin requieren
de quien los construye un mnimo de comprensin de la
filosofa subyacente, as como no slo el conocimiento
de las ventajas, sino tambin de los problemas y
debilidades de stas tcnicas. La utilizacin de
procedimientos matemticos a menudo nos convence
de que estamos introduciendo "objetividad" en los
resultados y ello es as en cierta medida, pero tambin
lleva aparejada una gran carga de subjetividad, donde
se incluye desde la misma eleccin de un modelo
matemtico determinado, hasta la seleccin de las
variables en l contenidas.
Una de las primeras consideraciones que hay que
hacer es que la relacin entre la variable independiente
y la probabilidad del suceso no cambie de sentido, ya
que en ese caso no nos sirve el modelo logstico. Esto
es algo que habitualmente no ocurre en los estudios
clnicos, pero por ello es ms fcil pasarlo por alto
cuando se presenta.
Un ejemplo muy claro de esa situacin se da si
estamos evaluando la probabilidad de nacimiento un
nio con bajo peso (de riesgo) en funcin de la edad de
la madre. Hasta una edad esa probabilidad puede
aumentar a medida que la edad de la madre disminuye
(madres muy jvenes) y a partir de una edad (madres
muy mayores) la probabilidad puede aumentar a
medida que lo hace la edad de la madre. En este caso
el modelo logstico no sera adecuado.
Colinealidad
Otro problema que se puede presentar en los modelos
de regresin, no slo logsticos, es que las variables
que intervienen estn muy correlacionadas, lo que
conduce a un modelo desprovisto de sentido y por lo
tanto a unos valores de los coeficientes no
interpretables. A esta situacin, de variables
independientes correlacionadas, se la denomina
colinealidad.
o lo que es lo mismo
=0"
".
Edad
(aos)
Sicofrmacos
(0-4)
49
35
23
54
43
63
25
41
22
33
...
...
...
...
...
N
Included in Analysis
Missing Cases
Total
52
14
66
0
66
Unselected Cases
Total
Percent
78,8
21,2
100,0
,0
100,0
Step 0
Observed
Condicin
Muerte Materna
Sobreviviente
Condicin
Muerte
Materna
Sobreviviente
0
24
0
28
Overall Percentage
Percentage
Correct
,0
100,0
53,8
Step 0
Constant
B
,154
S.E.
,278
Wald
,307
df
1
Sig.
,579
Exp(B)
1,167
Step
0
Variables
Score
,677
,604
,427
1,250
7,117
,558
1,072
17,056
EDAD10
EDADGE21
PESOMA22
TALMAT23
NHJSNV25
ININTE27
NCPN28
Overall Statistics
df
Sig.
,411
,437
,513
,264
,008
,455
,300
,017
1
1
1
1
1
1
1
7
Step
Block
Model
df
Sig.
,001
,001
,001
7
7
7
-2 Log
likelihood
48,194
B
Edad
Edad Gestacional
Peso Materno
Talla Materna
N de Hijos
Int. Intergensico
N de CPN
Constante
Nagelkerke
R Square
,487
Classification Tablea
Step 1
Condicin
Muerte
Materna
Sobreviviente
16
8
6
22
Muerte Materna
Sobreviviente
Overall Percentage
Percentage
Correct
66,7
78,6
73,1
1.
2.
3.
Step
a
1
EDAD10
EDADGE21
PESOMA22
TALMAT23
NHJSNV25
ININTE27
NCPN28
Constant
B
,166
-,038
-,019
-9,559
-,936
,095
,385
12,876
S.E.
,092
,041
,038
7,213
,346
,147
,174
10,057
Wald
3,269
,873
,247
1,756
7,331
,419
4,903
1,639
df
1
1
1
1
1
1
1
1
Sig.
,071
,350
,619
,185
,007
,518
,027
,200
Exp(B)
1,181
,962
,981
,000
,392
1,100
1,469
390681,5
gl
1,250
7,117
,558
1,072
17,056
1
1
1
1
1
1
1
7
Sig (p).
,411
,437
,513
,264
,008
,455
,300
,017
,166
-,038
-,019
-9,559
-,936
,095
,385
12,876
S.E.
,092
,041
,038
7,213
,346
,147
,174
10,057
gl
1
1
1
1
1
1
1
1
Sig (p).
OR
,071
1,181
,350
,962
,619
,981
,185
,000
,007
,392
,518
1,100
,027
1,469
,200 390681,50
REFERENCIAS BIBLIOGRFICAS
Predicted
Observed
Condicin
Valor Chi
,677
,604
Model Summary
Step
1
Edad
Edad gestacional
Peso Materno
Talla Materna
N de Hijos
Interv. Intergenesico
N de CPN
Step 1
Variables
4.
5.
a. Variable(s) entered on step 1: EDAD10, EDADGE21, PESOMA22, TALMAT23, NHJSNV25, ININTE27, NCPN28.
6.
7.
Recibido: 02/11/2008
8.
Aceptado: 06/01/2009