Está en la página 1de 65

Anlisis de regresin logstica

Albert Sorribas
Grup de Bioestadstica i Biomatemtica
Facultat de Medicina, UdL

Anlisis de regresin logstica







Concepto de riesgo relativo


Odds ratio y riesgo relativo
Necesidad del planteamiento multivariante
Modelo de regresin logstica
 Definicin
 Estimacin del riesgo relativo
 Interpretacin de resultados

 Cmo realizar un anlisis de regresin


logstica en SPSS?
2

El concepto de riesgo relativo


Tabla de contingencia GRUPO * ENFERMO

GRUPO

Expuestos
No expuestos

Total

Recuento
% de GRUPO
Recuento
% de GRUPO
Recuento
% de GRUPO

ENFERMO
Si
No
23
12
65,7%
34,3%
15
26
36,6%
63,4%
38
38
50,0%
50,0%

Total
35
100,0%
41
100,0%
76
100,0%

P ( S / E ) = 0.657
P( S / E )
= 1.795
RR =
P( S / E )
P ( S / E ) = 0.366
3

Tabla de contingencia EXPOSICI * ENFERMO

Ejemplo

EXPOSICI

Expuestos
No expuestos

Total

Recuento
% de EXPOSICI
Recuento
% de EXPOSICI
Recuento
% de EXPOSICI

ENFERMO
Enfermos
No enfermos
45
22
67,2%
32,8%
25
56
30,9%
69,1%
70
78
47,3%
52,7%

Total
67
100,0%
81
100,0%
148
100,0%

Estimacin de riesgo

Valor
Razn de las ventajas para EXPOSICI
(Expuestos / No expuestos)
Para la cohorte ENFERMO = Enfermos
Para la cohorte ENFERMO = No
enfermos
N de casos vlidos





Intervalo de confianza
al 95%
Inferior
Superior

4,582

2,288

9,175

2,176

1,509

3,139

,475

,327

,689

148

El IC del riesgo relativo es (1.51 , 3,14)


Podemos concluir que la exposicin aumenta entre 1.51 y 3.14
veces la probabilidad de padecer la enfermedad
La interpretacin mdica depende del problema (Hasta qu
punto este aumento en la probabilidad es importante?
4

Ejemplo

La interpretacin depende de cmo se han


codificado las variables
Tabla de contingencia EXPO * STATUS

Tabla de contingencia EXPO * STATUS

STATUS

STATUS
1
EXPO

1
2

Total

Recuento
% de EXPO
Recuento
% de EXPO
Recuento
% de EXPO

23
65,7%
15
31,3%
38
45,8%

12
34,3%
33
68,8%
45
54,2%

Total
35
100,0%
48
100,0%
83
100,0%

EXPO

0
1

Total

Recuento
% de EXPO
Recuento
% de EXPO
Recuento
% de EXPO

Intervalo de confianza
al 95%
Inferior
Superior

Valor

33
68,8%
12
34,3%
45
54,2%

15
31,3%
23
65,7%
38
45,8%

Total
48
100,0%
35
100,0%
83
100,0%

Estimacin de riesgo

Estimacin de riesgo

Razn de las ventajas


para EXPO (1 / 2)
Para la cohorte
STATUS = 1
Para la cohorte
STATUS = 2
N de casos vlidos

4,217

1,668

10,657

2,103

1,297

3,409

,499

,303

,820

83

1
= 0.476
2.103

Valor
Razn de las ventajas
para EXPO (0 / 1)
Para la cohorte
STATUS = 0
Para la cohorte
STATUS = 1
N de casos vlidos

Intervalo de confianza
al 95%
Inferior
Superior

4,217

1,668

10,657

2,005

1,220

3,295

,476

,293

,771

1
= 2.005
0.499

83

En la prctica, la frecuencia de la
patologa suele ser baja
Tabla de contingencia EXPOSICI * ENFERMO

EXPOSICI

Expuestos
No expuestos

Total

Recuento
% de EXPOSICI
Recuento
% de EXPOSICI
Recuento
% de EXPOSICI

ENFERMO
Enfermos
No enfermos
7
134
5,0%
95,0%
2
154
1,3%
98,7%
9
288
3,0%
97,0%

Total
141
100,0%
156
100,0%
297
100,0%

Estimacin de riesgo

Valor
Razn de las ventajas para EXPOSICI
(Expuestos / No expuestos)
Para la cohorte ENFERMO = Enfermos
Para la cohorte ENFERMO = No
enfermos
N de casos vlidos

Intervalo de confianza
al 95%
Inferior
Superior

4,022

,822

19,694

3,872

,818

18,334

,963

,923

1,004

297

Es necesario disponer
de muchas
observaciones
6

En la prctica, la frecuencia de la
patologa suele ser baja
Tabla de contingencia EXPOSICI * ENFERMO

EXPOSICI

Expuestos
No expuestos

Total

Recuento
% de EXPOSICI
Recuento
% de EXPOSICI
Recuento
% de EXPOSICI

ENFERMO
Enfermos
No enfermos
22
1323
1,6%
98,4%
12
1545
,8%
99,2%
34
2868
1,2%
98,8%

Total
1345
100,0%
1557
100,0%
2902
100,0%

Estimacin de riesgo

Valor
Razn de las ventajas para EXPOSICI
(Expuestos / No expuestos)
Para la cohorte ENFERMO = Enfermos
Para la cohorte ENFERMO = No enfermos
N de casos vlidos

Intervalo de confianza
al 95%
Inferior
Superior

2,141

1,056

4,343

2,122
,991
2902

1,054
,983

4,272
,999

Definicin de odds ratio


 El odds ratio (OR) se define como la razn del
riesgo relativo de padecer la enfermedad respecto
al riesgo relativo de no padecerla. Es decir:

P( E / R) / P( E / R )
OR =
P( E / R) / P( E / R )

El odds ratio como aproximacin


del riesgo relativo
 Si la patologa es poco prevalente se cumplir:

P( E / R) << P( E / R)
P( E / R ) << P( E / R )
 Por lo tanto, en este caso:

P( E / R) / P( E / R )
OR =
P( E / R) / P( E / R )
P( E / R) / P( E / R )

Ejemplo: El odds ratio como


aproximacin del riesgo relativo
Tabla de contingencia EXPOSICI * ENFERMO

EXPOSICI

Expuestos
No expuestos

Total

Recuento
% de EXPOSICI
Recuento
% de EXPOSICI
Recuento
% de EXPOSICI

ENFERMO
Enfermos
No enfermos
100
100000
,100%
99,9%
20
100000
,020%
100,0%
120
200000
,060%
99,9%

Total
100100
100,0%
100020
100,0%
200120
100,0%

Estimacin de riesgo

Valor
Razn de las ventajas para EXPOSICI
(Expuestos / No expuestos)
Para la cohorte ENFERMO = Enfermos
Para la cohorte ENFERMO = No enfermos
N de casos vlidos

Intervalo de confianza
al 95%
Inferior
Superior

5,000

3,093

8,082

4,996
,999
200120

3,091
,999

8,074
,999

10

Clculo del odds ratio


P( E / R) / P( E / R ) P( E / R) P( E / R )
OR =
=
P( E / R) / P( E / R ) P( E / R) P( E / R )
f E R f E R 15 165
P( E R) P( E R )

=
= 3.41
OR =
5 145
P( E R) P( E R )
f E R f E R
Tabla de contingencia EXPOSICI * ENFERMO

EXPOSICI

Expuestos
No expuestos

Total

Recuento
% de EXPOSICI
Recuento
% de EXPOSICI
Recuento
% de EXPOSICI

ENFERMO
Enfermos
No enfermos
15
145
9,4%
90,6%
5
165
2,9%
97,1%
20
310
6,1%
93,9%

Total
160
100,0%
170
100,0%
330
100,0%

11

Es aconsejable utilizar el riesgo relativo


en aquellas situaciones donde puede
estimarse
Tabla de contingencia EXPOSICI * ENFERMO

EXPOSICI

Expuestos
No expuestos

Total

Recuento
% de EXPOSICI
Recuento
% de EXPOSICI
Recuento
% de EXPOSICI

ENFERMO
Enfermos
No enfermos
23
145
13,7%
86,3%
12
165
6,8%
93,2%
35
310
10,1%
89,9%

Total
168
100,0%
177
100,0%
345
100,0%

Estimacin de riesgo

Valor
Razn de las ventajas para EXPOSICI (Expuestos /
No expuestos)
Para la cohorte ENFERMO = Enfermos
Para la cohorte ENFERMO = No enfermos
N de casos vlidos

Intervalo de confianza
al 95%
Inferior
Superior

2,181

1,048

4,538

2,019
,926
345

1,038
,861

3,928
,995

12

Ejemplo
 Se estudian los efectos de la contracepcin oral
(CO) en enfermedad cardiovascular en mujeres
entre 40 y 44 aos. En un conjunto de 5000
mujeres usuarias de CO, 13 presentaron infarto de
miocardio en el periodo estudiado. En 10000
mujeres que no usaron CO en el mismo periodo, 7
presentaron infarto. Estima el riesgo relativo de
padecer infarto de miocardio a partir de estos
datos.

13

Ejemplo
Tabla de contingencia CO * IM
IM
Si
CO

Si
No

Total

Recuento
% de CO
Recuento
% de CO
Recuento
% de CO

13
,260%
7
,070%
20
,133%

No
4987
99,7%
9993
99,9%
14980
99,9%

Total
5000
100,0%
10000
100,0%
15000
100,0%
Estimacin de riesgo

Valor
Razn de las ventajas para CO (Si /
No)
Para la cohorte IM = Si
Para la cohorte IM = No
N de casos vlidos

Intervalo de confianza
al 95%
Inferior
Superior

3,721

1,484

9,333

3,714
,998
15000

1,483
,997

9,304
1,000

14

Necesidad del planteamiento


multivariante
Variable
Edad (Incremento de 5 aos)
Colesterol (Alto vs Bajo)
Sexo (Hombre vs Mujer)
Hipertensin
Hiperuricemia
Genotipo (AA vs. Aa)

OR (IC 95%)
1.07
2.23
1.32
3.65
0.53
0.78
2.34
5.64
1.90
8.34
0.23
0.57

 La edad, el colesterol, el gnero, la hipertensin y


la hiperuricemia son factores de riesgo
 Cmo podemos estimar el riesgo relativo en
funcin de estos factores?
 Qu factores son ms significativos?
15

Necesidad del planteamiento


multivariante
 Considerar simultneamente el efecto de
distintas variables
 Seleccionar las variables ms significativas
 Estimar riesgos relativos ajustados segn
determinados valores de las variables
consideradas

 Regresin logstica
16

Introduccin a la regresin
logstica

17

El modelo logstico para la


probabilidad de un suceso
 Cmo podemos indicar la probabilidad de
que se presente un determinado suceso en
funcin de los valores de distintas
variables?
 La probabilidad debe estar entre 0 y 1
 Distintos valores de las variables deben
proporcionar distintas probabilidades
 La probabilidad es creciente (o de creciente) en
funcin de los valores de la variable

18

El modelo logstico

Probabilidad de un suceso en funcin de los valores de


una variable

P(S/X)
0.8

P(S/X=15)=0.924

0.6
0.4
0.2

10

15

20

25

X
19

P(S/X) puede cambiar en funcin


del grupo o de terceras variables
1

P(S/X)
0.8

Y=y1

0.6

Y=y3

Y=y2

0.4
0.2

X
5

10

15

20

25

20

P(S/X) puede cambiar en funcin


del grupo o de terceras variables

P(S/X,Y)
1
0.75
20

0.5
0.25

15

0
0

10
10
5

20
30 0
21

El modelo logstico univariante


P (S / X ) =

1
1 + e ( 0 + 1 X )

P (S / X )
= e ( 0 + 1 X )
P (S / X )
P (S / X )
= 0 + 1 X
Log
P (S / X )
22

El modelo logstico univariante


P ( S / X = x 2 ) P ( S / X = x1 )
P ( S / X = x 2 ) P ( S / X = x1 )
=
=
:
P ( S / X = x 2 ) P ( S / X = x1 ) P ( S / X = x 2 ) P ( S / X = x 1 )
P ( S / X = x 2 ) / P ( S / X = x1 )
= OR
P ( S / X = x 2 ) / P ( S / X = x1 )

P ( S / X = x1 )

= e ( 0 + 1 x1 )
P ( S / X = x1 )

1 ( x 2 x1 )

OR
=
e

P (S / X = x2 )
= e ( 0 + 1x2 )

P ( S / X = x2 )
Odds ratio (estimacin del riesgo relativo) asociado
a un cambio de x2 a x1

23

Ejemplo
 Disponemos de la edad de cada individuo y
determinamos si ha padecido o no una determinada
complicacin relacionada con un tratamiento
(Variable Status: 1(Si) 0 (No))

24

Codificacin de la variable dependiente


Valor original
,00
1,00

Ejemplo

Valor interno
0
1

Variables en la ecuacin

Paso
a
1

EDAD
Constante

B
,244
-10,579

E.T.
,059
2,796

Wald
17,289
14,318

gl
1
1

Sig.
,000
,000

Exp(B)
1,276
,000

I.C. 95,0% para EXP(B)


Inferior
Superior
1,138
1,432

a. Variable(s) introducida(s) en el paso 1: EDAD.

P( S / edad ) =

OR = e
OR = e

0.24

1
1+ e

= 1.276

0.24*5

= 3.32

( 10.58 + 0.24*edad )

OR = e

0.24*( e2 e1 )

Una persona que tiene un ao ms


tiene un riesgo relativo de 1.3 respecto
a una persona que tiene un ao menos
Una persona que tiene cinco aos ms
tiene un riesgo relativo de 3.3 respecto
a una persona que tiene cinco aos menos
25

Tratamiento de variables discretas


(nominales)
Tabla de contingencia HIPERT * STATUS
STATUS
HIPERT

Si
No

Total

Recuento
% de HIPERT
Recuento
% de HIPERT
Recuento
% de HIPERT

Si

No

28
73,7%
23
69,7%
51
71,8%

10
26,3%
10
30,3%
20
28,2%

Total
38
100,0%
33
100,0%
71
100,0%

Estimacin de riesgo

Razn de las ventajas para HIPERT (Si / No)


Para la cohorte STATUS = Si
Para la cohorte STATUS = No
N de casos vlidos

Valor
1,217
1,057
,868
71

Intervalo de confianza
al 95%
Inferior
Superior
,432
3,429
,788
1,419
,413
1,824

Variables en la ecuacin

Paso
a
1

HIPERT(1)
Constante

B
,197
,833

E.T.
,528
,379

Wald
,139
4,835

a. Variable(s) introducida(s) en el paso 1: HIPERT.

gl
1
1

Sig.
,710
,028

Exp(B)
1,217
2,300

I.C. 95,0% para EXP(B)


Inferior
Superior
,432
3,429

26

Tratamiento de variables discretas


(nominales)
Hipertensin: 1 (Si) 2 (No)
Categora de referencia es NO
Especificar que el ltimo valor es el de referencia !!
Status: 1 (Si) 0 (No)

27

Tratamiento de variables discretas


(nominales)
Codificaciones de variables categricas

Codificacin de

GENO

Tabla de contingencia GENO * STATUS

Frecuencia
2
2
2

aa
Aa
AA

(1)
1,000
,000
,000

(2)
,000
1,000
,000

STATUS
GENO

aa
Aa
AA

Total

Recuento
% de GENO
Recuento
% de GENO
Recuento
% de GENO
Recuento
% de GENO

No

Si

23
63,9%
16
42,1%
7
17,5%
46
40,4%

13
36,1%
22
57,9%
33
82,5%
68
59,6%

Total
36
100,0%
38
100,0%
40
100,0%
114
100,0%

aa : 1
Aa : 2
AA : 3

Categora de
Referencia: ltima

13 7
= 0.12
23 33

Variables en la ecuacin
B
Paso
a
1

GENO
GENO(1)
GENO(2)
Constante

-2,121
-1,232
1,550

E.T.
,542
,530
,416

Wald
15,328
15,326
5,400
13,884

gl
2
1
1
1

Sig.
,000
,000
,020
,000

Exp(B)
,120
,292
4,714

a. Variable(s) introducida(s) en el paso 1: GENO.

28

Tratamiento de variables discretas


(nominales)
Codificaciones de variables categricas

Codificacin de

GENO

Frecuencia
2
2
2

aa
Aa
AA

Tabla de contingencia GENO * STATUS

(1)
,000
1,000
,000

(2)
,000
,000
1,000

STATUS
GENO

aa
Aa
AA

Total

Recuento
% de GENO
Recuento
% de GENO
Recuento
% de GENO
Recuento
% de GENO

No

Si

23
63,9%
16
42,1%
7
17,5%
46
40,4%

13
36,1%
22
57,9%
33
82,5%
68
59,6%

Total
36
100,0%
38
100,0%
40
100,0%
114
100,0%

aa : 1
Aa : 2
AA : 3

Categora de
Referencia: Primera

33 23
= 8.34
7 13

Variables en la ecuacin
B
Paso
a
1

GENO
GENO(1)
GENO(2)
Constante

,889
2,121
-,571

E.T.
,478
,542
,347

Wald
15,328
3,461
15,326
2,704

a. Variable(s) introducida(s) en el paso 1: GENO.

gl
2
1
1
1

Sig.
,000
,063
,000
,100

Exp(B)
2,433
8,340
,565

29

El modelo logstico multivariante


X = { X 1 , X 2 ,..., X n }

P (S / X ) =

1
1 + e ( 0 + 1 X 1 + 2 X 2 + ... + n X n )

P (S / X )
= e ( 0 + 1 X 1 + 2 X 2 + ... + n X n )
P (S / X )
P (S / X )
= 0 + 1 X 1 + 2 X 2 + ... + n X n
Log
P (S / X )
30

P ( S / X i = xi )
( 0 + 1 X 1 + 2 X 2 +...+ i xi + n X n )
=e
P ( S / X i = xi )

P(S / X i = x j )
P(S / X i = x j )

=e

( 0 + 1 X 1 + 2 X 2 +...+ i x j + n X n )

P ( S / X i = xi ) / P ( S / X i = xi )
i ( xi x j )
=e
OR =
P(S / X i = x j ) / P(S / X i = x j )
OR correspondiente a la estimacin del RR cuando X pasa de xi a xj
31

Ejemplo
 Disponemos de datos acerca de hombres y
mujeres en relacin a la aparicin de
molestias artrticas. Queremos establecer la
posible relacin de estas molestias con la
concentracin dos metabolitos (X1,X2).

32

Resultados
Codificaciones de variables categricas
Codificaci
n de
SEXO

Hombre
Mujer

Frecuencia
59
52

(1)
1,000
,000

Variables en la ecuacin

Paso
a
1

SEXO(1)
X1
X2
Constante

B
,451
,253
,319
-8,086

E.T.
,418
,110
,114
2,697

Wald
1,164
5,277
7,852
8,988

gl
1
1
1
1

Sig.
,281
,022
,005
,003

Exp(B)
1,569
1,288
1,376
,000

I.C. 95,0% para EXP(B)


Inferior
Superior
,692
3,559
1,038
1,597
1,101
1,721

a. Variable(s) introducida(s) en el paso 1: SEXO, X1, X2.

33

Interpretacin
Variables en la ecuacin

Paso
a
1

SEXO(1)
X1
X2
Constante

B
,451
,253
,319
-8,086

E.T.
,418
,110
,114
2,697

Wald
1,164
5,277
7,852
8,988

gl
1
1
1
1

Sig.
,281
,022
,005
,003

Exp(B)
1,569
1,288
1,376
,000

I.C. 95,0% para EXP(B)


Inferior
Superior
,692
3,559
1,038
1,597
1,101
1,721

a. Variable(s) introducida(s) en el paso 1: SEXO, X1, X2.

 La estimacin del riesgo relativo de hombres respecto a


mujeres es:

OR( H / M ) = 1.57
 Esta estimacin est ajustada por las variables X1 y X2
34

Interpretacin
Variables en la ecuacin

Paso
a
1

SEXO(1)
X1
X2
Constante

B
,451
,253
,319
-8,086

E.T.
,418
,110
,114
2,697

Wald
1,164
5,277
7,852
8,988

gl

Sig.
,281
,022
,005
,003

1
1
1
1

Exp(B)
1,569
1,288
1,376
,000

I.C. 95,0% para EXP(B)


Inferior
Superior
,692
3,559
1,038
1,597
1,101
1,721

a. Variable(s) introducida(s) en el paso 1: SEXO, X1, X2.

Variables en la ecuacin

Paso
a
1

X2
Constante

B
,293
-1,823

E.T.
,109
,630

Wald
7,205
8,383

gl
1
1

Sig.
,007
,004

Exp(B)
1,340
,162

I.C. 95,0% para EXP(B)


Inferior
Superior
1,082
1,660

a. Variable(s) introducida(s) en el paso 1: X2.

35

Seleccin de variables
Variables en la ecuacin

Paso
a
1

SEXO(1)
X1
X2
Constante

B
,451
,253
,319
-8,086

E.T.
,418
,110
,114
2,697

Wald
1,164
5,277
7,852
8,988

gl

Sig.
,281
,022
,005
,003

1
1
1
1

Exp(B)
1,569
1,288
1,376
,000

I.C. 95,0% para EXP(B)


Inferior
Superior
,692
3,559
1,038
1,597
1,101
1,721

a. Variable(s) introducida(s) en el paso 1: SEXO, X1, X2.

 Podemos eliminar las variables que no son significativas


Variables en la ecuacin

Paso
a
1

X1
X2
Constante

B
,267
,309
-8,111

E.T.
,110
,113
2,701

Wald
5,917
7,501
9,019

gl
1
1
1

Sig.
,015
,006
,003

Exp(B)
1,306
1,362
,000

I.C. 95,0% para EXP(B)


Inferior
Superior
1,053
1,619
1,092
1,699

a. Variable(s) introducida(s) en el paso 1: X1, X2.

36

Modelo final
Variables en la ecuacin

Paso
a
1

X1
X2
Constante

B
,267
,309
-8,111

E.T.
,110
,113
2,701

Wald
5,917
7,501
9,019

gl
1
1
1

Sig.
,015
,006
,003

Exp(B)
1,306
1,362
,000

I.C. 95,0% para EXP(B)


Inferior
Superior
1,053
1,619
1,092
1,699

a. Variable(s) introducida(s) en el paso 1: X1, X2.

P( S / X ) =

1
1 + e ( 8.11+ 0.267 X 1 + 0.309 X 2 )

X 1 x1 ( 1x1 + 2 x2 )
= e
e (0.267 ( 2321) + 0.309 ( 65.5) ) = 1.99
OR
X 2 x2
37

Uso de la regresin logstica como


mtodo de anlisis de la relacin entre
variables cualitativas

 A menudo queremos evaluar si existe relacin entre


distintas variables cualitativas (tablas mltiples)
 Cuando el objetivo es calcular la probabilidad de un
suceso en funcin de varias variables, podemos
utilizar la regresin logstica
 P.e. Probabilidad de complicaciones en funcin de la
gravedad (+,++,+++), el sexo (Hombre/Mujer), y
el genotipo (aa,Aa,AA).

38

Uso de la regresin logstica


como mtodo de anlisis de
la relacin entre variables
cualitativas

Codificaciones de variables categricas


Codificacin de
GRAVEDAD

GENOTIPO

SEXO

+
++
+++
AA
Aa
aa
Hombre
Mujer

Frecuencia
14
22
6
14
11
17
23
19

(1)
,000
1,000
,000
,000
1,000
,000
1,000
,000

(2)
,000
,000
1,000
,000
,000
1,000

Variables en la ecuacin

B
Paso
a
1

GENOTIPO
GENOTIPO(1)
GENOTIPO(2)
SEXO(1)
GRAVEDAD
GRAVEDAD(1)
GRAVEDAD(2)
Constante

E.T.

,691
-,330
1,123

,955
,797
,718

1,076
,639
-,874

,756
1,130
,939

Wald
1,258
,524
,171
2,443
2,025
2,025
,320
,865

gl
2
1
1
1
2
1
1
1

Sig.
,533
,469
,679
,118
,363
,155
,572
,352

Exp(B)

I.C. 95,0% para EXP(B)


Inferior
Superior

1,996
,719
3,074

,307
,151
,752

12,964
3,433
12,563

2,934
1,895
,417

,666
,207

12,922
17,364

a. Variable(s) introducida(s) en el paso 1: GENOTIPO, SEXO, GRAVEDAD.

39

Uso de la regresin logstica


como mtodo de anlisis de
la relacin entre variables
cualitativas

Codificaciones de variables categricas


Codificacin de
GRAVEDAD

GENOTIPO

SEXO

+
++
+++
AA
Aa
aa
Hombre
Mujer

Frecuencia
14
22
6
14
11
17
23
19

(1)
,000
1,000
,000
,000
1,000
,000
1,000
,000

(2)
,000
,000
1,000
,000
,000
1,000

Variables en la ecuacin

B
Paso
a
1

GENOTIPO
GENOTIPO(1)
GENOTIPO(2)
SEXO(1)
GRAVEDAD
GRAVEDAD(1)
GRAVEDAD(2)
Constante

E.T.

,688
,722
-,176

,603
,602
,473

1,123
2,547
-1,284

,514
,711
,615

Wald
1,753
1,303
1,435
,139
13,566
4,766
12,841
4,360

gl
2
1
1
1
2
1
1
1

Sig.
,416
,254
,231
,709
,001
,029
,000
,037

Exp(B)

I.C. 95,0% para EXP(B)


Inferior
Superior

1,991
2,058
,838

,610
,632
,332

6,491
6,702
2,117

3,074
12,775
,277

1,122
3,171

8,425
51,463

a. Variable(s) introducida(s) en el paso 1: GENOTIPO, SEXO, GRAVEDAD.

40

La regresin logstica
como alternativa al
procedimiento de
Mantel-Haenzel

Tabla de contingencia LOW * SMOKE * RACE


Recuento
SMOKE
RACE
1,00

,00
LOW

2,00

Total
LOW

3,00

Total
LOW

,00
1,00
,00
1,00
,00
1,00

Total

1,00
40
4
44
11
5
16
35
20
55

33
19
52
4
6
10
7
5
12

Total
73
23
96
15
11
26
42
25
67

Estimacin de riesgo

RACE
1,00
2,00
3,00

Razn de las ventajas para LOW (,00 / 1,00)


N de casos vlidos
Razn de las ventajas para LOW (,00 / 1,00)
N de casos vlidos
Razn de las ventajas para LOW (,00 / 1,00)
N de casos vlidos

Valor
5,758
96
3,300
26
1,250
67

Intervalo de confianza
al 95%
Inferior
Superior
1,782
18,599
,635

17,160

,350

4,462

41

La regresin logstica como alternativa al


procedimiento de Mantel-Haenzel
Odds ratios ajustados

Estimacin de riesgo

RACE
1,00
2,00
3,00

Valor
5,758
96
3,300
26
1,250
67

Razn de las ventajas para LOW (,00 / 1,00)


N de casos vlidos
Razn de las ventajas para LOW (,00 / 1,00)
N de casos vlidos
Razn de las ventajas para LOW (,00 / 1,00)
N de casos vlidos

Intervalo de confianza
al 95%
Inferior
Superior
1,782
18,599
,635

17,160

,350

4,462

Variables en la ecuacin

Paso
a
1

SMOKE(1)
RACE
RACE(1)
RACE(2)
Constante

B
1,116

E.T.
,369

1,084
1,108
-1,840

,490
,400
,353

Wald
9,135
9,112
4,894
7,668
27,205

gl
1
2
1
1
1

Sig.
,003
,011
,027
,006
,000

Exp(B)
3,052
2,956
3,030
,159

I.C. 95,0% para EXP(B)


Inferior
Superior
1,480
6,294
1,132
1,382

7,724
6,639

a. Variable(s) introducida(s) en el paso 1: SMOKE, RACE.

42

Modelos con variables cualitativas y


cuantitativas
 En un mismo modelo de regresin logstica
podemos mezclar variables cualitativas
(nominales u ordinales) y variables
cuantitativas
 La codificacin de variables cualitativas
debe hacerse con cuidado para facilitar la
interpretacin de resultados
 En las variables cualitativas debemos
escoger una categora de referencia para el
clculo de odds ratios.
43

Datos de evolucin en ICU







Edad
Sexo (0:Male, 1:Female)
Race (1:White, 2:Black, 3:Other)
Service (0:Medical, Surgical)

44

SPSS

45

SPSS

Codificaciones de variables categricas


Codificacin de
Race

Service at ICU
admission
Sex

White
Black
Other
Medical
Surgical
Male
Female

Frecuencia
175
15
10
93
107
124
76

(1)
1,000
,000
,000
1,000
,000
1,000
,000

(2)
,000
1,000
,000

Race(1): White
Race(2): Black
Ser(1):Medical
Sex(1):Male

46

Race(1): White
Race(2): Black

SPSS

Ser(1):Medical
Sex(1):Male
Variables en la ecuacin

Paso
a
1

AGE
SEX(1)
RACE
RACE(1)
RACE(2)
SER(1)
Constante

B
,028
,028

E.T.
,011
,379

-,395
-1,579
1,071
-3,272

,852
1,331
,382
1,059

Wald
6,256
,005
1,493
,215
1,407
7,885
9,551

gl
1
1
2
1
1
1
1

Sig.
,012
,941
,474
,643
,236
,005
,002

Exp(B)
1,029
1,028
,673
,206
2,919
,038

I.C. 95,0% para EXP(B)


Inferior
Superior
1,006
1,052
,490
2,160
,127
,015
1,382

3,580
2,801
6,167

a. Variable(s) introducida(s) en el paso 1: AGE, SEX, RACE, SER.

La admisin en un servicio mdico determina una probabilidad ms


elevada de muerte (OR: 1.38 6.17)
La edad se asocia significativamente con una mayor probabilidad
de muerte
El sexo y el grupo tnico no se relacionan significativamente con la
probabilidad de muerte
47

Lemeshow et al. (1988) JASA 83:348-356

48

Codificaciones de variables categricas

Codificacin
de variables

Codificacin de
Level of conciosness at
ICU admission
Race

Service at ICU
admission
Cancer part of present
problem
History of chronic renal
failure
Infection probable at
ICU admission
CPR prior to ICU
admission
Previous admission to
an ICU within 6 months
Type of admission
Creatinine from initial
blood gases
Bicarbonate from initial
blood gases
PCO2 from initial blood
gases
PH from initial boood
gases
Long bone, Multiple,
Neck, Single area, or
Hip
PO2fracture
from initial blood
gases
Sex

No coma or stupor
Depp stupor
Coma
White
Black
Other
Medical
Surgical
No
Yes
No
Yes
No
Yes
No
Yes
No
Yes
Elective
Emergency
<=2.0
>2.0
>=18
<18
<=45
>45
>=7.25
<7.25
No
Yes
>60
<=60
Male
Female

Frecuencia
185
5
10
175
15
10
93
107
180
20
181
19
116
84
187
13
170
30
53
147
190
10
185
15
180
20
187
13
185
15
184
16
124
76

(1)
1,000
,000
,000
1,000
,000
,000
1,000
,000
1,000
,000
1,000
,000
1,000
,000
1,000
,000
1,000
,000
1,000
,000
1,000
,000
1,000
,000
1,000
,000
1,000
,000
1,000
,000
1,000
,000
1,000
,000

(2)
,000
1,000
,000
,000
1,000
,000

49

Variables en la ecuacin

Paso
a
1

AGE
SEX(1)
RACE
RACE(1)
RACE(2)
SER(1)
CAN(1)
CRN(1)
INF(1)
CPR(1)
SYS
HRA
PRE(1)
TYP(1)
FRA(1)
PO2(1)
PH(1)
PCO(1)
BIC(1)
CRE(1)
LOC
LOC(1)
LOC(2)
Constante

B
,056
,721

E.T.
,018
,546

-,583
-7,438
,674
-3,483
-,119
,108
-1,032
-,021
-,003
-1,279
-3,748
-1,649
,677
-1,771
2,084
,262
-,100

1,313
20,543
,629
1,121
,845
,556
,990
,009
,010
,702
1,342
1,093
,940
1,212
1,165
,897
1,131

-3,458
15,659
7,149

1,341
39,484
3,139

Wald
9,331
1,746
,310
,197
,131
1,148
9,650
,020
,038
1,087
4,871
,080
3,321
7,798
2,277
,518
2,134
3,201
,086
,008
6,857
6,646
,157
5,188

gl
1
1
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
1
1
1

Sig.
,002
,186
,856
,657
,717
,284
,002
,888
,846
,297
,027
,778
,068
,005
,131
,472
,144
,074
,770
,929
,032
,010
,692
,023

Exp(B)
1,058
2,057

I.C. 95,0% para EXP(B)


Inferior
Superior
1,020
1,097
,706
5,999

,558
,001
1,962
,031
,888
1,114
,356
,979
,997
,278
,024
,192
1,967
,170
8,033
1,300
,904

,043
,000
,572
,003
,170
,375
,051
,961
,977
,070
,002
,023
,312
,016
,820
,224
,099

7,313
1,8E+14
6,729
,277
4,649
3,311
2,480
,998
1,017
1,101
,327
1,637
12,419
1,832
78,741
7,537
8,296

,031
6321447
1273,250

,002
,000

,436
2,57E+40

a. Variable(s) introducida(s) en el paso 1: AGE, SEX, RACE, SER, CAN, CRN, INF, CPR, SYS, HRA, PRE, TYP, FRA,
PO2, PH, PCO, BIC, CRE, LOC.

50

Variables en la ecuacin

Paso
a
1

AGE
SEX(1)
RACE
RACE(1)
RACE(2)
SER(1)
CAN(1)
CRN(1)
INF(1)
CPR(1)
SYS
HRA
PRE(1)
TYP(1)
FRA(1)
PO2(1)
PH(1)
PCO(1)
BIC(1)
CRE(1)
Constante

B
,042
,484

E.T.
,014
,456

-,221
-1,130
,349
-2,083
-,314
-,172
-1,548
-,013
-,011
-,728
-2,724
-,651
-,207
-,557
,949
,271
-,446
3,953

,987
1,433
,533
,908
,676
,463
,752
,007
,009
,588
,940
,949
,805
,954
,891
,786
,933
2,554

Wald
8,402
1,130
,729
,050
,622
,429
5,267
,216
,139
4,237
3,629
1,491
1,536
8,403
,471
,066
,341
1,133
,119
,229
2,396

gl
1
1
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

Sig.
,004
,288
,694
,823
,430
,512
,022
,642
,709
,040
,057
,222
,215
,004
,493
,797
,559
,287
,730
,632
,122

Exp(B)
1,043
1,623
,802
,323
1,418
,125
,730
,842
,213
,987
,989
,483
,066
,521
,813
,573
2,582
1,312
,640
52,101

I.C. 95,0% para EXP(B)


Inferior
Superior
1,014
1,073
,665
3,964
,116
,019
,499
,021
,194
,340
,049
,973
,972
,153
,010
,081
,168
,088
,450
,281
,103

5,550
5,353
4,030
,738
2,745
2,085
,929
1,000
1,007
1,527
,414
3,349
3,936
3,719
14,807
6,120
3,984

a. Variable(s) introducida(s) en el paso 1: AGE, SEX, RACE, SER, CAN, CRN, INF, CPR, SYS, HRA, PRE, TYP, FRA,
PO2, PH, PCO, BIC, CRE.

51

Seleccin de modelos

52

Seleccin de modelos
Variables en la ecuacin

Paso
1
Paso
2

Paso
3

Paso
4

Paso
5

TYP(1)
Constante
AGE
TYP(1)
Constante
AGE
CPR(1)
TYP(1)
Constante
AGE
CAN(1)
CPR(1)
TYP(1)
Constante
AGE
CAN(1)
CPR(1)
SYS
TYP(1)
Constante

B
-2,185
-1,054
,034
-2,454

E.T.
,745
,188
,011
,753

Wald
8,600
31,288
10,117
10,629

-3,055

,693

,035
-1,391
-2,306
-1,885
,037
-1,534
-1,344
-2,849
-,609
,037
-1,624
-1,247
-,013
-2,746
1,029

,011
,616
,757
,864
,012
,802
,616
,867
1,094
,012
,808
,629
,006
,879
1,356

gl
1
1
1
1

Sig.
,003
,000
,001
,001

Exp(B)
,112
,349
1,035
,086

19,453

,000

,047

9,970
5,093
9,286
4,764
10,561
3,655
4,766
10,800
,310
10,307
4,033
3,933
4,434
9,756
,576

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

,002
,024
,002
,029
,001
,056
,029
,001
,578
,001
,045
,047
,035
,002
,448

1,036
,249
,100
,152
1,038
,216
,261
,058
,544
1,038
,197
,287
,987
,064
2,799

I.C. 95,0% para EXP(B)


Inferior
Superior
,026
,484
1,013
,020

1,057
,376

1,013
,074
,023

1,059
,833
,439

1,015
,045
,078
,011

1,062
1,039
,872
,317

1,015
,040
,084
,975
,011

1,062
,962
,986
,999
,359

53

Modelo final
Variables en la ecuacin

Paso
a
1

AGE
CAN(1)
CPR(1)
SYS
TYP(1)
Constante

B
,037
-1,624
-1,247
-,013
-2,746
1,029

E.T.
,012
,808
,629
,006
,879
1,356

Wald
10,307
4,033
3,933
4,434
9,756
,576

gl
1
1
1
1
1
1

Sig.
,001
,045
,047
,035
,002
,448

Exp(B)
1,038
,197
,287
,987
,064
2,799

I.C. 95,0% para EXP(B)


Inferior
Superior
1,015
1,062
,040
,962
,084
,986
,975
,999
,011
,359

a. Variable(s) introducida(s) en el paso 1: AGE, CAN, CPR, SYS, TYP.


Codificaciones de variables categricas
Codificaci
n de
Type of admission
CPR prior to ICU
admission
Cancer part of present
problem

Elective
Emergency
No
Yes
No
Yes

Frecuencia
53
147
187
13
180
20

(1)
1,000
,000
1,000
,000
1,000
,000

54

Modelo final

Cambio de codificacin

Cuidado: Los intevalos


de confianza son muy
amplios

Variables en la ecuacin

Paso
a
1

AGE
CAN(1)
CPR(1)
SYS
TYP(1)
Constante

B
,037
1,624
1,247
-,013
2,746
-4,588

E.T.
,012
,808
,629
,006
,879
1,431

Wald
10,307
4,033
3,933
4,434
9,756
10,276

gl
1
1
1
1
1
1

Sig.
,001
,045
,047
,035
,002
,001

Exp(B)
1,038
5,071
3,481
,987
15,585
,010

I.C. 95,0% para EXP(B)


Inferior
Superior
1,015
1,062
1,040
24,732
1,015
11,944
,975
,999
2,782
87,323

a. Variable(s) introducida(s) en el paso 1: AGE, CAN, CPR, SYS, TYP.

Codificaciones de variables categricas


Codificaci
n de
Type of admission
CPR prior to ICU
admission
Cancer part of present
problem

Elective
Emergency
No
Yes
No
Yes

Frecuencia
53
147
187
13
180
20

(1)
,000
1,000
,000
1,000
,000
1,000

CAN, CPR y TYP


son las variables
ms importantes

55

Interpretacin
 Un individuo de 55 aos ingresado en urgencias, con
una presin sistlica de 100, con cancer y CPR previo
tiene una probabilidad de morir igual a 0.85
 Un individuo de 55 aos ingresado en urgencias, con
una presin sistlica de 100, sin cancer ni CPR previo
tiene una probabilidad de morir igual a 0.25
 Un individuo de 55 aos ingresado en urgencias, con
una presin sistlica de 100, con cancer y sin CPR
previo tiene una probabilidad de morir igual a 0.62
 Un individuo de 55 aos ingresado en urgencias, con
una presin sistlica de 60, con cancer y sin CPR
previo tiene una probabilidad de morir igual a 0.74
56

Limitaciones de la regresin
logstica
 Independencia de variables

 Podemos considerar efectos de


interaccin entre variables
 Es difcil concretar los efectos

 Efectos lineales de las variables en el


valor del logit
 Alternativas: Redes Neurales
57

Redes neurales
 Algoritmo de clculo que es capaz de
aprender la relacin entre variables
de entrada (predictoras) y salida
(sucesos, grupos, etc.)
 Generalizan cualquier funcin nolineal
 El proceso de aprendizaje es crtico
58

Redes neurales
Inputs

59

Redes neurales
Inputs

Outputs

60

Redes neurales
Inputs

Hidden
units

Outputs

61

Redes neurales
Inputs

Hidden
units

Outputs

62

Redes neurales
Inputs

Hidden
units

Outputs

63

Redes neurales
Inputs

Hidden
units

Outputs

64

Redes neurales
Inputs

Hidden
units

Outputs

65

También podría gustarte