Está en la página 1de 33

CAPTULO 12.

INTRODUCCIN A LOS MODELOS


MULTIVARIABLES.
M.A. Martnez-Gonzlez, A. Snchez-Villegas, C. Lpez del Burgo
12.1. Introduccin
El anlisis multivariable trata con tres o ms variables simultneamente. Los
fenmenos de salud y enfermedad tienen habitualmente mltiples causas, en vez de una sola.
Nos movemos, por tanto, en un mundo multivariable. Lo ms comn en cualquier anlisis
estadstico es que intentemos eplicar un fenmeno teniendo en consideracin varias
variables simultneamente. !or esto es tan importante el anlisis multivariable
"
. En la tabla
"#." se presentan $ e%emplos donde se tienen en cuenta varias variables eplicativas de un
resultado.
T!" 12.1. E#$%&"o' t(&ico' d$ n)"i'i' %u"ti*ri!"$ $n ci$nci' d$ " '"ud.
Ejemplo 1 Ejemplo 2 Ejemplo 3
Se desea explicar... Cambio en colesterol Aparicin de trastornos de
la conducta alimentaria (TCA)
Incidencia de Hipertensin (HTA)
durante 27 meses
Variable dependiente ("efecto") Colesterol total (mg/dl) Incidencia de TCA (s/no) !TA (s/no) " Tiempo (meses)
Supuesta(s) "causa(s)" que se
tratan de valorar
Intervencin diettica stado civil de los padres
Comer solas
xposicin a mass!media
Consumo de l"cteos desnatados
#ariables independientes... Centro sanitario
dad
Sexo
Indice masa corporal
Inter#enci$n diet%tica
dad
Indice masa corporal
Auto!estima
$ivel social
Estado ci#il de los padres
Comer solas
E&posici$n a mass-media
dad
Sexo
Indice masa corporal
Actividad %&sica
Consumo de alco'ol
In(esta de sodio
In(esta ener(tica total
Tabaco
Hipercolesterolemia
Cons'mo de l(cteos desnatados
Se emplear"... )egresi$n *+,TI-,E )egresi$n ,./01TICA )egresi$n de C.2
(proportional hazards model)
)*or qu+ ,a variable dependiente
es c'antitati#a
,a variable dependiente es
dicot$mica
,a variable dependiente es del tipo
"tiempo 3asta 'n e#ento"
-e%erencias Ann Intern Med 2006 Pediatrics .//012223024. Am J Clin Nutr .//415.367..
En el primer e%emplo de la tabla "#." se trata de valorar los cambios en el colesterol
total que pueden eplicarse por una intervencin diet&tica, pero hay que tener en cuenta
tambi&n otros factores. En este e%emplo, se debern controlar pocos factores, ya que se
trataba de un ensayo aleatorizado multic&ntrico de 'ran tama(o y este dise(o corri'e por s
mismo muchos ses'os, puesla aleatorizacin consi'ue un equilibrio de las otras variables
entre los 'rupos comparados )d$ Ir"+ 2,,-*.
"
En ocasiones se conoce tambi&n como anlisis multivariante. !ero, en sentido estricto, se habla de multivariable cuando
eiste una sola variable dependiente )respuesta*, aunque haya muchas variables predictoras o independientes. +e reserva el
t&rmino ,multivariante, para cuando tambi&n hay muchas variables dependientes o de respuesta.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#"-
El colesterol total es una variable cuantitativa o num&rica, por lo tanto lo indicado es
una re'resin que tiene una sola variable dependiente cuantitativa, pero ms de una variable
independiente y se llama re'resin lineal mltiple o ms escuetamente regresin !ltiple. La
re'resin mltiple es una etensin de la re'resin lineal simple.
/e'resin lineal simple. y 0 a 1 b
/e'resin mltiple. y 0 a 1 b"" 1 b## 1... 1 bp2p
En el se'undo e%emplo interesa saber qu& variables se relacionan con la aparicin de
trastornos de la conducta alimentaria o 345 )anoreia nerviosa o bulimia* en chicas %venes.
La variable dependiente es ahora de tipo dicotmico )3450" si la chica desarroll uno de
estos trastornos y 34506 cuando no lo desarroll*. Los predictores o variables independientes
son la edad, el ndice de masa corporal )784*
#
, el nivel de autoestima, el estatus
socioeconmico, el estado civil de los padres )si estn casados o no*, si las chicas comen
habitualmente en solitario y su eposicin a medios de comunicacin )revistas para chicas
adolescentes, pro'ramas de radio*. Los investi'adores tenan la hiptesis de que las $ ltimas
variables podran e%ercer un papel causal en la '&nesis de los 345. 4omo la variable
dependiente )supuesto ,efecto,* es cualitativa dicotmica, se usar la re'resin logstica, que
viene a ser una etensin multivariable de la %i cuadrado.
El tercer e%emplo valor si el consumo de productos lcteos desnatados podra
prote'er frente a la ocurrencia de hipertensin arterial )935* en un se'uimiento prospectivo
durante #: meses de ;.<<6 personas )estudio ,+=N,, +e'uimiento =niversidad de Navarra,
Mrt(n$/23on/)"$/+ 2,,4*. +i slo se hubiese tenido en cuenta la ocurrencia de 935 )"0s>
60no* la situacin sera id&ntica a la del e%emplo #. En cambio, ahora interesa tambi&n el
tiepo que tarda en producirse el dia'nstico de 935. +e dispone ahora de dos variables por
participante.
"?+i ha desarrollado o no hipertensin. " 0 el participante desarroll 935
6 0 no desarroll
#?4unto tiempo ha sido se'uido )hasta desarrollar 935 o hasta acabar el estudio*
La primera variable es cualitativa dicotmica, la se'unda es el tiempo de observacin
que es cuantitativa. +e deben combinar ambas, si'uiendo t&cnicas anlo'as a las del anlisis
de supervivencia. 4uando se desea aplicar un anlisis multivariante en esta situacin, se
aplicar la re'resin de 4o o proportional hazards odel. La re'resin de 4o es una
etensin multivariable de los m&todos de @aplan?8eier.
Las bases de datos presentaran el si'uiente aspecto parcial.
1.RE3R. M5LTIPLE 2. RE3R. LO3STICA 6. RE3RESIN DE CO7
8 A" A# A$ 8 A" A# A$ 8 A" A# A$
29+2 # B; #$,;" NO " "C ",; NO 2: C; " $
21,+, " :" ##,<- S( 6 "; #,$ S( 1- ;# # "
12+: $ B- $",6; NO " #6 $," NO 2: ;; " ;
cambio
colest4
(rupo
tratam.
edad I8C 5iagn4
TCA
estado
civil
edad 'oras
radio
5iagn4
!TA
*eses
seg'im4
edad sexo quintil
l"cteos
#
El indice de masa corporal )784* es el peso en D' dividido por la talla )en metros* elevada al cuadrado.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
##6
El aspecto parcial de los datos en +!++ para el e%emplo " )re'resin mltiple* sera.
En el e%emplo # )re'resin lo'stica* se suele codificar con un valor de " a quienes son
casos )dia'nosticados de 345 en el e%emplo* y con un valor de 6 a los no dia'nosticados. El
aspecto en +!++ se presenta a continuacin por duplicado, a la derecha se muestran los
valores de las etiquetas.
En el e%emplo $ )re'resin de 4o* hacen falta dos variables para construir la
respuesta ),efecto, o variable dependiente*, ya que hay que combinar el dato de si se ha
producido o no el evento )935* con otro dato que es el tiempo que ha tardado en producirse
dicho evento. !ara aquellos en quienes no se produ%o el evento, se les asi'nar el tiempo total
que han sido observados. El aspecto de la base de datos en +!++ sera.
Entre las variadas t&cnicas multivariables disponibles, se tratarn con cierto detalle,
aunque slo de manera 'eneral e introductoria, estas tres t&cnicas de re'resin. la re'resin
mltiple, la re'resin lo'stica y la re'resin de ries'os proporcionales o re'resin de 4o.
5l final del captulo se tratar tambi&n muy brevemente de otras t&cnicas de anlisis
multivariable comparndolas con las anteriores.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
##"
#ariable dependien!
te3 cambio
colesterol
9rupo 2 : dieta A
9rupo . : dieta ;
9rupo 0 : control
#ariable dependiente3 HTA
< tiempo que tarda en
ocurrir
Sexo 2 :
varn
Sexo . :
mu=er
>uintiles
consumo
productos
l"cteos
#ariable
dependien!te3 TCA
12. 2. R$1r$'in "in$" %;"ti&"$
El modelo de re'resin mltiple no es ms que una 'eneralizacin a varias variables
de un modelo de re'resin simple. La ecuacin de la re'resin lineal siple es.
y a bx = +
Eonde FyF es la variable dependiente y FF es la variable independiente. !ero esta
ecuacin se puede 'eneralizar para el caso en que haya ms de una variable independiente.
+upon'amos que haya $ variables independientes. "", "#, "$. !odemos construir la ecuacin.
$

$
b
#

#
b
"

"
b a y + + + =
4ada variable independiente i tiene un coeficiente de re'resin o pendiente propia bi.
Este coeficiente se interpretar como el cambio en la variable dependiente #$%&', por unidad de
cambio en cada variable independiente )"", "# "$* a igualdad de ni(el de las otras (aria)les
independientes. Es imposible interpretar una re'resin si no se conocen las unidades de
medida de cada variable. Esto se aplica tanto a la re'resin simple como a la mltiple.
+upon'amos que la 3ensin 5rterial +istlica )35+, mm9'* de una muestra de adultos
con alto ries'o cardiovascular se utiliza como variable dependiente FyG intentando predecirla a
partir de tres variables independientes, ", # y $ que corresponden respectivamente a la edad
en a(os )EE5E. "*, el ndice de masa corporal en D'>m
#
)784. #* y el seo )+EAH. #
,
codificado como seo06 para hombres y seo0" para mu%eres*. /esulta la si'uiente ecuacin.
$ # "
C,- 6,B : 6 <; y + + = ,
I sustituyendo i por sus nombres, tendremos.
+EAH* C,- )? 784* )6,B EE5E* )6,: <; 35+ + + + =
La interpretacin ser que por cada a(o ms de edad, la 35+ aumentar en 6,: mm9'
por t&rmino medio, independientemente de cul sea el seo y el 784. !or cada D'>m
#
ms de
784 subir la 35+ en 6,B mm9' por t&rmino medio )en ambos seos y sea cual sea la edad*.
La diferencia entre hombres y mu%eres ser de C,- mm9' enos en las mu%eres, a i'ualdad
de edad y de 784. Juizs esto ltimo es ms difcil de entender, se aclarar si construimos
dos ecuaciones, una para hombres y otra para mu%eres, sustituyendo la variable ,+EAH, por
sus respectivos valores. La variable seo se codific as.
9ombres. +EAH0 6
8u%eres. +EAH0 "
En los hombres, la ecuacin ser.
784* )6,B EE5E* )6,: <; 35+ + + =
En las mu%eres, la ecuacin ser.
C,- ? 784* )6,B EE5E* )6,: <; 35+ + + =
!or lo tanto, las mu%eres, a i'ualdad de edad e 784, tendrn una 35+ C,- mm9'
inferior. Es posible introducir variables cate'ricas )seo en el e%emplo* en el modelo.
En la fi'ura "#." se ha asumido un 784 constante )7840#; D'>m#* para poder
representar la 35+ slo en funcin de la edad y el seo. +e puede observar que, se'n el
modelo de re'resin mltiple, las dos ecuaciones )una para hombres y otra para mu%eres* son
paralelas, ya que como se ha visto anteriormente nicamente difieren en una constante.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
###
<i1ur 12.1. L $cucin =>?!1@1?!2@2 d "u1r do' r$ct' &r"$"'+
'i @2 $' un *ri!"$ dicot%ic. En $" $#$%&"o A=B $' " TAS+ @1 $' " $dd = @2 $" '$@o.
"$6
"$;
"C6
"C;
";6
";;
"B6
;; ;: ;- B" B$ B; B: B- :" :$ :; :: :-
Edd
T
A
S

&
r
$
d

C
%
%
D
1
E
C'$ . &r$'cindido d$" IMC+ con'id$r)ndo"o Fi#o $n 29 G1H%
2
E
"#.#.". Estimaciones a%ustadas por factores de confusin en re'resin mltiple
=n eamen atento de la fi'ura "#." conduce a concluir que, sea cual sea la edad, la
diferencia entre la 35+ de hombres y mu%eres es constante y vale C,- mm9'. +e dice que esta
esta diferencia )C,- mm9'* est a*ustada por edad. ,5%ustar por, si'nifica equiparar a los
'rupos que se comparan en cuanto a la variable por la que se a%usta, en este caso es crear
una comparacin entre hombres y mu%eres, i'ualndolos en cuanto a su edad. !ara el a%uste
se ha usado un m&todo multivariable, que es la re'resin mltiple.
En cambio si comparsemos la 35+ entre hombres y mu%eres usando un m&todo
bivariante )t de +tudent* encontrariamos que la diferencia es slo de #,C mm9'. El m&todo
bivariante no tiene en cuenta la edad, pues slo considera las dos variables comparadas )seo
y 35+*
K4mo es posible que siendo la 35+ media de los hombres #,C mm9' mayor que la
de las mu%eres, sin embar'o en la fi'ura "#." la diferencia a cualquier edad entre la 35+ media
de hombres y mu%eres sea casi el doble )C,- mm9'*. Esto se puede eplicar con los datos
aportados por la tabla "#.#.
T!" 12.2. Co%&rcin $ntr$ .o%!r$' = %u#$r$' d$ t$n'in rt$ri" CTASE+ $dd $ IMC.
9ombres )n0$#B* 8u%eres )n0C"$*
3ensin arterial sistlica
media )EE* ";",< )"<,#* "C-,C )#6,#*
Eiferencia de medias en 35+ ";",< ? "C-,C 0 #,C mm9'
t de +tudent )compara medias 35+*
",:
",C$
"C-,C ";",<
t
:$:
=

=
p06,6- )# colas*
Edad media B:,B B-,-
784 medio #<,< $6,#
Hbservando la tabla "#.# puede apreciarse que los hombres de la muestra son ms
%venes que las mu%eres )diferencia de edad 0 #,# a(os* y por eso su 35+ es slo #,C mm9'
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
##$
superior cuando se comparan de manera bruta con las mu%eres, ya que la 35+ aumenta a
medida que aumenta la edad. +i, en la muestra, los hombres son ms %venes que las
mu%eres, comparar sus medias en la muestra )t de +tudent* infraestimar la verdadera
diferencia eistente entre hombres y mu%eres. !or eso no basta la comparacin bruta, sino que
es necesario i'ualar por edad a hombres y mu%eres usando un m&todo multivariable para
poder realizar una verdadera comparacin vlida. Esto libera del efecto distorsionador de la
edad. +lo mediante el m&todo multivariable que a%usta por edad se puede realizar una
'eneralizacin cientficamente ri'urosa de las diferencias en 35+ entre hombres y mu%eres. La
verdad es que los hombres tienen la 35+ C,- mm9' por encima de las mu%eres, sea cual sea
su edad. +i esto es verdad a todas las edades, debe ser verdad tambi&n para el con%unto.
En este e%emplo, al comparar la 35+ se'n seo, se dice que la variable edad acta
como +actor de con+usin #3r$$n"nd y Mor1$'t$n+ 2,,1I d$ Ir"+ 2,,1*. =n factor de
confusin es una variable que se asocia tanto con la variable independiente )supuesta ,causa,*
como con el supuesto ,efecto, y que hace que la comparacin bruta o ,cruda, )t de +tudent*
sea invlida. 4uando hay factores de confusin se debe usar el anlisis multivariable. La fi'ura
"#.# representa 'rficamente el papel de la edad como factor de confusin.
<i1ur 12.2. L $dd ct; co%o Fctor d$ conFu'in
" *"orr " r$"cin $ntr$ $dd = t$n'in rt$ri" 'i't"ic CTASE
=sando terminolo'a de 'rficos causales )3r$$n"nd+ 1JJJI KoFF$ = Mind$""+ 2,,4E
se dira que la edad abre una puerta trasera que comunica seo y 35+ )D$rn)n+ 2,,2I d$
Ir"+ 2,,2*. +e cierra dicha puerta trasera al ,a%ustar, por edad. La comparacin bruta
)diferencia 0 #,C mm9' entre hombres y mu%eres* no es vlida. La comparacin a%ustada
)diferencia 0 C,- mm9'* est libre de confusin por edad. La fi'ura "#.$ presenta esto mismo
$
se'n +!++.
T!" 12.6. Mod$"o' d$ r$1r$'in %;"ti&"$ con " t$n'in rt$ri" CTASE+ $dd+ '$@o $
IMC.
8odelo L Error tp. Leta t +i'.
" )4onstante* ";",<#: ",6:6 "C",-;# 6,666
+eo
"
?#,C6: ",C$" ?6,6B# ?",B<$ 6,6-$
# )4onstante* <;,666 -,#"# -,##: 6,666
+eo
"
?C,-6- ",C#: ?6,"#B ?$,C$- 6,66"
Edad 6,:C" 6,"6- 6,#CB B,<6" 6,666
784 6,;<# 6,"B< 6,"#; $,C;; 6,66"
,
Se"o-. para ho)res % Se"o-, para u*eres.
/MC - ndice de asa corporal #0g1
2
'
Varia)le dependiente3 tensin arterial sistlica #4AS, 5g'.
/nterpretacin3
Se han a*ustado dos odelos, a)os con 4AS coo (aria)le dependiente. 6l priero
slo inclu%e una (aria)le independiente, 7ue es el se"o. 6ste prier odelo representa la
$
5ntes se redondearon los coeficientes bucando la simplicidad. 5qu se presentan con todos sus decimales.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
##C
+eo
Edad
)factor de confusin*
35+
coparacin cruda o )ruta #)i(ariante'. Su coe+iciente de regresin o pendiente #) - -2,8.9'
corresponde e"actaente a la di+erencia de edias 7ue se hu)iese o)tenido usando la t de
Student. 6n este sentido, puede a+irarse 7ue la t de Student es un caso particular de
regresin.
6l segundo odelo usa : (aria)les independientes. Ades del se"o, inclu%e la edad %
el ndice de asa corporal #/MC'. 6ste odelo ha controlado la posi)le con+usin por edad %
por /MC en la coparacin de la tensin arterial sistlica #4AS' entre se"os. La (erdadera
di+erencia, una (ez a*ustada por edad e /MC es de ;8,< 5g #4AS in+erior en las u*eres'.
Los (alores p de signi+icacin estadstica indican 7ue cada una de las tres (aria)les del
segundo odelo se asocia independienteente a la 4AS de anera signi+icati(a. 6l (alor p del
prier odelo #p - .,.<:' no es signi+icati(o, pero no sera (lido, %a 7ue est con+undido por
edad e /MC. 6l (erdadero (alor p para la coparacin entre se"os es el a*ustado #p-.,..,'
7ue est en el segundo odelo.
"#.#.#. 7nteraccin o modificacin del efecto en re'resin mltiple
En el e%emplo anterior se asume implicitamente que hay una diferencia en la 35+
constante )C,- mm9'* entre hombres y mu%eres, sea cual sea su edad. !ero hay veces que la
diferencia entre hombres y mu%eres no es constante para todas las edades. !or e%emplo
pudiera pasar que, a medida que sea mayor la edad, sean menores las diferencias entre
hombres y mu%eres. 5 esto se le llama ,modificacin del efecto, o ,interaccin,, pues si'nifica
que la edad modifica las diferencias entre seos )o viceversa. que el efecto de la edad sobre la
35+ es diferente en uno y otro seo*. La interaccin puede valorarse introduciendo una nueva
variable que es el producto de las dos que podran interactuar entre s.
3&rmino de interaccin 0 seo M edad
En el e%emplo, el t&rmino de producto seoMedad valdr 6 en varones, ya que la
variable seo vale 6 para ellos. !ero esta nueva variable equivale a la edad en mu%eres
)edadM" 0 edad*. +e debe a%ustar un tercer modelo )tabla "#.C, modelo $* incluyendo el
t&rmino de producto.
T!" 12.-. R$1r$'in %;"ti&"$ con TAS Cd$&$ndi$nt$E+ $dd+ '$@o $ IMC+
Ldi$ndo un tMr%ino d$ int$rccin C%od$"o 6E $ntr$ '$@o = $dd.
8odel
o L Error tp. Leta t +i'.
" )4onstante* ";",<#: ",6:6 "C",-;# 6,666
+eo ?#,C6: ",C$" ?6,6B# ?",B<$ 6,6-$
# )4onstante* <;,666 -,#"# -,##: 6,666
+eo ?C,-6- ",C#: ?6,"#B ?$,C$- 6,66"
edad 6,:C" 6,"6- 6,#CB B,<6" 6,666
784 6,;<# 6,"B< 6,"#; $,C;; 6,66"
$ )4onstante* -B,6;" "#,6B6 :,-B; 6,666
seo ?#B,6<- ";,666 ?6,B:6 ?",:$- 6,6<#
edad 6,;:B 6,";- 6,"-# $,B#; 6,666
784 6,;<C 6,"B< 6,"#; $,C:6 6,66"
seoMedad 6,$6< 6,#": 6,;;- ",C"< 6,";B
,
Se"o-. para ho)res % Se"o-, para u*eres.
/MC - ndice de asa corporal #0g1
2
'
se"o=edad - t>rino de producto #e7ui(ale a la edad en u*eres % a . en (arones'
Varia)le dependiente3 tensin arterial sistlica #4AS, 5g'.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
##;
/nterpretacin3
6l odelo : proporciona dos ecuaciones, una para ho)res % otra para u*eres.
Varones3
784* )6,;<C EE5E* )6,;:B -B,6;" 35+ + + =
Mu*eres3
EE5E* 6,$6< 784* )6,;<C EE5E* )6,;:B #B,6<- ? -B,6;" 35+ + + + = (
Suando las constantes % los coe+icientes de la edad, la ecuacin en u*eres ser3
Mu*eres #sipli+icada'3
784* )6,;<C EE5E* )6,<<C B-,-B# 35+ + + =
Sin e)argo, al (alorar una interaccin de)e copro)arse si su coe+iciente tiene un
(alor p signi+icati(o o no. Si no es signi+icati(o de)e supriirse. A7u el (alor p no es
signi+icati(o #p-.,,?@' % pre+erireos el odelo sin interaccin, %a 7ue no ha% e(idencia para
rechazar la hiptesis nula de 7ue su coe+iciente #.,:.A' sea . en la po)lacin. Bo o)stante, a
e+ectos deostrati(os, representareos gr+icaente el odelo con interaccin #+igura ,2.:'
para interpretar su signi+icado.
<i1ur 12.6. Int$rccin. L $cucin =>?!1@1?!2@2? !2C@1N@2E d "u1r do' r$ct'
Ou$ = no 'on &r"$"'. En $" $#$%&"o A=B $' " TAS+ @1 $' " $dd = @2 $" '$@o.
"$6
"$;
"C6
"C;
";6
";;
"B6
;; ;: ;- B" B$ B; B: B- :" :$ :; :: :-
Edd
T
A
S

&
r
$
d

C
%
%
D
1
E
C'$ . &r$'cindido d$" IMC+ con'id$r)ndo"o Fi#o $n 29 G1H%
2
E
Hbservando la fi'ura "#.$ se aprecia que las diferencias entre hombres y mu%eres ya
no son constantes, sino que dependen de la edad )la edad es un modificador del efecto del
seo*. 3ambi&n puede interepretarse al rev&s. la pendiente de la recta que relaciona 35+ y
edad es diferente en hombres y mu%eres, es decir el seo es un modificador del efecto de la
edad.
"#.#.$. Nariables cualitativas con ms de dos cate'oras y variables dummy
4uando se desea introducir como independiente una variable cualitativa que ten'a $ o
ms cate'oras, se debe ele'ir primero cul ser la cate'ora de referencia y crear una nueva
variable para cada una de las dems cate'oras.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
##B
!or e%emplo, E'truc. et al )2,,4* desean comparar $ dietas en cuanto a su eficacia
para reducir los niveles de colesterol. =saron $ dietas, una rica en aceite de oliva vir'en
)5HN*, otra rica en frutos secos )O+* y una dieta control ba%a en 'rasas )control*. La variable
cualitativa ,dieta , tendr, por tanto estos $ niveles o cate'oras. +e consider el 'rupo control
como cate'ora de referencia y se crearn dos nuevas variables )5HN y O+*. Esto sirve para
comparar cada una de ellas dos frente al 'rupo control. La nueva variable 5HN valdr "
cuando el participante sea asi'nado al 'rupo de aceite de oliva vir'en y 6 en caso contrario
)control o O+*. La nueva variable O+ valdr " cuando el participante sea asi'nado al 'rupo de
frutos secos y 6 en caso contrario )control o 5HN*. +e ha usado este procedimiento para
valorar las diferencias en cuanto al cambio de peso al cabo de $ meses en ese ensayo )3abla
"#.;*.
T!" 12.9. Do' *ri!"$' Pdu%%=P 'u'titu=$n un *ri!"$ con 6 ct$1or('
4HE7O74547PN Nu$*' *ri!"$' C*ri!"$' Pdu%%=PPE
Nariable ori'inal
4ate'oras. AOV <S
" 0 5ceite de oliva " 6
# 0 Orutos secos 6 "
$ 0 control 6 6
+!++ L Error tp. Leta t +i'.
)4onstante* ?6,#<6 6,"-" ?",CB" 6,"CC
5HN 6,6$" 6,#B# 6,66; 6,""- 6,-6;
O+ 6,"B" 6,#B: 6,6#: 6,B6; 6,;CB
Varia)le dependiente3 ca)io de peso #0g' a : eses #C/DEF6S.'
/nterpretacin3
6l listado de salida de SFSS sir(e para crear tres ecuaciones de ca)io de peso, una
para cada grupo. As, se puede coparar el ca)io de peso #0g' predicho por el odelo para
el grupo de dieta rica en aceite de oli(a (irgen, lo predicho para dieta rica en +rutos secos % lo
predicho para el grupo control #)a*a en grasa'.
Modelo para dieta rica en aceite de oli(a (irgen #AGV-,, DS-.'3
C/DEF6S - -.,2A H .,.:,=, H .,,@,=.
C/DEF6S - -.,2A H .,.:, - -0,249
Modelo para dieta rica en +rutos secos #AGV-., DS-,'3
C/DEF6S - -.,2A H .,.:,=. H .,,@,=,
C/DEF6S - -.,2A H .,,@, - -0,119
Modelo para dieta )a*a en grasa #grupo control' #AGV-., DS-.'3
C/DEF6S - -.,2A H .,.:,=. H .,,@,=.
C/DEF6S - -0,28
La interpretacin de los dos coe+icientes #.,.:, % .,,@,' es, por tanto, u% sencilla %
directa. 6l priero #H.,.:,' es la di+erencia en el ca)io de peso entre el grupo de aceite % el
grupo control, el segundo #H.,,@,' es la di+erencia entre el grupo de +rutos secos % el grupo
control. Binguna de estas di+erencias result estadsticaente signi+icati(a.
6sto se podra ha)er hecho ta)i>n por ABGVA, con dos contrastes a priori
#coe+icientes3 ;,, . % H, para el prier contraste % coe+icientes3 ., -, % H, para el segundo'. 6l
resultado sera e"actaente id>ntico al de la regresin, coo puede (erse de)a*o.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
##:
4ontraste Nalor del
contraste Error tpico t
+i'.
)bilateral*
" ?6,6$" 6,#B# ?6,""- 6,-6;
# ?6,"B" 6,#B: ?6,B6; 6,;CB
La venta%a de hacerlo por re'resin es que basta con introducir tambi&n otras variables
en el modelo )p. e%. seo, edad, peso inicial, etc.* para obtener estas mismas estimaciones ya
a%ustadas por esos posibles factores de confusin.
"#.#.C. +upuestos o condiciones de aplicacin del modelo de re'resin mltiple
El procedimiento utilizado para calcular una re'resin lineal simple es el a%uste por
mnimos cuadrados El ob%etivo es encontrar la ecuacin que me%or se a%uste a los puntos
observados. En una re'resin mltiple el procedimiento de estimacin es seme%ante al
utilizado en la re'resin lineal simple, se estima la superficie que me%or se a%usta a la nube de
puntos observados. El m&todo se denomina a%uste por mnimos cuadrados. Es un m&todo que
minimiza las distancias desde cada punto observado hasta el plano )residuales*
4uando se a%usta un modelo de re'resin mltiple, el ordenador devuelve coeficientes
bi para cada una de las variables independientes i que pueden considerarse predictores de la
variable cuantitativa considerada como respuesta )variable dependiente*.
!or lo tanto, al i'ual que en la re'resin lineal simple, el modelo se basa unos
supuestos similares,que son los si'uientes.
Las variables estn relacionadas linealmente.
La distribucin de la variable dependiente condicionada a cada posible combinacin
de valores de las independientes es una distribucin normal multivariable.
Las variables son independientes unas de otras.
9omo'eneidad de las varianzas )homocedasticidad*. las varianzas de la variable FyG
condicionadas a los valores de FG son homo'&neas.
!ara comprobar estos supuestos se deben 'uardar los residuales y valorar si se
adaptan a la normalidad, i'ual que se hace en re'resin simple. +i el tama(o muestral es
'rande, habitualmente resultarn si'nificativos los tests de normalidad de los residuales, pero
esto tiene poca relevancia prctica. En esta situacin un test de normalidad si'nificativo es
slo una consecuencia del tama(o muestral )Lu%"$=+ 2,,2*. /esulta entonces ms importante
valorar la ma'nitud del apartamiento de la normalidad usando m&todos 'rficos.
9abitualmente, con tama(os muestrales 'randes )nQ;66* la re'resin suele ser
suficientemente robusta.
4uando haya un apartamiento notorio de la normalidad en los residuales se puede
probar un t&rmino cuadrtico para al'una de las variables independientes cuantitativas ms
importantes. Esto conducira a modelos polinmicos y permitira incluir relaciones curvilneas.
Eisten amplias posibilidades de modelizacin no lineal en re'resin )3r$$n"nd+ 1JJ9*.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
##<
"#.#.;. E%emplo prctico del modelo de re'resin mltiple
!or e%emplo, con +!++ se obtuvo el listado que aparece en la tabla "#.B al predecir el ndice de
masa corporal )784* en funcin de diversas caractersticas )edad, hbito tabquico, nivel de estudios y
actividad fsica en el tiempo libre* en los varones de una muestra representativa de la poblacin adulta
)Q"; a(os* de la =nin Europea )Mrt(n$/ 3on/)"$/+ 1JJJ*.
La codificacin de las variables fue.
6dad. variable cuantitativa )a(os* 6studios.
6 0 Estudios medios o superiores
" 0 Estudios primarios
Acti(idad +sica en el tiempo libre.
variable cuantitativa medida en 8E3s?
horas>semana
4a)aco.
6 0 No fumador
" 0 Oumador actual
# 0 E?fumador )lo de% hace R " a(o*
$ 0 E?fumador )lo de% hace Q0 " a(o*
T!" 12.4. A'&$cto &rci" d$ "o' r$'u"tdo' d$ SPSS $n r$1r$'in %;"ti&"$.
4oeficientes
4oeficientes no
estandarizados
4oeficientes
estandarizados
t +i'.
L Error tp. Leta
)4onstante* "<,:B: ,#<: B;,CC< ,666
EE5E ,#BB ,6"C ",##- "-,B:# ,666
EE5E 5L 4=5E/5EH ?#,$BCE?6$ ,666 ?,--$ ?";,<:# ,666
O=85EH/ ?,CB< ,6<: ?,6BC ?;,$-6 ,666
EAO=85EH/ R " 5SH ,C:< ,#C; ,6## ",-;B ,6;"
EAO=85EH/ " 5SH1 ,;$6 ,"#: ,6;6 C,":: ,666
E+3=E7H+ !/785/7H+ ,;$C ,6-" ,6B: ;,<B: ,666
5437N. O7+745 )8E3s?h.>sem* ?<,;6"E?6$ ,66# ?,6C- ?C,C6C ,666
Nariable dependiente. L87
/nterpretacin3
La edad guarda)a en esta )ase de datos una relacin cur(ilnea con el /MC #BM/', el
/MC correspondiente a cada edad ser3 /MC - ,A,9@9 H #.,2@@edad' ; #.,..2:@8edad
2
'. Fara
entender e*or esta relacin, es pre+eri)le representar la ecuacin gr+icaente coo se hace
en la +igura ,2.8.
<i1ur 12.-. R$"cin $ntr$ $dd $ (ndic$ d$ %' cor&or" CBMIE. Mu$'tr r$&r$'$ntti*
*ron$' $uro&$o' %=or$' d$ 19 Lo' Cn>:.6:9E )Mrt(n$/ 3on/)"$/+ 1JJJ*.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
##-
IMC
##
##,;
#$
#$,;
#C
#C,;
#;
#;,;
#B
#B,;
"; #6 #; $6 $; C6 C; ;6 ;; B6 B; :6 :; <6 <;
Edd
Ades, es preciso considerar 7ue este e+ecto de la edad es independiente de los
otros +actores #ta)aco, estudios % acti(idad +sica' incluidos en el odelo.
La (aria)le categrica Ita)acoI tena 8 categoras, por lo tanto se han introducido :
t>rinos en el odelo #todas las categoras enos una'. La categora 7ue no se introduce
#a7u son los nunca +uadores' es la 7ue 7ueda coo estrato de re+erencia +rente al cual se
realizan todas las coparaciones. As, los +uadores tenan #independienteente de cul
+uese su edad, estudios % acti(idad +sica' por t>rino edio .,8@A 0g1
2
enos de /MC 7ue
los nunca +uadores. 6n ca)io los e"-+uadores tenan por t>rino edio a%or /MC 7ue
los nunca +uadores. Fara los 7ue ha)an de*ado de +uar haca enos de un aJo esta
di+erencia edia +ue de H.,89A 0g1
2
, % para los 7ue de*aron de +uar haca s de un aJo
+ue de H.,?:. 0g1
2
, en coparacin con los nunca +uadores #siepre independienteente
de cul +uese su edad, estudios % acti(idad +sica'.
Los ho)res cu%o ni(el de estudios era priario o enor #6studios-priarios'
presentaron a%or /MC edio 7ue 7uienes tenan estudios s ele(ados. La di+erencia edia
en el /MC +ue de H.,?:8 0g1
2
#independienteente de cul +uese su edad, h)ito ta)7uico %
acti(idad +sica'.
Cada M64-hora s a la seana de acti(idad +sica en el tiepo li)re se asoci a una
reduccin del /MC de .,..A? 0g12 #independienteente de cul +uese la edad, h)ito
ta)7uico % ni(el de estudios de los participantes'. Los M64s son una edicin de la cantidad
de es+uerzo 7ue se hace en una acti(idad +sica o deporte. Se suan a lo largo de la seana
ultiplicados por las horas 7ue se dedican por t>rino edio a esa acti(idad o deporte
#M64S-horas1seana'.
Las 8 (aria)les resultaron ser predictores independientes % estadsticaente
signi+icati(os de la (aria)ilidad en el /MC.
La representacin gr+ica de la +igura ,2.8 asue 7ue los su*etos tenan el (alor . en
las otras : (aria)les #ni(el de estudios, h)ito ta)7uico % acti(idad +sica'. 4ener un (alor de .
en estas : (aria)les supone no ser +uador, tener estudios superiores o edios % no realizar
ninguna acti(idad +sica en el tiepo li)re.

12.6. R$1r$'in "o1('tic
4uando se desea conocer cmo una serie de factores influyen en una variable
cualitativa o cate'rica dicotmica, es decir con dos posibilidades, como por e%emplo estar
sano o enfermo, aprobar el 87/ o no aprobarlo, etc. se va a utilizar la re'resin lo'stica
)Do'%$r = L$%$'.oQ+ 1JRJI D$ Ir"+ 1JJ4I D$ Ir"+ 1JJ:I D$ Ir"+ 1JJJ*.
=tilizaremos la re'resin lo'stica cuando ten'amos una (aria)le dependiente
dicotica. Esta situacin es muy frecuente, ya que muchas veces en la investi'acin
biom&dica o epidemiol'ica se desean identificar los predictores de la ocurrencia de un
determinado fenmeno )que ocurra un suceso o no ocurra*. 3odas las variables que son
candidatas a predecir la ocurrencia de ese fenmeno se utilizaran como variables
independientes en un modelo de re'resin lo'stica, como muestra la fi'ura "#.;.
<i1ur 12.9. A&"iccin d$ " r$1r$'in "o1('tic.
La ecuacin de la re'resin lo'stica es.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#$6
!redictor "
!redictor FpG
!redictor $
!redictor #
...
Eesenlace o
respuesta
dicotmica. +T>NH
p p # # " "
b ... b b a
p "
p
ln + + + + =

+e trata de un conteto muy parecido al de la re'resin mltiple, la diferencia es que


ahora hemos sustituido la variable dependiente )FyG* por otra epresin. 5hora la variable
dependiente no tiene un sentido num&rico en s misma, sino que es el lo'aritmo neperiano )ln*
de la probabilidad )p* de que ocurra un suceso, dividido por la probabilidad de que no ocurra
)"?p*. 5l cociente p>"?p en in'l&s se le llamaGoddsG, que se ha querido traducir por Fventa%aG.
! "
!

= odds
Es ms fcil calcular una odds que definirla. +e calcula una odds dividiendo el nmero
de quienes tienen una caracterstica por el nmero de quienes no la tienen. +i en un estudio hay
;6 pacientes reclutados en un centro de salud y #; que no proceden de salud )son de un
hospital*, la odds de proceder del centro de salud es #. Esto si'nifica que hay el doble de
pacientes que vienen del centro de salud que del hospital.
#
#;
;6
+alud de 4entro del son no que pacientes nU
+alud de 4entro del pacientes nU
+alud de 4entro
= = = odds
!or tanto, para calcular una odds basta con dividir el nmero de individuos con la
caracterstica de inter&s por el nmero de individuos que carecen de ella
"#.$." 4onceptos de odds y odds ratio
El e%emplo de la fi'ura "#.B ayudar a entender los conceptos de odds y odds ratio
)Mrt(n$/ 3on/)"$/+ 1JJJ!*. +upon'amos que en una muestra de "66 pacientes que han
recibido un frmaco se ha alcanzado &ito en :; de ellos. +i se divide la probabilidad de
curacin )p0 :;>"66 0 6,:;* por la probabilidad de no curacin )#;>"6606,#;*, se obtendr la
odds de curacin para ese tratamiento, que valdra $, que es el resultado de dividir :;V entre
#;V )odds 0 6,:;>6,#; 0 $*, o bien simplemente dividir :; entre #; K4mo se interpreta una
odds de $ en el e%emploW +e entendera que por cada paciente en que no se alcanz el &ito
terap&utico hay $ en que s se lo'r, es decir, con ese tratamiento la probabilidad de &ito es $
veces mayor que la de fracaso. 3ienen una venta%a de $ para curarse. Esta venta%a es la odds,
como se muestra en la fi'ura "#.B.
<i1ur 12.4. Conc$&to d$ *$nt# CoddsES :9 curcion$' $n
1,, &ci$nt$' trtdo' con un F)r%co.
5unque este concepto de FoddsG pueda parecer al principio etra(o, se mane%a con 'ran
frecuencia en el mundo an'losa%n, por e%emplo en el len'ua%e de las apuestas. +upon'amos
que un caballo ha 'anado en la ltima temporada un <6V de las carreras y ha perdido )no ha
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#$"
"66 tratados
)frmaco* #; no curados.
"?p06,#;

:; curados. p06,:;
'anado* un #6V. La odds de ese caballo sera de C. 4uando se oye en una pelcula que las
apuestas van C a ", se interpretara que este caballo tiene un <6V de probabilidades de 'anar
!ara transformar una odds en una proporcin el proceso es a la inversa .
odds 1 "
odds
0 !roporcion
+i la odds de curarse con un tratamiento )fi'ura "#.B* es de $, la proporcin sera.
):;V* 6,:;
C
$
$ "
$
0 !roporcin = =
+
3anto las proporciones como las odds epresan lo mismo pero usando dos escalas
num&ricas distintas. las proporciones oscilan entre 6 y " y las odds entre 6 e infinito. 5 veces
interesa pasar de una escala a otra, utilizndose para ello las epresiones que hemos visto.
odds0p>)"?p* y p 0 odds>)"1odds*.
Ia sabemos lo que es una $odds&, pero ahora hay estudiar qu& es una odds ratio
)Mrt(n2Mor$no+ 1JJ,I Buti't+ 1JJ9I Lc.$n!ruc.+ 1JJ:I T.n1 = 8u+ 1JJRI A"t%n+
1JJRI McNutt+ 1JJJI Mrt(n$/23on/)"$/+ 1JJJ!I B"nd = A"t%n+ 2,,,*. La traduccin ms
l'ica es razn de odds o razn de (enta*as. !ero el t&rmino odds ratio, que es cada vez ms
utilizado en la literatura m&dica, ha recibido diversas traducciones al castellano. razn de
oportunidades, razn de posibilidades, oportunidad relativa, razn de probabilidades o razn
de productos cruzados, e incluso al'o tan etra(o como ,razn de momios,. =na buena opcin
que sirve para evitar confusiones y se ha hecho mayoritaria )Mrt(n$/23on/)"$/+ 1JJJ!* es
incorporar directamente el t&rmino in'l&s y decir siempre odds ratio )abreviadamente, H/*, lo
mismo que con otros t&rminos ori'inalmente in'leses, pero que ya son de uso habitual en
castellano )el Fstop& de las carreteras o el Fpenalt%G en el ftbol*.
KJu& es una odds ratioW =n cociente entre dos odds. La divisin de una odds por
otra odds es una razn de odds u Fodd' rtioG.
En el e%emplo anterior )fi'ura "#.B*, de "66 pacientes tratados m&dicamente con un
frmaco, se curaron :; )odds 0 :;>#; 0 $*. +upon'amos ahora que otros -6 pacientes se
trataron quirr'icamente y se alcanz el &ito terap&utico en <" de ellos. La odds esta vez
sera de - )odds 0 <">- 0 -* como muestra la fi'ura "#.:.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#$#
<i1ur 12.:. Odd' d$ curcin 'i '$ &roduc$n R1 M@ito'
$ntr$ J, &ci$nt$' trtdo' Ouir;r1ic%$nt$.
La odds ratio )H/* se obtiene al dividir la odds de un tratamiento por la odds de otro.
$
$
-
Hdds
Hdds
0 H/
OX/854H
. J=7/Y/Z74H 3.
= =
+e obtiene una H/ 0 $ para el &ito terap&utico del tratamiento quirr'ico respecto al
tratamiento con el frmaco como muestra la fi'ura "#.<. =na H/, por tanto, es el cociente o
razn entre dos odds y carece de unidades de medida.
<i1ur 12.R. Un odd' rtio '$ o!ti$n$ " di*idir un odd' &or otr odd'.
/nterpretacin3
6l trataiento 7uir!rgico o+rece una (enta*a terap>utica : (eces superior al
trataiento con el +raco.
!ara poder interpretar una H/ es necesario siempre tener en cuenta cul es el factor o
variable predictora que se estudia y cul es el resultado o desenlace. 5qu el factor es el
tratamiento y la respuesta o desenlace es el &ito terap&utico. La H/ no tiene interpretacin
absoluta, siempre es relati(a. =na H/ de $ se interpreta como una venta%a $ veces superior de
una de las cate'oras )la cate'ora quirr'ica en el factor tratamiento* relativamente a la otra
cate'ora )frmaco* para alcanzar el desenlace o resultado )&ito terap&utico*.
El valor nulo para la H/ es el ". =na H/ 0 " implica que las dos cate'oras comparadas
son i'uales. El valor mnimo posible es 6 y el mimo tericamente posible es infinito.
=na H/ inferior a la unidad se interpreta como que el desenlace es menos frecuente en
la cate'ora o 'rupo que se ha ele'ido como de inter&s con respecto al otro 'rupo o cate'ora de
referencia. La odds del 'rupo de inter&s se debe colocar siempre en el numerador y la de
referencia en el denominador.
El e%emplo de la fi'ura "#.< tambi&n podra representarse en forma de tabla, del modo
que muestra la tabla "#.:.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#$$
-6 tratados
quirr'icamente
<" curados
p0<">-606,-
- no curados
"?p0->-606,"
-
-
<"
->-6
<">-6
p "
p
odds = = =

=

-6 tratados
quirr'icamente
<" curados
- no curados
"66 tratados
con frmaco
:; curados
#; no curados



T!" 12.:. E" c)"cu"o d$ un odd' rtio '$ o!ti$n$ $n un t!"
&or " r/n d$ &roducto' cru/do'.
+e curan No se curan 3H35L
Trt%i$nto Ouir;r1ico <" - -6
Trt%i$nto con F)r%co :; #; "66
3H35L ";B $C "-6
La odds ratio se calcula por la razn de productos cruzados.
$
):;*)-*
)<"*)#;*
H/ = =
Zeneralizando, podra escribirse una tabla como la que se muestra a continuacin
)tabla "#.<*.
T!" 12.R. Di'&o'icin d$ un t!" &r $" c)"cu"o d$ un odd' rtio.
RESPUESTA
<ACTOR +T NH
4ate'ora 5 a b
4ate'ora L c d
En esta disposicin de la tabla, la odds ratio se calcula por el producto cruzado
bc
ad
H/ =
Ee todos modos, al mane%ar una H/ se presenta una aparente incon'ruencia con
nuestro modo habitual de pensar. K9asta qu& punto es verdad que el tratamiento quirr'ico es
$ veces me%or que el farmacol'icoW Nuestro modo habitual de razonar es que si el
tratamiento quirr'ico ha curado al -6V y el farmacol'ico slo al :;V, diremos que eiste
una razn de probabilidades de curarse de ",#.
",#
6,:;
6,-
:;V
-6V
= =
En epidemiolo'a este cociente, que sur'e de dividir proporciones )p5>pL* se conoce
como Fries'o relativoG o Frazn de ries'osG )//*.
KK
p
p
A
B
=
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#$C
Numerador 0 <" #;
Eenominador 0 :;
-
!ero la odds ratio )H/* slo se aproima al ries'o relativo )//* cuando el suceso es
raro y ocurre en menos del "6V de los su%etos )pR 6,"*, por lo que su interpretacin debe
matizarse en funcin de lo frecuente que sea el suceso que se usa como respuesta o variable
dependiente )T.n1 = 8u+ 1JJRI A"t%n+ 1JJRI McNutt+ 1JJJI Mrt(n$/23on/)"$/+ 1JJJ!I
B"nd = A"t%n+ 2,,,*.
Namos a ver otro e%emplo, que se resume en la tabla "#.-. En este otro e%emplo el
acontecimiento de desenlace o respuesta )variable dependiente* es el cncer de pncreas. +e
compara su ocurrencia en un 'rupo de "6.666 fumadores y en otro 'rupo de #6.666 no
fumadores. 5fortunadamente, el cncer de pncreas es un fenmeno raro, incluso entre los
fumadores. 9ubo "6 individuos entre los "6.666 fumadores que desarrollaron cncer de
pncreas, y slo "6 de los #6.666 no fumadores lo desarrollaron.
T!" 12.J. L odd' rtio '$ &ro@i% !i$n " ri$'1o r$"ti*o
'"o cundo $" F$n%$no o $*$nto C*ri!"$ d$&$ndi$nt$E $' rro.
4ncer de pncreas No cncer de pncreas 3H35L
Oumadores "6 -.--6 "6.666
No fumadores "6 "-.--6 #6.666
3H35L #6 #-.-<6 $6.666
En esta tabla la odds ratio )H/* valdra.
#,66"
* )-.--6*)"6
6* )"6*)"-.--
H/ = =
I el ries'o relativo )//* sera.
#,666
"6>#6.666
"6>"6.666
// = =
!uede comprobarse que apenas eisten diferencias y ambos estimadores son
intercambiables. Esto se debe a que el fenmeno estudiado es raro.
+e ha hecho esta lar'a introduccin sobre la odds ratio porque es el estimador que ms
fcilmente puede obtenerse e interpretarse en un anlisis de re'resin lo'stica )Mrt(n$/
3on/)"$/+ 1JJJ!*.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#$;
"#.$.#. La odds ratio en la re'resin lo'stica
Nolviendo a la re'resin lo'stica, podra escribirse tambi&n su ecuacin.
( )
p p # # " "
b ... b b a odds ln + + + + =
5 toda la epresin de la variable dependiente ln )p>"?p* se le llama lo'it )p*. !or
consi'uiente.
lo'it )p* 0 ln )odds* 0

p "
p
ln
La transformacin lo'artmica es necesaria para adaptarse a un fenmeno como la
probabilidad cuyos lmites tericos son tan estrechos como 6 y ". En cambio, los lmites
tericos de ln )odds* van desde ? hasta +.
4omo sucede con la re'resin lineal, tambi&n cuando se a%usta un modelo de
re'resin lo'stica, el ordenador tambi&n devuelve coeficientes bi para cada una de las
variables independientes i que pueden considerarse predictores del suceso considerado como
respuesta o variable dependiente )y 0 lo'it)p**.
En la tabla "#."6 se reco'e el nmero de hombres y mu%eres que afirmaron que a
veces conducan despu&s de haber bebido alcohol.
T!" 12.1,. T!" d$ contin1$nci C2@2E d$" .)!ito d$
!$!$r nt$' d$ conducir $n Funcin d$" '$@o
B$!$n nt$' d$ conducir
NH + 3otal
seo hombre CC": ##C; BBB#
mu%er :#$" #;66 -:$"
3otal ""BC< C:C; "B$-$
+i !beb es la probabilidad de beber antes de conducir, se puede a%ustar el si'uiente
modelo de re'resin lo'stica.
"n CP!$!H12 P!$!U'$@oE > ? ! '$@o
+i la variable seo vale " en hombres y 6 en mu%eres, los modelos sern.
9ombres. ln )!beb[hombre>"? !beb[hombre* 0 a 1 bM" 0 a 1 b
8u%eres. ln )!beb[mu%er>"? !beb[mu%er* 0 a1 bM6 0 a
+i ahora restamos ambas ecuaciones, tendremos
ln )!beb[hombre>"? !beb[hombre* ? ln )!beb[mu%er>"? !beb[mu%er* 0 a 1 b \ a 0 b
b
odds
odds
ln
! ? "
!
!
!
ln
mu%er [ beb
hombre [ beb
mu%er [ beb
mu%er [ beb
hombre [ beb
hombre [ beb
=

1
!ero lo que hay dentro del par&ntesis es precisamente la odds ratio. !or lo tanto
ln )H/* 0 b
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#$B
",C:
#;66 CC":
:#$" ##C;
H/ =

=
La interpretacin ms sencilla de la re'resin lo'stica es que cada coeficiente de
re'resin )i epresa el lo'aritmo neperiano de la odds ratio )GK' de que ocurra un fenmeno
por unidad de cambio de la variable independiente. En el e%emplo una ,unidad, de cambio es
compara hombres frente a mu%eres.
mujer
bre
odds
odds
OR
hom
=
( )
i
b
OR = ln
3omando antilo'aritmos, tendramos.
( ) OR anti
b
i
e
i b
= = log
En el e%emplo de la tabla "#."6, la salida correspondiente de +!++ sera.
L E.3. ]ald 'l +i'. Ep)L*
seo 6,$<; 6,6$; "##,B-< " 6,666 ",C:6
4onstante ?",6B# 6,6#$ #6-;,;B$ " 6,666 6,$CB
/nterpretacin3
6l coe+iciente )i para el se"o (ale .,:A? % su error estndar es .,.:?. 6l test de Lald es
el +ruto de di(idir el coe+iciente por su error estndar % ele(ar despu>s al cuadrado lo resultante.
6ste estadstico sigue una *i cuadrado3

2
- #.,:A?1.,.:?'
2
- ,2, #no coincide con ,22, @<A por errores de redondeo'
con 0-, grados de li)ertad siendo 0 el n!ero de categoras de la (aria)le se"o tiene dos
categoras esta *i cuadrado tendr un grado de li)ertad #p M .,..,'.
6le(ando el n!ero e al coe+iciente )i se o)tiene la odds ratio #GK'.
GK - e
)i
- 6"p#B' - e
.,:A?
- ,,89
Coo puede copro)arse, GK - 6"p #.,:A?' - ,,89 coincide con la odds ratio 7ue se
ha)a calculado en la ta)la ,2.,., se interpreta coo 7ue la odds de conducir despu>s de
)e)er es ,,89 (eces superior en los ho)res 7ue en las u*eres.
El estimador habitual de asociacin entre variables que se obtiene directamente de la
re'resin lo'stica es la odds ratio )H/*. Esto hace a la re'resin lo'stica un procedimiento
muy til para construir modelos matemticos de factores predictivos, ya que sus resultados
son interpretables como odds ratios. La re'resin lo'stica es muy utilizada, cada vez ms,
tanto en epidemiolo'a de factores de ries'o como en epidemiolo'a clnica.
"#.$.$. E%emplo de interpretacin de una re'resin lo'stica multivariante
+i'uiendo con el e%emplo anterior, se ha a%ustado un modelo de re'resin lo'stica
para predecir la probabilidad )p* de tener el hbito de conducir despu&s de haber bebido
alcohol. +e consideran como variables independientes el seo )60mu%er^ "0 varn*, la edad
)en : 'rupos, comenzando por los menores de #; a(os, hasta los que tienen ;6 o ms a(os*,
los Dilmetros conducidos al a(o )en ; cate'oras, la inferior para los de R".666 y la superior
para Q;6.666 Dm>a(o* y el estado civil )C cate'oras. soltero, casado, viudo y otros*. En el
listado )tabla "#.""*, para cada variable aparece una cate'ora menos que las ori'inales. La
cate'ora que no aparece es la de referencia, frente a la cual se comparan el resto.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#$:
T!" 12.11. An)"i'i' d$ r$1r$'in "o1('tic d$ Fctor$' 'ocido' con
$" .)!ito d$ !$!$r nt$' d$ conducir Cn>14.6J6E.
-
L E.3. ]ald 'l +i'. Ep)L*
seo 6,#BC 6,6$< C:,B#< ",666 6,666 ",$6$
edad_'r #6#,:-: B,666 6,666
#;?#-,- 6,:C# 6,6:: -$,":; ",666 6,666 #,6--
$6?$C,- 6,-#; 6,6<" "#<,<6C ",666 6,666 #,;#"
$;?$-,- ",6#; 6,6<B "C#,6BC ",666 6,666 #,:<B
C6?CC,- 6,-;C 6,6-6 ""#,<"C ",666 6,666 #,;-B
C;?C-,- 6,:B" 6,6-$ B:,6#; ",666 6,666 #,"C6
Q0;6 6,;<< 6,6<< CC,-BB ",666 6,666 ",<66
Dm_year "#6,BC: C,666 6,666
"666?"6.666 6,;6# 6,6:C C;,<#; ",666 6,666 ",B;#
"6.66"?#6.666 6,:$B 6,6:; -:,#CC ",666 6,666 #,6<<
#6.66"?;6.666 6,:;$ 6,6:: -;,:": ",666 6,666 #,"##
Q;6.666 6,:66 6,""B $B,C$" ",666 6,666 #,6"C
estcivil #,6-# $,666 6,;;$
casado ?6,6"# 6,6CB 6,6B; ",666 6,:-< 6,-<<
viudo ?6,"<6 6,"-; 6,<;B ",666 6,$;; 6,<$;
separado>otr 6,6-B 6,"6$ 6,<:$ ",666 6,$;6 ","6"
4onstante ?#,$CB 6,6-6 B:$,;$- ",666 6,666 6,6-B
/nterpretacin3
La odds de conducir tras )e)er es ,,:.: (eces a%or en ho)res 7ue en u*eres, una
(ez a*ustadas las di+erencias por los otros : +actores 7ue aparecen en la ta)la, es decir, a
igualdad de edad, 0 conducidos % estado ci(il. La odds ratio sera ,,:. para los (arones % se
podra escri)ir 7ue es ,,.. #re+erencia' para las u*eres.
La "ia +recuencia de conducir tras )e)er se da en 7uienes tienen de :? a 8. aJos
#GK - 2,9A@' % la nia en 7uienes tienen enos de 2? aJos #GK - ,,.., categora de
re+erencia'. 4odo esto a igualdad de se"o, 0 conducidos % estado ci(il.
Los 7ue conducen de 2..... a ?..... 01aJo son 7uienes con s +recuencia se
e"ponen a )e)er antes de conducir #GK - 2,,22' coparados con los 7ue conducen M,...
01aJo, 7ue son la re+erencia #GK - ,,..'.
Bo e"isten di+erencias estadsticaente signi+icati(as en el h)ito de )e)er antes de
conducir seg!n estado ci(il, %a 7ue el test de Lald no resulta signi+icati(o para ninguna categora
#p-.,9<AN p-.,:?? % p-.,:?.'.
Fuede copro)arse 7ue para las (aria)les con s de dos categoras #edadEgr,
0E%ear % estci(il' el anlisis de regresin logstica proporciona priero un (alor p glo)al
#p-.,??: para estci(il % pM.,.., para las otras dos' 7ue indica si la prediccin del suceso de
inter>s #)e)er % conducir en el e*eplo' e*ora signi+icati(aente al aJadir esta (aria)le en su
con*unto. A la luz del resultado para eci(il, puede a+irarse 7ue no es una (aria)le
independienteente asociada con el hecho de conducir tras ha)er )e)ido % pudiera supriirse
del odelo.
Ona (ez eliinada del odelo la (aria)le estado ci(il, >ste se (uel(e a*ustar % 7uedara
tal coo se recoge en la ta)la ,2.,2, a la 7ue se han aJadido los inter(alos de con+ianza % las
categoras de re+erencia para asiilarla a co se suelen presentar unos resultados de regresin
logstica en una pu)licacin cient+ica.
C
+e ha modificado li'eramente el listado de salida de +!++, pues &ste no suele indicar los valores de cada cate'ora )#;?
#-,-, etc.* sino simplemente edad_'r)"*, edad_'r)#*, etc.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#$<
T!" 12.12. <ctor$' ind$&$ndi$nt$%$nt$ 'ocido' con
$" .)!ito d$ !$!$r nt$' d$ conducir Cn>14.6J6E.
Nariable b EE H/ )74 -;V* p
S$@o. 8u%er " )ref.*
9ombre 6,#B$ 6,6$< ",$6 )",#"?",C6* R6,66"
Edd
R#; " )ref.*
#;?#-,- 6,:C6 6,6:: #,"6 )",<6?#,CC* R6,66"
$6?$C,- 6,-#" 6,6:< #,;" )#,";?#,-$* R6,66"
$;?$-,- ",6#6 6,6<6 #,:: )#,$:?$,#C* R6,66"
C6?CC,- 6,-C- 6,6<$ #,;< )#,#6?$,6C* R6,66"
C;?C-,- 6,:;B 6,6<; #,"$ )",<6?#,;"* R6,66"
Q0;6 6,;:: 6,6:< ",:< )",;$?#,6<* R6,66"
V% H Lo
?2/// " )ref.*
2///!2/./// 6,;6# 6,6:C ",B; )",C$?",-"* R6,66"
2/.//2!././// 6,:$< 6,6:C #,6- )",<"?#,C#* R6,66"
././/2!4/./// 6,:;; 6,6:: #,"$ )",<$?#,C:* R6,66"
@4/./// 6,:6C 6,""B #,6# )",B"?#,;C* R6,66"
4onstante ?#,$C: 6,6-6
/nterpretacin3
Las odds ratios prcticaente no se han odi+icado al de*ar de a*ustar por estado ci(il, lo
7ue indica 7ue esta (aria)le no induca con+usin. Ahora se han aJadido inter(alos de con+ianza
al <?P. 6l inter(alo de con+ianza al <?P para la odds ratio se calcula por apro"iacin a la
noralidad, sundole % restndole ,,<@ (eces #z' el error estndar al coe+iciente ) % usando lo
resultante coo e"ponente para el n!ero e. Se recoge de)a*o para la GK de ho)res respecto
a u*eres3
IC 95%= Exp (B 1,96 EEb) = Exp (0,263 1,96x0,038) = Exp (0,188);Exp (0,338) = 1,21;1,40
La e"presin anterior es e7ui(alente a ultiplicar la odds ratio por e
,,<@ 66
.
Exp (B 1,96 EEb) = OR*Exp( 1,96 EEb)
"#.$.C. Hbtencin de probabilidades )ries'os absolutos* en una re'resin lo'stica
4on el anterior modelo podramos pre'untarnos Kcul es la probabilidad que el modelo
predice de que un hombre de $;?$-,- a(os, que conduce "6,666?#6.666 Dm>a(o ten'a el
hbito de conducir tras beberW
El primer paso es calcular su odds, partimos del lo'aritmo neperiano de la odds.
ln )odds* 0 a 1 b"" 1 ...1 bpp
En el e%emplo, para ese su%eto slo entran $ variables en el modelo )seo, la dummy
correspondiente a edad 0 $;?$-,- a(os y la dummy correspondiente a conducir "6.666?#6.666
Dm>a(o. !or lo tanto.
ln )odds* 0 ?#,$C: 1 6,#B$ 1 ",6#6 1 6,:$< 0 ?6,$#B
+e toman antilo'aritmos y se obtiene
odds 0 ep )?6,$#B* 0 6,:##
Nos interesa la probabilidad )p* que es i'ual a odds>)"1odds*, como ya vimos.
p 0 odds>)"1odds* 0 6,:## >",:## 0 6,C"-
La probabilidad predicha es del C",-V.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#$-
En unare'resin lo'stica, al i'ual que en la re'resin lineal mltiple, es posible
introducir variables independientes )i* cate'ricas o dicotmicas en los modelos. 3ambi&n es
posible incluir como variables independientes variables cualitativas con varias cate'oras
como estado civil )soltero, casado, viudo, etc*. !ero ello, como hemos visto requerira la
creacin de tantas variables artificiales )dummies* como cate'oras, menos una, que se
reserva como estrato de referencia. Esto es lo mismo que vimos al hablar de re'resin
mltiple.
La re'resin lo'stica se emplea habitualmente en uno de los dise(os epidemiol'icos
mas utilizados. los estudios de casos y controles. +in embar'o es conveniente saber que hay
un tipo de estudios de casos y controles denominado casos y controles apareados en los que
no se debe aplicar la re'resin lo'stica convencional sino que se ha de utilizar un tipo
especial de re'resin lo'stica. la regresin logstica condicional.
12. -. R$1r$'in d$ Co@.
La re'resin de 4o, tambi&n llamada modelo de ries'os proporcionales )proportional
hazards odel* es una t&cnica muy difundida CCo@+ 1J:2I A"t%n = 3ood%n+ 1JJ-*. Est
indicado su uso cuando la variable dependiente est& relacionada con la supervivencia de un
'rupo de su%etos o, en 'eneral, con el tiempo que trascurre hasta que se produce en ellos un
suceso o evento. El evento de inter&s no tiene porqu& ser la muerte, puede ser otro tipo de
suceso, por e%emplo, el fallo de una prtesis, la incidencia de una enfermedad o la ocurrencia
de una complicacin en quien ya tiene una patolo'a de base. +e usa para valorar
simultneamente el efecto independiente de una serie de variables eplicativas o factores
pronsticos sobre esta supervivencia )es decir, sobre la tasa de mortalidad* o sobre la tasa de
ocurrencia de otro fennemo que vaya ocurriendo tras un periodo de tiempo variable en cada
su%eto )fi'ura "#.-*.
La re'resin de 4o es la etensin multivariable del anlisis de supervivencia para
evaluar de manera 'eneral variables dependientes del tipo ,tiempo hasta un suceso o evento,,
y usa modelos de re'resin, primos al modelo de re'resin lo'stica. Es una t&cnica que
permite identificar y evaluar la relacin entre un con%unto de variables eplicativas y la tasa de
ocurrencia del suceso de inter&s. El modelo de re'resin de 4o tambi&n permite predecir las
probabilidades de supervivencia )o, en 'eneral de permanencia libre del evento* para un
determinado su%eto a partir del patrn de valores que presenten sus variables pronsticas.
<i1ur 12.J. A&"iccin d$ " r$1r$'in d$ Co@.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#C6
!redictor "
!redictor FpG
!redictor $
!redictor #
...
Eesenlace.
+upervivencia a
tiempo t
Eebe tenerse en cuenta que la re'resin de 4o asume al'unos de los mismos
supuestos que el m&todo de @aplan?8eier. el suceso debe ser irreversible, debe poder ocurrir
una sola vez y la censura no debe ser informativa.
En la re'resin lineal se estimaban los coeficientes por el m&todo de mnimos
cuadrados. En cambio, en la re'resin lo'stica y en la re'resin de 4o no sirve el m&todo de
los mnimos cuadrados y hay que hacerlo por otros m&todos cuya eplicacin ecede los
ob%etivos de este teto. 4uando se emplea el modelo de re'resin de 4o se asume que la
razn de tasas instantneas es constante a lo lar'o del tiempo )los hazards son proporcionales,
de ah su nombre en in'l&s. proportional hazards odel'. 9ay m&todos para verificar si es
cierta esta suposicin y tambi&n hay t&cnicas que permiten traba%ar con modelos de ries'o no
proporcionales cuya descripcin y anlisis requeriran mucha ms etensin que lo que
permite este teto.
"#.C.". 4onceptos de hazard y hazard ratio en una re'resin de 4o
La interpretacin de una re'resin de 4o es muy parecida a la de la re'resin
lo'stica. El parmetro de asociacin que se obtiene con la re'resin lo'stica es la odds ratio,
en cambio el que se obtiene en la re'resin de 4o es una hazard ratio.
!ara entender una hazard ratio es preciso entender antes qu& es una hazard. El
t&rmino hazard )* corresponde a una tasa instantnea, que conceptualmente slo requiere
una duracin de tiempo infinitesimal )instantnea* para que ocurra el suceso.
+e entender esto al estudiar atentamente la fi'ura "#."6. En ella se representan dos
'rupos de pacientes )a y b*. En cada 'rupo hay B pacientes, se'uidos hasta un mimo de ;
a(os, pero el tiempo de se'uimiento vara de uno a otro paciente y su duracin se representa
por una lnea horizaontal. =na E si'nifica el momento en que ocurre la muerte de un paciente
y una 5 si'nifica el final del se'uimiento para un paciente que se encontraba vivo al final del
estudio. +e usa el si'no de interro'acin para aquellos pacientes que se perdieron, pero que la
ltima noticia que se tiene de ellos es que se'uan vivos.
<i1ur 12.1,. C)"cu"o d$ " h!"d do' Lo' C2E $n do' 1ru&o' C = !E d$ 4 &ci$nt$'.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#C"
1 2 3 4 5 6
?
D D
A A
D D
D D
D D
1 2 3 4 5 6
?
D D
A A
D D
A A
D D
gr'po a gr'po a
gr'po b gr'po b
5
1
2
=
6
2
2
=
3ru&o 3ru&o !
5(os Estado 5(os Estado
",; Nivo # 8uerto
# 8uerto # 8uerto
$,; 8uerto $,; 8uerto
C !erdido C !erdido
C Nivo C Nivo
; 8uerto ; 8uerto
En el 'rupo a se ha producido una muerte a los dos a(os y haba ; pacientes a ries'o
de morir en ese momento )el primero slo haba permanecido un a(o y medio en el estudio y
por eso a los dos a(os ya no estaba ,a ries'o,*. La hazard se calcula simplemente dividiendo
los sucesos ocurridos en ese instante )tiempo 0 # a(os* entre el total de su%etos a ries'o.
t
t
t
n
d
t instante el en ries'o a su%etos
t instante el en ocurridos sucesos
hazard = = =
t

Zrupo a
6,#
;
"
n
d
hazard
#
#
a(os #
= = = =
2

Zrupo b
6,$$
B
#
n
d
hazard
#
#
a(os #
= = = =
2

El hazard a los dos a(os ser 6,# en el 'rupo a y 6,$$ en el 'rupo b.


Es conocido que una odds ratio es una razn de odds. =na hazard ratio es
simplemente una razn de hazard. !ara comparar ambos 'rupos )a y b* se dividir una hazard
entre otra. +i se toma como referencia el 'rupo a, la hazard ratio para el 'rupo b )respecto al
a* ser.
",B:
6,#
6,$$
hazard
hazard
9/ ratio hazard
a
b
= = = =
El 'rupo b tiene una mortalidad que es ",B: veces mayor que la del b )un B:V
superior*. !ero esto es lo que ocurre cuando se les compara a los dos a(os.
+i se les comparase a los $,; a(os, su hazard ratio ser ". +i se les compara a los ;
a(os, tambi&n ser ". No se pueden hacer ms comparaciones, pues en esta base de datos
slo hay muertes a los # a(os a los $,; y a los ; a(os. Hbviamente, si no se observan muertes
no se pueden comparan sus ries'os de mortalidad.
Lo que hace el modelo de 4o es promediar de manera ponderada las hazard ratios de
los diversos momentos en los que se produce al'una muerte. Niene a ser como hacer muchas
re'resiones lo'sticas, una para cada momentos en se observa al'una muerte.
"#.C.#. 7nterpretacin de una re'resin de 4o
En la tabla "#."$ se reco'e la salida que producira +!++ para el e%emplo antes
presentado.
T!" 12.16. A#u't$ d$ un %od$"o d$ Co@ con
"o' dto' d$ " Fi1ur 12.1,
L E3 ]ald 'l +i'. Ep)L*
'rupo 6,#"6 6,:B; 6,6:B " 6,:<$ ",#$C
Fara la (aria)le grupo3 grupo ) - , % grupo a - ..
/nterpretacin.
La hazard ratio glo)al #proedio ponderado' es ,,2:8. 6sto signi+ica 7ue glo)alente
la tasa de ortalidad es ,,2:8 (eces superior en el grupo ) 7ue en el a #un 2:,8P superior'.
Fuede copro)arse 7ue la hazard ratio se ha o)tenido al e"ponenciar el n!ero e al
coe+iciente ) de regresin, %a 7ue 6"p #.,2,.' - ,,2:8. 6l error estndar del coe+iciente ) es
.,9@?. Se ha o)tenido el test de Lald al di(idir ) entre su error estndar % ele(ar al cuadrado la
cantidad resultante3 #.,2,.1.,9@?'
2
- .,.9@. 6ste estadstico sigue una *i cuadrado con un
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#C#
grado de li)ertad % no es estadsticaente signi+icati(o #p-.,9A:'. Fuede copro)arse 7ue el
aspecto es prcticaente id>ntico al de una regresin logstica. La di+erencia iportante es
7ue en la regresin de Co" 6"p#)' no es una odds ratio, sino una hazard ratio.
3&n'ase en cuenta que adems eisten otras diferencias con respecto a la re'resin lo'stica.
No se trata slo de saber el efecto sobre la supervivencia a un tiempo determinado
)por e%emplo, supervivencia a los ; a(os*, sino de valorar cul es el efecto sobre la
+uncin de super(i(encia )a lo lar'o de todo el periodo, sea cual sea el punto
temporal que se eli%a*. +i slo interesase estudiar el efecto sobre la supervivencia
en un punto del tiempo )por e%emplo, a los ; a(os*, entonces bastara con un
anlisis de re'resin lo'stica, porque la variable de respuesta sera dicotmica )s
sobreviven o no sobreviven*
La re'resin de 4o puede a%ustar por mltiples variables )al i'ual que la re'resin
multiple o lo'stica*. !ero en el anlisis de supervivencia no bastara una 'resin
lo'stica comparando 'rupos a un tiempo determinado. +lo la re'resin de 4o
permite afirmar que una supervivencia ms venta%osa puede ser atribuida a un
determinado tratamiento, porque, por e%emplo, comprueba que a igualdad de edad,
se"o, estadio tuoral, etc, los pacientes que fueron tratados con transplante
heptico sobrevivieron ms en cual7uier punto posi)le dentro del se'uimiento que
ha eistido en el estudio.
La re'resin de 4o asume que hay cierta constancia o coincidencia en la razn de
hazards )hazard ratio, 5K* a lo lar'o del tiempo. Es decir, si a los $ meses el hazard
de un 'rupo es el doble que el del otro, en los otros momentos del tiempo tambi&n
habr una 9/ aproimadamente i'ual a #. 5 este supuesto se le llama
proporcionalidad de los hazards y de aqu viene el otro nombre que tiene la
re'resin de 4o )proportional hazards odel*. No ser al'ico hacer un promedio
de 9/ que sean muy diferentes entre s.
"#.C.$. Ecuacin de la re'resin de 4o
La ecuacin de la re'resin de 4o es.
( )
p p # # " "
b ... b b a + + + + =
t
ln
!uede verse que, salvo el cambio de la variable dependiente, lo dems es bastante
parecido al anlisis de re'resin lo'stica. En la re'resin lo'stica la variable de respuesta o
dependiente era el lo'it, o ln)p*, mientras que en la re'resin de 4o, la respuesta depende del
tiempo y la variable dependiente es el lo'aritmo del hazard o tasa instantnea del evento. La
tasa se diferencia del ries'o en que la tasa tiene en cuenta el tiempo )fallecimientos por unidad
de tiempo* mientras que el ries'o slo es una proporcin y no tiene en cuenta ms que el
nmero de su%etos inicialmente a ries'o de fallecer. La tasa instantnea o hazard de fallecer en
el instante FtG se obtendra, se'n el modelo de 4o antes visto al tomar antilo'aritmos.
p p # # " " p p # # " "
b ... b b a
a
b ... b b a
e e e
+ + + + + + + +
= =
t

0
=
a
e
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#C$
p p # # " "
b ... b b
e
+ + +
=
0

t
Esta epresin procede de la anterior ya que hemos llamado . a la eponencial de lo
que antes llambamos ,a,. Es decir, . viene a ser al'o anlo'o a la ordenada en el ori'en ya
vista en otros modelos de re'resin y es la tasa )hazard* basal cuando todas las variables
independientes "# valen 6.
+i "06, #06,...p06
0
=
t
Ia se vio al tratar del m&todo de @aplan?8eier que la supervivencia a tiempo t )+t* no
es una cantidad num&rica nica, sino que va variando en funcin del tiempo. 3&n'ase en
cuenta que lo mismo sucede en el modelo de 4o con las tasas instantneas o hazards en las
que se basa. 3anto t como . irn variando a lo lar'o del tiempo de observacin o se'uimiento
)+olloQ-up' durante el cual se prolon'ue el estudio.
+e demuestra que, para un factor pronstico dicotmico "# que val'a " para los
epuestos a ese factor y 6 para los no epuestos, el hazard relativo o 5azard Katio #5K' para
ese factor valdr.
5K 0 antilo' )bi*0
i
b
e
Esta cantidad )5azard Katio o 5K* es un cociente entre el ries'o instantneo de fallecer en
los que estn epuestos a un factor y el ries'o instntaneo de fallecer en los que no estn
epuestos a ese factor. Este concepto se parece mucho al ries'o relativo o cociente entre dos
ries'os. !ero cuando se habla de ries'os se suele hacer referencia simplemente a
proporciones. En cambio la re'resin de 4o lo que estima no son proporciones, sino tasas.
!or eso el 9/ ms que un ries'o relativo estima una razn de densidad de incidencia o razn
de tasas. !or lo tanto, su utilidad es epresar la rapidez relativa con la cual un paciente pasa
de un estado a otro. Esto se epresa con el t&rmino in'l&s hazard que es la tasa instantnea
de ocurrencia de la enfermedad o el suceso de que se trate. La 5K )eponenciales de los
coeficientes dados por el modelo* es la razn entre dos 5azards. =na 5K sera por e%emplo el
cociente entre el ries'o instantneo )hazard' en un tipo de pacientes, por e%emplo en hombres,
y el hazard en las mu%eres, siempre que a &stas se las haya considerado como referencia.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#CC
"#.C.C. E%emplo de re'resin de 4o multivariable
El si'uiente listado de +!++ se ha obtenido al pedir una re'resin de 4o para valorar la
influencia de varios factores en el ries'o de que pacientes transplantados cardiacos
desarrollasen cncer de piel no melanoma durante un se'uimiento de "B" meses )E'&L+
2,,,*. +e ha simplificado el e%emplo, valorando slo dos factores de ries'o. !or una parte se
hace una comparacin entre personas que han tenido $ niveles de eposicin previa al sol
),car'a solar,*, pero se tiene en cuenta tambiu&n el ries'o se'n su tipo de piel ),fototipo,,
dicotomizada*. !ara la variable ,car'a solar, la referencia son los que menos epuestos han
estado al sol, para la variable ,fototipo, la referencia son quienes tienen pieles ms rubias )se
queman con el sol* y se calcula una hazard ratio para los morenos )se broncean con el sol,
pero no se queman* respecto a los rubios )tabla "#."C*.
T!" 12.1-. Mod$"o d$ Co@ &r *"orr " $@&o'icin $ntr$ " $@&o'icin " 'o"+
$" ti&o d$ &i$" = $" ri$'1o d$ c)nc$r d$ &i$" $n trn'&"ntdo' crdico' CE'&L+ 2,,,E.
L E3 ]ald 'l +i'. Ep)L*
4ar'a solar 6,66$6
8oderada #,6:"; 6,<<; ;,C:; " 6,6"-$ :,-$BB
7ntensa #,<#"$ 6,<-B -,-"- " 6,66"B "B,:--C
Oototipo ?#,6$C" 6,C-# ":,"#$ " 6,6666 6,"$"
!uede comprobarse que se usaron dos variables dummies para la ,car'a solar, pues tena
$ cate'oras )car'a solar mnima como referencia*. 3anto la car'a solar moderada como
intensa se asociaban de manera muy fuerte con el ries'o de desarrollar cncer de piel. En los
primeros )car'a solar moderada* se multiplicaba el ries'o por :,- veces. En los epuestos a
car'a solar intensa se multiplicaba por ms de "B veces )9/ 0 "B,<*.
!or otra parte, la piel morena ofreca una 'ran proteccin. Juienes tenan piel morena
presentaban un ries'o que era slo el "$,"V que el de los de piel rubia )9/ 0 6,"$"*. Esto
supone una reduccin relativa del ries'o del <B,-V.
Los resultados son, pues, muy similares a los de la re'resin lo'stica. Es importante tener
en cuenta que el ries'o relativo )9/* para el fototipo est a%ustado por la car'a solar. Esto
si'nifica que la car'a solar ya no es un factor de confusin para la relacin entre fototipo y
cncer de piel. 7'ualmente, el efecto de la car'a solar est a%ustado por fototipo. Esto implica
que los 9/ presentados epresan ries'os relativos asociados a car'a solar elevada a igualdad
de +ototipo.
5l interpreta la 9/ se debe pensar en una razn de tasas que es ms alta en quienes
tienen ms eposicin solar o en quienes tienen piel rubia. Es una medida relativa y, adems
asume, que esta razn entre los hazards se mantiene constante a lo lar'o de todo el perodo
de se'uimiento. +us intervalos de confianza al -;V se pueden obtener como en la re'resin
lo'stica y tambi&n son proporcionados por +!++ si se le piden.
74 -;V )9/* 0 EA! )b ",-B EEb* 0 9/MEA!) ",-B EEb*
El valor nulo de una 9/ es ", al i'ual que para la odds ratio. 4uando el intervalo de
confianza al -;V incluya la hiptesis nula )9/0"*, sabremos que las diferencias en la
incidencia de cncer de piel no sern si'nificativamente diferentes entre las cate'oras
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#C;
comparadas. Esto no ocurre en nin'uno de los $ 9/ estimados en el e%emplo, ya que sus 74
-;V son.
4ar'a +olar moderada. ",C6 ? CC,-:
4ar'a solar intensa. #,-6 ? -:,#:
Oototipo moreno )se broncea*. 6,6; ? 6,$C
"#.C.;. Eiferencias entre 5azard ratio y ries'o relativo
En muchos sitios se habla de la 5azard Katio como si fuera un ries'o relativo y se
interpreta con epresiones como Ftales pacientes tienen un ries'o A veces superior de morir
que tales otros a%ustando por las dems variables del modeloG. Esto es bsicamente aceptable,
pero debe matizarse, ya que el anlisis de supervivencia con re'resin de 4o no compara
ries'os propiamente dichos )proporciones* sino tasas instantneas, es decir Fla rapidez con la
cual se pasa de un estado a otro a%ustando por las dems variables del modeloG. !or lo tanto,
la F5azard KatioG epresa cuantas veces es ms rpida la ocurrencia de la muerte u otro
fenmeno en 'rupo que en otro. Niene a ser como un cociente entre dos velocidades.
=na 5azard Katio de # si'nifica que se multiplica por # la velocidad con que ocurre
una enfermedad )o el acontecimiento que sea* en los su%etos que estn epuestos al factor de
ries'o. =na 5azard Katio de " si'nifica que el efecto del factor es nulo. =n valor de 6,;
si'nifica que esa eposicin en vez de aumentar el ries'o lo reduce a la mitad. +i la
eposicin fuese cuantitativa habra que elevar
i
b
e
, pero multiplicndolo por el incremento en
unidades de la variable independiente cuya 5azard Katio queramos estimar, tal como
hacamos en el e%emplo de re'resin lo'stica con la edad.
12.9. Otro' %Mtodo' %u"ti*rint$'
"#.;.". /e'resin de !oisson )modelos lo'?lineales*
+e observaron $$ casos de una enfermedad en B66 personas?mes. +u distribucin por
edad y seo es la que muestra la tabla "#.";. En esa tabla cada fila no corresponde a una
persona sino a un 'rupo de personas definido por su edad y seo.
T!" 12.19. <or%to Ou$ 'u$"$n t$n$r "o' dto' cundo '$ &"ic un r$1r$'in d$
Poi''on. L &rt$ 'o%!r$d corr$'&ond$ "o' c)"cu"o' .$c.o' P %noP
seo casos pers_mes a'e#6_C6 a'e'tC6 DI RR .o%!r$' RR 2,2-, RR W-,
" C "66 6 6 6,6C #
" B "66 " 6 6,6B # ",;
" "# "66 6 " 6,"# # $
6 # "66 6 6 6,6#
6 $ "66 " 6 6,6$ ",;
6 B "66 6 " 6,6B $
5o)res3 Se"o-,. Mu*eres3 Se"o -.. FersEes3 personas-eses de seguiiento #,
persona seguida ,. eses constitu%e ,. personas-eses.
Casos3 n!ero de casos nue(os de una en+eredad 7ue se han producido en cada
categora.
La (aria)le Iage2.E8.Ies una (aria)le du% 7ue (ale , para 7uienes entre 2. % 8.
aJos % . en caso contrario. La (aria)le Iagegt8.Ies una (aria)le du% 7ue (ale , para
7uienes s de 8. aJos % . en caso contrario. La re+erencia sera 7uienes tienen enos de 2.
aJos.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#CB
C/- densidad de incidencia #tasa 7ue e"presa el n!ero de casos por cada persona-
es'. As, entre los ho)res de M2. aJos la C/ es de 8 casos nue(os por cada ,.. personas-
es #.,.8 eses
-,
'.
KK - riesgo relati(o #en realidad es una razn de tasas'. Se calcula un riesgo relati(o
para los ho)res coparados con las u*eres, otro para los de 2.-8. aJos coparados con
7uienes tienen enos de 2. aJos % otro para los 7ue tienen s de 8. aJos coparados
ta)i>n con 7uienes tienen enos de 2. aJos.
El modelo de !oisson se epresa as.
p p # # " "
b b b a ln)E7* + + + + = ...
Eonde ln)E7* es el lo'aritmo neperiano de la densidad de incidencia )casos>personas?
mes*, bi son los coeficientes y i son las variables independientes o predictoras. +e cumple que
/ies'o /elativo /azn de Eensidad de 7ncidencia 0 Ep )bi*.
+i se usa +tata para aplicar a la base de datos de la tabla "#."; un modelo de !oisson
)se recomienda usar +tata en vez de +!++ para esta finalidad*, se obtendr.
/nterpretacin3
Stata produce en prier lugar las estiaciones de los coe+icientes )i. Fuede
copro)arse 7ue utilizando estos coe+icientes coo e"ponentes del n!ero e se o)tienen los
riesgos relati(os #KK, pero propiaente son razones de tasas o de densidad de incidencia'3
6"p #.,@<:,892' - 2,... #KK de ho)res coparados con u*eres'
6"p #.,8.?8@?,' - ,,?.. #KK de 7uienes tienen 2. a 8. aJos coparados con los de M2.'
6"p #,,.<A@,2' - :,... #KK de 7uienes tienen R8. aJos coparados con los de M2.'
Coo en otros odelos de regresin, cada co+iciente (iene seguido de su respecti(o
error estndar #Std. 6rr.'. Ci(iendo el coe+iciente por su error estndar se o)tiene un (alor z
7ue sigue una distri)ucin noral #epieza a ser signi+icati(o al ?P a dos colas cuando
zR,,<@'. La siguiente coluna de Stata #FRSzS' corresponde al (alor p de signi+icacin
estadstica a dos colas. For !ltio se presentan los inter(alos de con+ianza al <?P para los
coe+icientes.
6l odelo de Foisson, coo todo odelo de regresin sir(e para hacer predicciones
de riesgos #tasas en este caso' a)solutos. Fara predecir la tasa #C/' de un (arn de s de 8.
aJos, se utilizara la ecuacin3
$% (&I'"(%,40)os) = -3,912 * 0,693*1 * 1,099*1 = - 2,12
&I'"(%,40)os = Exp ( - 2,12) = 0,12
Fuede o)ser(arse 7ue lo o)ser(ado coincide con lo predicho por el odelo.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#C:
"#.;.#. 5nlisis factorial )anlisis de componentes principales*
En este anlisis no hay una variable dependiente y muchas independientes que se
usen para eplicarla o predecirla. En cambio, el anlisis factorial pretende etraer de una base
de datos con muchas variables un peque(o 'rupo de factores )se les llama ,componentes
principales,* que consi'an proporcionar de manera resumida 'ran parte de la informacin
contenida en todas las variables iniciales. Es, por tanto, una t&cnica de reduccin de variables.
En principio, los factores o componentes principales que se obtienen con esta t&cnica no estn
correlacionados entre s y etraen la estructura latente o subyacente de las variables de la
base de datos. La fi'ura "#."" es un esquema del anlisis factorial.
<i1ur 12.11. E#$%&"o d$ n)"i'i' Fctori" Cco%&on$nt$' &rinci&"$'E
"#.;.#. 5nlisis de cluster
5l i'ual que el anlisis factorial es una t&cnica descriptiva que trata de sintentizar los
datos, pero en vez de resumir el nmero de variables )columna* lo que tiende es a formar
'rupos homo'&neos de su%etos )vendra ser reducir las filas*. Este anlisis facilita la
clasificacin de los su%etos en funcin de una serie de variables. 4oloca en el mismo 'rupo a
quienes tienen unos valores parecidos de esas variables. =n cluster es, por tanto, un 'rupo de
su%etos que estn primos entre s en el espacio multidimensional definido por las variables
consideradas para su clasificacin.
El proceso se inicia con la definicin de un nmero 'rande clusters, tantos como
su%etos eisten en la base de datos y poco a poco se les va a'rupando en funcin de la
proimidad entre ellos, al principio en muchos 'rupos con pocos individuos cada uno, pero que
son muy parecidos entre s, hasta lle'ar al mimo nivel que es el de un solo 'rupo que
continene a todos los su%etos. 5l m&todo 'rfico de representar esta pro'resiva a'rupacin se
le llama dendo'rama. En un e%e del dendo'rama se sitan los su%etos y en el otro las
distancias )proimidades* entre cada cluster y otro.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#C<
7N!=3
Lase de datos con
";6 columnas )variables*
"#.666 filas )su%etos*.
5l'unas de estas variables estn
correlacionadas entre s
H=3!=3
$ factores )componentes*
4ada su%eto tiene un valor para
cada factor
4ada factor es una combinacin
lineal de las variables iniciales
Los factores NH estn
correlacionados entre s
"#.;.$. 85NHN5 y 5N4HN5
El 85NHN5 o anlisis multivariante de la varianza no slo puede tener en cuenta
muchas variables independientes, sino que usa adems (arias variables dependientes, que de
al'n modo miden la misma respuesta desde distintos puntos de vista. !or e%emplo, si se
desean ver predictores de adiposidad, en vez de usar como respuesta o variable dependiente
solamente el ndice de masa corporal )784*, se puede decidir usar $ variables de respuesta.
784, ndice cintura?cadera y 'rosor de plie'ues cutneos. El 85NHN5 permite mane%ar a la
vez, en un solo anlisis varias variables dependientes. L'icamente tambi&n valorar una
serie de predictores o variables independientes )en el e%emplo. edad, actividad fsica, hbitos
alimentarios, variantes 'en&ticas, etc.*.
El 5N4HN5 es un anlisis de la varianza que permite usar como variables
independientes no slo factores )variables cualitativas* sino tambi&n variables num&ricas o
cuantitativas. Es equivalente a una re'resin lineal cuando &sta se pro'rama adecuadamente.
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#C-
/eferencias
5ltman EZ, EeeDs ``, +acDett EL )"--<*. Hdds ratios should be avoided ahen events are
common. L8` "--<^$":."$"<.
5ltman EZ, Zoodman +N )"--C*. 3ransfer of technolo'y from statistical %ournals to the
biomedical literature. !ast trends and future predictions. `585 "--C^#:#."#-?$#.
Lautista LE )"--;*. F/azn relativaG y Ftasa relativaG como traducciones de odds ratio y de
hazard ratio. Lol Hfic +anit !anam "--;^""-.#:<?<6.
Lland `8, 5ltman EZ )#666*. +tatistics notes. 3he odds ratio. L8` #666^$#6."CB<.
4o E/ )"-:#*. /e'ression model and life tables. ` /oy +tatist +oc L "-:#^$C."<:?##6.
de 7rala?Est&vez `, Oernndez?4r&huet / )"--B*. 5puntes de Epidemiolo'a Zeneral.
!amplona. NeabooD, "--B.
de 7rala?Est&vez `, Oernndez 4rehuet /, +errano del 4astillo 5 )"--:*. 5bnormally aide
confidence intervals in lo'istic re'ression. interpretation of statistical pro'ram results.
/ev !anam +alud !blica?!an 5m ` !ublic 9ealth "--:^ #.#B<?:".
de 7rala?Est&vez `, Eaz 8olina 4, Oernndez?4r&huet / )"---*. /e'resin lo'stica aplicada
en 4iencias de la +alud. !amplona. NeabooD, "---.
de 7rala `, 8artinez?Zonzalez 85, Zuillen Zrima O )#66"*. KJu& es una variable de
confusinW 8ed 4lin )Larc*. #66"^"":.$::?<;. O& errata. 8ed 4lin )Larc* #66"^"":.::;.
de 7rala `, 8artnez?Zonzlez 85, +e'u?Zmez 8 )#66C*. Epidemiolo'a aplicada. Larcelona.
5riel. #66C.
Espa(a 5, 8artnez?Zonzlez 85, Zarca?Zranero 8, +nchez?4arpintero 7, /ba'o Z,
9erreros `. 5 prospective study of incident non?melanoma sDin cancer in heart transplant
recipients. ` 7nvest Eermatol #666^"";."";<?B6.
Estruch /, 8artnez?Zonzlez 85, 4orella E, et al )#66B*. Effects of a 8editerranean?+tyle
Eiet on 4lassical and Novel /isD Oactors for 4oronary 9eart Eisease. 3he !/EE78EE
+tudy, a 8ulticenter, /andomized, 4ontrolled, Oeedin' 3rial. 5nn 7ntern 8ed #66B.
Zreenland + )"--;*. Eose?response and trend analysis in epidemiolo'y. alternatives to
cate'orical analysis. Epidemiolo'y "--;^B.$;B?B;.
Zreenland +, !earl `, /obins `8 )"---*. 4ausal dia'rams for epidemiolo'ic research.
Epidemiolo'y "---^"6.$:?C<.
Zreenland +, 8or'enstern 9 )#66"*. 4onfoundin' in health research. 5nnu /ev !ublic 9ealth.
#66"^##."<-?#"#.
9ernan 85, 9ernandez?Eiaz +, ]erler 88, 8itchell 55 )#66#*. 4ausal Dnoaled'e as a
prerequisite for confoundin' evaluation. an application to birth defects epidemiolo'y. 5m
` Epidemiol. #66#^";;.":B?<C.
9osmer E], Lemeshoa +5 )"-<-*. 5pplied lo'istic re'ression. N. IorD. ]iley, "-<-.
`offe 8, 8indell ` )#66B*. 4omple causal process dia'rams for analyzin' the health impacts
of policy interventions. 5m ` !ublic 9ealth. #66B^-B.C:$?-.
Lachenbruch !5 )"--:*. 3he odds ratio. 4ontrol 4lin 3rials "--:^"<.$<"?#.
Lumley 3, Eiehr !, Emerson +, 4hen L )#66#*. 3he importance of the normality assumption in
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#;6
lar'e public health data sets. 5nnu /ev !ublic 9ealth #66#^#$.";"?B-.
8artn?8oreno `8 )"--6*. Hportunidad relativa. refleiones en torno a la traduccin del
t&rmino ,odds ratio,. Zac +anit "--6^C.$:.
8artnez?Zonzlez 85, Ee 7rala?Est&vez `, Zuill&n?Zrima O )"---*. KJu& es una odds ratioW
8ed 4lin )Larc.* "---^""#.C"B?##.
8artnez?Zonzlez 85 )#66B*. 3he +=N cohort study )+e'uimiento =niversity of Navarra*.
!ublic 9ealth Nutrition #66B^-)"5*^"#:\"$"
8cNutt L5, 9afner `!, Aue A )"---*. 4orrectin' the odds ratio in cohort studies of common
outcomes. `585 "---^#<#.;#-.
/othman @`, Zreenland + )"--<*. !recision and validity in epidemiolo'ic studies. En /othman
@`, Zreenland + )eds*. 8odern Epidemiolo'y. #nd ed. !hiladelphia. Lippincott?/aven,
"--<^"";?$C.
+an'ro L, 9erraiz 8, 8artnez?Zonzlez 85, Lilbao 7, 9errero 7, Leloqui H, Letes 8, de la
!e(a 5, 4ienfue'os `5, Juiro'a `, !rieto ` )"--<*. !ro'nosis of hepatocellular
carcinoma in relation to treatment. a multivariate analysis of ":< patients from a sin'le
European institution. +ur'ery "--<^"#C.;:;?<$.
bhan' `, Iu @O )"--<*. ]hatcs the relative risDW 5 method of correctin' the odds ratio in cohort
studies of common outcomes. `585 "--<^#<6."B-6?".
En*ir corr$ccion$' d$ $rrt' 'nc.$/0dcc.u"&1c.$'
Mi1u$" A. Mrt(n$/23on/)"$/+ 2,,4
#;"

También podría gustarte