Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Dialnet RegresionLogisticaMultinomial 2981898 PDF
Dialnet RegresionLogisticaMultinomial 2981898 PDF
Resumen
la variable Y mediante un vector (Y1,Y2) cons- Es interesante observar que estas odds-ratio
truido de la siguiente forma: dependen de las unidades en que vengan medi-
(1,0) si Y = 1 das las variables regresoras (si multiplicamos X1
por 10, OR1 (X1) pasara a ser 10 exp( 11 ) ). Por
(Y1 , Y2 ) = (0,1) si Y = 2 tanto la importancia de cada variable regresora
(0,0) si Y = 3 en el modelo debera medirse por el valor de la
odds-ratio suponiendo estandarizada dicha varia-
Las variables Y1 e Y2 tienen una distribucin ble. Este es el motivo por el que se habla de las
de Bernouilli con E(Y1)=p1 y E(Y2)=p2, al igual odds-ratio estandarizadas en las variables
que la variable dependiente en una regresin regresoras. Por ejemplo OR1 (X*1)=exp(11Sx1)
logstica binaria clsica. Obviamente estas dos siendo Sx1 la desviacin tpica muestral de la
variables no son independientes ya que variable X1 (idem. para OR1 (X*2), OR2 (X*1) y OR2
Cov(Y1,Y2)=-p1p2. (X*2)). Cuanto ms grande sea este valor ms rele-
Formulamos el modelo multivariante defini- vante es la variable dentro del modelo.
do por las siguientes ecuaciones: Tambin interesa definir las proporciones de
exp(Z1 ) cambio en las odds con respecto a cada varia-
p1 ( X 1 , X 2 ) = p1 = E (Y1 ) = ble regresora que, por ejemplo, para O1 con res-
1 + exp(Z1 ) + exp(Z 2 )
exp( Z 2 ) pecto a X1, viene dada por:
p 2 ( X 1 , X 2 ) = p2 = E (Y2 ) =
1 + exp(Z1 ) + exp(Z 2 ) O1 ( X 1 + 1, X 2 ) O1 ( X 1 , X 2 )
= OR1 ( X 1 ) 1 = exp( 11 ) 1
O1 ( X 1 , X 2 )
donde Z1=01+11X1+21X2 y Z2=02+12X1+
22X2, siendo 01, 11, 21, 02, 12, 22, parme- y que representaremos por: OC1 (X1) (idem. para
tros que deseamos estimar. OC1 (X2), OC2 (X1) y OC2 (X2)).
(Observar que Otra formulacin alternativa, y quizs ms
conocida, se obtiene tomando logaritmos en
1 ambas ecuaciones del modelo:
p3 ( X 1 , X 2 ) = p3 = 1 p1 p2 = ).
1 + exp( Z1 ) + exp( Z 2 )
p
Con el propsito de interpretar mejor los ln 1 = Z1 = 01 + 11 X 1 + 21 X 2
parmetros que aparecen en el modelo, podra- p3
mos reescribir ste de la siguiente forma: p
ln 2 = Z 2 = 02 + 12 X 1 + 22 X 2
p1 X p3
= exp(Z1 ) = exp( 01 ) (exp(11 ) ) 1 (exp( 21 )) 2
X
p3
donde las expresiones del miembro izquierdo se
p2
= exp(Z 2 ) = exp( 02 ) (exp( 12 ) ) (exp( 22 ))
X1 X2
denominan logits (al igual que en la regresin
p3 logstica binaria) y los parmetros representan
Al cociente p1/p3 se le denomina odds de la las tasas de cambio en los logits cuando una de
categora 1 respecto de la categora 3 y se le las variables explicativas se incrementa en una
representa por O1 (X1, X2) = O1 (idem. para O2). unidad mantenindose constante la otra.
De este modo puede observarse fcilmente que
la razn de cambio en O1 cuando X1 se incre-
menta en una unidad mantenindose constante Estimacin de parmetros
O1 ( X 1 + 1, X 2 )
X2 viene dada por = exp( 11 ) , Dada una muestra de datos (Y1i, Y2i, X1i, X2i)
O1 ( X 1 , X 2 ) con i=1,2....,n podemos definir, en funcin de
que recibe el nombre de odds-ratio de la cate- los parmetros del modelo, las funciones Z1i, Z2i,
gora 1 respecto de la variable X1 y se represen- p1i, p2i y abordar el problema de la estimacin de
ta por OR1 (X1) (idem. para OR1 (X2), OR2 (X1) y los mismos mediante el mtodo de mxima
OR2 (X2). verosimilitud, como se muestra a continuacin.
324
Cuad. Soc. Esp. Cien. For. 18: XXX-XXX (2004) Actas de la Reunin de Modelizacin Forestal
325
V. PANDO FERNNDEZ et al. Regresin logstica multinomial
las transformaciones correspondientes, interva- interpretable al depender de L0. Por este motivo
los de confianza (I.C.) para las OR y las OC. Por es preferible el pseudo-R2 de Nagelkerke, que
ejemplo, para el parmetro 11, y utilizando un se define como
grado de confianza de 1, tendramos:
I. C. para 11: f 0
2
1 exp
( z 2 s.e.( 11 ) , 11 + z 2 s.e.( 11 ) ) RCS n
11 RN2 = =
I. C. para OR1(X1): 1 (L )
n
0
2
1 exp 0
(exp( 11 z 2 s.e.( 11 ) ), exp(11 + z 2 s.e.( 11 ) ))
n
I: C: para OR1(X1): *
y su rango de valores es 0 R2N 1 por lo que
( ( ) ( ))
exp S X (11 z 2 s.e.( 11 )) , exp S X (11 + z 2 s.e.( 11 )) puede interpretarse del mismo modo que el coe-
1 1
ficiente de determinacin de la regresin lineal
I. C. para OC1(X1): clsica, aunque es ms difcil que alcance valo-
res prximos a 1.
(exp( 11 z 2 s.e.( 11 ) ) 1, exp(11 + z 2 s.e.( 11 )) 1)
Para comparar modelos de regresin logsti-
siendo z/2 el valor que, en una distribucin nor- ca multinomial con diferente nmero de varia-
mal (0,1), verifica p(Z>z/2)=/2 bles regresoras suelen introducirse coeficientes
Pseudo-R2 ajustados. El ms conocido es el de
Mc-Fadden, definido como
Calidad del ajuste 0.5 f + k + 1
2
Adj RMF = 1 , siendo k el
Al igual que en la regresin logstica binaria, la 0. 5 0 + 1
calidad del ajuste en la regresin logstica multino- nmero de regresores.
mial se mide mediante coeficientes de determina-
cin conocidos como Pseudo-R2. De entre todos
ellos comentaremos los ms clsicos, que son los Calidad en la prediccin
que proporciona el paquete estadstico S.P.S.S.
El primero se basa en la funcin auxiliar Si, a partir del modelo ajustado, clasificamos
utilizada en el ajuste, se conoce como pseudo-R2 cada observacin en la categora ms probable,
f podemos construir una matriz de clasificacin
2
de Mc-Fadden y viene dado por: RMF = 1 . observados-predichos y utilizar el porcentaje de
0 clasificaciones correctas como una medida de la
Su rango terico de valores es 0 R2MF 1, pero calidad de prediccin, del mismo modo que se
muy raramente su valor se aproxima a 1. Suele hace en el anlisis discriminante.
considerarse una buena calidad del ajuste cuan-
do 0.2 R2MF 0.4 y excelente para valores supe-
riores. BIBLIOGRAFA
Otros autores prefieren coeficientes basados
directamente en la verosimilitud L, y no en la AGRESTI, A.; 1990. Categorical Data Analysis.
funcin auxiliar . El ms conocido es el pseu- John Wiley and Sons. New York.
do-R2 de Cox-Snell, definido como COX, D.R. & SNELL, E.J.; 1989. The Analysis of
2
RCS = 1
n L
0
2
( ) f 0
= 1 exp , siendo
Binary Data. Chapman and Hall. London.
HOSMER, D.W. & LEMESHOW, S; 1989. Applied
n L
f
2
( ) n Logistic Regression. Wiley Interscience.
L0=exp(0/2) y L f =exp( f /2). El rango teri- New York.
co de valores para este coeficiente es HARIG, A.L. & FAUSCH, K.D.; 2002. Minimum
habitat requirements for establishing translo-
2
0 RCS 1 (L )
n
0
2
, lo que le hace poco cated cutthroat trout populations. Ecol. Appl.
12(2): 535-551.
326
Cuad. Soc. Esp. Cien. For. 18: XXX-XXX (2004) Actas de la Reunin de Modelizacin Forestal
HERAJARVI, H.; 2002. Internal knottiness with NAGELKERKE, N.J.; 1991. A note on a general
respect to sawing patterns in Betula pendula definition of the coefficient of determina-
and B. bubescens. Baltic Forestry 8(1): 42- tion. Biometrika 78: 691-692.
50. NORTH, M.P. & REYNOLDS, J.H.; 1996.
MCFADDEN, D.; 1979. Quantitative methods for Microhabitat analysis using radiotelemetry
analysing travel behaviour of individuals: locations and polytomous logistic regres-
some recent developments. In: Behavioural sion. J. Wild. Manage. 60(3): 639-653.
travel modelling: 279-318. Croom Helm. RO, M. DEL; BRAVO, F.; PANDO, V.; SANZ, G. &
London. SIERRA, R.; 2004. Influence of individual
MENARD, S.; 2000. Coefficients of Determination tree and stand attributes in stem straightness
for Multiple Logistic Regression Analysis. in Pinus pinaster Ait. Stands. Ann. Sci. For.
The American Statistician 54: 17-24. 61(2): 141-148.
327