Está en la página 1de 5

Cuad. Soc. Esp. Cien. For.

18: 000-000 (2004) Actas de la Reunin de Modelizacin Forestal

REGRESIN LOGSTICA MULTINOMIAL

V. Pando Fernndez y R. San Martn Fernndez

Departamento de Estadstica e Investigacin Operativa. E.T.S. de Ingenieras Agrarias. Universidad de


Valladolid. Avda. de Madrid 44. 34004PALENCIA (Espaa). Correo electrnico: vpando@eio.uva.es

Resumen

En este artculo se presenta la regresin logstica multinomial como extensin multivariante de


la regresin logstica binaria clsica, ampliamente utilizada en la investigacin forestal. A partir de
la formulacin matemtica del modelo estadstico se explica la estimulacin de parmetros median-
te el mtodo de mxima verosimilitud y se establecen los test estadsticos adecuados para la signifi-
catividad global del modelo y el efecto de cada regresor. Tambin se calculan los intervalos de con-
fianza asintticos para los parmetros y se mide la calidad del ajuste mediante los coeficientes de
determinacin (pseudo-R2) ms ampliamente utilizados. La calidad en la prediccin puede medirse,
al igual que en el anlisis discriminante, mediante la tabla de clasificacin observados-predichos o
mediante validacin externa si se dispone de una muestra alternativa para ese propsito.
Palabras clave: Logstica, Multinomial, Politnica, Polinomial, Pseudo-R2

INTRODUCCIN Con esta comunicacin se pretende presen-


tar las bases tericas de esta tcnica estadstica
La regresin logstica multinomial (HOSMER & tanto en lo que se refiere a su formulacin y
LEMESHOW, 1989) es utilizada en modelos con metodologa de ajuste como al anlisis e inter-
variable dependiente de tipo nominal con ms de pretacin de los resultados obtenidos utilizando
dos categoras (politmica) y es una extensin mul- la subrutina NOMREG del paquete estadstico
tivariante de la regresin logstica binaria clsica. S.P.S.S. Para ello se considerar un caso con dos
Las variables independientes pueden ser tanto con-
regresores y una variable politmica con tres
tinuas (regresores) como categricas (factores).
categoras.
Tradicionalmente las variables dependientes
politmicas han sido modeladas mediante anli-
sis discriminante pero, gracias al creciente des-
arrollo de las tcnicas de clculo, cada vez es ms Formulacin del modelo
habitual el uso de modelos de regresin logstica
multinomial, ya implementados en paquetes esta- Consideramos una variable aleatoria depen-
dsticos como S.A.S. (PROC CATMOD) o diente Y categrica nominal politmica con
S.P.S.S. (NOMREG), debido a la mejor interpre- Soporte(Y)={1,2,3} y con probabilidades
tabilidad de los resultados que proporciona. p1=p(Y=1), p2=p(Y=2) y p3=p(Y=3)=1-p1-p2.
En el mbito forestal esta tcnica se ha uti- Supongamos que queremos analizar el efecto
lizado por diversos autores como por ejemplo que ejercen dos variables explicativas continuas
HARIG & FAUSCH (2002), HERAJARVI (2002), X1, X2 sobre las probabilidades p1 y p2 que
NORTH & REYNOLDS (1996) o RIO et al. (2004). caracterizan a la variable Y. Podemos redefinir a

ISSN: 1575-2410 323


2004 Sociedad Espaola de Ciencias Forestales
V. PANDO FERNNDEZ et al. Regresin logstica multinomial

la variable Y mediante un vector (Y1,Y2) cons- Es interesante observar que estas odds-ratio
truido de la siguiente forma: dependen de las unidades en que vengan medi-
(1,0) si Y = 1 das las variables regresoras (si multiplicamos X1
por 10, OR1 (X1) pasara a ser 10 exp( 11 ) ). Por
(Y1 , Y2 ) = (0,1) si Y = 2 tanto la importancia de cada variable regresora
(0,0) si Y = 3 en el modelo debera medirse por el valor de la

odds-ratio suponiendo estandarizada dicha varia-
Las variables Y1 e Y2 tienen una distribucin ble. Este es el motivo por el que se habla de las
de Bernouilli con E(Y1)=p1 y E(Y2)=p2, al igual odds-ratio estandarizadas en las variables
que la variable dependiente en una regresin regresoras. Por ejemplo OR1 (X*1)=exp(11Sx1)
logstica binaria clsica. Obviamente estas dos siendo Sx1 la desviacin tpica muestral de la
variables no son independientes ya que variable X1 (idem. para OR1 (X*2), OR2 (X*1) y OR2
Cov(Y1,Y2)=-p1p2. (X*2)). Cuanto ms grande sea este valor ms rele-
Formulamos el modelo multivariante defini- vante es la variable dentro del modelo.
do por las siguientes ecuaciones: Tambin interesa definir las proporciones de
exp(Z1 ) cambio en las odds con respecto a cada varia-
p1 ( X 1 , X 2 ) = p1 = E (Y1 ) = ble regresora que, por ejemplo, para O1 con res-
1 + exp(Z1 ) + exp(Z 2 )
exp( Z 2 ) pecto a X1, viene dada por:
p 2 ( X 1 , X 2 ) = p2 = E (Y2 ) =
1 + exp(Z1 ) + exp(Z 2 ) O1 ( X 1 + 1, X 2 ) O1 ( X 1 , X 2 )
= OR1 ( X 1 ) 1 = exp( 11 ) 1
O1 ( X 1 , X 2 )
donde Z1=01+11X1+21X2 y Z2=02+12X1+
22X2, siendo 01, 11, 21, 02, 12, 22, parme- y que representaremos por: OC1 (X1) (idem. para
tros que deseamos estimar. OC1 (X2), OC2 (X1) y OC2 (X2)).
(Observar que Otra formulacin alternativa, y quizs ms
conocida, se obtiene tomando logaritmos en
1 ambas ecuaciones del modelo:
p3 ( X 1 , X 2 ) = p3 = 1 p1 p2 = ).
1 + exp( Z1 ) + exp( Z 2 )
p
Con el propsito de interpretar mejor los ln 1 = Z1 = 01 + 11 X 1 + 21 X 2
parmetros que aparecen en el modelo, podra- p3

mos reescribir ste de la siguiente forma: p
ln 2 = Z 2 = 02 + 12 X 1 + 22 X 2
p1 X p3
= exp(Z1 ) = exp( 01 ) (exp(11 ) ) 1 (exp( 21 )) 2
X

p3
donde las expresiones del miembro izquierdo se
p2
= exp(Z 2 ) = exp( 02 ) (exp( 12 ) ) (exp( 22 ))
X1 X2
denominan logits (al igual que en la regresin
p3 logstica binaria) y los parmetros representan
Al cociente p1/p3 se le denomina odds de la las tasas de cambio en los logits cuando una de
categora 1 respecto de la categora 3 y se le las variables explicativas se incrementa en una
representa por O1 (X1, X2) = O1 (idem. para O2). unidad mantenindose constante la otra.
De este modo puede observarse fcilmente que
la razn de cambio en O1 cuando X1 se incre-
menta en una unidad mantenindose constante Estimacin de parmetros
O1 ( X 1 + 1, X 2 )
X2 viene dada por = exp( 11 ) , Dada una muestra de datos (Y1i, Y2i, X1i, X2i)
O1 ( X 1 , X 2 ) con i=1,2....,n podemos definir, en funcin de
que recibe el nombre de odds-ratio de la cate- los parmetros del modelo, las funciones Z1i, Z2i,
gora 1 respecto de la variable X1 y se represen- p1i, p2i y abordar el problema de la estimacin de
ta por OR1 (X1) (idem. para OR1 (X2), OR2 (X1) y los mismos mediante el mtodo de mxima
OR2 (X2). verosimilitud, como se muestra a continuacin.

324
Cuad. Soc. Esp. Cien. For. 18: XXX-XXX (2004) Actas de la Reunin de Modelizacin Forestal

Con el modelo planteado, la funcin de regresoras (11=21=12=22=0) vendr dado por


verosimilitud de la muestra viene dada por la p( 24>of ).
siguiente expresin:
Y1i Y2 i
n n
p p
( )
L = p1Yi1i p 2Yi2 i p31i Y1i Y2i = 1i 2i p3i

Significatividad del efecto de cada variable
i =1 i =1 p3i p3 i regresora

En vez de trabajar con esta expresin se uti- Si llamamos -1 al mnimo de la funcin
liza la funcin auxiliar: auxiliar que se obtendra eliminando del modelo
n la variable X1 (11=12=0) se verifica que la dife-
p p
= 2 ln( L) = 2 Y1i ln 1i + Y2i ln 2i + ln( p3i ) = rencia entre los mnimos de la funcin auxiliar en
i =1 p3 i p3i el modelo reducido y en el modelo completo
n tiene una distribucin 2 con 2 grados de liber-
= 2 (ln(1 + exp( Z1i ) + exp( Z 2i )) Y1i Z1i Y2i Z 2i ) tad (en general, nmero de regresores menos uno
i =1 multiplicado por nmero de categoras menos
El problema de maximizar la verosimilitud una). Por tanto el p-valor del test para la hipte-
equivale al de minimizar la funcin auxiliar sis nula de que no existe efecto de la variable X1
y puede resolverse por mtodos numricos de (11=12=0) vendr dado por p( 22 >-1!). De
forma iterativa partiendo de la estimacin inicial modo similar podramos calcular -0 (mnimo
11=21=12=22=0, 01=ln(n1)ln(nn1n2) y de la funcin auxiliar eliminando 01 y 02 del
02=ln(n2)ln(nn1n2) siendo n1 y n2 el nmero modelo) y -2 (mnimo de la funcin auxiliar
de observaciones en las categoras 1 y 2 respec- eliminando del modelo la variable X2) y cons-
tivamente. Estos estimadores iniciales se obtie- truir tests de hiptesis para 01=02=0 y
nen suponiendo que no hay una influencia de las 21=22=0, respectivamente.
variables regresoras en el modelo planteado y
para ellos el valor inicial de la funcin auxiliar
que debemos de minimizar es: Significatividad de cada parmetro

n n Teniendo en cuenta que el cuadrado de cada


0 = 2 n1 ln 1 + n2 ln 2 + estimador dividido por su error estndar tiene
n
n
una distribucin 2 con 1 grado de libertad pode-
n n1 n2 mos construir test de hiptesis para la igualdad
(n n1 n2 ) ln
n de cada parmetro a cero y podremos saber qu
Una vez alcanzada la convergencia del estimadores de los parmetros del modelo son
mtodo iterativo, designaremos por ! al mni- significativamente distintos de cero. Por ejem-
mo obtenido y por ^01, ^11, ^21, ^02, ^12, ^22 a los plo, para el test de hiptesis 11=0 el p-valor sera
2
valores estimados de los parmetros del modelo. 11
2
p 1 > , siendo s.e.(^11) el valor
s.e.( 11 )

Significatividad global del modelo correspondiente al error estndar del estimador
del parmetro 11.
Podemos contrastar la hiptesis de no exis-
tencia de un efecto significativo global de las
variables regresoras teniendo en cuenta que la Intervalos de confianza para los parmetros
diferencia entre el valor inicial y el valor final de
la funcin auxiliar tiene una distribucin 2 Basndonos en la normalidad asinttica de
con 4 grados de libertad (en general, nmero de los estimadores mximo verosmiles podemos
regresores multiplicado por nmero de categor- construir, utilizando la distribucin normal,
as menos una). El p-valor del test para la hipte- intervalos de confianza asintticos para cada
sis nula de que no existe efecto de las variables uno de los parmetros del modelo y, mediante

325
V. PANDO FERNNDEZ et al. Regresin logstica multinomial

las transformaciones correspondientes, interva- interpretable al depender de L0. Por este motivo
los de confianza (I.C.) para las OR y las OC. Por es preferible el pseudo-R2 de Nagelkerke, que
ejemplo, para el parmetro 11, y utilizando un se define como
grado de confianza de 1, tendramos:
I. C. para 11: f 0
2
1 exp
( z 2 s.e.( 11 ) , 11 + z 2 s.e.( 11 ) ) RCS n
11 RN2 = =
I. C. para OR1(X1): 1 (L )
n
0
2

1 exp 0

(exp( 11 z 2 s.e.( 11 ) ), exp(11 + z 2 s.e.( 11 ) ))
n
I: C: para OR1(X1): *
y su rango de valores es 0 R2N 1 por lo que
( ( ) ( ))
exp S X (11 z 2 s.e.( 11 )) , exp S X (11 + z 2 s.e.( 11 )) puede interpretarse del mismo modo que el coe-
1 1
ficiente de determinacin de la regresin lineal
I. C. para OC1(X1): clsica, aunque es ms difcil que alcance valo-
res prximos a 1.
(exp( 11 z 2 s.e.( 11 ) ) 1, exp(11 + z 2 s.e.( 11 )) 1)
Para comparar modelos de regresin logsti-
siendo z/2 el valor que, en una distribucin nor- ca multinomial con diferente nmero de varia-
mal (0,1), verifica p(Z>z/2)=/2 bles regresoras suelen introducirse coeficientes
Pseudo-R2 ajustados. El ms conocido es el de
Mc-Fadden, definido como
Calidad del ajuste 0.5 f + k + 1
2
Adj RMF = 1 , siendo k el
Al igual que en la regresin logstica binaria, la 0. 5 0 + 1
calidad del ajuste en la regresin logstica multino- nmero de regresores.
mial se mide mediante coeficientes de determina-
cin conocidos como Pseudo-R2. De entre todos
ellos comentaremos los ms clsicos, que son los Calidad en la prediccin
que proporciona el paquete estadstico S.P.S.S.
El primero se basa en la funcin auxiliar Si, a partir del modelo ajustado, clasificamos
utilizada en el ajuste, se conoce como pseudo-R2 cada observacin en la categora ms probable,
f podemos construir una matriz de clasificacin
2
de Mc-Fadden y viene dado por: RMF = 1 . observados-predichos y utilizar el porcentaje de
0 clasificaciones correctas como una medida de la
Su rango terico de valores es 0 R2MF 1, pero calidad de prediccin, del mismo modo que se
muy raramente su valor se aproxima a 1. Suele hace en el anlisis discriminante.
considerarse una buena calidad del ajuste cuan-
do 0.2 R2MF 0.4 y excelente para valores supe-
riores. BIBLIOGRAFA
Otros autores prefieren coeficientes basados
directamente en la verosimilitud L, y no en la AGRESTI, A.; 1990. Categorical Data Analysis.
funcin auxiliar . El ms conocido es el pseu- John Wiley and Sons. New York.
do-R2 de Cox-Snell, definido como COX, D.R. & SNELL, E.J.; 1989. The Analysis of
2
RCS = 1
n L
0
2
( ) f 0
= 1 exp , siendo
Binary Data. Chapman and Hall. London.
HOSMER, D.W. & LEMESHOW, S; 1989. Applied
n L
f
2
( ) n Logistic Regression. Wiley Interscience.
L0=exp(0/2) y L f =exp( f /2). El rango teri- New York.
co de valores para este coeficiente es HARIG, A.L. & FAUSCH, K.D.; 2002. Minimum
habitat requirements for establishing translo-
2
0 RCS 1 (L )
n
0
2
, lo que le hace poco cated cutthroat trout populations. Ecol. Appl.
12(2): 535-551.

326
Cuad. Soc. Esp. Cien. For. 18: XXX-XXX (2004) Actas de la Reunin de Modelizacin Forestal

HERAJARVI, H.; 2002. Internal knottiness with NAGELKERKE, N.J.; 1991. A note on a general
respect to sawing patterns in Betula pendula definition of the coefficient of determina-
and B. bubescens. Baltic Forestry 8(1): 42- tion. Biometrika 78: 691-692.
50. NORTH, M.P. & REYNOLDS, J.H.; 1996.
MCFADDEN, D.; 1979. Quantitative methods for Microhabitat analysis using radiotelemetry
analysing travel behaviour of individuals: locations and polytomous logistic regres-
some recent developments. In: Behavioural sion. J. Wild. Manage. 60(3): 639-653.
travel modelling: 279-318. Croom Helm. RO, M. DEL; BRAVO, F.; PANDO, V.; SANZ, G. &
London. SIERRA, R.; 2004. Influence of individual
MENARD, S.; 2000. Coefficients of Determination tree and stand attributes in stem straightness
for Multiple Logistic Regression Analysis. in Pinus pinaster Ait. Stands. Ann. Sci. For.
The American Statistician 54: 17-24. 61(2): 141-148.

327

También podría gustarte