Está en la página 1de 3

REGRESION LOGISTICA

En el modelo de regresión clásica la variable dependiente o respuesta es de carácter


cuantitativa y en el modelo de regresión logísticas la variable respuesta es de carácter
cualitativa. La variable respuesta es binaria, es decir, tiene dos alternativas que se pueden
explicar como presencia de un suceso A o ausencia del suceso A, por ejemplo: rotura o no
de una pieza, en donde los individuos se clasifican en dos categorías excluyentes.
1.1 Planteamiento del modelo

El modelo de RL predice la probabilidad del suceso A (valor medio de la variable


respuesta, con valores 0 y 1).
1.1.1 Definición de variables
Para empezar, se tiene que definir las variables con las que se va a trabajar tanto
independientes y dependiente (binaria).

Y X1 X2 … Xi
1 1 x 11 x 21 … xi1
0 1 x 11 x 21 … xi1
⋮ ⋮ ⋮ ⋮ … ⋮
1 1 x1 j x2 j … x ij Y j ≈ Bernoulli(P j)
⋮ ⋮ ⋮ ⋮ … ⋮
0 1 x1N x2 N … x¿

E ( Y j|⃗x j )=1 × P ( Y j=1|⃗x j ) +0 × P ( Y j=0|⃗x j )=P ( Y j=1|⃗x j ) =P j

La variable respuesta se distribuye como una Bernoulli y la esperanza es la probabilidad


P j.

Las variables explicativas (X1, X2, ..., XI) tendrán efecto sobre la probabilidad del
suceso considerado: P(A) = p. Entonces conocidos los valores, en un individuo, de las
variables explicativas ⃗x j , predice P(A). Por lo tanto, conocido ⃗x j de un nuevo individuo,
clasificarlo en una de las dos categorías: A y A .
1.1.2 forma de la variable explicativa
La variable explicativa debe tener la forma lineal, si no lo es procede a una transformación
para llegar a una lineal. Existen varias formas como:

 Lineal
 Exponencial

Hay que transformar la variable respuesta a partir de una función F estrictamente creciente,
tal que: F (-∞) =0 y F (∞) =1.

De este modo, el modelo expresará P j mediante una función no lineal de:

x i ' ⃗β) x i ' ⃗β


−1
P j=F(⃗ g ( P j ) =F ( P j )=⃗

Se utiliza el modelo logit como función F.


x i ' ⃗β

e
E ( Y j|⃗x j )=P ( Y j=1|⃗x j ) =P j= xi ' ⃗
⃗ β
1+e

Esta expresión garantiza que P j este entre 0 y 1. De tal manera que si e numerador es muy
pequeño ¿ ¿ 0) y si es muy grande( P j 1).

La variable “logit” representa, en escala logarítmica, la diferencia entre las probabilidades


de pertenecer a cada categoría.
Pj
Al cociente se le conoce como “odd” (lenguaje de apuestas), que suele traducirse por
1−P j
“riesgo”.

1.2.1 Estimación máximo-verosímil del modelo


Se tiene un cantidad N de observaciones (Yj,Xj), de manera que:
Yj = {0,1}
Xj = (1, X1j, ,, Xij)

P ( y j ) =P yj (1−P j )1− y
j j

N
V =P ( y 1 , … , y N ) =∏ P yj (1−P j )1− y
j j

j=1

N
ln V =∑ [ y j ln P j +(1− y j)ln(1−P j ) ]
j =1

[ ]
N
Pj
ln V =∑ y j ln + ln (1−P j)
j =1 1−P j j
N
ln V =∑ [ y j . ⃗ β−ln (1+e ⃗x . β ) ]

xj.⃗ j

j =1

También podría gustarte