Está en la página 1de 33

Regresión Logística

Múltiples Variables

1
“Cada forma de clasificar una cosa es
solamente una manera de manejarla para un
cierto propósito particular"
William James

2
Inteligencia Artificial

3
Regresión Logística: Clasificación

4
Regresión Logística

Variable Dependiente

Dos Valores Discretos

e.g. Booleano: 0, 1

5
Regresión Logística

6
Regresión Logística

“Dividir el Dataset: en datos de


Training y datos de Test. Nunca
usar los mismos datos de
Training para Evaluar”

7
Caso de Estudio
Regresión Logística Múltiple

8
Predicción de Uso de un Producto

La Empresa de ropa para dama Simmons Stores, va a realizar una


promoción por correo.
Datos:
• Imprime 500 catálogos, con un cupón de $50 de
descuento en compras mayores a $200.
• Envía sólo a aquellos clientes que tengan mayor
probabilidad de usar el cupón.
• Variables consideradas por los gerentes:
– Gasto anual clientes por miles
– Cliente posee o no una tarjeta de compras
– Envía sólo a aquellos clientes que tengan mayor probabilidad
de usar el cupón.
• Usará o no el cupón? 9
Regresión Logística

V. Independientes V. Dependiente
10
Regresión Logística
Ecuación de Regresión Logística: similar a la
regresión lineal:

11
Regresión Logística
Ejemplo:

0a1

12
Regresión Logística

Función Paso
(Función Heaviside)

13
Regresión Logística
Ecuación de Regresión Estimada:

14
Regresión Logística
Ecuación de Regresión Estimada:

15
Regresión Logística
Ecuación de Regresión Estimada:

Ejemplo 1: estimar la probabilidad de que los


clientes que tienen un gasto anual de $2000 y que
no tienen tarjeta de crédito usen el cupón

16
Regresión Logística
Ecuación de Regresión Estimada:

Respuesta Ejemplo 1: la probabilidad estimada de


que este tipo de clientes use el cupón es 0.1880.
Ejemplo 2: estimar la probabilidad de que los
clientes que tienen un gasto anual de $2000 y que
si tienen tarjeta de crédito usen el cupón

17
Regresión Logística
Ecuación de Regresión Estimada:

Respuesta Ejemplo 2: la probabilidad estimada de


que este tipo de clientes use el cupón es 0.4099.

Conclusión: “Parece ser que los clientes que tienen


tarjeta de crédito son los que tienen mayor
probabilidad de usar el cupón”
18
Interpretación: Ecuación Regresión
Logística
Dificultad: la ecuación de regresión logística no
es lineal, es difícil interpretar directamente la
relación entre las variables independientes y la
probabilidad de que y = 1.

Solución: interpretación indirecta por medio de


un concepto llamado cociente de posibilidades
(en inglés, odds ratio)

19
Interpretación: Ecuación Regresión
Logística
ODDS Ratio: Las posibilidades a favor de que
ocurra un evento se definen como la probabilidad
de que ocurra el evento, dividida entre la
probabilidad de que no ocurra el evento.

20
Interpretación: Ecuación Regresión
Logística
Cociente de Posibilidades (ODDS Ratio): mide el
efecto que tiene sobre estas posibilidades el
aumento en una unidad de una sola de las variables
independientes.

21
Interpretación: Ecuación Regresión
Logística
y = 1 cuando una de las variables
independientes es incrementada en una
unidad (odds1)

y = 1 cuando no ha habido cambio en los


valores de las variables independientes
(odds0)
22
Interpretación: Ecuación Regresión
Logística

Interpretación: compara las posibilidades de que


use el cupón un cliente que gasta $2000 anuales y
tiene tarjeta de crédito de Simmons (x1 = 2 y x2 = 1)
con las posibilidades de que use el cupón un cliente
que gasta $2000 anuales y no tiene tarjeta de
crédito de Simmons (x1 = 2 y x2 = 0).
23
Interpretación: Ecuación Regresión
Logística

24
Interpretación: Ecuación Regresión
Logística

Conclusión: las posibilidades estimadas de que


usen el cupón los clientes que gastaron $2000 y
tienen tarjeta de crédito son tres veces mayores
que las posibilidades estimadas de que usen el
cupón los clientes que gastaron $2000 y no
tienen tarjeta de crédito.

25
Interpretación: Ecuación Regresión
Logística

26
Interpretación: Ecuación Regresión
Logística

x1 x2

27
Transformación LOGIT

Solución: El logaritmo natural de las posibilidades


a favor de y = 1 es función lineal de las variables
independientes.

28
Transformación LOGIT

29
Caso de Estudio
Regresión Logística Múltiple

30
Predicción de Calidad de un Producto
Consumer Report le realizó una prueba de sabor a 19 marcas de chocolates. En
los datos a continuación se da el precio por porción, en base al tamaño de
porción de la FDA que es de 1.4 onzas, así como una evaluación de la calidad
de los 19 chocolates tomados para la prueba. Suponga que desea determinar si
los productos que son más caros son mejor evaluados. Para los
propósitos de este ejercicio, emplee la siguiente variable binaria dependiente:

y = 1 si la evaluación de la calidad fue excelente o muy buena y


y = 0 si la evaluación de la calidad fue buena o regular.

31
Predicción de Calidad de un Producto

32
Predicción de Calidad de un Producto

LOGIT

Coeficientes

33

También podría gustarte