Está en la página 1de 6

LABORATORIO N° 14

TEMA: REGRESIÓN LOGÍSTICA BINARIA

En una cadena de supermercados se va a realizar una promoción por correo y quiere


enviar un costoso catálogo de venta, en el cual se incluye un cupón de $50 de descuento
por la compra de $200 en productos, sólo a aquellos clientes que tengan mayor
probabilidad de usar el cupón. Además, dos variables que pueden servir para predecir si
ese cliente usará el cupón son la cantidad gastada anualmente por el cliente en las
tiendas, y si tiene o no una tarjeta de crédito de esta cadena de tiendas. Usando una
muestra aleatoria de 50 clientes que tiene tarjeta de crédito de esta cadena y otros 50
clientes que no tienen tarjeta de crédito. Al final del periodo de prueba, se anota si los
clientes han hecho uso o no del cupón.

A continuación, se muestran en la siguiente tabla la información recolectada del gasto


anual, si posee la tarjeta de crédito y si uso el cupón, de los 10 primeros clientes de los
100 que fueron seleccionados aleatoriamente y que recibieron el catálogo.

Cliente Gasto anual Tarjeta Cupón


1 2.291 1 0
2 3.215 1 0
3 2.135 1 0
4 3.924 0 0
5 2.528 1 0
6 2.473 0 1
7 2.384 0 0
8 7.076 0 0
9 1.182 1 1
10 3.345 0 0
….
Los datos se encuentra en un archivo de Excel: “Cupón”

Además, se codificó al cliente como 1: si tiene tarjeta de crédito de esta cadena de tienda
y 0: si no tiene, también se registró como 1: al cliente que usó el cupón y 0: si el cliente
no usó el cupón.

Usando el minitab, se realizará el análisis de regresión logística binaria.

Solución:

Como los datos están sueltos, en minitab se ingresará por columna la información de
cada variable del estudio, así:
Luego, siguiendo la ruta: Estadísticas / Regresión / Regresión logística binaria /
Ajustar modelo logístico binario…

En la siguiente ventana, se ingresarán las variables de la siguiente manera:

Respuesta: Usa cupón


Predictores continuos: Gasto anual y Tenencia de tarjeta
En la opción Resultados…, se marcan lo siguiente:

 Método
 Análisis de desviación
 Coeficientes
 Relaciones de probabilidades (Odds ratio)

 Presentación de resultados: Tablas expandidas


Después de marcar los resultados a necesitar, se hace clic en Aceptar; y en la siguiente
ventana, también se hace clic en Aceptar.

Se obtiene los siguientes resultados:

Regresión logística binaria: USA CUPÓN vs. GASTO ... CIA DE TARJETA

Tabla de desviaciones
Desv. Media
Fuente GL Desv. sec. Contribución ajust. ajust. Chi-cuadrada Valor p
Regresión 2 13.628 10.12% 13.628 6.814 13.63 0.001
GASTO ANUAL 1 7.218 5.36% 7.556 7.556 7.56 0.006
TENENCIA DE TARJETA 1 6.410 4.76% 6.410 6.410 6.41 0.011
Error 97 120.974 89.88% 120.974 1.247
Total 99 134.602 100.00%

Coeficientes
EE del
Término Coef coef. IC de 95% Valor Z Valor p FIV
Constante -2.146 0.577 (-3.278; -1.015) -3.72 0.000
GASTO ANUAL 0.342 0.129 (0.089; 0.594) 2.66 0.008 1.02
TENENCIA DE TARJETA 1.099 0.445 (0.227; 1.970) 2.47 0.013 1.02

Relaciones de probabilidades para predictores continuos


Relación de
probabilidades IC de 95%
GASTO ANUAL 1.4073 (1.0936; 1.8109)
TENENCIA DE TARJETA 3.0004 (1.2550; 7.1730)

Ecuación de regresión
P(1) = exp(Y')/(1 + exp(Y'))
Y' = -2.146 + 0.342 GASTO ANUAL + 1.099 TENENCIA DE TARJETA

Realizando el análisis de regresión logística correspondiente:

 Modelo de regresión logística estimado:

Corresponde cuando el valor de la variable dependiente es 1, así:

Del resultado:
Ecuación de regresión
P(1) = exp(Y')/(1 + exp(Y'))
Y' = -2.146 + 0.342 GASTO ANUAL + 1.099 TENENCIA DE TARJETA

𝑒 −2.146+0.342𝐺𝑎𝑠𝑡𝑜 𝑎𝑛𝑢𝑎𝑙+1.099 𝑇𝑒𝑛𝑒𝑐𝑖𝑎 𝑑𝑒 𝑡𝑎𝑟𝑗𝑒𝑡𝑎


𝑃(𝑌 = 1) =
1 + 𝑒 −2.146+0.342𝐺𝑎𝑠𝑡𝑜 𝑎𝑛𝑢𝑎𝑙+1.099 𝑇𝑒𝑛𝑒𝑐𝑖𝑎 𝑑𝑒 𝑡𝑎𝑟𝑗𝑒𝑡𝑎

 Significancia del modelo estimado:

Del resultado:

Tabla de desviaciones
Desv. Media
Fuente GL Desv. sec. Contribución ajust. ajust. Chi-cuadrada Valor p
Regresión 2 13.628 10.12% 13.628 6.814 13.63 0.001
GASTO ANUAL 1 7.218 5.36% 7.556 7.556 7.56 0.006
TENENCIA DE TARJETA 1 6.410 4.76% 6.410 6.410 6.41 0.011
Error 97 120.974 89.88% 120.974 1.247
Total 99 134.602 100.00%

Se obtiene:

Como el estadístico de prueba de Regresión: Chi-cuadrada = 13.63, con un valor p


= 0.001, se puede afirmar que el modelo de regresión logística estimado es
significativo.

 Significancia de las variables predictoras

Del resultado:

Coeficientes
EE del
Término Coef coef. IC de 95% Valor Z Valor p FIV
Constante -2.146 0.577 (-3.278; -1.015) -3.72 0.000
GASTO ANUAL 0.342 0.129 (0.089; 0.594) 2.66 0.008 1.02
TENENCIA DE TARJETA 1.099 0.445 (0.227; 1.970) 2.47 0.013 1.02

Para la variable Gasto anual, el valor del estadístico correspondiente Zcal = 2.66,
con valor p = 0.008; se puede afirmar que la variable es significativa, permanece en
el modelo de regresión logística estimada.
Para la variable Tenencia de tarjeta, el valor del estadístico correspondiente Zcal =
2.47, con valor p = 0.013; se puede afirmar que la variable es significativa,
permanece en el modelo de regresión logística estimada.

 Interpretación del cociente de probabilidades: Odds ratio

Del resultado:

Relaciones de probabilidades para predictores continuos


Relación de
probabilidades IC de 95%
GASTO ANUAL 1.4073 (1.0936; 1.8109)
TENENCIA DE TARJETA 3.0004 (1.2550; 7.1730)

Para Gasto anual: Odds ratio = 1.4073:

Por cada dólar de gasto anual, la probabilidad de que el cliente use el cupón de
descuento es 1.4073 veces más que la probabilidad de que el cliente no use el
cupón.

Para Tenencia de tarjeta de crédito: Odds ratio = 3.0004:

Si el cliente tiene tarjeta de crédito de la cadena de tiendas, la posibilidad de que use


el cupón de descuento es 3.0004 veces más que la posibilidad de que no lo use.

También podría gustarte