Está en la página 1de 13

Econometra

Tarea 3

Integrantes: Melany Figueroa Montalvo


Pamela Castillo Gallegos
Yuly Beraun Mendoza

1. Identificar el problema y objetivos

Problema: Los clientes abandonan la empresa

Objetivo: Para una base de datos (grupo de clientes) determinada, determinar quines
abandonaran la empre

2. Planteamiento del modelo

Para definir plantear el modelo, inicialmente verificaremos qu variables estn relacionadas.

Para esto se aplicar la prueba Chi-cuadrado a las variables categricas, donde:

Ho: Las variables son independientes


Ha: Las variables no son independientes

Si Pvalor <5%: Se rechaza Ho, las variables son dependientes


Si Pvalor>5%: NO se rechaza Ho, las variables son independientes

- Abandonaron el mes pasado versus Regin

Pruebas de chi-cuadrado
Significacin
asinttica
Valor gl (bilateral)
Chi-cuadrado
a
de Pearson ,820 2 .664

Razn de
.820 2 .663
verosimilitud
Asociacin
lineal por .703 1 .402
lineal
N de casos
548
vlidos
a. 0 casillas (0,0%) han esperado un recuento menor
que 5. El recuento mnimo esperado es 87,00.

La variable regin NO se usar, Chi-cuadrado/Pvalor=0.664

- Abandonaron el mes pasado versus Estado Civil


Pruebas de chi-cuadrado
Significacin Significacin Significacin
asinttica exacta exacta
Valor gl (bilateral) (bilateral) (unilateral)
Chi-cuadrado
a
de Pearson 4,937 1 .026

Correccin
de 4.564 1 .033
continuidad b
Razn de
4.944 1 .026
verosimilitud
Prueba
exacta de .033 .016
Fisher
Asociacin
lineal por 4.928 1 .026
lineal
N de casos
548
vlidos
a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento mnimo
esperado es 134,00.
b. Slo se ha calculado para una tabla 2x2

La variable Estado civil SI se usar, Chi-cuadrado/Pvalor=0.26

- Abandonaron el mes pasado versus Nivel de educacin

Pruebas de chi-cuadrado
Significacin
asinttica
Valor gl (bilateral)
Chi-cuadrado
a
de Pearson 28,470 4 .000

Razn de
28.958 4 .000
verosimilitud
Asociacin
lineal por 26.007 1 .000
lineal
N de casos
548
vlidos
a. 0 casillas (0,0%) han esperado un recuento menor
que 5. El recuento mnimo esperado es 23,00.

La variable Nivel de educacin SI se usar, Chi-cuadrado/Pvalor=0.00

- Abandonaron el mes pasado versus Gnero


Pruebas de chi-cuadrado
Significacin Significacin Significacin
asinttica exacta exacta
Valor gl (bilateral) (bilateral) (unilateral)
Chi-cuadrado
a
de Pearson ,735 1 .391

Correccin
de .595 1 .440
b
continuidad
Razn de
.735 1 .391
verosimilitud
Prueba
exacta de .440 .220
Fisher
Asociacin
lineal por .733 1 .392
lineal
N de casos
548
vlidos
a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento mnimo
esperado es 126,00.
b. Slo se ha calculado para una tabla 2x2

La variable Gnero NO se usar, Chi-cuadrado/Pvalor=0.391

- Abandonaron el mes pasado versus Servicio de llamada gratuita

Pruebas de chi-cuadrado
Significacin Significacin Significacin
asinttica exacta exacta
Valor gl (bilateral) (bilateral) (unilateral)
Chi-cuadrado
a
de Pearson ,469 1 .494

Correccin
de .359 1 .549
continuidad b
Razn de
.469 1 .494
verosimilitud
Prueba
exacta de .549 .275
Fisher
Asociacin
lineal por .468 1 .494
lineal
N de casos
548
vlidos
a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento mnimo
esperado es 129,00.
b. Slo se ha calculado para una tabla 2x2

La variable Llamada gratuita NO se usar, Chi-cuadrado/Pvalor=0.494

- Abandonaron el mes pasado versus Servicio Inalmbrico


Pruebas de chi-cuadrado
Significacin Significacin Significacin
asinttica exacta exacta
Valor gl (bilateral) (bilateral) (unilateral)
Chi-cuadrado
a
de Pearson 10,106 1 .001

Correccin
de 9.537 1 .002
continuidad b
Razn de
10.154 1 .001
verosimilitud
Prueba
exacta de .002 .001
Fisher
Asociacin
lineal por 10.087 1 .001
lineal
N de casos
548
vlidos
a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento mnimo
esperado es 90,50.
b. Slo se ha calculado para una tabla 2x2

La variable Servicio inalmbrico SI se usar, Chi-cuadrado/Pvalor=0.001

- Abandonaron el mes pasado versus Lneas mltiples

Pruebas de chi-cuadrado
Significacin Significacin Significacin
asinttica exacta exacta
Valor gl (bilateral) (bilateral) (unilateral)
Chi-cuadrado
de Pearson ,468 a 1 .494

Correccin
de .358 1 .549
continuidad b
Razn de
.468 1 .494
verosimilitud
Prueba
exacta de .549 .275
Fisher
Asociacin
lineal por .467 1 .494
lineal
N de casos
548
vlidos
a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento mnimo
esperado es 131,00.
b. Slo se ha calculado para una tabla 2x2

La variable Lneas mltiples NO se usar, Chi-cuadrado/Pvalor=0.494

- Abandonaron el mes pasado versus Correo de voz


Pruebas de chi-cuadrado
Significacin Significacin Significacin
asinttica exacta exacta
Valor gl (bilateral) (bilateral) (unilateral)
Chi-cuadrado
a
de Pearson 13,510 1 .000

Correccin
de 12.859 1 .000
continuidad b
Razn de
13.589 1 .000
verosimilitud
Prueba
exacta de .000 .000
Fisher
Asociacin
lineal por 13.485 1 .000
lineal
N de casos
548
vlidos
a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento mnimo
esperado es 95,50.
b. Slo se ha calculado para una tabla 2x2

La variable Correo de voz SI se usar, Chi-cuadrado/Pvalor=0.000

- Abandonaron el mes pasado versus Caller ID

Pruebas de chi-cuadrado
Significacin Significacin Significacin
asinttica exacta exacta
Valor gl (bilateral) (bilateral) (unilateral)
Chi-cuadrado
de Pearson ,468 a 1 .494

Correccin
de .358 1 .549
continuidad b
Razn de
.468 1 .494
verosimilitud
Prueba
exacta de .549 .275
Fisher
Asociacin
lineal por .467 1 .494
lineal
N de casos
548
vlidos
a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento mnimo
esperado es 131,00.
b. Slo se ha calculado para una tabla 2x2

La variable Caller ID NO se usar, Chi-cuadrado/Pvalor=0.494

- Abandonaron el mes pasado versus Categora del cliente


Pruebas de chi-cuadrado
Significacin
asinttica
Valor gl (bilateral)
Chi-cuadrado
de Pearson 20,921a 3 .000

Razn de
21.238 3 .000
verosimilitud
Asociacin
lineal por .012 1 .913
lineal
N de casos
548
vlidos
a. 0 casillas (0,0%) han esperado un recuento menor
que 5. El recuento mnimo esperado es 55,50.

La variable Categora del cliente SI se usar, Chi-cuadrado/Pvalor=0.000

El modelo sera:

Log(P/(1-P)) = 0 + 1*EstadoCivil + 2*NivelDeEducacin + 3*ServicioInalmbrico


+ 4*CorreoDeVoz + 5*CategoraDelCliente

3. Planteamiento de las variables

Las variables:

- Variable dependiente
o Abandonaron durante el mes pasado: indica si el cliente abandon (SI o NO) la
empresa el mes pasado

- Variables independientes
o Estado Civil: Indica si el cliente es Casado o NO Casado
o Nivel de Educacin: Indica si el cliente NO completo el colegio, Completo el
colegio, No culmin la universidad, Culmin la Universidad o Hizo post-grado
o Servicio Inalmbrico: indica si el cliente cuenta con servicio inalmbrico (SI o NO)
o Correo de Voz: indica si el cliente cuenta con correo de voz inalmbrico (SI o NO)
o Categora de Cliente: indica si el cliente cuenta con Servicio bsico, E-Service,
Servicio Plus o Servicio total

4. Anlisis descriptivo

Para la Base de Datos de 548 muestras, trabajaremos con 03 casos de particin:

a. FlagSample_70_30: 70% Muestra de construccin


30% Muestra de validacin
b. FlagSample_80_20: 80% Muestra de construccin
20% Muestra de validacin
c. FlagSample_90_10: 90% Muestra de construccin
10% Muestra de validacin
Anlisis Descriptivo FlagSample_70_30
FlagSample_70_30
Porcentaje Porcentaje
Frecuencia Porcentaje vlido acumulado
Vlido MValidacin 164 29.9 29.9 29.9
MConstruccin 384 70.1 70.1 100.0
Total 548 100.0 100.0

Tabla de clasificacina
Pronosticado
b c
Casosdurante
Abandonaron seleccionados
el Casos no
Abandonaron seleccionados
durante el
mes pasado Porcentaje mes pasado Porcentaje
Observado No Yes correcto No Yes correcto
Paso 1 Abandonaron durante el mes No 91 93 49.5 39 51 43.3
pasado Yes 41 159 79.5 17 57 77.0
Porcentaje global 65.1 58.5
a. El valor de corte es ,500
b. Casos seleccionados FlagSample_70_30 EQ 1
c. Casos no seleccionados FlagSample_70_30 NE 1

Prueba Omnibus:

Pruebas mnibus de coeficientes de modelo

Chi-cuadrado gl Sig.
Paso 1 Paso 40.586 10 .000
Bloque 40.586 10 .000
Modelo 40.586 10 .000

Dado que Pvalor=0.000<5%, a un nivel de confianza del 95% este modelo es significativo.

Prueba de Hosmer y Lemeshow:

Prueba de Hosmer y Lemeshow

Paso Chi-cuadrado gl Sig.


1 17.710 8 .024

Dada la prueba Hosmer y Lemeshow, Pvalor=0.024<5%


Entonces se rechaza Ho, con un nivel de confianza de 95% SI existe diferencia entre los valores
observados y los valores pre-dichos
Esto quiere decir que este modelo NO es adecuado.

Anlisis Descriptivo FlagSample_80_20


FlagSample_80_20
Porcentaje Porcentaje
Frecuencia Porcentaje vlido acumulado
Vlido MuValidacin 110 20.1 20.1 20.1
MuConstruccin 438 79.9 79.9 100.0
Total 548 100.0 100.0

Tabla de clasificacina
Pronosticado
b c
Casosdurante
Abandonaron seleccionados
el Casos no
Abandonaron seleccionados
durante el
mes pasado Porcentaje mes pasado Porcentaje
Observado No Yes correcto No Yes correcto
Paso 1 Abandonaron durante el mes No 118 92 56.2 34 30 53.1
pasado Yes 68 160 70.2 21 25 54.3
Porcentaje global 63.5 53.6
a. El valor de corte es ,500
b. Casos seleccionados FlagSample_80_20 EQ 1
c. Casos no seleccionados FlagSample_80_20 NE 1

Prueba Omnibus:

Pruebas mnibus de coeficientes de modelo

Chi-cuadrado gl Sig.
Paso 1 Paso 57.498 10 .000
Bloque 57.498 10 .000
Modelo 57.498 10 .000

Dado que Pvalor=0.000<5%, a un nivel de confianza del 95% este modelo es significativo.

Prueba de Hosmer y Lemeshow:

Prueba de Hosmer y Lemeshow


Paso Chi-cuadrado gl Sig.
1 5.624 8 .689

Dada la prueba Hosmer y Lemeshow, Pvalor=0.689>5%


Entonces NO se rechaza Ho, con un nivel de confianza de 95% NO existe diferencia entre los
valores observados y los valores pre-dichos
Esto quiere decir que este modelo es adecuado.

Para la identificacin de las variables categricas se realiz el siguiente anlisis.


Codificaciones de variables categricas
Codificacin de parmetro
Frecuencia (1) (2) (3) (4)
Nivel de educacin Did not complete high school 82 1.000 0.000 0.000 0.000
High school degree 107 0.000 1.000 0.000 0.000
Some college 91 0.000 0.000 1.000 0.000
College degree 118 0.000 0.000 0.000 1.000
Post-undergraduate degree 40 0.000 0.000 0.000 0.000
Categora del Basic service 128 1.000 0.000 0.000
cliente E-service 89 0.000 1.000 0.000
Plus service 100 0.000 0.000 1.000
Total service 121 0.000 0.000 0.000
servicio No 289 1.000
inalmbrico Yes 149 0.000
Correo de voz No 281 1.000
Yes 157 0.000
Estado civil Unmarried 212 1.000
Married 226 0.000

Debido a que nos parece ms adecuado comparar, en Categora de cliente, respecto del cliente
con Servicio Bsico. Se realiz el cambio para que el Servicio Bsico sea la categora de referencia
para esta variable.

Codificaciones de variables categricas


Codificacin de parmetro
Frecuencia (1) (2) (3) (4)
Nivel de educacin Did not complete high school 82 1.000 0.000 0.000 0.000
High school degree 107 0.000 1.000 0.000 0.000
Some college 91 0.000 0.000 1.000 0.000
College degree 118 0.000 0.000 0.000 1.000
Post-undergraduate degree 40 0.000 0.000 0.000 0.000
Categora del Basic service 128 0.000 0.000 0.000
cliente E-service 89 1.000 0.000 0.000
Plus service 100 0.000 1.000 0.000
Total service 121 0.000 0.000 1.000
servicio No 289 1.000
inalmbrico Yes 149 0.000
Correo de voz No 281 1.000
Yes 157 0.000
Estado civil Unmarried 212 1.000
Married 226 0.000

As, las categoras de referencia para cada variable seran:

o Nivel de Educacin: Post-undergraduated degree


o Categora del cliente: Servicio bsico (Basic Service)
o Servicio inalmbrico: SI
o Correo de Voz: SI
o Estado Civil: Casado (Married)

Anlisis del comportamiento de las variables respecto de su categora de referencia:


Variables en la ecuacin
Error
B estndar Wald gl Sig. Exp(B)
a marital(1)
Paso 1 .390 .206 3.582 1 .058 1.477
education 17.913 4 .001
education(1) -1.005 .439 5.241 1 .022 .366
education(2) -.313 .404 .601 1 .438 .731
education(3) -.170 .410 .173 1 .678 .843
education(4) .410 .394 1.085 1 .297 1.507
wireless(1) -.417 .342 1.483 1 .223 .659
voice(1) -.834 .318 6.868 1 .009 .434
custcat 12.441 3 .006
custcat(1) -.064 .297 .046 1 .830 .938
custcat(2) -.952 .304 9.774 1 .002 .386
custcat(3) -.981 .433 5.143 1 .023 .375
Constante 1.393 .528 6.969 1 .008 4.028
a. Variables especificadas en el paso 1: marital, education, wireless, voice, custcat.

o Nivel de Educacin: Post-undergraduated degree


Los clientes del tipo: Did not complete high school (que no completaron el colegio)
son 0.366 veces MENOS probables que dejen la empresa en comparacin con los
de nivel de educacin Post-undergraduated degree

o Categora del cliente: Servicio bsico (Basic Service)


Los clientes que cuentan con Total Service (servicio total) son 0.375 veces MENOS
probables que dejen la empresa comparado con los clientes que cuentan con
Servicio Bsico

o Servicio inalmbrico: SI
Los clientes que NO cuentan con Servicio inalmbrico (Wireless) son 0.659 veces
MENOS probables que dejen la empresa comparado con los clientes que SI
cuentan con Servicio inalmbrico

o Correo de Voz: SI
Los clientes que NO cuentan con Correo de voz son 0.434 veces MENOS probables
que dejen la empresa comparado con los clientes que si cuentan con Correo de
voz

o Estado Civil: Casado (Married)


Los clientes que NO son casados son 1.477 veces MAS probables que dejen la
empresa comparado con los clientes que Si son casados

Anlisis Descriptivo FlagSample_90_10


FlagSample_90_10
Porcentaje Porcentaje
Frecuencia Porcentaje vlido acumulado
Vlido MuValidacin 55 10.0 10.0 10.0
MuConstruccin 493 90.0 90.0 100.0
Total 548 100.0 100.0

Tabla de clasificacina
Pronosticado
b c
Casosdurante
Abandonaron seleccionados
el Casos no
Abandonaron seleccionados
durante el
mes pasado Porcentaje mes pasado Porcentaje
Observado No Yes correcto No Yes correcto
Paso 1 Abandonaron durante el mes No 149 95 61.1 14 16 46.7
pasado Yes 81 168 67.5 9 16 64.0
Porcentaje global 64.3 54.5
a. El valor de corte es ,500
b. Casos seleccionados FlagSample_90_10 EQ 1
c. Casos no seleccionados FlagSample_90_10 NE 1

Indicadores:

Prueba Omnibus:

Pruebas mnibus de coeficientes de modelo

Chi-cuadrado gl Sig.
Paso 1 Paso 54.127 10 .000
Bloque 54.127 10 .000
Modelo 54.127 10 .000

Dado que Pvalor=0.000<5%, a un nivel de confianza del 95% este modelo es significativo.

Prueba de Hosmer y Lemeshow:

Prueba de Hosmer y Lemeshow


Paso Chi-cuadrado gl Sig.
1 10.046 8 .262

Dada la prueba Hosmer y Lemeshow, Pvalor=0.262>5%


Entonces NO se rechaza Ho, con un nivel de confianza de 95% NO existe diferencia entre los
valores observados y los valores pre-dichos
Esto quiere decir que este modelo es adecuado.

Para la identificacin de las variables categricas se realiz el siguiente anlisis.


Codificaciones de variables categricas
Codificacin de parmetro
Frecuencia (1) (2) (3) (4)
Nivel de educacin Did not complete high school 93 1.000 0.000 0.000 0.000
High school degree 126 0.000 1.000 0.000 0.000
Some college 104 0.000 0.000 1.000 0.000
College degree 127 0.000 0.000 0.000 1.000
Post-undergraduate degree 43 0.000 0.000 0.000 0.000
Categora del Basic service 138 0.000 0.000 0.000
cliente E-service 100 1.000 0.000 0.000
Plus service 120 0.000 1.000 0.000
Total service 135 0.000 0.000 1.000
servicio No 329 1.000
inalmbrico Yes 164 0.000
Correo de voz No 322 1.000
Yes 171 0.000
Estado civil Unmarried 238 1.000
Married 255 0.000

As, las categoras de referencia para cada variable seran:

o Nivel de Educacin: Post-undergraduated degree


o Categora del cliente: Servicio bsico (Basic Service)
o Servicio inalmbrico: SI
o Correo de Voz: SI
o Estado Civil: Casado (Married)

Anlisis del comportamiento de las variables respecto de su categora de referencia:

Variables en la ecuacin
Error
B estndar Wald gl Sig. Exp(B)
Paso 1 a marital(1) .397 .192 4.259 1 .039 1.487
education 18.424 4 .001
education(1) -.863 .415 4.319 1 .038 .422
education(2) -.432 .381 1.287 1 .257 .649
education(3) -.119 .388 .094 1 .760 .888
education(4) .420 .375 1.257 1 .262 1.522
wireless(1) -.400 .305 1.725 1 .189 .670
voice(1) -.573 .298 3.692 1 .055 .564
custcat 12.805 3 .005
custcat(1) -.151 .282 .286 1 .593 .860
custcat(2) -.929 .278 11.175 1 .001 .395
custcat(3) -.818 .406 4.059 1 .044 .441
Constante 1.136 .501 5.140 1 .023 3.113
a. Variables especificadas en el paso 1: marital, education, wireless, voice, custcat.

o Nivel de Educacin: Post-undergraduated degree


Los clientes del tipo: High School Degree (que SI completaron el colegio) son 0.649
veces MENOS probables que dejen la empresa en comparacin con los de nivel de
educacin Post-undergraduated degree

o Categora del cliente: Servicio bsico (Basic Service)


Los clientes que cuentan con E-Service (servicio total) son 0.860 veces MENOS
probables que dejen la empresa comparado con los clientes que cuentan con
Servicio Bsico

o Servicio inalmbrico: SI
Los clientes que NO cuentan con Servicio inalmbrico (Wireless) son 0.670 veces
MENOS probables que dejen la empresa comparado con los clientes que SI
cuentan con Servicio inalmbrico

o Correo de Voz: SI
Los clientes que NO cuentan con Correo de voz son 0.564 veces MENOS probables
que dejen la empresa comparado con los clientes que si cuentan con Correo de
voz

o Estado Civil: Casado (Married)


Los clientes que NO son casados son 1.487 veces MAS probables que dejen la
empresa comparado con los clientes que Si son casados

Comparacin de indicadores:

FlagSample_70_30 FlagSample_80_20 FlagSample_90_10


Especificidad 43.33 53.13 46.67
Sensibilidad 77.03 54.35 64.00
%Global 58.54 53.64 54.55

Se observa que la Especificidad del caso FlagSample_80_20 es la mayor


Se observa que la Sensibilidad del FlagSample_70_30 es la mayor, sin embargo este modelo fue
rechazado. Entre los modelos que quedan la sensibilidad del modelo FlagSample_90_10 es mayor,
con lo cual se elige este modelo como el ms adecuado para aplicar para solucionar el problema
planteado.
Y en %Global, resultados correctos, el caso que mayor frecuencia de coincidencias es el
FlagSample_70_30.

También podría gustarte