Está en la página 1de 21

Econometra

PREGUNTA N 1

1. Identificar el problema y objetivos


Problema
Se abri una Nueva empresa y la empresa no sabe cunto se debera pagar al trabajador segn a
sus caractersticas que presenta

Objetivo
Estimar el Salario de los trabajadores en funcin de la Edad, educacin y experiencia laboral.

2. Planteamiento del modelo

El modelo sera:

Regresin lineal mltiple:


S = 0 + 1E + 2EXP + 1

3. Planteamiento de las variables

Las variables:

- Variable dependiente
o S: Salario

- Variables independientes
o E: Edad
o EXP: Experiencia
o La variable educacin no se tomara en cuenta ya que es una variable cualitativa

*: trmino de perturbacin o error

4. Anlisis descriptivo

a. Univariado

Del anlisis univariado podemos concluir que:

Pgina 1 de 21
La variable que presenta la mayor dispersin es Exp: Experiencia
La variable que presenta la menor dispersin es edad.

Histogramas:

Del histograma de la produccin se observa que S: SALARIO NO sigue una distribucin


normal.

E: EDAD

Del histograma de la produccin se observa que EDAD NO sigue una distribucin normal.

EXP: EXPERIANCIA

Pgina 2 de 21
Del histograma de la produccin se observa que EXPERIENCIA sigue una distribucin
normal.

b. Bivariado

Correlaciones

Salario Edad Experiencia


*
Salario Correlacin de Pearson 1 ,266 ,390**

Sig. (bilateral) ,038 ,002

N 61 61 61
*
Edad Correlacin de Pearson ,266 1 ,838**
Sig. (bilateral) ,038 ,000
N 61 61 61
** **
Experiencia Correlacin de Pearson ,390 ,838 1

Sig. (bilateral) ,002 ,000

N 61 61 61

*. La correlacin es significativa en el nivel 0,05 (bilateral).


**. La correlacin es significativa en el nivel 0,01 (bilateral).

Anlisis bivariado entre la variable dependiente y las variables independientes:

Pgina 3 de 21
Anlisis bivariado entre las variables independientes:

Vemos k las variables independientes estn correlacionadas por lo tanto el modelo planteado
S = 0 + 1E + 2EXP + 1
ya no se considerara, plantendose asi otro modelo
EN EL NUEVO MODELO SOLO CONSIDERARE LA VARIABLE EXPERIENCIA.
S = 0 + 1EXP + 1

ANALISIS DESCRIPTIVO DEL NUEVO MODELO

Pgina 4 de 21
UNIVARIADO

Aqu observamos que la variable con mayor dispersin es experiencia.

BIVARIADO

Correlaciones

Salario Experiencia

Salario Correlacin de Pearson 1 ,390**

Sig. (bilateral) ,002

N 61 61
Experiencia Correlacin de Pearson ,390** 1

Sig. (bilateral) ,002

N 61 61

**. La correlacin es significativa en el nivel 0,01 (bilateral).

Pgina 5 de 21
5. Elaboracin del modelo

Regresin lineal mltiple:

Resumen del modelob

Error
R cuadrado estndar de
Modelo R R cuadrado ajustado la estimacin Durbin-Watson
1 ,390 a
.152 .138 9006.815 2.094
a. Predictores: (Constante), Experiencia
b. Variable dependiente: Salario

Supuestos del modelo:

a. Independencia de errores

Como Durbin-Watson=2.094, est entre 1.5 y 2.5, entonces existe independencia de errores. se
cumple el supuesto de independencia de errores

b. Normalidad de errores

Pgina 6 de 21
Prueba de Kolmogorov-Smirnov para una muestra

Unstandardized
Predicted Value

N 61
a,b
Parmetros normales Media 17150,8196721
Desviacin estndar 3782,92624306
Mximas diferencias extremas Absoluta ,161
Positivo ,161
Negativo -,103
Estadstico de prueba ,161
Sig. asinttica (bilateral) ,000c

a. La distribucin de prueba es normal.

Pgina 7 de 21
b. Se calcula a partir de datos.
c. Correccin de significacin de Lilliefors.

Como Pvalor=0.000 es menor que 5%, a un nivel de confianza del 95% los errores no siguen una
distribucin normal (no se rechaza Ho)

Del Grfico P-P Normal, como los puntos no se aproximan a la recta, es posible que los errores no
sigan una distribucin normal.

c. Homocedasticidad

Pgina 8 de 21
Del grfico se aprecia que no existe relacin entre los residuales/errores y los valores predichos,
por lo tanto se cumple el supuesto de homocedasticidad.

ANOVA

Ho: 1 = 2 = 0, el modelo no es significativo


Ha: al menos Bi <> 0, el modelo es significativo

Pvalor: = ,002b

Conclusin:
Como Pvalor<5% entocnes se rechaza la hiptesis nula H0. El modelo es significativo.

COEFICIENTES:

Pgina 9 de 21
Ho: 1 = 2 = 3 = 0, la variable no es significativa
Ha: Bi <> 0, la variable es significativa

Para EXP:
Pvalor: 0.002
Conclusin: dado que Pvalor<5%, se rechaza Ho, la variable EXPERIENCIA es
significativa
El modelo sera:

Regresin lineal mltiple:


Y = 0 + 1EXP + 1
Y = 12376.179 + 362.255*EXP+ 1

INTERPRETACION

POR CADA 1 AO DE EXPERIENCIA EL SALARIO SE INCREMENTA EN 362.55 SOLES POR HORA

PREGUNTA 2

Pgina 10 de 21
1. Identificar el problema y objetivos

Problema: QUE clientes DEJARON la COMPAIA

Objetivo: Para una base de datos (grupo de clientes) determinada, determinar quines
DEJARIAN LA COMPAIA

2. Planteamiento del modelo

Para definir plantear el modelo, inicialmente verificaremos qu variables estn relacionadas.

Para esto se aplicar la prueba Chi-cuadrado a las variables categricas, donde:

Ho: Las variables son independientes


Ha: Las variables no son independientes

Si Pvalor <5%: Se rechaza Ho, las variables son dependientes


Si Pvalor>5%: NO se rechaza Ho, las variables son independientes

- DEJARON versus PRODUCTO

Pruebas de chi-cuadrado

Significacin
Valor gl asinttica (bilateral)
Chi-
cuadrado de 180,539a 2 .000
Pearson
Razn de
verosimilitud 205.367 2 .000
N de casos
vlidos 800

a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento


mnimo esperado es 33,39.

- DEJARON versus ESTADO CIVIL

Pruebas de chi-cuadrado

Significacin Significacin
asinttica Significacin exacta
Valor gl (bilateral) exacta (bilateral) (unilateral)

Chi-cuadrado de Pearson 6,259a 1 ,012


Correccin de continuidadb 5,906 1 ,015
Razn de verosimilitud 6,260 1 ,012
Prueba exacta de Fisher ,015 ,008
N de casos vlidos 800

a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento mnimo esperado es 159,53.

Pgina 11 de 21
b. Slo se ha calculado para una tabla 2x2

Pruebas de chi-cuadrado

Significacin Significacin
asinttica Significacin exacta
Valor gl (bilateral) exacta (bilateral) (unilateral)

Chi-cuadrado de Pearson ,009a 1 ,923


b
Correccin de continuidad ,000 1 1,000
Razn de verosimilitud ,009 1 ,923
Prueba exacta de Fisher 1,000 ,512
N de casos vlidos 800

a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento mnimo esperado es 33,39.
b. Slo se ha calculado para una tabla 2x2

Pruebas de chi-cuadrado

Significacin
asinttica
Valor gl (bilateral)

Chi-cuadrado de Pearson 14,329a 2 ,001


Razn de verosimilitud 14,339 2 ,001
N de casos vlidos 800

a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento


mnimo esperado es 65,85.

Pruebas de chi-cuadrado

Significacin
asinttica
Valor gl (bilateral)

Chi-cuadrado de Pearson 2,549a 2 ,280


Razn de verosimilitud 2,782 2 ,249
N de casos vlidos 800

a. 2 casillas (33,3%) han esperado un recuento menor que 5. El recuento


mnimo esperado es 2,78.

Pgina 12 de 21
Pruebas de chi-cuadrado

Significacin Significacin
asinttica Significacin exacta
Valor gl (bilateral) exacta (bilateral) (unilateral)
a
Chi-cuadrado de Pearson ,788 1 ,375
b
Correccin de continuidad ,581 1 ,446
Razn de verosimilitud ,786 1 ,375
Prueba exacta de Fisher ,383 ,223
N de casos vlidos 800

a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento mnimo esperado es 32,46.
b. Slo se ha calculado para una tabla 2x2

Pruebas de chi-cuadrado

Significacin
asinttica
Valor gl (bilateral)
a
Chi-cuadrado de Pearson 2,500 4 ,645
Razn de verosimilitud 2,502 4 ,644
N de casos vlidos 800

a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento


mnimo esperado es 67,71.

Pruebas de chi-cuadrado

Significacin
asinttica
Valor gl (bilateral)
a
Chi-cuadrado de Pearson 1,725 2 ,422
Razn de verosimilitud 1,725 2 ,422
N de casos vlidos 800

a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento


mnimo esperado es 119,18.

SEGN EN LOS CUADROS, ANALISANDO LOS CHI LAS UNICAS VARIABLES QUE SE USARAN
SERAN EL PRODUCTO Y NIVEL SOCIO ECONOMICO

Pgina 13 de 21
El modelo sera:

Log(P/(1-P)) = 0 + 1*PRODUCTO + 2*NivelSOCIOECONOMICO

3. Planteamiento de las variables

Las variables:

- Variable dependiente
o CLIENTES QUE DEJAN LA COMPAIA
- variable respuesta es Portabilidad (Portado: dej la compaa y No Portado: no dej la
compaa).
- Variables independientes
o PRODUCTO
o NSE

4. Anlisis descriptivo

Para la Base de Datos de 800 muestras, trabajaremos con 03 casos de particin:

a. FlagSample_70_30: 70% Muestra de construccin


30% Muestra de validacin
b. FlagSample_80_20: 80% Muestra de construccin
20% Muestra de validacin
c. FlagSample_90_10: 90% Muestra de construccin
10% Muestra de validacin

Anlisis Descriptivo FlagSample_70_30

Portabilidad

Porcentaje Porcentaje
Frecuencia Porcentaje vlido acumulado

Vlido No Portado 371 46,4 46,4 46,4

Portado 429 53,6 53,6 100,0

Total 800 100,0 100,0

Pgina 14 de 21
Prueba Omnibus:

Pruebas mnibus de coeficientes de modelo

Chi-cuadrado gl Sig.

Paso 1 Paso 133,368 4 ,000

Bloque 133,368 4 ,000

Modelo 133,368 4 ,000

Dado que Pvalor=0.000<5%, a un nivel de confianza del 95% este modelo es significativo.

Prueba de Hosmer y Lemeshow:

Prueba de Hosmer y Lemeshow

Paso Chi-cuadrado gl Sig.

1 ,704 4 ,951

Dada la prueba Hosmer y Lemeshow, Pvalor=0.951>5%


Entonces NO rechaza Ho, con un nivel de confianza de 95% NO existe diferencia entre los valores
observados y los valores pre-dichos
Esto quiere decir que este modelo es adecuado.

Pgina 15 de 21
Anlisis Descriptivo FlagSample_80_20

Prueba Omnibus:

Dado que Pvalor=0.000<5%, a un nivel de confianza del 95% este modelo es significativo.

Prueba de Hosmer y Lemeshow:

Dada la prueba Hosmer y Lemeshow, Pvalor=0.689>5%


Entonces NO se rechaza Ho, con un nivel de confianza de 95% NO existe diferencia entre los
valores observados y los valores pre-dichos
Esto quiere decir que este modelo es adecuado.

Para la identificacin de las variables categricas se realiz el siguiente anlisis.

Pgina 16 de 21
Debido a que nos parece ms adecuado comparar, en Categora de cliente, respecto del cliente con
Servicio Bsico. Se realiz el cambio para que el Servicio Bsico sea la categora de referencia para
esta variable.

As, las categoras de referencia para cada variable seran:

o Nivel de Educacin: Post-undergraduated degree


o Categora del cliente: Servicio bsico (Basic Service)
o Servicio inalmbrico: SI
o Correo de Voz: SI
o Estado Civil: Casado (Married)

Anlisis del comportamiento de las variables respecto de su categora de referencia:

Pgina 17 de 21
o Nivel de Educacin: Post-undergraduated degree
Los clientes del tipo: Did not complete high school (que no completaron el colegio)
son 0.366 veces MENOS probables que dejen la empresa en comparacin con los
de nivel de educacin Post-undergraduated degree

o Categora del cliente: Servicio bsico (Basic Service)


Los clientes que cuentan con Total Service (servicio total) son 0.375 veces MENOS
probables que dejen la empresa comparado con los clientes que cuentan con
Servicio Bsico

o Servicio inalmbrico: SI
Los clientes que NO cuentan con Servicio inalmbrico (Wireless) son 0.659 veces
MENOS probables que dejen la empresa comparado con los clientes que SI
cuentan con Servicio inalmbrico

o Correo de Voz: SI
Los clientes que NO cuentan con Correo de voz son 0.434 veces MENOS probables
que dejen la empresa comparado con los clientes que si cuentan con Correo de voz

o Estado Civil: Casado (Married)


Los clientes que NO son casados son 1.477 veces MAS probables que dejen la
empresa comparado con los clientes que Si son casados

Anlisis Descriptivo FlagSample_90_10

Pgina 18 de 21
Indicadores:

Prueba Omnibus:

Dado que Pvalor=0.000<5%, a un nivel de confianza del 95% este modelo es significativo.

Prueba de Hosmer y Lemeshow:

Dada la prueba Hosmer y Lemeshow, Pvalor=0.262>5%


Entonces NO se rechaza Ho, con un nivel de confianza de 95% NO existe diferencia entre los
valores observados y los valores pre-dichos
Esto quiere decir que este modelo es adecuado.

Para la identificacin de las variables categricas se realiz el siguiente anlisis.

Pgina 19 de 21
As, las categoras de referencia para cada variable seran:

o Nivel de Educacin: Post-undergraduated degree


o Categora del cliente: Servicio bsico (Basic Service)
o Servicio inalmbrico: SI
o Correo de Voz: SI
o Estado Civil: Casado (Married)

Anlisis del comportamiento de las variables respecto de su categora de referencia:

o Nivel de Educacin: Post-undergraduated degree


Los clientes del tipo: High School Degree (que SI completaron el colegio) son 0.649
veces MENOS probables que dejen la empresa en comparacin con los de nivel de
educacin Post-undergraduated degree

Pgina 20 de 21
o Categora del cliente: Servicio bsico (Basic Service)
Los clientes que cuentan con E-Service (servicio total) son 0.860 veces MENOS
probables que dejen la empresa comparado con los clientes que cuentan con
Servicio Bsico

o Servicio inalmbrico: SI
Los clientes que NO cuentan con Servicio inalmbrico (Wireless) son 0.670 veces
MENOS probables que dejen la empresa comparado con los clientes que SI
cuentan con Servicio inalmbrico

o Correo de Voz: SI
Los clientes que NO cuentan con Correo de voz son 0.564 veces MENOS probables
que dejen la empresa comparado con los clientes que si cuentan con Correo de voz

o Estado Civil: Casado (Married)


Los clientes que NO son casados son 1.487 veces MAS probables que dejen la
empresa comparado con los clientes que Si son casados

Comparacin de indicadores:

Se observa que la Especificidad del caso FlagSample_80_20 es la mayor


Se observa que la Sensibilidad del FlagSample_70_30 es la mayor, sin embargo este modelo fue
rechazado. Entre los modelos que quedan la sensibilidad del modelo FlagSample_90_10 es mayor,
con lo cual se elige este modelo como el ms adecuado para aplicar para solucionar el problema
planteado.
Y en %Global, resultados correctos, el caso que mayor frecuencia de coincidencias es el
FlagSample_70_30.

Pgina 21 de 21