Está en la página 1de 48

Ingeniera Comercial

Flexibilizacin del modelo lineal


Uso de logaritmos (ya lo vimos)

Formas cuadrticas
Cambios de escala (ya vimos)
Variables ficticias: variables explicativas binarias

Interacciones entre variables continuas-binarias y entre variables


binarias

Variables dependientes binarias

Bondad de ajuste y seleccin de los regresores.

Prediccin y anlisis de residuales.

Flexibilizacin del modelo lineal


Uso de logaritmos

Formas cuadrticas
Cambios de escala
Variables ficticias: variables explicativas binarias

Interacciones entre variables continuas-binarias y entre variables


binarias
Variables dependientes binarias

Bondad de ajuste y seleccin de los regresores.

Prediccin y anlisis de residuales.

Este tpico ya lo vimos, el usar logaritmos,


nos permite flexibilizar modelo

. reg sal esc


Source |
SS
df
MS
-------------+-----------------------------Model | 2.1038e+15
1 2.1038e+15
Residual | 1.4800e+16 36373 4.0690e+11
-------------+-----------------------------Total | 1.6904e+16 36374 4.6472e+11

Number of obs
F( 1, 36373)
Prob > F
R-squared
Adj R-squared
Root MSE

=
36375
= 5170.28
= 0.0000
= 0.1245
= 0.1244
= 6.4e+05

-----------------------------------------------------------------------------sal |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------esc |
63543.95
883.7253
71.90
0.000
61811.82
65276.08
_cons | -210733.3
10171.36
-20.72
0.000
-230669.5
-190797.2
------------------------------------------------------------------------------

Limitacin: por cada ao adicional de


educacin un hombre aumenta su salario
en $62.439.
Forma logartmica doble (log-log)
ln(W)= 0+1ln(Educ)+

Coeficiente se interpreta como una elasticidad:


qu variacin porcentual experimenta la
variable Y ante un cambio porcentual en X
Veamos un ejemplo

. reg lsal lesc


Source |
SS
df
MS
-------------+-----------------------------Model | 3916.45817
1 3916.45817
Residual | 16784.1046 35992 .466328757
-------------+-----------------------------Total | 20700.5628 35993 .575127463

Number of obs
F( 1, 35992)
Prob > F
R-squared
Adj R-squared
Root MSE

=
35994
= 8398.49
= 0.0000
= 0.1892
= 0.1892
= .68288

-----------------------------------------------------------------------------lsal |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lesc |
.7842882
.0085581
91.64
0.000
.7675141
.8010622
_cons |
10.91641
.0202144
540.03
0.000
10.87679
10.95603
------------------------------------------------------------------------------

Interpretacin: Cuando los aos de educacin aumentan en un 1%, el salario aumenta en un


0.78%. Si el coeficiente fuera 2.5: un aumento de un 1% en los aos de educacin aumenta el
salario en 2.5%

Forma semi-logartmica
ln(W)= 0+1 Educ+
Interpretacin aproximada coeficiente: variacin
porcentual en la variable Y ante un cambio en una
unidad en X.
Se conoce como semi-elasticidad.
Veamos un ejemplo.

. reg lsal esc


Source |
SS
df
MS
-------------+-----------------------------Model | 5383.94586
1 5383.94586
Residual | 15595.7482 36373 .428772668
-------------+-----------------------------Total | 20979.6941 36374 .576777206

Number of obs
F( 1, 36373)
Prob > F
R-squared
Adj R-squared
Root MSE

=
36375
=12556.64
= 0.0000
= 0.2566
= 0.2566
= .65481

-----------------------------------------------------------------------------lsal |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------esc |
.1016544
.0009072
112.06
0.000
.0998763
.1034325
_cons |
11.62769
.0104412 1113.63
0.000
11.60723
11.64816
------------------------------------------------------------------------------

Interpretacin: Un ao adicional de educacin aumenta el salario mensual en 10,1%


Esto en realidad es una aproximacin (efecto exacto es 10,6%
La frmula para evaluar el cambio en el salario mensual cuando la educacin aumenta en un ao est
dada por

% y 100exp( 1x) 1
^

Por qu usamos logaritmos?


Reducimos el rango de variacin de la variable
dependiente => menor influencia valores
extremos
Flexibilizacin de forma funcional
Ej es demasiado simplista pensar que un ao de
educacin aumenta el salario horario en 500 pesos, pero
tal vez resulta ms plausible postular que un ao
adicional de educacin aumenta el salario en un cierto %

Flexibilizacin del modelo lineal


Uso de logaritmos
Formas cuadrticas

Cambios de escala
Variables ficticias: variables explicativas binarias
Interacciones entre variables continuas-binarias y entre
variables binarias

Bondad de ajuste y seleccin de los regresores.

Prediccin y anlisis de residuales.

10

Ejemplo
ln W= 0+1Educ+2Educ2+

Lo importante es recordar que para encontrar el


efecto de Educ en W tengo que considerar ambas
pendientes.
En particular:

y 0 1 Educ 2 Educ 2
y 2 Educ Educ

Lo que en definitiva indica esta


frmula es que el efecto de Educ en W
no es lineal.
Depende del valor de Educ.
Si Educ=0, 1 es el efecto de pasar de
educ=0 a educ=1.
Para otros valores de Educ debemos tener en
cuenta el segundo trmino

1 + 22
Que no es constante, sino que depende de Educ

Estimemos el modelo de salarios con el


trmino cuadrtico

. reg lsal esc esc2


Source |
SS
df
MS
-------------+-----------------------------Model | 6135.36507
2 3067.68253
Residual |
14844.329 36372
.40812518
-------------+-----------------------------Total | 20979.6941 36374 .576777206

Number of obs
F( 2, 36372)
Prob > F
R-squared
Adj R-squared
Root MSE

=
36375
= 7516.52
= 0.0000
= 0.2924
= 0.2924
= .63885

-----------------------------------------------------------------------------lsal |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------esc | -.0439116
.003506
-12.52
0.000
-.0507835
-.0370397
esc2 |
.0070778
.000165
42.91
0.000
.0067545
.0074011
_cons |
12.27233
.0181514
676.11
0.000
12.23675
12.30791
------------------------------------------------------------------------------

Datos CASEN 2011

15
14

Linear prediction

13
12
0

10
aos de escolaridad

15

20

14

16
14
12
10
0

10
aos de escolaridad
Linear prediction

15

20

lsal

15

Podramos incluso agregar un trmino al


cubo
. reg lsal esc esc2 esc3
Source |
SS
df
MS
-------------+-----------------------------Model |
6184.8513
3
2061.6171
Residual | 14794.8428 36371 .406775805
-------------+-----------------------------Total | 20979.6941 36374 .576777206

Number of obs
F( 3, 36371)
Prob > F
R-squared
Adj R-squared
Root MSE

=
36375
= 5068.19
= 0.0000
= 0.2948
= 0.2947
= .63779

-----------------------------------------------------------------------------lsal |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------esc |
.0435572
.0086684
5.02
0.000
.026567
.0605475
esc2 | -.0031179
.0009389
-3.32
0.001
-.0049582
-.0012775
esc3 |
.0003388
.0000307
11.03
0.000
.0002786
.0003991
_cons |
12.08448
.0248685
485.94
0.000
12.03574
12.13323
------------------------------------------------------------------------------

Datos CASEN 2011

15
14
13
12
0

10
aos de escolaridad

Linear prediction
Yhat Modelo lineal

15

20

Yhat Modelo Cuadrado

Flexibilizacin del modelo lineal


Uso de logaritmos

Formas cuadrticas
Cambios de escala
Variables ficticias: variables explicativas binarias

Interacciones entre variables continuas-binarias y entre variables


binarias
Variables dependientes binarias

Bondad de ajuste y seleccin de los regresores.

Prediccin y anlisis de residuales.

18

Escalando datos. Ya vimos todas estas opciones


1. En el modelo de salarios, quiero medir los salarios en
miles de pesos. Cambia la escala de la variable
dependiente = todo queda escalado por el factor de
escala usado
2. En un modelo en el que tanto la variable dependiente
como la independiente estn medidas en $$, quiero
pasar a medirlas en miles de pesos = No cambia nada,
excepto la constante y sumas explicadas, residuales
3. En el modelo de salarios, qu pasa si en vez de poner
como variable explicativa los aos de escolaridad,
ponemos esta misma variable en desviacin con
respecto a su media => cambia la ordenada al origen

Flexibilizacin del modelo lineal


Uso de logaritmos

Formas cuadrticas
Cambios de escala
Variables ficticias: variables explicativas binarias

Interacciones entre variables continuas-binarias y entre variables


binarias
Variables dependientes binarias

Bondad de ajuste y seleccin de los regresores.

Prediccin y anlisis de residuales.

20

Variable dummy o ficticia


Ejemplos
variable asume valor uno si el individuo es mujer, cero en
cualquier otro caso
variable asume valor uno si el individuo tiene estudios
universitarios, cero en cualquier otro caso
variable asume valor uno si el individuo est afiliado a un
sindicato, cero en cualquier otro caso

Para qu las usamos?

Flexibilizar la forma funcional


Ej en la ecuacin de salarios quiero reflejar que en ciertas
circunstancias las mujeres reciben un pago inferior a los
hombres an cuando tengan la misma experiencia laboral y/o
nivel educacional
Veamos algunos ejemplos y su interpretacin

. reg lsal esc mujer


Source |
SS
df
MS
-------------+-----------------------------Model | 11474.1094
2 5737.05472
Residual |
27642.788 60705 .455362622
-------------+-----------------------------Total | 39116.8974 60707 .644355633

Number of obs
F( 2, 60705)
Prob > F
R-squared
Adj R-squared
Root MSE

=
60708
=12598.87
= 0.0000
= 0.2933
= 0.2933
= .67481

-----------------------------------------------------------------------------lsal |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------esc |
.1061411
.0007249
146.43
0.000
.1047204
.1075618
mujer | -.4229015
.0056155
-75.31
0.000
-.4339079
-.4118951
_cons |
11.57892
.0086369 1340.63
0.000
11.562
11.59585
------------------------------------------------------------------------------

Modelo:
lnW=0+1Ed+2Sexo+
Aproximadamente 2 mide la diferencia porcentual entre el salario predicho para hombres y
mujeres
Especficamente indica que las mujeres ganan mensualmente un 42% menos que los hombres
(clculo exacto: 34%)

% y 100exp( ) 1
^

. reg sal esc mujer


Source |
SS
df
MS
-------------+-----------------------------Model | 2.9424e+15
2 1.4712e+15
Residual | 1.8918e+16 60705 3.1164e+11
-------------+-----------------------------Total | 2.1861e+16 60707 3.6010e+11

Number of obs
F( 2, 60705)
Prob > F
R-squared
Adj R-squared
Root MSE

=
60708
= 4720.80
= 0.0000
= 0.1346
= 0.1346
= 5.6e+05

-----------------------------------------------------------------------------sal |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------esc |
55573.25
599.6599
92.67
0.000
54397.91
56748.58
mujer | -177124.5
4645.571
-38.13
0.000
-186229.8
-168019.1
_cons | -124094.9
7145.121
-17.37
0.000
-138099.4
-110090.4
------------------------------------------------------------------------------

Modelo:
W=0+1Ed+2Sexo+
Aproximadamente 2 mide la diferencia en el salario predicho en $ entre
hombres y mujeres. Especficamente indica que las mujeres ganan
mensualmente $177.124 menos que los hombres.

1000000

500000
-500000

10
aos de escolaridad
Mujer

15
Hombre

Modelo en niveles

20

1000000

500000
-500000

10
aos de escolaridad
Mujer

15
Hombre

Modelo en niveles

20

Variable dummy o ficticia


En el ejemplo, los hombres son la categora base y
entones el estimador de 0 nos da el salario promedio
predicho para los hombres cuando esc es cero (35776.54)
2 da la diferencia entre el salario promedio del los
hombres y el de las mujeres, por lo que entonces el
salario promedio predicho para las mujeres es igual a 0
+ 2 = -119053.77

No tienen mucho sentido estas constantes, claramente en


los datos no hay salarios negativos=> estamos
extrapolando la recta. Podramos predecir para educ=12

. reg sal esc_12 mujer


Source |
SS
df
MS
-------------+-----------------------------Model | 2.9424e+15
2 1.4712e+15
Residual | 1.8918e+16 60705 3.1164e+11
-------------+-----------------------------Total | 2.1861e+16 60707 3.6010e+11

Number of obs
F( 2, 60705)
Prob > F
R-squared
Adj R-squared
Root MSE

=
60708
= 4720.80
= 0.0000
= 0.1346
= 0.1346
= 5.6e+05

-----------------------------------------------------------------------------sal |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------esc_12 |
55573.25
599.6599
92.67
0.000
54397.91
56748.58
mujer | -177124.5
4645.571
-38.13
0.000
-186229.8
-168019.1
_cons |
542784.1
3004.501
180.66
0.000
536895.2
548672.9
------------------------------------------------------------------------------

Otra manera de especificar el modelo


W=1Ed+1Mujer+ 2Hombre+
donde Mujer=1 si es mujer, 0 en cualquier otro caso

Hombre=1 si es hombre, 0 en cualquier otro caso


. reg sal esc_12 mujer hombre, hascons
Source |
SS
df
MS
-------------+-----------------------------Model | 2.9424e+15
2 1.4712e+15
Residual | 1.8918e+16 60705 3.1164e+11
-------------+-----------------------------Total | 2.1861e+16 60707 3.6010e+11

Number of obs
F( 2, 60705)
Prob > F
R-squared
Adj R-squared
Root MSE

=
60708
= 4720.80
= 0.0000
= 0.1346
= 0.1346
= 5.6e+05

-----------------------------------------------------------------------------sal |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------esc_12 |
55573.25
599.6599
92.67
0.000
54397.91
56748.58
mujer |
365659.6
3585.735
101.98
0.000
358631.6
372687.7
hombre |
542784.1
3004.501
180.66
0.000
536895.2
548672.9
------------------------------------------------------------------------------

Variable dummy o ficticia


El estimador de 2 nos da el salario promedio de
los hombres cuando esc es igual al promedio
1 nos da el salario promedio de las mujeres (lo
que antes era (0+2)
Noten que no podemos poner ambas dummies Y
LA CONSTANTE EL MISMO TIEMPO
Se llama trampa de las variables ficticias
Las dos dummies suman uno, entonces tengo una
dependencia lineal perfecta entre la constante y las
dummies

Distintas maneras de especificar el modelo


W= 0 +1Ed+2Mujer+
donde Mujer=1 si es mujer, 0 en cualquier otro caso
W= 0 + 1Ed+ 2Hombre+
donde Hombre=1 si es hombre, 0 en cualquier otro caso
En este caso 1= 1; 2=-2; 0 = 0 +2;
Lo comprobamos?

Source |
SS
df
MS
-------------+-----------------------------Model | 11474.1094
2 5737.05472
Residual |
27642.788 60705 .455362622
-------------+-----------------------------Total | 39116.8974 60707 .644355633

Number of obs
F( 2, 60705)
Prob > F
R-squared
Adj R-squared
Root MSE

=
60708
=12598.87
= 0.0000
= 0.2933
= 0.2933
= .67481

-----------------------------------------------------------------------------lnsal |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------esc |
.1061411
.0007249
146.43
0.000
.1047204
.1075618
mujer | -.4229015
.0056155
-75.31
0.000
-.4339079
-.4118951
_cons |
11.57892
.0086369 1340.63
0.000
11.562
11.59585
Source |
SS
df
MS
-------------+-----------------------------Model | 11474.1094
2 5737.05472
Residual |
27642.788 60705 .455362622
-------------+-----------------------------Total | 39116.8974 60707 .644355633

Number of obs
F( 2, 60705)
Prob > F
R-squared
Adj R-squared
Root MSE

=
60708
=12598.87
= 0.0000
= 0.2933
= 0.2933
= .67481

-----------------------------------------------------------------------------lnsal |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------esc |
.1061411
.0007249
146.43
0.000
.1047204
.1075618
hombre |
.4229015
.0056155
75.31
0.000
.4118951
.4339079
_cons |
11.15602
.0094734 1177.62
0.000
11.13746
11.17459
. disp 11.57892-.4229015
11.156019

Otra opcin
W= 1Ed+ 2Mujer+3Hombre+
donde Mujer=1 si es mujer, 0 en cualquier otro caso
En este caso 1= 1=1;
2= 2-3; 2= 3-2;
3 = 0 ; 3 = 0 +2;
Lo comprobamos nuevamente? Corriendo esta regresin, vemos
que obtenemos directamente el salario esperado para las
mujeres y para los hombres. Si queremos hacer la diferencia
tenemos que restar estos dos coeficientes.

. reg lnsal esc hombre mujer, hascons


Source |
SS
df
MS
-------------+-----------------------------Model | 11474.1094
2 5737.05472
Residual |
27642.788 60705 .455362622
-------------+-----------------------------Total | 39116.8974 60707 .644355633

Number of obs
F( 2, 60705)
Prob > F
R-squared
Adj R-squared
Root MSE

=
60708
=12598.87
= 0.0000
= 0.2933
= 0.2933
= .67481

-----------------------------------------------------------------------------lnsal |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------esc |
.1061411
.0007249
146.43
0.000
.1047204
.1075618
hombre |
11.57892
.0086369 1340.63
0.000
11.562
11.59585
mujer |
11.15602
.0094734 1177.62
0.000
11.13746
11.17459
------------------------------------------------------------------------------

Si corremos los modelos


W= 0 +1Ed+2Mujer+
W= 0 + 1Ed+ 2Hombre+
Para evaluar si hay diferencia entre hombres y mujeres,
sencillamente hacemos un test t sobre el coeficiente de la
dummy
Si estimamos el modelo W= 1Ed+ 2Mujer+3Hombre+
Tenemos que hacer el test para la diferencia entre 2 y 3
Podemos usar un test t (diferencia entre dos coeficientes), o usar
un test F Si le pedimos a Stata que lo haga por nosotros, nos
hace un test F.

. test hombre=mujer
( 1)

hombre - mujer = 0
F(

1, 60705) = 5671.56
Prob > F =
0.0000

. disp 5671.56^(1/2)
75.30976

El test F se plantea en funcin de la diferencia de residuos del


modelo restringido versus el modelo sin restringir o en funcin de
la diferencia de los R-cuadrado del modelo restringido y sin
restringir = > es el mismo test como ya lo vimos

Variable dummy o ficticia


Este tipo de variables tambin puede usarse con
mltiples categoras
Ej: tomar como categora base a individuos sin
educacin o con bsica incompleta; luego definimos
tres dummies
D1=1 si el individuo tiene BC o MI, 0 en otro caso

D2=1 si el individuo tiene MC o SI, 0 en otro caso


D3=1 si el individuo tiene SC, 0 en otro caso

. reg sal D1 D2 D3
Source |
SS
df
MS
-------------+-----------------------------Model | 3.0663e+15
3 1.0221e+15
Residual | 1.8795e+16 60704 3.0961e+11
-------------+-----------------------------Total | 2.1861e+16 60707 3.6010e+11

Number of obs
F( 3, 60704)
Prob > F
R-squared
Adj R-squared
Root MSE

=
60708
= 3301.23
= 0.0000
= 0.1403
= 0.1402
= 5.6e+05

-----------------------------------------------------------------------------sal |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------D1 |
52990.13
7462.601
7.10
0.000
38363.41
67616.85
D2 |
195448
6789.003
28.79
0.000
182141.5
208754.4
D3 |
802231.2
9102.069
88.14
0.000
784391.1
820071.3
_cons |
229004.3
5979.268
38.30
0.000
217284.9
240723.7
------------------------------------------------------------------------------

Un individuo (base) que tiene menos de bsica completa, gana en promedio


$229.004
Un individuo que tiene BC pero MI, gana 52.990 pesos ms que ste.
Un individuo que tiene MC pero SI gana 195.448 pesos ms que el base.
Un individuo que tiene SC gana 802.231ms que el individuo base.

Flexibilizacin del modelo lineal


Uso de logaritmos

Formas cuadrticas
Cambios de escala
Variables ficticias

Interacciones entre variables continuas-binarias y entre variables


binarias
Variables dependientes binarias

Bondad de ajuste y seleccin de los regresores.

Prediccin y anlisis de residuales.

38

Variable dummy o ficticia


Interactuada con variable continua
El coeficiente de dicha variable me dice si la variable
continua tiene o no tiene un efecto diferente para la
categora de individuos con D=1 (si la educacin tiene un
efecto distinto en los salarios para las mujeres)
Modelo en niveles: me dice cuntos pesos ms (o menos)
por cada ao de educacin una mujer recibe.
Modelo en logs, me dice cmo cambia la tasa de retorno
(cambio % en salario) para las mujeres versus los
hombres.
Ver pizarra

. reg sal esc_12 mujer interac


Source |
SS
df
MS
-------------+-----------------------------Model | 3.0254e+15
3 1.0085e+15
Residual | 1.8835e+16 60704 3.1028e+11
-------------+-----------------------------Total | 2.1861e+16 60707 3.6010e+11

Number of obs
F( 3, 60704)
Prob > F
R-squared
Adj R-squared
Root MSE

=
60708
= 3250.18
= 0.0000
= 0.1384
= 0.1384
= 5.6e+05

-----------------------------------------------------------------------------sal |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------esc_12 |
63543.95
771.7105
82.34
0.000
62031.4
65056.51
mujer | -190615.3
4708.23
-40.49
0.000
-199843.5
-181387.2
interac | -19985.33
1221.973
-16.35
0.000
-22380.4
-17590.25
_cons |
551794.1
3048.125
181.03
0.000
545819.8
557768.4
------------------------------------------------------------------------------

. reg lsal esc_12 mujer interac


Source |
SS
df
MS
-------------+-----------------------------Model | 11500.4069
3 3833.46897
Residual | 27616.4905 60704 .454936915
-------------+-----------------------------Total | 39116.8974 60707 .644355633

Number of obs
F( 3, 60704)
Prob > F
R-squared
Adj R-squared
Root MSE

=
60708
= 8426.37
= 0.0000
= 0.2940
= 0.2940
= .67449

-----------------------------------------------------------------------------lsal |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------esc_12 |
.1016544
.0009344
108.79
0.000
.0998229
.1034859
mujer | -.4153075
.005701
-72.85
0.000
-.4264816
-.4041335
interac |
.0112497
.0014796
7.60
0.000
.0083496
.0141498
_cons |
12.84755
.0036909 3480.89
0.000
12.84031
12.85478
------------------------------------------------------------------------------

Variable dummy o ficticia interactuada con


otra variable dummy
El coeficiente de dicha variable me dice si
el pertenecer a ambas categoras (ser
mujer y vivir en R.M.) tiene un efecto
diferencial sobre el salario
Ej. Las mujeres tienen un salario menor a los
hombres, pero para las mujeres que pertenecen a la
R.M. esta brecha es menor
Ver desarrollo en pizarra

. reg sal esc_12 mujer RM mujer_RM


Source |
SS
df
MS
-------------+-----------------------------Model | 3.0505e+15
4 7.6262e+14
Residual | 1.8810e+16 60703 3.0987e+11
-------------+-----------------------------Total | 2.1861e+16 60707 3.6010e+11

Number of obs
F( 4, 60703)
Prob > F
R-squared
Adj R-squared
Root MSE

=
60708
= 2461.07
= 0.0000
= 0.1395
= 0.1395
= 5.6e+05

-----------------------------------------------------------------------------sal |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------esc_12 |
54377
601.3797
90.42
0.000
53198.29
55555.7
mujer | -170968.6
5049.012
-33.86
0.000
-180864.7
-161072.6
RM |
139748.1
8458.006
16.52
0.000
123170.4
156325.8
mujer_RM | -56381.59
12681.38
-4.45
0.000
-81237.14
-31526.04
_cons |
521922.8
3244.053
160.89
0.000
515564.5
528281.2
------------------------------------------------------------------------------

43

1000000 1500000

500000
-500000

-10

-5

0
esc_12

Hombre y no en RM
Hombre y en RM

10

Mujer y no en RM
Mujer y en RM

44

Flexibilizacin del modelo lineal


Uso de logaritmos

Formas cuadrticas
Cambios de escala
Variables ficticias

Interacciones entre variables continuas-binarias y entre variables


binarias
Variables dependientes binarias

Bondad de ajuste y seleccin de los regresores.

Prediccin y anlisis de residuales.

45

Ejemplo:
desempleado =0 + 1educ + 2edad + 3Mujer+u
La variable dependiente desempleado toma el
valor 1 si la persona est desempleada y el valor
0 si la persona est trabajando.
Cmo interpretamos los coeficientes de este
modelo?

Todo el resto constante, con cada ao adicional de educacin la


probabilidad de estar desempleado cambia en un 1%.

46

Estimemos este modelo a partir de los datos de


CASEN.
. reg des esc mujer edad
Source |
SS
df
MS
-------------+-----------------------------Model | 174.178341
3 58.0594469
Residual | 5652.44413 85378 .066204926
-------------+-----------------------------Total | 5826.62247 85381 .068242612

Number of obs
F( 3, 85378)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

85382
876.97
0.0000
0.0299
0.0299
.2573

-----------------------------------------------------------------------------des |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------esc | -.0030876
.0002431
-12.70
0.000
-.003564
-.0026112
mujer |
.0270465
.0018089
14.95
0.000
.023501
.0305919
edad | -.0032824
.0000677
-48.51
0.000
-.003415
-.0031498
_cons |
.2299453
.0045037
51.06
0.000
.2211181
.2387724
------------------------------------------------------------------------------

47

Ingeniera Comercial

También podría gustarte