Está en la página 1de 28

Econometría

Unidad 4. Extensiones al Modelo Lineal General

Semana 7. Presentación 5. Variables explicativas cuadráticas

Fernando Gonzales Fernández


VARIABLES EXPLICATIVAS CUADRÁTICAS

Y =  1 +  2 X 2 +  3 X 22 + u

Ahora consideraremos los modelos con variables explicativas cuadráticas del tipo que se muestra. Tal
modelo puede ser ajustado usando MCO sin ninguna modificación.

1
VARIABLES EXPLICATIVAS CUADRÁTICAS

Y =  1 +  2 X 2 +  3 X 22 + u

in embargo, no se puede aplicar la interpretación habitual de un parámetro, que representa el efecto de


un cambio de unidad en su variable asociada, manteniendo constantes todas las demás variables. No es
posible que X2 cambie sin que X22 también cambie.
2
VARIABLES EXPLICATIVAS CUADRÁTICAS

Y =  1 +  2 X 2 +  3 X 22 + u

dY
=  2 + 2 3 X 2
dX 2

Diferenciando la ecuación con respecto a X2, se obtiene el cambio en Y por unidad de cambio en X2. Por
lo tanto, el impacto de un cambio de unidad en X2 sobre Y, ( 2 + 2 3X2), es una función de X2.

3
VARIABLES EXPLICATIVAS CUADRÁTICAS

Y =  1 +  2 X 2 +  3 X 22 + u

dY
=  2 + 2 3 X 2
dX 2

Esto significa que  2 tiene una interpretación diferente a la del modelo lineal ordinario donde es el efecto
no cualificado de un cambio de unidad en X2 sobre Y.

4
VARIABLES EXPLICATIVAS CUADRÁTICAS

Y =  1 +  2 X 2 +  3 X 22 + u

dY
=  2 + 2 3 X 2
dX 2

En este modelo,  2 debe interpretarse como el efecto de un cambio de una unidad de X2 sobre Y para el
caso especial en que X2 = 0. Para los valores no nulos de X2, el efecto marginal será diferente.

5
VARIABLES EXPLICATIVAS CUADRÁTICAS

Y =  1 +  2 X 2 +  3 X 22 + u

dY
=  2 + 2 3 X 2
dX 2

Y =  1 + ( 2 +  3 X 2 ) X 2 + u

 3 también tiene una interpretación especial. Si reescribimos el modelo como se muestra,  3 puede ser
interpretado como la tasa de cambio del coeficiente de X2, por unidad de cambio en X2.

6
VARIABLES EXPLICATIVAS CUADRÁTICAS

Y =  1 +  2 X 2 +  3 X 22 + u

dY
=  2 + 2 3 X 2
dX 2

Y =  1 + ( 2 +  3 X 2 ) X 2 + u

Sólo  1 tiene una interpretación convencional. Como es habitual, es el valor de Y (aparte del componente
aleatorio) cuando X2 = 0.

7
VARIABLES EXPLICATIVAS CUADRÁTICAS

Y =  1 +  2 X 2 +  3 X 22 + u

dY
=  2 + 2 3 X 2
dX 2

Y =  1 + ( 2 +  3 X 2 ) X 2 + u

Hay otro problema. Sabemos que la estimación de la intercepción puede no tener sentido si X2 = 0 está
fuera del rango de datos. Si X2 = 0 está fuera del rango de datos, es el mismo tipo de distorsión puede
ocurrir con la estimación de  2.
8
VARIABLES EXPLICATIVAS CUADRÁTICAS

. gen SSQ = S*S


. reg EARNINGS S SSQ
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 2, 497) = 23.44
Model | 6061.38243 2 3030.69122 Prob > F = 0.0000
Residual | 64267.5838 497 129.311034 R-squared = 0.0862
-----------+------------------------------ Adj R-squared = 0.0825
Total | 70328.9662 499 140.939812 Root MSE = 11.372
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | .1910651 1.785822 0.11 0.915 -3.317626 3.699757
SSQ | .0366817 .0606266 0.61 0.545 -.0824344 .1557978
_cons | 8.358401 12.86047 0.65 0.516 -16.90919 33.62599
----------------------------------------------------------------------------

Lo ilustraremos con la función de ingresos. La tabla da la salida de una regresión cuadrática de las
remuneraciones en la escolaridad (SSQ se define como el cuadrado de la escolaridad). (Usa la base Data 6)

9
VARIABLES EXPLICATIVAS CUADRÁTICAS

. gen SSQ = S*S


. reg EARNINGS S SSQ
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 2, 497) = 23.44
Model | 6061.38243 2 3030.69122 Prob > F = 0.0000
Residual | 64267.5838 497 129.311034 R-squared = 0.0862
-----------+------------------------------ Adj R-squared = 0.0825
Total | 70328.9662 499 140.939812 Root MSE = 11.372
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | .1910651 1.785822 0.11 0.915 -3.317626 3.699757
SSQ | .0366817 .0606266 0.61 0.545 -.0824344 .1557978
_cons | 8.358401 12.86047 0.65 0.516 -16.90919 33.62599
----------------------------------------------------------------------------

El coeficiente de S implica que, para un individuo sin escolaridad, el impacto de un año de escolaridad
aumenta sus ingresos por hora en 0,19 dólares en promedio.

10
VARIABLES EXPLICATIVAS CUADRÁTICAS

. gen SSQ = S*S


. reg EARNINGS S SSQ
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 2, 497) = 23.44
Model | 6061.38243 2 3030.69122 Prob > F = 0.0000
Residual | 64267.5838 497 129.311034 R-squared = 0.0862
-----------+------------------------------ Adj R-squared = 0.0825
Total | 70328.9662 499 140.939812 Root MSE = 11.372
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | .1910651 1.785822 0.11 0.915 -3.317626 3.699757
SSQ | .0366817 .0606266 0.61 0.545 -.0824344 .1557978
_cons | 8.358401 12.86047 0.65 0.516 -16.90919 33.62599
----------------------------------------------------------------------------

También es dudoso que la interceptación tenga alguna interpretación sensata. Literalmente, implica que
un individuo sin escolaridad tendría unos ingresos por hora de 8,36 dólares, lo que parece inverosímil.

11
VARIABLES EXPLICATIVAS CUADRÁTICAS
------------------------
120 EARNINGS | Coef.
-----------+------------
S | .1910651
100 SSQ | .0366817
_cons | 8.358401
------------------------
Hourly earnings ($)

80

60

40

20 quadratic

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Years of schooling (highest grade completed)

La relación cuadrática se ilustra en la figura. Sobre el rango de los datos reales, se ajusta a las
observaciones tolerablemente bien. El ajuste no es dramáticamente diferente de las especificaciones
lineales y semilogarítmicas.
12
VARIABLES EXPLICATIVAS CUADRÁTICAS
------------------------
120 EARNINGS | Coef.
-----------+------------
S | .1910651
100 SSQ | .0366817
_cons | 8.358401
------------------------
Hourly earnings ($)

80

60

40

20 quadratic

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Years of schooling (highest grade completed)

La mayoría de los estudios de ecuaciones de salarios prefieren la especificación semilogarítmica. El


coeficiente de pendiente tiene una interpretación simple y la especificación no da lugar a predicciones sin
sentido fuera del rango de datos.
13
VARIABLES EXPLICATIVAS CUADRÁTICAS

Average annual percentage growth rates


Employment GDP Employment GDP

Australia 2.57 3.52 Korea 1.11 4.48


Austria 1.64 2.66 Luxembourg 1.34 4.55
Belgium 1.06 2.27 Mexico 1.88 3.36
Canada 1.90 2.57 Netherlands 0.51 2.37
Czech Republic 0.79 5.62 New Zealand 2.67 3.41
Denmark 0.58 2.02 Norway 1.36 2.49
Estonia 2.28 8.10 Poland 2.05 5.16
Finland 0.98 3.75 Portugal 0.13 1.04
France 0.69 2.00 Slovak Republic 2.08 7.04
Germany 0.84 1.67 Slovenia 1.60 4.82
Greece 1.55 4.32 Sweden 0.83 3.47
Hungary 0.28 3.31 Switzerland 0.90 2.54
Iceland 2.49 5.62 Turkey 1.30 6.90
Israel 3.29 4.79 United Kingdom 0.92 3.31
Italy 0.89 1.29 United States 1.36 2.88
Japan 0.31 1.85

Los datos sobre la tasa de crecimiento del empleo, e, y la tasa de crecimiento del PIB, g, de 25 países de la
OCDE constituyen otro ejemplo en el que se podría considerar el uso de una función cuadrática.

14
VARIABLES EXPLICATIVAS CUADRÁTICAS

. gen gsq = g*g


. reg e g gsq
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 31
-----------+------------------------------ F( 2, 28) = 7.03
Model | 6.05131556 2 3.02565778 Prob > F = 0.0034
Residual | 12.0579495 28 .430641052 R-squared = 0.3342
-----------+------------------------------ Adj R-squared = 0.2866
Total | 18.109265 30 .603642167 Root MSE = .65623
----------------------------------------------------------------------------
e | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
g | .6616232 .2988805 2.21 0.035 .0493942 1.273852
gsq | -.0490589 .0336736 -1.46 0.156 -.1180362 .0199185
_cons | -.2576489 .5845635 -0.44 0.663 -1.455073 .939775
----------------------------------------------------------------------------

Se muestra la salida de una regresión cuadrática. gsq se ha definido como el cuadrado de g.

15
VARIABLES EXPLICATIVAS CUADRÁTICAS

quadratic
Employment growth rate

hyperbolic
1

0 ------------------------
0 1 2 3 4 5 6 7 e |8 Coef.
9
-----------+------------
g | .6616232
-1
gsq | -.0490589
_cons | -.2576489
------------------------
-2

GDP growth rate

La especificación cuadrática parece ser una mejora de la función hiperbólica ajustada en una presentación
anterior. Es más satisfactoria que esta última para los valores bajos de g, en el sentido de que no produce
valores negativos inverosímiles de e.
16
VARIABLES EXPLICATIVAS CUADRÁTICAS

quadratic
Employment growth rate

hyperbolic
1

0 ------------------------
0 1 2 3 4 5 6 7 e |8 Coef.
9
-----------+------------
g | .6616232
-1
gsq | -.0490589
_cons | -.2576489
------------------------
-2

GDP growth rate

El único defecto es que predice que el valor ajustado de e empieza a caer cuando g excede de 7.

17
VARIABLES EXPLICATIVAS CUADRÁTICAS

3
quartic
Employment growth rate

quadratic

0
0 1 2 3 4 5 6 7 8 9

cubic

-1
GDP growth rate

¿Por qué detenerse en una cuadrática? ¿Por qué no considerar un cúbico, o un cuártico, o un polinomio
de orden aún más alto? Normalmente hay varias buenas razones para no hacerlo.

18
VARIABLES EXPLICATIVAS CUADRÁTICAS

3
quartic
Employment growth rate

quadratic

0
0 1 2 3 4 5 6 7 8 9

cubic

-1
GDP growth rate

Los efectos marginales decrecientes son estándar en la teoría económica, justificando las especificaciones
cuadráticas, al menos como una aproximación, pero la teoría económica rara vez sugiere que una relación
pueda ser representada sensatamente por un polinomio cúbico o de orden superior.
19
VARIABLES EXPLICATIVAS CUADRÁTICAS

3
quartic
Employment growth rate

quadratic

0
0 1 2 3 4 5 6 7 8 9

cubic

-1
GDP growth rate

La segunda razón se deriva de la primera. Habrá una mejora en el ajuste a medida que se añadan
términos de orden superior, pero como estos términos no están teóricamente justificados, la mejora será
específica de la muestra.
20
VARIABLES EXPLICATIVAS CUADRÁTICAS

3
quartic
Employment growth rate

quadratic

0
0 1 2 3 4 5 6 7 8 9

cubic

-1
GDP growth rate

En tercer lugar, a menos que la muestra sea muy pequeña, es poco probable que los ajustes de los
polinomios de orden superior sean muy diferentes de los de un cuadrante en la parte principal del
intervalo de datos.
21
VARIABLES EXPLICATIVAS CUADRÁTICAS

3
quartic
Employment growth rate

quadratic

0
0 1 2 3 4 5 6 7 8 9

cubic

-1
GDP growth rate

Estos puntos se ilustran en la figura, que muestra regresiones cúbicas y cuárticas con la regresión
cuadrática. En el rango principal de datos, de g = 1,5 a g = 5, los ajustes del cúbico y del cuártico son muy
similares a los de la cuadrática.
22
VARIABLES EXPLICATIVAS CUADRÁTICAS

3
quartic
Employment growth rate

quadratic

0
0 1 2 3 4 5 6 7 8 9

cubic

-1
GDP growth rate

R2 para la especificación cuadrática es 0,334. Para el cúbico y el cuartico es de 0,345 y 0,355, mejoras
relativamente pequeñas.

23
VARIABLES EXPLICATIVAS CUADRÁTICAS

3
quartic
Employment growth rate

quadratic

0
0 1 2 3 4 5 6 7 8 9

cubic

-1
GDP growth rate

Además, tanto la curva cúbica como la cuártica exhiben características inverosímiles.

24
VARIABLES EXPLICATIVAS CUADRÁTICAS

3
quartic
Employment growth rate

quadratic

0
0 1 2 3 4 5 6 7 8 9

cubic

-1
GDP growth rate

A medida que g aumenta, la pendiente del cúbico primero disminuye y luego aumenta. No hay una
explicación razonable. La curva del cuartico en realidad disminuye para los valores de g de 5 a 7, y luego
exhibe un extraño giro hacia arriba en su extremo.
25
VARIABLES EXPLICATIVAS CUADRÁTICAS

3
quartic
Employment growth rate

quadratic

0
0 1 2 3 4 5 6 7 8 9

cubic

-1
GDP growth rate

La lectura 11 muestra otras aplicaciones de esta temática.

25
Créditos
Fernando Gonzales Fernández
Original. Christopher Dougherty (2016).

También podría gustarte