Está en la página 1de 19

Modelos Econométricos Grado en Marketing

HOJA 3 DE PROBLEMAS - SOLUCIONES


VARIABLES FICTICIAS Y HETEROSCEDASTICIDAD

Ejercicios Resueltos

1. Se desea estimar el siguiente modelo Pi = β0 + β1R i + εi donde Pi y Ri


representan, respectivamente, el precio medio por m2 de la vivienda y la renta per
cápita en el municipio i en el año 2011, y donde εi cumple los supuestos clásicos.

a) Se sospecha que el precio medio de la vivienda también puede depender del


tipo de municipio donde está ubicada. En concreto, de si el municipio es o
no un municipio costero de carácter turístico. Plantee 2 posibles modelos
alternativos que recojan este hecho, e interprete los coeficientes de ambos
modelos. (Ambos modelos deben permitir que tanto la constante de la
ecuación, como la pendiente varíen en función del tipo de municipio donde
está situada la vivienda).

Los dos posibles modelos alternativos son:

M1: Pi = β0 + λ0costai + β1R i + λ1R i costai + εi

M2: Pi = βCcostai + βI interiori + β1C R i costai + β1I R iinteriori + εi


0 0

Modelo M1:

β0 ordenada en el origen del modelo de los municipios sin costa.


β0 +λ 0 : ordenada en el origen del modelo de los municipios con costa.
λ 0 : parte de la diferencia del precio medio por m 2 de una vivienda que es
independiente de la renta per capita del municipio.
β1 +λ1: variación del precio medio de una vivienda en la costa ante un cambio
unitario en la renta per capita en el municipio.
β1: variación del precio medio de una vivienda en el interior ante un cambio
unitario en la renta per capita del municipio.
λ1: diferencia de la variación del precio medio de una vivienda en la costa cuando
la renta per capita varía en una unidad respecto de una vivienda en el interior.

Modelo M2:

βC0 : ordenada en el origen del modelo de los municipios costeros.


β I0 : ordenada en el origen del modelo de los municipios de interior.
βC1 : variación del precio medio de una vivienda de un municipio de costa ante un
cambio unitario en la renta per capita de dicho municipio en 2011.

Material elaborado por S. Álvarez,, M. Camacho, M. González, F. Martínez y A. Quesada, basado en parte en las referencias bibliográficas de la guía docente.
Su reproducción, por cualquier medio o uso, sin citar la fuente, están prohibidas. 1
Modelos Econométricos Grado en Marketing

βI1 : variación del precio medio de una vivienda de un municipio de interior ante un
cambio unitario en la renta per capita de dicho municipio en 2011.

b) Explique y plantee el contraste necesario para saber si el hecho de que la


vivienda esté en un municipio turístico de la costa afecta a su precio
considerando cada uno de los modelos planteados en el apartado a).

Modelo M1:

H 0 : λ 0 =λ1 =0
H1 : H0 falsa

(SCE R − SCE NR )
q
F= ; regla de rechazo F > Fq , N − K ,α ⇒ RH 0
SCE NR
(N − K)
MR: Pi = β0 + β1R i + εi
MNR: Pi = β0 + λ 0costai + β1R i + λ1R i costai + εi

Modelo M2:

H 0 : βC0 = β I0
β1C = β1I
H1 : H0 falsa

(SCE R − SCE NR )
q
F= ; regla de rechazo F > Fq , N − K ,α ⇒ RH 0
SCE NR
(N − K)

MR: Pi = β0 +β1R i + εi
MNR: Pi = βCcostai + βI interiori + β1C R i costai + β1I Riinteriori + εi
0 0

2. Se han especificado dos modelos distintos para explicar el salario de los trabajadores de
una empresa:

M1: log( Sali ) = β0 + β1UNIVi + β2 X i + εi

M2: log( Sali ) = λ1UNIVi + λ 2 NOUNIVi + λ 3 X i + εi

donde Sal es el salario anual, UNIV es una variable ficticia que toma valor 1 si el individuo
tiene estudios universitarios, NOUNIV es una variable ficticia que toma valor 1 si no tiene
estudios universitarios, y X es la experiencia del individuo medida en años.

Material elaborado por S. Álvarez,, M. Camacho, M. González, F. Martínez y A. Quesada, basado en parte en las referencias bibliográficas de la guía docente.
Su reproducción, por cualquier medio o uso, sin citar la fuente, están prohibidas. 2
Modelos Econométricos Grado en Marketing

a) Interprete los coeficientes en cada uno de los modelos ¿Qué relación hay entre los
coeficientes de ambos modelos?

β0 : ordenada en el origen del modelo de los trabajadores sin estudios universitarios.

β0 +β1 : ordenada en el origen del modelo de los trabajadores con estudios universitarios.

β1 ⋅ 100 : diferencia porcentual del salario de un trabajador con estudios universitarios con
respecto de un trabajador sin estudios universitarios con el mismo nivel de experiencia.
Esta diferencia es solo por el hecho de tener estudios universitarios.

β2 ⋅ 100 : variación porcentual estimada en el salario ante un cambio unitario en la


experiencia, cuando la variable UNIV no cambia.

λ1 : ordenada en el origen del modelo de los trabajadores con estudios universitarios.

λ 2 : ordenada en el origen del modelo de los trabajadores sin estudios universitarios.

λ 3 ⋅ 100 : variación porcentual estimada en el salario ante un cambio unitario en la


experiencia, cuando el resto de variables explicativas no cambian.

β0 = λ 2 , β0 +β1 = λ1 ⇒ β1 = λ1 -λ 2 , β2 = λ 3

b) ¿Cómo contrastaría en M1 si la educación influye en la ecuación de salarios?, ¿Y


en M2? Plantee las hipótesis nula y alternativa, y explique detalladamente
cómo llevar a cabo ambos contrastes utilizando el estadístico t.

Modelo M1

H 0 : β1 = 0
H1 : β1 ≠ 0

β̂1
t= ; regla de rechazo t > t N − K ;α/2 ⇒ RH 0
V̂(βˆ 1 )

Modelo M2

 δ

H 0 : λ1 − λ 2 = 0
H1 : λ1 − λ2 ≠ 0

H0 :δ = 0
H1 : δ ≠ 0

Material elaborado por S. Álvarez,, M. Camacho, M. González, F. Martínez y A. Quesada, basado en parte en las referencias bibliográficas de la guía docente.
Su reproducción, por cualquier medio o uso, sin citar la fuente, están prohibidas. 3
Modelos Econométricos Grado en Marketing

δ̂
t= ; regla de rechazo t > t N − K ;α/2 ⇒ RH 0
ˆ
V̂(δ)

En este caso, para calcular el estadístico de contraste hemos de estimar el modelo reparametrizado:

log( Sali ) = δUNIVi + λ 2 (UNIVi + NOUNIVi ) + λ 3 X i + ε i


log( Sali ) = δUNIVi + λ 2 + λ 3 X i + ε i

3. El siguiente modelo de regresión relaciona el logaritmo del gasto en consumo de


los hogares (lgasto), la renta del hogar (renta), y la edad del sustentador principal
(edad). Además se han creado dos variables ficticias, hombre que vale 1 si el
sustentador principal es un hombre (cero en caso contrario) y mujer que vale 1 si el
sustentador principal es una mujer (cero en caso contrario). Sabiendo que se
cumplen los supuestos de Gauss-Markov, el modelo a estimar es:

lgastoi = β0Hhombrei + β0Mmujeri + β1rentai + β2edad i + β3edad i2 + εi

a) Interprete cada uno de los parámetros del modelo ¿Cuál es el efecto de la


edad sobre el gasto?

β 0H : ordenada en el origen del modelo de los hogares cuyo sustentador principal es hombre.

β 0M : ordenada en el origen del modelo de los hogares cuyo sustentador principal es mujer.

β 2 ⋅ 100 : variación porcentual aproximada en el gasto en consumo de los hogares ante un


cambio unitario de la renta del hogar ceteris paribus.

(β2 + 2β3 ⋅ edad ) ⋅ 100 : variación porcentual aproximada en el gasto en consumo de los
hogares ante una variación unitaria de la edad del sustentador principal ceteris paribus. No
es constante, depende de la edad del sustentador principal.

b) Plantee las hipótesis nula y alternativa del contraste de que el gasto es


mayor para los hogares cuyo sustentador principal es un hombre.

δ


H 0 : β0 − β0M = 0
H

H1 : β0H − β0M > 0

H0 :δ = 0
H1 : δ > 0

Material elaborado por S. Álvarez,, M. Camacho, M. González, F. Martínez y A. Quesada, basado en parte en las referencias bibliográficas de la guía docente.
Su reproducción, por cualquier medio o uso, sin citar la fuente, están prohibidas. 4
Modelos Econométricos Grado en Marketing

δ̂
t= ; regla de rechazo t > t N − K ;α ⇒ RH 0
ˆ
V̂(δ)

Para calcular el estadístico de contraste hemos de estimar el modelo reparametrizado:

lg astoi = δ hom brei + β 0M (hom brei + mujeri ) + β1rentai + β 2edad i + β 2edad i2 + ε i


lg astoi = β 0M + δ hom brei + β1rentai + β 2edad i + β 2edad i2 + ε i

4. Se desea estimar el siguiente modelo:


yi = β0 + β1xi + εi ,

donde las variables xi e yi se refieren a los precios de los hoteles y al nivel de


ocupación hotelera para el año pasado de 200 hoteles españoles y donde εi cumple
los supuestos clásicos. Se quiere discriminar entre hoteles de interior y hoteles de la
costa. Para ello creamos las variables FIi que vale 1 si el hotel es de interior y 0 en
otro caso, y FCi que vale 1 si el hotel es de la costa y 0 en otro caso. Para llevar a
cabo la estimación del modelo anterior se proponen las siguientes alternativas:

Alternativa 1 : yi = α0 + α1 xi + α2 FIi + α3 FCi + εi


Alternativa 2 : yi = δ0 + δ1 xi + δ2 FIi + εi
Alternativa 3 : yi = γ1 xi + γ 2 FIi + γ 3 FCi + εi

a) ¿Cree que hay alguna propuesta incorrecta de cara a la estimación? ¿Por


qué?
La Alternativa 1 es incorrecta porque se incluyen las dos variables ficticias FIi y
FCi y el término constante, lo que da lugar a la trampa de las ficticias
(multicolinealidad perfecta).
b) Se sabe que los coeficientes δ de la alternativa 2 están relacionados con los
coeficientes γ de la alternativa 3. Encuentre esas relaciones.

δ0 = γ 3 , δ1 = γ1 , δ2 = γ 2 − γ 3

Se llega a esta relación sustituyendo FCi = 1 − FIi en la Alternativa 3:

yi = γ 3 + γ1 xi + (γ 2 − γ 3 ) FIi + εi

y comparando esta ecuación con la Alternativa 2.

Material elaborado por S. Álvarez,, M. Camacho, M. González, F. Martínez y A. Quesada, basado en parte en las referencias bibliográficas de la guía docente.
Su reproducción, por cualquier medio o uso, sin citar la fuente, están prohibidas. 5
Modelos Econométricos Grado en Marketing

5. Dado el siguiente modelo de regresión lineal, que verifica los cinco supuestos de
Gauss-Markov (RLM.1-RLM.5),
yi =β1x i +εi
a) Obtenga el estimador MCO para β1 .

Minimizando la suma de los residuos al cuadrado obtenemos:

β̂1 =
∑y x i i

∑x 2
i

b) Demuestre que el estimador MCO es insesgado y calcule la varianza de


dicho estimador.

Sustituyendo yi por su valor en la fórmula del estimador obtenemos:

β̂1 =
∑y x i i
= β1 +
∑ε x i i

∑x 2
i ∑x 2
i

La esperanza del estimador es:

por RLM.2
0
  
(∑ ε x )=β + ∑ xi E(ε i x1,…, xN )
( )
E i i
x1 ,…, x N
E β̂1 x1 ,…, x N = β1 + = β1
∑x 2
i
1
∑x 2
i

La varianza del estimador es:


por RLM.4
2
σ  

V( β̂1 x1 ,…, x N ) = V(β1 x1 ,…, x N ) +


V (∑ ε x x ,…, x ) =
i i 1 N ∑ xi V(ε i x1,…, xN )
2

=
 
(∑ x ) (∑ x )
2 2
2 2
0 i i

σ 2 ∑ xi2 σ2
= =
(∑ x ) 2 2
i ∑ xi2
c) Suponga ahora que el modelo de regresión no verifica el supuesto RLM.4 y
que la varianza de las perturbaciones es: V (ε i x1 ,…, x N ) = xi2 . En este caso:

c1) ¿Es el estimador MCO insesgado? ¿Es ELIO? ¿Por qué?

En este caso hay heteroscedasticidad. El estimador MCO es insesgado porque se


verifican los tres primeros supuestos de Gauss-Markov, pero ya no es ELIO porque
su varianza no es óptima. Ahora hay un estimador (MCG) que tiene menor varianza
que el estimador MCO.

Material elaborado por S. Álvarez,, M. Camacho, M. González, F. Martínez y A. Quesada, basado en parte en las referencias bibliográficas de la guía docente.
Su reproducción, por cualquier medio o uso, sin citar la fuente, están prohibidas. 6
Modelos Econométricos Grado en Marketing

c2) Si MCO no es ELIO, halle el estimador ELIO de β1 (halle la expresión


algebraica de dicho estimador, y explique detalladamente cómo se calcula).

MCO no es ELIO. El estimador ELIO es MCG. Para calcular el estimador MCG:

1. Transformar el modelo en homoscedástico. Este es el modelo ponderado, al que


se llega dividiendo por la parte no constante de la desviación típica
yi x ε
= β1 i + i
xi xi xi
yi ε
= β1 + i
x x
i i
y* ε i*

Este modelo es homoscedástico:

(
⎛ε
)
⎞ V ε i x1 ,…, x N
V ε i* x1 ,…, x N = V ⎜ i x1 ,…, x N ⎟ = =
xi2
=1
( )
⎝ xi ⎠ xi2 xi2

2. Estimar por MCO el modelo ponderado. Minimizando la suma de residuos al


cuadrado en el modelo ponderado obtenemos:

βˆ1MCG =y*
porque el modelo ponderado solo tiene término constante.

6. A partir de una muestra de 152 trabajadores pretendemos analizar las diferencias


salariales en el sector energético. Para ello se plantea el siguiente modelo:

log( sali ) = β0 + β1educi + β2experi + β3antigi + εi , i=1,...,152

donde educ indica los años de formación, exper los años de experiencia y antig los
años de antigüedad en la empresa actual de cada trabajador.

a) A través del Contraste de White, determine si existe heteroscedasticidad en


los residuos de la regresión anterior (α=0.05). Para ello dispone de la
estimación por MCO de la siguiente regresión auxiliar:

eˆi2 = αˆ 0 + αˆ 1educi + αˆ 2experi + αˆ 3antigi + δˆ 1educi2 + δˆ 2experi 2 + δˆ 3antig i2


+θˆ educ exper + θˆ educ antig + θˆ experantig
1 i i 2 i i 3 i i

R = 0.1138
2

El cuadrado de los residuos MCO del modelo se regresan sobre las explicativas, sus
cuadrados y los productos cruzados (sin que se repita ninguno). Se obtiene el
R 2 = 0.1138 y el contraste consiste en

Material elaborado por S. Álvarez,, M. Camacho, M. González, F. Martínez y A. Quesada, basado en parte en las referencias bibliográficas de la guía docente.
Su reproducción, por cualquier medio o uso, sin citar la fuente, están prohibidas. 7
Modelos Econométricos Grado en Marketing

H0 homoscedasticidad ⎫
⎬ que se contrasta con el estadístico
Ha heteroscedasticidad ⎭
NR 2 = 150 ⋅ 0.1138 = 17.07 . Bajo la nula, el estadístico sigue una χ 2q , donde q es el
número de explicativas que usamos en la regresión auxiliar. En este caso, q=9, por
lo que se rechaza la nula de homoscedasticidad ya que 17.07 > χ 9,0.052
= 16.92 . Por
tanto, se detecta que existe heteroscedasticidad.

b) Teniendo en cuenta el resultado del apartado anterior, realice el contraste de


significatividad individual para cada una de las variables explicativas de la
ecuación de salarios. Para ello dispone de las estimaciones MCO de dicha
ecuación con errores estándar habituales (Estimación 1) y los errores
estándar corregidos por White (Estimación 2).

Estimación 1:
ˆ sali ) = 4.99975+ 1.9994 educi + 1.53216 experi + 1.0011antigi
log(
(2.857) (1.538) (0.8512) (0.4762)

Estimación 2:
ˆ sali ) = 4.99975+ 1.9994 educi + 1.53216 experi + 1.0011antigi
log(
(2.7780) (1.0520) (1.2768) (0.5400)

NOTA: Entre paréntesis se dan las desviaciones típicas estimadas de los


coeficientes de la ecuación de salarios.

Como hay heteroscedasticidad debemos usar el resultado de la estimación 2 donde


aparecen los errores estándar corregidos por White. En este caso los estadísticos
para los coeficientes de educ, exper y antig valen respectivamente

1.9994 1.53216 1.0011


teduc = = 1.90 , texper = = 1.20 , y tantig = = 1.85 .
1.0520 1.27687 0.5400
Como ninguno de ellos es mayor a 1.96, concluimos que ninguna de las variables
es significativa individualmente al 5%.

c) Explique por qué la estimación MCO habitual de los coeficientes de la


ecuación de salarios sigue siendo válida en presencia de
heteroscedasticidad.

La estimación MCO sigue siendo válida porque el estimador es insesgado si se


cumplen los tres primeros supuestos RLM, incluso en presencia de
heteroscedasticidad. Sin embargo, el estimador ya no es óptimo.

7. A partir de una muestra de tamaño N, se pretende estimar el modelo

yi = β0 + β1x1i + β2x2i + εi
donde se cumplen los tres primeros supuestos RLM. Para ello se estiman por MCO
los siguientes modelos alternativos:
Modelo 1:
yˆ i = βˆ 0 + βˆ 1x1i + βˆ 2x2i
Material elaborado por S. Álvarez,, M. Camacho, M. González, F. Martínez y A. Quesada, basado en parte en las referencias bibliográficas de la guía docente.
Su reproducción, por cualquier medio o uso, sin citar la fuente, están prohibidas. 8
Modelos Econométricos Grado en Marketing

Modelo 2:
yˆ i 1 x
= βˆ 0 + βˆ 1 x1i + βˆ 2 2i
x1i x1i x1i
Modelo 3:
yˆ i ˆ 1 ˆ ˆ x2i
= β0 + β1 + β2 .
x1i x1i x1i
Un investigador sugiere que Var ( εi | X ) = σ2 x12i , donde
X = ( x11,..., x1N , x21,..., x2 N ) .

a) ¿Cuál de esas estimaciones será la más eficiente? Justifique su respuesta.

Las estimaciones que se presentan viene de aplicar MCO a los modelos

Modelo 1: yi = β0 + β1x1i + β2x2i + εi


yi 1 x x ε
Modelo 2: = β0 + β1 1i + β2 2i + i
x1i x1i x1i x1i x1i
yi 1 x x ε
= β0 + β1 1i + β2 2i + i
Modelo 3:
x1i x1i x1i x1i x1i
En los tres casos el estimador MCO es insesgado porque se cumplen los tres
primeros supuestos RLM. El estimador MCO del modelo será más eficiente para el
modelo homoscedástico porque será el que tenga una menor varianza según el
teorema de Gauss-Markov. Por tanto, tenemos que analizar en qué modelo hay
homoscedasticidad.

Modelo 1: Hay heteroscedasticidad porque Var ( εi | X ) = σ2 x12i y por tanto


MCO no es óptimo.
ε
Modelo 2: Si llamamos ε*i = i , hay heteroscedasticidad porque
x1i
⎛ εi ⎞ V ( εi X ) σ 2 x12i
V (ε X ) = V ⎜
*
X⎟= = = σ 2 x1i
i
⎜ x ⎟ x1i x1i
⎝ 1i ⎠
εi
Modelo 3: Si llamamos ε i* = , hay homoscedasticidad porque
x1i
⎛ εi ⎞ V ( εi X ) σ 2 x12i
V (ε X ) = V ⎜ X⎟=
*
i 2
= 2 = σ2
⎝ x1i ⎠ x1i x1i
Por tanto, en el Modelo 3 el estimador es óptimo.

b) Describa de forma detallada el procedimiento de White para contrastar


heteroscedasticidad en el modelo.

El modelo del que partimos es


yi = β0 + β1x1i + β2x2i + εi ,

Material elaborado por S. Álvarez,, M. Camacho, M. González, F. Martínez y A. Quesada, basado en parte en las referencias bibliográficas de la guía docente.
Su reproducción, por cualquier medio o uso, sin citar la fuente, están prohibidas. 9
Modelos Econométricos Grado en Marketing

que se estima por MCO y se obtienen los residuos al cuadrado (los llamamos ei2 ).
Se plantea una regresión auxiliar que regrese los residuos al cuadrado sobre una
constante, las explicativas del modelo inicial, sus cuadrados, y sus productos
cruzados, cuidando de que no se repita ninguna explicativa en esta regresión
auxiliar. Es decir, se propone la regresión auxiliar siguiente

ei2 = α0 + α1x1i + α2x2i + α3x12i + α4x 22i + α5x1i x 2i + εi


y se obtiene el R2 de esta regresión que llamaremos R 2e

El contraste consiste en
H 0 homoscedasticidad ⎫ 2
⎬ y se contrasta con el estadístico NR e que bajo la nula
H a heteroscedasticidad ⎭
sigue una χ 2q , donde q es el número de explicativas que usamos en la regresión
auxiliar. El valor crítico con el que hay que comparar el estadístico es el valor de
χ q2,α . Por tanto, se rechaza la nula de homoscedasticidad si NR 2e > χq2,α .

8. Considere el modelo de regresión: yi = β0 + β1x i + ε i donde


E(ε i / x1 ,...,x N ) = 0 y V(ε i / x1 ,…,x N ) = σ 2 x 2i .

Un estudiante de econometría afirma que la varianza teórica del estimador MCO en


este modelo es:
σ2
V(βˆ 1 / x1 ,..., x N ) =
∑ (x i − x)2
a) ¿Está de acuerdo con este estudiante? Justifique razonadamente su respuesta

El estimador MCO del modelo se puede escribir como

βˆ 1 =
∑ ( x - x ) y = ∑ ( x − x )(β + β x + ε ) = β + ∑ ( x − x )ε .
i i i 0 1 i i i i

∑( x − x )i
2
∑( x − x ) ∑( x − x )
i
2 1
i
2

Si sacamos la varianza del estimador anterior, tenemos:

⎛ ∑ ( x − x )ε ⎞ ∑ ( x − x ) 2V ε / x ,…, x σ 2 ∑ ( x i − x ) 2 x i2
( )
i i i i 1 N
(
V β̂1 / x1 ,…, x N ) = V⎜
⎜ ∑( x − x )2
/ x1 ,…, x N ⎟=
⎟ 2
= 2
⎝ i ⎠ ∑ i ( x − x() 2
)
∑( xi − x )2 ( )
Por tanto, no estamos de acuerdo con la afirmación del estudiante.

b) Calcule el modelo ponderado, es decir el modelo donde la varianza del


término de error es constante.

El modelo ponderado se obtiene dividiendo el modelo original por la parte no


constante de la desviación típica. Esto supone dividir el modelo original por x i :

Material elaborado por S. Álvarez,, M. Camacho, M. González, F. Martínez y A. Quesada, basado en parte en las referencias bibliográficas de la guía docente.
Su reproducción, por cualquier medio o uso, sin citar la fuente, están prohibidas. 10
Modelos Econométricos Grado en Marketing

yi 1 x ε
= β0 + β1 i + i
xi xi xi xi
yi 1 ε
= β0 + β1 + i
x x x
i i i
y* x0* ε*i

Podemos comprobar que este modelo es homoscedástico

(
⎛ε
)
⎞ V ε i x1 ,…, x N
V ε*i x1 ,…, x N = V ⎜ i x1 ,…, x N ⎟ = =
σ 2 xi2
= σ2
( )
2 2
⎝ i
x ⎠ x i
x i

c) ¿Qué propiedades tiene el estimador MCO del modelo ponderado? ¿Cómo


se llama este estimador?

El estimador propuesto se llama Mínimos Cuadrados Generalizados y es ELIO.

9. Considere el siguiente modelo:

yi = β0 + β1xi + εi
Var (εi xi ) = σi2 = σ2 xi2

a) ¿Qué problema presenta? ¿Conviene estimar por mínimos cuadrados


ordinarios? ¿Por qué?

Como existe heteroscedasticidad el estimador MCO sigue siendo insesgado pero no


será óptimo.

b) Suponiendo que, aparte de lo especificado, el resto de supuestos del modelo


lineal clásico se cumplen, proponga un estadístico para el contraste de la
hipótesis nula H 0 : β1 = 0 .
El contraste de la hipótesis nula se basa en el estadístico t del estimador MCG. Para
obtener el estimador dividimos todas las observaciones por la variable x. Es decir, el
modelo transformado es
yi 1 x ε 1 ε
= β0 + β1 i + i = β0 + β1 + i
xi xi xi xi xi xi
Con esta transformación el modelo es homocedástico porque la varianza de su error es
constante.
⎛ ε ⎞ V(ε ) σ2 x 2
V ⎜ i ⎟ = 2 i = 2 i = σ2
⎝ xi ⎠ xi xi
ˆ
Aplicamos MCO al modelo transformado, y obtenemos el estimador MCG β , y
1MCG

su desviación típica V̂(βˆ 1MCG ) . Usamos el estadístico

Material elaborado por S. Álvarez,, M. Camacho, M. González, F. Martínez y A. Quesada, basado en parte en las referencias bibliográficas de la guía docente.
Su reproducción, por cualquier medio o uso, sin citar la fuente, están prohibidas. 11
Modelos Econométricos Grado en Marketing

βˆ 1MCG
t= : tN−K .
V̂(βˆ 1MCG ) H0
10. Un economista plantea estimar la siguiente función de consumo, utilizando
datos de una muestra de tamaño N:

consumoi 1 εi
= β0 + β1 rentai +
rentai rentai rentai

εi
Sabiendo que V( rentai ) = 1, y que el modelo propuesto verifica el resto de
rentai
supuestos de Gauss-Markov:

a) Justifique razonadamente por qué cree que el economista ha planteado el


modelo anterior y no el modelo: consumoi = β0 + β1rentai + εi .

Se ha planteado este
modelo transformado porque el modelo
consumoi = β0 + β1rentai + εi incumple el supuesto de homoscedasticidad. Tiene
heteroscedasticidad porque la varianza de ε i es una función creciente de la renta:
V(εi rentai ) = rentai El modelo transformado es homoscedástico.

b) Si el economista
hubiese decidido trabajar con el modelo
consumoi = β0 + β1rentai + εi , ¿qué consecuencias hubiera tenido sobre la
estimación de los coeficientes β0 y β1 ?, ¿y sobre la realización de
contrastes de hipótesis? Justifique su respuesta.

El estimador MCO de los coeficientes seguiría siendo insesgado pero ya no sería


óptimo. Por esta razón, los contrastes habituales dejarían de ser válidos ya que no
tendrían las distribuciones estándar.

c) ¿Cuál es el estimador ELIO de β0 y β1 ? ¿Cómo se podría obtener?


Se obtendría estimando por MCO el modelo propuesto que es homocedástico.

consumoi 1 εi
= β0 + β1 rentai +
rentai rentai rentai

Material elaborado por S. Álvarez,, M. Camacho, M. González, F. Martínez y A. Quesada, basado en parte en las referencias bibliográficas de la guía docente.
Su reproducción, por cualquier medio o uso, sin citar la fuente, están prohibidas. 12
Modelos Econométricos Grado en Marketing

Ejercicios Propuestos

1. Las siguientes ecuaciones de salario han sido estimadas utilizando datos


correspondientes a una muestra de trabajadores españoles:

Ecuación (1) : log(salario) = 1.25 + 0.2hombre + 0.07educacion + e

Ecuación (2) : log(salario) = 1.75 + 0.25hombre + 0.08educacion − 0.015hom bre ⋅ educacion + e

donde el salario está medido en euros, hombre es una variable ficticia que toma
valor 1 si el individuo es hombre y 0 si es mujer; y educación mide los años de
educación.

a) ¿Cuál es la diferencia media estimada entre el salario de un hombre con 5


años de educación y el de una mujer con 10 años de educación utilizando la
ecuación (1)?

b) ¿Cuál es la diferencia media estimada entre el salario de un hombre con 5


años de educación y el de una mujer con 10 años de educación utilizando la
ecuación (2)?

Considere ahora la ecuación (1) con el salario medido en miles de euros,


salario
salario* =
1000

log(salario* ) = β0* + δ0*hombre + β1*educacion + ε *

c) Obtenga las estimaciones de los coeficientes de este modelo a partir de las


estimaciones de la ecuación (1).

Considere ahora la ecuación (2):

log( salario) = β0 + δ 0 hombre + β1educacion + δ1hombre ⋅ educacion + ε

d) Explique cómo llevar a cabo los siguientes contrastes de hipótesis (plantee


claramente las hipótesis nula y alternativa, el estadístico de contraste y la
región crítica):

d1) No existen diferencias salariales según el sexo.

d2) No existen diferencias en los rendimientos de la educación según el


sexo, frente a la alternativa de que los rendimientos de la educación son
mayores para las mujeres.

Material elaborado por S. Álvarez,, M. Camacho, M. González, F. Martínez y A. Quesada, basado en parte en las referencias bibliográficas de la guía docente.
Su reproducción, por cualquier medio o uso, sin citar la fuente, están prohibidas. 13
Modelos Econométricos Grado en Marketing

2. Utilizando datos sobre 350 individuos seleccionados aleatoriamente un


investigador estima la siguiente regresión por MCO:

log(consumoi ) = 13.4+ 0.2 mujeri + 0.42log(rentai ) + ε i


(3.1) (0.02) (0.003)

donde consumo y renta están medidos en euros al mes y mujer es una variable
ficticia que es igual a 1 si la persona es mujer y 0 en caso contrario.

a) En promedio, ¿cuál es la diferencia estimada de consumo entre hombres y


mujeres para un mismo nivel de renta? ¿Es esa diferencia estimada
significativamente distinta de cero?

b) En el modelo propuesto, ¿es la elasticidad del consumo respecto a la renta la


misma para hombres y mujeres? ¿Por qué?

c) Otro investigador utiliza estos mismos datos pero regresa la variable


log(consumo) sobre la variable log(renta), la variable mujer y la variable
hombre (variable ficticia que es igual a 1 si es hombre y 0 en caso
contrario):

log(consumoi ) = α1mujeri + α 2 hom brei + α 3 log(rentai ) + ε i

c1) ¿Cuál es la relación que existe entre los coeficientes α1 y α 2 del modelo
(2) con los coeficientes del modelo (1)? Explique detalladamente.

c2) En el modelo (2) formule la hipótesis nula de que, para un mismo nivel
de renta, la diferencia de consumo entre hombres y mujeres es nula. Con la
información disponible, calcule el estadístico que permite contrastar dicha
hipótesis. ¿Es esa diferencia estimada significativamente distinta de cero?
Justifique el procedimiento.

c3) ¿Por qué el modelo (2) no tiene término constante?

3. Sea el modelo: yi = β0 + β1xi + ε i , i = 1,…, N , donde var (ε i ) = ( kxi )2 y se


cumplen el resto de supuestos de Gauss-Markov, se pide:

a) ¿Son homoscedásticas las perturbaciones?


b) Obtenga la expresión del estimador MCO de los parámetros del modelo
( βˆ0 y βˆ1 ), y explique por qué en este modelo el estimador MCO no es
ELIO.
c) Obtenga la expresión del estimador ELIO de los parámetros del modelo.

4. Considere un modelo para explicar el consumo mensual en litros de cerveza


(variable cons) en función del ingreso del individuo (variable ingr), los años de
educación (variable educ) y una ficticia que vale uno si el consumidor es una mujer
(variable mujer)

Material elaborado por S. Álvarez,, M. Camacho, M. González, F. Martínez y A. Quesada, basado en parte en las referencias bibliográficas de la guía docente.
Su reproducción, por cualquier medio o uso, sin citar la fuente, están prohibidas. 14
Modelos Econométricos Grado en Marketing

consi = β 0 + β1ingri + β 2nei + β 3mujeri + εi


E ( εi / ingri , nei , mujeri ) = 0, ∀i
V ( εi / ingri , nei , mujeri ) = σ 2ingri 2 , ∀i.
a) ¿Qué problema presenta esta regresión? ¿Conviene estimar por mínimos
cuadrados ordinarios? ¿Por qué?
b) ¿Cómo podríamos obtener una estimación óptima de los coeficientes de esta
regresión.

5. Considérese el siguiente modelo para determinar el consumo de tabaco en


diversos municipios españoles

ci = β0 + β1ri + β2 pi + εi

donde c es el consumo de tabaco medio del municipio, r es la renta por


habitante del municipio, y p es el gasto en publicidad que realizaron las
empresas de tabaco en cada municipio. Usando datos del año pasado de 200
municipios, se obtienen las siguientes estimaciones:

cˆi = 26.19+ 0.62 ri + 0.44 pi , R 2 = 0.9


(2.7) (0.006) (0.07)

cˆi 1 p
= 25.90 + 0.62 + 0.43 i , R 2 = 0.8
ri (2.2) ri (0.006) (0.06) ri

Si se sospecha que la dispersión de los errores pueda estar relacionada con la


renta por habitante del municipio según V (εi ri ) = σ2 ri2 , ¿valdría una de estas
dos estimaciones? ¿Y si V (εi ri ) = σ2 ri ? ¿Por qué?

Solución de los ejercicios propuestos

1.
a) Para un hombre con 5 años de educación:
 ) = 1.45 + 0.07 ⋅5 = 1.8 ⇒ salario
log(salario   e1.8
i i

Y para una mujer con 10 años de educación:


 ) = 1.25 + 0.07 ⋅10 = 1.95 ⇒ salario
log(salario   e1.95
i i

La diferencia media estimada entre el salario de un hombre con 5 años de


educación y el de una mujer con 10 años de educación es e1.8 − e1.95 = −0.97904
euros.

Material elaborado por S. Álvarez,, M. Camacho, M. González, F. Martínez y A. Quesada, basado en parte en las referencias bibliográficas de la guía docente.
Su reproducción, por cualquier medio o uso, sin citar la fuente, están prohibidas. 15
Modelos Econométricos Grado en Marketing

b) Para un hombre con 5 años de educación:


 ) = 2 + 0.065⋅5 = 2.33 ⇒ salario
log(salario   e2.33
i i

Y para una mujer con 10 años de educación:


 ) = 1.75 + 0.08⋅10 = 2.55 ⇒ salario
log(salario   e2.55
i i

La diferencia media estimada entre el salario de un hombre con 5 años de


educación y el de una mujer con 10 años de educación es e2.33 − e2.55 = −2.5291 euros.

c) β̂*0 = 1.25 − log(1000) , δ̂*0 = 0.20 , β̂1* = 0.07

d1)
MR: log( salario) = β0 + β1educacion + ε
MNR: log( salario) = β0 + δ0hombre + β1educacion + δ1hombre ⋅ educacion + ε

H 0 : δ0 = δ1 = 0
H1 : H0 falsa

(SCE R − SCE NR )
q
F= ; regla de rechazo F > Fq , N − K ,α ⇒ RH 0
SCE NR
(N − K)
d2)
H 0 : δ1 = 0
H1 : δ1 < 0

δ̂1
t= ; regla de rechazo t < −t N − K ;α ⇒ RH 0
V̂(δˆ 1 )

2.
a) Dada la ecuación de consumo: log(consumoi ) = β0 + δ0mujeri + β1 log( rentai ) + εi ,
estimando por mínimos cuadrados ordinarios, se obtiene que en promedio, la
diferencia estimada del consumo entre hombres y mujeres es
δ̂0 ⋅ 100% = 0.2 ⋅100% = 20% .
H 0 : δ0 = 0
H1 : δ 0 ≠ 0

0.2
t= = 10; 10 > t350−3;0.95 ⇒ RH 0
0.02
La diferencia estimada es significativamente distinta de cero.

Material elaborado por S. Álvarez,, M. Camacho, M. González, F. Martínez y A. Quesada, basado en parte en las referencias bibliográficas de la guía docente.
Su reproducción, por cualquier medio o uso, sin citar la fuente, están prohibidas. 16
Modelos Econométricos Grado en Marketing

b) La elasticidad del consumo respecto a la renta es la misma para mujeres y


hombres, e igual a β̂1 = 0.42 , porque la variable ficticia mujer solo se ha introducido
de manera aditiva.

c1) β0 = α 2 , δ0 = α1 − α2 , β1 = α3
A esta relación se llega sustituyendo hombrei = 1 − mujeri en el modelo (2) y
comparando la ecuación resultante con el modelo (1).

c2)
δ0

H 0 : α1 − α 2 = 0
H 1 : α1 − α 2 ≠ 0

H 0 : δ0 = 0
H1 : δ 0 ≠ 0

δ̂ 0 0.2
t= = = 10; regla de rechazo 10 > t 350−3;0.975 = 1.96 ⇒ RH 0
V̂(δ̂ 0 ) 0.02

c3) Porque si tuviese término constante habría multicolinealidad perfecta (trampa


de las ficticias).

3.
a) Es un modelo heteroscedástico porque la varianza del término de error es distinta
para cada una de las observaciones.

b) El estimador MCO se obtiene minimizando la suma de los residuos al cuadrado.


El resultado es:
β̂0 = y − β̂1x
Sxy
β̂1 =
S2x
MCO no es ELIO porque no se cumple el supuesto RLM.4. El estimador MCO es
ELI pero no es óptimo. Hay un estimador (MCG) que tiene menor varianza que
MCO.
c) Cuando hay heteroscedasticidad el estimador ELIO es MCG. Para obtener MCG,
yi 1 ε
primero se obtiene el modelo ponderado = β0 + β1 + i , que ya es
x x x
i i i
y* x0* ε*i

homoscedástico. Después se estima por MCO el modelo ponderado y se obtiene:

Material elaborado por S. Álvarez,, M. Camacho, M. González, F. Martínez y A. Quesada, basado en parte en las referencias bibliográficas de la guía docente.
Su reproducción, por cualquier medio o uso, sin citar la fuente, están prohibidas. 17
Modelos Econométricos Grado en Marketing

βˆ 1MCG =y * -βˆ 0 MCG x0*


S x* y *
βˆ 0 MCG = 0

S x2*
0

4.

a) No conviene estimar por MCO porque el estimador no sería ELIO. Como


E ( εi ingi , nei , mujeri ) = 0 se cumple el supuesto de media condicionada nula. Pero
como en este caso var (εi ingi , nei , mujeri ) = σ2ingi2 , la varianza será función de
alguna de las variables explicativas (el ingreso del individuo) y no será constante
por lo que nos encontraremos con problemas de heteroscedasticidad.

b) Estimando por MCG. Para ello tendremos que estimar por MCO

consi 1 ne mujeri ε
= β0 + β1 + β2 i + β3 + i
ingi ingi ingi ingi ingi

En este caso los nuevos ruidos de este modelo serán homoscedásticos porque su
varianza es constante

⎛ ε ⎞ var (ε i ) σ 2ing 2
var ⎜ i ⎟ = 2
= 2
=σ2
⎝ ingi ⎠ ingi ingi

5.
Supongamos que el modelo de partida es

ci = β0 + β1ri + β2 pi +εi .

Si V(εi ri ) = σ2 ri2 evitaremos la homosdecasticidad estimando el segundo modelo

ci 1 p ε
= β0 + β1 + β2 i + i
ri ri ri ri

porque los ruidos son homoscedásticos

⎛ ε ⎞ var ( εi ) σ2 ri2
var ⎜ i ⎟ = 2
= 2 = σ2
⎝ ri ⎠ ri ri

Pero si suponemos que V (εi ri ) = σ2 ri ninguno de los dos modelos sería


homoscedástico porque

⎛ ε ⎞ var ( εi ) σ2 ri σ2
var ⎜ i ⎟ = 2
= 2 =
r
⎝ i⎠ ri ri ri

Material elaborado por S. Álvarez,, M. Camacho, M. González, F. Martínez y A. Quesada, basado en parte en las referencias bibliográficas de la guía docente.
Su reproducción, por cualquier medio o uso, sin citar la fuente, están prohibidas. 18
Modelos Econométricos Grado en Marketing

Cuestiones de Verdadero o Falso

Indique si las afirmaciones siguientes son verdaderas o falsas, razonando (o


demostrando en su caso) la respuesta.
1. En el modelo sali = β1educi + β2mujeri + β3hombrei + εi , donde mujer es una
variable ficticia que toma valor 1 para las mujeres, y hombre es una variable
ficticia que toma valor 1 para los hombres, para contrastar si existe
discriminación salarial en función del sexo del individuo las hipótesis nula y
alternativa son H 0 : β3 = 0 y H1 : β3 ≠ 0 .

2. En presencia de heteroscedasticidad, las estimaciones MCO de los


parámetros del modelo y de su varianza son insesgadas. No obstante, este
estimador no es óptimo.

3. Si utilizamos datos de corte transversal para estimar un modelo que


explique el comportamiento del consumo en función de la renta de los
individuos, probablemente los errores serán heteroscedásticos, y por tanto
los estimadores MCO serán sesgados.

4. En modelos heteroscedásticos los estadísticos t y F habituales ya no siguen


una distribución t y F, respectivamente.

5. La estimación que propone White cuando existe heteroscedasticidad en un


modelo de regresión corrige el sesgo que presenta la estimación MCO de los
coeficientes del modelo.

Solución de las cuestiones de verdadero y falso

1. Falso. Las hipótesis nula y alternativa son:


H 0 : β 2 = β3 H1 : β2 ≠ β3
2. Falso. Cuando existe heteroscedasticidad solo las estimaciones MCO de los
parámetros del modelo son insesgadas, pero no es insesgada la estimación
de la varianza.
3. Falso. Aunque los errores sean heteroscedásticos, los estimadores MCO
siguen siendo insesgados.

4. Verdadero. Los t y F habituales ya no siguen una distribución t y F. Hay dos


opciones para resolver este problema. La primera es estimar mediante MCG
y los t y F habituales seguirán teniendo validez. La segunda es usar la
estimación MCO pero las varianzas de White, y en este caso los t y F
habituales sirven asintóticamente.

5. Falso. La presencia de heteroscedasticidad no implica sesgo en la


estimación MCO de los coeficientes del modelo.

Material elaborado por S. Álvarez,, M. Camacho, M. González, F. Martínez y A. Quesada, basado en parte en las referencias bibliográficas de la guía docente.
Su reproducción, por cualquier medio o uso, sin citar la fuente, están prohibidas. 19

También podría gustarte