Está en la página 1de 30

Econometrı́a

Modelos de regresión con variables dicótomas

Profesor: Mauricio Leiva del Campo


mauricioleivade@gmail.com

Ingenierı́a Comercial
Universidad del Bı́o-Bı́o

Primer Semestre 2019

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 1 / 30


Variables dicotómicas

• En el análisis de regresión, la variable dependiente puede ser explicada


no solo de variables en escala de razón (por ejemplo: ingreso,
producción, precios, costos y estatura), sino también de variables
cualitativas por naturaleza, o de escala nominal (como sexo, raza,
color, religión, nacionalidad, región geográfica, cambios polı́ticos y
afiliación partidista, etc).
• Por ejemplo, manteniendo las demás variables constantes, podrı́amos
analizar si el género afecta o no en los salarios.
• También podrı́amos analizar si la raza o etnia afecta positiva o
negativamente en los salarios.

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 2 / 30


Variables dicotómicas

• Estas variables suelen indicar la presencia o ausencia de algún


atributo.
• Una manera de “cuantificar” tales atributos es mediante variables
artificiales que toman los valores 0 o 1.
• Donde 1 es la presencia de tal atributo y 0 es la ausencia de este.
• Por ejemplo, 1 puede indicar que una persona es de sexo femenino y 0
que es de sexo masculino; o 1 puede indicar que una persona se
graduó en la universidad y 0 que no lo ha hecho, y ası́ en cada caso.

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 3 / 30


Variables dicotómicas

• Consideremos
 las siguientes variables:
1 mujer
d1i =
0 hombre ⇒ Situación base

• Supongamos que se quiere estimar una ecuación de salarios, donde se


quiere predecir el valor promedio del salario condicional al género,
para lo cual tenemos el siguiente modelo:

Wi = β0 + β1 d1i + ui

E [Wi |d1i = 0] = β0 y E [Wi |d1i = 1] = β0 + β1

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 4 / 30


Variables dicotómicas

• El modelo
 se puede estimar de una forma alternativa:
1 hombre
d2i =
0 mujer ⇒ Situación base

• Ahora, el modelo queda de la siguiente forma:

Wi = β0 + β1 d2i + ui

E [Wi |d2i = 0] = β0 y E [Wi |d2i = 1] = β0 + β1

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 5 / 30


Variables dicotómicas

• Existe una última forma de estimar el modelo:

Wi = β1 d1i + β2 d2i + ui

E [Wi |d1i = 1] = β1 y E [Wi |d2i = 1] = β2

• Notar que este modelo no incluye la constante. Esto se debe a la


trampa de las variables dicotómicas.

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 6 / 30


Variables dicotómicas

• La trampa de las variables dicotómicas es una situación en la que se


tendrá colinealidad o perfecta multicolinealidad, si hay más de una
relación exacta entre las variables.
• Existe una forma de eludirla al introducir tantas variables dicótomas
como números de categorı́as tenga dicha variable, siempre y cuando
no se introduzca el intercepto en dicho modelo.
• Por ejemplo en un modelo:

Yi = β1 D1i + β2 D2i + β2 D2i + ui

• Al no incluir el intercepto, no caemos en la trampa de las variables


dicotómicas, pues no existirá colinealidad perfecta.
• OJO... cuando se use esta regresión, asegurarse de usar la opción “no
constante” o “no intercepto” en algún software.

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 7 / 30


Variables dicotómicas

Reglas para utilizar las variables dicotómicas:

• Si se tienen n atributos, debe existir n − 1 variables dicotómicas.


• Los atributos deben ser excluyentes.

Otras utilidades:

• Incorporar efectos estacionales.


• Incorporar efectos umbrales (p.ej. educación)
• Alternativa al test de Chow.

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 8 / 30


Variables dicotómicas

• Ejemplo: Supongamos que deseamos saber si existe diferencia entre


los salarios promedio de las distintas zonas geográficas del paı́s:

Wi = β0 + β1 D1i + β2 D2i + ui

• Donde:
• Wi es el salario del individuo.
• D1 es la variable dummy que toma el valor de 1 si el individuo i vive
en el norte del paı́s, 0 en otro caso.
• D2 es la variable dummy que toma el valor de 1 si el individuo i vive
en el sur del paı́s, 0 en otro caso.

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 9 / 30


Variables dicotómicas

• Del ejemplo anterior, supongamos que tenemos el siguiente resultado


hipotético:
Zona Geográfica Salario Promedio
Norte $359.291
Centro $421.274
Sur $328.398
• ¿Qué nos dicen estos resultados? ¿Cómo interpretamos?

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 10 / 30


Variables dicotómicas

• El modelo anterior, lo podemos escribir de la siguiente forma:

• Zona Norte:
E [Wi |D1i = 1, D2i = 0] = β0 + β1

• Zona Sur:
E [Wi |D1i = 0, D2i = 1] = β0 + β2

• Zona Centro (categorı́a base):


E [Wi |D1i = 0, D2i = 0] = β0

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 11 / 30


Variables dicotómicas

• ¿Cómo quedarı́a la estimación del modelo?

ci = 421.274 − 61.983D1i − 92.876D2i


W

• Si queremos evaluar el efecto directo de los salarios promedio según el


lugar geográfico en donde viven los individuos, entonces debiéramos
eludir la trampa de las variables dicotómicas y especificar el modelo
sin constante:

Wi = β0 D0i + β1 D1i + β2 D2i + ui

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 12 / 30


Variables dicotómicas

• La estimación quedarı́a de la siguiente forma:

W
ci = 421.274D0i + 359.291D1i + 328.398D2i

• Donde:
• Wi es el salario del individuo.
• D0 es la variable dummy que toma el valor de 1 si el individuo i vive
en el centro del paı́s, 0 en otro caso.
• D1 es la variable dummy que toma el valor de 1 si el individuo i vive
en el norte del paı́s, 0 en otro caso.
• D2 es la variable dummy que toma el valor de 1 si el individuo i vive
en el sur del paı́s, 0 en otro caso.

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 13 / 30


Variables dicotómicas

• La incorporación de variables dicotómicas puede generar diversos


efectos en la estimación del modelo econométrico:
1 Intercepto
2 Pendiente
3 Pendiente e Intercepto
• Consideremos un ejemplo de discriminación salarial y supongamos que
el intercepto se encuentra explicado por los años de escolaridad.

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 14 / 30


Variables dicotómicas
Efecto en el Intercepto

Yi = β1 + γD + β2 X2i + ... + βk Xki + ui

• Si D = 1

Yi = (β1 + γ) + β2 X2i + ... + βk Xki + ui

• Si D = 0

Yi = β1 + β2 X2i + ... + βk Xki + ui

• En este caso, el término γ representa el diferencial promedio de


ingresos entre hombres y mujeres para un mismo nivel de educación

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 15 / 30


Variables dicotómicas
Efecto en la pendiente

Yi = β1 + β2 X2i + γDX2i + ... + βk Xki + ui

• Si D = 1:

Yi = β1 + (β2 + γ)X2i + ... + βk Xki + ui

• Si D = 0:

Yi = β1 + β2 X2i + ... + βk Xki + ui

• En este caso, el efecto de la variable explicativa X2i sobre la variable


dependiente varı́a entre hombres y mujeres; es decir, el diferencial
podrı́a ser menor conforme se tiene mayor acceso a la educación.
Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 16 / 30
Variables dicotómicas
Efecto en el intercepto y la pendiente

Yi = β1 + γ1 D1 + β2 X2i + γ2 D2 X2i + ... + βk Xki + ui

• Si D = 1:

Yi = (β1 + γ1 ) + (β2 + γ2 )X2i + ... + βk Xki + ui

• Si D = 0:

Yi = β1 + β2 X2i + ... + βk Xki + ui

• En este caso, el diferencial de salarios entre hombres y mujeres se


debe tanto a condiciones de género, como a años de escolaridad.

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 17 / 30


Variables dicotómicas
Regresión con variables dependientes cualitativas y cuantitativas

• Los modelos que vimos anteriormente, con solo variable dicotómicas


como regresoras no son tan frecuentes en la economı́a.
• Por lo general la mayor parte de las investigaciones económicas, un
modelo de regresión contiene diversas variables explicativas
cuantitativas y otras cualitativas.

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 18 / 30


Variables dicotómicas
Regresión con variables dependientes cualitativas y cuantitativas

• Veamos el siguiente ejemplo:


• Supongamos que queremos estimar el salario promedio de los
profesores de escuelas públicas en Estados Unidos, para los años 2005
y 2006.
• Tenemos el siguiente modelo:

Yi = β1 + β2 D2i + β3 D3i + β4 Xi + ui

Donde:
• Yi : salario promedio anual de los profesores de escuelas públicas en el
estado (US$)
• Xi : gasto en escuelas públicas por alumno (US$)
• D2 : 1 si el estado es del Noreste o Norte-centro; 0 en otro caso
• D3 : 1 si el estado es del Sur; 0 en otro caso
Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 19 / 30
Variables dicotómicas
Regresión con variables dependientes cualitativas y cuantitativas

Resultados Stata:

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 20 / 30


Variables dicotómicas
Regresión con variables dependientes cualitativas y cuantitativas

Ybi = 28.694, 918 − 2.954, 127D2i − 3.112, 194D3i + 2, 3404Xi

• ¿Cómo interpretamos?
• Un aumento en el gasto público de US$ 1 , en promedio, aumentará
el salario de los profesores de escuelas públicas en aprox. US$ 2,34,
ceteris paribus
• ¿Qué podemos decir sobre los demás parámetros?

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 21 / 30


Variables dicotómicas
Regresión con variables dependientes cualitativas y cuantitativas

Salarios de los profesores de escuelas públicas (Y ) en EEUU en relación


con el gasto en educación por alumno.

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 22 / 30


Alternativa al test de Chow con variables dicotómicas

• Anteriormente analizamos el test de Chow para examinar la


estabilidad del modelo de regresión.
• Vimos un ejemplo práctico con la relación de ahorro-ingreso en USA
entre 1970 y 1995.
• Dividimos el periodo de muestra en dos: 1970-1981 y 1982-1995.
• Con el test de Chow se mostró que existı́a una diferencia en la
regresión del ahorro sobre el ingreso para los dos periodos.

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 23 / 30


Alternativa al test de Chow con variables dicotómicas

• No pudimos determinar mediante el test de Chow si la diferencia en


las dos regresiones se debı́a a las diferencias en los términos del
intercepto o en los coeficientes de la pendiente, o en ambas.
• Hay cuatro posibilidades.
1 El intercepto y los coeficientes de las pendientes son iguales en ambas
regresiones. Esta situación, el caso de regresiones coincidentes.
2 Sólo los interceptos en ambas regresiones son diferentes, pero las
pendientes son las mismas. Este caso, de regresiones paralelas.
3 Los interceptos en las dos regresiones son las mismas, pero las
pendientes son distintas. Esta situación se conoce como regresiones
concurrentes.
4 Ambos interceptos y pendientes en las dos regresiones son distintos.
Este caso es el de regresiones disı́mbolas.

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 24 / 30


Alternativa al test de Chow con variables dicotómicas

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 25 / 30


Alternativa al test de Chow con variables dicotómicas

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 26 / 30


Alternativa al test de Chow con variables dicotómicas

• Estimemos el siguiente modelo:

Yt = α1 + α2 Dt + β1 Xt + β2 (Dt Xt ) + ut

Donde:
• Y = Ahorro
• X = Ingreso
• t = Tiempo
• D = 1 para las observaciones de 1982-1995, 0 en otro caso
• α2 = es el intercepto diferencial
• β2 = coeficiente de la pendiente diferencial (también llamado
alterador de pendiente)

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 27 / 30


Alternativa al test de Chow con variables dicotómicas

Salida de Stata:

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 28 / 30


Alternativa al test de Chow con variables dicotómicas

Para ver implicancias (suponiendo como siempre que E (ui ) = 0)1


• Función Ahorro-Ingreso 1970 - 1981:

E [Yt |Dt = 0, Xt ] = α1 + β1 Xt

• Función Ahorro-Ingreso 1982 - 1995:

E [Yt |Dt = 1, Xt ] = (α1 + α2 ) + (β1 + β2 )Xt

1
Como en la prueba de Chow, la técnica de agrupamiento supone la
homoscedasticidad; es decir, σ12 = σ22
Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 29 / 30
Alternativa al test de Chow con variables dicotómicas

• Como muestran los resultados de esta regresión, el intercepto


diferencial (α2 ) y el coeficiente de la pendiente (β2 ) son
estadı́sticamente significativos, lo cual indica enérgicamente que las
regresiones ahorro-ingreso para los dos periodos son diferentes.
• Regresión ahorro - ingreso para 1970-1981:

Ybt = 1, 0161 + 0, 0803Xt

• Regresión ahorro - ingreso para 1982 - 1995:

Ybt = (1, 0161 + 152, 4786) + (0, 0803 − 0, 0655)Xt


= 153, 4947 + 0, 0148Xt

Universidad del Bı́o-Bı́o Econometrı́a 07 Primer Semestre 2019 30 / 30

También podría gustarte