Está en la página 1de 20

Tema 3: Variables Ficticias

Josep Navarro
jm.navarro@ucv.es
Gujarati Capı́tulos 9
Econometrı́a el modelo Lineal Ezequiel Uriel 1990 Capı́tulo 8

UCV

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 9Tema


Econometrı́a
3: Variables
el modelo
FicticiasLineal Ezequiel Uriel 1990 Capı́tulo 8 (UCV) 1 / 20
Introducción

Hemos visto que para la estimación de modelos econométricos utilizamos


los valores directamente observables, tanto de la variable endógena como
de la exógena. Pero, con frecuencia, al formular un modelo econométrico
se desea introducir como regresor una o más variables que reflejen
fenómenos de tipo cualitativo.

Ası́, por ejemplo, caracterı́sticas tales como el estado civil, sexo o


nacionalidad son atributos que conviene cuantificar adecuadamente, ya
que pueden contribuir, en determinadas circunstancias, a explicar el
comportamiento de los agentes económicos.

Para ello se utilizan unas variables construidas artificialmente por el/la


económetra. Dichas variables reciben el nombre de dummies o variables
ficticias. La asignación de valores a las variables ficticias es siempre
arbitraria, si bien se realiza de tal manera que las variaciones del factor
cualitativo queden reflejadas convenientemente.
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 9Tema
Econometrı́a
3: Variables
el modelo
FicticiasLineal Ezequiel Uriel 1990 Capı́tulo 8 (UCV) 2 / 20
Introducción
Las variables ficticias se utilizan como indicadores, tanto de variables
categóricas como numéricas. En el primer caso, las posibilidades de
cuantificación se encuentran limitadas por la propia naturaleza cualitativa
de los atributos, es decir, no existe una ordenación inherente en
caracterı́sticas tales como el sexo, la nacionalidad, etc..., y de ahı́ el
recurso de las variables ficticias para obtener una expresión cuantitativa.
En el segundo caso, la elección de variables ficticias obedece a un criterio
de conveniencia más que de necesidad.

En lo referente a la modelización de las variables numéricas mediante


variables ficticias, piénsese, por ejemplo, en la pregunta relativa a la edad,
en una encuesta. Aunque sea posible, en principio, obtener el valor exacto
de la edad, ello requerirı́a que la medición se realizara en años, meses, dı́as
e incluso horas. Realmente, no existe tanta variabilidad en el
comportamiento de las personas cuya diferencia de edad se encuentra
dentro de un intervalo determinado. Ésta se puede considerar como
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 9Tema
Econometrı́a
3: Variables
el modelo
FicticiasLineal Ezequiel Uriel 1990 Capı́tulo 8 (UCV) 3 / 20
Introducción

una de las razones principales por las cuales (no solamente en las
estadı́sticas) la variable edad aparece habitualmente agrupada en tramos
cuyo comportamiento se puede considerar más o menos similar.
Igualmente, la mayorı́a de los cuestionarios están diseñados para recabar al
información sobre la edad también por los tramos.

Por tanto, el tratamiento de este tipo de variables en un modelo


econométrico, aun teniendo un patrón de medida natural, por la forma en
que se dispone de la información, debe realizarse utilizando variables
ficticias.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 9Tema


Econometrı́a
3: Variables
el modelo
FicticiasLineal Ezequiel Uriel 1990 Capı́tulo 8 (UCV) 4 / 20
La utilidad de las variables ficticias
Supongamos, para fijar ideas, que un modelo de determinación
microeconómica del salario, además de tener como regresores la
experiencia laboral y los años de estudio, ante la sospecha de que el sexo
del trabajador puede ser un factor explicativo del salario percibido, se
decide incluir la variable sexo. Dado que esta variable no es cuantitativa,
es decir, no tiene un patrón de medida natural ¿Cómo se
deberá especificar el modelo para que se pueda recoger el efecto del sexo
en una persona en su salario?

El tratamiento habitual en Econometrı́a de este tipo de problemas se


realiza mediante variables ficticias. De este modo, si definimos una variable
S tal que:

S = {1 si la persona i-ésima es hombre; 0 si la persona i-ésima es mujer }

entonces se puede plantear el siguiente modelo, que aparece en el ejemplo


3.1.
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 9Tema
Econometrı́a
3: Variables
el modelo
FicticiasLineal Ezequiel Uriel 1990 Capı́tulo 8 (UCV) 5 / 20
La utilidad de las variables ficticias
Ejemplo 3.1. Modelo con una variable ficticia aditiva

Sea el siguiente modelo de determinación salarial:

Wi = β1 + β2 ELi + β3 AEi + β4 Si + ui
donde
Wi = salario de la persona i-ésima
ELi = experiencia laboral de la persona i-ésima
AEi = años de estudio de la persona i-ésima
de forma que el salario esperado de un hombre será

E [Wi |Si = 1] = β1 + β4 + β2 ELi + β3 AEi + ui


mientras que el salario esperado de una mujer será:

E [Wi |Si = 0] = β1 + β2 ELi + β3 AEi + ui

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 9Tema


Econometrı́a
3: Variables
el modelo
FicticiasLineal Ezequiel Uriel 1990 Capı́tulo 8 (UCV) 6 / 20
La utilidad de las variables ficticias
Ejemplo 3.1. Modelo con una variable ficticia aditiva

con lo que, a igual experiencia laboral y años de estudio, la diferencia


salarial que cabe esperar entre un hombre y una mujer vendrá dada por:

E [Wi |Si = 1] − E [Wi |Si = 0] = β4 (1)

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 9Tema


Econometrı́a
3: Variables
el modelo
FicticiasLineal Ezequiel Uriel 1990 Capı́tulo 8 (UCV) 7 / 20
La utilidad de las variables ficticias
Ejemplo 3.1. Modelo con una variable ficticia aditiva

Vamos a generalizar a continuación lo que acabamos de exponer en el


ejemplo anterior. Para ello, consideremos el siguiente modelo:

Yi = β1 + β2 X2i + β3 X3i + . . . + βk Xki + ui , i = 1, 2, ..., N (2)


donde la variable ficticia Xk refleja una caracterı́stica dicotómica con
situaciones posibles A y B; si hacemos:

Xki = { 1 si en la observación i-ésima se da el estado A


0 si en la observación i-ésima se da el estado B }
entonces
E [Yi |A] − E [Yi |B] = βk
Es decir, el parámetro βk mide el efecto diferencial esperado en Yi del
estado A frente al B, permaneciendo constantes las demás variables. Por
lo tanto, al estimar el modelo por mı́nimos cuadrados, β̂k será una
estimación del efecto diferencial.
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 9Tema
Econometrı́a
3: Variables
el modelo
FicticiasLineal Ezequiel Uriel 1990 Capı́tulo 8 (UCV) 8 / 20
La utilidad de las variables ficticias

Supóngase que el sexo no sólo determina parcialmente el salario a percibir,


sino que también tiene una influencia sobre las acciones de las personas en
una etapa previa a su entrada en el mercado de trabajo. Al menos en el
pasado, la experiencia laboral de una persona y su nivel de estudios
estaban relacionados con el sexo. Las mujeres, sobre todo las casadas,
presentaban una menor experiencia laboral que los hombres en
circunstancias similares (por ejemplo, con el mismo nivel de estudios). Lo
mismo sucedı́a con el nivel de cualificación.

La forma de modelizar este efecto conjunto, fruto de la interacción de dos


variables, cuando al menos una de ellas es un atributo, es mediante la
introducción en el modelo de variables ficticias de forma multiplicativa.
Vamos a utilizar el ejemplo de determinación microeconómica del salario
para ilustrarlo.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 9Tema


Econometrı́a
3: Variables
el modelo
FicticiasLineal Ezequiel Uriel 1990 Capı́tulo 8 (UCV) 9 / 20
La utilidad de las variables ficticias
Ejemplo 3.2. Modelo con variable ficticia interactiva

Wi = β1 + β2 ELi + β3 AEi + β4 Si + β5 ELi Si + β6 AEi Si + ui (3)


siendo i = 1, 2, ..., N
El correspondiente modelo estimado en el caso de los varones será:

Ŵi = (β̂1 + β̂4 ) + (β̂2 + β̂5 )ELi + (β̂3 + β̂6 )AEi

Mientras que en el caso de las mujeres el modelo estimado será:

Ŵi = β̂1 + β̂2 ELi + β̂3 AEi


Nótese que la diferencia entre le salario esperado de un hombre y una
mujer es:

E [Wi |Si = 1] − E [Wi |Si = 0] = β4 + β5 ELi + β6 AEi (4)

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 9Tema


Econometrı́a
3: Variables
el modelo
FicticiasLineal Ezequiel Uriel 1990 Capı́tulo 8 (UCV) 10 / 20
La utilidad de las variables ficticias

Si comparamos las ecuaciones (1) y (4), se observa que la diferencia


depende de la forma en la cual se ha introducido en el modelo la ficticia S.
En el ejemplo 3.1., donde la variable ficticia se ha introducido de forma
aditiva, dicha diferencia se reduce a la cuantı́a del parámetro β4 , lo cual
supone únicamente un cambio de nivel en el modelo de determinación del
salario, según se trate de varones o de mujeres. También en este caso el
resto de las variables explicativas aparecerán afectadas por el mismo
coeficiente.

En el ejemplo 3.2., donde la variable ficticia Si aparece en forma iterativa,


la diferencia entre el salario esperado de un varón y el de una mujer no se
reduce a una diferencia de nivel, sino que también afecta a las pendientes,
es decir, a los coeficientes de las variables cuantitativas (variables
”experiencia laboral” (ELi ) y ”años de escolaridad” (AEi ), en este caso).

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 9Tema


Econometrı́a
3: Variables
el modelo
FicticiasLineal Ezequiel Uriel 1990 Capı́tulo 8 (UCV) 11 / 20
La utilidad de las variables ficticias

Una forma alternativa de captar el mismo fenómeno que se ilustra en el


ejemplo 3.2. consiste en realizar dos regresiones por separado: una para el
grupo de los varones (V ) y otra para el de las mujeres (M). De esta forma
se evita la introducción de una variable ficticia que aproxime la
caracterı́stica del sexo.

Las dos regresiones se pueden expresar de la forma siguiente:

Grupo Varones: WiV = α1 + α2 ELiV + α3 AEiV + uiV , i = 1, 2, ..., N1


Grupo Mujeres: WiM = γ1 + γ2 ELiM + γ3 AEiM + uiM , i = 1, 2, ..., N2 (5)
N = Ni + N2

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 9Tema


Econometrı́a
3: Variables
el modelo
FicticiasLineal Ezequiel Uriel 1990 Capı́tulo 8 (UCV) 12 / 20
La utilidad de las variables ficticias

Nótese que, haciendo el supuesto de igualdad de varianza entre los dos


grupos, la diferencia entre los coeficientes correspondientes al término
independiente de las regresiones de hombres y mujeres, αi − γ1 , coincide
con el coeficiente β4 , asociada a la variable ficticia Si en la especificación
del modelo del ejemplo 3.2.

Asimismo, la diferencia entre los coeficientes correspondientes a la


pendiente es igual a los coeficientes asociados a las interacciones de la
variable ficticia sexo con las variables explicativas experiencia y escolaridad,
es decir, α2 − γ2 = β5 y α3 − γ3 = β6 . Estas igualdades seguirán siendo
validas si sustituimos los coeficientes por sus respectivos estimadores.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 9Tema


Econometrı́a
3: Variables
el modelo
FicticiasLineal Ezequiel Uriel 1990 Capı́tulo 8 (UCV) 13 / 20
La utilidad de las variables ficticias

Ahora bien, al separar la muestra total en dos grupos, la estimación de la


varianza de las perturbaciones diferirá de un grupo a otro, y, por tanto, las
desviaciones tı́picas estimadas de los distintos coeficientes también
variarán de utilizar la especificación del modelo en el ejemplo 3.2.
(ecuación (3)) a realizar su estimación con el sistema de ecuaciones (5).
Ellos provocará diferencias en los valores de los estadı́sticos t
correspondientes a los coeficientes estimados en las ecuaciones (3) y (5)

Por tanto, en la elección entre (3) y (5) debe tenerse en cuenta si la


principal motivación del estudio es conocer cómo afectan de forma
diferente las variables experiencia y escolarización al caso de los varones y
al de las mujeres o bien, simplemente, la cuantı́a de esta diferencia. En el
primer caso se utilizarán la estimación (5) por grupos, mientras que en el
segundo se puede utilizar la ecuación (3) para todas las observaciones
conjuntamente.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 9Tema


Econometrı́a
3: Variables
el modelo
FicticiasLineal Ezequiel Uriel 1990 Capı́tulo 8 (UCV) 14 / 20
La utilidad de las variables ficticias

Finalmente, consideremos la utilidad de las variables ficticias para


desetacionalizar una serie temporal. Al tratar de estudiar la evolución
temporal de cualquier magnitud económica utilizando un conjunto de
variables explicativas, es conveniente tener en cuenta aquellas variaciones
que se producen como consecuencia del fenómeno de la estacionalidad. La
estacionalidad es una variación de la serie de periodicidad inferior a un año.

Los fenómenos estacionales son de carácter cultural o institucional, y no


están, en principio, relacionados con ningún factor puramente económico.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 9Tema


Econometrı́a
3: Variables
el modelo
FicticiasLineal Ezequiel Uriel 1990 Capı́tulo 8 (UCV) 15 / 20
La utilidad de las variables ficticias
Ejemplo 3.3. Utilidad de las variables ficticias para el tratamiento de la estacionalidad

Considérese, por ejemplo, el ı́ndice de producción industrial (IPI ) en


España. El valor de este indicador de la producción sufre una caı́da
espectacular en el mes de Agosto de cada año, como consecuencia de las
vacaciones estivales. También sufre una caı́da relativamente mucho menos
importante en el mes de diciembre, como consecuencia de las fiestas de
Navidad, por una parte, y en abril-marzo, coincidiendo con el periodo de
Pascua, por la otra.

Si el objetivo del estudio es obtener predicciones para el IPI mediante una


serie trimestral, el nivel de cartera de precios (NCP) puede considerarse
como un factor que anticipa las variaciones del IPI.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 9Tema


Econometrı́a
3: Variables
el modelo
FicticiasLineal Ezequiel Uriel 1990 Capı́tulo 8 (UCV) 16 / 20
La utilidad de las variables ficticias
Ejemplo 3.3. Utilidad de las variables ficticias para el tratamiento de la estacionalidad

Ası́, se definen tres variables ficticias, M1 , M2 y M3 , de la siguiente forma:


M1 = { 1 si la observación i-ésima corresponde al segundo trimestre
0 en caso contrario }
M2 = { 1 si la observación i-ésima corresponde al tercer trimestre
0 en caso contrario }
M3 = { 1 si la observación i-ésima corresponde al cuarto trimestre
0 en caso contrario }
Utilizando M1 , M2 y M3 para tratar las variaciones estacionales, es posible
especificar el siguiente modelo:
IPIi = β1 + β2 NCPi + β3 M1i + β4 M2i + β5 M3i + ui , i = 1, 2, ..., N
Nótese que los parámetros β3 , β4 , β5 miden el efecto estacional diferencial
con respecto al primer trimestre, que es la categorı́a de referencia.
Un supuesto implı́cito en esta forma de cuantificar la estacionalidad es que
ésta no varı́a de un año a otro.
Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 9Tema
Econometrı́a
3: Variables
el modelo
FicticiasLineal Ezequiel Uriel 1990 Capı́tulo 8 (UCV) 17 / 20
La trampa de las variables ficticias

Se debe reparar en que para una caracterı́stica dicotómica hemos utilizado


una única variable ficticia. Ello es ası́ porque, si utilizásemos dos variables
ficticias, F1 y F2 , donde

F1i = { 1 si en la observación i-ésima se da el estado A;


0 si en la observación i-ésima se da el estado B }
F2i = { 1 si en la observación i-ésima se da el estado B;
0 si en la observación i-ésima se da el estado A }

entonces resultarı́a que F1i + F2i = 1, para todo i. Si el modelo incluye el


término constante (X1i = 1 para todo i), entonces la matriz X ya no
será de rango pleno, por ser sus columnas linearmente dependientes, y
X 0 X ya no será invertible porqué el determinante será cero y, como
consecuencia, β̂ no estará unı́vocamente determinado.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 9Tema


Econometrı́a
3: Variables
el modelo
FicticiasLineal Ezequiel Uriel 1990 Capı́tulo 8 (UCV) 18 / 20
La trampa de las variables ficticias

Análogamente, si la caracterı́stica cualitativa presenta n estados,


utilizaremos n − 1 variables ficticias si se incluye un término constante. Ası́,
por ejemplo, si se presentan tres estados o categorı́as, A, B y C , deben
definirse únicamente dos variables ficticias, F1i y F2i , por ejemplo, donde

F1i = { 1 si en la observación i-ésima se da el estado A;


0 si en la observación i-ésima se da el estado B o C }
F2i = { 1 si en la observación i-ésima se da el estado B;
0 si en la observación i-ésima se da el estado A o C }

Hay que tener bien presente que en este caso la categorı́a de referencia es
la categorı́a C , ya que F1i + F2i = 0 si y sólo si en la observación i-ésima
se da el estado C.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 9Tema


Econometrı́a
3: Variables
el modelo
FicticiasLineal Ezequiel Uriel 1990 Capı́tulo 8 (UCV) 19 / 20
La trampa de las variables ficticias

No obstante, cuando se trata de una sola caracterı́stica se pueden incluir


tantas variables ficticias como categorı́as se puedan diferenciar, siempre
que no exista término constante, para evitar el problema de la singularidad
de X 0 X . En este caso, la estimación del efecto diferencial vendrá dada por
la diferencia de las estimaciones de los parámetros que acompañan a las
correspondientes variables ficticias. Este procedimiento, a diferencia del
anterior, no se puede generalizar a varios grupos de variables ficticias.

Josep Navarro jm.navarro@ucv.es Gujarati Capı́tulos 9Tema


Econometrı́a
3: Variables
el modelo
FicticiasLineal Ezequiel Uriel 1990 Capı́tulo 8 (UCV) 20 / 20

También podría gustarte