Está en la página 1de 31

Tema 7:

Variables Ficticias
Mximo Camacho

Mximo Camacho

Econometra I - ADE+D 11/12 - Tema 7

Variables ficticias
i

Bloque I: El modelo lineal clsico


r

Tema 1: Introduccin a la econometra

Tema 2: El modelo de regresin lineal

Tema 3: El mtodo MCO

Tema 4: Propiedades de la estimacin MCO

Tema 5: Inferencia y prediccin

Bloque II: Extensiones al modelo lineal clsico


r

Tema 6: Multicolinealidad

Tema 7: Variables ficticias

Tema 8: Heteroscedasticidad

Tema 9: Endogeneidad

Mximo Camacho

Econometra I - ADE+D 11/12 - Tema 7

Descripcin de la clase

Introduccin

Variables ficticias nicas con dos estados

Variables ficticias en casos ms generales

Ms de dos estados

Ms de una ficticia

Siempre usaremos datos reales

Mximo Camacho

Econometra I - ADE+D 11/12 - Tema 7

1. Introduccin
1.1. Ejemplo de clase

Imaginemos que en una regin (California) los responsables de educacin quieren


estudiar notas en 420 colegios en funcin estudiantes por profesor. Datos en 1998
i

Notas Yi

Ratio estudiantes por profesor Xi (REP)

Aunque no la incluiremos como explicativa, tenemos informacin


Porcentaje de alumnos que no hablan bien el idioma (PNI)

Cmo estimamos esta relacin?

Modelo lineal clsico

Mximo Camacho

Econometra I - ADE+D 11/12 - Tema 7

1. Introduccin
1.2. Supuestos del modelo lineal clsico

Suponemos relacin lineal entre las variables


Yi = 0 + 1 X 1i + ... + k X ki + i

Y = X +

Yi = i ' + i

Supuestos
E ( i i ) = E ( i ) = 0

Exogeneidad dbil

Muestras aleatorias

Momentos cuartos finitos

No multicolinealidad exacta

Normalidad

Homoscedasticidad

Mximo Camacho

E ( i j ) = E ( i ) = 0

E ( i j ) = E ( i )E ( j ) = 0

( )

( )

( )

0 < E i4 < ,0 < E X 14i < ,...,0 < E X ki4 <

X 1 ,..., X n no son linealmente dependientes

X~N
var( i X ) = 2i

Econometra I - ADE+D 11/12 - Tema 7

2. Variables ficticias

Cmo tratar informacin cualitativa?


Notasi = 698.93 2.27 REP1i

Notasi = 0 + 1REPi + i

( 9.46 )

(0.48 )

Definimos centros con problemas de aprendizaje aquellos con PNI > 10%.

Se cumple la relacin anterior para esos 192 centros (en azul)?

Notas

720

720

700

700

680

680

660

660

640

640

620

620

600

600

10

Mximo Camacho

15

20

25

REP

30

Notas

10

15

Econometra I - ADE+D 11/12 - Tema 7

20

25

REP

30

2. Variables ficticias

Permiten tratar informacin cualitativa

Ejemplos
i

Sexo en la determinacin de salarios

Estacin del ao en el consumo de helados

Pertenecer a la UE en la determinacin del crecimiento econmico

Entrar en bancarrota en la prediccin de beneficios

Variables binarias cero-uno

Se introducen en el modelo como explicativas adicionales

Mximo Camacho

Econometra I - ADE+D 11/12 - Tema 7

3. Variables ficticias nicas con dos estados


3.1. Variables ficticias aditivas

Supondremos que la cualidad slo afecta a la constante


i

Si no tenemos en cuenta la cualidad

192 primeros tienen problemas de aprendizaje ( PNI 10% )

Esperamos que el componente autnomo de sus notas sea menor


720

Notas

700
680
660
640
620
600
10

Mximo Camacho

15

20

25

REP

30

Econometra I - ADE+D 11/12 - Tema 7

3. Variables ficticias nicas con dos estados


3.1. Variables ficticias aditivas

Podemos estimar MCO por submuestras?


i

Nada asegura que la pendiente sea la misma


r

MCO en NP

Notasi = 687 .88 2.24 REPi

MCO en P

Notasi = 682 .24 0.96 REPi

Solucin: variables ficticias aditivas


i

Creamos FPi valga 1 si el colegio tiene problemas de aprendizaje (PNI 10%)

Creamos FNPi valga 1 si el colegio no tiene problemas de aprendizaje (PNI <10%)

En principio, vamos a aadir aditivamente las dos ficticias

Yi = a0 + b0 FNPi + c0 FPi + 1 X i + i
Mximo Camacho

i NP E (Yi / X i ) = a0 + b0 + 1 X i
i P E (Yi / X i ) = a0 + c0 + 1 X i

Econometra I - ADE+D 11/12 - Tema 7

3. Variables ficticias nicas con dos estados


3.1. Variables ficticias aditivas

En principio la ficticia parece que no viola ningn supuesto clsico

Problema: trampa de las ficticias

Yi = a0 + b0 FNPi + c0 FPi + 1 X i + i

El modelo propuesto

En forma matricial

Donde X presenta multicolinelaidad exacta (vase tema 6)

Y = X +


1
X =
1

X1

0
1

1
0

X 192
X 193

X 420

Por tanto no podemos encontrar de forma nica

Mximo Camacho

= ( X ' X )1 X ' Y

Econometra I - ADE+D 11/12 - Tema 7

10

3. Variables ficticias nicas con dos estados


3.1. Variables ficticias aditivas

Solucin 1 a la trampa de las ficticias


i

No incluimos la constante

720

Partimos del modelo Yi = a0 + b0 FNPi + c0 FPi + 1 X i + i

Usamos la relacin 1 = FNPi + FPi

Estimamos

Yi = (a0 + b0 )FNPi + (a0 + c0 )FPi + 1 X i + i

Notasi = 692 .36 FNPi + 672 .82 FPi 1.49 REPi

Notas

700
680
660
640
620
600
10

Mximo Camacho

15

20

25

REP

30

Econometra I - ADE+D 11/12 - Tema 7

11

3. Variables ficticias nicas con dos estados


3.1. Variables ficticias aditivas

Solucin 2 a la trampa de las ficticias


i

No incluimos alguna explicativa

720

Partimos del modelo Yi = a0 + b0 FNPi + c0 FPi + 1 X i + i

Usamos la relacin FNPi = 1 - FPi

Estimamos

Yi = (a0 + b0 ) + (c0 b0 )FPi + 1 X i + i

Notasi = 692 .36 19.53 FPi 1.49 REPi

Notas

700
680
660
640
620
600
10

Mximo Camacho

15

20

25

REP

30

Econometra I - ADE+D 11/12 - Tema 7

12

3. Variables ficticias nicas con dos estados


3.1. Variables ficticias aditivas

Contrastes
i

Tenemos que contrastar si efectivamente hay dos constantes distintas


Notasi = 0 + 0 FPi + 1 X i + i

H 0 : 0 = 0

Notasi = 692.36 19.53 FPi 1.49 X i

t =

( 0.41)

RH 0

( )

var 0

= 12.39
*

t = 12.39

t417,0.025 = 1.96

Mximo Camacho

(1.57 )

( 8.12 )

H a : 0 0

-1.96

Econometra I - ADE+D 11/12 - Tema 7

1.96
13

3. Variables ficticias nicas con dos estados


3.2. Variables ficticias multiplicativas

Supondremos que la cualidad slo afecta a la pendiente


i

Si no tenemos en cuenta la cualidad

192 primeros tienen problemas de aprendizaje ( PNI 10% )

Esperamos: reducir REP tenga ms efecto en notas en los colegios P (PNI 10%)

720

Notas

700
680
660
640
620
600
10

Mximo Camacho

15

20

25

REP

30

Econometra I - ADE+D 11/12 - Tema 7

14

3. Variables ficticias nicas con dos estados


3.2. Variables ficticias multiplicativas

Podemos estimar MCO por submuestras?


i

Nada asegura que la constante estimada sea la misma


r

MCO en NP

Notasi = 687 .88 2.24 REPi

MCO en P

Notasi = 682 .24 0.96 REPi

Solucin: variables ficticias multiplicativas


i

Creamos FPi valga 1 si el colegio tiene problemas de aprendizaje (PNI 10%)

Creamos FNPi valga 1 si el colegio no tiene problemas de aprendizaje (PNI < 10%)

En principio, vamos a aadir multiplicativamente las dos ficticias

Yi = a0 + 1 X i + b0 FNPi X i + c0 FPi X i + i
Mximo Camacho

i NP E (Yi / X i ) = a0 + (1 + b0 )X i
i P E (Yi / X i ) = a0 + (1 + c0 )X i

Econometra I - ADE+D 11/12 - Tema 7

15

3. Variables ficticias nicas con dos estados


3.2. Variables ficticias multiplicativas

En principio la ficticia parece que no viola ningn supuesto clsico

Problema: trampa de las ficticias

Yi = a0 + 1 X i + b0 FNPi X i + c0 FPi X i + i

El modelo propuesto

En forma matricial

Donde X presenta multicolinelaidad exacta (vase tema 6)


1


1
X =
1

Y = X +

X1

X 192
X 193

0
X 193

X 420

X 420

X 1


X 192

Por tanto no podemos encontrar de forma nica

Mximo Camacho

= ( X ' X )1 X ' Y

Econometra I - ADE+D 11/12 - Tema 7

16

3. Variables ficticias nicas con dos estados


3.2. Variables ficticias multiplicativas

Solucin 1 a la trampa de las ficticias


i

No incluimos la pendiente
Yi = a0 + 1 X i + b0 FNPi X i + c0 FPi X i + i

Partimos del modelo

Usamos la relacin 1 = FNPi + FPi

Estimamos

720

Yi = a0 + (1 + b0 )FNPi X i + (1 + c0 )FPi X i + i

Notasi = 684 .47 1.08 FNPi X i 2.07 FPi X i

Notas

700
680
660
640
620
600
10

Mximo Camacho

15

20

25

REP

30

Econometra I - ADE+D 11/12 - Tema 7

17

3. Variables ficticias nicas con dos estados


3.2. Variables ficticias multiplicativas

Solucin 2 a la trampa de las ficticias


i

No incluimos una de las ficticias


Yi = a0 + b0 FNPi X i + c0 FPi X i + 1 X i + i

Partimos del modelo

Usamos la relacin FNPi = 1 - FPi

Estimamos

720

Yi = a0 + (1 + b0 )X i + (c0 b0 )FPi X i + i

Notasi = 684 .47 1.08 X i 0.99 FPi X i

Notas

700
680
660
640
620
600
10

Mximo Camacho

15

20

25

REP

30

Econometra I - ADE+D 11/12 - Tema 7

18

3. Variables ficticias nicas con dos estados


3.2. Variables ficticias multiplicativas

Contrastes
i

Tenemos que contrastar si efectivamente hay dos pendientes distintas


Notasi = 0 + 1 X i + 1 FPi X i + i

H 0 : 1 = 0

Notasi = 684.47 1.08 X i 0.99 FPi X i


( 8.16 )

H a : 1 0

t* =

(0.07 )

RH 0

( )

var 1

= 12.51
*

t = 12.51

t417,0.025 = 1.96

Mximo Camacho

( 0.42 )

-1.96

Econometra I - ADE+D 11/12 - Tema 7

1.96
19

3. Variables ficticias nicas con dos estados


3.3. Variables ficticias aditivas y multiplicativas

Supondremos que la cualidad afecta la constante y pendiente


i

Si no tenemos en cuenta la cualidad

Si la tenemos en cuenta, esperamos


i
i

Colegios NP tengan sistemticamente ms notas


Reducir REP tenga ms efecto en notas en los colegios P (PNI 10%)
Notas
720
700
680
660
640
620
600
10

Mximo Camacho

15

20

25

REP

30

Econometra I - ADE+D 11/12 - Tema 7

20

3. Variables ficticias nicas con dos estados


3.3. Variables ficticias aditivas y multiplicativas

Segn la discusin anterior, para evitar trampa de las ficticias


Notasi = 0 + 0 FPi + 1 X i + 1FPi X i + i

Contrastes: se conoce como contraste de cambio estructural o de Chow


H 0 : 0 = 1 = 0
H a : no H 0

F* =

Notasi = 682.24+ 5.63 FPi 0.96 X i 1.27 FPi X i e' e = 104903


(10.51)

(16.71)

( 0.53)

(0.84 )

Notasi = 698 .93 2.28 X i eR ' eR = 144315

(eR ' eR e' e) q = (144315 104903) 2 = 78.14 > F


2, , 0.05 = 3.00 RH 0
e' e (n K )
104903 (420 4)

Cuidado con la multicolinealidad t* = 0.53


0

t1 = 1.51

Ninguna de las ficticias son significativas individualmente por multicolinelaidad

No hacer contrastes individuales mejor incluirlas una a una

Mximo Camacho

Econometra I - ADE+D 11/12 - Tema 7

21

4. Variables ficticias ms generales


4.1. Ms de dos estados

Supongamos
i

Mismo ejemplo notas y ratio estudiantes por profesor

Cualidad: colegios con problemas de aprendizaje en funcin PNI

Los problemas de aprendizaje afectan: ahora distinguimos tres estados


4

Colegios sin problemas: PNIi [0-10) FNPi = 1

Colegios con pocos problemas: PNIi [10-50) FPPi = 1

Colegios con muchos problemas: PNIi [50-100) FMPi = 1

Slo afectan al componente autnomo

No podemos incluir las tres ficticias y constante (trampa de las ficticias)

Solucin
4

Mximo Camacho

Incluir dos ficticias y trmino constante


Econometra I - ADE+D 11/12 - Tema 7

22

4. Variables ficticias ms generales


4.1. Ms de dos estados

Partimos del modelo


Notasi = 690.46 16.78 FPPi 36.00 FMPi 1.39 X i e' e = 96662
( 7.78)

(1.57 )

(0.39 )

( 3.07 )

Contraste significatividad de las ficticias


*

F = 102.53 > F2,,0.05 = 3.00 RH 0


Notas
720
700
680
660
640
620
600
10

Mximo Camacho

15

20

25

REP

30

Econometra I - ADE+D 11/12 - Tema 7

23

4. Variables ficticias ms generales


4.2. Ms de una variable ficticia

Nuevo ejemplo: Grado de sincronizacin ciclo econmico UE


i

Hay ms sincronizacin entre los que ya pertenecen?

Afecta tener frontera?

Cmo medimos sincronizacin entre dos pases?


i
i

Datos del IPI 1990.1-2004.3


Correlacin entre ellos (dos a dos)

Cuntos pases?
i

15 Unin Europea

12 Acceden excepto Malta y Bulgaria

1 Negocia: Turqua

4 pases industrializados:
( EE.UU, Japn, Canada, Noruega)

Tamao muestral: 435 datos de correlacin

Mximo Camacho

Econometra I - ADE+D 11/12 - Tema 7

24

4. Variables ficticias ms generales


4.2. Ms de una variable ficticia

Supongamos
i

La sincronizacin puede ser mayor


4

Ya pertenecan a UE antes de ampliacin: creamos ficticia FUEi = 1 cuando la


sincronizacin se mida entre dos de los 15

Comparten frontera: creamos ficticia FFi = 1 cuando la sincronizacin se mida


entre dos que comparten frontera

Slo afectan al componente autnomo

No podemos todas las ficticias y constante (trampa de las ficticias)

Solucin
4

Incluir dos ficticias FUEi y FFi y trmino constante

Posibilidad de efecto interaccin

Mximo Camacho

Econometra I - ADE+D 11/12 - Tema 7

25

4. Variables ficticias ms generales


4.2. Ms de una variable ficticia

Partimos del modelo

yi = a0 + b0 FUEi + c0 FFi + d 0 FUEi FFi + i

Posibilidades
FUEi = 0
FUEi = 1
FFi = 0
a0
a0+b0
FFi = 1
a0+c0
a0+c0 +b0+d0

Efecto interaccin

Mximo Camacho

Econometra I - ADE+D 11/12 - Tema 7

26

4. Variables ficticias ms generales


4.2. Ms de una variable ficticia
Existe correlacin positiva?

yi = a + i

Estimacin MCO
y i = 0.23
( 0.01)

Es significativa?

H 0 : a = 0

H a : a 0

RH 0

t=

0.23
= 23.0
0.01

t = 23.0

-1.96
Mximo Camacho

Econometra I - ADE+D 11/12 - Tema 7

1.96
27

4. Variables ficticias ms generales


4.2. Ms de una variable ficticia
Hay ms sincronizacin entre los que ya pertenecen a la UE?
i

Creamos FUEi = 1 si la sincronizacin se mide entre dos UE

Proponemos el modelo

yi = a + bFUEi + i
i

Estimacin MCO

y i = 0.20+ 0.08 FUEi


( 0.01)

( 0.02)

Contraste

H 0 : b = 0

H a : b 0
Mximo Camacho

t =

0.08
= 4.0
0.02

Econometra I - ADE+D 11/12 - Tema 7

S afecta ser de UE

28

4. Variables ficticias ms generales


4.2. Ms de una variable ficticia
Hay ms sincronizacin entre los que tienen frontera?
i

Creamos FFi = 1 si la sincronizacin se mide entre dos con frontera

Proponemos el modelo

yi = a + bFUEi + cFFi + i
i

Estimacin MCO

y i = 0.20+ 0.08 FUEi + 0.13 FFi


( 0.01)

( 0.02)

( 0.04)

Contraste

H 0 : c = 0

H a : c 0
Mximo Camacho

t =

0.13
= 3.2
0.04

Econometra I - ADE+D 11/12 - Tema 7

S afecta tener frontera

29

4. Variables ficticias ms generales


4.2. Ms de una variable ficticia

Existe efecto interaccin?


i

Proponemos el modelo

Estimacin MCO

yi = a + bFUEi + cFFi + dFUEi FFi + i

y i = 0.20+ 0.06 FUEi + 0.09 FFi + 0.09 FUEi FFi


( 0.01)

( 0.02)

( 0.07 )

Contraste

H 0 : d = 0

H a : d 0
i

( 0.04)

t =

0.09
= 1.3 < 1.96
0.07

Hay efecto interaccin?

A favor del efecto interaccin


r

Hay razones econmicas para pensar que s

Si hay multico el | t* |<< 1 para eliminarla y no es el caso

En contra: la multico suele afectar a la significatividad de varias explicativas

Mximo Camacho

Econometra I - ADE+D 11/12 - Tema 7

30

5. Qu hemos aprendido?

Concepto de variables ficticias


i

Secuencias de 1 y 0

Nos sirven para introducir en el modelo aspectos cualitativos

Ficticias aditivas y multiplicativas


i

Al principio, nicas y con dos estados

Cuidado con trampa de ficticias

Contraste de cambio estructural

Ms tarde:
i

Ms de dos estados: introducir tantas ficticias como estados menos una

Ms de una ficticia: posibilidad de efecto interaccin

Mximo Camacho

Econometra I - ADE+D 11/12 - Tema 7

31