Está en la página 1de 23

Información cualitativa

Modelos no lineales
Cambio en las unidades de medida

Información cualitativa y modelos no lineales

Gabriel V. Montes-Rojas

Gabriel Montes-Rojas Información cualitativa y modelos no lineales


Información cualitativa
Variables dummy
Modelos no lineales
Interacciones
Cambio en las unidades de medida

Variable binaria o dummy

Un factor cualitativo (vs. uno cuantitativo) es un factor cuya información tiene que
ser codificada en forma numérica para poder ser usado.

Definición: Una variable que toma valores 0 y 1 se define como VARIABLE DUMMY.
La categorı́a que tiene valor 0 se llama CATEGORIA BASE.

Ej. Sexo. female es una variable binaria que tiene 1 si sexo femenino, 0 si sexo
masculino. No importa cual es 1 o 0, lo importante es que distinga.
Ej. Estado civil. Para categorizar estado civil se puede necesitar más de dos
valores. 0 soltera/o, 1 casada/o, 2 divorciada/o, 3 viuda/o.
Ej. Nacionalidad. Para categorizar la nacionalidad se necesita una variable que
tome más de dos valores. 0 Argentina, 1 Uruguay, 2 Brasil, 3 Paraguay, 4 Chile,
5 otros.

En los dos últimos casos hay más de una dummy. Como regla, si hay Q categorı́as
necesitamos Q − 1 dummies. (ver más abajo)

Gabriel Montes-Rojas Información cualitativa y modelos no lineales


Información cualitativa
Variables dummy
Modelos no lineales
Interacciones
Cambio en las unidades de medida

Variable binaria o dummy

Consideremos el modelo:

wage = β 0 + δ0 female + β 1 educ + u


En este caso female no es una variable contı́nua, pero δ0 tiene la misma interpretación
que otros coeficientes. En particular, cuál es el cambio en wage cuando la variable
female se incrementa ceteris paribus una unidad. En el caso particular de las dummies
se obtiene:

δ0 = E (wage |female = 1, educ ) − E (wage |female = 0, educ )


Notar que este efecto es independiente del nivel de educ, es decir, se mantiene para
todo nivel de educación.

Gabriel Montes-Rojas Información cualitativa y modelos no lineales


Información cualitativa
Variables dummy
Modelos no lineales
Interacciones
Cambio en las unidades de medida

Discriminación por género


wage = β 0 + δ0 female + β 1 educ + u, δ0 < 0
wage

β 0 + β 1 educ

β 0 + δ0 + β 1 educ
β0

β 0 + δ0

educ
Gabriel Montes-Rojas Información cualitativa y modelos no lineales
Información cualitativa
Variables dummy
Modelos no lineales
Interacciones
Cambio en las unidades de medida

Gabriel Montes-Rojas Información cualitativa y modelos no lineales


Información cualitativa
Variables dummy
Modelos no lineales
Interacciones
Cambio en las unidades de medida

Variable binaria o dummy

Ejercicio: Probar que el modelo

wage = β 0 + δ0 female + β 1 educ + u

y
wage = β′0 + α0 male + β′1 educ + e
donde male = 1 − female, cumplen las relaciones β′0 + α0 = β 0 , β 0 + δ0 = β′0 , β 1 = β′1 .

Esto significa que la selección de la categorı́a base no tiene ningún efecto sobre los
resultados. Sólo para el intercepto.

Pregunta: ¿Cuál es el problema con este modelo?

wage = β 0 + δ0 female + α0 male + β 1 educ + u

Gabriel Montes-Rojas Información cualitativa y modelos no lineales


Información cualitativa
Variables dummy
Modelos no lineales
Interacciones
Cambio en las unidades de medida

Variable binaria o dummy


Supongamos un caso particular del modelo yi = β 0 + β 1 xi + ui , E [u |x ] = 0, donde x
es una variable dummy y donde hay N1 observaciones con x = 1 y N0 con x = 0, tal
que N0 + N1 = N. Definamos ȳ1 = N11 ∑N 1 N
i =1 yi 1[xi = 1], ȳ0 = N0 ∑i =1 yi 1[xi = 0],
x̄1 = N11 ∑N
i =1 xi 1[xi = 1] = 1, x̄0 =
1
N0 ∑N
i =1 xi 1[xi = 0] = 0.
Mostrar que

β̂ 1 = ȳ1 − ȳ0 .

Prueba: Tomemos el numerador del estimador de MCO.

N N 
N0 N

∑ (xi − x̄ )(yi − ȳ ) = ∑ xi (yi − ȳ ) = N1 ȳ1 − N1 ȳ = N1 ȳ1 − N1 N 0
ȳ + 1 ȳ1
N
i =1 i =1

N12 N N N 2 + N0 N1 − N12 N N N N
= (N1 − )ȳ − 0 1 ȳ0 = 1 ȳ1 − 0 1 ȳ0 = 0 1 (ȳ1 − ȳ0 ).
N 1 N N N N
Haciendo lo mismo para el denominador, donde reemplazamos y por x, llegamos al resultado

N N0 N1
∑ (xi − x̄ )2 = N
.
i =1

Gabriel Montes-Rojas Información cualitativa y modelos no lineales


Información cualitativa
Variables dummy
Modelos no lineales
Interacciones
Cambio en las unidades de medida

Gabriel Montes-Rojas Información cualitativa y modelos no lineales


Información cualitativa
Variables dummy
Modelos no lineales
Interacciones
Cambio en las unidades de medida

Efectos individuales y compuestos: interacciones

Las variables dummy pueden ser combinadas para efectos compuestos.


Supongamos que d1 and d2 son dos variables dummy que reflejan dos categorı́as
binarias diferentes (ejemplo género y casado). Definamos la interacción como
d1 × d2 . Consideremos el modelo

y = α + γd1 + δd2 + ϕ(d1 × d2 ) + u


¿Cómo se interpretan α, γ, δ, ϕ? Notar que E [y |d1 = 0, d2 = 0] = α,
E [y |d1 = 1, d2 = 0] = α + γ, E [y |d1 = 0, d2 = 1] = α + δ,
E [y |d1 = 1, d2 = 1] = α + γ + δ + ϕ.
Notar que ϕ se puede interpretar como estimador de diferencias en diferencias
(d-en-d):
ϕ = {E [y |d1 = 1, d2 = 1] − E [y |d1 = 0, d2 = 1]} −
{E [y |d1 = 1, d2 = 0] − E [y |d1 = 0, d2 = 0]}.

Gabriel Montes-Rojas Información cualitativa y modelos no lineales


Información cualitativa
Variables dummy
Modelos no lineales
Interacciones
Cambio en las unidades de medida

Efectos individuales y compuestos: interacciones

Supongamos que queremos contrastar si una variable continua, X , tiene


distintas pendientes en distintos grupos, dados por la variable dummy D.

y = α + γd + βx + δ(d × x ) + u

(d × x ) es la interacción.
Este modelo permite dos pendientes de acuerdo a la clasificación de d, β y β + δ.
Notar que E [y |d = 0] = α + βE [x |d = 0] y que
E [y |d = 1] = α + γ + ( β + δ)E [x |d = 1]. También, E [y |d = 0, x ] = α + βx y
E [y |d = 1, x ] = α + γ + ( β + δ)x. ¿Cuál es la diferencia entre estos términos?

Gabriel Montes-Rojas Información cualitativa y modelos no lineales


Información cualitativa
Variables dummy
Modelos no lineales
Interacciones
Cambio en las unidades de medida

Discriminación por género wage =


β 0 + δ0 female + β 1 educ + δ1 female × educ + u, δ0 < 0, δ1 > 0
wage

β 0 + β 1 educ

β0
( β 0 + δ0 ) + ( β 1 + δ1 )educ
β 0 + δ0

educ
Gabriel Montes-Rojas Información cualitativa y modelos no lineales
Información cualitativa
Variables dummy
Modelos no lineales
Interacciones
Cambio en las unidades de medida

STATA: dummies
Una variable dummy se implementa como cualquier otra variable independiente.
Supongamos que queremos ver el efecto de la variable z, que tiene categorı́as
múltiples. Z ∈ 0, 1, 2, ..., J
Para ver la distribución de z en la muestra:
tab z
Para ver los valores de y para distintos z en la muestra:
tab z, summ(y)
Para ver un histograma de z:
hist z
En forma general, si tenemos más de dos categorı́as, ej. Q, necesitamos Q − 1.
Esto se implementa automáticamente en STATA
xi: reg y i.z x1 x2 x3
Nota: Por default, STATA omite el valor de z del primer grupo. Pero esto se
puede cambiar (por ej. z=2)
char z[omit] 2
Más detalles:
http://www.stata.com/help.cgi?xi

Gabriel Montes-Rojas Información cualitativa y modelos no lineales


Información cualitativa
Variables dummy
Modelos no lineales
Interacciones
Cambio en las unidades de medida

STATA

clear
set more off
set obs 100
gen d=rnormal(0,1)>0
gen u=rnormal(0,1)
gen y=1+1*d+u

reg y d
bys d: summ y
ttest y, by(d)

Gabriel Montes-Rojas Información cualitativa y modelos no lineales


Información cualitativa
Variables dummy
Modelos no lineales
Interacciones
Cambio en las unidades de medida

Las dummies en R se pueden crear con las funciones lógicas. Sea var una variable,
entonces (var>0) genera automáticamente la variable dummy con TRUE (valor 1) y
FALSE (valor 0) dependiende la pregunta lógica si var es mayor a cero o no.
d<−( rnorm ( 1 0 0 , 0 , 1 ) > 0 ) ;
u<−rnorm ( 1 0 0 , 0 , 1 ) ;
y<−1+1∗d+u ;
lm ( y ˜d )

Gabriel Montes-Rojas Información cualitativa y modelos no lineales


Información cualitativa
Modelos no lineales
Cambio en las unidades de medida

Modelos cuadráticos

Consideremos el siguiente modelo:

wage = β 0 + β 1 exper + β 2 exper 2 + u


En este caso,

∂E (wage |exper )
= β 1 + 2β 2 exper
∂exper
En palabras, el efecto de exper sobre wage no es lineal, y el efecto lineal (pendiente)
depende de los valores de exper .
Pregunta: Supongamos que queremos hacer inferencia sobre el valor máximo o
β
mı́nimo de la variable exper sobre wage. Notar que expermax = − 2β12 .
¿Cómo contrastarı́a por expermax = e? ¿Cómo contrastarı́a por wagemax = w ?

Gabriel Montes-Rojas Información cualitativa y modelos no lineales


Información cualitativa
Modelos no lineales
Cambio en las unidades de medida

Logaritmos

Consideremos el siguiente modelo log-lineal:

log wage = β 0 + β 1 educ + u


d wage
Resultado: d dlogeduc
wage wage
= d educ
En general funciona la siguiente aproximación: dwage
wage
≈ ∆wage
wage
≈ % cambio en wage
β 1 : Es el cambio porcentual en wage ante un cambio de una unidad en educ.

lwage = .584∗∗∗ + .083∗∗∗ educ


(.097) (.0076)
< 0.000 > < 0.000 >
[6.0] [10.9]

(error estándar); < p − valor >; [t − valor ]; * significancia 10%; ** significancia 5%;
*** significancia 1%

Gabriel Montes-Rojas Información cualitativa y modelos no lineales


Información cualitativa
Modelos no lineales
Cambio en las unidades de medida

Logaritmos

Sin embargo, la aproximación sólo funciona para pequeños cambios en la variable


independiente. El cálculo exacto es

ˆ = 100[exp ( β̂ 1 ∆x ) − 1]
%∆y

exp (.083) − 1 = .087 ̸= .083

Gabriel Montes-Rojas Información cualitativa y modelos no lineales


Información cualitativa
Modelos no lineales
Cambio en las unidades de medida

Logaritmos

Ahora consideremos el modelo log-log:

log wage = β 0 + β 1 log educ + u


Pregunta: ¿Qué significa β 1 en este modelo?

Gabriel Montes-Rojas Información cualitativa y modelos no lineales


Información cualitativa
Modelos no lineales
Cambio en las unidades de medida

Ejemplos

http://fmwww.bc.edu/gstat/examples/wooldridge/wooldridge7.html

Gabriel Montes-Rojas Información cualitativa y modelos no lineales


Información cualitativa
Modelos no lineales
Cambio en las unidades de medida

Regresiones en STATA

Para implementar modelos cuadráticos se debe crear el cuadrado de la variable.


Por ejemplo,
gen exper2=exper*exper
reg wage educ exper exper2

Evaluar los comandos test y testnl en STATA para hacer inferencia sobre estos
modelos.
Para implementar logaritmos se debe transformar la variable en log.
Por ejemplo,

gen lwage=ln(wage)
reg lwage educ
gen leduc=ln(educ)
reg wage leduc
reg lwage leduc

Gabriel Montes-Rojas Información cualitativa y modelos no lineales


Información cualitativa
Modelos no lineales
Cambio en las unidades de medida

Regresiones en R

Ejemplo de wage1 del libro de Wooldridge.


l i b r a r y ( wooldridge )
lm ( l o g ( wage ) ˜ l o g ( e d u c )+ I ( l o g ( wage ) ˆ 2 ) , d a t a=wage1 [ which ( wage1 $ educ > 0 ) , ] )

Call :
lm ( f o r m u l a = l o g ( wage ) ˜ l o g ( e d u c ) + I ( l o g ( wage ) ˆ 2 ) , d a t a = wage1 [ which ( wage1 $ e d u c >
0) , ] )

Coefficients :
( Intercept ) l o g ( educ ) I ( l o g ( wage ) ˆ 2 )
0.72796 0.03952 0.27297

Gabriel Montes-Rojas Información cualitativa y modelos no lineales


Información cualitativa
Modelos no lineales
Cambio en las unidades de medida

Cambio en las unidades de medida

Es muy importante saber cuales son la unidades de medida en X e Y para interpretar


correctamente los parámetros estimados.
Ej.: Supongamos que educ se mide en meses, en vez de años como tenı́amos antes.
Definamos educm=12*educ

wage = β 0 + β 1 educ + u

wage = γ0 + γ1 educm + u

¿Cómo se comparan β y γ?
∆wage ∆wage
β1 = ∆educ = .
∆educ ∗ 12
12
∆wage ∆wage
β 1 /12 = ∆educ ∗12 = ∆educm = γ1 .
¿Qué pasa con las constantes?

Gabriel Montes-Rojas Información cualitativa y modelos no lineales


Información cualitativa
Modelos no lineales
Cambio en las unidades de medida

Cambio en las unidades de medida

Ej.: supongamos que wage se mide en centavos. Definamos wagec=wage*100

wage = β 0 + β 1 educ + u

wagec = γ0 + γ1 educ + u

¿Cómo se comparan β y γ?
wage ∗ 100 = β 0 ∗ 100 + β 1 educ ∗ 100 = wagec = γ0 + γ1 ∗ educ entonces
β 1 = γ1 /100

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

También podría gustarte