Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Modelos no lineales
Cambio en las unidades de medida
Gabriel V. Montes-Rojas
Un factor cualitativo (vs. uno cuantitativo) es un factor cuya información tiene que
ser codificada en forma numérica para poder ser usado.
Definición: Una variable que toma valores 0 y 1 se define como VARIABLE DUMMY.
La categorı́a que tiene valor 0 se llama CATEGORIA BASE.
Ej. Sexo. female es una variable binaria que tiene 1 si sexo femenino, 0 si sexo
masculino. No importa cual es 1 o 0, lo importante es que distinga.
Ej. Estado civil. Para categorizar estado civil se puede necesitar más de dos
valores. 0 soltera/o, 1 casada/o, 2 divorciada/o, 3 viuda/o.
Ej. Nacionalidad. Para categorizar la nacionalidad se necesita una variable que
tome más de dos valores. 0 Argentina, 1 Uruguay, 2 Brasil, 3 Paraguay, 4 Chile,
5 otros.
En los dos últimos casos hay más de una dummy. Como regla, si hay Q categorı́as
necesitamos Q − 1 dummies. (ver más abajo)
Consideremos el modelo:
β 0 + β 1 educ
β 0 + δ0 + β 1 educ
β0
β 0 + δ0
educ
Gabriel Montes-Rojas Información cualitativa y modelos no lineales
Información cualitativa
Variables dummy
Modelos no lineales
Interacciones
Cambio en las unidades de medida
y
wage = β′0 + α0 male + β′1 educ + e
donde male = 1 − female, cumplen las relaciones β′0 + α0 = β 0 , β 0 + δ0 = β′0 , β 1 = β′1 .
Esto significa que la selección de la categorı́a base no tiene ningún efecto sobre los
resultados. Sólo para el intercepto.
β̂ 1 = ȳ1 − ȳ0 .
N N
N0 N
∑ (xi − x̄ )(yi − ȳ ) = ∑ xi (yi − ȳ ) = N1 ȳ1 − N1 ȳ = N1 ȳ1 − N1 N 0
ȳ + 1 ȳ1
N
i =1 i =1
N12 N N N 2 + N0 N1 − N12 N N N N
= (N1 − )ȳ − 0 1 ȳ0 = 1 ȳ1 − 0 1 ȳ0 = 0 1 (ȳ1 − ȳ0 ).
N 1 N N N N
Haciendo lo mismo para el denominador, donde reemplazamos y por x, llegamos al resultado
N N0 N1
∑ (xi − x̄ )2 = N
.
i =1
y = α + γd + βx + δ(d × x ) + u
(d × x ) es la interacción.
Este modelo permite dos pendientes de acuerdo a la clasificación de d, β y β + δ.
Notar que E [y |d = 0] = α + βE [x |d = 0] y que
E [y |d = 1] = α + γ + ( β + δ)E [x |d = 1]. También, E [y |d = 0, x ] = α + βx y
E [y |d = 1, x ] = α + γ + ( β + δ)x. ¿Cuál es la diferencia entre estos términos?
β 0 + β 1 educ
β0
( β 0 + δ0 ) + ( β 1 + δ1 )educ
β 0 + δ0
educ
Gabriel Montes-Rojas Información cualitativa y modelos no lineales
Información cualitativa
Variables dummy
Modelos no lineales
Interacciones
Cambio en las unidades de medida
STATA: dummies
Una variable dummy se implementa como cualquier otra variable independiente.
Supongamos que queremos ver el efecto de la variable z, que tiene categorı́as
múltiples. Z ∈ 0, 1, 2, ..., J
Para ver la distribución de z en la muestra:
tab z
Para ver los valores de y para distintos z en la muestra:
tab z, summ(y)
Para ver un histograma de z:
hist z
En forma general, si tenemos más de dos categorı́as, ej. Q, necesitamos Q − 1.
Esto se implementa automáticamente en STATA
xi: reg y i.z x1 x2 x3
Nota: Por default, STATA omite el valor de z del primer grupo. Pero esto se
puede cambiar (por ej. z=2)
char z[omit] 2
Más detalles:
http://www.stata.com/help.cgi?xi
STATA
clear
set more off
set obs 100
gen d=rnormal(0,1)>0
gen u=rnormal(0,1)
gen y=1+1*d+u
reg y d
bys d: summ y
ttest y, by(d)
Las dummies en R se pueden crear con las funciones lógicas. Sea var una variable,
entonces (var>0) genera automáticamente la variable dummy con TRUE (valor 1) y
FALSE (valor 0) dependiende la pregunta lógica si var es mayor a cero o no.
d<−( rnorm ( 1 0 0 , 0 , 1 ) > 0 ) ;
u<−rnorm ( 1 0 0 , 0 , 1 ) ;
y<−1+1∗d+u ;
lm ( y ˜d )
Modelos cuadráticos
∂E (wage |exper )
= β 1 + 2β 2 exper
∂exper
En palabras, el efecto de exper sobre wage no es lineal, y el efecto lineal (pendiente)
depende de los valores de exper .
Pregunta: Supongamos que queremos hacer inferencia sobre el valor máximo o
β
mı́nimo de la variable exper sobre wage. Notar que expermax = − 2β12 .
¿Cómo contrastarı́a por expermax = e? ¿Cómo contrastarı́a por wagemax = w ?
Logaritmos
(error estándar); < p − valor >; [t − valor ]; * significancia 10%; ** significancia 5%;
*** significancia 1%
Logaritmos
ˆ = 100[exp ( β̂ 1 ∆x ) − 1]
%∆y
Logaritmos
Ejemplos
http://fmwww.bc.edu/gstat/examples/wooldridge/wooldridge7.html
Regresiones en STATA
Evaluar los comandos test y testnl en STATA para hacer inferencia sobre estos
modelos.
Para implementar logaritmos se debe transformar la variable en log.
Por ejemplo,
gen lwage=ln(wage)
reg lwage educ
gen leduc=ln(educ)
reg wage leduc
reg lwage leduc
Regresiones en R
Call :
lm ( f o r m u l a = l o g ( wage ) ˜ l o g ( e d u c ) + I ( l o g ( wage ) ˆ 2 ) , d a t a = wage1 [ which ( wage1 $ e d u c >
0) , ] )
Coefficients :
( Intercept ) l o g ( educ ) I ( l o g ( wage ) ˆ 2 )
0.72796 0.03952 0.27297
wage = β 0 + β 1 educ + u
wage = γ0 + γ1 educm + u
¿Cómo se comparan β y γ?
∆wage ∆wage
β1 = ∆educ = .
∆educ ∗ 12
12
∆wage ∆wage
β 1 /12 = ∆educ ∗12 = ∆educm = γ1 .
¿Qué pasa con las constantes?
wage = β 0 + β 1 educ + u
wagec = γ0 + γ1 educ + u
¿Cómo se comparan β y γ?
wage ∗ 100 = β 0 ∗ 100 + β 1 educ ∗ 100 = wagec = γ0 + γ1 ∗ educ entonces
β 1 = γ1 /100