Información Cualitativa y Modelos No Lineales

Información cualitativa
Modelos no lineales
Cambio en las unidades de medida
Información cualitativa y modelos no lineales
Gabriel V. Montes-Rojas
Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Variables dummy
Modelos no lineales
Interacciones
Variable binaria o dummy
Un factor cualitativo (vs. uno cuantitativo) es un factor cuya información tiene que
ser codificada en forma numérica para poder ser usado.
Definición: Una variable que toma valores 0 y 1 se define como VARIABLE DUMMY.
La categorı́a que tiene valor 0 se llama CATEGORIA BASE.
Ej. Sexo. female es una variable binaria que tiene 1 si sexo femenino, 0 si sexo
masculino. No importa cual es 1 o 0, lo importante es que distinga.
Ej. Estado civil. Para categorizar estado civil se puede necesitar más de dos
valores. 0 soltera/o, 1 casada/o, 2 divorciada/o, 3 viuda/o.
Ej. Nacionalidad. Para categorizar la nacionalidad se necesita una variable que
tome más de dos valores. 0 Argentina, 1 Uruguay, 2 Brasil, 3 Paraguay, 4 Chile,
5 otros.
En los dos últimos casos hay más de una dummy. Como regla, si hay Q categorı́as
necesitamos Q − 1 dummies. (ver más abajo)

Variables dummy
Modelos no lineales
Interacciones
Consideremos el modelo:
wage = β 0 + δ0 female + β 1 educ + u

En este caso female no es una variable contı́nua, pero δ0 tiene la misma interpretación
que otros coeficientes. En particular, cuál es el cambio en wage cuando la variable
female se incrementa ceteris paribus una unidad. En el caso particular de las dummies
se obtiene:
δ0 = E (wage |female = 1, educ ) − E (wage |female = 0, educ )

Notar que este efecto es independiente del nivel de educ, es decir, se mantiene para
todo nivel de educación.

Variables dummy
Modelos no lineales
Interacciones
Discriminación por género

wage = β 0 + δ0 female + β 1 educ + u, δ0 < 0
wage
β 0 + β 1 educ
β 0 + δ0 + β 1 educ
β0
β 0 + δ0
educ
Variables dummy
Modelos no lineales
Interacciones

Variables dummy
Modelos no lineales
Interacciones
Ejercicio: Probar que el modelo
wage = β 0 + δ0 female + β 1 educ + u
y
wage = β′0 + α0 male + β′1 educ + e
donde male = 1 − female, cumplen las relaciones β′0 + α0 = β 0 , β 0 + δ0 = β′0 , β 1 = β′1 .
Esto significa que la selección de la categorı́a base no tiene ningún efecto sobre los
resultados. Sólo para el intercepto.
Pregunta: ¿Cuál es el problema con este modelo?
wage = β 0 + δ0 female + α0 male + β 1 educ + u

Variables dummy
Modelos no lineales
Interacciones

Supongamos un caso particular del modelo yi = β 0 + β 1 xi + ui , E [u |x ] = 0, donde x
es una variable dummy y donde hay N1 observaciones con x = 1 y N0 con x = 0, tal
que N0 + N1 = N. Definamos ȳ1 = N11 ∑N 1 N
i =1 yi 1[xi = 1], ȳ0 = N0 ∑i =1 yi 1[xi = 0],
x̄1 = N11 ∑N
i =1 xi 1[xi = 1] = 1, x̄0 =
1
N0 ∑N
i =1 xi 1[xi = 0] = 0.
Mostrar que
β̂ 1 = ȳ1 − ȳ0 .
Prueba: Tomemos el numerador del estimador de MCO.
N N
N0 N

∑ (xi − x̄ )(yi − ȳ ) = ∑ xi (yi − ȳ ) = N1 ȳ1 − N1 ȳ = N1 ȳ1 − N1 N 0
ȳ + 1 ȳ1
N
i =1 i =1
N12 N N N 2 + N0 N1 − N12 N N N N
= (N1 − )ȳ − 0 1 ȳ0 = 1 ȳ1 − 0 1 ȳ0 = 0 1 (ȳ1 − ȳ0 ).
N 1 N N N N
Haciendo lo mismo para el denominador, donde reemplazamos y por x, llegamos al resultado
N N0 N1
∑ (xi − x̄ )2 = N
.
i =1

Variables dummy
Modelos no lineales
Interacciones

Variables dummy
Modelos no lineales
Interacciones
Efectos individuales y compuestos: interacciones
Las variables dummy pueden ser combinadas para efectos compuestos.

Supongamos que d1 and d2 son dos variables dummy que reflejan dos categorı́as
binarias diferentes (ejemplo género y casado). Definamos la interacción como
d1 × d2 . Consideremos el modelo
y = α + γd1 + δd2 + ϕ(d1 × d2 ) + u

¿Cómo se interpretan α, γ, δ, ϕ? Notar que E [y |d1 = 0, d2 = 0] = α,
E [y |d1 = 1, d2 = 0] = α + γ, E [y |d1 = 0, d2 = 1] = α + δ,
E [y |d1 = 1, d2 = 1] = α + γ + δ + ϕ.
Notar que ϕ se puede interpretar como estimador de diferencias en diferencias
(d-en-d):
ϕ = {E [y |d1 = 1, d2 = 1] − E [y |d1 = 0, d2 = 1]} −
{E [y |d1 = 1, d2 = 0] − E [y |d1 = 0, d2 = 0]}.

Variables dummy
Modelos no lineales
Interacciones
Efectos individuales y compuestos: interacciones
Supongamos que queremos contrastar si una variable continua, X , tiene

distintas pendientes en distintos grupos, dados por la variable dummy D.
y = α + γd + βx + δ(d × x ) + u
(d × x ) es la interacción.
Este modelo permite dos pendientes de acuerdo a la clasificación de d, β y β + δ.
Notar que E [y |d = 0] = α + βE [x |d = 0] y que
E [y |d = 1] = α + γ + ( β + δ)E [x |d = 1]. También, E [y |d = 0, x ] = α + βx y
E [y |d = 1, x ] = α + γ + ( β + δ)x. ¿Cuál es la diferencia entre estos términos?

Variables dummy
Modelos no lineales
Interacciones
Discriminación por género wage =

β 0 + δ0 female + β 1 educ + δ1 female × educ + u, δ0 < 0, δ1 > 0
wage
β 0 + β 1 educ
β0
( β 0 + δ0 ) + ( β 1 + δ1 )educ
β 0 + δ0
educ
Variables dummy
Modelos no lineales
Interacciones
STATA: dummies
Una variable dummy se implementa como cualquier otra variable independiente.
Supongamos que queremos ver el efecto de la variable z, que tiene categorı́as
múltiples. Z ∈ 0, 1, 2, ..., J
Para ver la distribución de z en la muestra:
tab z
Para ver los valores de y para distintos z en la muestra:
tab z, summ(y)
Para ver un histograma de z:
hist z
En forma general, si tenemos más de dos categorı́as, ej. Q, necesitamos Q − 1.
Esto se implementa automáticamente en STATA
xi: reg y i.z x1 x2 x3
Nota: Por default, STATA omite el valor de z del primer grupo. Pero esto se
puede cambiar (por ej. z=2)
char z[omit] 2
Más detalles:
http://www.stata.com/help.cgi?xi

Variables dummy
Modelos no lineales
Interacciones
STATA
clear
set more off
set obs 100
gen d=rnormal(0,1)>0
gen u=rnormal(0,1)
gen y=1+1*d+u
reg y d
bys d: summ y
ttest y, by(d)

Variables dummy
Modelos no lineales
Interacciones
Las dummies en R se pueden crear con las funciones lógicas. Sea var una variable,
entonces (var>0) genera automáticamente la variable dummy con TRUE (valor 1) y
FALSE (valor 0) dependiende la pregunta lógica si var es mayor a cero o no.
d<−( rnorm ( 1 0 0 , 0 , 1 ) > 0 ) ;
u<−rnorm ( 1 0 0 , 0 , 1 ) ;
y<−1+1∗d+u ;
lm ( y ˜d )

Modelos no lineales
Modelos cuadráticos
Consideremos el siguiente modelo:
wage = β 0 + β 1 exper + β 2 exper 2 + u

En este caso,
∂E (wage |exper )
= β 1 + 2β 2 exper
∂exper
En palabras, el efecto de exper sobre wage no es lineal, y el efecto lineal (pendiente)
depende de los valores de exper .
Pregunta: Supongamos que queremos hacer inferencia sobre el valor máximo o
β
mı́nimo de la variable exper sobre wage. Notar que expermax = − 2β12 .
¿Cómo contrastarı́a por expermax = e? ¿Cómo contrastarı́a por wagemax = w ?

Modelos no lineales
Logaritmos
Consideremos el siguiente modelo log-lineal:
log wage = β 0 + β 1 educ + u

d wage
Resultado: d dlogeduc
wage wage
= d educ
En general funciona la siguiente aproximación: dwage
wage
≈ ∆wage
wage
≈ % cambio en wage
β 1 : Es el cambio porcentual en wage ante un cambio de una unidad en educ.
lwage = .584∗∗∗ + .083∗∗∗ educ

(.097) (.0076)
< 0.000 > < 0.000 >
[6.0] [10.9]
(error estándar); < p − valor >; [t − valor ]; * significancia 10%; ** significancia 5%;
*** significancia 1%

Modelos no lineales
Logaritmos
Sin embargo, la aproximación sólo funciona para pequeños cambios en la variable

independiente. El cálculo exacto es
ˆ = 100[exp ( β̂ 1 ∆x ) − 1]
%∆y
exp (.083) − 1 = .087 ̸= .083

Modelos no lineales
Logaritmos
Ahora consideremos el modelo log-log:
log wage = β 0 + β 1 log educ + u

Pregunta: ¿Qué significa β 1 en este modelo?

Modelos no lineales
Ejemplos
http://fmwww.bc.edu/gstat/examples/wooldridge/wooldridge7.html

Modelos no lineales
Regresiones en STATA
Para implementar modelos cuadráticos se debe crear el cuadrado de la variable.

Por ejemplo,
gen exper2=exper*exper
reg wage educ exper exper2
Evaluar los comandos test y testnl en STATA para hacer inferencia sobre estos
modelos.
Para implementar logaritmos se debe transformar la variable en log.
Por ejemplo,
gen lwage=ln(wage)
reg lwage educ
gen leduc=ln(educ)
reg wage leduc
reg lwage leduc

Modelos no lineales
Regresiones en R
Ejemplo de wage1 del libro de Wooldridge.

l i b r a r y ( wooldridge )
lm ( l o g ( wage ) ˜ l o g ( e d u c )+ I ( l o g ( wage ) ˆ 2 ) , d a t a=wage1 [ which ( wage1 $ educ > 0 ) , ] )
Call :
lm ( f o r m u l a = l o g ( wage ) ˜ l o g ( e d u c ) + I ( l o g ( wage ) ˆ 2 ) , d a t a = wage1 [ which ( wage1 $ e d u c >
0) , ] )
Coefficients :
( Intercept ) l o g ( educ ) I ( l o g ( wage ) ˆ 2 )
0.72796 0.03952 0.27297

Modelos no lineales
Es muy importante saber cuales son la unidades de medida en X e Y para interpretar

correctamente los parámetros estimados.
Ej.: Supongamos que educ se mide en meses, en vez de años como tenı́amos antes.
Definamos educm=12*educ
wage = β 0 + β 1 educ + u
wage = γ0 + γ1 educm + u
¿Cómo se comparan β y γ?
∆wage ∆wage
β1 = ∆educ = .
∆educ ∗ 12
12
∆wage ∆wage
β 1 /12 = ∆educ ∗12 = ∆educm = γ1 .
¿Qué pasa con las constantes?

Modelos no lineales
Ej.: supongamos que wage se mide en centavos. Definamos wagec=wage*100
wage = β 0 + β 1 educ + u
wagec = γ0 + γ1 educ + u
¿Cómo se comparan β y γ?
wage ∗ 100 = β 0 ∗ 100 + β 1 educ ∗ 100 = wagec = γ0 + γ1 ∗ educ entonces
β 1 = γ1 /100

Información Cualitativa y Modelos No Lineales

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Información Cualitativa y Modelos No Lineales

Cargado por

Copyright:

Formatos disponibles

Información cualitativa

Información cualitativa y modelos no lineales

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Variable binaria o dummy

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Variable binaria o dummy

wage = β 0 + δ0 female + β 1 educ + u

δ0 = E (wage |female = 1, educ ) − E (wage |female = 0, educ )

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Discriminación por género

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Variable binaria o dummy

Ejercicio: Probar que el modelo

wage = β 0 + δ0 female + β 1 educ + u

Pregunta: ¿Cuál es el problema con este modelo?

wage = β 0 + δ0 female + α0 male + β 1 educ + u

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Variable binaria o dummy

Prueba: Tomemos el numerador del estimador de MCO.

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Efectos individuales y compuestos: interacciones

Las variables dummy pueden ser combinadas para efectos compuestos.

y = α + γd1 + δd2 + ϕ(d1 × d2 ) + u

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Efectos individuales y compuestos: interacciones

Supongamos que queremos contrastar si una variable continua, X , tiene

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Discriminación por género wage =

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Consideremos el siguiente modelo:

wage = β 0 + β 1 exper + β 2 exper 2 + u

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Consideremos el siguiente modelo log-lineal:

log wage = β 0 + β 1 educ + u

lwage = .584∗∗∗ + .083∗∗∗ educ

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Sin embargo, la aproximación sólo funciona para pequeños cambios en la variable

exp (.083) − 1 = .087 ̸= .083

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Ahora consideremos el modelo log-log:

log wage = β 0 + β 1 log educ + u

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Para implementar modelos cuadráticos se debe crear el cuadrado de la variable.

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Ejemplo de wage1 del libro de Wooldridge.

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Cambio en las unidades de medida

Es muy importante saber cuales son la unidades de medida en X e Y para interpretar

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

Cambio en las unidades de medida

Ej.: supongamos que wage se mide en centavos. Definamos wagec=wage*100

Gabriel Montes-Rojas Información cualitativa y modelos no lineales

También podría gustarte