01 Cap1 Eco2 UNAP 2017 PDF

Econometría Aplicada Prof. Edson Apaza Mamani Econometría Aplicada Prof.
Edson Apaza Mamani

eapaza@unap.edu.pe eapaza@unap.edu.pe
Notas de clase preparadas para el curso de Econometría II.

Prohibida su reproducción parcial o total del documento sin
autorización expresa del autor.
Econometría Aplicada con

Stata
Modelos de Elección Discreta
Edson Apaza Mamani

UNIVERSIDAD NACIONAL DEL ALTIPLANO
INGENIERÍA ECONÓMICA
Abril de 2017 pág. 0 pág. 1

Econometría Aplicada Prof. Edson Apaza Mamani Econometría Aplicada Prof. Edson Apaza Mamani
7.1. Introducción ............................................................................................................. 42

7.2. Modelos TRUNCADOS .............................................................................................. 42
Contenido 7.3. Modelos CENSURADOS ............................................................................................ 46

REGRESIÓN CON VARIABLES DEPENDIENTES E INDEPENDIENTES DISCRETAS ................................. 5 MODELOS DE HECKMAN DE AUTOSELECCION .............................................................................. 50
1. Modelo de regresión con variables discretas en las variables independientes. ................. 5 8. Modelos Selección ........................................................................................................... 50
1.1. Aplicación del Modelo Lineal General 1 ..................................................................... 8 vi) Aplicación................................................................................................................. 56
Referencias .......................................................................................................................... 10 Referencias: ......................................................................................................................... 57
REGRESIÓN CON VARIABLES DEPENDIENTES E INDEPENDIENTES DISCRETAS (2) .......................... 11 MODELOS DE ELECCIÓN MULTIPLE .............................................................................................. 59
2. Modelo Lineal General 2 .................................................................................................. 11 9. Modelos de elección múltiple .......................................................................................... 59
3. Estrategia de Identificación ............................................................................................. 12 v) Aplicaciones ................................................................................................................. 61
i) Causalidad y Correlación .............................................................................................. 12 9.2. Logit Condicional ...................................................................................................... 63
iii) Aplicación: Ecuación de Mincer 3 (Impacto)............................................................. 14 Referencias .......................................................................................................................... 67
REGRESIÓN CON VARIABLES DEPENDIENTES DISCRETAS .............................................................. 15 MODELOS DE ELECCIÓN MULTIPLE .............................................................................................. 68
4. Modelos de regresión con variables discretas en la variable dependiente ...................... 15 9.3. Logit Multinomial ......................................................................................................... 68
4.1. Modelos de Elección Discreta................................................................................... 16 References ........................................................................................................................... 71
4.2. Modelo de Probabilidad Lineal (MPL) ...................................................................... 16
4.3. Modelo Probabilístico .............................................................................................. 17
4.4. Modelo Logístico ...................................................................................................... 18
4.5. Modelo de doble complementariedad logarítmica .................................................. 20
4.6. Medidas de bondad de ajuste (fitstat) ..................................................................... 21
Referencias .......................................................................................................................... 26
AUTOSELECCION .......................................................................................................................... 31
5. Modelo de Autoselección ................................................................................................ 31
i) Modelo de Heckman .................................................................................................... 31
Referencias .......................................................................................................................... 35
CAMBIO DE REGRESIÓN: SWITCHING REGRESSION ...................................................................... 36
6. Modelo de Switching Regression ..................................................................................... 36
SWITCHING REGRESSION: APLICACIÓN .................................................................................... 38
Referencias .......................................................................................................................... 41
MODELOS TRUNCADOS Y CENSURADOS ...................................................................................... 42
7. Modelos censurados y truncados .................................................................................... 42
pág. 2 pág. 3
ECONOMETRÍA APLICADA
Prof. Edson Apaza Mamani
REGRESIÓN CON VARIABLES DEPENDIENTES E

INDEPENDIENTES DISCRETAS
1. Modelo de regresión con variables discretas en las variables independientes.
La especificación habitual de los modelos lineales, incluyen una variable dependiente y

varias variables explicativas. Así por ejemplo:
= + + + +
Esta representación teórica puede ser utilizado en un contexto empírico, donde es posible
establecer la siguiente relación; ln( ) representa el logaritmo del ingreso, esta
medido en años de educación alcanzado, mide los años de experiencia laboral y es
una variable dicotómica que toma el valor de uno si es casado e igual a cero si tiene otro
estado civil. La especificación para esta relación sería de la forma:
( )= + + + +
Especificación propuesto por Mincer para identificar los retornos a la educación. La
estimación de los parámetros se obtienen utilizando el método de Mínimos Cuadrados
Ordinarios (MCO). Dadas las características de la especificación, es posible representarlo de
forma matricial como:
= +
i) Estimación por MCO
El método de estimación para un modelo lineal es el estimador de MCO, siempre y

cuando se cumplan los supuestos del modelo lineal general (MLG). Dado que el método
estima los parámetros minimizando la suma de los errores al cuadrado, se obtiene el
siguiente estimador:
=( ′ ) ′
La estimación consistente debe reflejar resultados estadísticamente significativos,

relevancia y dependencia. Asimismo, debe observase la bondad de ajuste del modelo
estimado, el cual se observa por el , que indica el grado de ajuste o grado de
pág. 4 pág. 5
variabilidad explicada por las variables explicativas incluidos en el modelo

econométrico.
a) Consistencia
Los supuestos de los estimadores de MCO: =
a) MCO1: Linealidad en los parámetros del modelo, = + + , y b) Asintóticamente Distribuido Normalmente
( )=0
b) MCO2: Independencia, { , } son i.i.d. (independiente e idénticamente √ − → (0, )
distribuida), esto garantiza que la muestra sea aleatoria y de una muestra
comparable. c) Aproximadamente Distribuido Normalmente
c) MCO3: Exogeneidad de las variables expectativas,
i. | , ~ (0, ) ,
~
Asume que el término de error es independiente de las variables explicativas
y que éstas están normalmente distribuidas. = varianza asintótica.
ii. ∀ : ⊥ , (independiente)
Implica que el termino de error es independiente de las variables
explicativas.
iii. ( | , ) = 0, (promedio independiente) ii) Interpretación de los estimadores
El promedio del término de error es independiente de las variables La interpretación de los estimadores se realizan obteniendo:
explicativas.
iv. ∀ : ( , ) = 0, (no correlación)
=
Implica que el término de error y las variables explicativas no están
correlacionadas. El término de error no contiene información relacionada
con las variables explicativas. Es decir, que ante cambios en una unidad de las variables explicativas , la variable
d) MCO4: Identificabilidad dependiente variará en unidades, para el caso lineal, en otras especificaciones el
i. ,…, son linealmente independientes y 0 < ( ) < ∞ ∀ . estimador tiene una interpretación diferente.
Es decir que la matriz de información de las variables explicativas es de rango
Tabla 1. Interpretación de los Cambios marginales
completo, esto garantiza que los regresores no sean colineales perfectos
entre sí: ninguna variable es una combinación lineal de las otras explicativas. Modelo ( | , ) Interpretación de los
e) MCO5: Estructura del error, Cambios marginales
i. Si se cumple que ( | , … , ) = , entonces la relación entre las
variables explicativas y el término de error es Homocedástica. Significa que Lineal = + + Niveles
la varianza del termino de error es una constante.
ii. Si se cumple que ( | , … , )= = ( ,… , ) < ∞, entonces se
presenta el problema de la Heterocedasticidad condicional. Este resultado Semi-logaritmico Ln( ) = + + Semielasticidad
permite a la varianza del error depender de las variables explicativas.
Logaritmico ln( ) = + ln( )+ Elasticidad

La consistencia de los estimadores requieren que se cumplan las propiedades
asintóticas, esto garantizará que las estimaciones sean estadísticamente significativas.
A continuación se presenta las Propiedades Asintóticas de los Estimadores de Mínimos

Cuadrados Ordinarios.
pág. 6 pág. 7
1.1. Aplicación del Modelo Lineal General 1 El comando post-estimación predict genera dentro de la muestra fuera de la muestra
las predicciones. Por ejemplo
regress wage educ exper expersq if _n < 100
i) Taller Stata 1 predict wage_hat_in if e(sample)
predict wage_hat_out if !e(sample)
La estimación de un modelo lineal por MCO utilizando Stata es: browse wage wage_hat_in wage_hat_out
regress vardep [varsindep] [if] [in] [weight], [option]
donde vardep es la variable dependiente y varsindep es una lista de variables utiliza las primeras 100 observaciones para estimar el modelo de regresión lineal y
explicativas. estimar los valores del esto de observaciones.
La estimación de cambios marginales se obtiene utilizando el comando mfx y sus

respectivas opciones, de la forma:
ii) Aplicación en Stata: Ecuación de Mincer 1
dydx, estima los efectos marginales por defecto
La ecuación de Mincer intenta explicar que tan importante es la escolaridad sobre el eyex, estima las elasticidades en la forma de d(lny)/d(lnx)
salario. dyex, estima las elasticidades en la forma de d(y)/d(lnx)
eydx, estima las elasticidades en la forma de d(lny)/d(x)
ln( )= + + + +
Un problema frecuente, del investigador, es determinar la mejor especificación del

Estimación en Stata: modelo empírico. A continuación vamos a determinar la especificación adecuada, para
ello utilizaremos el comando stepwise con la opción prob(n.c.).
use mincer_peru.dta
summarize stepwise, pr(0.2): regress wage educ exper expersq
regress wage educ exper expersq
Regresiona la ecuación de MINCER, el salario por hora en función de escolaridad y

experiencia. Stata agrega automáticamente una constante. Stata reporta un estimador
de MCO de covarianza robusta y consistente utilizando la opción robust.
regress wage educ exper expersq, vce(robust)
Se puede utilizar el comando postestimación test para estimar las pruebas de

dependencia, prueba F, para una o más restricciones. Por ejemplo:
test educ
la prueba consiste en evaluar : = 0 contra : ≠ 0,

test educ exper
la prueba consiste en evaluar : =0y = 0 contra : ≠0o ≠0

test educ = exper
la prueba consiste en evaluar : = contra : ≠

pág. 8 pág. 9
Referencias ECONOMETRÍA APLICADA
Libros introductorios
Stock, James H. and Mark W. Watson (2007), Introduction to Econometrics, 2nd ed., Pearson
Addison-Wesley. Capítulos 4 - 9. REGRESIÓN CON VARIABLES DEPENDIENTES E
Wooldridge, Jefrey M. (2009), Introductory Econometrics: A Modern Approach, 4th ed.,
INDEPENDIENTES DISCRETAS (2)
South-Western Cengage Learning. Capítulos 2 - 8.
Libros Avanzados 2. Modelo Lineal General 2
Cameron, A. Colin and Pravin K. Trivedi (2005), Microeconometrics:Methods and La especificación inicial permite ver una relación lineal entre la variable dependiente
Applications, Cambridge University Press. Secciones 4.1-4.4. (continua) y variables explicativas (continuas). Si a esta última relación de variables se
incluyen variables binarias (dummy), de tal forma que tengamos la siguiente
Wooldridge, Jefrey M. (2002), Econometric Analysis of Cross Section and Panel Data, MIT representación:
Press. Capítulos 4.1 - 4.23.
ln( )= + + + + +
Libros adicionales
Donde es igual a uno si la el individuo es hombre y cero si es mujer, el uso de una
Angrist, Joshua D. and Jorn-Steffen Pischke (2009), Mostly Harmless Econometrics: An variable dicotómica permite identificar la presencia o ausencia de un atributo, este tipo de
Empiricist's Companion, Princeton University Press. Capítulo 3. variables tiene varias aplicaciones. Gráficamente podemos suponer que:
Figura Nro. 1 Representación de una variable ficticia
Note que el efecto marginal para los dos grupos (implícitamente definido por la variable
dummy) es igual pero diferente en el término constante.
i) Prueba de hipótesis de relevancia (t) y de dependencia (F)
pág. 10 pág. 11
Es importante evaluar la significancia individual y en todo el cojunto de variables probabilidades y las esperanzas condicionales— son llamados “parámetros asociativos”
explicativas, tanto pruebas de multicolinealidad y heterocedasticidad. los cuales han sido utilizados como pieza clave en el análisis econométrico. Estos
parámetros no son determinantes para establecer relaciones causales entre las
ii) Aplicación: Ecuación de Mincer para Perú (género) variables. La presencia de variables asociadas sin mayor sentido, como en el caso de las
ln( )= + + + + + conocidas regresiones espurias o la presencia de los llamados “confounders”, presenta
una limitación importante para el análisis de inferencia causal con base en parámetros
asociativos
3. Estrategia de Identificación ii) Interacciones
En los últimos veinte años, el “Enfoque Causal” o de “efectos de un tratamiento” se ha De la forma functional
convertido en un complemento sustancial al anterior. Esto se debe a que ofrece una
estrategia de identificación de los efectos causales de una política pública a partir, sobre ln( )= + + + + ∗ + +
todo, de datos adecuados para contestar a cada pregunta concreta, más que del soporte Efectos marginales para educ y exp:
estricto de un determinado modelo económico. Este enfoque, más concentrado en los
datos y menos necesitado de modelos teóricos o econométricos muy sofisticados, ha ∂ ln( )
= +
generado contribuciones notables en la evaluación de políticas tan relevantes como la ∂
formación, los subsidios a la contratación, los efectos de cambios fiscales sobre la oferta de
∂ ln( )
trabajo o la inversión, etc. = +2 +
∂
Así, la evaluación de políticas públicas constituye hoy un campo de indudable crecimiento,
donde el interés científico se ha centrado en campos tan diversos como las finanzas La interpretación de estos efectos y de los parámetros individuales es muy específico al
públicas, las políticas de empleo y formación o las subvenciones públicas. Existen modelo teórico detrás de la relación.
numerosos ejemplos en la literatura reciente sobre este tipo de evaluaciones. En particular, Un caso especial, la interacción con la variable dummy :
sobre el mercado de trabajo han aparecido numerosas contribuciones muy importantes
para el desarrollo de esta técnica de evaluación. ln( )= + + + + + ∗ +
i) Causalidad y Correlación Figura Nro. 2. Cambio en pendiente por una variable ficticia
El interés por hacer un estudio acerca de la relación causal entre las variables. Este
estudio empieza con la pregunta inicial de cualquier estudio de impacto: ¿cuál es el
efecto causal de una variable X sobre otra variable Y? Responderla puede ser un asunto
no tan trivial ni desde el punto de vista analítico ni desde los datos. Pues para tener una
idea de este efecto, deberíamos tener alguna idea sobre la existencia de una relación
causal entre estas variables.
La aceptación de la frase que “la correlación no implica causalidad” ha significado el

límite que la estadística se ha puesto a si misma en su contribución a este análisis. Esto
se debe a que tradicionalmente la estadística inferencial ha estudiado la manera como
los datos “aparecen” en el mundo real. Tal interés conlleva al estudio de la distribución
de probabilidad conjunta de estas variables, la cual entrega las probabilidades de
ocurrencia de ellas. Luego, contando con una muestra de observaciones de estas
variables y haciendo algunos supuestos simplificadores sobre la estructura de este
proceso generador de datos, la estadística inferencial obtiene estimadores de los
parámetros que configuran a tal proceso. Algunos de estos parámetros —como las
pág. 12 pág. 13
iii) Aplicación: Ecuación de Mincer 3 (Impacto) ECONOMETRÍA APLICADA

¿Vale la pena el esfuerzo?
Estimación por MCO.
use mincer_peru.dta REGRESIÓN CON VARIABLES DEPENDIENTES DISCRETAS
regress wage educ exper expersq
Actividades: 4. Modelos de regresión con variables discretas en la variable dependiente
 La estrategia de identificación Esta situación se presenta cuando una variable dummy (ficticia) exógena en un modelo, en
 Relación causal y correlación realidad es endógena debido a causas del estudio. Esto origina un problema de
autoselectividad o autoselección en la muestra. Un ejemplo de esto puede ser el caso en
Regresión lineal general que se necesite estimar el efecto de las uniones sindicales (pertenecer a un sindicato) sobre
el salario de los trabajadores. Otro ejemplo sería los estudiantes que solicitan el servicio de
generate hijos=( kidslt6!=0 & kidsge6!=0)
comedor o de residencia de la universidad, así como estos existen varios casos donde se
regress wage educ exper expersq hijos, vce(robust)
pueden utilizar la variable dependiente discreta.
Muchas variables dependientes de interés en economía y otras ciencias sociales pueden

Se puede utilizar el comando postestimación test para estimar las pruebas de
tomar sólo dos valores. Los dos posibles valores están denotados usualmente por 0 y 1.
dependencia, prueba F, para una o más restricciones. Por ejemplo:
Tales variables son llamadas variables dummy o variables dicotómicas.
test hijos
El valor esperado de una variable dicotómica ∈ {0,1} es la probabilidad que toma el valor
la prueba consiste en evaluar : = 0 contra : ≠ 0, de 1:
test educ exper hijos ( )=0∙ ( = 0) + 1 ∙ ( = 1) = ( = 1)
la prueba consiste en evaluar : = 0, =0y = 0 contra : ≠0o ≠0 El modelo de regresión lineal,

o ≠ 0.
= + , ( | )=0
xi: regress inlf educ exper expersq i.kidslt6, vce(robust)
xi: regress inlf educ exper expersq i.kidslt6*educ, vce(robust) Es llamado el modelo de probabilidad lineal en este contexto. Este modelo no es un modelo
estadístico adecuado como el valor esperado de ( | ) = puede sobrepasar los
límites de [0,1] y no representan una probabilidad. Además el término de error es
heterocedastico como:
Tabla 2. Estimación del Modelo de Probabilidad Lineal
Error Probabilidad de Ocurrencia del Evento

( )
1−
1−
( )= (1 − )
( ) = ( | )[1 − ( | )]
pág. 14 pág. 15
4.1. Modelos de Elección Discreta ii) Bondad de ajuste
Sea la utilidad de obtener el comedor universitario y la utilidad de estar pensionado. Los habituales, y sus desventajas.
La decisión observada revela cual de las alternativas proporciona más utilidad o mayor
beneficio (el cual es no observable). Por tanto, la variable que se observa vale 1 si >
y 0 si ≤ . iii) Interpretación
La formulación habitual es: = + y = + . La interpretación de los parámetros estimados es directa como efectos
marginales sobre la variable dependiente . En general, se puede representar
Si denotamos a = 1, es decir que el consumidor escoja la alternativa a, obtenemos que: como:
( = 1| ) = [ > ] ( | )
=
( = 1| ) = [ + > + | ]
Este resultado explica la unidad de medida de los estimadores, como los cambios
( = 1| ) = [ + > 0] marginales.
( = 1| ) = [ ]
Para la última representación, se puede asumir diferentes distribuciones para el término de 4.3. Modelo Probabilístico
error, por ejemplo, la función de transformación para definirá la especificación del Los modelos de elección discreta, binaria, describe la respuesta de
modelo no lineal a estimar. Así se puede tener una distribución normal con media cero y probabilidades ( = 1) de la variable dependiente .
varianza constante e igual a uno pero no logística, o puede tener una distribución logística
Considere una muestra de N ( = 1,2, … , ) observaciones i.i.d. (independiente e
con media cero y varianza constante logística. En el primer caso se puede aplicar el modelo idénticamente distribuida) de la variable dependiente dummy y un vector de dimensión
Probit también llamada Normit y en el segundo el modelo Logit. ( + 1) variables explicativas incluyendo el término constante. La probabilidad que la
variable dependiente toma el valor de 1 es modelado como:
4.2. Modelo de Probabilidad Lineal (MPL)
( = 1| ) = ( ) = ( )
Es la representación más básica, el cual permite estimar las primeras aproximaciones a los
resultados. Como se vió antes, a pesar de tener problemas asociados con las varianzas, Donde es un vector columna de parámetros de dimensión ( + 1), y
empírcamente son válidos los resultados.
=
i) Estimadores: MCO
Es un índice lineal simple. La transformación de la función muestra un índice dentro del
=( ′ ) ′ rango [0,1] y en general satisface:
En este tipo de modelos es habitual el uso del estimador por el método de mínimos ( )
(−∞) = 0, (∞) = 1, >0
cuadrados ordinarios, por su simplicidad, se requiere evaluar la consistencia de los
resultados, robustez y demás pruebas para información de corte transversal. A pesar de
El modelo probit asume que la transformación de la función es la función de densidad
su poca aplicación, los resultados son una primera aproximación a los resultados
acumulativa (cdf) de la distribución normal estándar. La respuesta de probabilidad es:
obtenidos con los modelos no lineales como son el logit, probit o cloglog. Sin embargo
el uso de los modelos lineales con la variable dependiente binomial trae consigo riesgos
de la presencia del problema de heterocedasticidad. 1
( = 1| ) = Φ( )= () =
√2
pág. 16 pág. 17
Donde (. ) es la función de densidad de probabilidad (pdf) y Φ(. ) la función de distribución

acumulativa (cdf) de la distribución normal estándar.
Figura Nro. 3. Función de transformación en el modelo Logit y Probit
i) Estimadores: MV
= [Prob( = 1| )] [Prob( = 1| )]
= [Φ( )] [1 − Φ( )]
= ln[Φ( )] + (1 − ) [1 − Φ( )]
ϕ( ) −ϕ( )
= + (1 − ) =0
Φ( ) [1 − Φ( )]
ii) Interpretación de los parámetros Nota: el modelo Logit y Probit son casi idéntico y el modelo de elección es usualmente
arbitrario. Sin embargo, los parámetros de los modelos son escalados de manera
A diferencia del modelo lineal, los parámetros estimados no se pueden diferente. Multiplicando los parámetros del modelo Probit por 1.6 son aproximadamente
interpretar directamente como efectos marginales sobre la variable iguales al modelo Logit estimado.
dependiente. En algunas situaciones, la función índice = tiene una clara
interpretación en el modelo teórico y el efecto marginal, del cambio de sobre
.
i) Estimadores: MV
En general, estamos interesados en estimar el efecto marginal del cambio de
sobre .
( | ) ( = 1| ) ∂Φ( ) = [F( )] [1 − F( )]
= = = ( )
∂
4.4. Modelo Logístico
= ln[F( )] + (1 − ) [1 − F( )]
En el modelo Logit, la transformación de la función es la función logística. La respuesta de
probabilidades son:
f( ) −f( )
= + (1 − ) =0
1 F( ) [1 − F( )]
( = 1| ) = =
1+ 1+
La siguiente figura muestra la función de transformación de para los dos modelos.
ii) Interpretación de los parámetros
pág. 18 pág. 19
Como antes, los parámetros estimados no se interpretan directamente como

efectos marginales. Este efecto marginal depende de las características de todas
las para la observación . Además, cualquier individuo tiene un efecto 4.6. Medidas de bondad de ajuste (fitstat)
marginal diferente. Para los modelos de variables dependientes discretas y limitadas, los estadísticos
habituales de bondad de ajuste ahora son diferentes. Algunos de ellos son
modificaciones de la medida de bondad de ajuste de McFadden, a continuación listo
( | ) ( = 1| ) algunos de estos:
= =
(1 + )
4.5. Modelo de doble complementariedad logarítmica Coeficiente de correlación :  2  y , yˆ 
n yi  yˆi 
2
Los modelos Logit y Probit, son las técnicas más comunes para la estimación de modelos
con una variable dependiente dicotómica, impone el supuesto de que los individuos tienen Medida de Effron :1 
n1n2
una probabilidad de 0.5 de elegir cualquiera de las dos alternativas, sin embargo ambas son
muy sensibles a los cambios en las variables independientes. Este supuesto es impuesta por 2/ N
 L 
la técnica de estimación porque las dos funciones de densidad logística y normal son Ratio de LR. : 1   R 
simétricas con respecto a cero. Ante cambios en la probabilidad de elegir una de dos  LNR 
alternativas de manera desproporcional 30 y 70 o 70 y 30 los modelos habituales ya no son
2/ N
consistentes, ante ello propongo una distribución alternativa para los errores en la  L 
distribución normal o logística. El estimador resultante, se demuestra que es apropiado Cragg-Uhler (1) : 1   R 
donde los individuos con alguna probabilidad inicial de elegir cualquiera de las dos  LNR 
alternativas son más sensibles a los cambios en las variables independientes. 2 2
LNRN  LRN
Cragg-Uhler (2) : 1
( = 1| ) = 1 −  1  L2 N 
 N 
 L2 N 
 R 
i) Estimadores: MV
ln LNR
McFadden : 1
ln LR
= [Prob( = 1| )] [Prob( = 1| )]
2ln LNR  ln LR 
Aderish-Nelson :
2ln LNR  ln LR   n
2ln LNR  ln LR  2 ln LNR  n 

=0 Veal-Zimmerman : .
2ln LNR  ln LR   n 2 ln LR
2
 ln LR
 ln LNR  N
ii) Interpretación Arturo Estrella : 1   
 ln LR 
( | )
Cada investigador puede especificar el uso del estadístico de bondad de ajuste.
pág. 20 pág. 21
ECONOMETRÍA APLICADA
Tabla 3. Resumen de modelos de elección discreta
Modelo Probabilidad = ( = 1| ) Efecto Marginal:
Valoración Económica
Logit Λ( ′ ){1 − Λ( ′ )}
Λ( ′ ) =
1+ La bahía de Puno se encuentra dentro de la reserva nacional del Titicaca con 36,180
Probit ( ′ ) hectáreas. La ciudad de Puno es uno de los departamentos con un flujo de turismo
Φ( ′ ) = ( )
considerable, por sus diversos atractivos turísticos, siendo uno de estos el lago Titicaca en
Cloglog ( ′ ) =1− ( ′ ) cuyas aguas se encuentra la isla flotante de los Uros, que constituye uno de los atractivos
Probabilidad Lineal ( ′ )= ′ más singulares del turismo mundial, ubicada a 6 kilómetros de la bahía de Puno, además de
las islas de Taquile y Amantan en el lado peruano y las islas del Sol y de la Luna en el lado
boliviano. En la actualidad la bahía de Puno enfrenta problemas de contaminación del agua
derivados de la disposición de aguas servidas provenientes de diversas actividades
económicas desarrolladas por las poblaciones aledañas a esta. En la actualidad los hogares
no están de acuerdo con la disposición de las aguas servidas y sus inconveniencias asociadas
con las inundaciones en épocas de lluvia y riesgos de contraer enfermedades asociadas con
el agua contaminada.
Dadas los antecedentes anteriores surgen una serie de preguntas de mucho interés en
torno al manejo de este recurso natural. ¿Es posible la implementación de una política de
descontaminación de la bahía y la regulación de las fuentes generadoras de la
contaminación?, ¿cuál sería el mecanismo más adecuado de implementación de esta
política?, ¿cuál sería la disponibilidad a pagar de los habitantes de Puno por una mejora en
la calidad ambiental de la bahía?, ¿cuál sería el valor de no uso que estarían dispuesto a
asignar estas personas a la reserva natural de Titicaca?.
Las variables incluidas dentro de este estudio fueron:
- PROB: Variable dependiente discreta que toma el valor de 1 si la persona responde

afirmativamente a la pregunta de disponibilidad a pagar y 0 si no.
- POSTURA: Variable dependiente que representa los precios revelados bajo una
pregunta de formato abierto, para el valor de existencia.
- PH: Variable independiente que representa el precio hipotético propuesto en soles para
financiar el plan de saneamiento ambiental.
- Y: Variable independiente que representa el ingreso familiar mensual en soles.
- EDAD: Variable independiente continúa que representa la edad del jefe o responsable
de la familia.
- SEXO: Variable independiente discreta que toma el valor de 1 si el entrevistado es del
genero masculino y 0 si es del genero femenino.
La variable nivel de educación del entrevistado fue presentada en tres variables discretas a
como sigue:
pág. 22 pág. 23
- ED1: Toma el valor de 1 si el entrevistado tiene educación superior completa y 0 los Especificación de los Cambios marginales:
demás. Interpretación de los coeficientes estimados:
- ED2: Toma el valor de 1 si el entrevistado tiene educación secundaria completa y 0 los Bondad de ajuste:
demás. iii) Especificación econométrica
- ED3: Toma el valor de 1 si el entrevistado tiene educación primaria completa y 0 los
stepwise, pr(0.2): reg prob ph y edad sexo ed1 ed2 ed3 np oc1
demás. oc2 oc3 oc4 oc5 enti mcon nhab valor enf uso, robust
- NP: Variable independiente que representa el número de personas por familia.
- La variable independiente ocupación del entrevistado fue representada a partir de cinco stepwise, pr(0.2): probit prob ph y edad sexo ed1 ed2 ed3 np oc1
oc2 oc3 oc4 oc5 enti mcon nhab valor enf uso, robust
variables.
- OC1: Toma el valor de 1 si el entrevistado es empleado del sector público y 0 los demás. stepwise, pr(0.2): logit prob ph y edad sexo ed1 ed2 ed3 np oc1
- OC2: Toma el valor de 1 si el entrevistado es comerciante y 0 los demás. oc2 oc3 oc4 oc5 enti mcon nhab valor enf uso, robust
- OC3: Toma el valor de 1 si el entrevistado es obrero o vendedor ambulante y 0 los
stepwise, pr(0.2): cloglog prob ph y edad sexo ed1 ed2 ed3 np
demás. oc1 oc2 oc3 oc4 oc5 enti mcon nhab valor enf, r
- OC4: Toma el valor de 1 si el entrevistado es jubilado rentista y 0 los demás.
- OC5: Toma el valor de 1 si el entrevistado esta sin trabajo o es ama de casa y 0 los demás. iv) Estimación del beneficios social del proyecto de descontaminación
- ENTI: Variable independiente discreta que la preferencia por el tipo de identidad que
ejecute el plan de saneamiento, 1 si es una entidad pública y 0 si es una entidad privada. logit prob ph y sexo ed1 ed2 np enf, robust
gen ECL=-(_b[_cons]+_b[y]*y + _b[sexo]*sexo + _b[ed1]*ed1
- MCON: Variable independiente que representa el tipo de material con que esta
+ _b[ed2]*ed2 + _b[np]*np + _b[enf]*enf)/(_b[ph])
construida la casa del entrevistado, 1 si es noble, 0 si es adobe.
- NHAB: Variable independiente que representa el número de habitaciones de la vivienda probit prob ph y sexo ed1 ed2 np enf, r
del entrevistado. gen ECP=-(_b[_cons]+_b[y]*y + _b[sexo]*sexo + _b[ed1]*ed1
- VALOR: Variable independiente que representa la ponderación que asigna a la bahía si + _b[ed2]*ed2 + _b[np]*np + _b[enf]*enf)/(_b[ph])
se descontaminara, 3 = mucho, 2 = poco, 1 = ninguno.
cloglog prob ph y sexo ed1 ed2 np enf, r
- ENF: Variable independiente que representa la presencia de enfermedades gen ECCL=-(_b[_cons]+_b[y]*y + _b[sexo]*sexo + _b[ed1]*ed1
relacionadas con la contaminación del agua de la bahía, 1 si hay presencia y 0 si no hay. + _b[ed2]*ed2 + _b[np]*np + _b[enf]*enf)/(_b[ph])
i) Realice las estadísticas básicas de la muestra e interprete.
ii) Especifique diferentes formas funcionales del modelo de elección discreta y summarize ECLO ECPR ECCL
concluya una especificación final, realice pruebas de robutez. Interprete.
iii) Utilizando el comando stepwise de Stata, compruebe sus resultados del punto
ii)
iv) Estime la disponibilidad media a pagar (Excedente del consumidor) de los
habitantes de la ciudad de Puno por el plan de Saneamiento Ambiente de la
Bahía.
Solución: valoración económica

i) Importando datos y Estadisticas descriptivas:
insheet using "TITICACA.txt"
describe
summarize
tabulate prob
ii) Comparación de modelos de elección discreta

Especificación de los modelos de elección discreta: Probit, Logit, Cloglog
pág. 24 pág. 25
Referencias Anexo: Estimador de Máxima Verosimilitud

1. Halle el estimador del parámetro por el método de MV a partir de una muestra de
Libros introductorios tamaño n. considere una v.a. que tiene la siguiente f.d.p.:
Stock, James H. and Mark W. Watson (2007), Introduction to Econometrics, 2nd ed., Pearson 2
( ; )= ,0 ≤ ≤ 1; >0
Addison-Wesley. Capítulos 4 - 9. 1−
Wooldridge, Jefrey M. (2009), Introductory Econometrics: A Modern Approach, 4th ed., Sea la muestra aleatoria de tamaño n: ( ,…, ). La función de verosimilitud será:
South-Western Cengage Learning. Capítulos 2 - 8.
( | )= ( ; ) ( ; )… ( ; )= ( ; )
Libros Avanzados
Cameron, A. Colin and Pravin K. Trivedi (2005), Microeconometrics:Methods and 2 2 2 2

Applications, Cambridge University Press. Secciones 4.1-4.4. ( | )= … =
1− 1− 1− 1−
Wooldridge, Jefrey M. (2002), Econometric Analysis of Cross Section and Panel Data, MIT
Press. Capítulos 4.1 - 4.23. 0≤ ≤ 1; 0 ≤ ≤ 1; … ,0 ≤ ≤ 1; >0
Libros adicionales Tomando logaritmos en la última expresión:

Angrist, Joshua D. and Jorn-Steffen Pischke (2009), Mostly Harmless Econometrics: An 2 3 −1
( | )= +
Empiricist's Companion, Princeton University Press. Capítulo 3. 1− 1−
3 −1
= [ 2 − (1 − )] +
1−
3 −1
= 2+ − (1 − ) +
1−
Derivando respecto de , e igualando a cero, se obtiene:
( | ) (−1) 3(1 − ) + (3 − 1)
= − + =0
1− (1 − )
2
= + + =0
1− (1 − )
Por lo tanto:
2 − (1 − ) +
=− − =
(1 − ) 1− (1 − )
2 − − + −
= =
(1 − ) (1 − ) (1 − )
1 (1 − )
=−
2 (1 − )
pág. 26 pág. 27
1 (1 − ) 1
=− , ; ,…, =− (2 ) − ( ) − ( − )
2 2 2 2
2 = − (1 − ) 1
max =− (2 ) − ( ) − ( − )
ℝ, ℝ 2 2 2
2 =− + Condiciones de primer orden
, ; ,…, 1
2 + − =0 =− 2( − )(−1) = 0
2
1
2 − + =0 = − = 0; ⟹ =
, ; ,…, 2 1(−2)
2 − =− =− + ( − ) =0
2 2
=− 1
2∑ − = ( − )
=
− 2∑
3. Sea el modelo = + y Sea ~ , . Encuentre el estimador de MV de

El estimador de MV es:
= = (04 puntos)
− 2∑
1 ( ) ( )
( , , )=
2. Sea { } i.i.d., donde ~ ( , ). Encontrar los estimadores de máxima √2
verosimilitud de: = . ( ) I ( )
( , , ) = (2 ) ( )
( )( )
( , , ) = (2 )
( , )→ ,…, ( ,…, | , )
( , ; ): ℝ x(0, ∞)
,…, ( ,…, | , )= ( | , ) ( | , )… ( | , )
( )( )
Multiplicación por independencia de xi ( , ; ) = (2 )
( ) ( ) ( ) 1
1 1 1 ( , ; )=− (2 ) − − ( − )′( − )
,…, ( ,…, | , )= … 2 2
√2 √2 √2
1 1
( ,…, )=
∑ ( ) max − (2 ) − − ( − )′( − )
,…, | , ∈ℝ , ( , ) 2 2
(2 )
Condiciones de primer orden
Distribución conjunta, ahora en términos de función de verosimilitud
pág. 28 pág. 29
( , ; ) 1 ECONOMETRÍA APLICADA
=0=− ( − + ′ ′ + ′ ′ )
2
−2 +2 ′ ′ =0 Prof. Edson Apaza Mamani

− ′ + ′ =0
AUTOSELECCION
=( ′ ) ′
5. Modelo de Autoselección
( , ; ) −2
=0=− − ( − )′( − ) Ahora analizaremos qué factores determinan el salario de las mujeres casadas. Para ello
2
utilizaremos una especificación que en la literatura mundial se conoce como minceriana, en
1 honor a Mincer (1974), la cual señala que el logaritmo del ingreso es función de la
= − ′ −
escolaridad, la experiencia laboral y el cuadrado de ésta. Formalmente se tiene:
Estimadores sesgados, común en MV )=
ln( + + + + (1)
Donde ln( ) representa el logaritmo del ingreso del individuo , son los años de
educación, es la experiencia laboral, y es el cuadrado de la experiencia laboral.
La especificación anterior tiene el problema de que no toma en cuenta si las mujeres han
decidido autoseleccionarse a no participar en el mercado de trabajo. Si esto sucede, las
estimaciones con este método pueden ser sesgadas. 1
Con el método de dos etapas de Heckman se busca eliminar los posibles sesgos que surgen
debido a que en las encuestas únicamente se puede observar el ingreso de aquellos
individuos cuyo salario de reserva es inferior al salario de mercado. Aquellos con un salario
de reserva superior al de mercado no aparecen en la estimación. De acuerdo con Heckman
(1979) esta situación puede introducir sesgos en los estimadores de los parámetros de la
ecuación de ingresos similares a los generados por la omisión de variables relevantes en el
modelo.
i) Modelo de Heckman
Para ilustrar este método se plantean dos ecuaciones:

∗
= + ó ó (2)
= + ó é (3)
En este caso son la ecuación de participación de las ocupadas asalariadas y la función

de Mincer (1), respectivamente. Donde ∗ es la propensión a trabajar, es un vector
de variables explicativas observadas y es un término de error en la ecuación de
decisión, no observado, es el nivel de ingreso potencial de un determinado individuo,
1
Este tipo de problema se conoce en la literatura como sesgo por autoselección. Para una explicación
detallada, véase Heckman (1979) y Lewis (1974).
pág. 30 pág. 31
es un vector de variables que influyen en el nivel de ingreso potencial, es otro Para hacer esta estimación escribimos:
término de error en la ecuación de interés, que tampoco se observa.
∗
reg lwage educ exp expsq
Así, es observado si > 0. Esto es:
( | )= ( | ∗
> 0) (4) Procedimiento manual:
Para las mujeres que no trabajan se tiene que ∗

≤ 0 y en consecuencia es igual a Modelo Probit:
cero. El problema de autoselección surge si la parte no observada de la decisión de probit inlf kidslt6 kidsge6 faminc age agesq
trabajar ( ) se correlaciona con la parte no observada del resultado ( ). lsens
Empíricamente, en la primera etapa de este método se estima un modelo probit en la Estimando el IMR ( ):
ecuación de decisión con el cual se calcula el inverso de la razón de Mills ( ), el cual se
incluye como regresor en la ecuación de interés, que se estima por el Método de predict y_hat, xb
Máxima Verosimilitud en la segunda etapa. gen imr = normalden(y_hat)/normprob(y_hat)
Para corregir el sesgo de selección, de la primera etapa, se obtienen el ratio inversa de

Modelo Lineal con :
Mills para cada grupo de hogares, restringido o no restringido del crédito, de la siguiente
manera: reg lwage educ exper expersq imr, robust
( )
=
Φ( )
Procedimiento directo:
( )
= Modelo HECKIT
1 − Φ( )
Para aplicar el modelo Heckit en STATA se deberá emplear el comando heckman.
Así la ecuación final que se estima es:
∗ La sintaxis es la siguiente:
| >0= + + (5)
Donde es el coeficiente asociado al inverso de la razón de Mills evaluado en la heckman depvar [indepvars], select(varlist_s) [twostep]
ecuación de decisión. Si el valor estimado de es distinto a cero se puede concluir que
existe autoselección.
Donde depvar es la variable independiente. En nuestro caso es lwage.
La decisión individual de incorporarse al mercado laboral puede estar afectada por
diferentes factores. En este caso utilizaremos las variables siguientes: hijos menores a 6 indepvars representa las variables independientes. En nuestro caso
años, hijos entre 6 y 18 añ0s, ingreso familiar, y edad.
select(varlist_s). varlist_s representa el grupo de variables que se incluyen en la
ii) Aplicación: inlf
ecuación de decisión. En nuestro caso son: hijo5, hijo611, hijo1218, ingfam, eda, eda2,
Estimación por MCO
norte, y sur
Aunque sabemos que si estimamos por MCO podemos tener un sesgo por variable
omitid. A continuación se presenta la estimación por este método. twostep indica que es una estimación en dos etapas.
Primero generamos la variable del logaritmo de los salarios:
Así se deberá escribir el comando siguiente:
gen lwage=log( salario)
pág. 32 pág. 33
heckman lwage educ exper expersq, select(kidslt6 kidsge6 faminc Referencias

age agesq) twostep
heckman lwage educ exper expersq, select(kidslt6 kidsge6 faminc

Heckman, J. (1979), Sample selection bias as a specification error, Econometrica, vol. 47, Nº
age agesq) first twostep
1, pp. 153-161.
El valor de lambda indica si existe o no autoselección. Mroz, T. A. (1987), The Sensitivity of an Empirical Model of Married Women’s Hours of Work
to Economic and Statistical Assumptions Econometrica 55, 765–799.
Mincer, J. (1974), Schooling Experience and Earnings, National Bureau of Economic

Research, Columbia University Press.
Woolwridge, Jeffrey M. (2002), Econometric Analysis of Cross-Section and Panel Data, MIT
Press
pág. 34 pág. 35
ECONOMETRÍA APLICADA >
Prof. Edson Apaza Mamani donde F es una función acumulativa de distribución normal, f es la función de densidad de
distribución normal, es un ponderador opcional para la observación .
CAMBIO DE REGRESIÓN: SWITCHING REGRESSION Luego de estimar los parámetros del modelo, se debe calcular las esperanzas condicional y
no condicional.
6. Modelo de Switching Regression La esperanza no condicional:
Considere el siguiente modelo, el cual describe el comportamiento de un agente con dos =( | )= (3)
ecuaciones de regresión y una función de criterio, ∗ , que determina que régimen enfrenta =( | )= (4)
el agente 2:
La esperanza condicional:
=1 + >0
( )
=0 + ≤0 _ =( | = 1, )= + 1 (5)
( )
Régimen 1: = + =1 (1) ( )
_ =( | = 0, )= − 1 (6)
1− ( )
Régimen 2: = + =0 (2)
( )
Donde, son las variables dependientes en las ecuaciones continuas; y son los _ =( | = 1, )= + 2 (7)
( )
vectores de variables débilmente exógenas; y y , y γ son los vectores de parámetros.
Se asume que , y tienen una distribución normal (trivariada) con el vector de media ( )
igual cero y una matriz de convarianzas: _ =( | = 0, )= − 2 (8)
1− ( )
Donde:
Ω=
a) y son los errores estándar de y ;
b) es el coeficiente de correlación entre y ;
c) es el coeficiente de correlación entre y ;
d) f(.) es la función de densidad normal, y F[.] es la distribución normal acumulativa.
a) es la varianza del termino de error en la ecuación de selección,
b) y son las varianzas de los términos de error en las ecuaciones continuas.
c) es la covarianza de y .
d) es la covarianza de , y .
e) La covarianza entre y no está definido, porque y no se observan
simultáneamente. Asumiendo = 1 (γ es estimable solo como un factor de escala).
f) El modelo está identificado por construcción a través de no linealidades.
g) Dado el supuesto con respecto a la distribución de los términos de error, el logaritmo
de la función de verosimilitud para el sistema de ecuaciones (1-2) es:
2
La discusión en esta sección es tomado de Maddala (1983, 223-225)
pág. 36 pág. 37
ECONOMETRÍA APLICADA - La estimación simultánea de (9-12) por ML corrige el sesgo de selección en el salario
sectorial estimado.
El indicador de elección del sector privado=1 si el individuo está empleado en el sector
SWITCHING REGRESSION: APLICACIÓN privado y 0 si está en el sector público.
La variable endógena, de (9-10), el logaritmo del salario individual mensual, lsalario.

Aplicación. A continuación realizaremos la estimación empírica pada determinar los
factores que determinan la decisión de trabajar en el sector público o privado, utilizando la Las variables exógenas en la regresión de salario (9-10) se basan en Mincer (Mincer y
ecuación de Mincer, determinamos el problema de estimación de salario individual en los Polacheck, 1974).
sectores público y privado. Una especificación habitual se puede representar de la siguiente
- Incluye las características individuales como: edad, edad2, educacion, y dummies
forma:
regionales.
= + =1 (9) - Además, la ecuación de elección del sector de empleo (11) incluye dos variables para
mejorar la identificación. El estado civil del individuo y el número de miembros
= + =0 (10) empelados en el hogar que se cree que afecta la elección de un individuo del sector de
La función de criterio de decisión de trabajar en el sector público o privado esta dado por: empleo, pero no afecta el salario.
- La estimación por ML:
∗ )+
= ( − + (11)
∗ Regresión de decisión de participación en el sector privado:
- es la variable latente que determina el sector en el cual el individuo está empleado
- es el salario del individuo en el sector ;
regress privado edad edad2 prima secun univer puno aqp otros
- es un vector de características que afectan la decisión respecto al sector de empleo. soltero, robust
- es un vector de características individuales que se piensa que afecta el salario
individual. Regresión de salarios.
- , , y son vectores de parámetros,
- , y son los términos de error. regress lsalario edad edad2 prima secun univer puno aqp otros
nempleados privado, robust
Las realizaciones observadas dicótomas de la variable latente ∗

de si el individuo está Regresión de autoselección.
empleado en un sector particular tiene la siguiente forma: heckman lsalario edad edad2 prima secun univer puno aqp otros
∗
nempleados, select(privado=edad edad2 prima secun univer puno
=1 >0 . . + >0 aqp otros soltero nempleados ) first twostep
∗
=0 ≤0 . . + ≤0 (12) Regresión de intercambio.
El supuesto que se hace con frecuencia en este tipo de modelos: movestay lsalario edad edad2 prima secun univer puno aqp otros
nempleados, select(privado=edad edad2 prima secun univer puno
- Que el sector de empleo es endógeno para el salario. aqp otros soltero nempleados)
- Algunas características no observadas que afecta la probabilidad de elegir un sector en
particular de empleo además podrían influenciar al salario que recibe el individuo una
vez que él este empleado. Los resultados de la ecuación de selección del sector son reportados en el panel
- Omitiendo este efecto de selectividad es probable tener una imagen falsa de la relativa select/privado.
posición de ganancia tanto en el sector público y privado. Los resultados de la regresión de salarios en el sector privado son reportados en el panel
lsalario_1, y la regresión de salario en el sector público es reportada en el panel lsalario_0.
pág. 38 pág. 39
El coeficiente de correlación rho_1 y rho_2 ambos son positivos pero solo es significativo Referencias
para la correlación entre la ecuación de elección y la ecuación de salario del sector público.
Ya que rho_2 es positivo y estadísticamente diferente de cero, el modelo sugiere que un Heckman, J. 1979. Sample selection bias as a specification error. Econometrica 47(1): 153–
individuo quien elige trabajar en el sector público ganan un salario menor en ese sector, 162.
que cualquier individuo de la muestra habría ganado, y aquellos que trabajan en el sector
privado no están mejor o peor que un individuo cualquiera. Maddala, G., (1983) Limited-Dependent and Qualitative Variables in Econometric,
La prueba de razón de verosimilitud para la independencia conjunta de las tres ecuaciones Econometric Society Monographs No. 3, Cambridge University Press, New York.
se reporta en la última línea de la salida.
Mincer Jacob and Solomon Polachek. 1974. Family Investments in Human Capital: Earnings
La variable sigma, /lns1, /lns2, /r1, y /r2 son parámetros auxiliares utilizando en el of Women. The Journal of Political Economy, Vol. 82, No. 2, Part 2: Marriage, Family Human
procedimiento de máxima verosimilitud. sigma_1 y sigma_2 son las raíces cuadradas de las Capital, and Fertility (Mar. - Apr., 1974), pp. S76-S108
varianzas de los errores del modelo de regresión. /r1 y /r2 son la transformación de la
correlación entre los errores de las dos ecuaciones. Winship Christopher and Robert D. Mare. 1992. Models for Sample Selection Bias. Annual
Review of Sociology, Vol. 18, (1992), pp. 327-350
pág. 40 pág. 41
∗
ECONOMETRÍA APLICADA La observación es sólo observado si está por encima de cierto limite/umbral
conocido, es decir:
Prof. Edson Apaza Mamani ∗ ∗
>
= ∗
. . ≤
MODELOS TRUNCADOS Y CENSURADOS La función de densidad de la variable truncada observada es por tanto la función de
densidad de probabilidad de la variable latente condicional sobre sus valores
observados, es decir3:
7. Modelos censurados y truncados
∗ ∗ ( ∗| )
( | )= ( | > , )=
La existencia de información omitida o no cuantificada en las encuestas, puede dar logar a ∗
> |
la inconsistencia en la estimación de los modelos econométricos. Así por ejemplo, se
presentan casos en las cuales existe disponible, para una submuestra, de información de −1 −
salario muchos de los cuales están considerados como cero o no esá disponible, sin ( | )=
−
embargo todas la demás datos si están disponibles tanto para los que reportan salarios cero 1−Φ
o no disponible. Para este caso el modelo a utilizar es un modelo truncado.
−
En otros casos, es posible que el investigador esté interesado en un rango de información, 1
( | )=
por ejemplo, un cierto nivel de estudios, o un cierto rango de edades, rango de ingresos etc. −
Φ
Esta información permitirá definir el modelo econométrico a estimar como un modelo
censurado. donde (. ) es la función de densidad de probabilidad y Φ(. ) La distribución normal
acumulativa.
7.1. Introducción
Note que el valor esperado de la variable observada no es lineal en (intente derivar la
La estimación de modelos econométricos con información faltante o con un interés ecuación de abajo).
particular de una submuestra, nos permitirá definir un modelo censurado o truncado. En
estos modelos, los puestos del modelo lineal general ya no se cumplen. Por ello, el método ∗ ∗
[( − )/ ]
de estimación más apropiado es el estimador de máxima verosimilitud. ( | )= ( | > , )= + +
Φ[( − )/ ]
7.2. Modelos TRUNCADOS donde ≡ ( )/Φ( ) y = ( − )/ . La siguiente figura muestra el modelo de
regresión truncada en un ejemplo con = 30, = 2 (un termino constante y una
Los efectos del trucamiento ocurre cuando los datos observados en la muestra sólo se −2
agrupan a una submuestra de una gran población. La muestra de este subconjunto se basa variable dependiente) con un punto de truncamiento = 0, = y = 1.
0.5
en el valor de la variable dependiente.
Un ejemplo, un estudio de los determinantes del ingreso de los pobres. Únicamente

hogares con ingreso debajo de una cierta línea de pobreza son parte de la muestra.
i) Especificación del modelo (Regresión Truncada) 3

Note cómo la función de densidad de probabilidad de una variable normalmente distribuida con media
Considere la variable aleatoria latente ∗
que depende linealmente de , es decir: y varianza puede ser escrita utilizando la función de densidad de probabilidad (. ) De la normal estándar
(0,1)
∗
= + ~ (0, ) 1 ( − )
( )= −
√2 2
El término de error es independiente y normalmente distribuido con media cero y 1 1 ( )
( )= −
varianza constante. La distribución de ∗ dado es por lo tanto normal: √2 2
∗ −
| ~ ( , ). El valor esperado de la variable latente es ∗ = . ( )=
pág. 42 pág. 43
Sin embargo, si el investigador sólo está interesado en el efecto del valor esperado de l
subpoblación, estimar el efecto marginal es más complicado, de hecho se debe estimar:
∗ ∗
( | ) ( | > , )
=
= +
= (1 − − )
Estos efectos marginales dependen de las características individuales y sólo pueden

ser reportados para tipos específicos o como efectos promedio en la muestra
poblacional (ver ejemplo de aplicación para cambios marginales).
iv) Aplicaciones
Stata estima el modelo de regresión truncada por el comando

Figura 1: Modelo de regresión truncada
truncreg depvar [indepvars] [, ll(#)]
ii) Estimadores: MV
donde ll(#) define el punto de truncamiento . Podemos estimar un modelo general
La regresión lineal simple por MCO para la variable observada sobre . con un punto de truncamiento por arriba o por encima.
= + truncreg depvar [indepvars] [if] [in] [weight] [, ll(varname) lu(varname)]
Obteniendo estimadores sesgados de , como el término de error es: donde la opción umbral arriba ll y abajo lu puede ser referido a observaciones
∗ específicas y sus valores están definidor por varname.
=( | > )
∗ podemos utilizar los comandos post-estimación predict y mfx para obtener
que está correlacionado con y ( )= ( | > )= > 0.
predicciones y efectos marginales. Por ejemplo:
La regresión truncada además es usualmente por el método de máxima verosimilitud
truncreg wage age educ, ll(1.5)
(ML). La función de máxima verosimilitud es: predict wage_hat, e(.,1.5)
mfx compute, predict(e(.,1.5)) at(age=40,educ=12)
− −
= − 1−Φ
truncreg lwage age educ, ll(1.2)
predict lwage_hat, e(.,1.2)
y permite estimar tanto y por una procedimiento numérico iterativo. La función de mfx compute, predict(e(.,1.2)) at(age=40,educ=12)
verosimilitud aplica las propiedades de consistencia, eficiencia asintótica y normalidad, etc.
estima un modelo de regresión truncada debajo del nivel de ingreso (wage) 1.5 dólares
iii) Interpretación de los parámetros la hora, calcula el valor proyectado de ( | ) = ( ∗ | ∗ > , ) en esta submuestra
La interpretación de los parámetros depende mucho de la pregunta de investigación. Si y calcula los efectos marginales de edad y educación sobre el valor esperado del ingreso
el investigador está interesado en el promedio de toda la población, los coeficientes ( | ) para personas con 45 años de edad y con escolaridad de 12 años de educación.
simplemente se interpretan como los efectos marginales.
( ∗| )
=
pág. 44 pág. 45
7.3. Modelos CENSURADOS La siguiente figura representa el modelo de regresión truncada en un ejemplo con =
30, = 2 (una constante y una variable independiente) un punto de truncamiento
El censuramiento ocurre cuando los valores de la variable dependientes están restringidos −2
a un rango de valores. Como veremos más adelante, para el caso de truncamiento la debajo = y = 1.
0.5
variable dependiente la información sólo es observable para una bus muestra. Sin embargo,
existe información (para las variables independientes) de la muestra completa.
Algunos ejemplos.
Tickets vendidos para un encuentro deportivo, no puede exceder la capacidad del estadio.
Gasto en bienes durables son tanto valores positivos como ceros (este es el ejemplo
utilizado en Tobin (1958) en su paper original.
El número de aventuras extramatrimoniales son no negativos. (Observe que aunque el

famoso paper de Fair (1978) utiliza un modelo Tobit, los modelos de datos de conteo
pueden ser más apropiados.
i) Especificación
∗
Considere la variable latente aleatoria que depende linealmente de , es decir:
∗ )
= + ~ (0,
El término de error es independiente y normalmente distribuido con media cero y Figura 2: El modelo Tobit estándar (tipo 1).
varianza constante. La distribución de ∗ dado es por lo tanto normal:
∗
| ~ ( , ). El valor esperado de la variable latente es ∗ = .
El valor observado de está censurada por abajo por 0, es decir: ii) Estimadores: MV
∗ ∗ La regresión por MCO para la variable observada sobre .
>0
= ∗
0 ≤0
= +
La variable observada es una variable aleatoria mezclada con una probabilidad de masa
Obteniendo estimadores sesgados de , como
( = 0| ) = ( ∗ < 0| ) = Φ(− / ) sobre 0 y un valor continuo sobre
0 con densidad ( | ) = ϕ[( − )/ ]. ( | )= Φ( / ) + ϕ( / )
El valor esperado de la variable observada es: no es una función lineal de .
∗ ∗ ∗ ∗
( | )=0∙ ( ≤ 0| ) + ( | > 0, )∙ ( > 0| ) Note que existe una muestra restringida de todas las observaciones observadas,
( recolectadas, es decir, donde > 0, no resuelve el problema como sería en el caso de
/ )
( | )= + Φ( / ) un modelo de regresión truncada hacia arriba.
Φ( / )
La regresión truncada usualmente se estima por el método de máxima verosimilitud.
( | )= Φ( / ) + ϕ( / ) Asumiendo independencia entre las observaciones, la función de máxima verosimilitud
(log likelihood) es:
pág. 46 pág. 47
− ∗
( > 0) Φ( / ) −1
= + 1−Φ = =
{| } { | }
esta función puede estimar tanto y por una procedimiento numérico iterativo. La función donde
de verosimilitud hacia arriba es una función combinada de componentes discreta y continua y
una función de máxima verosimilitud estándar, se deja al lector la demostración del mismo.
≡ =
Sin embargo, este puede ser mostrado que el estimador tiene propiedades usuales de 1−Φ Φ
máxima verosimilitud. Aunque la función de máxima verosimilitud del modelo Tobit no
es globalmente cóncava este tiene un máximo único. El estimador es inconsistente ante y
la presencia de heterocedasticidad. Greene (2004, seccion 22.3.3.) muestra cómo se
realiza la prueba de heterocedasticidad.
=
La estimación por ML de los modelos de regresión censurada descansa fuertemente de
los supuestos fuertes de que el término de error está normalmente distribuido. Existen Estos efectos marginales dependen de las características individuales y sólo pueden
varias estrategias de estimación semi-paramétrico, estrategias que han sido propuestas ser reportados para tipos específicos o como efectos promedio en la muestra
que relaja la distribución del término de error. Vea Chay y Powell (2001) para una poblacional (ver ejemplo de aplicación para cambios marginales).
introducción. iv) Aplicaciones
iii) Interpretación de los Parámetros
El programa Stata, estima el modelo Tobit estándar (tipo 1) mediante el comando:
La interpretación de los parámetros depende mucho de la pregunta de investigación. Si tobit depvar [indepvars], ll[(0)]
el investigador está interesado en el promedio de toda la población, los coeficientes
se interpretan como los efectos marginales. Asimismo, se puede estimar modelos más generales con censuramiento para arriba (ll)
y para abajo (lu).
∗
( | )
= tobit depvar [indepvars] [if] [in] [weight] , ll[(#)] ul[(#)] [options]
luego es posible utilizar los comandos post-estimación predict y mfx para obtener
Sin embargo, si el investigador está interesado en el efecto del valor esperado de los predicciones y efectos marginales. Por ejemplo:
valores observados (censurado), el efecto marginal es (derívelo!):
tobit faminc age educ, ll(2000)
( | ) predict faminc_hat, ystar(2000,.)
= Φ( / ) mfx compute, predict(ystar(2000,.)) at(age=40,educ=12)
Hay una descomposición interesante de este efecto marginal (McDonald y Moffit,

1980): (1) el efecto sobre la expectativa de todos los valores completamente observados estima ( | ) = ( ∗ | ∗ > 0, ) ∙ ( ∗ > 0| ) y calcula los efectos marginales
y (2) el efecto sobre la probabilidad de ser completamente observado: de la edad y educación sobre el nivel de ingresos ( | ) para personas de 45 años de
∗ ∗ ∗
edad con escolaridad de 12 años alcanzados.
( | ) ( | > 0, ) ∗
( > 0) ∗ ∗
= ( > 0) + ( | > 0, )
( ) ( )
con
( ∗| ∗
> 0, )
= (1 − − )
pág. 48 pág. 49
∗
ECONOMETRÍA APLICADA 1 >0
=
0
Prof. Edson Apaza Mamani ∗
=1
=
. .
MODELOS DE HECKMAN DE AUTOSELECCION En otras palabras, la primera ecuación (la ecuación de decisión, ∗ ) explica qi una
observación está en la muestra o no. La segunda ecuación (ecuación de regresión de
interés, ∗ ) determina el valor de . Note que el modelo estándar tobit es un caso
8. Modelos Selección especial de esta especificación con = , = , = y = 1.
El problema de selección muestral ocurre cuando la muestra observada no es una muestra La siguiente figura muestra un ejemplo de un modelo de selección con = 30, =
aleatoria pero sistemáticamente se eligen de una población. El truncamiento y −1.5 −2
, = , = 1, = 0.8 y correlación entre y explica porqué la
censuramiento como casos especiales de selección muestral o truncamiento incidental. 1 0.5
probabilidad de ser observada incrementa con .
El ejemplo clásico: el ingreso sólo se observa para personas empleadas pero no para
aquellos que deciden estar en casa (históricamente se mantienen para el caso de las
mujeres).
Otros ejemplos, en estudios de migración, solamente se observan aquella que decidieron

hacer el cambio de residencia por diferentes factores. Hogares que realmente tienen acceso
al crédito. No se pueden ver los otros casos, losque deciden quedarse en sus lugares de
origen y los que no recibieron el crédito. Por tanto, es posible que al momento de estimar
los determinantes de la migración o los factores que determinan el acceso al microcrédito,
tengan el problema de selección muestral.
i) Especificación del modelo (Modelo de Selección de Heckman, Tobit tipo 2)
Considere un modelo con dos variables latentes ∗ y ∗ que dependen linealmente de

variables observables y respectivamente, es decir:
∗
= +
∗
= +
con
0 1
( , )~ ,
0
Los términos de error y son independientemente (entre observaciones) y

conjuntamente normalmente distribuidos con covarianza . Note que la varianza de
es fijado a la unidad ya que en la estimación no está identificada.
Las dos variables latentes no son observadas por el investigador. Estas se observan
únicamente en un indicador cuando la variable latente ∗ es positiva. El valor de la
variable ∗ = sólo se observa si el indicador es 1.
pág. 50 pág. 51
( )
Φ( )
se omite y se convierte parte del término de error.
El término de error además está correlacionada con si ≠ 0 y está

correlacionada con . El resultado sesgado es llamado sesgo de selección o sesgo de
selección muestral. (Demostración en Stata).
Note que no existe sesgo si los componentes no observables están no correlacionados

( = 0) incluso cuando la muestra observada es altamente selectiva (sólo inlf, solo
migrantes, sólo con créditos, etc.), es decir, incluso cuando y están correlacionadas
y así algunos valores de son más probables a ser observadas que otras. La siguiente
figura muestra esta situación.
Figura 3: modelo de selección con correlación observable y características no

observables.
Como = 0.8, indica que se tiene una correlación positiva del error explica por qué,
para un y , puntos de ∗ por encima del valor esperado (por ejemplo, el punto 6) es
más probable para ser observado.
∗
El valor esperado de la variable es la esperanza condicional de condicionado a que
sea observado ( = 1), en términos econométricos:
( )
( | , ) = ( ∗| = 1, , )= + = + ( )
Φ( )
Figura 4: el modelo de selección con correlación de características observables pero
donde ( ) ≡ ( )/Φ( ) es el indicador conocido como el ratio inversa de Mills. características no observables no correlacionados.
Note que ( | , ) = si los dos términos de errores no están correlacionados, es No es necesario decir que no existe sesgo si las características observables y no
decir que = 0. Esto es aun cierto cuando y están correlacionados, como por observables entre la decisión y la ecuación de regresión no esta correlacioandas. Este
ejemplo en el caso usual cuando alguna variable independiente aparece en y en . es el caso de una representación de muestra aleatoria pura, la cual se observa en la
siguiente figura.
ii) Estimación
La regresión por MCO para la variable observada sobre .
= +
Obteniendo estimadores sesgados de , ya que el f actor:
pág. 52 pág. 53
La estimación por ML del modelo de selección tienen las propiedades estándar de ML

(consistencia, eficiencia, normalidad asintótica, etc.). En la práctica es difícil para
encontrar numéricamente el máximo valor, ya que el valor inicial es muy importante.
Además, la estimación con el procedimiento de dos etapas que analizaremos en la
siguiente sección es a menudo utilizado como valor inicial. La estimación por ML es sólo
necesario cuando la prueba de = 0 es rechazado en la estimación de dos etapas.
La estimación por ML del modelo de selección de Heckman descansa fuertemente en el

supuesto de que el términos de errores están conjuntamente normalmente
distribuidos. Hay un supuesto muy fuerte y a menudo no realista. Muchas estrategias
de estimación semi paramétricas han sido propuestos donde relajan los supuestos
distributivos sobre el término de error. Vea Vella 81998) para una introducción.
iv) Estimación con el Procedimiento de Dos Etapas de Heckman
Figura 5: el modelo de selección tanto con características observables y características Heckman propuso un estimador de dos etapas que sólo considera la estimación de un
no observables no correlacionadas, es decir, muestras aleatorias. modelo probit estándar y un modelo de regresión lineal. El procedimiento de dos etapas
se define sobre la media condicional:
iii) Estimación con el Método de Máxima Verosimilitud
( )
( | , )= + = + ( )
Las ecuaciones de decisión y regresión pueden ser estimados simultáneamente por el Φ( )
método de máxima verosimilitud bajo el supuesto distribucional de los errores. La
función de máxima verosimilitud consiste en dos partes: (1) la contribución de de todas las ’s observadas
probabilidad de las observaciones con = 0, es decir, la probabilidad de no ser La primera etapa es la estimación consistente de por el método de ML utilizando todo
observado en la ecuación de regresión. (2) La contribución de probabilidad de las el conjunto de observaciones en el modelo probit estándar:
observaciones con = 1, es decir la probabilidad de ser observada multiplicada con la
densidad condicional del valor observado: ∗
= +
∗
= [ = 0] + [ = 1] ∗| =1 = 1 si > 0, 0 en otro caso
=0 =1
Podemos utilizar para esta estimación consistente, el ratio inversa de Mills , para todas las
= [ = 0] + ∗ = 1| ∗ observaciones.
=0 =1
( ) ( )
≡ =
= [ = 0] + ∗ + = 1| ∗ 1 − Φ( ) Φ( )
=0 =1 =1 Segunda etapa; es la estimación de la ecuación de regresión con el ratio inversa de Mills como
− + − una variable adicional:
= [Φ(− )] + + Φ /
(1 − )
=0 =1 =1 = + +
Para la submuestra de todas las observaciones. El modelo de regresión de MCO obtiene , ,

y así la correlación = ⁄ .
Note que esta función de máxima verosimilitud identifica , , , pero no la varianza
de el cual fue fijado a la unidad. En el caso de = 0, las funciones de probabilidad se El estimador de dos etapas de Heckman es consistente per no eficiente. Además, la matriz de
reduce a la suma de un modelo probit y un modelo regresión lineal que puede ser covarianzas del estimador de la segunda etapa proporcionado por MCO estándar es incorrecto
estimado por separado. con el regresor adicional (el ratio inversa de Mills), el cual esta medido con error y el término de
pág. 54 pág. 55
error es hetorocedastico. Además el error estándar necesita ser corregido. Para más donde depvar = , indepvars= , depvar_s = y varlist_s= . Stata
detalles Greene (2003, 22.4.3.) sobre cómo hacerlo. La pruena de la hipótesis nula = calcula los parámetros de interés por el método de ML por dos etapas, agregando la
0 es una prueba optima de = 0 y puede ser realizado utilizando los errores estándar opción twostep.
“incorrectos” de MCO (como ellos son correctos bajo la hipótesis nula).
Estimación de la primera etapa:
Existe a menudo un problema práctico de identificación (casi multicolinealidad) cuando
probit inlf kidslt6 kidsge6 faminc age agesq
las variables de ambas ecuaciones son las mismas, es decir, cuando = , vea Vella predict y_hat, xb
(1998). Los parámetros y están teóricamente identificados por la nolinealidad del gen imr = normalden(y_hat)/normprob(y_hat)
ratio inversa de Mills (. ). Sin embargo, como puede verse en la siguiente figura, es caso
lineal para una gran rango de valores de . Este es además fuertemente aconsejable
para incluir variables en que no están incluidos en aunque esto es con frecuencia Estimación de la segunda etapa:
difícil encontrar tales variables.
regress lwage educ exper expersq imr, r
Estimación del modelo de Heckman en dos etapas

age agesq) twostep

age agesq) first twostep

age agesq) first twostep mills(mymills)
Referencias:
Figura 6: El ratio inversa de Mills y las observaciones de la Figura 3.
Greene, William H. (2003), Econometric Analysis, Prentice Hall, section 22.1-22.4.

v) Interpretación de los parámetros Davidson and MacKinnon (1993), Estimation and Inference in Econometrics, Oxford
University Press, sections 15.6-15.8.
En la mayoría de los casos, nosotros estamos interesados en el efecto de las variables
independientes en toda la población. Además nos gustaría obtener los estimadores Davidson and MacKinnon (2004), Econometric Theory and Methods, Oxford University
insesgados y consistentes de que es interpretado directamente como efecto marginal. Press, chapter 11.6-11.7.
En algunos casos, sin embargo, los investigadores están interesados en el efecto sobre
la población observada. Para los regresores que aparecen en el lado izquierdo tanto en Amemiya, Takeshi (1994), Introduction to Statistics and Econometrics, Cambridge: Harvard
∗
y ∗ , el efecto marginal depende no sólo de sino también de a través de la University Press, section 13.6.
probabilidad de estar en la muestra. Vea Greene 2003, sección 22.4.2.).
Amemiya, Takeshi (1985), Advanced Econometrics, Cambridge: Harvard University Press,
vi) Aplicación chapter 10.
Stata calcula por el método de ML, con el comando heckman: Chay, Kenneth Y. and James L. Powell (2001), Semiparametric Censored Regression Models,
Journal of Economic Perspectives, 15(4), 29-42.
heckman depvar [indepvars], select(depvar_s = varlist_s) [twostep]
pág. 56 pág. 57
Vella, F. (1998) Estimating Models with Sample Selection Bias: A Survey, Journal of Human ECONOMETRÍA APLICADA
Resources, 33, 127-169
MODELOS DE ELECCIÓN MULTIPLE
9. Modelos de elección múltiple
En muchas ocasiones, el agente económico debe elegir entre más de dos alternativas
posibles. Los modelos presentados anteriormente pueden adaptarse, sin mucha dificultad,
a este tipo de problemas de decisión. A modo de ejemplo, supongamos que cada individuo
de una muestra puede escoger una entre tres alternativas posibles, y denotaremos por
una variable que toma el valor de 1 si el individuo escoge la opción , mientras que toma
el valor de 0 si el individuo escoge otra de las opciones.
En esta sección analizaremos los modelos más conocidos de elección múltiple: probit
ordenado, logit ordenado y modelo logit multinomial.
9.1. Probit Ordenado
La variable dependiente a menudo toma números valores contables, por ejemplo:
{1,2, … , }
Esto aplica en contextos donde un agente (individuo, hogar, empresa, tomador de
decisiones, …) elige de un conjunto de alternativas.
Algunas veces tales valores/categorías de tales variables discretas pueden ser naturalmente
ordenados, es decir, valores grandes se asumen a su correspondiente mayor “resultado”. El
modelo probit ordenado es un modelo de variable latente que ofrece un proceso generador
de datos para este tipo de variables dependientes. Algunos ejemplos:
 Escala en las encuestas de opinión: 1 = "Totalmente en desacuerdo", 2 = "Algo en

desacuerdo", 3 = "Indeciso", 4 = "Algo de acuerdo ", 5 =" totalmente de acuerdo".
 Estado de Empleo: 1 = "sin empleo", 2 = "tiempo parcial", 3 = "tiempo completo".
(Aunque a menudo se utiliza como ejemplo cabe preguntarse el orden "natural" en
este caso y aplicar los modelos sin ordenar.)
i) Especificación del Modelo Econométrico
Considere la variable latente aleatoria ∗ para los individuos = 1,2, … ,

∗ = + ~ (0, )
pág. 58 pág. 59
que depende linealmente de . El término de error es independiente y estimadores de la función de máxima verosimilitud y ̂ son consistentes,
normalmente distribuido con media 0 y varianza . La distribución de ∗ dado es asintóticamente eficiente y distribuidos normalmente.
además normal: ∗ | ~ ( , ). El valor esperado de la variable latente es ∗
=
. iv) Interpretación de los Parámetros
La elección observada es únicamente si el índice del individuo indica la elección dentro [el índice del individuo es omitida en esta sección] el signo del parámetros estimados
de una categoría (que elige previamente) = 1,2, … , que se define a través de sus puede ser interpretado directamente: un signo positivo nos dice si la probabilidad de
límites inferior y superiores , es decir, la elección observada es: respuesta/elección cambia a una categoría mayor cuando la variable independiente
incrementa. La hipótesis nula = 0 implica que la variable , no tiene influencia
1 ∗ ≤ sobre la probabilidad de elección. Tenga en cuenta, sin embargo, que la magnitud
⎧2 < ∗≤
⎪ absoluta de los parámetros no tiene sentido, ya que es arbitrariamente escalado por el
= 3 < ∗≤ supuesto = 1. Lo cual puede abarcar, por ejemplo, no comparar directamente las
⎨ ⋮ estimaciones de los parámetros de la misma variable en diferentes subgrupos.
⎪
⎩ < ∗
A menudo es interesante predecir las probabilidades de elección ( = | ) para
La probabilidad que un individuo elija la alternativa es fácilmente derivada con la ciertos tipos de y para inspeccionar el efecto marginal de una variable independiente
ayuda de la siguiente figura: en las probabilidades de elección (suponiendo = 1 y = 1).
Φ[( − )/ ] =1 ( = | )
⎧ =− ( )
⎪Φ[( − )/ ] − Φ[( − )/ ] =2
= Φ[( − )/ ] − Φ[( − )/ ] =3
⎨ ⋮ ( = 2| )
⎪ =[ ( )− ( − )]
⎩1 − Φ − / =
donde Φ(. ) Es la distribución acumulativa normal estándar. ( = 3| )

=[ ( − )− ( − )]
ii) Identificación
…
La probabilidad de elección permite sólo para identificar los ratios / y / pero
no , y individualmente. Además, uno usualmente asume = 1. ( = | )
= −
Suponfa que la función índice contiene una constante, es decir = + +⋯+
. Entonces y , … , no están identificadas como sólo diferencias − Tenga en cuenta que los efectos marginales sólo pueden ser reportados para tipos
aparecen en las probabilidades de elección . El modelo es usualmente identificado especificados . Cuando es positivo, entonces la probabilidad de elegir la primera
tanto por la definición de =0o = 0. categoría ( = 1) disminuye con y la probabilidad de que los última categoría
( = ) aumenta. Sin embargo, el efecto en las categorías medias es ambiguo y
iii) Estimación depende de .
El modelo probit ordenado puede ser estimado utilizando el método de ML. La función v) Aplicaciones
de ML es:
El comando de Stata
= oprobit depvar [indepvars] [if] [in] [weight] [, options]
estima los parámetros y el umbral en el modelo probit ordenado. Stata no asume la

donde = 1 si el elije la alternativa y = 0 en caso contrario. La función de constante, es decir, = 0. depvar es una variable categórica que es más favorable
verosimilitud es numéricamente maximizado sujeto a < <⋯< . Los pero no necesariamente codificado como 1,2, … , .
pág. 60 pág. 61
El comando post estimación. 9.2. Logit Condicional

predict [type] {stub* | newvar | newvarlist} [if] [in] [, statistic En la mayoría de los casos, las variables dependientes discretas
outcome(outcome) nooffset]
predict p1, p outcome(1) {1,2, … , }
predice la probabilidad de elegir, por ejemplo, la alternativa con valor = 1, en no tienen un orden natural. Esto se aplica a menudo a un contexto en el que un agente
nuestra notación ( = | ), para todos los individuos de la muestra. Usted (individuo, familia, empresa, toma de decisiones,...) elige a partir de un conjunto
directamente puede predecir las probabilidades de elección para todas las alternativas. desordenado de alternativas.
Para = 3 alternativas, el commando El modelo logit condicional requiere que las variables que varían entre alternativas y,
predict p1 p2 p3, p posiblemente, a través de los individuos. Algunos ejemplos:
asigna las probabilidades estimada ( = 1| ), ( = 2| )y ( =  Los viajeros eligen entre un conjunto de modos de transporte: "bus", "tren",
2| ) en las respectivas nuevas variables p1, p2 y p3. "coche", "avión". Puede haber una variable "tiempo de viaje", que es específica a
una alternativa y una variable "gastos de viaje" que depende del medio de
Los efectos marginales sobre la probabilidad de elegir la alternativa con valor 1 se transporte y el ingreso personal a través de los costos de oportunidad, que es el
calcula como mismo para todas las alternativas.
mfx compute, predict(outcome(1))  Los compradores de coches escogen entre ciertos tipos de vehículos: " Sedán 4
puertas", " coupé 2 puertas", "Station Wagons", "Convertibles", " Auto Deportivo",
para un individuo con características medias ̅ . La opción at se utiliza para evaluar los "Mini vans", "Todo terreno", "Camiones Tractor" , "Vans".
tipos .  Los compradores de papel higiénico tienen que elegir entre diferentes marcas.
 Las empresas deben elegir entre diferentes tecnologías.
i) Especificación del Modelo Econométrico
La elección de una de las alternativas desordenadas es impulsada por una variable

latente, a menudo interpretada como utilidad indirecta. La utilidad indirecta ∗ de un
individuo elegir la alternativa = 1,2, … , es:
∗
= +
Hay términos errores para cualquier individuo . Las variables exógenas =

, , se puede dividir en variables que dependen de un sólo individuo, ,
sólo en la alternativa, , o en ambos .
Un individuo elije la alternativa , siempre que ofrezca el mayor valor de utilidad

indirecta. La elección observada de un individuo es por lo tanto
∗ ∗
1 ≤
⎧ ∗ ∗
⎪2 ≤
∗ ∗
= 3 ≤
⎨ ⋮
⎪ ∗ ∗
⎩ ≤
pág. 62 pág. 63
Tenga en cuenta que esto implica que la elección sólo depende de la diferencia de probabilidad de elección . Tenga en cuenta que para la identificación del efecto fijo,
utilidad y no sobre el nivel. una alternativa actúa como referencia y su constante se fija en cero.
El modelo logit condicional supone que los términos de error siguen una distribución iii) Estimación
independiente e idénticamente un valor extremo. La función de distribución
acumulativa es: El modelo condicional puede ser estimado utilizando máxima verosimilitud (ML). La
función de verosimilitud es
=
Esta especificación aparentemente arbitrario del término de error tiene dos =

características importantes: (1) La diferencia de dos términos de error sigue una
distribución logística (como en el modelo logit). (2) La probabilidad de que un individuo donde = 1 si el individuo elije la alternativa y = 0 de lo contrario. El
elige la alternativa es una expresión simple (que no es trivial derivar): estimador de máxima verosimilitud es consistente, asintóticamente eficiente y
normalmente distribuida.
= ( = | )=
∑ iv) Interpretación de los Parámetros
La independencia del término de error a través de alternativas es un supuesto fuerte. [El índice de individuo se omite en esta sección] En algunas aplicaciones existe una
Esto implica que la estocástica de un individuo, es decir, la preferencia no observada, la interpretación natural de la variable latente ∗ . En estas situaciones, el signo de un
preferencia por una determinada alternativa es independiente de su preferencia parámetro se puede interpretar como la dirección de la influencia de la variable ,
estocástico para otras alternativas. Las fuertes y desagradables consecuencias de esta = ,… , ,…, para todo . Tenga en cuenta que la magnitud absoluta de los
suposición se discuten en la literatura como independencia de alternativas irrelevantes parámetros no tiene sentido o intepretación dirrecta.
(IIA).
A veces es interesante examinar el efecto marginal de una variable independiente
ii) Identificación en las probabilidades de elección:
En el modelo logit condicional, las personas sólo se preocupan por las diferencias de ( = | )
servicios públicos a través de alternativas. Los factores que influyen en el nivel de = 1−
utilidad dependen de todas las alternativas, por lo tanto no se puede explicar la decisión
del individuo. Las variables independientes individuales específicas por lo tanto se ( = ≠ | )
cancela en la probabilidad elección =
Tenga en cuenta que los efectos marginales dependen de que pasa por y para ello
= = =
∑ ∑ ∑ sólo puede ser reportado para tipos especificados.
y el correspondiente no está identificado. Un término constante que no varían con A menudo es más interesante utilizar el modelo estimado para predecir probabilidades
los individuos ni las alternativas es, por supuesto, no identificado por el mismo de elección para los tipos de hogares específicos descritos por
argumento. La característica individual comienza a jugar un papel cuando
interactúan con las características de las alternativas (forman los efectos fijos). = ( = | )=
∑
A menudo es beneficioso incluir el término constante de la alternativa específica .
Estos efectos fijos de la alternativa capturan todas las características observadas y no Sin embargo sólo se puede inspeccionar los cambios de las características individuales
observadas que describen la alternativa que son idénticos entre los individuos. En este en el resultado predicho como toda la información sobre las alternativas está encerrado
en el estimado βj alternativa parámetros específicos. Además, no es posible simular la
caso, el coeficiente de la variable de alternativa específica no es identificado:
adición o supresión de alternativas de elección.
cualquier vector añade ∗ = + y ∗= − se cancela dentro de la
pág. 64 pág. 65
v) Aplicaciones numéricamente muy exigente. Por otra parte, todavía no muchos entienden
completamente los problemas prácticos que surgen de la identificación.
Los modelos logit multinomiales sólo utiliza las características individuales específicas.
Los datos se almacenan como los datos habituales de corte transversal: una línea por Referencias
cada individuo. La variable dependiente (vardep = ) es una variable categórica para
el individuo que elige la alternativa . Las variables independientes (varindeps = )
no varían entre las alternativas. Stata estima el modelo logit multinomial utilizando el Train, Kenneth E. (2003), Discrete Choice Methods with Simulation, Cambridge
siguiente comando: University Press. Chapter 1 and 2.
mlogit vardep varindeps, basecategory (#) Greene, William H. (2003), Econometric Analysis, Prentice Hall. Sections 21.7.1-21.7.3,
21.8.
donde # indica la alternativa para el cual el parámetro = 0 para su identificación
(valor de la variable dependiente como base o punto de referencia). De manera general Amemiya, Takeshi (1994), Introduction to Statistics and Econometrics, Harvard
el comando mlogit es de la forma: University Press. Section 13.5.2.
mlogit depvar [indepvars] [if] [in] [weight] [, options] Amemiya, Takeshi (1985), Advanced Econometrics, Harvard University Press. Chapter
9.3.1-9.3.4.
El comando post-estimación
Davidson and MacKinnon (2004), Econometric Theory and Methods, Oxford University
predict p1, p outcome(1)
Press, chapter 11.4.
predice la probabilidad de elegir la alternativa con valor = 1, en nuestra
notación ( = 1| ), para todos los individuos en la muestra. Usted puede
proyectar directamente las probabilidades de elección para todas las alternativas. Por
ejemplo, para 3 alternativas, el comando es:
predict p1 p2 p3, p
básicamente asigna las probabilidades estimadas ( = 1| ), ( = 2| )

y ( = 2| ) en las respectivas nuevas variables p1, p2 y p3.
Los efectos marginales sobre la probabilidad de elegir por ejemplo, la alternativa con
valor 1 se calcula mediante
mfx compute, predict(outcome(1))
para un individuo con características medias ̅ . La opción at se utiliza para evaluar

otros tipos más, .
vi) Vea otros temas relacionados ...
La propiedad de independencia de alternativas irrelevantes (IIA) de los modelos logit

condicional y el modelo logit multinomial es, en la mayoría de las aplicaciones de un
supuesto muy poco realista. Los estimadores de los parámetros y en especial las
predicciones contrafactuales de ambos modelos son incompatibles si el IIA no se
sostiene. Los modelos más flexibles que se han propuestos son el logit anidado (nested
logit), logit mixto (kernel) o probit multinomial tanto. La flexibilidad del probit
multinomial y el modelo logit mixto, sin embargo, tiene un precio: la estimación es
pág. 66 pág. 67
Las partes restantes son como en el modelo logit condicional: la elección observada
de un individuo es
ECONOMETRÍA APLICADA ∗ ∗
1 ≥
⎧ ∗ ∗
Prof. Edson Apaza Mamani ⎪2 ≥
∗ ∗
= 3 ≥
⎨ ⋮
⎪ ∗ ∗
MODELOS DE ELECCIÓN MULTIPLE ⎩ ≥
los términos de error continúan como independiente e idénticamente una distribución

9.3. Logit Multinomial de valor extremo
El modelo logit multinomial se utiliza para el mismo tipo de situaciones de elección como =
el logit condicional:
y la probabilidad de que un individuo elige la alternativa es:
{1,2, … , }
= ( = | )=
donde el valor de no tienen un orden natural. ∑
Sin embargo, el logit multinomial utiliza sólo las variables que describen las características Una característica interesante del modelo logit multinomial es que el ratio de
de los individuos y no de las alternativas. Esto limita la utilidad del modelo para las probabilidad /odds ratio) ( / ) depende log-linealmente de .
predicciones hipotéticas. Algunos ejemplos:
 Los viajeros eligen entre un conjunto de modos de transporte: "bus", "tren", = −

"coche", "avión". Hay variables que describen al viajero, como sus ingresos. No hay
información sobre los modos de viaje. ii) Identificación
 Los compradores de coches escoger entre ciertos tipos de vehículos:
 Los compradores de coches escogen entre ciertos tipos de vehículos: " Sedán 4 El vector de parámetros , = 1,2, … , no tienen una nunca definición: cualquier
puertas", " coupé 2 puertas", "Station Wagons", "Convertibles", " Auto Deportivo", vector se añade a todos los vectores de ∗ = + cancela en las probabilidades de
"Mini vans", "Todo terreno", "Camiones Tractor" , "Vans". Sólo se utiliza información elección
sobre el comprador.
 Los compradores de papel higiénico eligen entre diferentes marcas. Como en el caso = = =
∑ ( ) ∑ ∑
anterior, sólo se utiliza información sobre el comprador.
 Las empresas deben elegir entre diferentes tecnologías. Sólo se utiliza Información
de la empresa. Los ’s se identifican generalmente mediante el establecimiento de la = 0 para una
alternativa de referencia.
i) Especificación del Modelo Econométrico iii) Estimación
El modelo logit multinomial difiere del modelo logit condicional sólo en la especificación El modelo condicional puede ser estimado utilizando máxima verosimilitud (ML). La
de la parte determinística de la utilidad indirecta, ∗ . función de verosimilitud es
∗
= +
=
Las variables exógenas describen únicamente los individuos y son idénticos entre las
alternativas. Sin embargo el parámetro difiere entre las alternativas.
pág. 68 pág. 69
donde = 1 si el individuo elije la alternativa y = 0 de lo contrario. El Sin embargo sólo se puede inspeccionar los cambios de las características individuales
estimador de máxima verosimilitud es consistente, asintóticamente eficiente y en el resultado proyectado, como toda la información sobre las alternativas está
normalmente distribuida. encerrada en los parámetros específicos estimado de la alternativa . Además, no es
posible simular la adición o supresión de alternativas de elección.
iv) Interpretación de los Parámetros
v) Aplicaciones
[El índice individual se omite en esta sección] Los parámetros del modelo logit
multinomial son difíciles de interpretar. Ni el signo (véase la sección de identificación Los modelos logit multinomiales sólo utiliza las características individuales específicas.
anteriormente) ni la magnitud del parámetro tiene un significado intuitivo directa. Las Los datos se almacenan tanto como es usual en formato de corte transversal: una línea
pruebas de hipótesis deben, pues, ser muy cuidadosamente formuladas en términos de por cada individuo. La variable dependiente (depvar = ) es una variable categórica
los parámetros estimados. con la persona que elige la alternativa . Las variables independientes
(indepvar= ) no varían entre las alternativas. Stata estima el modelo logit
El efecto marginal de una variable independiente en la probabilidad de elección para multinomial con el comando
la alternativa
mlogit depvar indepvars, basecategory(#)
( = | )
= − ̅
donde # indica la alternativa para el cual el parámetro = 0 para su identificación
(valor de la variable dependiente como base o punto de referencia).
depende no sólo de los parámetros sino también en la media de todas las demás
alternativas ̅ = 1/ ∑ El comando post-estimación
predict p1, p outcome(1)
Una posible interpretación más directa de las estimaciones de los parámetros se puede
se ha subido al ver el registro de la razón de posibilidades: predice la probabilidad de elegir la alternativa con valor = 1, en nuestra
notación ( = 1| ), para todos los individuos en la muestra. Usted puede
Una posible interpretación más directa de las estimaciones de los parámetros se puede
proyectar directamente las probabilidades de elección para todas las alternativas. Por
obtener viendo el logaritmo del ratio de probabilidades:
ejemplo, para 3 alternativas, el comando es:
/ predict p1 p2 p3, p
= −
básicamente asigna las probabilidades estimadas ( = 1| ), ( = 2| )
que se reduce a: y ( = 2| ) en las respectivas nuevas variables p1, p2 y p3.
/ Los efectos marginales sobre la probabilidad de elegir por ejemplo, la alternativa con
=
valor 1 se calcula mediante
para las comparaciones con la categoría de referencia . Un parámetro positivo mfx compute, predict(outcome(1))
significa por lo tanto que la probabilidad relativa de elegir aumenta la probabilidad
para un individuo con características medias ̅ . La opción at se utiliza para evaluar
relativa de elegir .
otros tipos más, .
El modelo logit multinomial también se puede utilizar para predecir probabilidades de
elección para determinados tipos de hogares
References
= ( = | )=
∑
Train, Kenneth E. (2003), Discrete Choice Methods with Simulation, Cambridge
University Press. Chapter 1 and 2.
pág. 70 pág. 71
Econometría Aplicada Prof. Edson Apaza Mamani
eapaza@unap.edu.pe
Greene, William H. (2003), Econometric Analysis, Prentice Hall. Sections 21.7.1-21.7.3,

21.8.
Amemiya, Takeshi (1994), Introduction to Statistics and Econometrics, Harvard

University Press. Section 13.5.2.
Amemiya, Takeshi (1985), Advanced Econometrics, Harvard University Press. Chapter

9.3.1-9.3.4.
Davidson and MacKinnon (2004), Econometric Theory and Methods, Oxford University
Press, chapter 11.4.
pág. 72

01 Cap1 Eco2 UNAP 2017 PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

01 Cap1 Eco2 UNAP 2017 PDF

Cargado por

Copyright:

Formatos disponibles

Econometría Aplicada Prof. Edson Apaza Mamani Econometría Aplicada Prof.

Edson Apaza Mamani

Notas de clase preparadas para el curso de Econometría II.

Econometría Aplicada con

Edson Apaza Mamani

Abril de 2017 pág. 0 pág. 1

7.1. Introducción ............................................................................................................. 42

Contenido 7.3. Modelos CENSURADOS ............................................................................................ 46

Prof. Edson Apaza Mamani

REGRESIÓN CON VARIABLES DEPENDIENTES E

1. Modelo de regresión con variables discretas en las variables independientes.

La especificación habitual de los modelos lineales, incluyen una variable dependiente y

i) Estimación por MCO

El método de estimación para un modelo lineal es el estimador de MCO, siempre y

La estimación consistente debe reflejar resultados estadísticamente significativos,

variabilidad explicada por las variables explicativas incluidos en el modelo

Logaritmico ln( ) = + ln( )+ Elasticidad

A continuación se presenta las Propiedades Asintóticas de los Estimadores de Mínimos

La estimación de cambios marginales se obtiene utilizando el comando mfx y sus

Un problema frecuente, del investigador, es determinar la mejor especificación del

Regresiona la ecuación de MINCER, el salario por hora en función de escolaridad y

Se puede utilizar el comando postestimación test para estimar las pruebas de

la prueba consiste en evaluar : = 0 contra : ≠ 0,

la prueba consiste en evaluar : =0y = 0 contra : ≠0o ≠0

la prueba consiste en evaluar : = contra : ≠

Referencias ECONOMETRÍA APLICADA

Libros Avanzados 2. Modelo Lineal General 2

Figura Nro. 1 Representación de una variable ficticia

i) Prueba de hipótesis de relevancia (t) y de dependencia (F)

3. Estrategia de Identificación ii) Interacciones

La aceptación de la frase que “la correlación no implica causalidad” ha significado el

iii) Aplicación: Ecuación de Mincer 3 (Impacto) ECONOMETRÍA APLICADA

Actividades: 4. Modelos de regresión con variables discretas en la variable dependiente

Muchas variables dependientes de interés en economía y otras ciencias sociales pueden

test educ exper hijos ( )=0∙ ( = 0) + 1 ∙ ( = 1) = ( = 1)

la prueba consiste en evaluar : = 0, =0y = 0 contra : ≠0o ≠0 El modelo de regresión lineal,

Tabla 2. Estimación del Modelo de Probabilidad Lineal

Error Probabilidad de Ocurrencia del Evento

4.1. Modelos de Elección Discreta ii) Bondad de ajuste

Donde (. ) es la función de densidad de probabilidad (pdf) y Φ(. ) la función de distribución

Como antes, los parámetros estimados no se interpretan directamente como

4.5. Modelo de doble complementariedad logarítmica Coeficiente de correlación :  2  y , yˆ 

2ln LNR  ln LR  2 ln LNR  n 

Las variables incluidas dentro de este estudio fueron:

- PROB: Variable dependiente discreta que toma el valor de 1 si la persona responde

Solución: valoración económica

ii) Comparación de modelos de elección discreta

Referencias Anexo: Estimador de Máxima Verosimilitud

Cameron, A. Colin and Pravin K. Trivedi (2005), Microeconometrics:Methods and 2 2 2 2

Libros adicionales Tomando logaritmos en la última expresión:

2 =− + Condiciones de primer orden

3. Sea el modelo = + y Sea ~ , . Encuentre el estimador de MV de

−2 +2 ′ ′ =0 Prof. Edson Apaza Mamani

Para ilustrar este método se plantean dos ecuaciones:

En este caso son la ecuación de participación de las ocupadas asalariadas y la función

Para las mujeres que no trabajan se tiene que ∗

Para corregir el sesgo de selección, de la primera etapa, se obtienen el ratio inversa de

heckman lwage educ exper expersq, select(kidslt6 kidsge6 faminc Referencias

heckman lwage educ exper expersq, select(kidslt6 kidsge6 faminc

Mincer, J. (1974), Schooling Experience and Earnings, National Bureau of Economic

ECONOMETRÍA APLICADA >

6. Modelo de Switching Regression La esperanza no condicional:

La variable endógena, de (9-10), el logaritmo del salario individual mensual, lsalario.