Está en la página 1de 69

CAPTULO 16

Modelos Tobit y Seleccin


16.1 . Introduccin
En este captulo se consideran dos temas muy relacionados: regresin
cuando la variable dependiente de inters es incompleta y a la regresin
observada cuando la variable dependiente es completamente observado
tambin se observa en una muestra seleccionada que no es representante
de la poblacin. Esto incluye los modelos limitados variable dependiente,
variable latente modelos Tobit generalizados, modelos, modelos y seleccin.
Todos estos modelos comparten la caracterstica comn que incluso en el
caso ms sencillo de mor- talidad media condicional lineal en los regresores,
regresin de MCO no conduce a estimaciones de parmetros debido a que la
muestra no es representativa de la poblacin. Alter- nativa procedimientos
de estimacin, la mayora dependen de supuestos distributivos fuertes, son
necesarias para asegurar la coherencia estimacin de parmetros.
Principales causas de forma incompleta datos observados son el
truncamiento y censura. Para datos truncados algunas observaciones
sobre la variable dependiente y los regresores se pierden. Por
ejemplo, los ingresos pueden ser la variable dependiente y slo las personas
de bajos ingresos estn incluidos en la muestra. Para informacin de
datos censurados en la variable dependiente se pierde, pero no los
datos de los regresores. Por ejemplo, la gente de todos los niveles de
ingresos puede estar incluida en la muestra, pero por razones de
confidencialidad los ingresos de personas de altos ingresos pueden ser de
distintos colores y slo inform que sobrepase, por ejemplo, 100.000 dlares
por ao. El truncamiento implica una mayor prdida de informacin
que censurar. Un ejemplo destacado de truncamiento y la censura es el
modelo tobit, que debe su nombre a Tobin (1958), que consider regresin
lineal por debajo de lo normal. Problemas similares surgen de truncamiento
y censura en otros modelos presentados en los captulos posteriores,
especialmente en el caso de censura duracin los datos presentados en el
Captulo 17. Ms en general, el truncamiento y censura son ejemplos de la
falta de datos los problemas que se estudian en el Captulo 27.
La primera generacin de mtodos de estimacin hiptesis requiere una
fuerte distribucin.
Aunque aparentemente menores salidas de suposiciones, como
heterosedasticidad homocedsticas utilizndose errores errores cuando se
supone, no puede conducir a estimaciones de parmetros.

Por esta razn los modelos presentados en este captulo proporcionan un


econometra aplicacin de mtodos de regresin semiparamtrico. Mtodos
simples para concentrar
529

MODELOS TOBIT Y SELECCIN


formas de censura y truncamiento como tope de codificacin se han
aplicado correctamente.
Sin embargo, en general los modelos con seleccin de aspectos hasta la
fecha no hay ningn procedimiento ampliamente aceptado.
Seccin 16.2 presenta teora general de censurados y truncados no lineal
regresion modelos, con especializacin en el modelo tobit en la Seccin 16.3
. Una alternativa de modelo de datos censurados, las dos partes de modelo,
es introducido en la Seccin 16.4 . La seleccin de la muestra se presenta
en la Seccin 16.5 . Una aplicacin a la salud gastos operativos en la
Seccin 16.6 contrasta las dos partes de modelos y de seleccin de la
muestra. El modelo no observables de Roy hiptesis se presenta en la
Seccin 16.7 . Seccin 16.8 ges- tin totalmente los modelos estructurales
de maximizacin de la utilidad de las soluciones o por extensin de modelos
de ecuaciones simultaneas a muestras seleccionadas. Concentrar
estimacin se presenta en la Seccin 16.9 .
16.2 . Modelos censurados y truncados
presentamos mtodos generales para la estimacin de modelos
paramtricos completamente cuando los datos estn censurados o
truncado. Estos mtodos pueden ser aplicados a los modelos presentados
en los captulos posteriores tales como modelos y la duracin. El ejemplo
ms destacado, el modelo tobit para censurar o truncado en modelos
lineales, se presenta en la Seccin 16.2.1 y tratamiento por separado en la
Seccin 16.3 .
16.2.1 . Censura y truncamiento Ejemplo
* * y que denotan una variable observada que es incompleta. Para el
truncamiento desde abajo, y * slo se observa si supera un umbral. En aras
de la sencillez, que umbral cero.
* * A continuacin, observamos y = y si y > 0. Dado que los valores
negativos no aparecen en la muestra, el truncado media supera la media de

y . De la censura desde abajo a cero, y * no est completamente observada


cuando y 0, pero se sabe que y < 0 y por la sencillez y se establece en
0. Desde los valores negativos se escalan hasta cero, la censura significa
tambin supera la media de y . Evidentemente, muestra significa truncado o
censurados en las muestras no se puede utilizar sin ajuste para estimar la
poblacin original.
Este captulo se estudian cuestiones similares en modelos de regresin. Con
un poco de suerte, el truncamiento y censurar slo podra dar lugar a un
desplazamiento hacia arriba o hacia abajo en la interseccin, dejando
pendiente puede llegar sin cambios; sin embargo, este no es el caso. Por
ejemplo, si E[y |x] = x en el modelo original, a continuacin, el
truncamiento o censurar conduce a E[y|x] que no lineal en x y para que LA
OPERACIN son inconsistentes las estimaciones de y por lo tanto
incompatibles las estimaciones de los efectos marginales.
Como ejemplo, considere el siguiente ejemplo de oferta de mano de obra
* datos simulados. La relacin entre nmero de horas trabajadas, y , y
salario por hora,w, se especifica que de lineal y formulario de registro con
los datos de proceso de generacin
Y = -2500 + 1000 matrcula lnw +, (16.1 ) N [0, 2 1000 ], matrcula
lnw N [2,75 , 0. 2 60 ].
530

16.2 . CENSURADOS Y truncados LOS MODELOS


Tobit: censurados y truncados Medios
4000
2000
0
Real
Media Variable latente truncado
-2000 censura significa
censura condicional significa diferentes medios

-40001 2 3 4 5
logaritmo natural de los salarios
Figura 16.1 : regresin Tobit de las horas de registro salario promedio
condicional: sin censura (parte inferior), censurados media condicional (en
el centro), y trunca media condicional (superior) de la censura/truncado
desde abajo a las cero horas. Los datos generados a partir de un modelo de
regresin lineal clsico.
Este es un modelo tobit, estudi en detalle en la Seccin 16.3 . El modelo
supone que el
aumento de salario, aumento de horas anual 10 horas. %1 * elasticidad
salario 1000/y , lo que equivale a, por ejemplo, 0,5 para el trabajo a tiempo
completo (2.000 horas).
* Para cada Figura 16.1 presenta un grfico de dispersin de matrcula lnw y
genera una muestra de 200
* observaciones. La incondicional significa para y , que es -2500 + 1000
matrcula lnw, est dada por la curva ms baja, que es una lnea recta.
* Con censurar a cero, los valores negativos de y se ponen a cero negativo
debido a que la gente con horas de trabajo desee optar por no trabajar. Para
este ejemplo concreto es el caso de aproximadamente el 35% de las
observaciones. Este empuja hacia arriba la media de baja
* los salarios, ya que los muchos valores negativos de los aos se desplazan
hasta cero.
* Tiene poco impacto en los salarios elevados, ya que, a continuacin,
algunas observaciones sobre el problema del ao cero. La curva en la figura
16.1 la censura da media, usando la frmula que figura ms adelante en
(16,23 ).
* Con el truncado con el cero, el 35% de la poblacin con valores negativos
de y se cay por completo. Esto hace que aumente la media por encima de
la censura significa, ya que los valores iguales a cero ya no estn incluidos
en los datos utilizados para la media. La curva superior en la figura 16.1 se
trunca el resultado da media, usando la frmula que figura ms adelante en
(16,23 ).
Est claro que censurados y truncados medio condicional son no-lineales en
x incluso si la media de la poblacin subyacente es lineal. Estimacin
mediante MCO truncado o cen- patrocinados datos lleven a incompatible
estimacin de la pendiente parmetro, ya que por vi- sual de inspeccin
Figura 16.1 una aproximacin lineal de la truncada no lineal y censurados
medios tendr ms plana que la de pendiente el original no truncada.

Anlisis debe basarse en las frmulas para la censura o trunca condi- media.
Desafortunadamente, estos son el resultado de una fuerte distribucin
hiptesis, como veremos.
531

MODELOS TOBIT Y SELECCIN


16.2.2 . Censura y truncamiento mecanismos
como es habitual en anlisis de regresin, nos vamos a indicar el valor
observado de la variable dependiente. La salida de anlisis habitual es que y
es la forma incompleta
* valor observado de la variable dependiente y latente, donde la
observacin es
* y = g(y ),
para un determinado funcin g( ). Principales ejemplos del g( )
inmediatamente.

* Con censura Censura que tenga siempre en cuenta los regresores x,


completamente observar y para un subconjunto
* de los posibles valores de y , e incompleta y para observar las dems
posibles
* los valores de y . Si la censura es desde abajo (o de la izquierda), podemos
observar
* * y si y > L y = * (16.2 ) L si y L.
Por ejemplo, todos los consumidores podrn tomarse muestras positivas con
bienes durables
* * los gastos (y > 0) y otros con cero gastos (y 0). Si la censura es
desde arriba (o desde la derecha) observamos
* * y si y < U y = * (16,3 ) U si y U.
Por ejemplo, ingresos anuales los datos pueden ser codificados por encima
de U = $100,000 . Esta forma de censura se llama tipo 1 censura en la
duracin literatura (consulte la seccin 17.4.1 ).

* La forma incompleta observ las observaciones sobre el problema del ao


se ajustan a L o U de la sencillez.
* En general, necesitamos que observ las observaciones de forma
incompleta y es conocido
* que se han perdido (es decir, observamos que y se encuentra fuera del
correspondiente) y los regresores x continan siendo completamente.
Truncamiento
el truncamiento implica una prdida de informacin, ya que todos los datos
de las observaciones en el obligado se pierden. Con truncamiento desde
abajo observamos slo
* * y = y si y > L. (16.4 )
Por ejemplo, slo los consumidores que compraron bienes duraderos pueden
ser muestreados (L = 0).
Con el truncamiento de arriba observamos slo
* * y = y si y < U. (16.5 )
Por ejemplo, slo las personas de bajos ingresos pueden ser muestreados.
Datos de Intervalo
Intervalo de datos son los datos registrados en intervalos. Los datos de la
encuesta son a menudo recaudado de esta manera para recordar y ayuda a
proporcionar una mayor anonimato en las respuestas a ms personal
532

16.2 . MODELOS censurados Y truncados


. Por ejemplo, los ingresos se pueden registrar en intervalos de 10.000
dlares y, a continuacin, parte superior- est codificado en 100.000
dlares. Estos datos son censurados en varios puntos, con los datos
observados
* y es el intervalo concreto en el que el ser vistos y mentiras.
16.2.3 . Censurados y truncados MLE

Censura y truncamiento son fciles de tratar si el investigador se aplica


totalmente para- mtricas. Este puede ser el caso de datos de intervalo o de
datos codificados en las que, por ejemplo, es razonable suponer una
distribucin log-normal de los ingresos o un modelo binomial negativa para
la cantidad de visitas al mdico.
* Si la distribucin condicional de y dado los regresores x es especificado,
entonces el- cativas de esta distribucin puede ser coherente y eficiente
estimado por ML estimaciones basadas en la distribucin condicional de la
censura o truncado. En concreto,
* * * * f (y |x) y F (y |x) indican la funcin de densidad de probabilidad
condicional (o problemas de
funcin * capacidad de comunicacin) y funcin de distribucin acumulada
de la variable latente y .
A continuacin, uno siempre puede obtener f (y|x) y F(y|x), el
correspondiente pdf condicional y
* * cdf de la variable dependiente y, dado que y = g(y) es una
transformacin de y .
La limitacin del enfoque paramtrico es el uso de hiptesis distribucin
fuerte. Por ejemplo, para el modelo de regresin lineal con normalidad la
MLE sigue siendo coherente incluso si los errores son anormales), pero la
censura MLE se vuelve incoherente si los errores son anormales) (consulte la
seccin 16.3.2 ). Modelos ms flexibles y concentrar mtodos se presentan
en secciones posteriores.
MLE
Censura Censura y truncamiento cambiar tanto el condicional y el
condicional significa den- sity. Comenzamos con la densidad.
Considerar ML estimacin dada la censura desde abajo. Y> L la densidad
de y es
* * el mismo que el de y , sof (y|x) = f (y|x). Para y = L, el lmite inferior, la
densidad
* * discreto, con masa igual a la probabilidad de observar y L, orf (L|x).
Por lo tanto, de la censura
F desde abajo (y|x) enfocar> L, f (y|x) = F (L|x) = L.
* enfocar tal como se menciona despus (16,3 ), y cuando y = L L no es
necesario. Incluso si no hay
* * valor de y se observa cuando a L la densidad es an F (L|x).

* La densidad es un hbrido de los pdf y la fdc de y . Similar al anlisis de


resultados modelos binarios, es aparte es extremadamente conveniente
introducir un indicador variable
1 enfocar> L, d = (16,6 ) 0 = L. enfocar
la densidad condicional dada la censura desde abajo puede ser escrito como
* * 1-d f (y|x) = f (y|x d) F (L|x) . (16.7 )
533

MODELOS TOBIT Y SELECCIN


de una muestra de N observaciones independientes, el censurado MLE
maximiza
N * * ln LN () = ln f (yi|xi, ) + (1 - di)lnF (Li|xi, ") , (16,8 )
i=1
!di
* donde son los parmetros de la distribucin de y . Para garantizar la
generalidad la censura
lmite inferior Li est permitido varan entre los individuos, aunque por lo
general Li = L. Los censurados MLE es coherente y asintticamente normal,
siempre que la densidad de la original
* * variable sin censura y |f (x, ) est correctamente especificado.
Cuando la censura es, por el contrario desde arriba, el registro de
probabilidad es similar (16,8 ),
* excepto que ahora d = 1 enfocar< U y d = 0, de lo contrario, y F (L|x, )
es reemplazado por
* 1 - F (U|x, ). Un ejemplo destacado es derecho de duracin datos
censurados (vase la seccin 17.4 ).
MLE
de truncado truncado por la parte inferior de L, y reprimiendo dependencia
de x, la densidad condicional de los observados y es

* f (y) = f (y|y> L)
* = f (y) /Pr[y|y> L]
* * = f (y) / [1 - F (L) ].
El truncado MLE por lo tanto maximiza
N * * " ln LN () = !ln f (yi|xi, ) - ln[ 1] - F (Li|xi, ) ]. (16,9 )
i=1
si en su lugar el truncamiento es desde arriba, el registro de probabilidad es
(16,9 ), excepto que 1 * * F (L|x, ) es reemplazado por F (U|x, ).
Ignorando la censura o truncamiento conduce a contradiccin. Por ejemplo,
si el truncamiento * se omite el MLE maximiza i ln f (yi|xi, ), que es el malo
de la funcin probabilidad como se cae el segundo trmino en (16,9 ).
Coherencia de los censurados y truncados MLE requiere especificacin
correcta de f ( ), que a su vez requiere una adecuada especificaciones
* * de la variable latente densidad f ( ). Incluso si f ( ) es un LEF densidad
(vase la seccin 5.7.3 ), la densidad, y no solo la media, deben estar
correctamente especificado si censura o truncamiento.
Datos de Intervalo MLE
* Supongamos que la variable latente y slo se observ que se encuentran
en la (J + 1) intervalos mutuamente excluyentes ( -, a1], (a1, a2],... , (aJ,
), donde a1, a2,... ,aJ son conocidos. Luego desde
* * * Pr[a j < y j+1] = Pr[y j+1] - Pr[y] j
* * = F (j+1) - F (j),
el intervalo de datos MLE maximiza
N

J * * ln LN () = dij ln F (a j+1 |xi, ) - F (a j|xi, ) , (16,10 )

i=1 j=0
534

16.2 . MODELOS censurados Y truncados

en la dij, j = 0,... ,J, son indicadores binarios igual a uno si yij (a j, j+1] y
cero en caso contrario. Esto es similar a un probit ordenado o modelo logit
(consulte la seccin 15.9.1 ), excepto en los lmites del intervalo a1,... an ,aJ
son conocidos.
16.2.4 . Poisson censurados y truncados MLE Ejemplo
* * * - y suponer que es Poisson y distribuidos, por lo que f (y) = e /y! Y ln
f (y) = - + y ln - ln y!, con media = exp(x ).
Supongamos que el nmero de visitas a una clnica de salud tiene un
modelo, pero los datos son slo est disponible para las personas que
visitaron el centro de salud. A continuacin, los datos se han truncado desde
abajo
* * * * * a cero y slo observar y = y si y > 0. Entonces F (0) = Pr[y 0] =
Pr[y =
- 0] = e , y de (16.9 ) la truncan MLE de maximiza
N
ln LN () = !- exp(xi) + yi xi- ln yi! - Ln[1 - exp(- exp(xi " )) ].
i=1
supongamos que los datos estn censurados desde arriba a los 10 porque
de codificacin, as que
* * * * que observamos y = y < 10 y que y = 10 si y 10. Entonces, el
Pr[y 10] =
* * 1 - Pr[ 10] y < = 1 - si y
9 k=0 f (k). (16,8 ) la censura de MLE maximiza
5

ln LN () = di
- exp(xi) + yi xi - ln yi
!
I=1 & 69 - ) k + (1 - di) ln e
exp(xi (exp(xi)) /k! .
K=0
en ambos casos, el resultado de primer orden las condiciones son mucho
ms complicados que los de Poisson MLE sin truncamiento o censurar.
Adems, en ambos casos haciendo caso omiso de la truncacin o censurar y

maximizar la densidad original lleva a las estimaciones de parmetros


consistentes.
16.2.5 . Censurados y truncados medio condicional
Censura y truncamiento cambio la media condicional.
Por ejemplo, considere el Poisson truncado desde abajo a cero. El truncado
den* * * sity es f ( [1 - F (0) ], y
* y) /= 1, 2,... , por lo que la media truncada es k=1 kf (k) / [1 * * - F (0)] = k=0 kf (k) / [1 - F (0)] = / (1 - e). Por lo tanto,
E[y|x] = exp(x ) / [1 - exp(- exp(x ) ],
en lugar de exp(x ) si no hay truncamiento.
Esta expresin para E[y|x] se puede utilizar para estimar NLS. Hay poca
ventaja de NLS en lugar de ML estimacin, sin embargo, el truncamiento de
NLS distribucin estimador se basa en supuestos que son esencialmente tan
fuerte como los que se necesitan para mantener la consistencia del
estimador ML ms eficiente.
535

MODELOS TOBIT Y SELECCIN


16.3 . Modelo Tobit
truncado y la censura se plantean ms a menudo de la econometra en el
modelo de regresin lineal con error distribuido normalmente, cuando slo
los resultados positivos son completamente. Este modelo se denomina
modelo tobit de Tobin (1958), quien lo aplic a los gastos en bienes de
consumo duraderos. El modelo en la prctica suele ser demasiado
restrictiva. Sin embargo, es presentado con cierto detalle, ya que
proporciona la base para obtener informacin ms general modelos como
los que se presentan en las siguientes secciones de este captulo.
16.3.1 . Modelo Tobit
censurado normal el modelo de regresin, o modelo tobit, es uno con la
censura desde abajo a cero donde la variable latente es lineal en los

regresores error con el aditivo que se distribuye normalmente y


homocedsticas utilizndose. As
Y = x + (16,11 )
donde el trmino de error
N 2 [0, ] (16,12 )
2 * ha variance constantes en todas las observaciones. Esto implica que la
variable latente y
N [x 2, ]. La observ y se define como (16.2 ) con L = 0, por lo que
* * y si y > 0, y = * (16,13 ) - si y 0,
en la que - significa que y se observa que falta. No existe un valor en
particular de y es necesariamente
* observ cuando y 0, aunque en algunos lugares, como bienes durables
los gastos que observamos y = 0.
Las Ecuaciones (16,11 ) - (16,13 ) definir el prototipo modelo tobit
analizados por a- bin (1958). Ms en general, los modelos Tobit comienzan
con (16,11 ) y (16,12 ) para la variable latente pero puede tener otros
mecanismos, incluyendo la censura censura desde arriba, censurando de
tanto por debajo como por encima de las dos-lmite modelo tobit), y el
intervalo de datos censurados. Los resultados de esta seccin se limita a la
censura en mecanismo (16,13 ). La utilizacin de los modelos de las
secciones posteriores se denominan a veces modelos Tobit generalizados.
La normalizacin L = 0 no solo es natural en muchos lugares, pero algunos
de esos ni- malization es necesaria para un modelo lineal con intercepto y
umbral constante pa* esen- ciales L. a continuacin observamos y si y > L, o de modo
equivalente if1 + (1 - L) +
x22 +>L o ) se identifica. Ms gen- x22 +>0. Por lo tanto, slo la
diferencia (1 - L
* generalmente, el modelo latente y = x + con censura variable umbral
L = x es
observacionalmente equivalente * latente modelo y = x ( - ) + con
umbral fijo de L = 0. Estos resultados son consecuencia de la censura que
surgen en un modelo lineal con aditivo error y no en modelos no lineales,
como el anterior ejemplo Poisson.
536

16.3 . MODELO TOBIT


* aplicando la expresin general (16.7 ) densidad de la censura, aqu f (y) es
la
N [x 2, ] densidad y
* * F (0) = Pr[y 0]
= 0] = =
Pr[x + -x / 1 - x / ,
donde ( ) es el estndar normal cdf y utiliza la ltima igualdad simetra de
la distribucin normal estndar. Por lo tanto, la censura de densidad puede
ser expresada como
1 1 . d 1-d x f (y) = exp - ( 2) 1 - , (16,14 ) 22 2 2 y - x
se define en (16.6 ) con L = 0. En el caso de que el indicador binario d El
Tobit MLE = ( , 2 ) aumenta la censura de probabilidad funcin (16,8 ).
(16,14 ) esto se hace
N 1 1 2 1 ln LN ( 2, ) = di - ln 2 - ln - (16,15 ) 2 i=1 2 yi - xi 2
di)ln + (1 - 1 xi
2 2
.
,
una mezcla de densidades continuas y discretas. La primera de las
condiciones son
ln LN

N 1 =2 di(yi - xi) - (1 - i di) (16,16 )

i=1 (1 - xi = 0 i) 5 2
6 ln LN

N 1 yi - xi + (1 - 2 4 =2 di - + di) i xi 1 = 0,

i=1 2 2 (1 - i) 2 3
using (z) /Z = (z) = i where ( ) es el estndar pdf normal, y con las
definiciones es consistente si la densidad es correctamente (xi/ ) y i =
(xi/ ). Como es habitual, es decir, si el dgp es (16,11 ) y (16,12 ) y la

censura es mecanismo (16,13 ). La MLE es asinttico normal con varianza


matriz distribuida en, por ejemplo, Maddala (1983, p. 155) y Amemiya
(1985, p. 373).
Tobin (1958) propuso ML estimacin del modelo tobit y afirm que el
habitual ML teora aplicada. Amemiya (1973) proporcion una prueba oficial
que la teora no habitual, a pesar de la discreta mixtos de carcter
continuado de las censuradas densidad. El apndice de este libro clsico de
Amemiya detalles la teora asinttica de estimadores extremum presenta en
la Seccin 5.3 .
537

MODELOS TOBIT Y SELECCIN


q Si los datos se trunca, en lugar de censurar, de abajo a cero, entonces el
Modelo Tobit MLE = ( 2 , ) maximiza el registro normal truncada de
probabilidad funcin
N 1 2 1 1 2 . ln LN ( 2, ) = - ln - ln 2 - 2 i=1 2 2 2 yi - xi - ln
xi/ ,
(16,17 )
* obtenidos con (16,9 ) y distribuida, como en (16,11 ) y (16,12 ).
16.3.2 . Incoherencia del MLE
una gran debilidad del MLE es su fuerte dependencia de distribucinsunciones bsicas. Si el error es heterosedasticidad anormales)o el MLE se
organi- zaciones tienda.
Esto puede ser visto en el ML de primer orden (16,16 ), que es una funcin
bastante ms complejas que las variables de di, yi,i, y yo. La primera
ecuacin en (16,16 ) satisface E[ln LN/] = 0, una condicin necesaria
para la coherencia (ver Seccin 5.3.7 ), si
E[di] = i, E[di yi] = i +i xi.
Estas condiciones pueden ser momentos de espera si el dgp es (16,11 ) y
(16,12 ) y la censura es mecanismo (16,13 ). Sin embargo, es poco
probable que mantenga bajo cualquier otra especificacin de la dgp, ya que
dependen en gran medida de normalidad y tanto homoskedas- ticity. Por

ejemplo, withheteroskedastic errorsthe estimador es coherente, ya que, a


continuacin, E[di] = 2 2 (xi/i) = i unlessi = .
Estimacin Consistente con heterosedasticidad errores normales es posible
mediante la especificacin de un modelo de heteroscedasticidad, digamos 2
i = exp(zi). De la censura desde abajo a cero
2 el registro de probabilidad ln LN (, ) es la de (16,15 ) with sustituido
por exp(zi).
Requiere consistencia, entonces los errores normales y la correcta
especificacin de la forma funcional de la heteroscedasticidad.
Es evidente que, con censura o truncamiento, supuestos distribucin
importante incluso para convertirse en algo slido en las distribuciones en la
invariacin censura o se- truncado. Pruebas de especificacin para el
modelo tobit se examinan en la Seccin 16.3.7 .
En muchas aplicaciones de datos censurados el modelo tobit no es el
adecuado. Ms en general los modelos presentados en las secciones
siguientes de este captulo se utiliz en su lugar.
16.3.3 . Censurados y truncados en regresin lineal significa
Censura y truncamiento en el modelo de regresin lineal (16,11 ), que
observ de- fender variable y que tiene distribucin condicional significa
que x , condicionales 2 varianza otros than homocedsticas utilizndose incluso if es, y
de la distribucin, que es nonnor- mal incluso if se distribuye normalmente.
Presentamos los resultados generales de regresin lineal en esta seccin
especializada antes de errores normalmente distribuidos en las secciones
16.3 .4538

16.3 . MODELO TOBIT


16.3.7 . Los resultados proporcionan una visin adicional con respecto a las
consecuencias de trunca- y la censura y forma la base de la no-ML mtodos
de estimacin presentada en secciones posteriores.
Comenzaremos con la media truncada. Los efectos del truncamiento es
intuitivamente- ropeos han usado. El truncamiento de la Izquierda excluye

los valores pequeos, por lo que el significa que aumente, mientras que por
la derecha el truncamiento la media debera disminuir. Desde el
truncamiento reduce el rango de variacin, la variacin debe disminuir.
* A la izquierda el truncamiento a cero slo observar y si y > 0. Si se
suprimen las expectativas de dependencia x por simplicidad de notacin, la
izquierda media truncada es
* E[x] = |y >
=+==
* E[E x E x |
x+
xE,
donde la segunda igualdad utiliza (16,11 ), y la ltima igualdad asume
0] (16,18 )
|x + >0 +>0 + E |x + >0
|> -x ,
es independiente de x. Tal como se esperaba, la media truncada es
superior a x , ya que E[|>c] para cualquier constante c superar E[].
Para datos de izquierda censurarse en cero supongamos que observamos y
= 0, en lugar de simplemente que
Y 0. La censura significa se obtiene por primera vez el acondicionador
observable y en el indicador binario d definido en (16.6 ) con L = 0 y, a
continuacin, est ulos incondicionados. La dependencia de x por
simplicidad de notacin una vez ms, tenemos el de la izquierda significa
censura
E[x] = Ed[Ey|y|d[d]] = Pr[d = 0] E[y|d = 0] + Pr[d = 1] E[y|d = 1]
* * * * (16,19 ) = 0 Pr[y 0] + Pr[ 0] y > E[y |y > 0]
* * * = Pr[ 0] y > E[y |y > 0],
* * donde Pr[ 0] y > = 1 - Pr[y 0] = Pr[>- x ] es uno menos la
censura
* * probabilidad y E[y |y > 0] es el media truncada ya derivados de (16,18
).
En resumen, para el modelo de regresin lineal con censura o truncamiento
de baja a cero, el medio condicional estn dadas por
* variable latente: E[y |x] = x

izquierda truncado (0): E[y|x, y> 0] = x + , , (16,20 )


" izquierda-censurados (en 0): E[y|x] = Pr[>- x E!] x
|>- x + E |> -x .
Est claro que a pesar de que el original media condicional es lineal,
censurar o conectar- conduce a condicional significa que son no-lineales por
lo que la operacin no ser coherente las estimaciones.
Uno de los enfoques posibles para llevar es una paramtrica uno de asumir
una distribucin de .
Esto lleva a las expresiones de E|> -x y Pr[> -x ] y por lo tanto el
conectar- media condicional o censurados. Lo hacemos de la siguiente
seccin para dis- nantes errores.
539

MODELOS TOBIT Y SELECCIN


inversa de Mills como relacin de corte vara segn
relacin inversa de Mills 2,5 N[0,1 ] cdf
N[0,1 ] Densidad
1,5 2
1
.5
inversa de Mills, pdf y cdf
0
-2 -1 0 1 2
punto de corte c
Figura 16.2 : razn inversa de Mills para la distribucin normal estndar
como la censura o punto de corte c aumenta. CDF normal estndar y
densidad tambin representado.

Un segundo enfoque trata de evitar o reducir al mnimo esos presupuestos


paramtricos. Consideramos que esta en una seccin posterior, sino sealar
aqu que, independientemente de la distribucin for
x desde la media truncada es de un solo modelo de ndices de disminucin
en trmino de correccin E|> -x es una funcin montona decreciente
en x .
16.3.4 . Medios censurados y truncados en el Modelo Tobit
para el modelo tobit la regresin error es normal y se utiliza el siguiente
resultado, obtenido en la Seccin 16.10.1 .
La Proposicin 16.1 (trunca momentos del Estndar Normal): Supongamos
que z N [0, 1]. A continuacin la izquierda truncado momentos de z son
(i) E[z|z> c] = (c) / [1 - (c) ], y E[z|z> -c] = (c) / (c),
2 (ii) E[z |z> c] = 1 + c(c) / [1 - (c) ], y
2 2 (iii) V[z|z> c] = 1 + c(c) / [1 - (c)] -(c) / [1 - (c)]
Resultado (i) de la Proposicin 16.1 se muestra en la Figura 16.2 .
Consideramos que el truncamiento de z N [0, 1] desde abajo en c, donde
c va de -2 a 2. La curva ms baja es la normal estndar density(c) evalu
en c. La curva normal estndar es el cdf (c) evalu en c y proporciona la
probabilidad de truncamiento si el truncamiento es en c.
Esta probabilidad es de aproximadamente 0,023 a c = -2 y 0,977 en c = 2.
La curva superior da la media truncada E[z|z> c] = (c) / [1 - (c) ]. Como
era de esperar este est cerca de E[z] = 0 para c = -2, desde entonces no
hay truncamiento y E[z|z> c]> c. Lo que no se espera a priori es
that(c) / [1 - (c)] es aproximadamente lineal, especialmente para c> 0.
Momentos en el truncamiento es desde arriba se puede obtener mediante,
por ejemplo, E[z|z < c] = -E[ -z| -z> -c] = -(c)/ (c).
540

16.3 . MODELO TOBIT


estn aplicando este resultado (16,18 ), el trmino de error

ha truncado significa -x E |> -x = E | > (16,21 )


x x =(- ) / [1 - ( )]
x x =( ) /[ ( )]
x = ( ),
donde la segunda lnea utiliza la Proposicin 16.1 , la tercera lnea utiliza
simetra alrededor de cero of(z), y definimos
(z) (z) = . (16,22 ) (z)
seguimos la definicin y la terminologa de Amemiya (1985) y muchos otros
en defining( ) como en (16,22 ) y que es la razn inversa de Mills. De
Johnson y Kotz (1970, p. 278), Molinos tabulados en realidad la proporcin
(1- (z) /(z) cuya en- verse(z) / [1 - (z)] = (z) / ( -z) es la funcin de las
luces de emergencia de la normal distribucin de *. Por lo tanto algunos
autores en su lugar escribir (16,21 ) como E|> -x = ( -x / ),
* where (z) = (z) / ( -z) se conoce como la razn inversa de Mills.
Adems, Pr[>- x ] = Pr[- <x ] = Pr[ -/ < x / ] = (x / ). A
continuacin, el medio condicional (16,20 ) se especializan a
* variable latente: E[y |x] = x , (16,23 ) trunca (0): E[y|x, y> 0] = x
+( x / ), a la
izquierda de censura (0): E[y|x] = (x / ) x +( x / ).
La diferencia es del mismo modo (vase Ejercicio 16.1 ). Definingw = x / ,
tenemos
* 2 variable latente: V[y |x] = , (16,24 )
2 a la izquierda de truncado (0): V[y|x, y> 0] = 1 -w(w) - (w) ,
2 a la izquierda de censura (0): V[y|x] = (w)
2
. 2 "2 w + w(w) + 1 - (w) [w + (w) ].
El truncamiento y censurar claramente inducir heteroscedasticidad y de
truncamiento
y|V[x] 2 < que reduce el truncamiento variabilidad, tal como se
esperaba.
Estos resultados suponen errores normales. Maddala (1983, pg. 369) da
resultados similares a la Proposicin 16.1 para el log-normal, logstica,
uniforme, Laplace, exponencial y distribuciones gamma.
16.3.5 . Efectos marginales en el Modelo Tobit

el efecto marginal es el efecto de la media condicional de la variable


dependiente de los cambios en los regresores. Este efecto vara en funcin
de si el inters se encuentra en la variable latente significa x o las
truncado o censurados en medios (16,23 ).
541

MODELOS TOBIT Y
diferenciar cada SELECCIN con respecto a x los rendimientos
* variable latente: E[y |x] /X = , (16,25 )
2 izquierda truncado (0) :E[s, s> 0 |x] /X = {1 -w(w) -(w) }, a la
izquierda de censura (0): E[y|x] /X = (w),
wherew = x / y use (z) /Z = (z) and(z) /Z = -z(z). La sim- ple
expresin de la censura significa se obtiene tras algunas manipulaciones.
Puede ser descompuesto en dos efectos, uno para y = 0 y uno para y> 0
(vase McDonald y Moffitt, 1980).
En algunos casos el truncamiento o censurar es slo un artefacto de la
recoleccin de datos, por lo que el truncado y censurados medios no son de
inters intrnseco y estamos interesados en
E[y |x] /X = . Por ejemplo, con respecto a la parte superior de los
ingresos de datos codificados que son claramente lici- en medir el efecto de
la escolaridad en los ingresos promedio en lugar de los ingresos de los nocodificado.
En otros casos ha truncado o censurar las consecuencias conductuales. En
un modelo de la jornada de trabajo, por ejemplo, los tres efectos marginales
en (16,25 ) corresponden a los efectos de un cambio de un regresor en,
respectivamente, (1) horas de trabajo deseado, (2) las horas de trabajo para
los trabajadores, y (3) las horas de trabajo para los trabajadores y
nonworkers.
(1) es evidente que necesitamos una estimacin de , pero para (2) y (3) LA
OPERACIN pendiente, los coeficientes aunque incoherente que, en
realidad puede proporcionar una razonable estimacin cruda del efecto
marginal desde el truncado y censurados medios son todava bastante lineal
en x.
16.3.6 . Los estimadores alternativos para el Modelo Tobit

adems de la MLE, estimacin consistente de NLS es posible basado en la


expresin correcta de la trunca o censurados. Consideramos que el NLS
estimador y otros estimadores de mnimos cuadrados.
Estimador de NLS
los resultados en la (16,23 ) se puede utilizar para permitir estimacin
consistente de los parmetros del modelo de Tobit. Por ejemplo, con datos
truncados, minimizar
NO2 ( 2, ) = yi - xi - (xi/ )
i=1
2 con respecto a y , pero luego de realizar inferencia el heteroskedasticity en (16,24 ). UN estimador similar puede obtenerse de datos
censurados.
Este estimador no se utiliza en la prctica. Coherencia, correccin de la
especificacin de la media truncada, que a partir de (16,21 ) requiere
normalidad y homocedasticidad de los errores. Uno podra as estimacin de
ML desde este se basa en supuestos tan fuerte y es plenamente eficaz. Por
otra parte, en la prctica, el NLS estimador puede ser impreciso.
En la figura 16.2 es evidente that (x / ) es aproximadamente lineal en x
/, que conduzca a collinearity prximo porque x tambin es un regresor.
En la seccin 16.5 se consideran modelos que permitan trminos de
correccin similar a (x / ) en (16,23 ) que tienen la ventaja de depender
en parte de los regresores distintos de los de x.
542

16.3 . MODELO TOBIT


Heckman Two-Step Estimator
(16,23 ) la trunca (en cero) significa es
E[y|x] = x +( x / ). (16,26 )
en lugar de utilizar NLS, esto puede ser estimada en los siguientes dos
pasos si se dispone de datos censurados. En primer lugar, para el total de la
muestra no regresin probit de d a x, donde la variable binaria d es igual a
uno si y> 0 se observa, para dar estimacin coherente , donde = / .

En segundo lugar, para la muestra truncada regresin por MCO de y sobre


xy
(x ) para proporcionar estimaciones consistentes de y .
Este procedimiento de estimacin, debido a Heckman (1976, 1979), se
presenta en Seccin 16.5.4 cuando se aplican a la seleccin de la muestra
ms general modelo. Seccin
16.10.2 se deriva el error estndar de los que tiene en cuenta la
regressor(x ) dependen de parmetros estimados y de
heteroscedasticidad inducida por truncamiento.
LA OPERACIN de la estimacin Modelo Tobit
La OPERACIN estimaciones usando datos censurados o que se trunc son
incompatibles para . Esto es porque los medios censurados y truncados en
(16,23 ) no son iguales a x , violando la condicin esencial de la coherencia
de LA OPERACIN.
Para datos censurados, LA OPERACIN proporciona una aproximacin lineal
de la regresin no lineal curva censura. Es evidente en la figura 16.1 y
(16,25 ) que esta lnea es ms plana que la lnea de regresin para datos sin
censura, que tiene pendiente igual a la verdadera pendiente parmetro.
Goldberger (1981) demostraron que si analticamente y y x son
normalmente distribuidos y hay censura desde abajo a cero, entonces la
operacin pendiente parmetros convergen para p veces el verdadero
parmetro pendiente, en donde p es la fraccin de la muestra con posi- los
valores de y. Estas condiciones son restrictivas, pero se relajaron un tanto
por Ruud (1986). En la prctica, esta proporcionalidad resultado
proporciona una buena aproximacin emprica a la incoherencia de la
operacin si un modelo tobit es en su lugar apropiado.
De igual modo, el truncamiento de la recta de regresin es ms plana que la
no truncada regres- sion. Goldberger (1981) obtuvo un resultado analtico
similar al de la cen patrocinados. Si y y x son normalmente distribuidos y no
hay censura desde abajo a cero, entonces la operacin pendiente
parmetros convergen a un mltiplo de la verdadera pendiente pa esenciales. Los mltiples, la expresin de que es bastante larga, se encuentra
entre cero y uno, y la contraccin es la misma para todos los coeficientes
pendiente. Truncar LA OPERACIN por lo tanto subestima la magnitud
absoluta de la verdadera inclinacin parmetros.
16.3.7 . Pruebas de especificacin para el Modelo Tobit
dada la fragilidad del modelo tobit es una buena prctica para probar la
distribucin de las especificaciones. Hay cuatro estrategias generales.
El primer enfoque es para anidar el modelo tobit ricos dentro de un modelo
paramtrico y aplicar una Wald, LR, LM o prueba. Dado que la hiptesis nula

modelo, el modelo tobit, lo ms fcil es estimado, es natural que usar LM


pruebas. Esto es particularmente base intuitiva- ward para la realizacin de
pruebas de heteroscedasticidad de la forma 2i = exp(xi) en el censurado
543

MODELOS TOBIT Y SELECCIN


modelo de regresin. Utilizando el formulario de la OPG LM test (vase la
seccin 7.3.5 ) que com2 pute N veces la descentra debido al uso de regresin auxiliar de 1 a s1i y
s2i, donde fi = f (yi|xi, , ) es la densidad de (16,14 ) with sustituido por
exp(x ), las expresiones para s1i = ln fi/ y s2i = ln fi/ se obtienen
por menor adapta- cin de las expresiones de (16,16 ), y tilde indica
evaluacin de la MLE censurados Tobit con todos los componentes de
excepto que para la interseccin igual a cero. Un enfoque similar para
probar la hiptesis de distribucin normal errores es ms difcil ya que no
hay una generalizacin de las estndar normal.
Un segundo enfoque consiste en utilizar pruebas momento condicional
(vase la seccin 8.2 ) que no requieren especificaciones de una hiptesis
alternativa modelo. En particular, la primera de las condiciones (16,16 ) de
la MLE censurados Tobit momento sugieren condicional ensayos sobre la
base de la residual generalizado
= yi - di xi - (1 - i ei . 2 di) (1 - i)
Si el modelo tobit est correctamente especificado a continuacin, E[ei|xi] =
0, puesto que la regularidad- implica que E[ ln f (yi) /] = E[ez] = 0 0. A
continuacin, podemos aplicar un m-prueba de H0 :
-1 N contra Ha : E[ez] =0 con N i=1 eizi, donde ei = ei evaluado en
2 Tobit la MLE ( , ). En la seccin 8.2.2 esta prueba puede ser llevado a
cabo por comput2 ing N veces la descentra debido al uso de regresin auxiliar de 1 en eizi,
s1i, s2i, donde fi = f (yi|xi, 2, fi/ y
2 s2i = ln fi/ ) es la densidad de (16,14 ) y s1i = ln
2 dado en (16,16 ) se evalan en ( , ). Las variables zi pueden ser las
variables xi, en cuyo caso la prueba puede ser interpretado como una

prueba de omitido- gressors, o poderes de los componentes de xi. Momento


Condicional pruebas basadas en momentos orden superior tambin se han
desarrollado. Para obtener ms detalles, vase Chesher e irlandeses (1987)
y Pagano y Vella (1989).
Un tercer enfoque es para adaptar algunos de los mtodos de diagnstico y
pruebas desarrolladas por la derecha duracin datos censurados (vase el
captulo 19) a la izquierda de censurados datos distribuidos normalmente.
Un ltimo mtodo compara el Tobit MLE con otras alternativas de
estimacin de , nunca el semiparamtrico estimaciones presentadas en la
Seccin 16.9 , que son coherentes con las hiptesis ms dbil distribucin.
Para obtener ms detalles, consulte Pagano y Vella (1989), que actual teora
con algunas preci- samente y Melenberg y Van Soest (1996), que
proporcionan una informacin ms completa aplicacin. Ambos documentos
considerar pruebas de especificacin para los ms ricos muestra modelo de
seleccin (vase la seccin 16.5 ) adems de las de la modelo tobit.
16.4 . Two-Part Modelo
los modelos precedentes para restringir los datos censurados la censura
mecanismo para ser de la misma generacin que como modelo la variable
resultado. Ms en general, la censura mecanismo y los resultados pueden
ser modelados por procesos separados. Por ejemplo, para explicar los
gastos hospitalarios anuales individuales pueden determinar un proceso
hospital globalizacin y un segundo proceso pueden explicar como
consecuencia los gastos de hospital. El caso de
544

16.4 . DOS PARTE MODELO


postula dos mecanismos separados es fuerte si no hay razn de peso para
creer que ciertos valores se dio cuenta demasiado grandes o demasiado
pequeo una frecuencia de es- tancia con un modelo ms sencillo. Por
ejemplo, uno puede observar muchos ms ceros que es consistente con, por
ejemplo, la distribucin de Poisson. UNA de dos parte modelo que permite
los ceros y no-ceros que se generan en diferentes densidades aade
flexibilidad. De hecho, es un tipo especfico de mezcla modelo.
Hay dos enfoques para dicha generalizacin. Las dos partes de modelo, en
esta seccin, se especifica un modelo de la censura y de un modelo para el

resultado depender de los resultados que se observan. La seleccin de la


muestra modelo, que se presenta en la siguiente seccin, en lugar
especifica un conjunto de distribucin de la censura- nismo y de los
resultados, y, a continuacin, busca el implcito distribucin condicional de
los resultados observados. Estos enfoques son contrastados en la Seccin
16.5.7 .
16.4.1 . Two-Part Modelo
No podemos permitir que una persona con plena observancia resultado ser
llamado un participante en la actividad que se est estudiando. Definir un
indicador binario variable d = 1 para los participantes y d = 0 para los
maestros no participantes. Supongamos que y>0 se observa para los
participantes y y = 0 se observa para los maestros no participantes. Para los
maestros no participantes observamos slo Pr[d = 0]. Para los participantes
la densidad condicional de y dada y> 0 se especifica que f (y|d = 1), para
algunos eleccin de densidad f ( ). Las dos partes de modelo y, a
continuacin, dado por el
Pr[d = 0 |x] si a = 0, f (y|x) = (16,27 ) Pr[d = 1 |x] f (y|d = 1, x) enfocar>
0.
Este modelo se present en detalle por Cragg (1971) como una
generalizacin del modelo tobit, que puede presentarse como un caso
especial de (16,27 ). Un claro modelo de la decisin de participar d es un
modelo logit o probit. Una variable latente es la frmula que d = 1 ifi = x
+ mayor que cero, y el modelo es entonces visto como un obstculo
modelo desde cruzar una valla o umbral conduce a la participacin. A fin de
garantizar los valores positivos de los participantes, la densidad f (y|d = 1,
x) debera ser, para un valor variable aleatoria, como el log-normal, o una
densidad apropiada como la normal truncada desde abajo a cero.
Para simplificar los mismos regresores generalmente aparecen en ambas
partes del modelo, pero esto puede estar relajado y si es obvio que hay
exclusin las restricciones. Estimacin de mxima verosimilitud es sencilla
como se separa en estimacin de un modelo de eleccin discreta todas las
observaciones y estimacin de los parmetros de la densidad f (y|d = 1, x)
usando slo las observaciones con y > 0.
16.4.2 . Ejemplos de Modelos Two-Part
Duan et al. (1983) presentan una de las principales aplicaciones de este
modelo de pronstico medi- cal los gastos, utilizando datos de la Rand
Health Insurance Experiment. Ellos se especifican un modelo probit para si o
no los gastos mdicos efectuados durante el ao, as que Pr[d = 1 |x] =
x11 y un modelo log-normal para los gastos mdicos dado
2 que algunos gastos se efectuaron, por lo tanto ln y|d = 1, x N [x2
2 ,,2 ]. A continuacin, espera

545

MODELOS TOBIT Y SELECCIN


los gastos mdicos en toda la poblacin, est dado por
E[y|x] = x11 exp[ 2 2/2 + x22], (16,28 )
2 donde el segundo trmino utiliza el resultado de que, si ln y N ( , ]
E[x] = exp( +
2 / 2). Mullahy (1998) considera que tales retransformation en ms
detalle.
Dos de los modelos son especialmente populares para modelar datos de
recuento. Por ejemplo, para modelar el nmero de visitas al mdico no es un
modelo para determinar si o no un paciente visita a un mdico y un segundo
modelo para determinar el consiguiente nmero de visitas a las personas
con al menos una visita. Entonces, el Pr[d = 1] se especifica que la
probabilidad de que una Poisson variable binomial negativa o mayor que
cero, mientras que la densidad f (y|d = 1) se especifica que un Poisson o
binomial negativa densidad truncado desde abajo a cero. Este modelo,
debido a Mullahy (1986), se denomina modelo un obstculo en el recuento
literatura y se describe detalladamente en la Seccin 20.4.5 .
Para los datos continuos de dos modelos son utilizados para los modelos con
exceso gasto ceros (Cragg la motivacin original). Una alternativa, una
seleccin de la muestra, es de- claraciones siguiente.
16.5 . Seleccin de la muestra
seleccin de la Muestra modelos pueden surgir en muchos ajustes y as, hay
muchos modelos seleccin de la muestra. Esta seccin comienza con una
discusin general de seleccin de la muestra antes centrado en un ejemplo
destacado, el modelo bivariado seleccin de la muestra estudiada por
Heckman (1979). Otro ejemplo, el Roy modelo, se trata por separado en la
Seccin 16.7 .
16.5.1 . Seleccin de la muestra Los Modelos
estudios observacionales raramente se basan en puras muestras aleatorias.
La mayora de las veces se utiliza el muestreo exgenos (vase la seccin
3.2.4 ) y estimadores habituales pueden ser aplicados. En cambio, si una
muestra, de forma intencional o no, se basa en parte en valores de una

variable dependiente, las estimaciones de parmetros puede no ser


coherente a menos que se tomen medidas correctivas. Estas muestras
pueden definirse de modo general como muestras seleccionadas.
Hay muchos modelos, ya que hay muchas maneras que una muestra
seleccionada puede ser generado. De hecho, es muy fcil de ser consciente
de que la muestra seleccionada se utiliza. Por ejemplo, estudiar
interpretacin de las puntuaciones medias en el tiempo en un logro como
prueba el Scholastic Aptitude Test, cuando la prueba es voluntaria. Una
disminucin en el tiempo, puede ser debido a deterioro real de
conocimientos de los alumnos. Sin embargo, puede simplemente reflejar el
efecto seleccin que son relativamente ms estudiantes han llevado a cabo
las pruebas con el tiempo y la nueva prueba secuestradores son los
relativamente ms dbiles los estudiantes.
Seleccin puede ser debido a la libre seleccin, con el resultado de inters
determinado en parte por eleccin individual de participar o no en la
actividad de inters.
Tambin puede ser el resultado de seleccin de la muestra, con las personas
que participan en la actividad de inters deliberadamente sobremuestr - un
caso extremo que muestra slo los participantes.
En cualquier caso, se plantean cuestiones parecidas y seleccin modelos se
denominan generalmente muestra- visionales modelos.
546

16.5 . SELECCIN DE LA MUESTRA LOS MODELOS


Este captulo presenta slo tres de los muchos modelos de la literatura. El
modelo ms simple es el modelo tobit ya presentados en la Seccin 16.3 .
Un prototipo modelo habitual que se da en llamar el modelo bivariado
seleccin de la muestra se presenta en el resto de esta seccin. Este
modelo generaliza el modelo tobit censura mediante la introduccin de una
variable latente que difiere de la variable latente genera el resultado de
inters. Otra popular modelo llamado Roy modelo se presenta en la Seccin
16.7 .
Este modelo considera un resultado que tiene uno de dos valores segn el
valor que toma una variable aleatoria censura. Estos modelos corresponden
a, respectivamente, el modelo tobit tipos 1, 2 y 5 en la terminologa de
Amemiya (1985, p. 384).

Estimacin consistente en la presencia de seleccin de la muestra se basa


en aspectos distributivos relativamente fuerte en supuestos, aun en el caso
de es- timation semiparamtrico. Datos Experimentales estudios
proporcionan una alternativa atractiva como la seleccin pro- blemas puede
evitar la asignacin aleatoria. Sin embargo, los experimentos pueden ser
difciles de aplicar en el campo de la economa de costos y razones ticas.
Los efectos del tratamiento, detalladas en el Captulo 25, procura aplicar el
enfoque experimental de datos de observacin.
16.5.2 . Seleccin de la muestra un modelo bivariado (Tipo 2 Tobit)
le permiten Y2 indican el resultado de inters. En el estndar modelo tobit
truncado este
* resultado se observa si y2> 0. UN modelo general latente introduce un
diferente
* * * * variable, y1, y2 los resultados y se observa si y1> 0. Por ejemplo,
y1 determina
* * * si trabaja o no y y2 determina la cantidad de trabajo, e y1 =a2 puesto
que hay costos fijos para trabajar como gastos de desplazamiento que son
ms importantes para determinar la participacin de las horas de trabajo
una vez.
Seleccin de la muestra el modelo bivariado comprende una participacin
ecuacin que
> 0, y1 = (16,29 )
* 1 1 * 0 enfocar enfocar1 0
y el consiguiente resultado ecuacin que
Y2 si > 0 y2 = (16,30 ) - si
Y1 Y1 0.
Este modelo especifica que y2 se observa en cualquier valor significativo
cuando
Y1> 0, mientras que y2 no tiene por qu tomar en 0. El modelo
estndar especifica un modelo lineal con aditivo Y1 errores en el
variables latentes, de modo
Y1 = x11 +1, (16,31 )
Y2 = x22 +2,
de los problemas que puedan surgir a la hora de estimar 2 if1 and2
estn correlacionados. El modelo tobit es
* * claramente el caso especial en que y1 = y2.

No hay ninguna denominacin generalmente aceptada para este modelo.


Heckman (1979) se utiliza para ilustrar estimacin ofrecida seleccin de la
muestra. El modelo es equivalente a un modelo tobit
* con umbral estocstico (Nelson, 1977). Supongamos que observamos L ,
donde
* * Y2 se define como en (16,31 ) y el umbral es L = z +v
* * y2 y2> si en lugar de L = 0 en
547

MODELOS TOBIT Y SELECCIN


* Seccin 16.3 . Entonces, lo que es equivalente, observamos L = (x 22 - z
) + (2 -v) = x
* * * y2 si y1> 0, donde y1 = x1 y donde denota la unin de x2
Y2 - y
1 and1
11 +1 z, y que se definen en una manera obvia. Amemiya (1985, p. 384)
llama a la modelo un modelo tobit tipo 2. Wooldridge (2002, p. 506) llama al
modelo probit con una seleccin ecuacin. Otros llaman este modelo, el
modelo tobit generalizado o la seleccin de la muestra, aunque hay muchos
de estos modelos.
Estimacin de ML es sencillo dado el supuesto adicional que el correlacionados con errores comunes son normalmente distribuidos y
homocedsticas utilizndose, con
1 0 1 12 N , . (16,32 ) 2 0 12 22
como para el modelo probit en la Seccin 14.4.1 , la normalizacin 21 = 1
se utiliza desde slo el signo de Y1 es observado.
(16,29 ) y (16,30 ), * * y1> 0 observamos y2, con probabilidad igual a
* * * la probabilidad de que y1> 0 veces la probabilidad condicional de y2
dado que y1> 0.
* * * * Por lo tanto, positivo y2 de la densidad de las observables es f (y2 |
y1> 0) Pr[y1> 0].

* De y1 0 todo lo que se observa es que se ha producido este evento, y la


densidad es la probabilidad de que esto ocurra. Seleccin de la muestra el
modelo bivariado por lo tanto tiene probabilidad funcin
8n 1-y1i! * Y1i L = !Pr[y i 1 , 0] f (y2i | Y1i> 0) Pr[y1i > " 0] ,
(16,33 )
i=1
donde el primer trmino es la contribucin independiente cuando Y1i 0,
desde entonces y1i = 0, y
el segundo es la continua contribucin al y1i> 0. Esta probabilidad
funcin es aplicable a modelos bastante general, no slo de modelos
lineales con errores normales.
Especializada en modelos lineales con errores normales conjunto da una
densidad bivariante
F ( * * y1, y2 ) que es normal, lo que da lugar a una densidad condicional
en el segundo trmino que es normal univariante y fciles de manipular.
Amemiya (1985, pgs. 385- 387) proporciona informacin detallada,
incluyendo la forma exacta de la probabilidad.
El clsico aplicacin precoz de este modelo de oferta de mano de obra,
donde observ deseo o propensin a trabajar, mientras que y2
Y1 es el Nuevo Programa de las naciones unidas es el nmero de horas
trabajadas. El modelo tambin es conceptualmente ms atractiva para la
oferta de trabajo que el modelo tobit en la Seccin 14.2.1 que requiere el
artificio de "deseado" horas de trabajo. Este prototipo preci- samente tiene
la complicacin que los datos de una tecla regresor, el salario ofrecido, no
est para esas personas que no trabajan. Esta complicacin se realiza
mediante la adicin de una ecuacin para el salario ofrecido y sustituyendo
este, aunque el modelo es entonces, estrictamente hablando, no slo un
modelo bivariado seleccin de la muestra. Ver Mroz (1987) para una
excelente aplicacin de oferta de mano de obra.
16.5.3 . Medio condicional en el modelo bivariado Seleccin de la muestra
en esta seccin se obtiene la media truncada condicional en el bivariado
muestra de seleccio- modelo. A diferencia de x2 2 , por lo que la operacin
regresin de y2 en x2 conduce a- inconsistente tienda las estimaciones de
parmetros. No obstante, la expresin de la media condicional puede ser
548

16.5 . SELECCIN DE LA MUESTRA LOS MODELOS


utilizados para motivar una alternativa procedimiento de estimacin en la
seccin siguiente que se basa en supuestos distributivos ms dbiles que
los de la MLE.
Consideramos que el truncado en la muestra selectividad modelo donde
solamente los valores positivos de y2 se utilizan. En general, este es
E[y2 |x, Y1> 0] = E[ x22 +2 |x11 +1> 0] (16,34 ) = x22 + E[2
|1> - x11],
donde x denota la unin de x1 y x2. Si el errors1 and2 son
independientes, a continuacin, el ltimo trmino simplifica a E[2] = 0 y
regresin por MCO de y2 en x2 dar un- tancia estimacin de 2 ,. Sin
embargo, la correlacin entre los dos errores significa que la media
truncada ya no es la de obtener E[2 |1> que si los errores (1, 2
-x1
) en (16,31 ) son normales como en (16,32 ) y, a continuacin, Ecuacin
(16,36 )
x22 y tenemos en cuenta para la seleccin.
1] when1 and2 estn correlacionadas, Heckman (1979) seala en el
siguiente implica que
2 =121 + (16,35 ),
donde el azar variable of1 es independiente. Para obtener este resultado,
tenga en cuenta que, en general la distribucin normal
z1 11 12 N 1 , z2 2 21 22
implica la distribucin condicional normal
-1 -1 z2 |z1 N 2 + 21 11 (z1 - 1), 22 - 21 11 12 ,
un resultado que implica que
-1 z2 = 2 + 21 11 (z1 - 1) + (16,36 )
donde N [0, 22 - 21 12] es independiente de z1. Para la densidad dada
-1 11
(16,32 ) hemos escalares y 1 = 2 = 0 y 21 = 1, de modo que (16,36 ) se
especializa en (16,35 ).
Mediante (16,35 ), la media truncada (16,34 ) se convierte
E[y2 |x, Y1> 0] = 2 + E (121 +) |1> - x11

=
x2 x22 +12E[1 |1> - x11],
donde utilizamos independencia of and1. El plazo de seleccin es similar a
la de las ms simple modelo tobit y utilizando de nuevo la expresin de E[z|
z> -c] en la proposicin 16.1 obtenemos
E[y2 |x, Y1> 0] = x22 +12 x 1 1 , (16,37 )
where(z) = (z) / (z) y hemos utilizado 21 = 1. Del mismo modo, la
Proposicin 16.1 (iii) da como resultado la varianza truncan
V[y2 |x, Y1> 0] = 2 2 - 2 12 (x11) x11 + (x11). (16,38 )
el anlisis precedente especifica ningn valor para y2 y2 cuando puede ser
igual a cero cuando Y1 <
Y1 0. En algunas aplicaciones 0. A continuacin, es importante
considerar la censura.
549

MODELOS TOBIT Y
acondicionamiento a la seleccin y2 observable en los aspectos Y Y1 y2
y, a continuacin, uncondition- los rendimientos
E[y2 |x] = E [E[y2 |x, Y1]] =
Y1
Pr[ Y1 0 |x] Pr[ Y1 " E[ Y2 |x, Y2> 0] (16,39 ) = 0 + ( x11)
+12
= (x11 )x22
! 0 +
x22
+12 ( x11
> 0 |x]
x11

),
donde la tercera lnea (16,37 ) y la ltima lnea uses (z) = (z) / (z). La
variacin puede ser censurados se heterosedasticidad.
16.5.4 . Heckman Two-Step Estimator
Un resultado importante es que regresin por MCO de y2 en x2 solo
utilizando slo los valores positivos de y2 conduce a estimaciones
inconsistentes de a menos que los errores son uncor- relacin tan that12
= 0. Esto se desprende claramente de la media truncada frmula (16,37 ),
que adems incluye el "regresor" (x11).
Heckman el procedimiento en dos etapas, a veces llamado el estimador
Heckit, ago- la regresin por MCO por una estimacin de la omite
regressor( x11). Por lo tanto, utilizando los valores positivos de y2
estimacin por MCO el modelo
y2i = x2i2 +12( x1i 1) +vi, (16,40 )
wherev es un trmino de error, 1 se obtiene por primera vez paso de
regresin probit y1 en x1 desde
* Pr[y 1> 0] = (x11), y (x 11) = (x11) / (x11) es la estimacin
relacin inversa 2 Molinos. Esta regresin no proporciona directamente una
estimacin of2 , pero al conectar2 -1 2 2 varianza frmula sealada (16,38 ) conduce a estimar 2 = N i[ vi
+ 12 i se(x 11 + i se) ], donde vi es la residual de LA OPERACIN
(16,40 ) y i se = (x1i1). La correlacin entre los dos errores (16,32 ) se
puede ser estimado por = 12/ 2.
Una prueba de si es o not or12 = 0 = 0, es una prueba de si es o no los
errores estn correlacionados y de seleccin de la muestra es necesaria la
correccin. Una de esas pruebas es un test de Wald 12 basado en , el
coeficiente estimado de la razn inversa de Mills.
Es importante sealar que tanto los errores estndar LA OPERACIN
habitual y heteroscedasticidad de errores estndar robustos de la regresin
(16,40 ) en correcto. Frmulas correctas para el error estndar tener en
cuenta dos complicaciones en la segunda fase de regresin. En primer
lugar, incluso si 1 eran conocidos, el error de (16,40 ) es
heterosedasticidad (16,38 ). En segundo lugar, de hecho 1 se sustituye
por una estimacin, de una compa- as estudiadas en la Seccin 6.6 y
analiza en la Seccin 16.10.2 para el ms simple modelo tobit. Frmulas
para la norma correcta los errores se dan en Heckman (1979); vase
tambin Greene (1981). Seccin 16.10.2 se deriva estas frmulas para el
ms simple modelo tobit.

Aplicacin no es tan sencillo por lo que es mejor usar un paquete que


gestiona de forma automtica esta complicacin o la utilizacin del
bootstrap.
El estimador de 2 es coherente. A pesar de la prdida de eficiencia en
comparacin con el MLE de normalidad de los errores que pueden ser
bastante grandes, el estimador es muy popular por las siguientes razones:
(1) es fcil de aplicar; (2) el enfoque es aplicable a una amplia gama de
modelos, entre ellos los que se proporcionan en la seccin 16,7 ; (3) el
estimador requiere supuestos distributivos ms dbil que la normalidad of1
550

16.5 . SELECCIN DE LA MUESTRA LOS MODELOS


and2; y (4) estos supuestos distributivos se puede debilitar an ms para
permitir concentrar estimacin como en la Seccin 16.9 .
El supuesto clave es (16,35 ), esencialmente que
2 =1 + (16,41 )
where of1 es independiente. Esto parece ser un modelo bastante sensata.
En el caso de los gastos en un bien duradero, es decir, este dice que el error
de la ecuacin los gastos es un mltiplo del error en la decisin de compra
ecuacin, ms un ruido que es independiente de la decisin de compra;
bsicamente un modelo de regresin lineal de los errores. Por supuesto
(16,41 ) la media condicional (16,34 ) se
E[y2| Y1> 0] = x22 +E[1 |1> -x 11]. (16,42 )
If1 es normal estndar distribuido esta conduce a (16,37 ), la base de la
operacin regres- sion (16,40 ).
Ms en general, de Heckman mtodo en dos pasos se pueden aplicar a
(16,42 ) con distribucin for pue-1 otros de lo normal; vase, por ejemplo,
Olsen (1980). Tambin se pueden utilizar mtodos concentrar que no
imponen una forma funcional para E[1 |1> -x11] (vase la seccin
16.9 ).
16.5.5 . Identificacin Consideraciones
La seleccin de la muestra modelo bivariado con errores normales es
tericamente sin restriccin alguna de los regresores. En particular,

exactamente los mismos regresores puede aparecer en las ecuaciones para


* * y1 y y2.
El modelo con los errores se distribuyen normalmente cerca de no
identificado, sin embargo, si ex- los mismos regresores rreno se utilizan. Si
x1 = x2 y luego E[y2| * y1> 0] x22 + a + bx21, utilizando (16,37 ) y la
observacin de la Seccin 16.3.2 que la razn inversa de Mills trmino ( )
es aproximadamente lineal en un amplio rango de su argumento. Esto nos
lleva a gru- ou problemas de multicolinearidad, discutido en muchos
artculos, entre ellos los de Nawata (1993), Nawata y Nagase (1996), y
Leung y Yu (1996). La multicolinealidad puede ser detectado mediante el
nmero de condicin en la Seccin 10.4.2 , donde (16,40 )
los regresores son x2 and(x 11). El problema es menos grave cuanto
mayor es la variacin
de x 1 1 en todas las observaciones, es decir, un modelo probit puede
discriminar entre participantes y no participantes.
Concentrar Heckman variantes del mtodo en dos pasos (consulte la
seccin 16.9.3 ) requieren una exclusin restriccin. Por lo que la
identificacin en la seleccin de la muestra modelo bivariado con errores
normales ya se est llevando a cabo en forma funcional supuestos.
Para fines prcticos, por lo tanto, la estimacin del modelo de seleccin
muestra dos variables puede requerir que al menos un regresor en la
participacin ecuacin ( desde el resultado ecuacin (
Y1) sea excluido ). Por ejemplo, los costes fijos de trabajo ajenos a Y2
horas de trabajo afectar a la decisin de trabajar, pero no las horas
trabajadas. Esto puede ser una gran limitacin en muchas aplicaciones,
tales como que en la Seccin 16.6 , es muy difcil hacer exclusin
defendibles las restricciones.
551

MODELOS TOBIT Y SELECCIN


16.5.6 . Efectos marginales
los efectos marginales en el modelo de seleccin muestra dos variables
varan en funcin de si consideramos la variable latente media o la media
truncada en (16,37 ) o la censura significa (si es apropiado).

Es conveniente definir x ser el vector formado por la unin de x1 y x2 y


escribir x y . Por ejemplo, la media truncada se convierte E[y2 |x]
1
= 1 y/o 2 tendr algunas entradas cero si x1 = x2. Diferenciacin con
respecto a
1 como x 1 2 x12+ (x
x22 como x 2
1). Tenga en cuenta que x produce los efectos marginales
sin censura: E[ Y2 |x] /X = 2, (16,43 )
trunca (0) :E[y2 |x, y1 = 1] /X = 2-12 (x1) x 1+ (x 1) censurados
(en 0): E[y2 |x] /X = 1 (x 1 2 )x + (x 1)2 -12 x 1(x 1)1,
donde (z) = (z) / (z), y usamos (z) /Z = -z(z) y (z) /Z =
2 -z(z) / (z) -(z) / (z 2) = -(z) (z + (z)). Interpretacin de estos tres relativos es similar al que ya se haba tratado en detalle en la Seccin 16.3.5 .
Como ya se ha sealado, el anlisis de la censura significa slo es adecuado
si y2 toma el valor de cero cuando y1 = 0. En aplicaciones tales como el
registro de los gastos de salud normal ejemplo discutido ms adelante no
hay censura.
16.5.7 . Seleccin de observables y en aspectos
hay muchos modelos situaciones que pueden ser considerados como una
decisin de dos partes pro- blema de primera de una actividad y, a
continuacin, determinar el nivel de la actividad. Estas decisiones estn
interrelacionadas y pueden depender de factores comunes. La nat- ural
modelo para estos datos es el modelo de seleccin bivariado (16,29 ) (16,31 ).
Despus de la inclusin de regresores cualquier error restante (1 and2) en
los dos procesos pueden ser en algunos casos no correlacionados. Por
ejemplo, en el caso de los modelos de hospitalizacin es posible que,
despus de controlar los efectos de observar caractersticas individuales
tales como el estado de salud, no hay correlacin entre el error en la
ecuacin determinar ingreso en el hospital y en el error de la ecuacin
determinar la duracin de la estancia hospitalaria. En este caso es tan
simple como seleccin slo est basada en observables desde, por ejemplo,
(16,37 ) simplifica when12 = 0. Las dos piezas se pueden modelar por
separado y el ms sencillo de dos parte modelo de seccin 16.4 se puede
utilizar.
En otros casos los errores pueden ser correlacionadas incluso despus de la
inclusin de los regresores.

Por ejemplo, en la oferta de trabajo factores no observables que hacer que


alguien sea ms probable que trabajo tambin pueden hacer ms
probabilidad de trabajar ms horas a la que predice la observable
regresores. Uno puede probar si existe tal correlacin entre los errores. Si no
hay correlacin, a continuacin, seleccin de aspectos y los mtodos de
este captulo entran en juego. Distribucin relativamente fuertes supuestos
son necesarios, incluso con el Heckman mtodo en dos pasos.
El estudio de Duan et al. (1983), se resume en la Seccin 16.4.2 fue
criticado por usar los dos de referencia del modelo, que es ms restrictivo
que la seleccin de la muestra.
Esto llev a un debate considerable, con muchos de los artculos referidos
en Leung
552

16.6 . EJEMPLO DE SELECCIN: LOS GASTOS DE SALUD


y Yu (1996), quien destaca la importancia del papel de correlacin potencial
de la razn inversa de Mills plazo con los restantes regresores.
Ms en general, la seleccin modelos como el modelo de seleccin bivariado
permiso- visionales en ambos aspectos observables y, como se permite la
seleccin de ambas ob- sirve los regresores y no observados errores. A
menudo es ms conocido simplemente como un modelo de seleccin de
aspectos, con la seleccin de observables implcito. Este captulo hace
hincapi en aspectos.
En cambio, si slo tenemos seleccin en observables, el anlisis es mucho
ms sencilla.
La modelo de este captulo es un ejemplo. El Captulo 25 sobre evaluacin
del tratamiento destaca seleccin en observables (vase la discusin en la
seccin 25.3.3 ) y detalles como mtodos de puntuacin.
16.6 . Ejemplo de seleccin: Los gastos de salud
para la ilustracin hemos utilizado los datos de la RAND Health Insurance
Experiment (RHIE).
La extraccin de datos proviene de Deb y Trivedi (2002), que modela el
nmero de visitas de pacientes ambulatorios a un mdico y a todos los
proveedores de datos de conteo.

Seccin 20.3 resume los datos y la Seccin 20.7 presenta estimaciones


recuento estndar de algunos modelos.
Aqu los gastos anuales de salud modelo. Los regresores son los mismos
regresores tal como se define en detalle en el cuadro 20.4 . Se pueden
dividir en salud de- bern variables (LC, IDP, LPI, FMDE), caractersticas
socioeconmicas (LINC, LFAM, edad, sexo femenino, NIO, FEMCHILD,
NEGRO y EDUCDEC) y estado de salud variables (PHYSLIM, NDISEASE,
HLTHG, HLTHF y HLTHP). El anlisis en el Captulo 20 se emplea cuatro aos
de datos, mientras que aqu se utiliza slo el segundo ao de los datos,
produciendo 5.574 observaciones con resumen de estadsticas similares,
pero no exactamente las mismas que las dadas en la tabla 20.4 .
La variable dependiente y es anual e individual los gastos en salud. Un
modelo economtrico debe tener en cuenta dos complicaciones: (1) los
gastos en salud son cero de 23,2 % de la muestra y (2) el gasto en salud
son muy derecha torcida con un promedio de 221 dlares que es mucho
ms grande que el promedio de $53. La transformacin logartmica elimina
este sesgo, con una media de 4,07 a 3,96 de la mediana y la desviacin
estadstica cae de 24.0 a 0.3 . La kurtosis es de 3,29 , cerca del valor normal
de 3.
Nos centramos en ln y modelos positivos para los gastos mdicos. Los
modelos incluyen un modelo de dos parte, expuestos por los gastos mdicos
de registro en la Seccin 16.4.2 , muestra dos variables y un modelo de
seleccin (vase la seccin 16.5.2 ), donde y1 en (16,29 ) es un indicador
positivo para los gastos y y2 (16,30 ) es ln y. Tenga en cuenta que no tiene
sentido considerar el valor de y2 en 0 y1 = ln 0 no est definido. La modelo
es un caso especial de la seleccin de la muestra modelo bivariado with12
= 0 en (16,32 ).
Cuadro 16.1 presenta los resultados para las variables del seguro de salud y
el estado de salud- gressors. Las variables socioeconmicas tambin
incluidas en la regresin se han omitido en el cuadro de la brevedad.
553

MODELOS TOBIT Y SELECCIN


Cuadro 16.1 . un gasto sanitario Datos: Estimaciones de Modelos Two-Part
Two-Part y Seleccin Seleccin Seleccin Two-Step MLE ecuacin del modelo
DMED LNMED DMED LNMED DMED LNMED

LC -0-0-0 -0-0-0
(-4.41) ( -0,52 ( -4,41 ( -0,70 ( -4,03 ) (2.25 )
PDI -0-0-0 -0-0-0
( -2,45 ( -1,28 ( -2,45 ( -0,70 ( -2,13 ( -2,26 )
LPI 0,028
(3.19 ) 0,003
(0.28 )
(3.19 ) 0,028 0,005
0,029 (0.47 )
(3.42 ) 0,015
(1.42 )
-0-0-0 FMDE 0,008
(0.47 ) ( -1,69 ) 0,008
(0.47 ) ( -1,62 ) 0,001
(0.05 ) (1.21 )
PHYSLIM 0,273
(3,67 ) 0,262
(3,81 ) 0,273
(3,67 ) 0,281
0,285 (3.50 )
(3.94 ) 0,355
(4,70 )
NDISEASE 0,022
(6.25 ) 0,020
(5,78 ) 0,022
(6.25 ) 0,022
( 4.29 ) 0,021
(6,03 ) 0,029

(7,54 )
HLTHG 0,039
(0.88 ) 0,144
(2,97 ) 0,039
0,147 (0.88 )
(3.01 )
(1.35 ) 0,058 0,156
(2.99 )
HLTHF 0,192
0,364 (2.29 )
(4.13 )
(2.29 ) 0,192 0,382
(3,98 ) 0,224
0,445 (2.75 )
(4.66 )
HLTHP 0,640
(3.01 ) 0,787
(4,63 ) 0,640
0,833 (3.01 )
(4.22 ) 0,798
(3,90 ) 0,999
(5,32 )
0,000 0,168 0,736 1,401 1,570 2 12 = 2 0,000 0,236
(0.47 ) 1,155
(16,43 )
-ln L 10184,1 10170,1
la estadstica t se encuentran entre parntesis. Tambin incluyen los
regresores ocho caractersticas socioeconmicas. DMED es un indicador de
si o no los gastos mdicos son positivos y LNMED es el logaritmo natural de
gastos operativos si es positivo. Los estadsticos-t para la segunda fase de

las dos etapas de seleccin modelo se basan en los errores que corregir
para la primera estimacin paso para obtener la razn inversa de Mills.
En primer lugar debemos comparar las dos partes de las estimaciones del
modelo con el de dos paso las estimaciones del modelo bivariado seleccin
de la muestra. La unidad DMED ecuacin son idnticas a las estimaciones
que se obtienen por medio de una regresin probit de DMED sobre los
mismos regresores. La ecuacin LNMED clculos difieren porque para dos
pasos de seleccin de la muestra el segundo paso de regresin OLS LNMED
incluye adems como un regresor el valor de la de Molinos relacin plazo.
Este perodo adicional es estadsticamente insignificante (t = 0,47 ) y baja
en magnitud con implcita = 0,168 que es cercano a cero. Como resultado
los dos modelos similares a las estimaciones de los coeficientes de la
ecuacin LNMED.
Como se ha indicado en la Seccin 16.4.4 el estimador de dos pasos pueden
realizar mal si la razn inversa de Mills plazo est altamente correlacionada
con los otros regresores. Aqu no parece que ese sea el caso, ya que es una
gran variedad en el modelo probit predijo probabili- de 0,15 a 0,99 y el
nmero de condicin (vase la seccin 10.4.4 ) de la segunda etapa los
regresores en la segunda etapa, aunque algo elevado, slo dobles de 37 a
82 a la inclusin de la razn inversa de Mills. A pesar de que es preferible
tener algunos exclusin las restricciones, no est claro en esta aplicacin
que los regresores en la ecuacin DMED podra razonablemente excluida por
motivos a priori de la LNMED ecuacin.
El ML estimaciones del modelo bivariado seleccin de muestras difieren
considerablemente de las estimaciones anteriores, en tanto LNMED DMED y
ecuaciones. Los errores en la
554

16.7 . ROY MODELO


modelos de variable latente LNMED DMED y son altamente correlacionados
con estimacin = 0,736 que es estadsticamente muy significativa (t =
16,43 ). La gran diferencia entre las dos estimaciones de paso las
estimaciones y la ML of12 (o of) se ve mejor como indica un problema con
la seleccin de la muestra modelo bivariado. Rechazo de la hiptesis nula de
que las estimaciones tienen la misma probabilidad lmite, la prueba de
Hausman dada en la Seccin 8.4 , puede ser interpretado como un rechazo
de la suposicin de normalidad conjunta necesaria para pasar de dos de

estimacin paso a ML estimacin de dos variables el modelo de seleccin.


Sin embargo, puede ser un problema ms fundamental que la seleccin de
la muestra modelo bivariado con los ms dbiles supuesto (16,41 ) and1 iid
normal tampoco es razonable. Esa fragilidad del modelo bivariado seleccin
de la muestra no es algo inusual, especialmente si los mismos regresores
son utilizadas, tanto en las partes del modelo para que identificacin se est
llevando a cabo a travs supuestos especificacin del modelo. Aqu, se ve
agravado por el uso de los gastos de salud los datos, que pueden tener
bastante grande para que los valores atpicos memorias permiten puede no
ser normal. Aunque ha sesgado LNMED cerca de 0 y la kurtosis cerca de 3,
como ya se seal, las pruebas estndar de heteroscedasticidad, oblicuidad,
rechazar rotundamente y curtosis (con valor de p 0.000 ) la hiptesis nula
de que LNMED se distribuye normalmente.
El regresor de mayor inters es LC, el logaritmo natural de la tasa en el
coaseguro de coaseguro es igual al porcentaje de salud coste soportado por
el asegurado paga por parte del paciente. El efecto ms significativos
estadsticamente a la hora de determinar si es o no de los gastos son
positivos, y no en el tamao de los gastos. Si todas las observaciones fueron
positivos, a continuacin, el coeficiente de LC en regresin en LNMED es
igual a la elasticidad precio de la demanda de atencin de la salud. De
hecho, en predecir el efecto de los cambios en el precio de la media
truncada condicional de registro de gastos que se necesitan para controlar
el efecto de los gastos con cero, al igual que en la segunda lnea de (16,43 ).
En algunas aplicaciones es el inters en las predicciones en lugar de
estimacin de los efectos marginales. Esto es complicado en este ejemplo
por el deseo de predecir el nivel, en lugar de el registro de los gastos.
Suponiendo log-normalidad, la expresin para el modelo de dos piezas en
(16,28 ). Duan et al. (1983) presentan un mtodo para hacer predicciones
sin el registro de suposicin de normalidad que puede ser vista como una
variante de bootstrap. Vase tambin Mullahy (1998).
16.7 . Roy Modelo
dos variables en el modelo de seleccin muestra la variable dependiente en
un individuo puede no ser observado. Por lo tanto, observar y2 de un
individuo si y1 = 1, pero no podr observar y2 en si y1 = 0. En esta seccin
consideramos un modelo en el que y2 se observ en todos los individuos,
pero slo en uno de los dos estados posibles. Este importante modelo
liberaliza- hiptesis y se conecta con la literatura sobre evaluacin de
programas presentados en el Captulo 25.
16.7.1 . Modelo
de Roy a menudo citado artculo de Roy (1951) examin las consecuencias
de la tra- distribucin de los ingresos (media y varianza) cuando no hay
individuo
555

MODELOS TOBIT Y SELECCIN


heterogeneidad en las capacidades y las personas de libre eleccin en las
ocupaciones. El tratamiento fue relativamente general y no matemtico,
aunque supongo que cada uno de los trabajadores en una ocupacin de
salida es normalmente distribuidos en la ausencia de seleccin, y no
considera en absoluto estimacin de un modelo formal. Durante la dcada
de 1970 una serie de autores independientes modelos propuestos para
situaciones similares que se puedan estimar con seccin transversal de
datos y seleccin de ambos observables y aspectos.
Estos modelos se han convertido en conocidos como Roy modelos.
Definimos el prototipo modelo Roy de la siguiente manera. Una variable
latente si el resultado observado es Y2 o Y3
positivo o negativo,
Y1 determina
* . En concreto, observamos si y1 es
> 0, y1 = (16,44 )
* 1 1 * 0 enfocar enfocar1 0,
y observar exactamente uno de Y2 y
0, y (16,45 ) 0.
Es habitual para especificar un modelo lineal con el aditivo los errores de las
variables latentes,
Y3 segn
* * y2 si y1> = * * y3 si y1
con
Y1 = x11 +1, (16,46 )
Y2 = x22 +2,
Y3 = x33 +3.

Un modelo con efecto aditivo es la especializacin 2 +. La forma ms


sencilla para- x33 = x2
mtricas modelo de correlacin de los errores es la normal, con
1 0 1 12 13
2 N 0, 12 2 2 23, (16,47 ) 3 0 13 23 2 3,
donde como de costumbre la normalizacin 2 * 1 = 1 se utiliza como slo
el signo de y1 es observado.
El registro de probabilidad funcin es similar a la que muestra dos variables
para el modelo de seleccin de la Seccin 16.5 , salvo que ahora 0, por lo
que el trmino Pr[ Y1i 0] en (16,33 ) es sustituido por f (y3i | Y1i
es ms comn para estimar el modelo usando de Heckman de dos paso
mtodo aplicado
Y3 se observa si
0) Pr[y1i
Y1 0].
en el truncado,
E[y|x > 0] = 2 +12( x11), (16,48 ) E[y|x
1 Y Y1 0] =
x2 x33 -13(- x11),
where(z) = (z) / (z) y hemos usado 21 = 1. De la primera etapa de
estimacin probit
* si o no y1> 0 produce una estimacin de 1 y hence(x 11). Dos
regresiones separadas LA OPERACIN 2 a continuacin con la estimacin
directa ( 2 ,,12) y ( 3 (,13). Las estimaciones of2 2 y3 puede
obtenerse utilizando el cuadrado de los residuos de las regresiones, similar
a la tcnica utilizada para la seleccin de la muestra modelo bivariado
despus (16,40 ). Maddala (1983, p. 225) proporciona informacin completa
de este modelo, que l llama una conmutacin
556

16.7 . ROY MODELO


endgeno con modelo de regresin. Este es tambin el modelo tobit tipo 5
presentan en Amemiya (1985, p. 399).
16.7.2 . Las variaciones de la Roy Modelo
muchos modelos pertenecen a la categora de Roy modelos. Maddala (1983,
Captulo 9) le da nu- recensin referencias a lo que l llama modelos con la
selectividad. Vase tambin Amemiya (1985, Captulo 10). Aqu
presentamos algunos ejemplos.
Seleccin de la muestra el modelo bivariado se puede ver como un caso
especial en el que se ignora y que slo el modelo truncado momento E[
Y3
0]. Seleccin de la muestra los modelos bifactoriales donde a = 0 cuando
* * y2 |y1> 0, como en las aplicaciones de la oferta de mano de obra,
puede Y1 ms directamente verse como Roy modelos donde
observamos bien y = Y2 o y = 0, de modo que
Y3 = 0.
En el estudio de L. -F. Lee (1978), salarios y Y1
* * y2 e y3 indican, respectivamente, de la unin y pseudoartrosis indica
tendencia a ser miembros de un sindicato. Esto agrega la estructura
adicional que
Y1 = Y2 - Y 3 + z + ,
donde z + reflejar los costes de la integracin en la unin y est muy en
el espritu de Roy (1951). Sustitucin de Y2 y Y3 produce una forma
reducida de Y1:
Y1 = (x 22 - x33 + z ) + (2 -3 + ).
Este modelo es en la actualidad el mismo que el del modelo anterior, con la
correccin term de primer paso regresin probit de y1 en x1, donde x1
x
(x 11) obtenidos indica que el nico de los regresores
2, x3 y z.
Si slo la interseccin vara a travs de las dos posibles resultados, por un
amount dice, entonces el modelo Roy reduce a dos variables latentes
Y1 = x 11 +1
y = x + y 1 +

donde y = y siempre es observado y observamos tambin la variable


binaria y1 igual a uno si Y1> 0 e igual a cero en caso contrario. Este
modelo de y puede ser visto como una variable endgena con dummy (y1).
Se puede calcular mediante la Heckman de dos paso
* estimador aplicado a la expresin de E[y |x]. Por otra parte, las variables
instrumentales estimacin puede ser utilizado, siempre un instrumento de
y1 est disponible. Esto requiere una re- gressor que no determinan el nivel
de los resultados de inters, pero no determinar qu resultado es elegido.
Estos Roy los modelos son similares a los modelos estudiados los efectos del
tratamiento en la literatura. Hay dos posibles resultados, aqu * * y2 y y3,
pero nosotros slo podemos observar uno de ellos. El enfoque de este
captulo ha sido la de crear la situacin hipottica por mak- distribucin
fuerte hiptesis sobre la distribucin de aspectos. El Captulo 25 presenta
mtodos alternativos. Vase en particular el captulo 25.3 para las
conexiones entre los diferentes enfoques.
557

MODELOS TOBIT Y SELECCIN


16.8 . Modelos Estructurales
modelos de regresin para muestras seleccionadas tienen la caracterstica
de que el resultado de la est depende en parte de la decisin de participar
que, a su vez, depender de los resultados esperados. La decisin de
participar y los resultados son simultneamente decisiones. Las anteriores
presentaciones simplificado esta interdependencia dando una forma
reducida de versin de la participacin ecuacin. En particular, ver la
exposicin de Lee (1978) en la Seccin 16.7.2 . Este es un enfoque vlido
aunque es menos eficiente que trabaja con una versin totalmente
estructural.
En esta seccin nos modelo explcitamente la interdependencia estructural
con modelos econmicos basados en maximizacin de la utilidad, y
utilizando modelos estadsticos estructurales que ex- tienden lineal
ecuaciones simultneas para cubrir la censura y truncamiento, incluyendo
los resultados binarios.
16.8.1 . Modelos Estructurales de maximizacin de la utilidad

modelo estructural inicial investigacin considera que la oferta de mano de


obra. El modelo clsico tiene los consumidores maximizar utilidad, una
funcin de consumo de bienes y en el tiempo libre, sujeto a una restriccin
presupuestaria y una restriccin de tiempo discrecional que se asigne el
tiempo necesario entre tiempo de ocio y tiempo de trabajo. Solucin en el
interior la tasa marginal de sustitucin (MRS) entre el ocio y consumo de
bienes es igual a la tasa salarial. Sin embargo, una solucin esquina donde
la mujer decide no trabajar puede surgir si la seora supera el salario
ofrecido. Gronau (1973) y Heckman (1974) present modelos economtricos
congruentes con maximizacin de la utilidad que llev a Tobit-al igual que
los modelos, lo que representa la complicacin adicional que el salario
ofrecido no se observa con las mujeres que no trabajan. Los anticipos
siguientes incluyen la incorporacin de los costos fijos de trabajo, seleccin
de la muestra de los modelos y el uso de datos de panel, panel de modelos
Tobit. Killingsworth y Heckman (1986) y Blundell y MaCurdy (2001) y
encuestas Mroz (1987) proporciona una aplicacin.
Para ilustrar el enfoque estructural, se presenta un resumen del siguiente
ejemplo. Presidente Dubin y McFadden (1984) modelo hogar consumo de
energa (electricidad o gas nat- urales) y la seleccin de artefactos (tales
como calefaccin elctrica o de gas natural calefaccin) se relacionan entre
s las decisiones procedentes de la misma funcin de utilidad. En concreto,
se supone que para la j-sima de m aparato carteras hogar utilidad indirecta
est dada por
-p1 vj = {0 j + 1/ + 1 p1 + 2 p2 + w +(y - r j) +}e + j, (16,49 )
donde p1 y p2 indican los precios de la electricidad y el gas, y denota los
ingresos y r j
indica el total anual costo del ciclo de vida de la cartera de j
r j = p1q1 j + p2q2 j + c j,
donde q1 y q2 j j denotan el tpico consumo de electricidad y de gas en los
hogares con aparato cartera j, c j es el costo del aparato cartera j, and es
la dis- tasa de recuento. Los gustos varan de los hogares debido a
characteristicsw observables, error observables, y un aparato especfico
cartera error j, que se supone que es
558

16.8 . MODELOS ESTRUCTURALES

independientes pero correlacionadas en j with. Adems, hay un comn


gusto especfico aparato factor0 j.
Demanda de Electricidad x1 dispositivo dado cartera j es igual a - (Vj/P1) /
(Vj/Y), de Roy la identidad, dando
x1 - p1 j = 0 j + 1 p1 + 2 p2 + w +(y - r j) + .
A destacar que la eleccin del aparato cartera j es endgeno, introducir m
mutu- exclusivo indicador aliado variables jk, k = 1,... , m, donde
1 ifk = j jk = 0 ifk =j.
A continuacin, demanda de electricidad x1 dispositivo dado cartera j es
dado por

m
(16,50 )

m x1 - p1 j = 0k jk + 1 p1 + 2 p2 + w + y - r j jk +.

k=1 k=1
aunque el modelo (16,50 ) es lineal, regresin de MCO inconclusivos
rendimientos como resultado de la endogeneidad of jk. Presidente Dubin y
McFadden (1984) presentan dos procedimientos de estimacin.
Las estimaciones del mtodo IV (16,50 ) con pk y r j pk como instrumentos
for jk y r j jk, k = 1,... ,m, donde pk son las probabilidades estimadas de
escoger las diversas carteras aparato. Aqu el Ejrcito Yugoslavo se utiliza
para denotar la funcin de utilidad indirecta. Incluye tanto los componentes
deterministas y estocsticos de utilidad y corresponde a U j en la Seccin
15.5.1 presentacin del ARUM. Un enfoque similar rendimiento
pk = Pr[Vk> Vl, l =k, l = 1,... ,m]
-p1 = Pr[l -k< { (0k -0l) - rl) }, todos l =k]
- k -rk)e = exp[ (0 m ,
l=1 exp[ (0l -rl)
(rk p
1/ 3] e-p1/ 3]
bajo el supuesto de que the j = 1,... ,m, iid tipo II son valores extremos con
cdf F() = exp(- exp( --J, / 3)), where 0,5772 es constante de Euler.
Tenga en cuenta que

2 here j ha significa cero y variance/2 que difieren de las de la


parametrizacin del tipo II de valores extremos en los Captulos 14 y 15.
Estimacin de un modelo logit multinomial no lineal permite predecir
probabilidades pk.
Un enfoque de seleccin de muestras alternativas seala que E[|cartera j
elegido] =0 y utiliza supuestos sobre la distribucin of and1,... ,mto
obtener esta- mentos m. En concreto, suponga that|1,... ,m es iid con
media (
2 m 2 m 2/) k=1 y
m 2 Rkk variance (1 - k=1 Rk ), donde k=1 Rk = 0 y k=1 Rk < 1 y la
distribu- cin ofk ya ha sido dado. Luego realizar lgebra en Tribunal Dubin
y McFadden rendimientos
pk ln pk E[|cartera elegido j] =m
(6Rk/) + ln pk .
k =j 1 - pk
559

MODELOS TOBIT Y SELECCIN


DE Heckman procedimiento en dos etapas, a continuacin, las estimaciones
de la operacin

x1 - p1 j = 0k jk + 1 p1 + 2 p2 + w + y - r j jk k=1 k=1
m + pk pk k ln + ln pk +,
k = j 1 - pk
donde pk se predice probabilidades en el modelo anterior de pk, and es un
error asinttica con media cero.
Presidente Dubin y McFadden estima que estos modelos con los datos de
3.249 hogares con dos carteras: posible aparato elctrico para agua y
calefaccin y gas de agua y calefaccin.

Ejemplos relacionados con los de ( HANEMANN ) (1984), que modela el


consumo de una marca de buena en la que los consumidores consumen slo
uno de los posibles productos de marca a la hora de elegir y de Cameron et
al. (1988), que como modelo demanda de servicios de salud depende de la
eleccin de uno de una serie de exclusivos entre s las plizas de seguro de
salud.
Mucha creatividad, evidente en el Tribunal Dubin y McFadden ejemplo,
puede ser necesario especificar un modelo que produce soluciones
analticas para tanto a la eleccin y las probabilidades condicionales de
sores de la eleccin. Los avances en mtodos computacionales de Chap- ter
12 y 13 permiten la estimacin de dichos modelos incluso cuando las
soluciones analticas no se obtienen. Sin embargo, los resultados todava se
depende de la funcin de utilidad y la distribucin de aspectos.
16.8.2 . Ecuaciones simultneas Tobit y modelos Probit
para ilustrar las cuestiones que se planteaban en la posibilidad de ampliar el
enfoque lineal SEM de la Seccin 2.4 consideramos un modelo de seleccin
que depende de dos variables latentes e introducir si- multaneity en los
modelos de variables latentes. De modo muy general
Y modelo es1 =1 Y2 +1y1 +1y2 + x 11 +1, (16,51 )
Y2 =2 Y1 +2y1 +2y2 + x 22 +2,
donde e y1 y se puede observar el indicador binario
Y1
y2
Y2 no se respetan plenamente, pero no determinar las variables
observables, y los errores se supone la distribucin normal. Por ejemplo, y1
= 1 * * * enfocar1> 0 y observar y2 = y2 si y1> 0. Tenga en cuenta
que en principal o variables latentes o resultados observados o ambos
pueden aparecer como regresores, aunque identificacin requiere
restricciones tales como las que figuran en el siguiente.
Las variables latentes endgenas
, es ms sencillo para permitir que slo las variables latentes que los
regresores en (16,51 ). Luego
Y1 =1 Y2 + x11 +1, (16,52 )
Y2 =2 Y1 + x22 + 2.
560

16.8 . MODELOS ESTRUCTURALES


del modelo bivariado seleccin de la muestra (16,31 ) es un ejemplo que
adems especifica 2 = 0 y directamente especifica una forma reducida en
lugar de una forma estructural de la ecuacin. Modelo (16,52 ) es fcilmente
debido a la forma reducida para
Y1
puede * * y1 e y2
se obtiene de la misma manera que para regular las ecuaciones lineales
simultneas. Este formato reducido puede ser estimado utilizando mtodos
como probit o Tobit en funcin de la forma en que y1 y y2 son determina
dada * * y1 y y2. Los parmetros de la
* * modelo estructural (16,52 ) se puede estimarse mediante la sustitucin
de la regresores y2 e y1 * * por la forma reducida de predicciones y2 y y1.
Modelos como (16,52 ) se denominan ecuaciones simultneas modelos
Tobit.Asimul tra- ecuaciones modelo probit se plantea si las variables
dependientes y1 e y2
son binarios. Los estimadores son presentados por Nelson y Olson (1978),
Amemiya (1979), y Lee, Maddala y Trost (1980) y un tratamiento general
para una amplia gama de mod- els en L-F. Lee (1981). Los errores estndar
de los estimadores se puede obtener utilizando los resultados de secuencial
de dos paso de estimadores-m en la Seccin 6.6 . Sin embargo, es mucho
ms fcil de obtener mediante el procedimiento bootstrap pares
presentados en sec- cin 11.2 . Identificacin requiere exclusin de
restricciones (16,51 ) similares a los lineales de ecuaciones simultneas.
Regresores endgenos
una especializacin del modelo (16,52 ) es un modelo tobit con regresor
endgeno que se respetan plenamente. A continuacin, Y2, mientras que
observamos y1 = Y1 si Y1> 0 e y1 =
Y2 se observa plenamente, por lo que y2 = 0, de lo contrario. El modelo se
hace
Y1 =1y2 + x 11 +1, (16,53 )
y2 = x +v,

donde la primera ecuacin es la ecuacin estructural de inters y la


segunda ecuacin es la forma reducida para el regresor endgeno y2. Note
una vez ms que aqu y2 es con- tinuo, no discreto. De normal errors v1
=+, where independiente es un error normal (ver Seccin 5.1 ), por lo
tanto * y1 = 1y2 + x11 +v+.
Dos pasos de clculo procedimiento calcula predice residuales v = y2 - x
de regresin por MCO de y2 en x y, a continuacin, obtiene Tobas
estimaciones del modelo
Y1 =1y2 + x11 + v + e1,
cuando el error e1 se distribuye normalmente. Una prueba de endogeneidad
de y2 se puede apli- carse como un test de Wald of = 0 utilizando el
estndar habituales errores de Tobit.
Esta prueba es una extensin de la regresin auxiliar para poner en prctica
el Hausman endo- geneity prueba en el modelo lineal (vase la seccin
8.4.3 ). Si la hiptesis nula es rechazada, la mencionada etapa de regresin
Tobit produce estimaciones of1
y 1, pero errores estndar, a continuacin, es necesario ajustarse debido al
primer paso de la estimacin regresor adicional v. Vase Smith y Blundell
(1986) para obtener informacin detallada sobre el modelo tobit y los ros y
Vuong (1988) para un procedimiento similar que se estima un modelo probit
en el segundo paso.
561

MODELOS TOBIT SELECCIN


endgena Y censurados o variables binarias
anlisis es ms complicado si la censura o endgena binaria- cutidas y1 o y2
aparecen como regresores en (16,51 ). Heckman (1978) considera que lamodelo:
Y1 =1y1 +1 Y2 + x11 +1, (16,54 )
Y2 =2 Y1 +2y1 + x22 +2,
donde observamos y1 = y1 = 1 * enfocar1> 0 y el tiempo. La
complicacin es que y1

* 0 * enfocar1 0 y observamos y2 = y2 aparece como un regresor. Una


significativa forma reducida de 12 + entonces la forma reducida del
modelo se hace
Y1 puede depender solamente de x1 y x2 y y1. Esto impone la restriccin
de que 1 = 0, un ejemplo de lo que se llama coherencia en esta literatura.
Y 1 = x1 +v1, y2 = 2y1 + x 2 +v2.
Este es un caso especial de la Roy modelo donde la participacin (y1 = 1)
lleva a cambio slo una intercepcin (via2) en los resultados. En general,
los modelos con regresores que son censuradas o trunca las variables
endgenas son difciles de estimar. Vase, por ejemplo, Blundell y Smith
(1989).
Ejemplo
Brooks, Cameron y Carter (1998) aplic un modelo tobit ecuaciones
simultneas a explicar el voto por representantes del congreso de azcar.
Los tres resultados observados y1, y2 y y3 son, respectivamente, el voto (s
o no) y de las contribuciones a sus fondos para su campaa de intereses y
azcar (oposicin) - intereses de los usuarios. El primer resultado es un
resultado binario y los otros dos resultados son censurados en cero. Un
modelo de ecuaciones simultneas asociados
Y1 variables latentes, * * y2, y3 se ha especificado, por lo que el modelo
estructural de la forma ms simple (16,52 ).
* * Cmo es esta especificacin razonable? Aqu las contribuciones de
campaa y2 e y3
* dependen de la variable latente y1 desde el voto real y1 se hizo en una
fecha posterior.
* * De y1 sin embargo, una alternativa, ms difcil es que modelo y1, la
variable latente de la votacin, depende de las contribuciones recibidas (y2
y y3) en lugar de las contribuciones en el latente. Sin embargo, si se
considera que un juego es probable que se repita en el futuro, se puede
utilizar * * y2 y y3. Es evidente que la razonabilidad de esos supuestos
variar en funcin de la aplicacin. Identificacin de parmetros se obtuvo
mediante la exclusin de las restricciones exgenas regresores. Estimacin
consistente se basa en errores comunes que se distribuyen normalmente.
16.9 . Estimacin concentrar
Censura, truncamiento y de seleccin de la muestra a una muestra que
difiere de la mor- talidad. Esto es, en esencia, un problema de los datos
faltantes, uno que es complicado porque faltan datos sobre la variable
dependiente(s) en lugar de en los regresores exgenos.
562

16.9 . ESTIMACIN DE
La SEMIPARAMTRICO mtodos anteriores soluciona este problema de los
datos faltantes de distribucin- sunciones bsicas para obtener una funcin
de probabilidad los datos de la muestra o la correspondiente censura,
truncado o condicional.
Estos mtodos son frgiles incluso a muy menor de invariacin distribucin
del error.
Por ejemplo, tanto la MLE y el Heckman de dos paso estimador estndar en
el modelo Tobit son incompatibles si los errores son normales, pero dentro, o
si son homo- skedastic pero anormales). Vase, por ejemplo, Paarsch
(1982) y las referencias que en l.
Grandes esfuerzos se han dedicado a los pases en desarrollo que son
estimadores semiparamtrico en supuestos distributivos ms dbiles. Antes
de presentar ejemplos, sin embargo, tomamos nota de que existe una
alternativa a que siga aplicando un enfoque paramtrico que se basa en
mucho ms rica, ms supuestos distribucin flexible.
16.9.1 . Modelos paramtricos Flexible
por la sencillez comenzar con el clsico modelo tobit thati N
* yi = xi + i. El supuesto ] puede ser relajado en dos formas. En primer
lugar, la heterocedasticidad se puede incor- 2 [0,i
rase a travs de un modelo explcito 2 i = exp(zi), donde ahora tanto y
tienen que ser estimados. En segundo lugar, las distribuciones ms
flexible que la distribucin normal puede ser utilizado. Por ejemplo, podra
utilizar un cuadrado polinomio expansin del normal (vase la seccin
9.7.7 ).
Para la seleccin de la muestra modelo bivariado un enfoque similar puede
ser tomado, donde actualmente una mayor flexibilidad de distribucin
conjunta (1, 2) se usa. Lee (1983) propusieron trabajar ) (1, 2) para que
la suposicin de normalidad bivariada * * con transformaciones (1, 2
puede ser ms razonable.
Mtodos Bayesianos se puede aplicar tambin a esos modelos. (1992)
examin el censurado modelo tobit. Las variables latentes Y se introducen
como variables auxiliares y los datos de enfoque (ver Seccin 13.7 ). El

muestreador de Gibbs ciclos entre (1) el condicional posterior para |y, Y


2,, (2) el condicional para posterior
2 |s, s, , y (3) la posterior para Y |y 2, .
Un enfoque paramtrico flexible es especialmente ventajoso para la
manipulacin censurar-, truncamiento y seleccin de la muestra en modelos
no lineales como los de cuenta y datos de duracin o tipos de datos
combinados, como mtodos concentrar es menos probable que estn
disponibles.
16.9.2 . Concentrar Estimacin de Modelos censurados
, ahora a concentrar estimacin. Consideramos un modelo lineal de la
variable latente = i, que es de izquierda censurados a cero, de manera que
observamos yi = si YI > 0 y modelo
YI
yi =
xi +
*0
YI ifyi
0. El semiparamtrico literatura suele expresar el
yi = max(xi + i, 0). (16,55 )
es el modelo Tobit (16,11 ) - (16,13 ), excepto la distribucin of no
especificado.
Con algunas adaptaciones este modelo abarca tambin la censura de la
izquierda en punto fijo conocido distinto de cero y a la derecha de la censura
como de la parte superior de datos codificados. Por ejemplo, si
563

MODELOS TOBIT Y SELECCIN


y = min(x + , U) y U - y = max(U - x -, 0). El objetivo es siempre
estimacin sin especificar una distribucin paramtrica fori completa. Los
estimadores son llamados concentrar como la censura significa xi se
parametriza la distribucin de errores pero no lo es. Los mtodos que se

presentan en las siguientes difieren en las hiptesis formuladas sobre la


distribucin of.
De (16,8 ) ML estimacin es posible dado el conocimiento de la cdf de y y
por lo tanto of. La cdf of nonparametrically puede ser estimado utilizando
el Kaplan-Meier producto lmite estimador para el cdf presentado en el
Captulo 17 para el caso de derecho de duracin datos censurados. Por otra
parte, la distribucin puede ser nonparametrically of determinada
mediante la expansin de la serie de Gallant y Nychka (1987); vase la
seccin 9.7.7 . Estos mtodos de estimacin ML concentrar rara vez se
aplican.
En cambio, la literatura se centra en la estimacin basada en momentos
condicionales. (16,20 ) el condicional significa censura E[y|x] es claramente
un modelo de ndices con
E[y|x] = g(x), en el que la funcin g( ) se desconoce si la distribucin of
no est especificado. El ndice de la Seccin 9.7.4 mtodos pueden
aplicarse, por lo tanto, aunque como ya se ha sealado slo se puede
estimar de ubicacin y la escala.
Un enfoque ms popular alternativa considera censura condicional
momentos menos alterados por la censura. Powell (1984) propuso utilizar la
media condicional.
El supuesto clave es that distribucin|x tiene media cero, en cuyo caso la
con- dicionales de mediana y|x es igual a la media condicional x . La
intuicin de Powell en la calculadora es ms fcil de obtener y es de suponer
iid. Si menos de la mitad de la muestra est censurada, por lo que menos de
la mitad de las observaciones son cero y ms de la mitad son - sada, la
censurada muestra mediana proporciona una estimacin coherente de la
poblacin media. Powell (1984) extendi esta idea de la regresin, en la
misma lgica se aplica para las observaciones de las que menos de la mitad
de las observaciones on|x cen son patrocinados, where = y - x depende
de , que debe ser estimado. La regresin estimacin anloga de mediana
es LAD estimacin (ver Seccin 4.6 ). Esto lleva a la censura desviaciones
de mnimo absoluto (CLAD) estimador CLAD, que minimiza
N -1 Q N () =N |yi - max(xi, 0) |. (16,56 )
i=1
El supuesto esencial de la coherencia de este estimador es that|x tiene
media cero.
En este supuesto el estimador es consistente incluso si los errores son
condicionalmente het- eroskedastic. El estimador de es N-consistente y
asintticamente normal. Estimadores ms eficientes se puede obtener
mediante la ponderacin de los trminos de importes de f (0 |xi), la

densidad condicional ofi|xi evaluados en cero. El mtodo tambin se puede


extender a cuantiles condicional.
Un procedimiento alternativo utiliza una forma simtrica media truncada, en
lugar de la me- dian, que tambin es afectada por la censura. Suponer que
la distribucin of|x es sim- sistema mtrico. Esto implica que para las
observaciones con media positivo (es decir,
x >0) y|x es distribuidos simtricamente en el intervalo (0, 2 x ). A
continuacin, ya sea x + < 0 e y = 0 se observa o, con la misma
probabilidad, x + > 2x y los datos
son artificialmente a 2x para preservar la simetra sobre x . Hemos
demostrado que
E[ 1( x > 0) [min(a, 2x ) - x ]x] = 0, (16,57 )
564

16.9 . ESTIMACIN CONCENTRAR


donde 1 (x > 0) restringe atencin positiva en las observaciones con la
media y la nueva variable dependiente es y = 0, o 0< y < 2x , o 2x
si y> 2x . El momento esti de- saparecido en (16,57 ) no tiene solucin
nica para . Powell (1986b) propone la forma simtrica censurados por el
mtodo de los mnimos cuadrados (LAS LCB) estimador que minimiza
-1 2 Q N () = N

{ [yi - max(yi/2, xi)] + 1 (yi> 2xi) [ 2yi/4 - max(0, xi 2)] },


i=1
(16,58 )
que con algunos lgebra puede ser demostrado que rendimiento de primer
orden que las condiciones son la muestra de momento condicin analgica
(16,57 ). Chay y Honor (1998) "una exposicin grfica de la fresa de la
calculadora las LCB, as como para la relacin con pares de estimadores de
diferencia Honore y Powell (1994). " Melenberg y Van Soest (1996), Chay y
Honor (1998), y Chay y Pow "ell (2001) proporcionan aplicaciones de
algunos de estos estimadores. Pagano y Ullah (1999) proporcionan mtodos
adicionales y la teora.

Como ejemplos empricos que hemos aplicado a la estimacin REVESTIDO


Seccin 16.2.1 los datos que se generan a partir de un modelo tobit con
errores normales. La pendiente parmetro (establecido en 1000) se estima
en 956 (error estndar 117) con ML en comparacin con 838 (error estndar
165) con CHAPADOS. Tal como se esperaba, la robustez a CHAPAR
nonormality viene a costa de cierta prdida de eficiencia.
16.9.3 . Estimacin de Seleccin concentrar
concentrar Modelos estimacin modelos de seleccin de la muestra es ms
complicado. - Las ms comnmente modelo estudiado, el modelo bivariado
seleccin de la muestra de una multa en la Seccin 16.5.2 , donde ahora
relajamos la hiptesis de que los errores (1, 2) son normalmente
distribuidos.
Concentrar ML estimacin es posible. En particular Gallant y Nychka (1987)
consideraron explcitamente la seleccin de la muestra modelo bivariado
como un candidato adecuado para la expansin de la serie estimador
presenta en la Seccin 9.7.7 .
La literatura en su lugar, utiliza como punto de partida la expresin para el
truncado condi- significa, que a partir de (16,34 ) viene dado por
E[y2i|xi, Y1i> 0] = x 2 + E[2 |1> - x1i1] (16,59 ) =
2i x2i2 + g(x1i1),
donde la segunda igualdad asume that2i|xi,1i tiene distribucin justa que
depende de x1i similar a la hiptesis (16,41 ). La distribucin de (1, 2) no
se especifica para que la funcin g( ) es desconocida, dando lugar a un
problema de estimacin semiparamtrico. Dado que es posible que g 1 y la
identificacin de este modelo con g( ) no especificado- duccin de
(x11) = x1 exclusin restriccin que al menos, uno de los componentes
de x1 no aparece en x2.
Por otra parte, las ms correlacionadas x 11 es con el x2 el mejor 2 y g( )
puede distin- guidos. El modelo (16,59 ) es un modelo lineal parcialmente,
que se puede calcular utilizando mtodos presentados en la Seccin 9.7.3 .
Mtodos populares incluyen el Robinson (1988a) g diferenciacin y el uso de
un estimador de expansin de la serie de
la regresin es de y2i en x2i2 + g(x1i1), donde 1
(x11). Desde 1 es desconocido puede ser obtenida por regresin
565

MODELOS TOBIT Y SELECCIN


del resultado binario y1i en x1i, utilizando uno de los modelo binario
concentrar esti- macin en la Seccin 14.7 . Estos mtodos proporcionan
estimaciones consistentes de los parmetros 2 , pendiente. Adems de
estimar la interseccin, necesario para el anlisis de los niveles en lugar de
cambios en y2, vase Andrews y Schafgens (1998).
Newey, Powell, y Walker (1990) aplic este enfoque de oferta de mano de
obra femenina.
La participacin modelo de indicadores se estim utilizando varios mtodos
diferentes y la ecuacin de los resultados y2 se estim utilizando el mtodo
de Robinson (1988a).
Melenberg y Van Soest (1996), modelado vacaciones los gastos mediante el
uso de una amplia gama de mtodos concentrar tanto para la seleccin de
la muestra y bivariante censurado regres- sion modelos. Un modelo ms
ricos es proporcionada por el Das, Newey y Vella (2003).
Manski (1989) considera dos variables identificacin en el modelo de
seleccin de la muestra relativamente mnimas suposiciones y siempre los
lmites de la media y de efectos marginales, sujeta a los regresores y la
seleccin.
16,10 . Derivaciones para el Modelo Tobit
16.10.1 . Momentos de truncado
2 considerar Normal Estndar z N [0, 1], con density(z) = (1/ 2) exp(
-z / 2) y de la fuerza de defensa civil (z). Desde Pr[z> c] = 1 - (c), la
densidad condicional de z|z> c is(z) / (1 - (c)). El fol- mnimos (
E[z|z> c] = z ((z) / [1 - (c) ]) dz
c( 9
2 = z(1) exp( -z / 2) dz [1 - (c)]
c
/ 2 ( 9
2 = - (1 z / 2) dz [1 - (c)]
c
/ 2) exp( -:

2 = - (1
Z / 2) exp( -z / 2) [1 - (c)]
c
= c) / [1 - (c) ].
Del mismo modo,
( 2 2 E[z |z> c] = z ( (z) / [1 - (c) ]) dz
c( 9
2 = z z (z 1 / 2) dz [1 - (c)]
c
/ 2) exp(- ( 9
2 = z - (1/z / 2) dz [1 - (c)]
c
2) exp(2 :
= z ( -) exp( -z / 2) [1 - (c)]
c(
Z 1/ 2
9
2 - (z) - (1 ) exp( -z / 2) dz [1 - (c)]
c
/Z 2
= c(c) / [1 - (c)] + (1 - c) / [1 - (c)] = c(c) / [1 - ( C)] + 1.
566

16,10 . DERIVACIONES PARA EL MODELO TOBIT

se deduce despus de un poco de lgebra


2 2 V[z|z> c] = E[z |z> c] - (E[z|z> c])
2 2 = 1 + c(c) / [1 - (c)] -(c) / [1 - (c) ].
16.10.2 . Teora asinttica de Heckman para Two-Step estimador del Modelo
Tobit
la varianza asinttica de la matriz de dos paso Heckman estimador es
complicada por su dependencia de primer paso las estimaciones de
parmetros. Hay varias maneras de obtener la varianza asinttica, como el
de Amemiya (1985, pgs. 369- 370). Aqu se aplican, en cambio el
resultado general de secuencial de dos paso de estimadores-m en la
Seccin 6.6 .
Consideramos el caso ms simple de la modelo Tobit (vase la seccin
16.3.6 ). Los mtodos se pueden adaptar a dos pasos de estimadores para
la seleccin de la muestra modelo bivariado (sec- cin 16.5.4 ) y ecuaciones
simultneas modelo Tobit (Seccin 16.8.2 ). Un enfoque bastante diferente
ms simple es usar el mtodo bootstrap pares (vase la seccin 11.2 ).
(16,26 ) queremos estimar los parmetros = [ ] en la ecuacin:
yi yi positivo = xi +( xi) + i
= wi( ) +i,
donde wi() =
[xi variance i se(xi)] andi = yi - xi -(xi) es heteroscedstico con
definidos en (16,24 ). El primer paso del procedimiento de dos pasos es
obtener
una estimacin i 2 del parmetro desconocido por un probit MLE. Lo
anterior se deduce que la ecuaciones normales para las dos partes de la
Heckman de dos paso estimador son
N 2 (yi (xi) (xi)) (16,60 ) xi (1 - i=1 (xi) xi = 0,
N
- diwi() ( yi - wi () ) = 0,
i=1
donde la primera ecuacin da el probit de primer orden las condiciones de
, y la segunda ecuacin da de primer orden para las condiciones para la
operacin de positivo yi (di = 1).

N estas ecuaciones pueden combinarse como i=1 h(xi, ) = 0 donde = (,


). Por
d -1 -1 la costumbre de primer orden series de Taylor - N [0, G (G
-1 N -1 0 S0 0 ) ]] donde
N G0 = lim N E[ i=1 H(xi, ) /] y S0 = lim N E[ i=1 h(xi, )h(xi, ) ].
Estamos interesados en el subcomponente correspondiente a .
Simplificacin se produce porque H(xi, ) / es el bloque triangular porque
no aparece en el primer conjunto de ecuaciones.
Particiones produce el resultado general
-1 " V[ 2] = G22
!S22 + G21 [ -1 G11 S11 -1 G11 ] G21 - G21 -1 G11 S12 - S21 -1 G11
G21 -1 G22,
donde las matrices se definen en la Seccin 6.6 .
567

MODELOS TOBIT Y SELECCIN


Especializada para el problema en este caso, se considerar en primer lugar
los trminos de G0. A continuacin,
2 1 N ( G11 = lim N i=1 (xi (1
xi) - xi (xi))
xi,
1 N ( G21 = lim N i=1 diwi
xi) ,
1 N G22 = lim N i=1 E[diwi wi].
La expresin para G11 utiliza el conocimiento que -1 G11 es slo la varianza
de la MLE probit.
La expresin para G21 utiliza

H 2i- diwi() ( E = E yi - wi() ) 1 DIWI() = E wi ( ) = E


diwi
xi .
La expresin para G22 utiliza
H 2i ) ( = diwi( yi - wi () ) = diwi wi. 2
En cuanto a S0 tenemos
S11 = -1 G11, S21 = 0,
1 N S22 = lim N i=1 E[di( yi - wi() 2) ].
La expresin de S11 sigue aplicando la matriz de informacin la igualdad.
Teniendo expectativas y algunas manipulaciones conduce a S21 = 0, y
S22 ]. es simplemente V[i combinando estos resultados da la Heckman de
dos paso estimador N (, V), donde
-V = 1 1 W W W + W W D V
DW W - W , (16,61 )
y donde W W =
i=1 di wi wi, D = Diag(xi) / | , V es la varianza ma2 trix para la primera fase de probit MLE, y es una matriz diagonal con
ith entrada . Esta estimacin es fcil de obtener si matrix comandos
estn disponibles. La parte ms difcil puede ser analticamente obtaining
i 2 =V[i] en (16,24 ). Si esto es difcil, podemos usar en su lugar 2 i =
(yi - xi + i (xi 2 ) siguiendo el enfoque de Blanco (1980).
16,11 .
La mayora de las principales consideraciones prcticas los paquetes
incluyen ML estimacin del modelo tobit con normalidad. La modelo es fcil
de estimar como uno puede estimar cada parte por separado. En principio
568

16,12 . NOTAS BIBLIOGRFICAS


bivariado muestra el modelo de seleccin puede ser estimado como de
Heckman de dos paso modifi- utilizando slo un probit OLS y rutina. Sin

embargo, los errores estndar son difciles de calcular debido a los dos de
carcter gradual de la calculadora, y es mucho ms fcil de obtener errores
estndar utilizando un paquete de Heckman con procedimiento de dos
pasos.
Estimadores concentrar Aplicacin generalmente requiere un cdigo
especializado en programacin lenguaje como GAUSS. Algunos paquetes
tambin permiten ML estimacin de censurados y truncados variantes de
otros modelos, como el Poisson y binomial negativa para datos de recuento.
Censura y truncamiento se gestionan fcilmente si uno ve como razonable
la distribucin especificada. Por ejemplo, los datos sobre los ingresos de
colores se gestionan fcilmente si la distribucin log-normal se ajusta bien a
los datos. Censurados LAD, que se basa en mucho ms dbil distribuhiptesis, tambin puede ser utilizado en esta situacin.
Mucho ms problemtico es el manejo modelos con seleccin de la muestra.
El ms para- mtricas las versiones de estos modelos pueden depender de
supuestos distributivos que se estima que sea fuerte. Las versiones
concentrar todava tienen que luchar con la identificacin- que una variable
que determina la participacin es tambin determinar el resultado de
inters. Una ruta ms prometedora, a menudo en la literatura sobre los
efectos del tratamiento, es el de limitar atencin a los casos en que es
razonable suponer que la seleccin es slo de observables.
16,12 . Notas bibliogrficas
La literatura sobre los modelos de muestras seleccionadas es enorme. Libro
los tratamientos son proporcionados por Maddala (1983) y Gourieroux
(2000), y resmenes cortos son proporcionados por Amemiya (1984, 1985)
y Greene (2003).
Tobit 16,3 (1958) propuso y aplic el modelo tobit de datos relativos a los
gastos realizados. Amemiya (1973) estableci formalmente su consistencia
y normalidad asinttica. Heckman (1974) es una excelente aplicacin oferta
de mano de obra femenina con un anlisis detallado de los resultados.
16.4 Los numerosos estudios de la Rand Health Insurance Experimant, como
el de Duan et al. (1983), son las principales aplicaciones de las dos partes
de modelo.
16,5 Heckman (1976, 1979) present a las dos etapas de la calculadora
muestra dos variables- visionales que modelo es tambin la base para
muchos ms recientes procedimientos de estimacin semiparamtrico. Mroz
(1987) es una excelente aplicacin de oferta de mano de obra femenina que
hace hincapi en el papel de los supuestos sobre los salarios exogeneidad.
16.7 Hay muchas variantes en las ideas de Roy (1951), al igual que hay
muchas variantes del modelo tobit. L-F. Lee (1978) proporciona una buena
aplicacin anticipada a la unin de pseudoartrosis diferencial salarial.

16.8 El trabajo de presidente Dubin y McFadden (1984) es un destacado


ejemplo de micre estructurales- conometric anlisis basado en las
especificaciones completas de funcin de utilidad y distribu- cin de
aspectos.
16.9 Concentrar binario estimacin de modelos de seleccin se presenta en
detalle en los libros de M-J. Lee (1996), Horowitz (1997), y Pagano y Ullah
(1999) y en los estudios por
569

MODELOS TOBIT Y SELECCIN


Vella (1998) y L-F. Lee (2001). Chay y Honor (1998) y "Chay y Powell
(2001) proporcionan aplicaciones para modelos censurados y Melenberg y
Van Soest (1996) adems dos variables estimacin modelos seleccin de la
muestra.
Ejercicios
16-1 Esta cuestin considera el impacto de los diferentes grados de
truncado en el modelo tobit.
* (A) generar 200 saca de una variable latente y = k + 3x + u, donde u N
[0, 3] y el regresor x uniforme[0, 1]. Elegir k tal que se genere ap* duracin aproximada 30% de y a ser negativo.
(B) generar una censura o trunca submuestra, excluyendo las observaciones
* que corresponden a y < 0.
(C) calcular el modelo usando todos 2.000 observaciones, como si la
variable latente se observan, en el Sudn. Evaluar los resultados a la luz de
las propiedades tericas de la operacin, teniendo en cuenta que slo se
dispone de una rplica.
(D) mediante la submuestra de truncado y> 0 slo, estimamos el modelo
por MCO.
(E) utilizar la opcin mxima verosimilitud truncada la estimacin de
parmetros utilizando todas las observaciones. Evaluar los resultados a la
luz de las propiedades de la MLE truncada. Comparar con el de los mnimos
cuadrados los resultados de las dos anteriores partes.

(F) Repita todos los pasos anteriores utilizando un valor de k, para generar
20, 40 y 50% observaciones censuradas. Compare sus resultados con los
que se basan en observaciones 30% censuradas. Por lo tanto, sugerir lo que
es la consecuencia de las estimaciones de los parmetros de los niveles
ms altos de censura. Reforzar su- plejos utilizando teora en la medida de
lo posible.
16-2 considerar una variable latente modelada por N 2 [0, ]. Supplantean yi = *
* * yi si yi < Iu y es una constante conocida para cada uno de ellos en- YI
Ui , donde el lmite superior
individua de iu (es decir, datos) y puede ser diferente en las personas.
yi
Ui si
yi = xi +i withi
est censurada desde arriba, de forma que podemos observar yi =
(a) registro de probabilidad funcin para este modelo. [Nota: Tenga en
cuenta que esto es diferente de la habitual tanto debido a la presencia de la
interfaz de usuario y porque la misma se invirti con yi = (b)
* * yi si yi < Ui .] Obtener la expresin de la media truncada E[yi|xi, yi <
Ui ]. [Pista: Para z N [0, 1], tenemos E[z|z> c] = (c) / [1 - (c) ].
Adems, E[z|z < c] = -E[ -z|- z> -c] y -z N [0, 1] .] (c) Por lo tanto dar
de Heckman de dos paso estimador para este modelo.
(D) obtener la expresin de la censura significa E[yi|xi ]. [Pista: Una parte
esencial es la respuesta de la parte (b) .]
16-3 Esta cuestin considera las consecuencias de especificaci en el
modelo tobit. El punto de partida es el modelo de ejercicio 16.1 .
* (A) Generar y con heteroscedasticidad dejando que u N 2 [0, z], donde
z> 0 es elegido para ser el apropiado de un valor variable que se
correlaciona con la x, aunque no perfectamente. Otra vez k para obtener el
30% de observaciones censuradas. La MLE para uso normal censura para
estimar este modelo y comparar sus resultados con los correspondientes
homocedsticas utilizndose caso.
570

16,12 . NOTAS BIBLIOGRFICAS


(b) tener en cuenta las consecuencias de no-normalidad en la muestra.
Utilizar la simulacin macro disponibles en algunos paquetes para llevar a
cabo un Monte Carlo evaluacin, basada en una muestra de 1.000
observaciones y 500 repeticiones. Repiti en cada uno de- generar una
muestra de observaciones censuradas, que los errores son extradas de una
mezcla de dos normales: N [1, 9] o N [0.4 , 1]- habilidades 0.4 y 0.6 ,
respectivamente. Estimar el modelo usando los censurados Tobit MLE y
compare los resultados con el caso normal. Llevar a cabo un anlisis de la
salida de Monte Carlo los dos estimadores. Extraer conclusiones sobre el
impacto de no-normalidad en la distribucin del estimador.
* * * 16-4 considerar un modelo de regresin de Poisson donde y tiene
densidad f (y ) =
y * -e /y !, i . Porque de bacalao- YI = 0, 1, 2,... ,y que tenemos
independencia de
* * * ing error slo observar completamente y cuando y 2. Cuando y = 0 o
1 slo nos ob* * servir que y 1. Supongo que es codificada como y = 1. Definir los
datos observados
* * * y = y para yi 2 y y = 1 foryi = 0 o 1.
(A) obtener la densidad f (y) de la que se observa a.
(B) Obtener E[y]. [Hay algunos lgebra aqu.]
* Ahora los regresores con E[y |x] = exp(x ) y definir el indicador
* * variable d = 1 2 y ambientarse para su d = 0 ambientarse para su = 0
o 1.
(C) Dar la frmula exacta para este ejemplo de la funcin objetiva de un estimator que ofrezca un estimador de utilizando datos sobre yi , di , y xi.
(D) Dar la frmula exacta para este ejemplo de la funcin objetiva de un estimator que proporciona un estimador consistente de utilizando datos de
slo di y xi.
(E) es posible estimar utilizando sistemticamente datos sobre tan solo di
y xi ? Explique su respuesta.
16-5, usando un 50% de la submuestra aleatoria RAND datos sobre los
gastos mdicos durante un perodo de 12 meses utilizada en este captulo, y
la utilizacin de una especificacin de los modelos similares, queremos

considerar la siguiente pregunta: Qu modelo es el adecuado para modelar


los datos sobre los gastos?
(A) con el resumen de datos de los gastos variables, analizar las
implicaciones de la alta proporcin de gasto cero. Esto es una violacin de la
suposicin de normalidad? Hay una transformacin de los gastos que la
hiptesis de normalidad ms apropiado?
(B) tres modelos son considerados candidatos, cada uno con el mismo
conjunto de covari- ates. Estos datos son los mismos que en los datos
Ejercicio 20.6 . Los modelos son: (i) el modelo tobit, (ii) las dos partes
( "obstculo") modelo (TPM), y (iii) el modelo de seleccin. Explicar cmo
cada una de estas se establecer la relacin y las conexiones entre ellos, y
cmo se puede comparar y elegir entre ellos. Si que se pueden encontrar en
cualquier punto especfico- problemas o estimacin, estado y sugerir cmo
puede manejar. Prestar atencin a la eleccin de exclusin las restricciones.
(C) Estimacin a su vez el modelo tobit, el TPM y la seleccin modelos. Para
el TPM tiene dos ecuaciones, y el segundo es para aquellos que tienen
nicamente los gastos positivos. En el caso del modelo de seleccin, utilice
los MLE y en dos etapas (Heckman) estimadores. Discutir las razones
subyacentes

SELECCIN 571 MODELOS TOBIT Y


la exclusin restriccin requerida para la estimacin del modelo de
seleccin. Hay evidencia de que el problema de seleccin es un problema
grave?
(D) Cmo podemos comparar la estadstica de los tres modelos? Lo que
aparece un modelo para proporcionar el mejor ajuste a los datos? Por qu
criterio?
(E) supongamos que nuestro inters principal es el impacto de dos variables
sobre los gastos, ingresos, registro y registro de (1 + coaseguro). Utilizar los
resultados de la esti- mado modelo tobit y TPM para hacer una comparacin
entre los efectos marginales de un cambio en estas variables sobre los
gastos. Habida cuenta de que existe una gran heterogeneidad en la
muestra, indican la forma de presentar los resultados de su anlisis en el
ms informativo.

(F) explicar brevemente cmo regresin (vase la seccin 4.6 ) proporciona


un alter- mtodo nativo de analizar los mismos datos. Cules son las
principales ventajas y desventajas de este mtodo en la actual situacin de
los datos?
572

También podría gustarte