Está en la página 1de 26
Introduccién a la econometria Un enfoque moderno Gite Jeffrey M. Wooldridge ‘Michigan State University 4a. edicién Traduccion a. del. no) 3 CENGAGE ‘s+ Learning: CAPITULO | 7 Modelos de variable dependiente limitada y correcciones a la selecci6n muestral ccacién del modelo de regresién mditiple a una variable dependiente binaria. Una variable ‘dependiente binaria es un ejemplo de una variable dependiente limitada (VDL). Una VDL se define en sentido amplio como una variable dependiente cuyo rango de valores est es- ‘wingido de forma importante. Una variable binaria asume s6lo0 dos valores, el cero y el uno. Se han analizado otros varios ejemplos de variables dependientes limitadas: el porcentaje de par- ticipacién en un plan de pensiones est entre 0 y 100, el ntimero de veces que un individuo es arrestado en un aifo determinado es un entero no negativo, y el promedio de calificaciones uni- versitarias es de entre Oy 4.0 en la mayoria de las universidades estadounidenses En cierto sentido, la mayorfa de las variables econémicas que se desea explicar son Timita- ‘das, debido a que con frecuencia deben ser positivas. Por ejemplo, el salario por hora, el pre- cio de la vivienda y las tasas de interés nominales deben ser mayores que cero. Pero no todas ‘estas variables requieren un tratamiento especial. Si una variable estrictamente positiva asume ‘muchos valores diferentes, en raras ocasiones ser necesario un modelo econométrico especi Cuando y es discreta y asume un pequeito ndimero de valores, no tiene sentido tratarla como una variable aproximadamente continua. Por si misma, Ia diserecionalidad de y no significa que los ‘modelos lineales sean inapropiados. No obstante, como se vio en el capitulo 7 para la respuesta binaria,el modelo de probabilidad lineal tiene ciertas desventajas. En la seccién 17.1, se analizan los modelos logit y probit, que superan las desventajas del MPL; la desventaja es que son mis, Aificles de interpreta, En el andlisis econométrico surgen otros tipos de variables dependientes limitadas, en espe- cial cuando se est modelando el comportamiento de individuos, familias o empresas. El com- portamiento optimizador suele provocar una respuesta de solucién de esquina para una fraccién ‘no trivial de la poblacin, Es decir, lo mejores clegir una cantidad o valor en délares igual acero, por ejemplo, En un aifo cualquiera, un niimero significativo de familias hard cero contribuciones {de caridad, Por tanto, las contribuciones caritativas familiares anuales tienen una distribucién poblacional dispersa entre el gran rango de valores positivos, pero con una acumulacién en el valor cero. Aunque un modelo lineal podria ser adecuado para capturar el valor esperado de las contribuciones de caridad, es probable que un modelo lineal lleve a predicciones negativas para algunas familias. Obtener el logaritmo natural no es posible debido a que muchas observaciones. son de cero. El modelo Tobit, que se abordard en la seccién 17.2, est disefiado explicitamente para modelar las variables dependientes con solucién de esquina. Otro tipo importante de VDL es una variable de conteo, que asume valores enteros no nnegativos, La secci6n 17.3 ilustra por qué los modelos de regresién Poisson son adecuados para ‘modelar variables de conteo. F: el capitulo 7 se estudi6 ef modelo de probabilidad lineal, el cual simplemente es una apli- 57a Capitulo 17 Modelos de variable dependiente imitaday corrcciones a la seleccién muestal En algunos casos, se observan variables dependientes limitadas debido a Ia censura de datos, tun tema que se presenta en la secci6n 17.4, El problema general de la seleccién muestral, donde se observa una muestra no aleatoria de 1a poblacién subyacente, se analiza en la seccién 17.5, ‘Los modelos de variable dependiente limitada se pueden usar para series de tiempo y datos de panel, pero suelen aplicarse alos datos de corte transversal. Los problemas de seleccién muestral suelen estar confinados a Tos datos de corte transversal o de panel. Este capitulo se centraré en las aplicaciones de corte transversal. En Wooldridge (2002) se presentan estos problemas en el ccontexto de modelos de datos de panel y offece mayores detalles para las aplicaciones de corte transversal y de datos de panel 17.1 Modelos logit y probit para respuesta binaria Estimar y utilizar el modelo de probabilidad lineal es simple, pero tiene algunas desventajas que se analizaron en la seccién 7.5. Las dos desventajas més importantes son que las probabilidades ajustadas pueden ser menores que cero 0 mayores que uno y el efecto parcial de cualquier varia- ble explicativa (si aparece en la ecuaci6n en su nivel) ¢s constante. Estas Timitaciones del MPL pueden superarse si se usan modelos de respuesta binaria mis sofisticados, En un modelo de respuesta binaria, el interés yace principalmente en la probabilidad de respuesta P= Is) = PO = Hay ays 8s 7A donde x denota el conjunto total de variables explicativas, Por ejemplo, cuando y es un indicador del empleo, x podria contener varias caracteristicas individuales como la educacién, edad, estado civil y otros factores que afectan el estado del empleo, incluida una variable de indicador binario para la participacién en un reciente programa de empleo. Especificacién de modelos logit y probit En el MPL, se supone que la probablidad de respuesta es lineal en un conjunto de parémetros, £; vea la ecuaciGn (7.27) Para evitar las limitaciones del MPL. considere una clase de modelos de respuesta binaria de la forma PQ = IIx) = GB, + Bx, +--+ BX) = GB, + xB), 1 donde G es una funcién que asume valores estrictamente entre cero y uno: 0 < G(z) <1, para todos los mimeros reales z. Esto asegura que las probablidades de respuesta estimada sean estrictamente entre cero y uno. Como en los primeros capitulos, se escribe xB = Bx, +... + Bete Se han sugerido varias funciones no lineales para la funcidn G afin de asegurar que las pro- babilidades estén entre cero y uno. Las dos que se estudiardn aqui se usan en la mayorta de las aplicaciones junto con el MPL). En el modelo logit, G es la funcién logistica: GQ) = expleV/ll + exp@l = AC), 173 575 516 Parte 3 Temas avanzados ‘que est entre cero y uno para todos los nimeros reales z, Esta es la funcién de distibucién acumu- Jada (Fda) para una variable aleatoria log{stica estindar. En el modelo probit, Ges la funcidn de distribucién acumulada normal estindar, que se expresa como una integral; Ge) = 0) = f sonar, iT donde (2) es la densidad normal estindar $@) = Qn) exp(—-2/2). 175 Esta eleccidn de G nuevamente asegura que (17.2) est estrictamente entre cero y tno para todos: los valores de los pardmetros y las x, Las funciones G en (17.3) y (17.4) son funciones crecientes, Cada una aumenta con més ‘apidez en z = 0, G(z) > 0.a medida que 2 -> ~~, y G(z) -> 1a medida que ze. La funcién logistica esta graficada en la figura 17.1. La fda normal estindar tiene wna forma muy similar a lade la fda logistica, Los modelos logit y probit pueden derivarse a partir de un modelo de variable latente sub- yacente, Sea yuna variable inobservable, 0 Jatente, determinada por Y=B, + xB +e y= Ib*>O), 176 donde se introduce la notacién 1{-] para definir un resultado binario. La funcién 1[-] recibe el nombre de funcién de indicador, que asume el valor de uno si el evento dentro de los corchetes ces verdadero y de cero si no lo es. Por tanto, yes uno si y* > Oy y es cero si y* = 0. Se supone Grafica de la funci6n logistica Giz) = exp(2i/It + expla. plat + expel 1 Capitulo 17 Modelos de variable dependient limitada y cortecciones a la seleccién muestra que € es independiente de x y que ¢ tiene la distribuci6n logistica estindar o a distribucién nor- ‘mal estindar. En cualquier caso, e se distribuye simétricamente en tomno a cero, lo cual significa {que 1 ~ G(—2) = G(2) para todos los mimeros reales z. Los economistas tienden a favorecer el supuesto de normalidad para e, lo cual es la raz6n por Ia que en econometria el modelo probit es més popular que el logit. Ademés, varios problemas de especificacin, que se tratarén después, se analizan fécilmente mediante probit debido a las propiedades de la distribucién normal AA partir de (17.6) y de los supuestos establecidos, se puede calcular Ia probabilidad de res- puesta para y: Poy = Ix) = Po* > Ox) = Ple > ~(B, + xB)x] ~ G[-B, + xB)) = GB, + xB), To cual es exactamente to mismo que (17.2). En la mayoria de las aplicaciones de los modelos de respuesta binara, la meta principales explicar los efectos de asx, sobre la probabilidad de respuesta P(y = tx). La formulacién de la variable latente tiende a dar la impresiGn de que lo que principalmenteinteresa son los efectos de cada x, sobre °. Como se vers, para logit y probit, la direccidn de efecto de x, sobre E(y*|x) = By xB y sobre E(x) = P= Ils) = G(B, + xB) es siempre la misma, Pero la variable ltente 1 rara vez tiene una unidad de medicién bien definida, (Por ejemplo, y* puede ser la diferencia en niveles de utilidad de dos acciones diferentes.) Por tanto, las magnitudes de cada f, no son, por s{ mismas, especialmente tiles (en contraste con el modelo de probabilidad linea). Para la ™mayorfa de los prop6stos, se quiere estimar el efecto de x, sobre la probabilidad de éxito PCy = I[s), pero esto se compliea por la naturaleza no lineal de G() Para halla el efecto parcial de las variables aproximadamente continuss sobre la probabi- lidad de respuesta, es necesariorecurrir al efleulo Six, es una variable aproximadamente con tinua, su efecto parcial sobre p(x) = PCY = IIx) se obtiene de la derivada parcial = 8B, + x68, donde g(o) = “Eee, 177 Debido a que G es la fia de una variable aleatoria continua, g es una funcién de densidad de probabilidad. En los casos logit y probit, G(-) es una fda estrictamente creciente y, por tanto (2) > 0 para toda z. Por consiguiente, el efecto parcial dex, sobre p(x) depende de x a través de la cantidad positiva g(B, + xB), lo cual significa que el efecto parcial siempre tiene el mismo signo que B, La ecuacisn (17.7) muestra que los efectos relrivos de cuslesquiera dos variables explicai- ‘as continuas no dependen de x: la razén de los efecios parciales dex, x, es B, En el caso tipico de que g sea una densidad simétrica en torn de cero, con una Giea moda eh cero, el mayor efecto ocurre cuando B, + xB = 0. Por ejemplo, en el caso probit con az) = 642). @(0) = 4(0) = Zar ~ AO. En el caso logit, g(z) = exp(cV/[1 + exp(e)’ y por tanto g(0) = .25. Si, por ejemplo, x, ¢s una variable explicativa binaria, entonces el efecto parcial de cambiar x de cero a uno, manteniendo todas las demas variables fija, simplemente es GB, +B, + Bos, + + Bat) ~ GIB, Ba + Ba). [AB De nuevo, esto depende de todos los valores de las otras x Por ejemplo, si yes un indicador de empleo y x, ¢s una variable binaria que indica la participacién en un programa de capacitacién laboral, entonces (17.8) es el cambio en la probabilidad de] empleo debido a este programa de capacitacién; esto depende de las demés caracteristicas que afectan Ia posibilidad de obtener el sr” 578 Parte 3 Temas avanzados ‘empleo, como la educacin y Ia experiencia. Observe que saber el signo de , es suficiente para ddeterminar si el programa tuvo un efecto positivo o negativo. Pero para hallar la magnitua del ‘efecto, se tiene que estimar Ia cantidad en (17.8). ‘También se puede usar la diferencia en (17.8) para otros tipos de variables discretas (como «el niimero de nilios). Si x, denota esta variable, el efecto sobre la probabilidad de que x, cambie dec, a, + Les simplemente GIB, + Bx, + Bx, +... + Ble, + DI — GB, + Bx, + Bx, +... + Bye,). 179 Es muy fécil incluir las formas funcionales usuales de las variables explicativas. Por ejemplo, en el modelo Ply = In) = GIB, + Bz, + Ba + B,logte,) + Bz) el efecto parcial de z, sobre P(y = I[z) es AP(y = llzV@z, = «(B, + xB)(B, + 28.2, y el efecto parcial dec, sobre In probabilidad de respuesta es OP(y = tleVdz, = a(B, + XBNPJz,), donde XB = Bz, + BA + Blogz) + Bz, Por tanto, (8, + xB\(B,/100) es el cambio aproximado en a probabilidad de respuesta cuando z, aumenta 1% Algunas veces se quiere calcula la elasicidad de la probabilidad de respuesta respecto a una variable explicativa, aunque se deben interpretar de manera cuidadosa los cambios porcen- tuales en ls probabilidades. Por ejemplo, un cambio en una probabilidad de 04 a.06 representa un incremento de 2 puntos porcentuales en la probabilidad, pero un incremento de 50% relativo al valor inicial. Mediante el célculo, en el modelo anterior se puede mostrar que Ia elasticidad de PCy = 2) respecto a z, es Bils(B, + xBYGIB, + xB). La elasticidad respecto a z, €s (B2,)Is(B, + XBYG(B, + xB)). Enel primer caso la elaticidad siempre es del mismo signo que B,, pero por lo general depende de todos los parmetos y todos los valores de las variables expli- cativas, Siz, > 0, la segunda elasicidad siempre tiene el mismo signo que el parimetio B,. Los modelos con interacciones entre las variables explicativas pueden ser un tanto delicados, pero se deben calcular las derivadas parciales y después evaluar los efectos parciales resultantes en valores interesantes. Cuando se miden los efectos de las variables discreta, sin importar qué tan complicado sea el modelo, se debe usar (17.9. Se analzaré esto con mayor profundidad en la subsecciGn sobre interpretaciGn de las etimaciones de la pigina 80. Estimaci6n de maxima verosimilitud de los modelos logit y probit iCémo se deben estimar los modelos no lineales de respuesta binria? Para estimar os MPL, se pueden usar misimos cuadrados ordinarios (ve la seccién 7.5) 0 en algunos casos, miimos cuadrados ponderados (ves la seein 85), Debido ala aturaleza no lineal de E(x), MCO y MCP no son aplicabes. Se podrian usar las versiones no lineales de estos métodos, ero no es ns dificil usar la estimacién de méxima verosimilitud (EMV) (vea el aénice 17 para un breve andlisis). Hasta ahora se hateido poca necesidad de la EMV, aunque sf se establecié que, bajo los supuestos del modelo lineal cisco, el esimador de MCO es el estimador de maxima ‘erosimiliud (condicional en las variables explicativas),Paa estima los models de variables ependientes imitadas, los métodos de maxima verosimilited son indispensable. Como la est- mmacin de méxima verosmiltud ests basada en la dstibuisn de y dada x, la heterocedastcidad ‘en Var(y|x) automaticamente se toma en cuenta. ‘Capitulo 17 Modelos de variable dependiente limitada y corecciones ala seleccién muestal ‘Suponga que se tiene una muestra aleatoria de tamafio n, Para obtener el estimador de méxi- ‘ma verosimilitud, condicional sobre las variables explicativas, se necesita la densidad de y, dada x, Esto se puede escribir como FOW;B) = [G%BIPU — G“B)I™, y = 0.1, 17.10 donde, por simplicidad, se absorbe el intercepto en el vector x, Se puede ver con facilidad que ‘cuando y = 1, se obtiene G(x,B) y cuando y = 0, se obtiene 1 — G(x,B).La funcién de log-vero- similitud para la observacicn ies una funcién de los pardmettosy los datos (x, ,,y se obtiene al aplicar el log a la ecuaci6n (17.10): £(B) = y,loglG(x,B)] + (1 ~ y)logl! ~ Gtx) ran Debido a que G(-)estéestrictamente entre cero y uno para logit y probit, €(B)esté bien definida para todos los valores de B. La log-verosimilitud para un tamafto de muestra de nse btiene al sumar (17.11) través de todas las observaciones: £(B) = 3°", €(B). La EMV de B, denotada como B, maximiza esta Jog-verosimilitud, Si G(-) es la fda logit esténdar, entonces B es el estimador logit; si G(-) es la fda normal estandar, entonces Bes el estimador probit Debido ala nateraleza no lineal del problema de maximizacin, no se pueden escribir férm- Jas para las estimaciones de méxima verosimilitud logit o probit, Adem de los problemas computacionales, eto hace que Ia teorfa estaditica para logit y probit sea mucho més dificil {que MCO o incluso que MC2E. Sin embargo, la eoria general de EMV para muestrasaleatorias implica que, bajo condiciones muy generals, la EMY es consstente,asintéticamente normal y asintticamente eficiente. [Vea Wooldridge (2002, capitulo 13) para un andliss general] Aqut sélo se usarin los resultados; apicar los modelos logit y probit es muy féeil, siempre y cuando se comprenda lo que significan los estadisticos. Cada viene con un error estinda asinttico), uy fOrmula es complica y se presenta cn el apéndice del capitulo, Una vez que se tengan los erores estindar,y que ésos © repor- ten junto con ls estimaciones de los coeficientes mediante cualquier paquete que soporte logit ¥ probit, seré posible construirprucbas¢eintervalos de confinza (asinttico), al como con en MCO, MC2E y otros estimadores. En particular, para probar H,: B, = 0, se forma el estadstico {= fect) y srealiza la prucba en la forma usa una Ver que se ha deiddo una alternatva de una 0 dos cola. Prueba de hipstesis multiples ‘También es posible probar restrieciones miltiples en los modelos probit y logit. En la mayoria de los casos, se trata de pruebas de restricciones de exclusién miiiple, como en la seccién 4.5. Esta seccién se enfocaré en las resricciones de exclusion. Existen tres formas de probar las restricciones de exclusién para modelos logit y probit EI multiplicedor de Lagrange o el estadistico de puntuacién sélo requieren estimar el modelo bajo la hipétesis mula, tal como en el caso lineal de la seccién 5.2; aqui no se abordaré el esta- distico de puntuacién, dado que rara ver. se necesita probar las restricciones de exclusi6n. [Vea ‘Wooldridge (2002, capitulo 15) para otros usos de la prucba de puntuacién en los modelos de respuesta binaria] La prueba de Wald requiere la estimacién s6lo del modelo no restringido. En el caso del ‘modelo lineal, el estadistico de Wald, después de una simple transformacidn, es esencialmente el estadistco F, asf que no hay necesidad de abordar el estaistico de Wald por separado. La 519 580 Parte 3. Temas avanzados {érmula para el estadistico de Wald se da en Wooldridge (2002, capitulo 15). Los paquetes econométricos que permiten que las restricciones de exclusién se prueben después de que se ha estimado el modelo no restringido pueden calcular este estadistico, Este tiene una distribucién Ji-cuadrada asintética, con g/ igual al nimero de restricciones que se estin probando. tanto el modelo restringido como el no restringido son ficiles de estimar, como suele ser el caso con las restrcciones de exclusisn, entonces la prueba de la razén de verosimiliaules (RV) se vuelve muy atractiva. La prueba RV estd basada en el mismo concepto que la prueba F en un ‘modelo lineal. La prueba F mide el incremento en Ta suma de los residuales cuadrados cuando as variables se desechan del modelo. La prueba RV est basada en la diferencia en las funcio- ‘nes de log-verosimilitud para los modelos restringido y no restringido, La idea es la siguiente. Dado que la EMV maximiza la funcién de log-verosimilitud, omitir variables por lo general ocasiona una log-verosimilitud menor, 0 al menos no mayor, (Esto es similar al hecho de que la R-cuadrada nunca aumenta cuando las variables se omiten de una regresién.) La cuestiOn es si Ja disminucién de la log-verosimilitud es lo bastante grande para coneluir que las variables omi- tidas son importantes. Se puede tomar esta decisién una vez. que se tiene un estadistico de prueba yun conjunto de valores criticos. El estadistico de razén de verosimilitudes es dos veces la diferencia en las log-verosimi litudes: 172 donde SF, es el valor de ta log-verosimilitud para el modelo no restringido y &, es el valor de 4a log-verosimilitud para ef modelo restringido, Debido a que ,, =, RV es no negativa y suele ser estrictamente positiva. Al calcular el estadistico RV para modelos de respuesta binaria, es importante saber que la funcién de log-verosimilitud siempre es un niimero negativo. Esto se desprende de la ecuacién (17.11), debido a que y, es cero 0 uno, y ambas variables dentro de Ja funcién log estn estrictamente entre cero y uno, lo cual significa que sus logaritmos natu- rales son negativos. Que las funciones de log- verosimilitud sean ambas negativas no cambia la forma en que se calcula el estadistico RV; tan s6lo se preservan los signos negativos en 1a ecuacién (17.12) Pregunta (7.f 'Un modelo probit para explcar si una empresa es absorbida por ‘otra durante un afo determinado es Pltakeover = Ix) = 4B, + B,aveorof + Bimktval + Bydebteam + B,ceoten + Byceosal + Biceoage), onde takeover es una variable de respuesta binaria, augorof es #1 margen de utlidades promedio en los afios previos, mktval es el valor de mercado de la. empresa, debtearn es la razén deuda 3 ingresos y ceoten,ceasaly ceaage sonla antiguedad, suelda anual yeedad del director genera, respectivamente, stablezc ls hipote- Ss nula de que, manteniendo todos los demas factores igual, las variables del director general no tienen efecto sabre la probabil dad de absorcion. {Cudntos a! hay en la dstrbucion j-cuadrada para la prueba RVo la prueba de Wald? La multiplieacién por dos en (17.12) es necesaria de manera que RV tenga una distri- bucién ji-cuadrada aproximada bajo H,. Si se estén probando q restricciones de exclusién, RV + x2. Esto significa que, para probar H, al nivel ‘de 5%, se usa como valor eritica el percentil 95 en la distribucién 2, Calcular los valores-p es fcil con la mayoria de los paque- les de software. Interpretacién de las estimaciones logit y probit ‘Dadas las computadoras modernas, desde una perspectiva prictica el aspecto més dificil de los ‘modelos logit y probit es presentare interpretar los resultados. Las estimaciones de coeficientes, sus errores estindar y el valor de la funciéa de log-verosimilitud se pueden obtener mediante {odos los paquetes de software que realicen logit y probit, y se deben reportar en cualquier apli- «avin. Los coeficientes dan los signos de los efectos parcales de cada x, sobre la probabilidad Capitulo 17. Modelos de variable dependiene limitada y cortecciones a la seleccién muestal de respuesta y la significancia estadistica de x, esté determinada por B, = 0 a.un nivel de significancia suficientemente pequefio. Como se analiz6 brevemente en la seccién 7.5 para el modelo de probabilidad lineal, se puede calcular una medida de la bondad de ajuste llamada poreentaje correctamente predi- ‘cho, Como antes, se define un predictor binario de y, como uno sila probabilidad predicha es de al menos 5, y cero en caso contratio, En términos matemiticos, j, = 1 si G@, + xB) = 5 y 5, = 08i GB, + xB) < 5. Dada {j,:i = 1, 2, ... n), se puede ver qué tan bien predice Fay, a través de todas las observaciones. Hay cuatro resultados posibles en cada par, (5); euando ‘ambos son cero © ambos son uno, se hace la prediccién correcta. En los dos casos en que un componente del par es cero y el otro es uno, la predicciGn es incorrecta. El porcentaje predi- cho comectamente es el porcentaje de veces en que Aunque 1 porcentaje predicho correctamente es stil,como una medida de Ia bondad de ajuste, puede ser confuso. En particular, es posible obtener porcentajes muy altos predichos con precisin aun cuando el resultado menos probable esté predicho de manera muy deficiente. Por ejemplo, suponga que n = 200, 160 observaciones tienen y, = 0, y de estas 160 observaciones, 140 de las 5, son tambign cero (asf que se predice correctamente 87.5% de los resultados cero). ‘Aunque ninguna de las predicciones sea correcta cuando y, = 1, atin se predicen con precisién 70% de todos los resultados (140/200 = .70). Con frecuencia, se espera tener alguna capaci- dad de predecir el resultado menos probable (por ejemplo, si alguien es arestado por cometer un delito) y asf se debe ser transparente acerca de qué tan bien se predice cada resultado. Por tan- to, es logico también calcular el porcentaje predicho correctamente para cada uno de los resul- tados. El problema 17.1 le pide que demuestre que el porcentaje general predicho correctamente 8 un promedio ponderado de G, (el porcentaje predicho para y, = 0) y, (el porcentaje predicho 1), donde las ponderaciones son las proporcionés de ceros y de unos en la muestra, respectivamente ‘Allgunos han crticado la regla de prediccin que se acabe de describir por usar un valor umbral de .5, en especial cuando uno de Ios resultados es improbable, Por ejemplo, si =.08, (6610 8% de “Exitos” en la muestra) podria ser que nunca se prediga y, = 1 debido a que Ia probabilidad estimada de éxito nunca es mayor que .5. Una alternativa es usar Ia fraccién de xitos en la muestra como el umbral: .08 en el ejemplo anterior. En otras palabras, definir j= 1 cuando GQ, + xB) = 08 y cero de otra manera, Mediante esta regla seguramente se ineremen- ta el mimero de Exitos predichos, pero no sin costo: necesariamente se cometern més errores, uizé muchos més, en predecir ceros (“fallas”). En términos del porcentaje general predicho correctamente, el desempeiio puede ser peor que si se usara el umbral de 5. Una tercera posibilidad es elegirel umbral de tal manera que lafraccién de j, = 1 en la mues- tra sea la misma que (0 muy cercana a) J. En otras palabras, buscar a través de valores umbral 7, 0<1< I, tal que sise define j, = 1 cuando G@, + xf) =r, entonces S",5,~ 5", y, a prueba y error requeridos para encontrar el valor deseado de + puede ser tedioso pero es facti- ble. En algunos casos no serd posible hacer que el nimero de éxitos predicho sea exactamente €1 mismo que el nimero de éxitos en la muestra.) Ahora, dado este conjunto de jj, se puede calcular el porcentaje correctamente predicho para cada uno de los dos resultados asf como el porcentaje general predicho correctamente. Existen arias medidas de pseudo R-cundradas para la respuesta binaria, McFadden (1974) sugiere la medida 1 ~ Sf, /,, donde Sf,, es la funcin de log-verosimilitud para el modelo esti- ‘mado, y SE, es la funcién de probabilidad log en el modelo con sélo un intercepto. 0, Si, fuera cero, la pseudo R-cuadrada seria igual a la unidad, De hecho, 2, no puede llegar a cero en un modelo probit o logit, ya que esto requerrfa que ls probabitidades estimadas cuando y, = 1 fueran jguales a la unidad y que las probabilidades estimadas cuando 1, = 0 fueran todas iguales a cero, Las pseudo R-cuadradas altemnas para probity logit estén relacionadas més directamente con 1a R-cuadruda usual de la estimaci6n de MCO de un modelo de probabilidad lineal. Para probit 0 logit, sean f, = G(B, + xB) las probabilidades ajustadas, Dado que estas probabilidades también son estimaciones de E(x), se puede basar una R-cuadrada en qué tan cerca estén ls j, de las 4 Una posibilidad que se sugiere del andisis de regzesin estindar es ealculat la correlacign cuadrada entre y,y §,, Recuerde, en un marco de regresin lineal, esta es una forma algebraica equivalente de obtener a R-cuadrada usual; vea la ecuaci6n (3.29) Por tanto, se puede caleular una pseudo R-cuadrada para probit y logit que sea directamente comparable con la R-cuadtada usual a partir de la estimacién de un modelo de probabilidad lineal. En cualquier caso, 1a bon- dad de ajuste suele ser menos importante que intentar obtener estimaciones convincentes de los efectos ceteris paribus de las variables explicaivas Con frecuencia se desean estimar los efectos de las x, sobre las probabilidades de respuesta, PU = Ifs). Sis es (aproximadamente) continua, entonces APY = Is) ~ (9B, + xB Ax, 17.13 para cambios “pequeios” en x, ASf que, para Ax, = 1, el cambio en la probabilidad estimada de éxito es aproximadamente 6(8, + xB)B, En comparacién con el modelo de probabilidad lineal, el costo de usar los modelos probit y logit es que los efectos parcisles en In ecuacién (17.13) son mas dificiles de resumir debido a que el factor de escala, g(3, + xB), depende de Xx (es decir, de todas las variables expicativas) Una posibilidad es insertar valores interesantes para las x, —como las medias, las medianas, los minimos los méximos y los eustles superio- res e infetiores— y ver cémo eambia g(@, + x). Aunque atractvo, ste puede ser un proceso tedioso y dar como resuitado demasiada informacién aun si el nimero de variables explicatvas es moderado. Como resumen répido para obtener las magnitudes de los efectos parciles, e til tener un factor escalartnio que se pueda usar para multiplica cada, (0 al menos aquellos coofcientes, de variables aproximadamente continuas). Un método que stele usrse en los paquetes econo meétrcos que esiman de forma rutinaria los modelos probity logit, es remplazar cada variable expliativa con su promedio muestra. En otras palabras, el factor de ajuste es 38, + 3B) = a8, +8, +85, + +B.) ina ‘donde g() es la densidad normal estindar en el caso probit g(2) = exp( Y/LI + exp(2)F en el caso logit. La idea en que se basa (17.14) es que cuando ésta se multiplica por se obtiene el efecto parcial dex, para la persona “promedio” en la muestra. Por tanto, si se multplica un coeficiente por (17.14), por lo general se obtcne cl efecto parcial en el promedio (EPeP). Existen al menos dos posibles problemas con el uso de los EPeP para resumir los efectos parciales de las variables explicaivas. Primero, si algunas de las variables explicaivas son Aiseretas, sus promedios no representan a nadie en la muestra (0 poblacin, en tal caso). Por jemplo, six, = mujeres y 47.5% de la muestra son mujeres, :qué sentido tiene insertar 5, = 47S para representar a la persona “promedio"? Segundo, si una variable expicatva continua aparece como una funcién no fineal, por ejemplo, como un log natural oen una cundrdtca, no Capitulo 17 Modelos de variable dependientelmitada y corecciones a la selecckin muestra claro si se quiere promesdar la funcién no lineal insertar el promedi en la funcién no linea Por ejemplo ;Se debe usar log(sales) 0 log(sals) para epresentar el tamatio promedio de una empresa? Los paquetes economéiticos que caleulan el factor escalar en (17.14) se quedan en el primero: el paquete esté programado para calcular los promedios de los regresores incluidos en Ja estimacn probit o logit. ‘Un método diferente para calcular un factor escalar elude lacuestin de qué valores insertar para las variables explicativas. En lugar de ello, el segundo factor escalar resulta al prome- dir los efectos parciales individuaes a raves de la muestra, lo que gener el algunas veces llama- do efecto parcial promedio (EPP). Para una variable explicativa continua x, el efecto parcial promedio es nD. Ie(B, + AB) = [wD e@, + xB)] A, Bl termino que multiplica a 8 acta como un factor escalar: Ded, + xf) . 17.15 La ecuaciGn (17.15) se calcula fécilmente después de ta estimacién probit logit, don |, + xB) = #3, + xB) enel caso probit y @(, + xf) = exp, + xAV/{1 + exp, + xA)F en el caso logit. Los dos factores escalares differen, y posiblemente son muy diferentes, debido ‘aque en (17.15) se usa el promedio de la funcién no lineal en lugar de la funcién no lineal en el promedio [como en (17.14)] Debido a que los dos factores escalares que se acaban de describir dependen de la aproxima- cin de eéteulo en (17-13), ninguna es logica para las variables explicativas diseretas. En lugar de esto, ¢s mejor usar la ecuacién (17.9) para estimar directamente el cambio en la probabilidad, Para un cambio en x, de ¢, a ¢, + 1, el andlogo discreto del efecto parcial basado en (17.14) es, GIB, + BS, + = + B+ Ble, + DL ~ GB, + BR + + BA, + Bes 116 donde G es ia fa normal esténdar en el caso probit y G(z) = exp(eV{1 + exp(2)] en el caso logit. {Para x, binaria, (17.16) suele calcularse mediante ciertos paquetes econométricos, como Stata®] El efecto parcial promedio, que suele ser mas comparable con las estimaciones del MPL, es MILIGB, + Baty + oe + Boots s + BGG, + DI GB, * Bits + * Becta * Bed) 17.17 Obtener Ia expresién (17.17) para probit o logit en realidad es muy féeil, Primero, para cada observacién, se estima la probabilidad de éxito para los dos valores elegidos de x, insertando los resultados reales para las demés variables explicativas. (Asi, se tendrfan n diferencias esti- ‘madas.) Después, se promedian las diferencias en las probabilidades estimadas através de todas las observaciones. La expresién en (17.17) tiene una interpretacién particularmente itil cuando x, es una varia- ble binaria, Para cada unidad i, se estima la diferencia predicha en Ia probabilidad de que y, = 1 cuando x, = 1y x, = 0, €s decir, GB. + Bay + + Buchs +BY ~ OB, + Bet, + + Bt? sea Parte 3. Temas avanzados Para cada i, esta diferencia es el efecto estimado de cambiar x, de cero a uno, ya sea que la ‘mnidad {tenga x, = 1 04, = 0, Por ejemplo, si y es un indicador del empleo (igual a uno si | persona se contrata) después de la participacién en un programa de capacitacién, indicado Por *, entonces se puede estimar Ia diferencia en las probabilidades de empleo para cada perso- tna en ambas situaciones. Este razonamiento contrafactual es silat al indicado en el eapttulo 16, el cual se us6 para motivar los modelos de ecuaciones simulténeas. El efecto estimado del programa de capacitacén labora sobre la probabilidad de empleo es el promedio de las diferen- cias estimadas en las probabilidades. En otro ejemplo, suponga que y indica si la solictud para hipoteca que hizo una famitia se aprueba y que x, es un indicador racial binario (por ejemplo, ‘igual a uno para no blancos). Entonces, para cada familia se puede estima la diferencia predicha en cuanto a que se aprusbe la solicitud de hipoteca en funcién del ingreso,riqueza,calificaciones ‘erediticis, etc, los cuales serfan Tos elementos de (3. ,) en 10s dos escenarios en que ¢l jefe de Familia sea no blanco frente a que sea blanco. Se espera que se hayan contemplado los suficientes factores de manera que el promedio de las diferencias en las probabilidades genere una estimacién convincente del efeto racial. En las aplicaciones donde se aplica probit, logit y el MPL, es I6gico calcula Ios Factores cscalaresanalizados antes para probity logit al hacer comparaciones de efectos parcales. Sin «embargo, algunas veces es necesaria una forma més ripida de comparar las magnitudes de las diferentes estimaciones. Como se mencioné antes, para probit g(0) ~ 4 y para logit, g(0) =.25 Por tanto, para hacer que las magnitudes de probity logit sean aproximadamente comparable, se pueden multplicar los coeficientes probit por 4.25 = 1.6, o se pueden multiplicar las esti- ‘maciones logit por 625, En el MPL, g(0) es efectivamente uno, asf que las estimaciones de la pengiente logit se pueden dividir entre cuatro para hacerlas comparables a as estimaciones del MPL; las estimaciones dela pendiente probit se pueden dividir ene 2.5, para hacerlas compara- bles con ls estimaciones MPL. Sin embargo, en la mayor‘a de los casos, se desean comparacio- nes ms precsas obtenidas mediante el uso de factoresesealares en (17.15) aa logit y probit aE 0 IParticipacién en la fuerza laboral de las mujeres casadas| Ahora se usar los datos en MROZ.RAW para estimar ef modelo de paticipacién labora de ejemplo 483 (ven umbign la secci6n 7.5) mediante logit y probit. También se reportan las estimaciones del mo- {elo de probabida lineal del ejemplo 88, mediante los eros esténdarrobusos la heterocedasticidad Los resultados con los errors estindar entre paréntesis, se dan en la tabla 17. Las estimaciones de los tres modelos revelan una historia consstene. Los signos de los coeicientes| Son los mismos entre todos los modelos y las mismas variables son estadisticamentesignfictivas en eada ‘modelo, La pseudo R-cuarad para el MPL es a R-cuadrada usual de MCO; para logit y probit la pseudo -cuadrada es a medida basada en las log-verosimlitudes descritas antes. Como ya se a enfatizato, as magnitudes de las estmaciones de los coefcientes a través de los moe los no son comparables directamente. En lugar de ello, se calculan Ios factoresescalares en as ecvaciones (17.14) y (17.18), Si 0 eval ia funcin de densidad de probabilidad normal estindar (2, + As, + Bist ... + Byi) en los promedios muestrales de lt variables expictivas (inclido el prom de exper, kidst6y Kidsge, el resultado seré aproxi- madamente 391. Cuando se caleuta (17.14) para el 230 logit, se obtiene alrededor de 243, La razén 5 el cambio aproximado en la probabiidad de respuesta cuando | 4 éstos, 391/243 ~ 1.61, es may ereana al sim- ‘exper aumenta de 10 3117 ple regla general de aumentar las estimaciones pro- bit para haceras comparables con las estimaciones ‘Mediantelas esimaciones probity aproximacién de calcul, geval Captulo 17. Modelos de variable dependiente limitada y corecchones a seleccién muestra Estimacones MP, logty probit dela participation en Ia fverza labora! wifeine 0034 012 0015) (005) edue 038 221 131 (007) (.043) (025) exper 039 206 123 (,006) (032) (019) exper? ~.00060 0032 0019 (00018) 0010) (0006) age - 016 =.088 = 053 (002) (015) (008) Kidst6 =262 1.443 — 868 032) (204) (19) kidsgeb 013 .060 036 (013) (075) (043) ‘constante 586 425 270 (asi) (860) (509) Porcentaje predicho correctamente | 73.4 736 Ba Valor de log-verosimilitud = 401.7 | 401.30 Pseudo R-cuadrada 264 220 221 logit: mlipicar las estimaciones probit por 1.6. Sin embargo, para comparar las estimaciones logit y probit con las del MPL. es mejor usar (17.15)- Estos factors escalares son de cerea de 301 (probit) y-179 (ogi). Por ejemplo, e coeficenteescalao logit de educ es de cerca de 17% 221) ~ 040 yelcoeficiente escalado probit de educ es de alrededor de 301(131) ~ 039; ambos son extraordinariamente cercanos a Jncestimacion del MPL de 038, Incuso en la variable dscretakidst6, los coeficientesescalados logit y probit son similares al coeficente del MPL de ~.262, Estos son .179(—1.443) ~ ~ 258 (logit) y 301(—.868) = = 261 (probit. La mayor diferencia entree! modelo MPL y los modelos logit y probit es que el MPL supone efectos imarginales consantes para educ, kids, ef, mientras que los modelos logit y probit implicen magnitu- des decrecientes de los efectos parcales. En el MPL se estima que un nito pequetio adicional reduce la ‘robabilida de participacién en la fuerza laborl por aproximadamente.262, sin importar cunts niios ‘pequetios tenga ya la mujer (y sin importar los niveles de otras variables explictivas), Se puede contrss- tar esto con el efecto marginal estimado de probit. Especticaments, tome el ejemplo de une mujer con 585 Parte 3. Temas avanzados ‘wvifeine = 20.13, educ = 123, exper = 10.6 y age = 42.5, que son aproximadamente los promedios smuestrals, ykidiges = 1, {Cuil es el deeremento estima en la probabilida de trabajar l pasar de cr nifios a un nifio pequefio? Se evalda la fda normal estindar, (A, + Ax, + ... + Ayx,) con kidsh6 = 1 3 Hidsi6 = 0, y las otras variables independiente establecidas en los valores anteriores, Se oben aproxi- Imadamente 373 ~ 707 = ~,334, lo cual signiica que a prbabiida de patcipacin en a fuerza labora ¢saproximadamente 334 menor cuando una mujer tien un alo pequeto Si a mujer pasa de uno a dos nits poquetos, la probabildad disminuye an més, pero el efecto marginal noes tan grande: 117 ~ 373 -256, Es interesante observar qu la estimaciGn del modelo de probabilda lineal, que se supone esti ma el efecto cercano al promedio, en realidad est entre esas dos eatmaciones. La figura 17.2 asta e6mo pueden afer as probabldades de respuesta estimada de los models no lineales de respuesta binarn del modelo de probebilidad lineal. La prbabilidad estimadade la paricipacién en l fuerza labors rac respect a los aos de edcacén para el moto de probabilidad lineal y el modelo probit. (La grifia para el modelo logit es muy Similar ala del modelo probit) En ambos caso, las variables expliatvas,ferenes de edu, se establecen en sus promedios muesales. En particular, las dos ecuacionesgraficaas son inf = 102 + 038 edue pra el modelo lineal yilf = ‘(~1.403 +131 edu) nls niveles nis bajo de educacdn,e1 modelo de probabilidad lineal estima mayores probabiliaes de partcipacién labora que el modelo probit. Pr ejemplo, on ocho aos deedueacién, el modelo de probbiidad lineal estima una prbabilidad de partcipacin aboral de 406 mientras que el modelo probit estima cerca de 361. Las estimacions son ls msmas en torn alos 1136 tos de educacién, A niveles mis altos de educacin, el modelo probit da nayoresprobailidade de Probabilidades estimadas de respuesta respecto a la educaclén para los modelos de probabllidad lneal y probit. (Bi = (1.403 + 131 ede) 5 init = 102 + .038 eouc probabilidad estimada {de partcipacion laboral ° 4 8 2 16 20 afios de educacién Capitulo 17. Modelos de variable dependientelimitada y corecciones a la seleccién muestal participacién laboral. En esta muestra, la menor cantidad de afios de educacién es 5 y la mayor 17, asf que en realidad no se deben hacer comparaciones fuera de este rango. Las mismas cuestiones concernientes a las variables explicativas end6genas en los modelos lineales también surgen en los modelos probit y logit, las cuales no se cubrirén, pero es posible probar y corregir las variables explicativas end6genas mediante métodos relacionados con los ‘mfnimos cuadrados en dos etapas. Evans y Schwab (1995) estimaron un modelo probit para si un estudianteasiste a Ta universidad, donde la variable explicativa clave es una variable binaria para si el estudiante asiste a una escucta catotica. Evans y Schwab estimaron un modelo mediante ‘maxima verosimilitud que permite que asistir a una escuela cat6lica se considere endégeno. [Vea ‘Wooldridge (2002, capitulo 15) para una explicacién de estos métodos.] Enel contexto de los modelos probit, otras dos cuestiones han recibido atencién, La primera sla no normatidad de ¢ en e1 modelo de variable ltente (17.6). Naturalmente, sie no tiene una listribucién normal esténdar, la probabilidad de respuesta no tendrat la forma probit. Algunos autores tienden a enfatizar la inconsistencia en estimar B, pero este es el enfoque equivocado @ ‘menos que sélo interese la direccién de los efectos, Debido a que la probabilidad de respuesta se ignora, no se podria estima la magnitud de los efectos parciales aunque se tuvieran estimaciones consistentes de B, ‘Un segundo problema de especificacin, también definido en términos del modelo de variable latente, es In heterocedasticidad en e. Si Var(elx) depende de x, la probabilidad de respuesta ya no tiene la forma G(B, + xB); en lugar de ello, depende de la forma dela varianza y requiere una estimacién mAs general. Tales modelos suelen no usarse en la prictica, dado que logit y probit con las formas funcionales flexibles en las variables independientes tienden a funcionar bien Los modelos de respuesta binaria aplican con pocas modificaciones ala combinacién inde pendiente de cortes transversales 0 a otros conjuntos de datos donde las observaciones estin distribuidas de manera independiente, pero no necesariamente idéntica. Con frecuencia, las va- les binarias anuales o de otro periodo se incluyen para representar los efectos agregados del mpo. Tal como en los modelos lineales, logit y probit se pueden usar para evaluar el impacto de ciertas politicas en el contexto de un experimento natural EI modelo de probabilidad lineal se puede aplicar a los datos de panel; por lo general se cstimarfa mediante los efectos fijos (vea el capitulo 14), Los modelos logit y probit con efectos inobservables recién se han popularizado. Estos modelos se complican por la naturaleza no lineal de las probabilidades de respuesta y son dificiles de estimar e interpretar. [Vea Wooldridge (2002, capitulo 15) 17.2 Modelo Tobit para respuestas de solucién de esquina ‘Como se mencioné en la introduccién del capitulo, otro tipo importante de variable dependiente Timitada es una respuesta de soluci6n de esquina Tal variable es cero para una frceién no trivial de la poblaci6a, pero tene una distribucin aproximadamente continua a través de valores posi- tivos. Un ejemplo es la cantidad que un individuo gasta en alcohol en un mes determinado. En la poblacién de personas de més de 21 afios en Estados Unidos, esta variable asume un amplio rango de valores. Para alguna fraccién importante, la canidad gastada es de cero, El siguiente tratamiento omite la verficacién de algunos detalles concernientes al modelo Tobit [Estos ddan en Wooldridge (2002, capitulo 16) Sea y una variable esencialmente continua a través de valores estrictamente postivos pero ‘que asume un cero con probabilidad positiva. Nada impide que se use un modelo lineal para y. De hecho, un modelo lineal pofa ser una buena aproximacion a EG, .-.4), en especial 6 Parte 3. Temas avanzados Como una alternativa al método anterior de estimacién de dos pasos esté la estimacién completa de maxima verosimilitud. Es més complicado puesto que requiere obtener Ia distribu- in conjunta de yy s. Sule ser Igo probar la seleccién muestral mediante el procedimiento anterior; si no hay evidencia de seleccién muestral, no hay raz6n para continua. Si se detecta, tun sesgo en la seleccn muestra, se pueden usar las estimaciones de dos pasos o estimar las cecuaciones de regresin y de seleccién de manera conjunta mediante EMV, (Vea Wooldridge (2002, capitulo 17),] En el ejemplo 17.5 se sabe més que s6lo si una mujer trabaj6 durante el aio se sabe cudntas horas trabajé cada mujer. Resulta que se puede usar esta informacién como un procedimiento de seleccién muestral alterativo. En lugar de la razén inversa de Mills, se usan ls residuales ‘Tobit, por ejemplo, §, los cuales se caleulan como #, = y, ~ xB siempre que y, > 0. Se puede ‘mostrar que la regesién en (17.50) con 5, en lugar de A, también produce estimaciones consis- tentes de las 8, y el estadistico estindar dees una prueba vilida para elsesgo de la selecci6n ‘muestra, Este enfoque tiene la ventaja de usar més informacién, pero es menos aplicable en general, [Vea Wooldridge (2002, capftulo 17). Existen muchos més temas concernientes a la seleccién muestral, Uno que vale la pena rmencionar es el modelo con variables explicaivas end6genas en adiciOn al posible sesgo de seleccién muestal, Escriba un modelo con una sola variable explicativa como n= at 7B, + uy i751 donde y, s6to se observa cuando s = 1, yy, puede observarse sélo junto con y,. Un ejemplo es ‘cuando y, ¢s el porcentaje de votos recibidos por un funcionario que busca la recleccidn y y, «es el porcentaje del total de gastos de campafa que realiza. Para los funcionarios que no parti cipan en la eleccién, no se puede observar y, 0 y, Si se tienen factores exgenos que afecten la decisién de participar y que estén correlacionados con los gastos de campada, se puede estimar consistemente a, y 1s elementos de B, por variables instrumentals, Para ser convineentes, son necesarias dos variables exégenas que no aparezcan en (17.51), Ciertamente, una afectaré la decisién de seleccién y otra estard correlacionada con y, [el requisito acostumrado para estimar (17.51) por MC2E]. En breve, el método es para estimar la ecuacién de seleccién mediante probit, donde todas las variables exégenas aparecen en la ecuacién probit. Entonces, se agrega la razén inversa de Mills a (17.51) y se estima la ecuacién mediante MC2E, La razén inversa de Mills acta como su propio instrumento, puesto que depende s6lo de las Variables exdgenas, Se usan todas las variables exégenas como los demsis instrumentos. Como antes, se puede usar el estadistico de 4, como una prucba del sesgo de seleceiGn. [Vea Wooldridge (2002, capitulo 17) para mayor informacién.] : ENR [En este capitulo se han cubierto varios métodos avanzados que suelen usarse en aplicaciones, en especial en microeconomia. Los modelos logit y probit se usan para las variables de respuesta binaria. Estos modelos tienen algunas ventajas sobre el modelo de probabilidad lineal: las proba- bilidades ajustadas estén entre cero y uno, y los efectos parciales son decrecientes, La principal desventaja de logit y probit es que son més dificiles de interpreta. EI modelo Tobit es aplicable a resultados no negativos que se acumulan en cero pero que también asumen un amplio rango de valores positives. Muchas variables de eleceién individual, Captulo 17 Modelos de variable dependientelimitada y corecciones a la selecei6n muestal como la oferta labora, cantidad del seguro de vida y cantidad del fondo de pensiones invertida en acciones, tienen esta caracterstica. Como con logit y probit, ls valores esperados de y dada x, ya sea condicional en y > 0.0 no condicional, dependen de x y B en formas no lineales. Se dicron las expresiones para estas expectativas asf como férmulas para los efectos parciales de cada x, sobre las expectativas. Estas se pueden estimar después de que se ha estimado el modelo Tobit mediante maxima verosimilitud. Cuando la variable dependiente es una variable de conteo, es decir, asume valores enteros no negativos, un modelo de regresién Poisson es adecuado. El valor esperado de y dada x, tiene tuna forma exponencial, Esto da las interpretaciones de parmetro como semiclasticidades © clasticidades, dependiendo de six, esté en nivel o en forma logaritmica, En resumen, se pueden {nterpretar los parémetros como si estuvieran en un modelo lineal con log(y) como Ta variable dependiente. Los parimetros se pueden estimar mediante EMV. No obstante, debido que la distribucién de Poisson impone igualdad de la varianza y la media, suele ser necesario calcular los errores estindar y estadisticos de prueba que permitan una sobre o subdispersién. Estos son simples ajustes los estadisticns y errores estindar de EMV. Los modelos de regresién censurada y truncada manejan clases especificas de problemas de datos fatantes. En la regresiGn censurada, la variable dependiente se censura por encima © debajo de un umbral, Se puede usar Ja informacién de los resultados censurados debido a 4que siempre se observan las variables explicativas, como en las aplicaciones de duracién o Ia codificacién superior de las observaciones. Un modelo de regresion truncada surge cuando parte 4e la poblacién se excluye por completo, no se observa informacién sobre las unidades que no estén cubiertas por el esquema de muestreo. Este es un caso especial de problema de seleccién vest. La seceién 17.5 offece un tratamiento sistematico de ta seleccén muestra no aleatoria. Se rmostr6 que la seleccién muestral exégena no afecta Ia consistencia de MCO cuando se aplican a Ja submuesta, pero la seleccién muestra endégena slo hace. Se mostr6 c6mo probar y corregir cl sesgo de seleccién muestral para el problema general de truncamiento incidental, donde las cobservaciones faltan en y debido al resultado de otra variable (como la partiipacién en la fuerza laboral). El método de Heckman es relativamentefécil de implementar en estas situaciones _____ HININSegme Anilisis de duracion Funcién de log-verosimilinud _Porcentajepredicho. Coditicacién superior Método Heckit ‘correctamente Distribucn de Poisson Modelo de regresi6y censurada _Probabilidad de respuesta Efecto parcial al promedtio ‘Modelo de regresién de Poisson Pseudo R-cvadrada (EPA) “Modelo de egresién normal _Razén inversa de Mills Efecto parcial al promedio (EPP) censurada Respuesta de solucisn de EEstadfstico de razén de cuasi_ Modelo de regresién normal esquina verosimilinudes ‘runcada Seleccién muestal exégena stadistico de razén de Modelo de regresién truncada _Selecci6n muestra no aleatoria. verosimititades Modelo de variable latente Sobredispersion Extadistico de Wald ‘Modelo logit ‘Truncamiento incidental Estimacién de cuasi mixima Modelo probit ‘Variable de conteo verosimilitud (ECMV) Modelo Tobit Variable dependientelimitada Estimacién de méxima Modelos de respuesta binaria (DL) verosimititud (EMV) Muestra seleccionada 613 | | ous Parte 3 Temas avanzados Ene 174 m2 173 174 1) Pam una repost bins y, ea ja proporcién de unos en lamest ue et igual promedio must de 9). Sea el porcetje prodico conecamente prac eau y= 0, send, el porcentijeconectament precio para el esulado y = 1 Sip es el Porceise gene predico conetamente, moss que sua promedio ponder de yah b=(1- 5G, + H,- En una muestra de 300, suponga que j = .70, de manera que hay 210 resultados con .¥, = Ly 90.con y, = 0, Suponga que el porcentaje correctamente predicho cuando y = 0 8 80, y el porcentaje correctamente predicho cuando y = | es 40, Determine el porcen- {aje correctamente predicho. ‘Sea grad una variable binaria para si un atleta colegial en una universidad grande se graduard ten cinco aos. Sean hsGPA y SAT el promedio de eaificaciones de bachillerato las puntua nes del SAT de admisién a la universidad, respectivamente, Sea study el nimero de horas por semana que pasa un estudiante en un aula de estudio. Suponga que, usando los datos sobre 420 alletas colegiales se obtiene el siguiente modelo logit: Pgrad = I hsGPA,SAT-study) = A(—1.17 +24 hsGPA + 00058 SAT + 073 snudy), donde A(z) = exp(e)/[I + exp(z)] es la funcin logit. Si se mantiene hsGPA en 3.0 y el SAT {jo en 1,200, calcue la diferencia estimada en Ia probabilidad de graduscién para alguien que pasa 10 horas a la semana en el aula de estudio y alguien que pasa 5 horas por semana. (Requiere edleulo) i) Suponga en et modelo Tobit que +, cen x. Muestre que log(,) y este es el dnico lugar en el que 2, aparece aEGLy > 0.x) 2%, Ble 1 ~ AixBloyixBlor + Axio}, ist donde 8, es el coeficiente de log). fi) Six, =z, yx, = 2, demuestre que AEGly > 0.x) ee, (B, + 28,21 — AGxBlo\|xBlo + A(xBio)))}, donde, ese coefiiente de z,y es el coeficient de Sea mype valor de producto margins! para el abso, que eel precio del ben de una empresa muitipicado por el producto marginal del abajador. pong que Toglmp) = By + By, + + Big + wage, = max(myp,minvage), onde las vasiablesexplicaivas incluyen educcién, experiencia, ete, y mimvage, es el salario minimo relevante para la persona i. Escriba log(wage) en términos de log(myp) y log(minwage). 175 176 a7 ‘Capitulo 17 Modlelos de variable dependientelimitada y cottecciones a fa seleccin muestra (Requiete célculo). Sea patents el némero de patentes solicitadas por una empresa durante un aio determinado. Suponga que la expectativa condicional de parents dadas sales y RD es E(patents|sales,RD) xpIB, + B,los(sales) + B,RD + BRD’, donde sales son las ventas anales de ta empresa y RD es el gasto total en investigaicn y esarolo durante los pasidos 10 aos. |) {Como estimara las 8? Jusifigue su respuesta mediante un andlisis de a naturaleza de patents ii) Como imterpreta sted f,? iii) Encuentre el efecto parcial de RD en Eparents|sales, RD). Considere Ia funci6n de ahorro de una familia para la poblacién de todas las familias en Estados Unidos: 3, + Byinc + B,hhsize + Pyeduc + Bage + u, donde hhsize es l tamalio deta familia, educ son los afios de educacién del jefe de familia y ‘age es la edad del jefe de familia, Suponga que Etulin.thsize,edue,age) = 0. |) Suponga que la muestra ineluye soa familias euyo jefe tiene mis de 25 aios de edad. Si se usa MCO en tal muestra, 8 obtienen estimadiores insesgados de las ,? Explique ii) Ahora, saponga que nuestra muestra incluye slo a parejas casadas sin hijos. Se pueden estimar todos los pardmetros en la ecuacién de ahorro? ;Cusles se pueden estimar? iil) Suponga que se excluyen las familias de la muestra que ahorran més de $25,000 al ai. {MCO produce estimadores consstentes de las 8? ‘Suponga que lo contrata una universidad para estudiar los factores que determinan si un es ‘udiante admitido a la universidad en realidad asise a ella, Se le da una muestra aleatoria gran de de estudiantes que fueron admitidos el afio anterior. Se tiene informacién sobre si cada estudianteeligié asstr, el desempetio en el bachillerato, el ingreso familiar, la asistencia fi- nnanciera oftecida, la raza y 1as variables geogréficas. Alguien le dice: “Cualquier andlisis de los datos generaré resultados sesgados debido a que ésta no es una muestra aleatoria de todos Tos que solicitaron su ingreso a la universidad, sino s6lo de aquellos que lo solicitaron pars cesta universidad”. ;Queé piensa usted de tal ertica?” CA7.A. Use los datos en PNTSPRD RAW para este ejervicio. i) La variable favwin es una variable binaria siel equipo favorecido por la diferencia de ‘Puntos (spread) predicha por Las Vegas gana. Un modelo de probabilidad lineal para ‘estimar si ef equipo favorecido gana es PC favwin = l|spread) 1, + B spread. Expligue por qué, si la diferencia de puntos (spread) incorpora toda la informacién relevante, se espera B= 5. ii) Bstime el modelo de la parte i) mediante MCO. Pruebe Hy, = 5 frente a una alte nativa de dos clas. Use los erores estindar usuales y los robustos a la heterocedas- ticidad. ii) {La vatible spread es estadisticamentesignificativa?;Cul es la probabilidad estima- das de que el equipo favorito gane cuando spread = 10? os 616 Parte 3. Temas avanzados ci72 173 cra i) » vi) Ahora estime un modelo probit para P( favwin = spread). Interprete y prucbe la hipotesis nula de que el intercepto es cero. [Sugerencia: recuerde que (0) = 5] Use el modelo probit para estimar Ia probabilidad de que el equipo favorito gane cuan- «do spread = 10. Compare esto con la estimacién del MPL. de la parte ili). Agregue las variables favhome, fav25 y und25 al modelo probit y pruebe la signifi ccancia conjunta de estas variables mediante la prueba de razén de verosimilitudes, ({Cusntos gf hay en la distribucién ji-cuadrada?) Interprete este resultado enfocdndose cen Ia pregunta de si la diferencia de puntos incorpora toda la informacién observable antes de un juego. Use tos datos en LOANAPP.RAW para este ejercicio; vea también el ejercicio en compu- tadora C78, i i itp iy) Estime un modelo probit de approve sobre white, Encuentre la probabilidad de que se apruebe un préstamo tanto para blancos como para no blancos. Cémo se compara esto ‘con las estimaciones de probabilidad lineal? Ahora agregue las variables hrat, obrat, loanpre, unem, male, married, dep, sch, ccosign, chist, pubree, mortlat!, mortlat2 y vral modelo probit. Hay alguna evidencia estadisticamente significativa de discriminacién contra los no blancos? Estime el modelo de la parte ii) mediante logit. Compute el coeficiente de white res- ecto la estimacién probit ‘Use la ecuacién (17.17) para estimar las dimensiones de los efectos diseriminativos para probity logit. Use fos datos en FRINGE.RAW para este ejercicio, 9 ii) wy) ” {Para que porcentaje de trabajadores en la muestra pension es igual a cera? ,Cudl es el rango de pension para trabajadores con beneficios de pensidn no iguales a cera? ;Por qué un modelo Tobit es apropiado para modelar pension’ Estime un modelo Tobit que explique pension en términos de exper (experiencia), age (alad), tenure (antigiedad), duc (educacibn), depends (dependientes), married (esta- do civil casado), white (blanco) y mate (hombre). ,Los hombres y los blancos tienen prestaciones de pensién esperadas significativamente més altas? Use fos resultados de la parte ii) para estimar Ia diferencia en las prestaciones de pen- sidn esperadas para los hombres blancos y para las mujeres no blancas, ambos con 35 ailos de edad, solteros sin dependientes, con 16 afios de educacién y con 10 de expe- Agregue union (variable binaria igual a uno si pertenece a un sindicato) al modelo ‘obit y comente sobre su importancia, Aplique ef modeto Tobit de la parte iv) pero con peratio, la razén pensiGn-ingreso, ‘como la variable dependiente. (Observe que esta es una fraceién entre cero y no, pero ‘aunque suele asumir el valor de cero, nunca se acerca a la unidad. Por tanto, un mode- lo Tobit esté bien como aproximacisn.) {El género o la raza tienen un efeeto sobre la relacin pensiGn-ingreso? Enel ejemplo 9.1 se agregaron los términos cuadriticos pen, prime86? e inc86? al modelo lineal para narr86, a ii) ii) Use los datos en CRIMEL.RAW par agregar estos mismos éminos a egresn do Poisson en el ejemplo 173 Cate a esmacion deo dad por 2 = (n — k 1)" 095, cay slguna evi dena de sbredispesin? ;Come se deben js ls errs ein det EMV de Posson? ‘Use los resliads de as parte i) y ila abla 173 para caleular el extadinico de ranindecusivrosinilities paral signifcanca conjunt elo wes téminos cu Griicos, Qu conclye se? cars 176 177 178 Ccaptulo 17 Modelos de variable dependiente limitada y correcclones ala seleccién muestra Conse I tala 13.1 en el captlo 13, As wsaton los datos en FERTILL.RAW para estimar un modelo lineal para Kids, el nimero de nos que hatenido una mujer. 3) atime un modelo de reresén Poison para Kids, empleando las misma variables de la tabla 13.1. Interprete el coeficiente de y82. ii) {Cues a diferencia porental estima en a feria entre una mje negra yuna ‘mujer no negra, manteniendo fijos los deméis factores? Obtenga &. Hay evidencia de sobre o subdispersién’? Compare os valores sostados den regresion de Poisson y obtenga la Rcusdrads como lacomelcincuadrada ene ids kd, Compare esto conta Raa del modelo regres ine. Use los datos en RECID.RAW para estimar el modelo del ejemplo 17.4 por MCO, usando ‘inicamente las 552 duraciones no censuradas. Comente en términos generales eémo estas cestimaciones se cormparan con las de la tabla 17.4 Use los datos MROZ.RAW para est eerico. ')Tomundo ls 428 mujeres que estaban en la fuerza labora, etime el rendimiento de a educacién mediante MCO incluyendo ls variables explicativas exper, exper mwife- Inc, age, kids y kidsge6, Reporte su esimacin para educ ysu eto estndar ‘Ahora estime el rendiminto dela educacion mediante Heckit, donde todas las variables exdgenas aparecen en la regresign dela segunda etapa. En otras palabras, ta regresiGn logtvage) sobre edu, exper, exper, nvifeinc, age, kids, kidsge6 y A. Compare el rendimiento estimado de la edcacin y su error estindar con el de la pate i. i) Usundo solo ls 428 observaciones para las mujeres que tabajan, efectc Ia regresion de X sobre edu, exper, exper, nwifeinc, age, kids y kidege6. {QUE tan grande es la ‘Recuadrada? {Cémo ayuda esto a explicar sus hallazgos en la parte i)? (Sugerencia piense en la multicolineaidad,) El archivo JTRAIN2.RAW contiene datos sobre un experimento de capzcitacién laboral para tun grupo de hombres. Los hombres podrian ingresar al programa a partir de enero de 1976 hasta mediados de 1977. El programa terminé en diciembre de 1977. La idea es probar sila Participacién en el programa de capacitacinlaboral tuvo un efecto sobre las probabilidades de esempleo y os ingresos en 1978, i) _Laariable rrain es el indicador de capacitacién labora. ;Cusntos hombres en la mues- tra participaron en el programa de capacitacién laboral? {Cuél es el mayor méimero {de meses en el que un hombre participé realmente en el programa (mostrn)? li) _Ejecute una regresién lineal de rran sobre varias variables demogrficas anteriores a la capacitaci6n: unem74, unem75, age, educ, black, hisp y married, {Estas vatiables en Cconjunto son significativas al nivel de 59%? iil) Estime una versién probit del modelo lineal en Ta parte ii). Calcule Ia prueba de ra én de verosimilitudes para la significancia conjunta de todas las variables. {Qué cconcluye? iv) Con base en sus respuestas a las partes ii) y ii), {parece que la participacién en la ‘capacitacién laboral puede tatarse como exégena para explicar el estatus de desempleo de 1978? Explique, ¥) Bjecute una regresion simple de unem78 en train y reporte los resultados en forma de ecuacién, {Cul es el efecto estimado de partcipar en el programa de eapacitacién lnboral sobre la probabilidad de ser desempleado en 1978? {Bs estadisticamente signi- ficativo? vi) Bjecute un probit de unem78 sobre train. {Es légico comparar el coeficiente probit de ‘rain con el coeficiente obtenido del modelo lineal en la parte ¥)? on 618 Pane 3 ci79 Temas avanzados vii) Determine tas probabilidades ajustadas de las partes v) y vi). Explique por qué son idénticas. ;Qué método usaria para medir el efecto y la significancia estadistica del programa de capacitaci6n laboral? viii) Agregue todas las variables de la parte i) como controles adicionales a los modelos de tas partes v) y vi). ;Ahora son idénticas las probabilidades ajustadas? {Cual es la correlacién entre ellas? ix) Mediante ef modelo de la parte vii), estime el efecto parcial promedio de train sobre {a probabilidad de desempleo de 1978, Use (17.17) con ¢, = 0. ,Cémo se compara esta cstimacién con la de MCO de la parte vii)? Use los datos en APPLE.RAW para este ejercicio, Estos son los datos de una encuesta tele- fénica qu intentabaprovoca la demanda de una manzana (Ftc) “ecoldpicamente amiga Die" cada familia se le presents un conjunto de precios para maazanas regulars (Pere) Y manzanasecoldieas(ecopre). Seles pregunté cunts Hibes de cada tipo de mancanas compracan (reps y ecb, respetvamente), |) De les 660 Familias en a ses, cunts repotaron no querer ninguna de ls man- zn eoligicas al precio jd (ecolbs = 0? ii) {La vaable ecolbs parece tener una distibucén continua sobre valores estictamente Powitivos?:Que impicaiones ees respuesta para a idoneiad de un model Tobit para ecols? il) Esme un modeto Tobit para ecolbs con ecopre, regpre; famine y hhsize como lis variables expiatvs. QU vatables sn sgifiaivas a nivel de 1482 iv) {Son famine yhhsize en conjunto siniicatvas? ¥) Los signos de os coeicientes dels variables de reco de apart usted espera? Expiqe. Vi) Sea, el coficinte de ecopre y A el coetcents en regpre.Prube fa hipstesis Hl; ~ B, = B frente ala alternativa de dos coas. Reporte el valorp dela prueba. (Quid auiera consulta a seceién 4.4 si su paguete de epesin no cau icmenic tsles pacha) Vil) Obtenga las eximaciones de Blecolbs}x) par todas ls observaciones en la mes. {Nea la ecuacign (17.25) Llame a estas zcolB, ;Cusles son los valores sjutados imayoresy menores? a vi) Caleta comeacin cada ene eco, y ix) Ahora, estime un modelo lineal para ecolbs mediante ls mismas variables explicatvas dla pat i). ;Por qué las eximaciones de MCO son mucho menotes que ls est raciones Tobit? En érminos de bondad de suse, el modelo Tobit es mejor que el rode ine? %) Eval la sguent afrmacién: “Debio aque la Rcundrada del modelo Tobit stan quel, os efectos estimados del precio probablemente sean inconsistent fueron lo que 17.10 Use los datos en SMOKE.RAW para este ejercicio. i) La variable cigs es el auimero de cigamillos fumados por fa. {Cudntas personas en la "muestra no Funan en absoluto? ;Que fraccién de personas afirman fumar 20 cigarrillos al dia? gPor qué piensa que hay una acumulacién de personas en 20 cigarillos? ii) _Dadas sus respuestas en la parte i), ccigs parece ser un buen candidato para tener una Aisiibucién de Poisson condicional? i) Estime un modelo de regresién de Poisson para cigs, incluyendo log(cigpric), logtincome), white, educ, age y age® como variables explicativas. ;Cules son las elas- ticidades estimadas de precio e ingreso? cman crm. Captalo 17 Modelos de variable dependientelimtada y conecciones a a seleccién muesal iv) Usandotos errores estar de méxima verosimiliud, as variables de precio ingreso son estadsticamentesigntiativas al nivel de 5%? 'y) Obtenga Ia estimacién de a? descrita después de la ecuacién (17.35). ,Cudinto es 6 {Como se deen ajustar los erroresestindar de la parte iv)? vi) _Empleando los errores estdndar ajustados de la parte v), jlas elasticidades de precio ¢ ingreso ahora difieren estadfsticamente de cero? Explique vii). {Las variables de educacin y edad son sigificativas empleando eroresestindar més robustos? {Como interpreta el cocfciene de educ? vill) Obtenga los valores ajustados, j, del modelo de regresién de Poiston, Determine os ‘valores mévimos y minimos, y analce qu tan bien predice el modelo exponencial el consumo intensvo de cigars ix) Uiilizando tos valores ajustados de la parte vi, obtenga el coeficiente de correlacion cuadrada entre jy y, x) Estime un modelo lineal para cigs mediante MCO, usando las variables explicativas. (las mismas formas fu ales) de la parte ii). {E modelo lineal o e! modelo expo- 1 ofrecen un mejor ajuste? ;Alguna R-cuadrada es muy grande? Use los datos en CPS9LLRAW en este ejercicio. Estos datos son de mujeres casadas, que también tienen informacién demogratica y sobre el ingreso de cada mario, i) {Que fraccisn de mujeres reports estar en la fuerza laboral (nlf = 1)? fi) Solo empleando los datos para mujeres que trabajan (no tiene opeién), estime la ecus- ign salarial logovage) B, + Byeduc + Bexper + Berper® + B,black + B,hispanic + w mediante minimos euadrados ordinarios. Reporte Jos resultados en la forma acostum- brada. :Parece haber diferencias salarialessipnificaivas por raza y etnicidad? iil) Estime un modelo probit para inlf que incluya las variables explicativas en la ecuacién salaral de la parte i), asf como mwifein (ingreso familiar no debido a la exposa) y ide (binaria igual a‘uno si tiene al menos un hijo menor de 6 afios de edad). (Les ‘kimas dos variables tienen coeficientes con el signo esperado? Son estadisticamente signitiatvas? iv) Explique por qu, para fines de probary posiblemente corer en la ecuacin salsial problema de fa seleceién en ta fuerza labora, es importante que nwfeine y Kl ayuden a explicar nlf ;Qué debe suponer acerca de mwifein y kilt en la ecuacién salarial? ¥)Calcule a razén inverse de Mills (para cada observaci6n) y agréguela como un regre- sor adicional ala ecuacién salavial de la pare i). ,Cudl es el valor-p de dos colas? {Piensa que es partcularmente pequetio con 3,286 observaciones? vi) jAgregar la razén inversa de Mills cambia los coeficientes en laregresién salaval de forma importante? Explique Use los datos en CHARITY.RAW para contestar estas preguntas i) La variable respond es una variable binaria igual a uno si un individuo responde con ‘una donacién a la solicitud més reciente. La base de datos consiste s6lo de personas que hhan contestado al menos una vez.en el pasado, Qué fraccién de personas respondi sms recientemente (resplast = 1)? ii) Estime un modelo probit para respond, utilizando resplast, weekslast, propresp, ailsyear y avgpift como las variables explicativas, ,Cul de las variables explicativas es estadisticamente signficativa? 619 Parte 3 Temas avanzados iil) Encuentre el efecto parcial promedio de mailsyear y compéirelo con el coeficiente de ‘un modelo de probebilidad lineal. iv) Empleando las mismas variables explicativas, estime un modelo Tobit para gi, la cantidad de la donacién més reciente (en florines holandeses). Ahora, ,qué variable explicativa es estadisticamente significative? ¥) Compare e1 EPP Tobit para mailsyear con el de Ia regresin lineal. ;Son similares? vi) Las estimaciones de las partes ii) y iv) son enteramente compatibles con un modelo ‘Tobit? Explique. €17.43 Use los datos en HTV.RAW para responder esta pregunta, {) Mediante MCO en la muestra total, estime un modelo para logtwage) mediante las variables explicativas edue, abil, exper, nc, west, south y urban. Reporte el rendimiento cstimado de la educacién y su error estindar. ii) Ahora, estime la ecuacién de la parte i) usando s6lo personas con educ < 16. {Qué porcentaje de la muestra se pierde? Ahora, ;cusl es el rendimiento estimado de un aio de escolaridad? ;Cémo se compara esto con Ia parte i)? ii) Ahora deseche todas las observaciones con wage = 20, de manera que todos los que ‘queden en la muestra ganan menos de $20 por hora, Ejecute la regresin de Ia parte i) y ccomente acerca del coeficiente de educ. (Debido a que el modelo de regresin truncada normal supone que y es continua, no importa en teofa si se desechan las observaciones ‘con wage = 200 wage > 20, En la prctica, incuida esta apicacién, esto puede importar tun poco debido a que hay algunas personas que ganan exactamente $20 por hor.) iv) Utiizando Ia muestra en ta parte ii), realice la regresiGn truncada [tomando log(20) como punto de truncamiento superior]. :La regresién trunca parece recuperar el ren dimiento de la educacién en toda la poblacién, en el supuesto de que la estimaci6n de {) sea consistente? Explique. Estimacion de maxima verosimilitud con variables explicativas El apéndice C oftece un repaso de la estimacién de méxima verosimilitud (EMV) en el caso ids simple de estimar los pardmetros en una distribucién no condicional, Pero Ia mayorta de los modelos en econometra tienen variables explicativas, ya sea que se estimen esos modelos mediante MCO 0 EMV, Esta ditima es indispensable para los modelos no lineales y aqui se ofrece tna breve descripcién del enfogue general. i ‘Todos los modelos que se cubren en este capiulo se pueden poner en Ia siguiente forma. Sea /ix,B) la funciGn de densidad para una extracci6n aleatoria y, de la poblacién, coadicional ‘en x, = X. Bl estimador de maxima yerosimiliud (EMY) de 8 maximiza la funci6n de log- verosimilitud, snax lows), 17.53 donde el vector b es el angumento binaro en el problema de'maximizacién. En la ayoria de los casos, la EMV, que se esribe como, es consistent tiene una distibucién normal aproximada en muestras grandes, Esto es verdad un cuindo no se poeda escribir una fSmula para saivo en circunstancias may especiales: Capitulo 17 Modelos de variable dependiente limitada y crrecciones 3 la seleccién muestra Para el caso de respuesta binara (logit y probit), ls densidad condicional se determina por dos valores, (1}x,B) = PO, = IIx) = GB) y FOlxB) = PCy, = Ox) = 1 ~ Gx). De hecho, una forma sucinta de escribir la densidad es f(y)x,B) = [1 ~ GtxB)I"-"(GCxB)? para y= 0, 1 Por tanto, (17.53) se puede escribir como max Y) (1 = yplogt = Gexp)] + y,loslGexp 17.54 En general, las soluciones a (17.54) se encuentran répidamente mediante computadoras moder- ras y métodos iteativos para maximizar una funcién. El tiempo total de célculo incluso para Jos conjuntos de datos muy grandes es muy répido. ‘La funcién de log-verosimilitud para el modelo Tobit y para la regresién censurada y truncada son s6lo ligeramente més complicados, dependiendo de un parmetro de varianza adicional ademés de B. Se derivan fécilmente de las densidades obtenidas en el libro. Vea ‘Wooldridge (2002) para mayores detalles Errores estandar asintéticos en modelos de varlable dependiente limitada Las derivaciones de los errores estindar asintticos para los modelos y métodos presentados en ‘este capitulo estin mas allé del alcance de este libro. No s6lo Jas derivaciones requieren dlgebra ‘matricial, sino que también requieren una teoria asintotica avanzada sobre estimacién no lines ‘Los antecedentes necesatios para un anélisiscuidadoso de estos métodos y varias derivaciones se dan en Wooldridge (2002). Es instructivo ver las formulas para obtener los errores estindar asintticos para al menos algunos de los métodos. Dado el modelo de respuesta binaria PCy = Ix) = G(xB), donde GC) ‘es la funcién logit o probit y Bes el vector k X 1 de parimetros, la mattiz de varianza asinttica de se estima como acer LexPyPxx, \7 Koa = (5 APTS 753 ? (S Gx Ail — a wim ue es una matrz.k X k (Vea el apéndice D para un resumen de élgebra matricial.) Sin los términos que implican g(-)'y G(), esta formula se parece mucho a la matriz de varianza es- timade para el estimador de MCO, menos el término 6. La expresién en (17.55) representa Ja naturaleza no lineal de la probabilidad de respuesta, es deci, Ia naturaleza no lineal de GC), asf como la forma particular de heterocedasticidad en un modelo de respuesta binaria: Varin) = Gtx6){1 — Gixp)) Las races cuadradas de los elementos de Ia diagonal de (17.55) son los errores estindar toticon Se Ya'B y-lclen' velar elle) ofvne € ceancaniats ab spore anilisis logit y probit. Una vez que esto se tiene, los estadisticos y Ios intervalos de confianza (esintticos) se obtienen de la form acostumbrada, ‘La matriz en (17.55) tambien es la base de las pruebas de Wald de restricciones maltiples sobre B [vea Wooldridge (2002, capitulo 15) a on Parte 3. Temas avanzados La matriz de varianza asinttica para Tobit es mas complicada pero tiene una estructura similar, Observe que se puede obtener tn error estindar para é también. La varianza asintética para la regresion de Poisson, que permite o? # 1 en (17.35), tiene una forma muy similar a (17.55% @1S expen Bx, warp) 17.56 Las raices cuadradas de los elementos de la diagonal de esta matriz son los errores estindar asint6ticos, Si el supuesto de Poisson es vélido, se puede descartar de la formula (debido a queo?= 1). Los ertores estdndar asint6ticos para la regresién censurada, regresién trunca y la corree- ‘cin de la seleccin muestral Heckit son mas complicados, aunque comparten caractristicas con las frmulas anteriores. [Vea Wooldridge (2002) para mayores detalles.)

También podría gustarte