Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ejercicios Econometria III PDF
Ejercicios Econometria III PDF
ECONOMETRIA III
Por
Beatriz GONZÁLEZ LÓPEZ-VALCÁRCEL
Jorge V. PÉREZ RODRÍGUEZ
(LICENCIATURA EN ECONOMIA)
Octubre 2007
PARTE I.
PROBLEMAS PROPUESTOS
donde, si es una variable dicotómica que vale uno si el individuo i-ésimo posee un seguro y
cero en caso de no poseerlo; yi es la renta en miles de pesetas y Ei es la edad del asegurado.
Si la renta bruta anual fuese de 4 millones de pesetas y la edad del asegurado de 30 años,
entonces:
Se pide:
a) Calcular las probabilidad de tener vivienda en propiedad en los dos modelos y para
los dos individuos.
b) Calcular los ODDS de cada individuo, para cada modelo.
c) Calcular los efectos marginales para el individuo 9 en el modelo logit; y para el
individuo 18 en el modelo probit.
1
3. Obtener la expresión del algoritmo de Newton-Raphson mediante los minimos
cuadrados, y para el modelo: yt = αe βxt + ut , siendo ut una perturbación aleatoria iid.
4. Un banco pretende caracterizar las empresas que cumplen puntualmente todos los
plazos de devolución de los créditos que reciben. Tras crear una variable Yi, que toma
valor 1 cuando las empresas cumplieron dichos compromisos y cero en caso contrario,
se estimaron los siguientes modelos:
pi
ln = −1.66 − 0.32 x1i + 0.62 x 2i − 0.90 x3i
1 − pi
donde x1i es el ratio (en porcentaje) entre el valor nominal de la deuda viva de la
empresa y el valor total del activo; x2i es el ratio (en porcentaje) entre los beneficios
después de impuestos y el valor total del activo; y x3i es el valor del activo (como
indicador del tamaño de la empresa).
Se pide:
Aprobaron Calificación
Macroeconomía Econometría
Sí 8
Sí 8
No 6
Sí 6
No 6
No 5
Sí 5
Sí 4
No 4
No 4
Se pide:
a) Especificar y estimar por mínimos cuadrados ordinarios un modelo lineal que evalúe
el efecto que la calificación de Econometría tiene sobre la probabilidad de aprobar
Macroeconomía.
2
b) Interpretar los valores estimados para cada uno de los coeficientes del modelo.
¿Cuál es la calificación que debe alcanzarse en Econometría para tener una
probabilidad de 0.80 de aprobar Macroeconomía?.
c) Obtener una estimación eficiente del modelo especificado en a).
d) Si un alumno obtuvo 9.5 en Econometría, ¿Cuál es la probabilidad de aprobar
Macroeconomía?.
Pi1 = α 1 + β 1 x i + u i1
Pi 2 = α 2 + β 2 xi + u i 2
Pi 3 = α 3 + β 3 xi + u i 3
3 3
satisfacen ∑α
i =1
i = 1y ∑β
i =1
i =0.
∑ (Y − Pˆi ) .
N 2
demostrar que el R 2 de Effron es equivalente a 1 − i
N1 N 2 i =1
Se pide:
3
b) Si un grupo posee un rating igual a 5, y actúa en un día con meteorología favorable
y un fan paga un precio de 5000 ptas., ¿cuáles son las predicciones de la ventas
considerando la censura?.
10. En el modelo TOBIT: yi* = xi' β + ui , ¿A qué será igual el valor obtenido para
[ ]
∂E y i / xi , y i* > 0
?. ¿Y si
[ ]
∂E yi / xi , y i* < 0
?.Demostrarlo en ambos casos.
∂xi ∂xi
11. Una muestra de 2000 individuos se dispone para las siguientes variables: CRi son los
créditos personales (es una variable dicotómica que toma valor 1 si el crédito no resulta
fallido y 0 en caso contrario); RNi es la renta anual en miles de dólares; TCi es el número
de tarjetas de crédito (es una variable dicotómica que toma valor 1 si el individuo las posee
y 0 si no las tiene) y EDi es la edad del cabeza de familia. Se estima el siguiente modelo de
probabilidad lineal:
Se pide:
12. Un análisis empírico trata de estudiar los factores explicativos del empleo juvenil. Con
esta finalidad, se especifica un modelo probit donde la variable depediente representa el
status que tienen en la fuerza laboral los jóvenes de una muestra con edades comprendidas
entre 16-21 años. Esta variable se define como status (1=ocupado, 0=parado). Las
variables explicativas utilizadas son las siguientes variables dicotómicas: sexo (1=varón),
estudios (1=superiores o medios), residencia (1=urbana), edad1 (1=16-17), edad2 (1=18-
19). Los resultados proporcionados en el análisis son:
a) ¿Qué se trata de explicar con este modelo?, ¿Qué significado tienen los parámetros
estimados?, ¿Podemos decir que el modelo es significativo?.
b) Comente, de manera breve, las características y/o diferencias del modelo probit
respecto a otros modelos susceptibles de aplicarse a este tipo de datos.
( )
c) Teniendo en cuenta la siguiente información, f xI' β = 0.2 , donde f es función de
densidad evaluada en x, ¿podría calcular la tasa de discriminación laboral sufrida por
las mujeres respecto a los hombres?.
4
13. Con los resultados de una encuesta de la Fundación FOESSA realizada en 1960, se
elabora un modelo logit para explicar la posesión o no de un autómovil en un colectivo de
2414 personas. Como variable explicativa se considera la autoasignación de los individuos
a una clase social. Las clases son: alta, media alta, media, media baja y baja. Se obtienen
los siguientes resultados:
Donde: Et=1 para más de 40 años, y 0 para menos de 40 años. EPt=1 sin experiencia, y 0
con experiencia. Se pide:
a) Si con los datos de la encuesta tuviera que estimar el modelo, escriba los elementos de
la matriz de datos X y los del vector de la variable endógena del modelo necesarios
para dicho fin.
15. Se quiere estudiar si los clientes de un banco utilizan o no los cajeros automáticos. El
estudio se hace para una muestra de 100 individuos. Se pide:
a) Proponer un modelo logit que estudia esta relación en función de si los clientes tienen
más o menos de 35 años, de si su nivel de ingresos anuales es superior o no a
1.750.000 ptas y del nivel de movilidad del cliente. (NOTA: Se considera que un
cliente es móvil si en el periodo de 10 años ha vivido como mínimo en tres ciudades).
5
Definir las variables de manera que la categoría base sea un individuo de menos de 35
años, no móvil y con un nivel de ingresos menor a 1.750.000.
b) Comenta los problemas de la estimación por MCO de este modelo y las posibles
soluciones.
Parámetros β t
Constante -0.880 -1.733
Años -0.882 -1.621
Ingresos 1.216 2.468
Movilidad 1.129 2.223
TEST RV χ2=18.915
17. Para explicar la elección del tipo de centro (privado o público) en el ámbito de la
enseñanza universitaria, se ha estimado por MCO un modelo de regresión utilizando como
variable dependiente a CENTRO (=1, privado). Por otro lado, las variables explicativas
empleadas son: EDUCP (=1 si el cabeza de familia tiene estudios universitarios) y,
además, cuatro categorías de renta definidas por las siguientes variables ficticias: RENTA1
(=1, renta familiar < 1000), RENTA2 (=1, renta familiar entre 1000-1500), RENTA3 (=1,
renta familiar entre 1500-2000), RENTA4 (=1, renta familiar entre 2000-3000). La renta
familiar está expresada en miles de pesetas y se toma como categoría base las rentas
familiares superiores a 3000.
6
18. Con el fin de predecir la crisis de las compañías de seguros en Estados Unidos se
elaboraron distintos modelos logit utilizando diversos ratios considerando que la empresa
puede quebrar o no. Uno de estos modelos, relacionaba el ratio del inmovilizado sobre el
neto patrimonial (X1), las inversiones en filiales sobre el neto patrimonial (X2), y la
variación de los ingresos procedentes de las operaciones (X3). Los resultados más simples
obtenidos determinan que el índice estimado es igual a:
conociéndose que el valor del logaritmo de verosimilitud del modelo sin restringir es 919 y
el modelo restringido 900.
Se pide:
19. Demostrar que tanto en el modelo probit como logit, si denotamos por L0 el valor de la
función de verosimilitud que se obtiene cuando sólo se estima una constante, restringiendo
los demás coeficientes a cero, se tiene:
ln L0 = N [ p ln p + (1 − p ) ln(1 − p )]
y t = α + β 1 e β 2 xt + u t
7
21. Sea un modelo de regresión truncada con truncación superior en el punto a≠0.
Deduzca su función de verosimilitud.
23. Sea un modelo de probabilidad lineal dicotómico con una sola variable explicativa
X: Yi = α + βX i + U i . Demuestra que es heterocedástico, y calcula la expresión de las
varianzas de las perturbaciones.
26. Lee lo que sigue, que es un resumen extractado de un artículo, para contestar las
preguntas.
8
Las variables consideradas en el estudio son:
Los modelos econométricos que se emplearon para el análisis de los datos fueron de
los denominados modelos de elección discreta, concretamente, modelos logit
multinomiales. Los resultados de la estimación de los modelos logit multinomiales para
FRAUDE son:
9
1 2 3 4 5
CONSTANTE 1 -2,8630* -2,5341* -2,4528* -2,5955* -2,6945**
(3,682) (2,203) (2,074) (2,120) (1,796)
AMIGOS 1 0,3733 0,3822 0,3764 0,3763 0,5822
(0,975) (0,903) (0,864) (0,861) (1,201)
VERENGEX 1 1,5398* 1,8674* 1,9655* 1,9866* 2,7467*
(2,232) (2,232) (2,306) (2,333) (2,401)
COLECTIVO 1 0,5004* 0,4448* 0,4360* 0,4096* 0,2768
(2,921) (2,400) (2,285) (2,110) (1,339)
---
SEVER 1 -0,3633** -0,4174* -0,4361* -0,4449**
(1,932) (2,063) (2,114) (1,931)
---
PROBLEMA 1 0,7508 0,8866** 0,9177** 0,6835
(1,636) (1,888) (1,940) (1,325)
--- ___
SEXO 1 -0,0079 -0,0089 -0,5761
(0,019) (0,022) (1,273)
--- ___ ___
POSICION 1 0,2926 0,2736
(0,516) (0,457)
--- ----- -----
ESPONT 1 ---- 0,2146
(0,461)
CHI-CUADRADO (G.L.) 52,9518 (9)* 59,8239 (15)* 62,4953 (18)* 65,2330 (21)* 65,2276 (24)*
Nº OBSERVACIONES 215 187 177 177 154
% DE CLASIFICADOS 47,44% 49,20% 49,72% 49,15% 49,35%
CORRECTAMENTE
Notas: Entre paréntesis aparecen los t-valores asintóticos en valor absoluto. Los coeficientes han sido
normalizados para el valor de FRAUDE=0. * Indica significación al 5%. ** Indica significación al 10%.
10
27. Defina la función de razón de fallo e indique para qué se usa. ¿Cómo es la función
de razón de fallo en el caso de una distribución exponencial?. ¿Qué significa?.
29. Para el modelo logit multinomial, deduzca la expresión del efecto marginal de un
cambio en la variables explicativa xk sobre la probabilidad de elección de la alternativa
j, de entre las J del conjunto de elección.
31. En un modelo logit multinomial no ordenado, hay tres alternativas (A, B y C),
actuando la tercera como categoría de referencia. Se ha estimado el modelo por máxima
verosimilitud, con los resultados siguientes:
⎛P ⎞
Ln⎜⎜ A ⎟⎟ = −0.5 − 0.8 x1 + 0.2 x2
⎝ PC ⎠
⎛P ⎞
Ln⎜⎜ B ⎟⎟ = −0.2 + 1.3x1 − 0.26 x2
⎝ PC ⎠
34. Con datos de una muestra de familias españolas (renta; número de miembros que
trabajan; habitat rural o urbano) queremos estimar la demanda de vivienda: gasto en
compra de vivienda. Especifique los posibles modelos que podría utilizar y discuta las
propiedades de unos y otros, indicando cuál prefiere y por qué.
35. Hemos estimado un modelo logit binomial por MV, con los siguientes resultados:
11
Constante 0.6 0.63
X1 -0.46 0.104 5
X2 0.72 0.032 4
VARIABLE Definición (para las variables dummy, categoría =1) Coeficiente Error estándar
CONSTANTE -23.15(*) 3.84
SEXO mujer 0.24 0.24
CASADO casado con esposo/a conviviente 1.13 1.13
OTRO separado, viudo, divorciado 1.09 1.47
E35-49 edad entre 35 y 49 años 0.08 0.3
E50-64 edad entre 50 y 64 años 0.61 0.41
E65 mas de 65 años 1.04 0.79
PUB1 1 hijo estudiando en la escuela pública 1.44(*) 0.34
PUB2 2 hijos estudiando en la escuela pública 1.39(*) 0.35
PUB3 3 hijos estudiando en la escuela pública 1.3(*) 0.42
PUB4 4 hijos estudiando en la escuela pública 2.0(*) 0.58
PUB5 5 o más hijos estudiando en la escuela pública 2.16(*) 0.79
PRIV 1 o mas hijos estudiando en la escuela privada -0.56 0.42
MAESTRO si es maestro en escuela pública o privada 3.07(*) 0.84
AÑOS Número de años que lleva viviendo en la región -0.02(*) 0.01
LRENTA LOG.(renta familiar anual en $) 2.14(*) 0.37
LPRECIO LOG(precio de la enseñanza pública en $) -1.21(*) 0.44
37. Tenemos los siguientes datos agrupados referidos a una muestra de 1000 empresas.
Suponemos que la probabilidad de “éxito” depende de X según un modelo logit. X es
una variable controlable por la empresa.
12
Número de grupo X Proporción muestral de éxitos
en el grupo
1 160 11
2 250 74
3 170 8
4 365 87
5 210 62
6 206 83
7 203 48
8 305 84
9 270 71
10 340 79
Se pide:
a) Si una empresa quiere alcanzar el éxito el 95% de las veces, ¿qué valor debe fijar
para X?.
b) Si cada unidad de X cuesta 20000 ptas., ¿puede esperar la empresa que alcanzará su
objetivo con un presupuesto de 8 millones de ptas.?.
c) Según el modelo estimado, ¿cuál es el valor marginal de la unidad 301 de X, en
términos del aumento de la probabilidad de éxito?.
Binomial :……
Multinomial no ordenado:……….
Multinomial ordenado:……….
NOTA: Se trata de definir su variable dependiente y dar una idea de las variables independientes que
podrían intervenir
39. Demuestra que en el modelo logit estimado por MV la suma de las probabilidades
estimadas por el modelo (para los n individuos de la muestra) es el número de
individuos con Y=1.
13
MLP PROBIT LOGIT MEDIA MUESTRAL
CONSTANTE -0.084 -1.763 -2.946
HIJOS -0.167 -0.486 -0.788 0.24
EDUCAC 0.04 0.122 0.201 12.3
EXPERI 0.018 0.055 0.096 10.6
43. Sea una variable Z distribuida N (µ ,σ ) . Se sabe que la esperanza truncada con
truncación inferior en el punto a=25 es igual a 6.85. El grado de truncación es del 90%.
Calcular µ y σ .
44. Si tenemos una muestra censurada, ¿qué crees que es mejor y por qué, estimar un
modelo de regresión truncado o un modelo tobit censurado?. Discuta la pregunta.
45. Una empresa de seguros encuentra que la probabilidad de poseer un seguro de hogar
frente a no poseerlo, puede escribirse mediante una relación lineal definida por el siguiente
modelo:
donde, si es una variable dicotómica que vale uno si el individuo i-ésimo posee un seguro y
cero en caso de no poseerlo; yi es la renta en miles de pesetas y Ei es la edad del asegurado.
Si la renta bruta anual fuese de 3 millones de pesetas y la edad del asegurado de 30 años,
entonces:
46. Se ha estudiado la posibilidad de que el hecho de que una familia tenga la vivienda
en propiedad o no (Y) dependa de variables como los ingresos (INGRESOS) de los
individuos (en miles de pesetas mensuales); si trabaja (TRABFIJO), que es una variable
dicotómica que toma el valor uno si el cabeza de familia trabaja y cero en caso
contrario; el sexo (SEXO), que también es dicotómica, tomando valor 1 si es hombre y
cero si es mujer; y la edad (EDAD), que representa la edad del cabeza de familia. El
siguiente cuadro recoge los valores de dichas variables para dos individuos elegidos al
azar de la muestra.
14
i Y Sexo Edad Ingresos Trabfijo
9 1 1 39 250 0
18 0 0 46 80 0
Se pide:
d) Calcular las probabilidad de tener vivienda en propiedad en los dos modelos y para
los dos individuos.
e) Calcular los ODDS de cada individuo, para cada modelo.
f) Calcular los efectos marginales para el individuo 9 en el modelo logit; y para el
individuo 18 en el modelo probit.
47. Realizar un breve comparación entre los algoritmos Scoring y Descenso Rápido.
y1 y2 x1 x2
y1 12 6 3 0
y2 6 16 2 4
x1 3 2 4 0
x2 0 4 0 1
Se pide:
49. Se ha relacionado el logaritmo del índice Financial Times (FT) con el logaritmo del
índice Dow Jones (DJ), y obtenido los siguientes resutados por MCO:
Estimación de la ecuación
Dependent Variable: LOG(FT)
Included observations: 153
Variable Coefficient Std. Error t-Statistic Prob.
C 1.098982 0.036141 30.40816 0.0000
15
LOG(DJ) 0.754361 0.007653 98.57209 0.0000
R-squared 0.984697 Mean dependent var 4.639985
Adjusted R-squared 0.984596 S.D. dependent var 0.395047
S.E. of regression 0.049031 Akaike info criterion -3.179754
Sum squared resid 0.363006 Schwarz criterion -3.140140
Se pide:
50. En el modelo TOBIT: yi* = xi' β + ui , cuando existe censura superior o inferior en
52. Un banco pretende caracterizar las empresas que cumplen puntualmente todos los
plazos de devolución de los créditos que reciben. Tras crear una variable Yi, que toma
valor 1 cuando las empresas cumplieron dichos compromisos y cero en caso contrario,
se estimaron los siguientes modelos:
pi
ln = −1.66 − 0.32 x1i + 0.62 x 2i − 0.90 x3i
1 − pi
donde x1i es el ratio (en porcentaje) entre el valor nominal de la deuda viva de la
empresa y el valor total del activo; x2i es el ratio (en porcentaje) entre los beneficios
después de impuestos y el valor total del activo; y x3i es el valor del activo (como
indicador del tamaño de la empresa).
Se pide:
16
incumplan los compromisos en ambos modelos. Además, Obtenga los efectos
marginales.
53. Realícese una comparación entre los algoritmos "Descenso Rápido" y "Gauss-
Newton".
54. Atendiendo al enunciado del ejercicio 49, se han obtenido los siguientes resultados,
aplicando el método bietápico de Engle y Granger.
Se pide
y1t + γ 21 y 2t + β 11 xt + u1t = 0
γ 12 y1t + y 2t + β 12 xt + u 2t = 0
Se pide:
y 2t = β 12 x1t + β 22 x 2t + u 2t
17
en el que E [u1t ] = E [u 2t ] = 0 , var(u1t ) = σ 12 , var(u 2t ) = σ 22 , cov(u1t , u 2t ) = 0 , y cuya
matriz de momentos (en desviaciones respecto a la media) es:
y1 y2 x1 x2
y1 120 80 20 45
y2 90 25 30
x1 10 5
x2 20
Se pide:
Se pide:
58. Suponga que una variable no observable, y i* , se encuentra censurada entre dos
puntos a y b, siendo a<b. ¿A qué será igual la media condicional de la variable
censurada en ambos lados?.
18
59. Se tiene la siguiente tabla de resultados para el modelo de regresión:
Se pide:
Se pide:
19
a) Evaluar la significación conjunta del modelo.
b) Estimar las probabilidades, para el individuo medio de la muestra, de ser
fumador, exfumador y nunca haber fumado.
c) Disponiendo de la siguiente información, evalúe las predicciones del modelo:
Frequencies of actual & predicted outcomes
Predicted outcome has maximum probability.
Predicted
------ --------------- + -----
Actual 0 1 2 | Total
------ --------------- + -----
0 1391 51 836 | 2278
1 342 102 452 | 896
2 793 38 2156 | 2987
------ --------------- + -----
Total 2526 191 3444 | 6161
Se pide:
20
a) Comente brevemente el método de estimación de Heckman. ¿Porqué se aplica
en este caso? y ¿Qué ratio inverso de Mills utilizaría en este modelo?.
b) Evalúe la significación de los coeficientes estimados. ¿Cuál es la interpretación
del parámetro de la variable SEXO y EDAD?.
c) ¿A qué es igual la estimación de ρ̂ ?. Por lo tanto, ¿cree usted que debería
aplicarse el modelo Tobit?.
d) ¿Cuál es el precio medio de mercado de la vivienda habitual en propiedad en
1998?.
63. Defina la función de razón de fallo e indique para qué se usa. ¿Cómo es la función
de razón de fallo en el caso de una distribución exponencial?. ¿Cuál es su significado en
este caso?.
64. Se tiene el siguiente modelo no lineal simple: y t = e β1xt + u t . Utilizando los mínimos
cuadrados no lineales, escriba los elementos del algoritmo de Newton-Raphson para la
primera iteración.
65. Demuestre que en el modelo logit binomial para N individuos, donde yi es una
variable endógena que toma valor 0 o 1, y la función índice es igual a I i = xi′β (siendo
xi′ un vector fila que contiene las características del i-ésimo individuo y β un vector de
parámetros desconocidos), la función de verosimilitud puede escribirse como:
N
∑ y i ( xi′ β )
∏ [1 + e β ].
N
x i′
L = e i =1
i =1
66. Suponga que existe censura superior e inferior en los puntos a y b. Construya, bajo
el supuesto de normalidad, el logaritmo de verosimilitud que permita, mediante su
maximización, la estimación de los parámetros en el modelo yi* = xi′β + ui .
21
Los resultados de la estimación máximo verosímil son:
+---------------------------------------------+
| Poisson Regression |
| Maximum Likelihood Estimates |
| Dependent variable DVISITS |
| Weighting variable ONE |
| Number of observations 1000 |
| Iterations completed 7 |
| Log likelihood function -973.6213 |
| Restricted log likelihood -1178.649 |
| Chi-squared 410.0552 |
| Degrees of freedom 6 |
| Significance level .0000000 |
| Chi- squared = 551.23707 RsqP= .4429 |
| G - squared = 699.07657 RsqD= .3697 |
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Constant -.7900618450 .11221447 -7.041 .0000
SEXO .2182756364E-01 .71371673E-01 .306 .7597 .48300000
EDAD .9496278280 .33929493 2.799 .0051 .41413000
EDAD2 .4508287253E-01 .43719734E-01 1.031 .3025 .26519850
RENTA .1594314240E-03 .24396592E-04 6.535 .0000 1442.4560
SPUB -.6376025892 .10604556 -6.013 .0000 .79700000
JUBIL 1.096445780 .20492877 5.350 .0000 .19700000
a) ¿Cuál es el valor medio del número de visitas al médico en las últimas dos
semanas?. ¿Y la varianza?.
b) ¿Cuál es el efecto marginal de la variable EDAD?.
c) ¿Cuál es la probabilidad de que el individuo medio no haya ido al médico en
los últimos quince días?. Y, ¿que haya ido 3 veces?.
68. ¿Cuál es el modelo probabilístico que especifica una razón de fallo constante?. Para
dicho modelo, aplicado a la duración de la carrera de Económicas, se tiene que la duración
media estimada de la carrera es 5,2 años. Calcula el valor estimado de la función de
supervivencia para t=4 años e interpreta el resultado.
xtλ − 1
69. Suponga el siguiente modelo: yt = α + β g ( xt ) + ut , donde g (xt ) = . Demuestre
λ
si existe o no, una solución analítica al problema de maximización de la función del
logaritmo de verosimilitud.
70. Se tiene el siguiente modelo no lineal simple: yt = xtβ1 + ut . Utilizando los mínimos
cuadrados no lineales, escriba los elementos del algoritmo de Gauss-Newton para la
primera iteración.
IS : yt = α 0 + α1rt + u1t
LM : yt = β 0 + β1M t + β 2 rt + u2t
22
entre los errores de ambas ecuaciones se denota por σ 12 . ¿A qué es igual el sesgo de
α̂ 1 ?.
72. Sea yi = 0,1,2,...,10 el número de veces que las personas han visitado un
determinado balneario durante los dos últimos años. Se estima un modelo de Poisson
considerando como variable explicativa el número de noches de estancia en ese lugar.
Los resultados de máxima verosimilitud así como un listado para las primeras 10
observaciones de la muestra son los siguientes:
+---------------------------------------------+
| Poisson Regression |
| Maximum Likelihood Estimates |
| Dependent variable VECES |
| Weighting variable ONE |
| Number of observations 3831 |
| Iterations completed 7 |
| Log likelihood function -7247.789 |
| Restricted log likelihood -7518.572 |
| Chi-squared 541.5661 |
| Degrees of freedom 1 |
| Significance level .0000000 |
| Chi- squared = 12900.53321 RsqP= .0628 |
| G - squared = 10168.03678 RsqD= .0506 |
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Constant -.3276808869 .24715869E-01 -13.258 .0000
NOCHES .4537878664E-01 .15657352E-02 28.982 .0000 10.552858
Observation Observed Y Predicted Y Residual x(i)b
1 .00000 .99002 -.9900 -.0100
2 .00000 .99002 -.9900 -.0100
3 .00000 .99002 -.9900 -.0100
4 .00000 1.0360 -1.0360 .0353
6 .00000 .99002 -.9900 -.0100
7 3.0000 .99002 2.0100 -.0100
8 .00000 1.1871 -1.1871 .1715
9 7.0000 1.0360 5.9640 .0353
10 2.0000 .99002 1.0100 -.0100
Se pide:
e1′e1 = 491649.7 y e2′ e2 = 495026.3 son las sumas de cuadrados de los errores en el
primer y segundo modelo, respectivamente. [NOTA: El lado derecho de ambas
ecuaciones, tanto la constante en la primera ecuación como λ̂i en la segunda ecuación,
está dividido por 2 ].
23
y1t = α1 + β1 x1t + u1t
y2t = β 2 x2t + u2t
Se pide:
a) ¿Qué significa que la tasa hazard sea igual a 0.0032?. Y, ¿Qué significa que la tasa de
supervivencia sea igual a 0.1139?.
c) ¿Qué significa que el número de individuos censurados sea 5?.
77. Atendiendo al enunciado del ejercicio 61, se trata de especificar y estimar un modelo que
explique la cantidad invertida en la vivienda habitual por parte de las familias. La estimación del
modelo en dos etapas de Heckman obtiene los siguientes resultados.
+---------------------------------------------+
| Binomial Probit Model |
| Maximum Likelihood Estimates |
24
| Dependent variable PROPIE |
| Weighting variable ONE |
| Number of observations 1123 |
| Iterations completed 7 |
| Log likelihood function -373.0777 |
| Restricted log likelihood -745.3807 |
| Chi-squared 744.6061 |
| Degrees of freedom 2 |
| Significance level .0000000 |
| Results retained for SELECTION model. |
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Index function for probability
Constant -2.227412200 .14573711 -15.284 .0000 .
TRABFIJO 1.021115011 .12018962 8.496 .0000 .65805877
INGRESO .6585780215E-05 .39261072E-06 16.774 .0000 398436.14
+----------------------------------------------------------+
| Sample Selection Model |
| Probit selection equation based on PROPIE |
| Selection rule is: Observations with PROPIE = 1 |
| Results of selection: |
| Data points Sum of weights |
| Data set 1123 1123.0 |
| Selected sample 697 697.0 |
+----------------------------------------------------------+
+-----------------------------------------------------------------------+
| Sample Selection Model |
| Two stage least squares regression Weighting variable = none |
| Dep. var. = LPRECIO Mean= 16.18272434 , S.D.= .8333333897 |
| Model size: Observations = 697, Parameters = 9, Deg.Fr.= 688 |
| Residuals: Sum of squares= 290.2310590 , Std.Dev.= .64950 |
| Fit: R-squared= .391667, Adjusted R-squared = .38459 |
| (Note: Not using OLS. R-squared is not bounded in [0,1] |
| Model test: F[ 8, 688] = 55.37, Prob value = .00000 |
| Diagnostic: Log-L = -683.6765, Restricted(b=0) Log-L = -861.4217 |
| LogAmemiyaPrCrt.= -.850, Akaike Info. Crt.= 1.988 |
| Standard error corrected for selection..... .68767 |
| Correlation of disturbance in regression |
| and Selection Criterion (Rho).............. .65910 |
+-----------------------------------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Constant 1.753797810 1.3912725 1.261 .2075 .
TRABFIJO .4356437681 .68409420E-01 6.368 .0000 .73027260
SEXO -.5062113124E-01 .66550751E-01 -.761 .4469 .83500717
EDAD .8875735718E-02 .24876340E-02 3.568 .0004 41.364419
HIJOS -.7482653581E-01 .18528622E-01 -4.038 .0001 1.8952654
EDUCA .2583800339E-01 .95730846E-02 2.699 .0070 13.298422
MOVIL .1485053775E-02 .21997061E-02 .675 .4996 35.981349
LINGRESO 1.029119343 .10064208 10.226 .0000 13.015925
LAMBDA .4532492445 .15652247 2.896 .0038 .29951337
Se pide:
d) ¿Cuál es la probabilidad de que el individuo medio tenga la vivienda en
propiedad?.
e) ¿Y si el individuo medio tuviese un ingreso anual de 5 millones y tuviera
trabajo fijo?.
f) ¿Existe sesgo de selección?. Explique brevemente el truncamiento selectivo
en términos de este modelo.
78. Sea el siguiente sistema de ecuaciones aparentemente no relacionadas:
25
y1t = γ 1 y 2t + β 11 x1t + u1t
y 2t = γ 2 y1t + β 22 x 2t + β 32 x3t + u 2t
Estimar por MCI las ecuaciones del modelo, conociendo la siguiente matriz de
productos cruzados de las variables:
y1 y2 x1 x2 x3
y1 20 6 4 3 5
y2 10 3 6 7
x1 5 2 3
x2 10 8
x3 15
MODELO II
+---------------------------------------------+
| Multinomial Logit Model |
| Maximum Likelihood Estimates |
| Dependent variable VECES |
| Weighting variable ONE |
| Number of observations 2703 |
| Iterations completed 6 |
| Log likelihood function -1744.843 |
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Characteristics in numerator of Prob[Y = 1]
Constant -1.003536689 .10705899 -9.374 .0000
NOCHES .1276876219 .10680396E-01 11.955 .0000 10.794673
GASTOS -.6216886838E-06 .16365883E-06 -3.799 .0001 77314.730
26
5 .00000 .00000 .0000 -.1098 .4726
6 1.0000 .00000 1.0000 -.1100 .4725
7 1.0000 .00000 1.0000 -.1099 .4726
8 1.0000 1.0000 .0000 .7837 .6865
9 1.0000 .00000 1.0000 -.2375 .4409
10 1.0000 .00000 1.0000 -.1100 .4725
11 1.0000
12 1.0000 .00000 1.0000 -.1100 .4725
13 1.0000 .00000 1.0000 -.1099 .4726
14 1.0000 1.0000 .0000 .9113 .7133
15 1.0000 1.0000 .0000 .7835 .6864
16 .00000 .00000 .0000 -.2375 .4409
17 1.0000 .00000 1.0000 -.1099 .4726
18 .00000 .00000 .0000 -.1102 .4725
19 1.0000 1.0000 .0000 .7835
20 1.0000 .00000 1.0000 -.1099
Se pide:
1.1) (0.5 puntos) Demuestre que el odd de un modelo logit binomial de k-variables
explicativas no es independiente del resto de las variables (tanto continuas como
discretas). Justifique su respuesta.
1.2) (0.25 puntos) Sea Φ −1 ( pi ) = 0 . ¿Cuánto vale la probabilidad?. Y, ¿Si
p
ln i = 0 ?.
1 − pi
1.3) (0.25 puntos) En un modelo logit multinomial con tres alternativas ( j = 0,1,2 ), ¿A
qué es igual el odd-ratio entre la alternativa 0 y 2?. Justifique su respuesta.
1.4) (0.5 puntos) En el modelo de Poisson, si xi′β = ln β 0 , siendo β 0 una constante, ¿A
qué es igual P(Yi ≤ 1) sabiendo que yi = 0,1,2,3,4,5,6 ?. Justifique su respuesta.
1.5) (0.5 puntos) Es cierta la afirmación de que en un modelo de regresión truncado, sea
el truncamiento superior o inferior, el efecto marginal no es inferior con respecto
al caso en que no exista truncamiento. Justifique su respuesta.
27
1.6) (0.5 puntos) Sea y una variable censurada inferiormente en 0. Si esta variable es
N (0,1) , entonces, ¿A qué es igual E [ y ] ?.
1.7) (0.5 puntos) Sea x ~ U (0,1) una variable aleatoria truncada superiormente en el
⎡ 1⎤
punto 1 3 y f (x ) = 1 , ¿Cuánto vale E ⎢ x x < ⎥ ?.
⎣ 3⎦
1.8) (0.5 puntos) En un sistema de dos ecuaciones SUR, cuando X 1 = X 2 = X 0 , es
decir, todos los regresores contenidos en X i son iguales para las 2-ecuaciones,
¿A qué es igual el estimador MCO?. ¿Coincide con el estimador MCO de
ecuación por ecuación?. ¿Es eficiente?. Justifique su respuesta.
1.9) (0.25 puntos) Los métodos de estimación de información completa en los modelos
de ecuaciones simultáneas son, en general: (a) Sesgados e ineficientes
asintóticamente; (b) Sesgados, consistentes pero ineficientes asintóticamente; (c)
Sesgados, inconsistentes y eficientes asintóticamente; (d) Ninguna de las
anteriores. ¡Elegir una respuesta!.
1.10) (0.25 puntos) ¿Bajo qué condiciones coinciden el estimador MC2E y MC3E?.
Enumere al menos dos condiciones.
83. Suponga los siguientes datos de un modelo de Poisson que trata de explicar la
incidencia de la antigüedad de los barcos sobre el número de accidentes navales ( y i ).
Estos datos son:
Barco yi ( xi′ β̂ )
1 0 1.79
2 0 1.78
3 3 1.85
4 4 1.85
5 6 1.87
Calcular la probabilidad asociada al número de accidentes del 3er y 4º barco así como el
efecto marginal que les corresponde, sabiendo que el coeficiente de la variable que
representa la antigüedad de los barcos es 0.00006.
84. Se dispone de información sobre las siguientes variables: MODE, que es una
variable dicotómica 0/1 para cuatro alternativas: 1=avión, 2=tren, 3=bus, 4=coche;
TTME, es el tiempo de espera en la terminal (aeropuerto o estación) en minutos; GC,
es una medida del coste total, calculada como la suma del precio o coste directo del
transporte más el coste de oportunidad del tiempo del viaje; HINC, es la renta familiar
en miles de u.m.; AASC, es una variable ficticia que recogerá la constante específica de
la alternativa Avión; TASC, es una variable ficticia que recogerá la constante específica
de la alternativa Tren; BASC, es una variable ficticia que recogerá la constante
específica de la alternativa Bus; y T_HINC es HINC x TASC. Se obtienen los
siguientes resultados de la estimación de un logit condicional:
+---------------------------------------------+
| Discrete choice (multinomial logit) model |
| Maximum Likelihood Estimates |
| Dependent variable Choice |
| Weighting variable ONE |
| Number of observations 210 |
| Iterations completed 6 |
| Log likelihood function -191.3419 |
| Log-L for Choice model = -191.3419 |
| R2=1-LogL/LogL* Log-L fncn R-sqrd RsqAdj |
| No coefficients -291.1218 .34274 .33642 |
| Constants only -283.7588 .32569 .31920 |
28
| Response data are given as ind. choice. |
| Number of obs.= 210, skipped 0 bad obs. |
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
TTME -.0979 .10528918E-01 -9.251 .0000
GC -.0114 .45838244E-02 -2.491 .0128
AASC 5.7753 .66299023 8.711 .0000
TASC 5.2830 .59420314 8.891 .0000
BASC 3.2163 .45585715 7.056 .0000
T_HINC -.0476 .12376830E-01 -3.843 .0001
+-----------------------------------------------------------------------+
| Dependent variable is binary, y=0 or y not equal 0 |
| Ordinary least squares regression Weighting variable = none |
| Dep. var. = TAX Mean= .6375000000 , S.D.= .4837550902 |
| Model size: Observations = 80, Parameters = 5, Deg.Fr.= 75 |
| Residuals: Sum of squares= 15.35904939 , Std.Dev.= .45253 |
| Fit: R-squared= .169220, Adjusted R-squared = .12491 |
| Model test: F[ 4, 75] = 3.82, Prob value = .00703 |
| Diagnostic: Log-L = -47.5022, Restricted(b=0) Log-L = -54.9178 |
| LogAmemiyaPrCrt.= -1.525, Akaike Info. Crt.= 1.313 |
+-----------------------------------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Constant -.6501299531E-01 1.4267090 -.046 .9637
PRIV -.2026390498 .15401512 -1.316 .1883 .12500000
YRS -.3577810684E-02 .55246021E-02 -.648 .5172 8.7750000
INC .4727635679 .14558071 3.247 .0012 9.9677200
PTAX -.5698400912 .18646276 -3.056 .0022 6.9372738
Normal exit from iterations. Exit status=0.
+---------------------------------------------+
| Binomial Probit Model |
| Maximum Likelihood Estimates |
| Dependent variable TAX |
| Weighting variable ONE |
| Number of observations 80 |
| Iterations completed 5 |
| Log likelihood function -44.60409 |
| Restricted log likelihood -52.38744 |
| Chi-squared 15.56671 |
| Degrees of freedom 4 |
| Significance level .3659252E-02 |
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Index function for probability
Constant -1.438212331 4.5332519 -.317 .7510
PRIV -.6254668928 .45015770 -1.389 .1647 .12500000
YRS -.9763633978E-02 .16139813E-01 -.605 .5452 8.7750000
INC 1.678640394 .58167049 2.886 .0039 9.9677200
PTAX -2.123845389 .75134583 -2.827 .0047 6.9372738
Frequencies of actual & predicted outcomes
Predicted outcome has maximum probability.
29
Predicted
------ ---------- + -----
Actual 0 1 | Total
------ ---------- + -----
0 12 17 | 29
1 7 44 | 51
------ ---------- + -----
Total 19 61 | 80
Se pide:
Se pide:
87. Suponga que un individuo tiene la posibilidad de elegir entre dos alternativas (=1 si
la elige, =0 en caso contrario). Suponga también que los datos muestrales de 14
individuos se agrupan en 5 grupos para la variable x j . Estos datos aparecen resumidos
30
en la siguiente tabla para las proporciones muestrales p̂ j , los valores de x j , las
puntuaciones x′j βˆ = βˆ0 + βˆ1 x j y el tamaño muestral de cada grupo n j .
p̂ j xj x ′j β̂ nj
0.84 6 1.72 3
0.10 4 -2.17 2
0.15 3 -1.66 4
0.95 8 3.00 3
0.98 10 4.30 2
Se pide que, con los datos anteriores, escriba la expresión del estimador eficiente
usando esta información -en su forma matricial-, que es necesaria para estimar un
modelo probit con observaciones repetidas.
88. Un estadio de fútbol, con capacidad para 60000 espectadores, se ha llenado el 25%
de los partidos en él celebrados a lo largo de la competición, con una cifra media de
asistencia (incluidos los partidos en los que se llenó el estadio) de 40000 espectadores.
¿Cómo estimaría la media y varianza de la demanda de localidades?. ¿Cómo cambiaría
su respuesta si la cifra de 40000 espectadores no incluyese los partidos en que se llenó
el estadio?. Justifique brevemente su respuesta.
89. El logaritmo de la variable ingresos tiene distribución normal, y = log x , con media
µ y desviación σ . Sabiendo que el grado de truncamiento es del 98% y que los
ingresos de todos los hogares encuestados están por encima de 100000 euros con media
de 142000 euros para los más acaudalados, tal que:
E [ y y > log100] = log142 ≡ E [ y y > 4.605] = 4.956 , ¿Cuál es el valor de µ y σ ?. ¿Y
el ingreso medio?.
ct = α1 yt + α 2 mt −1 + u1t
it = β1 yt + β 2 rt + u2t
yt ≡ ct + it
donde las variables endógenas son c t (consumo), ii (inversión) e yt (renta). Las otras
variables son predeterminadas ( rt es el tipo de interés, y mt es la masa monetaria), y uit ,
(
i=1,2, los residuos de ambas ecuaciones, distribuidos iid 0,σ i2 . Se pide:)
a) Identificar el modelo.
b) Obtener la forma reducida para la ecuación de consumo, inversión y renta.
31
PARTE II
a) En promedio y ceteris paribus los chicos tienen 0.8 puntos menos de media de
expediente que las chicas.
b) Considerando solo la población de alumnos cuya nota media es igual o mayor
que 6, en promedio y ceteris paribus los chicos tienen 0.8 puntos menos de
media de expediente que las chicas.
c) Como el estimador de MCO coincide en este caso particular con el de MV (por
el teorema de Frobenius), podemos hacer inferencia a la población, pero solo a
la de mujeres ya que para ellas GENERO=0.
32
d) Ninguna de las anteriores.
5. Sea un modelo de probabilidad lineal dicotómico con una sola variable explicativa X:
Yi = α + βX i + U i .
8. Hemos estimado un modelo logit binomial por MV, con los siguientes resultados:
a) 0.6
b) 1.5
33
c) 0.08949
d) 0.817574
a) Pij (1 − Pij ) β jk .
J −1
b) Pij ( β ik − ∑ Pij β jk ) .
h =1
2
c) Pij ( β jk − ∑ Pih β hk ) .
h =1
d) Ninguna de las anteriores.
a) Una variable solo se observa si otra variable con la que está correlacionada está
por debajo de un valor fijo dado.
b) Una variable solo se observa si otra variable con la que está correlacionada está
por encima de un valor fijo dado.
c) Es un modelo de regresión que mezcla el truncamiento con la censuración.
d) Es un modelo de regresión que ha pasado una selectividad previa de forma que
los valores que no alcancen un determinado nivel de la variable endógena no
pueden entrar en la muestra.
12. Una variable X está distribuída N(200, 120). Está censurada inferiormente en el
punto a=200. La esperanza de la distribución censurada es:
a) 295.7461.
b) 312.8446.
c) 162.7740.
d) 185.3312.
13. Con datos de las 3000 mayores empresas españolas por volumen de ventas
queremos estimar un modelo explicativo de las ventas (en logaritmo) válido para todas
las empresas españolas, en función de los gastos en publicidad, la plantilla, dummies de
sector y algunos ratios financieros. En este caso:
34
a) Los estimadores MCO son ELIO pero deben obtenerse mediante un algoritmo
iterativo de optimización no lineal.
b) Habrá que utilizar MCG porque las perturbaciones son heterocedásticas.
c) Como es una muestra censurada, debemos emplear el modelo tobit y estimarlo
por MV.
d) Como es una muestra truncada, debemos obtener el estimador MV del modelo
de regresión truncada.
14. Considera la elección por el consumidor racional entre una cesta compuesta de
bienes y las horas semanales de ocio. El IRPF grava en un porcentaje fijo las rentas del
trabajo pero hay un mínimo exento:
15. Sea una distribución normal de media 20 y desviación igual a 15, truncada
superiormente en el punto 30:
17. Sea un modelo de oferta laboral de mujeres casadas, que explica las horas anuales
trabajadas a partir de una muestra aleatoria de la población que contiene trabajadoras y
no trabajadoras. Una estrategia adecuada (consistente) de estimación de los efectos del
número de hijos pequeños sobre las horas ofertadas es:
35
a) Estimar por MV un modelo de dos ecuaciones, una probit que estima la
probabilidad de trabajar y otra censurada (censuración incidental según la
primera ecuación) que estima las horas ofertadas.
b) Estimar por MV un modelo de regresión truncada, con truncación inferior en
cero horas trabajadas.
c) Estimar por MV un modelo tobit de regresión censurada, con censuración
inferior en cero horas trabajadas.
d) Estimar primero por MCO un modelo de salarios con la submuestra de
trabajadoras y luego un modelo de regresión censurada de las horas trabajadas
en el que los salarios sombra figuren como explicativos.
19. En las dos preguntas siguientes sólo una de las alternativas es FALSA. Debes
señalar la alternativa FALSA:
2) El modelo de Cox:
36
a) La muestra constituye dos grupos, según la elección que hayan realizado.
b) Los datos se agrupan previamente para evitar la heterocedasticidad.
c) Hay grupos de individuos idénticos en las características X, que son cualitativas
o discretas.
d) Las observaciones repetidas sobran y por tanto se borran del fichero.
a) Tanto el MLP como el modelo logit se pueden estimar eficientemente por MCO.
b) Para estimar el modelo logit hay que emplear el método de máxima
verosimilitud.
c) Tanto el MLP como el modelo logit se pueden estimar eficientemente por MCG,
introduciendo información sobre las varianzas (heterocedásticas) de las
perturbaciones aleatorias de cada clase.
d) Ninguna de las anteriores.
37
25. Un modelo logit multinomial no ordenado estima las probabilidades de elección
entre J alternativas exhaustivas y mutuamente excluyentes. Para ello
29. Queremos estimar los determinantes de la elección de centro comercial para hacer la
compra mensual de alimentación de las familias de una gran ciudad. Hay cuatro
grandes centros comerciales. Las variables explicativas son un índice de precios
relativos, la distancia en kilómetros desde el hogar y la renta familar. Un modelo
adecuado para esta situación es:
38
30. Hemos estimado un modelo logit multinomial no ordenado con tres alternativas de
elección (1,2,3). Tomando como referencia la alternativa 1, los coeficientes estimados
de X, en las dos ecuaciones son respectivamente 1.2 y -0.8. Si volviéramos a estimar el
modelo tomando como referencia la alternativa 3:
a) Los dos estimadores serían iguales a los obtenidos pero con los signos
cambiados.
b) El estimador en la ecuación de Y=1 sería 0.8 y en la ecuación de Y=2 sería 2.
c) El estimador en la ecuación de Y=1 sería -1.2 y en la ecuación de Y=2 sería 0.4.
d) El estimador en la ecuación de Y=1 sería 0.4 y en la ecuación de Y=2 sería -1.2.
39
b) Indica que el odd entre dos alternativas solo depende de los atributos del
individuo y de los vectores de coeficientes de las ecuaciones
correspondintes a dichas alternativas.
c) Es una hipótesis que permite considerar la existencia de alternativas de
elección sustitutivas y complementarias.
d) Es una hipótesis en muchos casos poco realista pero desafortunadamente no
puede contrastarse.
a) 0.03588.
b) 0.08526.
c) 0.12526.
d) No se puede calcular con los datos de la tabla.
40