Ejercicios Econometria III PDF

EJERCICIOS PROPUESTOS DE
ECONOMETRIA III
MODELOS DE RESPUESTA CUALITATIVA

Y
MODELOS DE VARIABLE DEPENDIENTE LIMITADA
Por
Beatriz GONZÁLEZ LÓPEZ-VALCÁRCEL
Jorge V. PÉREZ RODRÍGUEZ
(LICENCIATURA EN ECONOMIA)
Octubre 2007
PARTE I.
PROBLEMAS PROPUESTOS
1. Una empresa de seguros encuentra que la probabilidad de poseer un seguro de hogar

frente a no poseerlo, puede escribirse mediante una relación lineal definida por el siguiente
modelo:
sî = 0.07 + 0.0002 y i + 0.004 Ei
donde, si es una variable dicotómica que vale uno si el individuo i-ésimo posee un seguro y
cero en caso de no poseerlo; yi es la renta en miles de pesetas y Ei es la edad del asegurado.
Si la renta bruta anual fuese de 4 millones de pesetas y la edad del asegurado de 30 años,
entonces:
a) ¿Cuál es la probabilidad de NO poseer un seguro?.

b) ¿Cuál es el incremento de probabilidad, si la renta de dicho individuo aumentase en
200.000 pesetas?.
2. Se ha estudiado la posibilidad de que el hecho de que una familia tenga la vivienda en

propiedad o no (Y) dependa de variables como los ingresos de los individuos
(INGRESOS, en miles de pesetas mensuales); si trabaja (TRABFIJO), que es una
variable dicotómica que toma el valor uno si el cabeza de familia trabaja y cero en caso
contrario; el sexo (SEXO), que también es dicotómica, tomando valor 1 si es hombre y
cero si es mujer; y la edad (EDAD), que representa la edad del cabeza de familia. El
siguiente cuadro recoge los valores de dichas variables para dos individuos elegidos al
azar de la muestra.
i Y Sexo Edad Ingresos Trabfijo

9 1 1 39 250 0
18 0 0 46 80 0
Además, se conocen los siguientes resultados de la estimación de un modelo logit y

probit:
Variables Logit Probit

Constante -4.73 -2.66
Sexo 0.16 0.16
Edad 0.01 0.004
Ingresos 0.0194 0.0113
Trabfijo 0.02 0.015
Se pide:
a) Calcular las probabilidad de tener vivienda en propiedad en los dos modelos y para
los dos individuos.
b) Calcular los ODDS de cada individuo, para cada modelo.
c) Calcular los efectos marginales para el individuo 9 en el modelo logit; y para el
individuo 18 en el modelo probit.
1
3. Obtener la expresión del algoritmo de Newton-Raphson mediante los minimos
cuadrados, y para el modelo: yt = αe βxt + ut , siendo ut una perturbación aleatoria iid.
4. Un banco pretende caracterizar las empresas que cumplen puntualmente todos los
plazos de devolución de los créditos que reciben. Tras crear una variable Yi, que toma
valor 1 cuando las empresas cumplieron dichos compromisos y cero en caso contrario,
se estimaron los siguientes modelos:
Yi = 0.069 − 0.018 x1i + 0.049 x 2i + 0.057 x3i
pi
ln = −1.66 − 0.32 x1i + 0.62 x 2i − 0.90 x3i
1 − pi
donde x1i es el ratio (en porcentaje) entre el valor nominal de la deuda viva de la
empresa y el valor total del activo; x2i es el ratio (en porcentaje) entre los beneficios
después de impuestos y el valor total del activo; y x3i es el valor del activo (como
indicador del tamaño de la empresa).
Se pide:
a) ¿Qué modelos han sido estimados?.

b) Interprétense los coeficientes estimados en ambos modelos.
c) Suponga que el individuo i-ésimo posee los siguientes valores de las
variables: x1i = 9.7% , x 2i = 7.8% , x3i = 0.6 . Calcule la probabilidad de que se
incumplan los compromisos en ambos modelos. Además, obtenga los efectos
marginales.
5. En una encuesta realizada en junio de 2001 a diez alumnos de 4º curso se les

preguntó si aprobaron o no la asignatura de Macroeconomía, así como la calificación
que obtuvieron en la asignatura de Econometría, con los siguientes resultados:
Aprobaron Calificación
Macroeconomía Econometría
Sí 8
Sí 8
No 6
Sí 6
No 6
No 5
Sí 5
Sí 4
No 4
No 4
Se pide:
a) Especificar y estimar por mínimos cuadrados ordinarios un modelo lineal que evalúe
el efecto que la calificación de Econometría tiene sobre la probabilidad de aprobar
Macroeconomía.
2
b) Interpretar los valores estimados para cada uno de los coeficientes del modelo.
¿Cuál es la calificación que debe alcanzarse en Econometría para tener una
probabilidad de 0.80 de aprobar Macroeconomía?.
c) Obtener una estimación eficiente del modelo especificado en a).
d) Si un alumno obtuvo 9.5 en Econometría, ¿Cuál es la probabilidad de aprobar
Macroeconomía?.
6. Demostrar que las estimaciones de mínimos cuadrados ordinarios de los modelos

lineales de probabilidad en el caso de alternativas múltiples:
Pi1 = α 1 + β 1 x i + u i1
Pi 2 = α 2 + β 2 xi + u i 2
Pi 3 = α 3 + β 3 xi + u i 3
3 3
satisfacen ∑α
i =1
i = 1y ∑β
i =1
i =0.
7. Sea N 1 el número de individuos con Yi = 1 y N 2 el número de individuos con Yi = 0 ,

N
∑ (Y − Pî ) .
N 2
demostrar que el R 2 de Effron es equivalente a 1 − i
N1 N 2 i =1
8. Suponga una distribución z ~ N (µ , σ ) , la cuál se encuentra truncada en el punto

4.605. Se sabe que E [z z > 4.605] = 4.956 y el grado de truncamiento es del 95%. Calcule
µ yσ.
9. Suponemos que la demanda de entradas a los conciertos (VENTAS) que se celebran

en una ciudad depende del precio (PRECIO), de las condiciones meteorológicas
(METEO), que pueden ser favorables (0) o desfavorables (1) y del renombre del grupo
que actúa, medido en una escala de 1 a 5 (RATING). Los conciertos se celebran en un
recinto que tiene capacidad para 23.000 espectadores.
Se ha estimado el modelo y los resultados son:

+---------------------------------------------+
| Limited Dependent Variable Model - CENSORED |
| Maximum Likelihood Estimates |
| Dependent variable VENTAS |
| Weighting variable ONE |
| Number of observations 90 |
| Iterations completed 6 |
| Log likelihood function -522.4057 |
| Threshold values for the model: |
| Lower=-infinity Upper=23000.0000 |
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Primary Index Equation for Model
Constant 29588.03508 590.39079 50.116 .0000
PRECIO -4.879326375 .16399481 -29.753 .0000 2952.8667
RATING 1940.032493 122.51143 15.836 .0000 3.1555556
METEO -4513.019466 268.57781 -16.803 .0000 .18888889
Disturbance standard deviation
Sigma 923.1196055 81.283308 11.357 .0000
Se pide:
a) Calcular los efectos marginales evaluados en la media de las variables.
3
b) Si un grupo posee un rating igual a 5, y actúa en un día con meteorología favorable
y un fan paga un precio de 5000 ptas., ¿cuáles son las predicciones de la ventas
considerando la censura?.
10. En el modelo TOBIT: yi* = xi' β + ui , ¿A qué será igual el valor obtenido para
[ ]
∂E y i / xi , y i* > 0
?. ¿Y si
[ ]
∂E yi / xi , y i* < 0
?.Demostrarlo en ambos casos.
∂xi ∂xi
11. Una muestra de 2000 individuos se dispone para las siguientes variables: CRi son los
créditos personales (es una variable dicotómica que toma valor 1 si el crédito no resulta
fallido y 0 en caso contrario); RNi es la renta anual en miles de dólares; TCi es el número
de tarjetas de crédito (es una variable dicotómica que toma valor 1 si el individuo las posee
y 0 si no las tiene) y EDi es la edad del cabeza de familia. Se estima el siguiente modelo de
probabilidad lineal:
CRI = 0.07 + 0.02 RN I + 0.004 EDI + 0.14TC I
Se pide:
a) Interpretar los parámetros de este modelo.

b) Si el individuo i-ésimo tiene 54 años, posee 10000 dólares y tiene tarjeta de crédito
¿cuál es la probabilidad de que si se le concede un crédito éste no resulte fallido?.
12. Un análisis empírico trata de estudiar los factores explicativos del empleo juvenil. Con
esta finalidad, se especifica un modelo probit donde la variable depediente representa el
status que tienen en la fuerza laboral los jóvenes de una muestra con edades comprendidas
entre 16-21 años. Esta variable se define como status (1=ocupado, 0=parado). Las
variables explicativas utilizadas son las siguientes variables dicotómicas: sexo (1=varón),
estudios (1=superiores o medios), residencia (1=urbana), edad1 (1=16-17), edad2 (1=18-
19). Los resultados proporcionados en el análisis son:
Parámetro Beta e.s. beta e.s.

Constante 0.50 0.02 0.80 0.01
Sexo 1.05 0.08 -- --
Estudios 1.27 0.08 -- --
Residencia 0.06 0.09 -- --
Edad1 -0.65 0.23 -- --
Edad2 -0.14 0.08 -- --
Log.F.V. -200.3 -210.3
a) ¿Qué se trata de explicar con este modelo?, ¿Qué significado tienen los parámetros
estimados?, ¿Podemos decir que el modelo es significativo?.
b) Comente, de manera breve, las características y/o diferencias del modelo probit
respecto a otros modelos susceptibles de aplicarse a este tipo de datos.
( )
c) Teniendo en cuenta la siguiente información, f xI' β = 0.2 , donde f es función de
densidad evaluada en x, ¿podría calcular la tasa de discriminación laboral sufrida por
las mujeres respecto a los hombres?.
4
13. Con los resultados de una encuesta de la Fundación FOESSA realizada en 1960, se
elabora un modelo logit para explicar la posesión o no de un autómovil en un colectivo de
2414 personas. Como variable explicativa se considera la autoasignación de los individuos
a una clase social. Las clases son: alta, media alta, media, media baja y baja. Se obtienen
los siguientes resultados:
yî = 1.22 − 1.68D1i − 2.88D2i − 4.17 D3i − 11.69 D4i

(e.s.) (0.51) (0.52) (0.52) (0.52) (10.46)
siendo, D1 (1=clase media alta), D2 (1=clase media), D3 (1=clase media baja) y D4 (clase
baja). Calcular la probabilidad que pronostica el modelo para la posesión de automóvil en
cada una de las cinco clases.
14. En el análisis de los resultados de un plan de ocupación en donde la variable

dependiente Y se le asigna el valor 1 cuando el individuo ha encontrado trabajo y 0, en
caso contrario; se especifica un modelo logit que incorpora, además de un término
independiente, las siguientes variables explicativas: la edad del individuo (Et) y la
experiencia profesional (EPt). Con este objetivo, se realiza una encuesta a 379 individuos,
obteniendo la siguiente información:
E=0,EP=0 E=0,EP=1 E=1,EP=0 E=1,EP=1 Total

Respuestas 68 50 14 19 151
Afirmativas (Y=1)
Total Respuestas 89 83 43 164 379
Donde: Et=1 para más de 40 años, y 0 para menos de 40 años. EPt=1 sin experiencia, y 0
con experiencia. Se pide:
a) Si con los datos de la encuesta tuviera que estimar el modelo, escriba los elementos de
la matriz de datos X y los del vector de la variable endógena del modelo necesarios
para dicho fin.
b) Una vez realizada la estimación por el método de máxima verosimilitud, se obtienen

las siguientes estimaciones de los parámetros (entre paréntesis aparecen los errores
estándar):
βˆ0 = 1.30(0.22), βˆ1 = −2.23(0.26), βˆ2 = −0.98(0.26 )
¿Cuál será la probabilidad estimada por el modelo de que encuentre trabajo un

individuo menor de 40 años y sin experiencia?.
15. Se quiere estudiar si los clientes de un banco utilizan o no los cajeros automáticos. El
estudio se hace para una muestra de 100 individuos. Se pide:
a) Proponer un modelo logit que estudia esta relación en función de si los clientes tienen
más o menos de 35 años, de si su nivel de ingresos anuales es superior o no a
1.750.000 ptas y del nivel de movilidad del cliente. (NOTA: Se considera que un
cliente es móvil si en el periodo de 10 años ha vivido como mínimo en tres ciudades).
5
Definir las variables de manera que la categoría base sea un individuo de menos de 35
años, no móvil y con un nivel de ingresos menor a 1.750.000.
b) Comenta los problemas de la estimación por MCO de este modelo y las posibles
soluciones.
c) La estimación por máxima verosimilitud proporciona los siguientes resultados:
Parámetros β t
Constante -0.880 -1.733
Años -0.882 -1.621
Ingresos 1.216 2.468
Movilidad 1.129 2.223
TEST RV χ2=18.915
1) Interpreta los resultados.

2) ¿Cuál es el aumento de probabilidad asociado a la edad? (se conoce que 47 de los
100 individuos utilizarán los cajeros).
3) ¿Cuál es la probabilidad de que un individuo de 28 años, con un nivel de ingresos
anual de 2.600.000 y no móvil, utilice los cajeros automáticos?.
16. Retomando el ejercicio 1. Si la renta bruta anual fuese de 3 millones de pesetas y la

edad del asegurado de 30 años, entonces, ¿cuál es la respuesta correcta?:
a) ¿Es la probabilidad de poseer un seguro igual al 79% y la varianza de la perturbación

en el modelo transformado bajo heterocedasticidad para este individuo es igual a la
unidad?.
b) ¿Es el incremento de probabilidad igual a 0.07 cuando aumentan en mil pesetas las
renta de los individuos?.
c) ¿Es la probabilidad de no poseer un seguro igual al 21% y la varianza de la
perturbación en el modelo de probabilidad transformado igual a 0.1659?.
17. Para explicar la elección del tipo de centro (privado o público) en el ámbito de la
enseñanza universitaria, se ha estimado por MCO un modelo de regresión utilizando como
variable dependiente a CENTRO (=1, privado). Por otro lado, las variables explicativas
empleadas son: EDUCP (=1 si el cabeza de familia tiene estudios universitarios) y,
además, cuatro categorías de renta definidas por las siguientes variables ficticias: RENTA1
(=1, renta familiar < 1000), RENTA2 (=1, renta familiar entre 1000-1500), RENTA3 (=1,
renta familiar entre 1500-2000), RENTA4 (=1, renta familiar entre 2000-3000). La renta
familiar está expresada en miles de pesetas y se toma como categoría base las rentas
familiares superiores a 3000.
a) ¿Qué diferencias sustanciales hay en la especificación y estimación de este modelo

frente a un modelo no lineal?.
b) )Qué significado tiene un valor -0.0815 para el parámetro de la variable RENTA1?.
6
18. Con el fin de predecir la crisis de las compañías de seguros en Estados Unidos se
elaboraron distintos modelos logit utilizando diversos ratios considerando que la empresa
puede quebrar o no. Uno de estos modelos, relacionaba el ratio del inmovilizado sobre el
neto patrimonial (X1), las inversiones en filiales sobre el neto patrimonial (X2), y la
variación de los ingresos procedentes de las operaciones (X3). Los resultados más simples
obtenidos determinan que el índice estimado es igual a:
Zˆ i = 0.0040 X 1i + 0.0312 X 2i + 0.4967 X 3i
conociéndose que el valor del logaritmo de verosimilitud del modelo sin restringir es 919 y
el modelo restringido 900.
Se pide:
a) Verificar si el modelo es significativo globalmente.

b) ¿Cuál es la probabilidad de que una empresa de seguros quiebre suponiendo los ratios
entre el inmovilizado/neto patrimonial y las inversiones en filiales/neto patrimonial
sean la unidad y la variación en los ingresos sea nula?.
c) Suponga ahora, que se estima otro modelo logit añadiendo una nueva variable, que
representa la variación en el ratio reservas/primas totales (X4), tal que
Zˆ i = 0.0380 X 1i + 0.0240 X 2i + 0.5674 X 3i + 0.0382 X 4i
¿Cuál sería la probabilidad de que la empresa quiebre cuando el ratio de reservas es

unitario, X1=1.5, X2=1 y X3=0?.
19. Demostrar que tanto en el modelo probit como logit, si denotamos por L0 el valor de la
función de verosimilitud que se obtiene cuando sólo se estima una constante, restringiendo
los demás coeficientes a cero, se tiene:
ln L0 = N [ p ln p + (1 − p ) ln(1 − p )]
donde p es la proporción de observaciones muestrales con Yi = 1 . ¿Puede extenderse este

resultado a otros modelos?.
20. Sea el siguiente modelo no lineal:
y t = α + β 1 e β 2 xt + u t
Suponiendo normalidad en la distribución del término de perturbación del modelo, así

como homocedasticidad y no autocorrelación, obtenga las expresiones analíticas de los
algoritmos numéricos de optimización, tanto por MC como por MV, para:
a) Descenso más rápido.

b) Newton-Raphson.
c) Gauss-Newton.
d) Scoring.
7
21. Sea un modelo de regresión truncada con truncación superior en el punto a≠0.
Deduzca su función de verosimilitud.
22. Se ha estimado un modelo probit de elección de modo de transporte para ir al

trabajo (1=coche propio; 0= guagua). Las variables explicativas son sexo (1= hombre),
con coeficiente estimado igual a 0.5 y edad, con coeficiente estimado igual a 0.03. La
constante estimada es 0.2. Calcule la probabilidad estimada por el modelo de que una
mujer de 60 años vaya a trabajar en su coche.
23. Sea un modelo de probabilidad lineal dicotómico con una sola variable explicativa
X: Yi = α + βX i + U i . Demuestra que es heterocedástico, y calcula la expresión de las
varianzas de las perturbaciones.
24. Calcula la esperanza de la distribución de una variable X que es N(200, 120) y

censurada inferiormente en el punto a=200.
25. Formula la hipótesis de independencia de las alternativas irrelevantes en el contexto

de un modelo que incorpora dicha hipótesis. Pon un ejemplo para explicar
intuitivamente dicha hipótesis e indica qué consecuencias tiene su incumplimiento.
26. Lee lo que sigue, que es un resumen extractado de un artículo, para contestar las
preguntas.
Autores: Enrique García Pérez y Benjamín Manchado.
Título: Un modelo econométrico del fraude académico en una universidad española
Resumen: El fraude académico es un fenómeno que, en un futuro próximo, adquirirá

gran interés en España, debido a la implantación de los Reglamentos de Disciplina
Académica en las Universidades. En el presente trabajo empírico se estudian los
factores determinantes de las modalidades de fraude global y fraude específico en
exámenes, mediante la estimación de modelos de elección discreta logit multinomiales,
a partir de una muestra obtenida en la Facultad de Ciencias Económicas y Empresariales
de una universidad española.
La variable que desempeñó el papel de endógena (FRAUDE) podía tomar los

siguientes valores: 0 si el alumno declaró que no cometió fraude, 1 si el alumno admitió
defraudar en exámenes pero no en trabajos, 2 si declaró haber engañado sólo en
trabajos, y 3 si respondió afirmativamente en ambas preguntas. El número de
observaciones para cada categoría de la variable fue de 78, 87, 18 y 60,
respectivamente. Mediante esta variable endógena, estudiamos aquellos factores que
permiten discriminar entre no engañar (categoría 0), fraude específico (categorías 1 y 2)
y generalizado (categoría 3).
Las variables explicativas incluidas en las especificaciones que se propusieron trataron

de aproximarse a los beneficios y costes esperados del comportamiento, elegido en cada
caso por los alumnos, de fraude académico. Se podría distinguir, al igual que en Nowell
y Laufer (1997), entre características individuales y de la clase de cada estudiante.
Kerkvliet (1994), por su parte, emplea variables de rendimiento académico, hábitos
personales y características socioeconómicas.
8
Las variables consideradas en el estudio son:
- VERENGEX es una variable dicotómica que toma el valor 1 si el alumno observó a

algún otro alumno defraudando en un examen, durante el tiempo que llevaba en la
Universidad, y 0 si no lo observó.
- COLECTIVO mide el número de alumnos que cada encuestado consideró que
defraudaban habitualmente en un examen, en distintos intervalos que son 0-1, 2-5,
6-10, 11-15 y más de 15, tomando, por tanto, valores entre 1 y 5. En las encuestas
de Bunn et al. (1992) y Mixon (1996) se recoge esta variable en forma de porcentaje
pero, en nuestro caso, se consideró más conveniente esta codificación.
- AMIGOS se usa para recoger, de alguna forma, el entorno de amistades del alumno.
La respuesta se codificó como 1 si el alumno conocía a alguien que defraudase
sistemáticamente en los exámenes y 0, caso de no conocerlo.
- SEVER responde a la pregunta sobre la severidad percibida en las sanciones
impuestas por parte de la Universidad, en caso de detectarse el fraude académico.
Se consideró cuantitativa en orden creciente de severidad, entre los valores 1 y 5.
- ESPONT recoge la importancia que las distintas situaciones contextuales tienen a la
hora de producirse el fraude, ya fuera espontáneamente o por temor (valor 1), frente
al hecho de actuar de manera premeditada, que se recoge con el valor 0.
- POSICION indica la influencia de la colocación física en el aula sobre el fraude
tomando valor 1 si se respondió afirmativamente y 0, en caso contrario. La
influencia de la colocación es una variable ampliamente señalada como influyente a
la hora de analizar el fraude en el aula.
- PROBLEMA es dicotómica con valores 1 si el fraude no era percibido como un
problema o era un problema leve, y 0 si era considerado un problema.
- SEXO recoge el sexo del encuestado, codificando 1 si era hombre y 0 si era mujer.
Responda a las siguientes cuestiones y diga si se cumple en los modelos estimados:
a) La percepción de una baja probabilidad de ser sorprendido, ¿implicaría un menor

coste esperado?.
b) El número de alumnos que cada encuestado considera que defrauda, ¿debería estar
positivamente correlacionada con el fraude, ya que un mayor número de estudiantes
implicados supondría que la probabilidad de ser sorprendido sería baja y, de esta
forma, los costes no serían muy altos?.
c) Que el alumno conozca a alguien que defrauda en un examen, ¿influye de forma
positiva a la hora de cometer el fraude en la Universidad?.
d) ¿Es de suponer que, a una mayor severidad percibida, le correspondería un mayor
coste esperado, por lo que debería estar correlacionada de forma negativa?.
e) ¿Qué comportamiento espera de la variable ESPONT?.
f) ¿POSICION tiene una influencia positiva o negativa?.
g) ¿Se puede considerar que a menor conciencia moral del alumno (lo que significaría
un valor de PROBLEMA=1), la propensión a defraudar sería mayor, por lo que esta
variable debería estar positivamente correlacionada con el fraude?.
h) ¿Existen diferencias significativas entre los hombres y las mujeres?. ¡Cuantifíquelo!.
Los modelos econométricos que se emplearon para el análisis de los datos fueron de
los denominados modelos de elección discreta, concretamente, modelos logit
multinomiales. Los resultados de la estimación de los modelos logit multinomiales para
FRAUDE son:
9
1 2 3 4 5
CONSTANTE 1 -2,8630* -2,5341* -2,4528* -2,5955* -2,6945**
(3,682) (2,203) (2,074) (2,120) (1,796)
AMIGOS 1 0,3733 0,3822 0,3764 0,3763 0,5822
(0,975) (0,903) (0,864) (0,861) (1,201)
VERENGEX 1 1,5398* 1,8674* 1,9655* 1,9866* 2,7467*
(2,232) (2,232) (2,306) (2,333) (2,401)
COLECTIVO 1 0,5004* 0,4448* 0,4360* 0,4096* 0,2768
(2,921) (2,400) (2,285) (2,110) (1,339)
---
SEVER 1 -0,3633** -0,4174* -0,4361* -0,4449**
(1,932) (2,063) (2,114) (1,931)
---
PROBLEMA 1 0,7508 0,8866** 0,9177** 0,6835
(1,636) (1,888) (1,940) (1,325)
--- ___
SEXO 1 -0,0079 -0,0089 -0,5761
(0,019) (0,022) (1,273)
--- ___ ___
POSICION 1 0,2926 0,2736
(0,516) (0,457)
--- ----- -----
ESPONT 1 ---- 0,2146
(0,461)
CONSTANTE 2 -13,624 -12,105 -12,301 -12,426 -13,451

(0,068) (0,090) (0,091) (0,092) (0,093)
AMIGOS 2 0,1112 -0,1901 -0,2328 -0,2404 0,0064
(0,173) (0,276) (0,335) (0,346) (0,008)
VERENGEX 2 11,866 10,968 10,920 10,949 10,704
(0,059) (0,082) (0,081) (0,081) (0,074)
COLECTIVO 2 0,1446 0,1019 0,1707 0,1503 0,2142
(0,494) (0,338) (0,562) (0,483) (0,625)
SEVER 2 --- -0,0752 -0,1724 -0,1864 -0,0979
(0,234) (0,516) (0,554) (0,240)
----
PROBLEMA 2 -0,1923 -0,1007 -0,0772 -0,1242
(0,290) (0,151) (0,114) (0,165)
___
SEXO 2 --- 0,6287 0,6304 1,0165
(0,919) (0,921) (1,160)
___ ___
POSICION 2 --- 0,2299 0,6821
(0,254) (0,583)
---- ----
ESPONT 2 --- --- -0,3490
(0,453)
CONSTANTE 3 -4,5128* -5,5000* -5,1343* -6,0046* -6,2749*

(3,733) (3,553) (3,227) (3,456) (3,352)
AMIGOS 3 1,2867* 1,2667* 1,2721* 1,2121* 1,4919*
(2,875) (2,630) (2,506) (2,370) (2,631)
VERENGEX 3 1,9376** 2,0732** 2,3030* 2,3597* 2,2295**
(1,756) (1,807) (1,962) (2,005) (1,799)
COLECTIVO 3 0,5720* 0,5533* 0,4853* 0,4209** 0,4575*
(2,950) (2,672) (2,245) (1,904) (1,964)
----
SEVER 3 -0,2618 -0,2636 -0,3072 -0,2480
(1,224) (1,119) (1,275) (0,947)
----
PROBLEMA 3 2,1469* 2,2066* 2,2454* 1,8553*
(3,313) (3,316) (3,375) (2,669)
__
SEXO 3 --- -0,8960** -0,8724** -1,0986*
(1,858) (1,800) (2,099)
___ ___
POSICION 3 --- 1,3078 1,1850
(1,510) (1,330)
___ ___ _____
ESPONT 3 --- 0,8445
(1,576)
CHI-CUADRADO (G.L.) 52,9518 (9)* 59,8239 (15)* 62,4953 (18)* 65,2330 (21)* 65,2276 (24)*
Nº OBSERVACIONES 215 187 177 177 154
% DE CLASIFICADOS 47,44% 49,20% 49,72% 49,15% 49,35%
CORRECTAMENTE
Notas: Entre paréntesis aparecen los t-valores asintóticos en valor absoluto. Los coeficientes han sido
normalizados para el valor de FRAUDE=0. * Indica significación al 5%. ** Indica significación al 10%.
10
27. Defina la función de razón de fallo e indique para qué se usa. ¿Cómo es la función
de razón de fallo en el caso de una distribución exponencial?. ¿Qué significa?.
28. Diferencia entre un modelo logit multinomial y un modelo logit condicional de

McFadden.
29. Para el modelo logit multinomial, deduzca la expresión del efecto marginal de un
cambio en la variables explicativa xk sobre la probabilidad de elección de la alternativa
j, de entre las J del conjunto de elección.
30. ¿Qué es truncación incidental (llamada también truncamiento selectivo?. Defínala y

ponga un ejemplo.
31. En un modelo logit multinomial no ordenado, hay tres alternativas (A, B y C),
actuando la tercera como categoría de referencia. Se ha estimado el modelo por máxima
verosimilitud, con los resultados siguientes:
⎛P ⎞
Ln⎜⎜ A ⎟⎟ = −0.5 − 0.8 x1 + 0.2 x2
⎝ PC ⎠
⎛P ⎞
Ln⎜⎜ B ⎟⎟ = −0.2 + 1.3x1 − 0.26 x2
⎝ PC ⎠
Un conocido tuyo tiene x1 = 4 y x2 = 20 . Estima las probabilidades que, según el

modelo, tiene de elegir A, B y C.
32. ¿Cuál es el modelo probabilístico que especifica una razón de fallo

constante?…………………..…………. . Para dicho modelo, aplicado a la duración de
la carrera de Económicas, se tiene que la duración media estimada de la carrera es 5,2
años. Calcula el valor estimado de la función de supervivencia para t=4 años e interpreta
el resultado.
32. Se ha estimado un modelo probit de elección de modo de transporte para ir al

trabajo (1=coche propio; 0= guagua). Las variables explicativas son sexo (1= hombre),
con coeficiente estimado igual a 0.5 y edad, con coeficiente estimado igual a 0.03. La
constante estimada es 0.2. Calcule la probabilidad estimada por el modelo de que un
hombre de 47 años vaya a trabajar en guagua.
33. Escribe la función de verosimilitud de un modelo tobit de regresión censurada con

censuración doble, inferior en a1 y superior en a2.
34. Con datos de una muestra de familias españolas (renta; número de miembros que
trabajan; habitat rural o urbano) queremos estimar la demanda de vivienda: gasto en
compra de vivienda. Especifique los posibles modelos que podría utilizar y discuta las
propiedades de unos y otros, indicando cuál prefiere y por qué.
35. Hemos estimado un modelo logit binomial por MV, con los siguientes resultados:
Variable Coeficiente Error Estándar Datos del Individuo i
11
Constante 0.6 0.63
X1 -0.46 0.104 5
X2 0.72 0.032 4
Calcula el efecto marginal de X1 sobre la probabilidad de que el individuo i elija la

alternativa 1 (Y=1).
36. Sea la siguiente muestra de N=425 votantes. La variable dependiente representa el

voto en un referendum sobre un nuevo impuesto específico sobre la enseñanza pública
(Y=1 =Si, Y=O= NO). La lista de variables independientes y resultados de la
estimación logit son:
VARIABLE Definición (para las variables dummy, categoría =1) Coeficiente Error estándar
CONSTANTE -23.15(*) 3.84
SEXO mujer 0.24 0.24
CASADO casado con esposo/a conviviente 1.13 1.13
OTRO separado, viudo, divorciado 1.09 1.47
E35-49 edad entre 35 y 49 años 0.08 0.3
E50-64 edad entre 50 y 64 años 0.61 0.41
E65 mas de 65 años 1.04 0.79
PUB1 1 hijo estudiando en la escuela pública 1.44(*) 0.34
PUB2 2 hijos estudiando en la escuela pública 1.39(*) 0.35
PUB5 5 o más hijos estudiando en la escuela pública 2.16(*) 0.79
PRIV 1 o mas hijos estudiando en la escuela privada -0.56 0.42
MAESTRO si es maestro en escuela pública o privada 3.07(*) 0.84
AÑOS Número de años que lleva viviendo en la región -0.02(*) 0.01
LRENTA LOG.(renta familiar anual en $) 2.14(*) 0.37
LPRECIO LOG(precio de la enseñanza pública en $) -1.21(*) 0.44
La ecuación está estimada por MV (errores estándar asintóticos entre paréntesis, un *

indica coeficiente significativo al 5%):
a) Calcula el "score" o "logit" estimado de un hombre, no maestro, divorciado de

40 años con sus 6 hijos en una escuela pública gratuita que se ha mudado a la
región este mismo año y tiene una renta de 10.000$. Calcula su probabilidad
estimada de votar Si.
b) Ahora repite los cálculos si ese hombre no tuviera hijos. ¡Compara los
resultados!.
c) ¿Y si no tuviera hijos y fuera maestro de escuela?.
d) Calcula el "riesgo relativo" de votar Si de los maestros respecto a los no
maestros. Interprétalo. (Riesgo relativo = cociente entre los odd-ratios de ambas
categorías).
e) Interpreta el coeficiente de los años de residencia.
f) Si no estuvieran en el modelo las tres variables continuas, ¿cómo se podría
estimar?.
37. Tenemos los siguientes datos agrupados referidos a una muestra de 1000 empresas.
Suponemos que la probabilidad de “éxito” depende de X según un modelo logit. X es
una variable controlable por la empresa.
12
Número de grupo X Proporción muestral de éxitos
en el grupo
1 160 11
2 250 74
3 170 8
4 365 87
5 210 62
6 206 83
7 203 48
8 305 84
9 270 71
10 340 79
Se pide:
a) Si una empresa quiere alcanzar el éxito el 95% de las veces, ¿qué valor debe fijar
para X?.
b) Si cada unidad de X cuesta 20000 ptas., ¿puede esperar la empresa que alcanzará su
objetivo con un presupuesto de 8 millones de ptas.?.
c) Según el modelo estimado, ¿cuál es el valor marginal de la unidad 301 de X, en
términos del aumento de la probabilidad de éxito?.
38. Pon un ejemplo de modelo de respuesta cualitativa:
Binomial :……
Multinomial no ordenado:……….
Multinomial ordenado:……….
De decisión secuencial anidado:……..
NOTA: Se trata de definir su variable dependiente y dar una idea de las variables independientes que
podrían intervenir
39. Demuestra que en el modelo logit estimado por MV la suma de las probabilidades
estimadas por el modelo (para los n individuos de la muestra) es el número de
individuos con Y=1.
40. Obtén el estimador MV del MLP binomial.
41. Hemos empleado modelos binomiales de elección discreta para estimar la

probabilidad de la mujer casada de participar en el mercado laboral (Yi=1, SI trabaja;
Yi=0, NO trabaja). La muestra contiene 753 mujeres, de las cuales trabajan 428. Las
variables explicativas son la experiencia laboral en años, el nivel educativo en años y el
número de hijos. Los coeficientes estimados aparecen en la tabla siguiente. Considera a
la mujer i, sin hijos, que ha estudiado 10 años y tiene una experiencia laboral de 1 año y
a la mujer media, y rellena la tabla .
COEFICIENTES DE LOS MODELOS

(BETA)
13
MLP PROBIT LOGIT MEDIA MUESTRAL
CONSTANTE -0.084 -1.763 -2.946
HIJOS -0.167 -0.486 -0.788 0.24
EDUCAC 0.04 0.122 0.201 12.3
EXPERI 0.018 0.055 0.096 10.6
Probabilidad de trabajar estimada Efecto marginal sobre la prob de un año

MODEL más de estudios
O Mujer i Mujer media Mujer i Mujer media
MLP
PROBIT XXXXXXX XXXXXXX
LOGIT
Además, conocemos las probabilidades de trabajar estimadas: 0.3015, 0.3128, 0.334,

0.5587, 0.5808, 0.5878. Y, los efectos marginales sobre las probabilidades de trabajar
son: 0.04, 0.0423, 0.0487.
42. La truncación, ¿hace que la varianza aumente o disminuya?. Discuta la pregunta.
43. Sea una variable Z distribuida N (µ ,σ ) . Se sabe que la esperanza truncada con
truncación inferior en el punto a=25 es igual a 6.85. El grado de truncación es del 90%.
Calcular µ y σ .
44. Si tenemos una muestra censurada, ¿qué crees que es mejor y por qué, estimar un
modelo de regresión truncado o un modelo tobit censurado?. Discuta la pregunta.
45. Una empresa de seguros encuentra que la probabilidad de poseer un seguro de hogar
frente a no poseerlo, puede escribirse mediante una relación lineal definida por el siguiente
modelo:
sî = 0.07 + 0.0002 y i + 0.004 Ei
donde, si es una variable dicotómica que vale uno si el individuo i-ésimo posee un seguro y
cero en caso de no poseerlo; yi es la renta en miles de pesetas y Ei es la edad del asegurado.
Si la renta bruta anual fuese de 3 millones de pesetas y la edad del asegurado de 30 años,
entonces:
a) ¿Cuál es la probabilidad de poseer un seguro?.

b) ¿Cuál es el incremento de probabilidad, si la renta de dicho individuo aumentase en
100.000 pesetas?.
46. Se ha estudiado la posibilidad de que el hecho de que una familia tenga la vivienda
en propiedad o no (Y) dependa de variables como los ingresos (INGRESOS) de los
individuos (en miles de pesetas mensuales); si trabaja (TRABFIJO), que es una variable
dicotómica que toma el valor uno si el cabeza de familia trabaja y cero en caso
contrario; el sexo (SEXO), que también es dicotómica, tomando valor 1 si es hombre y
cero si es mujer; y la edad (EDAD), que representa la edad del cabeza de familia. El
siguiente cuadro recoge los valores de dichas variables para dos individuos elegidos al
azar de la muestra.
14
i Y Sexo Edad Ingresos Trabfijo
9 1 1 39 250 0
18 0 0 46 80 0
Además, se conocen los siguientes resultados de la estimación de un modelo logit y

probit:
Variables Logit Probit

Constante -4.73 -2.66
Sexo 0.16 0.16
Edad 0.01 0.004
Ingresos 1.94 1.13
Trabfijo 0.02 0.015
Se pide:
d) Calcular las probabilidad de tener vivienda en propiedad en los dos modelos y para
los dos individuos.
e) Calcular los ODDS de cada individuo, para cada modelo.
f) Calcular los efectos marginales para el individuo 9 en el modelo logit; y para el
individuo 18 en el modelo probit.
47. Realizar un breve comparación entre los algoritmos Scoring y Descenso Rápido.
48. Sea el siguiente modelo de ecuaciones simultáneas:
y1t = γ 21 y2t + β11 x1t + β 21 x2t + u1t
y2t = γ 12 y1t + β 22 x2t + u2t
cuya matriz de momentos (es desviaciones respecto a la media) es:
y1 y2 x1 x2
y1 12 6 3 0
y2 6 16 2 4
x1 3 2 4 0
x2 0 4 0 1
Se pide:
a) Indentificar el sistema sin restricciones y estimar adecuadamente los parámetros de

la segunda ecuación del sistema.
b) Identificar el sistema considerando la restricción: β11 = β 21 y estimar los
coeficientes de la primera ecuación considerando dicha restricción.
49. Se ha relacionado el logaritmo del índice Financial Times (FT) con el logaritmo del
índice Dow Jones (DJ), y obtenido los siguientes resutados por MCO:
Estimación de la ecuación
Dependent Variable: LOG(FT)
Included observations: 153
Variable Coefficient Std. Error t-Statistic Prob.
C 1.098982 0.036141 30.40816 0.0000
15
LOG(DJ) 0.754361 0.007653 98.57209 0.0000
R-squared 0.984697 Mean dependent var 4.639985
Adjusted R-squared 0.984596 S.D. dependent var 0.395047
S.E. of regression 0.049031 Akaike info criterion -3.179754
Sum squared resid 0.363006 Schwarz criterion -3.140140
Log likelihood 245.2512 F-statistic 9716.456

Durbin-Watson stat 0.444218 Prob(F-statistic) 0.000000
Test de raíz unitaria para el residuo de la regresión

PP Test Statistic -4.423605 1% -3.4743*
5% -2.8805
10% -2.5768
*MacKinnon critical values for rejection of hypothesis of a unit root.
Se pide:
a) Especifique, si existe, el vector de cointegración; así como el orden de cointegración

de las variables.
b) Valorar la existencia de contegración entre los dos índices, en los tres niveles
críticos de Engle y Granger, que son: 1% 0.511, 5% 0.386 y 10% 0.322.
50. En el modelo TOBIT: yi* = xi' β + ui , cuando existe censura superior o inferior en
cero, ¿A qué será igual el valor obtenido para

[ ]
∂E yi / xi , yi* < 0
y
[ ]
∂E y i / xi , y i* > 0
?.
∂xi ∂xi
51. Derivar la función de verosimilitud para el modelo:

yi = µ + ε i ; yi = yi si yi > 0 ; ε i ~ N 0,σ 2
* * *
( ) y el correspondiente a
y = µ + ε i ; y i = y si y < 0 ; ε i
*
i
*
i
*
i ~ N (0, σ ) . 2
Además, obtenga las expresiones del
vector gradiente para ambos.
52. Un banco pretende caracterizar las empresas que cumplen puntualmente todos los
plazos de devolución de los créditos que reciben. Tras crear una variable Yi, que toma
valor 1 cuando las empresas cumplieron dichos compromisos y cero en caso contrario,
se estimaron los siguientes modelos:
Yi = 0.069 − 0.018 x1i + 0.049 x 2i + 0.057 x3i
pi
ln = −1.66 − 0.32 x1i + 0.62 x 2i − 0.90 x3i
1 − pi
donde x1i es el ratio (en porcentaje) entre el valor nominal de la deuda viva de la
empresa y el valor total del activo; x2i es el ratio (en porcentaje) entre los beneficios
después de impuestos y el valor total del activo; y x3i es el valor del activo (como
indicador del tamaño de la empresa).
Se pide:
a) ¿Qué modelos han sido estimados?.

b) Interprétense los coeficientes estimados en ambos modelos.
c) Suponga que el individuo i-ésimo posee los siguienets valores de las
variables: x1i = 9.7% , x 2i = 7.8% , x3i = 0.6 . Calcule la probabilidad de que se
16
incumplan los compromisos en ambos modelos. Además, Obtenga los efectos
marginales.
53. Realícese una comparación entre los algoritmos "Descenso Rápido" y "Gauss-
Newton".
54. Atendiendo al enunciado del ejercicio 49, se han obtenido los siguientes resultados,
aplicando el método bietápico de Engle y Granger.
Dependent Variable: DLOG(FTSE100)

Sample(adjusted): 1988M08 2000M03
Included observations: 140 after adjusting endpoints
Variable Coefficient t-Statistic
DLOG(FT(-1)) 0.162826 1.990719
DLOG(DJ(-1)) -0.099776 -2.778151
DLOG(FT(-2)) -0.163138 -3.287065
DLOG(DJ(-2)) 0.093377 2.706378
DLOG(FT(-12)) -0.041340 -2.365320
DLOG(DJ(-12)) 0.043033 2.350196
RESID01(-1) -0.205430 -2.488271
R-squared 0.83430
Durbin-Watson 2.011624
Se pide
a) ¿Qué tipo de modelo ha sido estimado?.

b) Escriba la ecuación estimada y valore la posible existencia de una relación de
equilibrio a largo plazo.
55. Utilizando el siguiente sistema de ecuaciones:
y1t + γ 21 y 2t + β 11 xt + u1t = 0
γ 12 y1t + y 2t + β 12 xt + u 2t = 0
Se pide:
a) Identificar el sistema de ecuaciones, si β 11 = β 12 = β , γ 12 = 0 .

b) Identificar el sistema de ecuaciones, si β 11 = β 12 = β , γ 21 = 2 .
56. Sea el siguiente sistema de ecuaciones simultáneas:
y1t = β 11 x1t + β 21 x 2t + u1t
y 2t = β 12 x1t + β 22 x 2t + u 2t
17
en el que E [u1t ] = E [u 2t ] = 0 , var(u1t ) = σ 12 , var(u 2t ) = σ 22 , cov(u1t , u 2t ) = 0 , y cuya
matriz de momentos (en desviaciones respecto a la media) es:
y1 y2 x1 x2
y1 120 80 20 45
y2 90 25 30
x1 10 5
x2 20
Se pide:
a) Estímense los parámetros del sistema de ecuaciones de forma eficiente.

b) Manteniendo iguales las hipótesis iniciales, pero suponiendo que σ 12 = σ 22 , ¿Cuál
sería la expresión del estimador del sistema de ecuaciones?.
c) Manteniendo iguales las hipótesis iniciales, pero suponiendo que
cov(u1t , u 2t ) = σ 12 , ¿Cuál sería la expresión del estimador para el sistema de
ecuaciones?.
57. Suponemos que la demanda de entradas a los conciertos (VENTAS) que se

celebran en una ciudad depende del precio (PRECIO), de las condiciones
meteorológicas (METEO), que pueden ser favorables (0) o desfavorables (1) y del
renombre del grupo que actúa, medido en una escala de 1 a 5 (RATING). Los
conciertos se celebran en un recinto que tiene capacidad para 23.000 espectadores.
Se ha estimado el modelo y los resultados son:

+---------------------------------------------+
| Limited Dependent Variable Model - CENSORED |
| Dependent variable VENTAS |
| Lower=-infinity Upper=23000.0000 |
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
+---------+--------------+----------------+--------+---------+----------+
Constant 29588.03508 590.39079 50.116 .0000
PRECIO -4.879326375 .16399481 -29.753 .0000 2952.8667
RATING 1940.032493 122.51143 15.836 .0000 3.1555556
METEO -4513.019466 268.57781 -16.803 .0000 .18888889
Sigma 923.1196055 81.283308 11.357 .0000
Se pide:
a) Calcular los efectos marginales evaluados en la media de las variables.

b) Si un grupo posee un rating igual a 5, y actúa en un día con meteorología
favorable y un fan paga un precio de 5000 ptas, ¿cuáles son las predicciones de
la ventas considerando la censura?.
58. Suponga que una variable no observable, y i* , se encuentra censurada entre dos
puntos a y b, siendo a<b. ¿A qué será igual la media condicional de la variable
censurada en ambos lados?.
18
59. Se tiene la siguiente tabla de resultados para el modelo de regresión:
LPVPi = β 1 + β 2 CC i + β 3 POTECIAi + β 4 PLAZAS i + β 5 CONSURBi + u i ,
donde LPVP=(logaritmo del precio de venta al público), CONSURB=(consumo urbano

de gasolina), PLAZAS=(número de plazas), POTENCIA=(potencia) y
CC=(centímetros cúbicos del motor).
+---------------------------------------------+
| Limited Dependent Variable Model - TRUNCATE |
| Dependent variable LPVP |
| Log likelihood function 10.36396 |
| Lower= 14.7710 Upper=+infinity |
| Observations after truncation 89 |
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
+---------+--------------+----------------+--------+---------+----------+
Constant 13.99540073 .23644489 59.191 .0000 .
CC .2469698762E-03 .70523122E-04 3.502 .0005 2798.2135
POTENCIA .6146523460E-02 .15073046E-02 4.078 .0000 130.57303
PLAZAS .5854436861E-01 .26134858E-01 2.240 .0251 5.4494382
CONSURB -.4132447336E-01 .17188130E-01 -2.404 .0162 13.296629
Sigma .2557355692 .24599767E-01 10.396 .0000 .
Se pide:
a) Obtén el valor del ratio inverso de Mills para el individuo medio.

b) Calcula el efecto marginal evaluado en la media para la variable PLAZAS.
c) ¿A qué consideras es igual la varianza de la variable LPVP?. Calcula su valor.
60. En un modelo logit multinomial no ordenado, que determina los perfiles

diferenciados de los fumadores, los exfumadores y los que nunca han fumado, se
dispone de información acerca de las variables: FUMA (=0 si fuma ; =1 si exfumador;
=2 si nunca ha fumado); ALCOHOL (=1 si ha bebido en la última semana; 0 en otro
caso); EDAD = Edad en años cumplidos y SEXO (variable ficticia =1 hombre; 0
mujer).
+---------------------------------------------+
| Multinomial Logit Model |
| Dependent variable FUMA |
| Restricted log likelihood -6156.510 |
+---------------------------------------------+
+--------+-------------+---------------+-------+--------+----------+
|Variable| Coefficient | Standard Error|b/St.Er.|P[|Z|>z]|Mean of X|
+--------+-------------+---------------+-------+--------+----------+
Characteristics in numerator of Prob[Y = 1]
Constant -3.640533526 .19250329 -18.912 .0000 .
SEXO .6886612269 .98854654E-01 6.966 .0000 .48401234
EDAD .4619101884E-01 .25459570E-02 18.143 .0000 43.751826
ALCOHOL -.4462521624 .90439443E-01 -4.934 .0000 .52410323
Constant -.7178729803 .12564652 -5.713 .0000 .
SEXO -1.084755046 .67757546E-01 -16.009 .0000 .48401234
EDAD .3373685387E-01 .18930611E-02 17.821 .0000 43.751826
ALCOHOL -.8573745420 .64989954E-01 -13.192 .0000 .52410323
Se pide:
19
a) Evaluar la significación conjunta del modelo.
b) Estimar las probabilidades, para el individuo medio de la muestra, de ser
fumador, exfumador y nunca haber fumado.
c) Disponiendo de la siguiente información, evalúe las predicciones del modelo:
Frequencies of actual & predicted outcomes
Predicted outcome has maximum probability.
Predicted
------ --------------- + -----
Actual 0 1 2 | Total
------ --------------- + -----
0 1391 51 836 | 2278
1 342 102 452 | 896
2 793 38 2156 | 2987
------ --------------- + -----
Total 2526 191 3444 | 6161
d) Considerando el siguiente vector de variables explicativas para el i-ésimo

individuo: xi' = [1 1 36 1] , ¿cuál será el odd de ser exfumador y de no haber
fumado nunca?. Interprételo.
61. Se dispone de información sobre: LPRECIO = logaritmo del precio de mercado de

la vivienda habitual en propiedad en 1998. PROPIE = 1 si la familia es propietaria de la
vivienda; 0 en caso contrario. TRABFIJO = 1 si el cabeza de familia tiene trabajo fijo; 0
en caso contrario. SEXO = 1 si el cabeza de familia es hombre 0 en caso contrario.
EDAD = edad del cabeza de familia en años. HIJOS = nº de hijos que conviven con la
familia. INGRESO = ingresos familiares mensuales en 1997 (ingresos anuales / 12).
EDUCA = años de educación del cabeza de familia. MOVIL = número de años que
llevan viviendo en la ciudad actual. Se estima un modelo de selección muestral,
obteniéndose los resultados siguientes:
+----------------------------------------------------------+
| Sample Selection Model |
| Probit selection equation based on PROPIE |
| Selection rule is: Observations with PROPIE = 1 |
| Results of selection: |
| Data points Sum of weights |
| Data set 1123 1123.0 |
| Selected sample 697 697.0 |
+----------------------------------------------------------+
+-----------------------------------------------------------------------+
| Two stage least squares regression Weighting variable = none |
| Dep. var. = LPRECIO Mean= 16.18272434 , S.D.= .8333333897 |
| Model size: Observations = 697, Parameters = 9, Deg.Fr.= 688 |
| Residuals: Sum of squares= 290.2310590 , Std.Dev.= .64950 |
| Fit: R-squared= .391667, Adjusted R-squared = .38459 |
| (Note: Not using OLS. R-squared is not bounded in [0,1] |
| Model test: F[ 8, 688] = 55.37, Prob value = .00000 |
| Diagnostic: Log-L = -683.6765, Restricted(b=0) Log-L = -861.4217 |
| LogAmemiyaPrCrt.= -.850, Akaike Info. Crt.= 1.988 |
| Standard error corrected for selection..... .68767 |
+-----------------------------------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
+---------+--------------+----------------+--------+---------+----------+
Constant 1.753797810 1.3912725 *****
TRABFIJO .4356437681 .68409420E-01 ***** .73027260
SEXO -.5062113124E-01 .66550751E-01 ***** .83500717
EDAD .8875735718E-02 .24876340E-02 ***** 41.364419
HIJOS -.7482653581E-01 .18528622E-01 ***** 1.8952654
EDUCA .2583800339E-01 .95730846E-02 ***** 13.298422
MOVIL .1485053775E-02 .21997061E-02 ***** 35.981349
LINGRESO 1.029119343 .10064208 ***** 13.015925
LAMBDA .4532492445 .15652247 ***** .29951337
Se pide:
20
a) Comente brevemente el método de estimación de Heckman. ¿Porqué se aplica
en este caso? y ¿Qué ratio inverso de Mills utilizaría en este modelo?.
b) Evalúe la significación de los coeficientes estimados. ¿Cuál es la interpretación
del parámetro de la variable SEXO y EDAD?.
c) ¿A qué es igual la estimación de ρ̂ ?. Por lo tanto, ¿cree usted que debería
aplicarse el modelo Tobit?.
d) ¿Cuál es el precio medio de mercado de la vivienda habitual en propiedad en
1998?.
62. Considere el siguiente sistema de ecuaciones simultáneas:

y1t + γ 31 y3t + β 11 x1t + u1t = 0
y 2t + γ 32 y 3t + γ 42 y 4t + β 12 x1t + β 22 x 2t + β 32 x3t + u 2t = 0
γ 13 y1t + γ 23 y 2t + y3t + β 23 x 2t + β 33 x3t + u 3t = 0
γ 14 y1t + γ 24 y 2t + y 4t + β 14 x1t + u 4t = 0
Se pide:
a) Analizar la identificación del sistema.

b) Analizar la identificación del modelo considerando la siguiente restricción:
2γ 13 − 3γ 23 + 4 β 23 = 0 .
63. Defina la función de razón de fallo e indique para qué se usa. ¿Cómo es la función
de razón de fallo en el caso de una distribución exponencial?. ¿Cuál es su significado en
este caso?.
64. Se tiene el siguiente modelo no lineal simple: y t = e β1xt + u t . Utilizando los mínimos
cuadrados no lineales, escriba los elementos del algoritmo de Newton-Raphson para la
primera iteración.
65. Demuestre que en el modelo logit binomial para N individuos, donde yi es una
variable endógena que toma valor 0 o 1, y la función índice es igual a I i = xi′β (siendo
xi′ un vector fila que contiene las características del i-ésimo individuo y β un vector de
parámetros desconocidos), la función de verosimilitud puede escribirse como:
N
∑ y i ( xi′ β )
∏ [1 + e β ].
N
x i′
L = e i =1
i =1
66. Suponga que existe censura superior e inferior en los puntos a y b. Construya, bajo
el supuesto de normalidad, el logaritmo de verosimilitud que permita, mediante su
maximización, la estimación de los parámetros en el modelo yi* = xi′β + ui .
67. A partir de la siguiente información sobre el número de visitas al médico en las

últimas dos semanas (DVISITS), el sexo de las personas que han sido encuestadas
(SEXO = 1 si es mujer y cero si es hombre), la edad del individuo en número años
divididos por 100 (EDAD), la edad al cuadrado (EDAD2), la renta anual en miles de
pesetas (RENTA), si posee un seguro público (SPUB = 1 si posee seguro público y
cero en caso contrario), y si está jubilado (JUBIL = 1 si está jubilado y cero en caso
contrario).
21
Los resultados de la estimación máximo verosímil son:
+---------------------------------------------+
| Poisson Regression |
| Dependent variable DVISITS |
| Chi-squared 410.0552 |
| Degrees of freedom 6 |
| Significance level .0000000 |
| Chi- squared = 551.23707 RsqP= .4429 |
| G - squared = 699.07657 RsqD= .3697 |
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
+---------+--------------+----------------+--------+---------+----------+
Constant -.7900618450 .11221447 -7.041 .0000
SEXO .2182756364E-01 .71371673E-01 .306 .7597 .48300000
EDAD .9496278280 .33929493 2.799 .0051 .41413000
EDAD2 .4508287253E-01 .43719734E-01 1.031 .3025 .26519850
RENTA .1594314240E-03 .24396592E-04 6.535 .0000 1442.4560
SPUB -.6376025892 .10604556 -6.013 .0000 .79700000
JUBIL 1.096445780 .20492877 5.350 .0000 .19700000
Evaluando los resultados en la media, se pide:
a) ¿Cuál es el valor medio del número de visitas al médico en las últimas dos
semanas?. ¿Y la varianza?.
b) ¿Cuál es el efecto marginal de la variable EDAD?.
c) ¿Cuál es la probabilidad de que el individuo medio no haya ido al médico en
los últimos quince días?. Y, ¿que haya ido 3 veces?.
68. ¿Cuál es el modelo probabilístico que especifica una razón de fallo constante?. Para
dicho modelo, aplicado a la duración de la carrera de Económicas, se tiene que la duración
media estimada de la carrera es 5,2 años. Calcula el valor estimado de la función de
supervivencia para t=4 años e interpreta el resultado.
xtλ − 1
69. Suponga el siguiente modelo: yt = α + β g ( xt ) + ut , donde g (xt ) = . Demuestre
λ
si existe o no, una solución analítica al problema de maximización de la función del
logaritmo de verosimilitud.
70. Se tiene el siguiente modelo no lineal simple: yt = xtβ1 + ut . Utilizando los mínimos
cuadrados no lineales, escriba los elementos del algoritmo de Gauss-Newton para la
primera iteración.
71. En el siguiente modelo IS-LM:
IS : yt = α 0 + α1rt + u1t
LM : yt = β 0 + β1M t + β 2 rt + u2t
donde yt es la renta, rt es el tipo de interés (ambas variables endógenas), Mt es la masa

( ) ( )
monetaria (como variable exógena), u1t ~ N 0,σ 12 , u2t ~ N 0,σ 22 y las covarianzas
22
entre los errores de ambas ecuaciones se denota por σ 12 . ¿A qué es igual el sesgo de
α̂ 1 ?.
72. Sea yi = 0,1,2,...,10 el número de veces que las personas han visitado un
determinado balneario durante los dos últimos años. Se estima un modelo de Poisson
considerando como variable explicativa el número de noches de estancia en ese lugar.
Los resultados de máxima verosimilitud así como un listado para las primeras 10
observaciones de la muestra son los siguientes:
+---------------------------------------------+
| Dependent variable VECES |
| Chi- squared = 12900.53321 RsqP= .0628 |
| G - squared = 10168.03678 RsqD= .0506 |
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
+---------+--------------+----------------+--------+---------+----------+
Constant -.3276808869 .24715869E-01 -13.258 .0000
NOCHES .4537878664E-01 .15657352E-02 28.982 .0000 10.552858
Observation Observed Y Predicted Y Residual x(i)b
1 .00000 .99002 -.9900 -.0100
2 .00000 .99002 -.9900 -.0100
3 .00000 .99002 -.9900 -.0100
4 .00000 1.0360 -1.0360 .0353
6 .00000 .99002 -.9900 -.0100
7 3.0000 .99002 2.0100 -.0100
8 .00000 1.1871 -1.1871 .1715
9 7.0000 1.0360 5.9640 .0353
10 2.0000 .99002 1.0100 -.0100
Se pide:
a) ¿Cuál es el promedio de veces que han visitado el balneario?.

b) Obtenga la probabilidades para el 6º y 10º individuo. ¿Cuál es la probabilidad de que
un individuo (en media) venga más de 1 vez?.
c) ¿Qué es la sobredispersión?. Contrastar la sobredispersión del modelo. Para ello,
utilice las expresiones sugeridas por Cameron y Trivedi (1990): zî = α + ui y
[ ]( )
zî = βλî + ui , siendo zî = ( yi − λî ) − yi λî 2 .
2
(1) Establezca las hipótesis nula y alternativa a contrastar en ambos casos y su

significado.
(2) Realice una evaluación del rechazo o aceptación, atendiendo a los siguientes
N N
resultados: z = 4.7725 , ∑ λ̂i2 = 4632 ,
i =1
∑ zˆ λˆ
i =1
i i = 16915.97 , y finalmente
e1′e1 = 491649.7 y e2′ e2 = 495026.3 son las sumas de cuadrados de los errores en el
primer y segundo modelo, respectivamente. [NOTA: El lado derecho de ambas
ecuaciones, tanto la constante en la primera ecuación como λ̂i en la segunda ecuación,
está dividido por 2 ].
73. Sea el siguiente sistema de ecuaciones aparentemente no relacionadas:
23
y1t = α1 + β1 x1t + u1t
y2t = β 2 x2t + u2t
donde var(u1t ) = σ 12 , var(u2t ) = σ 22 x2t y cov(u1t u2t ) = σ 12 = 0 . Bajo estas condiciones,

estime los coeficientes de las ecuaciones, proporcionando la expresión de cada uno de
ellos.
74. Sea yi ~ Bernoulli (Pi ) , siendo Pi la probabilidad de que yi = 1 . En el modelo lineal

de probabilidad de observaciones repetidas en el que se forman m-grupos, ¿cuál es
var( p j ) , siendo p j la proporción muestral de respuestas afirmativas dentro del grupo j-
ésimo?. Si los grupos son del mismo tamaño y, además, cada uno de estos es igual a 10,
¿cuál será la varianza máxima de dicha proporción?.
75. Responda a las siguientes cuestiones:
a) Se dispone de información sobre n individuos. Suponga que existe truncamiento

inferior en el punto a y que yi = β 0 + ui , donde ui ~ N (0, σ u2 ). Obtenga las expresiones
∂LnL ∂LnL
de y en este modelo.
∂β ∂σ u2
b) Explique el significado del truncamiento inferior en el punto r, considerando que

yi ~ Poisson(µi ) , siendo µi = exp(xi′β ) . Obtenga la expresión de E [ yi yi ≥ r ] .
c) ¿Qué diferencias sustanciales existen entre la censura y truncamiento?. Explíquelo

brevemente.
76. En el método de Cutler y Ederer, el rango t se divide en K intervalos, j=1,..,K. Estos

intervalos tienen igual amplitud. A partir de los siguientes resultados parciales:
Estimated Survival Function
Duration variable is DURACION EN EL PARO (EN DÍAS)
Status is given by variable ESTADO
Number of observations in stratum = 608
Number of observations exiting = 539
Number of observations censored = 69
Survival Enter Cnsrd At Risk Exited Survival Rate Hazard Rate
.0- 194.7 608 25 595 407 1.0000 ( .000) .0053 ( .000)
194.7- 389.3 176 23 164 79 .3165 ( .019) .0032 ( .000)
389.3- 584.0 74 5 71 22 .1645 ( .016) .0019 ( .000)
584.0- 778.7 47 8 43 16 .1139 ( .014) .0023 ( .001)
Se pide:
a) ¿Qué significa que la tasa hazard sea igual a 0.0032?. Y, ¿Qué significa que la tasa de
supervivencia sea igual a 0.1139?.
c) ¿Qué significa que el número de individuos censurados sea 5?.
77. Atendiendo al enunciado del ejercicio 61, se trata de especificar y estimar un modelo que
explique la cantidad invertida en la vivienda habitual por parte de las familias. La estimación del
modelo en dos etapas de Heckman obtiene los siguientes resultados.
+---------------------------------------------+
| Binomial Probit Model |
24
| Dependent variable PROPIE |
| Results retained for SELECTION model. |
+---------+--------------+----------------+--------+---------+----------+
+---------+--------------+----------------+--------+---------+----------+
Index function for probability
Constant -2.227412200 .14573711 -15.284 .0000 .
TRABFIJO 1.021115011 .12018962 8.496 .0000 .65805877
INGRESO .6585780215E-05 .39261072E-06 16.774 .0000 398436.14
+----------------------------------------------------------+
| Probit selection equation based on PROPIE |
| Selection rule is: Observations with PROPIE = 1 |
| Results of selection: |
| Data points Sum of weights |
| Data set 1123 1123.0 |
| Selected sample 697 697.0 |
+----------------------------------------------------------+
+-----------------------------------------------------------------------+
| Two stage least squares regression Weighting variable = none |
| Dep. var. = LPRECIO Mean= 16.18272434 , S.D.= .8333333897 |
| (Note: Not using OLS. R-squared is not bounded in [0,1] |
| LogAmemiyaPrCrt.= -.850, Akaike Info. Crt.= 1.988 |
| Standard error corrected for selection..... .68767 |
| Correlation of disturbance in regression |
| and Selection Criterion (Rho).............. .65910 |
+-----------------------------------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
+---------+--------------+----------------+--------+---------+----------+
Constant 1.753797810 1.3912725 1.261 .2075 .
TRABFIJO .4356437681 .68409420E-01 6.368 .0000 .73027260
SEXO -.5062113124E-01 .66550751E-01 -.761 .4469 .83500717
EDAD .8875735718E-02 .24876340E-02 3.568 .0004 41.364419
HIJOS -.7482653581E-01 .18528622E-01 -4.038 .0001 1.8952654
EDUCA .2583800339E-01 .95730846E-02 2.699 .0070 13.298422
MOVIL .1485053775E-02 .21997061E-02 .675 .4996 35.981349
LINGRESO 1.029119343 .10064208 10.226 .0000 13.015925
LAMBDA .4532492445 .15652247 2.896 .0038 .29951337
Se pide:
d) ¿Cuál es la probabilidad de que el individuo medio tenga la vivienda en
propiedad?.
e) ¿Y si el individuo medio tuviese un ingreso anual de 5 millones y tuviera
trabajo fijo?.
f) ¿Existe sesgo de selección?. Explique brevemente el truncamiento selectivo
en términos de este modelo.
78. Sea el siguiente sistema de ecuaciones aparentemente no relacionadas:
y1t = α 1 + β 1 y1t + u1t

y 2t = β 2 x 2t + u 2t
donde var(u1 ) = σ 12 I T , var(u 2 ) = σ 22 I T y σ 12 = 0 . Bajo estas condiciones, estime los

coeficientes de las ecuaciones, proporcionando el valor de cada uno de ellos.
79. Sea el siguiente sistema de ecuaciones simultáneas:
25
y1t = γ 1 y 2t + β 11 x1t + u1t
y 2t = γ 2 y1t + β 22 x 2t + β 32 x3t + u 2t
Estimar por MCI las ecuaciones del modelo, conociendo la siguiente matriz de
productos cruzados de las variables:
y1 y2 x1 x2 x3
y1 20 6 4 3 5
y2 10 3 6 7
x1 5 2 3
x2 10 8
x3 15
80. Considere que yi ~ Poisson(µi ) , siendo µ i = µ = exp(β 0 ) . Obtenga la expresión de

E [ y i y i > r ] , siendo r el punto de truncamiento inferior.
81. Se dispone de información de una encuesta de Turismo para la isla de Tenerife en el

año 1999. La siguiente tabla de resultados recoge la estimación de un modelo logit
binomial para el número de VECES que un turista ha visitado la isla de Tenerife hasta
1999 (=0 si no la ha visitado hasta la vez presente; =1 si la visitado más de una vez, sin
incluir la presente). La regresión se realiza frente al número de noches (NOCHES) y el
gasto en pesetas realizado en el viaje (GASTOS).
MODELO I
+---------------------------------------------+
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
+---------+--------------+----------------+--------+---------+----------+
Constant .1922286745 .38646475E-01 4.974 .0000
MODELO II
+---------------------------------------------+
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
+---------+--------------+----------------+--------+---------+----------+
Constant -1.003536689 .10705899 -9.374 .0000
NOCHES .1276876219 .10680396E-01 11.955 .0000 10.794673
GASTOS -.6216886838E-06 .16365883E-06 -3.799 .0001 77314.730
Predicted Values (* => observation was not in estimating sample.)

Observation Observed Y Predicted Y Residual x(i)b Pr[Y=1]
1 1.0000
2 1.0000 .00000 1.0000 -.1098 .4726
3 .00000 .00000 .0000 -.1103 .4724
4 1.0000 .00000 1.0000 -.1383 .4655
26
5 .00000 .00000 .0000 -.1098 .4726
6 1.0000 .00000 1.0000 -.1100 .4725
7 1.0000 .00000 1.0000 -.1099 .4726
8 1.0000 1.0000 .0000 .7837 .6865
9 1.0000 .00000 1.0000 -.2375 .4409
10 1.0000 .00000 1.0000 -.1100 .4725
11 1.0000
12 1.0000 .00000 1.0000 -.1100 .4725
13 1.0000 .00000 1.0000 -.1099 .4726
14 1.0000 1.0000 .0000 .9113 .7133
15 1.0000 1.0000 .0000 .7835 .6864
16 .00000 .00000 .0000 -.2375 .4409
17 1.0000 .00000 1.0000 -.1099 .4726
18 .00000 .00000 .0000 -.1102 .4725
19 1.0000 1.0000 .0000 .7835
20 1.0000 .00000 1.0000 -.1099
Se pide:
a) En el Modelo I, ¿Cuánto vale la probabilidad del individuo 1º?. ¿Y la del 5º?.
b) Evaluar la significación estadística de los coeficientes del Modelo II. Globalmente,

¿Es el Modelo II estadísticamente significativo?.
c) En el Modelo II, calcular el efecto marginal de la variable NOCHES para el individuo

medio. Interprete el resultado.
d) En el Modelo II, ¿Cuál es la probabilidad estimada por el modelo de que el individuo

1º no haya venido y que el 11º haya venido al menos una vez?. Para ello, tenga en
cuenta que el individuo 1º pasa 7 noches y dice que gasta solamente 400 pesetas;
mientras que el 11º pasa 10 noches y gasta también 400 pesetas. ¿Cuáles son sus valores
predichos y residuos, respectivamente?.
e) En el Modelo II, ¿Cuál es el odd de los individuos 19 y 20?.
f) En el Modelo II, ¿Cuál es el efecto marginal de la variable GASTOS para los

individuos 14 y 18?. Interprete el resultado.
g) Si en toda la muestra existe un 45% de personas que visitaron más de una vez la isla
de Tenerife hasta 1999, ¿cuál es el % de aciertos y no aciertos del modelo II, para los
primeros veinte individuos?.
82. Responda brevemente y de manera justificada a las siguientes cuestiones:
1.1) (0.5 puntos) Demuestre que el odd de un modelo logit binomial de k-variables
explicativas no es independiente del resto de las variables (tanto continuas como
discretas). Justifique su respuesta.
1.2) (0.25 puntos) Sea Φ −1 ( pi ) = 0 . ¿Cuánto vale la probabilidad?. Y, ¿Si
p
ln i = 0 ?.
1 − pi
1.3) (0.25 puntos) En un modelo logit multinomial con tres alternativas ( j = 0,1,2 ), ¿A
qué es igual el odd-ratio entre la alternativa 0 y 2?. Justifique su respuesta.
1.4) (0.5 puntos) En el modelo de Poisson, si xi′β = ln β 0 , siendo β 0 una constante, ¿A
qué es igual P(Yi ≤ 1) sabiendo que yi = 0,1,2,3,4,5,6 ?. Justifique su respuesta.
1.5) (0.5 puntos) Es cierta la afirmación de que en un modelo de regresión truncado, sea
el truncamiento superior o inferior, el efecto marginal no es inferior con respecto
al caso en que no exista truncamiento. Justifique su respuesta.
27
1.6) (0.5 puntos) Sea y una variable censurada inferiormente en 0. Si esta variable es
N (0,1) , entonces, ¿A qué es igual E [ y ] ?.
1.7) (0.5 puntos) Sea x ~ U (0,1) una variable aleatoria truncada superiormente en el
⎡ 1⎤
punto 1 3 y f (x ) = 1 , ¿Cuánto vale E ⎢ x x < ⎥ ?.
⎣ 3⎦
1.8) (0.5 puntos) En un sistema de dos ecuaciones SUR, cuando X 1 = X 2 = X 0 , es
decir, todos los regresores contenidos en X i son iguales para las 2-ecuaciones,
¿A qué es igual el estimador MCO?. ¿Coincide con el estimador MCO de
ecuación por ecuación?. ¿Es eficiente?. Justifique su respuesta.
1.9) (0.25 puntos) Los métodos de estimación de información completa en los modelos
de ecuaciones simultáneas son, en general: (a) Sesgados e ineficientes
asintóticamente; (b) Sesgados, consistentes pero ineficientes asintóticamente; (c)
Sesgados, inconsistentes y eficientes asintóticamente; (d) Ninguna de las
anteriores. ¡Elegir una respuesta!.
1.10) (0.25 puntos) ¿Bajo qué condiciones coinciden el estimador MC2E y MC3E?.
Enumere al menos dos condiciones.
83. Suponga los siguientes datos de un modelo de Poisson que trata de explicar la
incidencia de la antigüedad de los barcos sobre el número de accidentes navales ( y i ).
Estos datos son:
Barco yi ( xi′ β̂ )
1 0 1.79
2 0 1.78
3 3 1.85
4 4 1.85
5 6 1.87
Calcular la probabilidad asociada al número de accidentes del 3er y 4º barco así como el
efecto marginal que les corresponde, sabiendo que el coeficiente de la variable que
representa la antigüedad de los barcos es 0.00006.
84. Se dispone de información sobre las siguientes variables: MODE, que es una
variable dicotómica 0/1 para cuatro alternativas: 1=avión, 2=tren, 3=bus, 4=coche;
TTME, es el tiempo de espera en la terminal (aeropuerto o estación) en minutos; GC,
es una medida del coste total, calculada como la suma del precio o coste directo del
transporte más el coste de oportunidad del tiempo del viaje; HINC, es la renta familiar
en miles de u.m.; AASC, es una variable ficticia que recogerá la constante específica de
la alternativa Avión; TASC, es una variable ficticia que recogerá la constante específica
de la alternativa Tren; BASC, es una variable ficticia que recogerá la constante
específica de la alternativa Bus; y T_HINC es HINC x TASC. Se obtienen los
siguientes resultados de la estimación de un logit condicional:
+---------------------------------------------+
| Discrete choice (multinomial logit) model |
| Dependent variable Choice |
| Log-L for Choice model = -191.3419 |
| R2=1-LogL/LogL* Log-L fncn R-sqrd RsqAdj |
| No coefficients -291.1218 .34274 .33642 |
| Constants only -283.7588 .32569 .31920 |
28
| Response data are given as ind. choice. |
| Number of obs.= 210, skipped 0 bad obs. |
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
+---------+--------------+----------------+--------+---------+----------+
TTME -.0979 .10528918E-01 -9.251 .0000
GC -.0114 .45838244E-02 -2.491 .0128
AASC 5.7753 .66299023 8.711 .0000
TASC 5.2830 .59420314 8.891 .0000
BASC 3.2163 .45585715 7.056 .0000
T_HINC -.0476 .12376830E-01 -3.843 .0001
Y se dispone adicionalmente de la información del primer individuo de la muestra:
Individuo 1 MODE TTME GC HINC

Avión 0 69 70 35
Tren 0 34 71 35
Autobús 0 35 70 35
Coche 1 0 30 35
Se pide, calcular la probabilidad asignada por el modelo para la elección de ir en

autobús.
85. Se dispone de la información sobre las siguientes variables: PRIV = decisión de

tener al menos un hijo en colegio privado (=1,si; = 0, no). YRS = años vividos en la
comunidad. INC = Logaritmo de la renta. PTAX = logaritmo de los impuestos pagados
sobre la propiedad. TAX = voto (0=no) sobre un impuesto de la propiedad. A
continuación, aparecen los resultados de la estimación del siguiente modelo de Elección
Discreta, en el que la variable endógena es TAX.
+-----------------------------------------------------------------------+
| Dependent variable is binary, y=0 or y not equal 0 |
| Ordinary least squares regression Weighting variable = none |
| Dep. var. = TAX Mean= .6375000000 , S.D.= .4837550902 |
| LogAmemiyaPrCrt.= -1.525, Akaike Info. Crt.= 1.313 |
+-----------------------------------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
+---------+--------------+----------------+--------+---------+----------+
Constant -.6501299531E-01 1.4267090 -.046 .9637
PRIV -.2026390498 .15401512 -1.316 .1883 .12500000
YRS -.3577810684E-02 .55246021E-02 -.648 .5172 8.7750000
INC .4727635679 .14558071 3.247 .0012 9.9677200
PTAX -.5698400912 .18646276 -3.056 .0022 6.9372738
Normal exit from iterations. Exit status=0.
+---------------------------------------------+
| Binomial Probit Model |
| Dependent variable TAX |
| Significance level .3659252E-02 |
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
+---------+--------------+----------------+--------+---------+----------+
Index function for probability
Constant -1.438212331 4.5332519 -.317 .7510
PRIV -.6254668928 .45015770 -1.389 .1647 .12500000
YRS -.9763633978E-02 .16139813E-01 -.605 .5452 8.7750000
INC 1.678640394 .58167049 2.886 .0039 9.9677200
PTAX -2.123845389 .75134583 -2.827 .0047 6.9372738
Frequencies of actual & predicted outcomes
Predicted outcome has maximum probability.
29
Predicted
------ ---------- + -----
Actual 0 1 | Total
------ ---------- + -----
0 12 17 | 29
1 7 44 | 51
------ ---------- + -----
Total 19 61 | 80
Se pide:
a) ¿Cuál es la probabilidad de votar NO para el primer individuo, sabiendo que su score

es 0.2263?. ¿Cuál es la probabilidad de votar SI para el 10º individuo, sabiendo que su
score es 0.9015?.
b) ¿Cuál es el efecto marginal de las variables PTAX e INC, evaluado éste en la media
de las observaciones individuales?.
c) Si la probabilidad del individuo 8º fuese 0.6159, su renta fuese 2980.96 unidades
monetarias, tuviese dos hijos en un colegio privado y los impuestos pagados sobre la
propiedad fuesen de 148.41 unidades monetarias, ¿cuántos años habría vivido en la
comunidad?. Suponga conocidos los valores de los parámetros obtenidos de la
estimación del modelo.
d) ¿Cuál es el porcentaje de predicciones incorrectas?.
86. Sea yi = 0,1,2 el número de veces de una variable Y. Se estima un modelo de
Poisson, considerando como variables explicativas X1, X2 y X3. Los resultados de la
estimación son los siguientes:
+---------------------------------------------+
| Dependent variable Y |
| Significance level .8543482E-01 |
| Chi- squared = 9.40329 RsqP= .3283 |
| G - squared = 11.77968 RsqD= .3594 |
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
+---------+--------------+----------------+--------+---------+----------+
Constant .7551347557 .27109082 2.786 .0053
X1 .5086108632 .24598851 2.068 .0387 .26233333
X2 -.3799382583 .26275370 -1.446 .1482 -.20766667
X3 -.3219574305 .31345480 -1.027 .3044 -.30813333
Se pide:
a) ¿Cuál es la probabilidad para los individuos 1º, 2º y 5º de la muestra, sabiendo que

sus respectivos números de veces son 1, 0 y 2, así como sus parámetros λ̂i son iguales a
0.36169, 0.44244 y 1.7826, respectivamente?.
b) ¿Cuál es el efecto marginal de las variables X1 y X2, evaluado en la media de las
observaciones individuales?.
c) Suponiendo que el individuo 10º ha venido 0 veces, y la probabilidad estimada por el
modelo es de 12.50%, ¿Cuánto vale la media y varianza condicional estimada por el
modelo para este individuo?.
87. Suponga que un individuo tiene la posibilidad de elegir entre dos alternativas (=1 si
la elige, =0 en caso contrario). Suponga también que los datos muestrales de 14
individuos se agrupan en 5 grupos para la variable x j . Estos datos aparecen resumidos
30
en la siguiente tabla para las proporciones muestrales p̂ j , los valores de x j , las
puntuaciones x′j βˆ = βˆ0 + βˆ1 x j y el tamaño muestral de cada grupo n j .
p̂ j xj x ′j β̂ nj
0.84 6 1.72 3
0.10 4 -2.17 2
0.15 3 -1.66 4
0.95 8 3.00 3
0.98 10 4.30 2
Se pide que, con los datos anteriores, escriba la expresión del estimador eficiente
usando esta información -en su forma matricial-, que es necesaria para estimar un
modelo probit con observaciones repetidas.
88. Un estadio de fútbol, con capacidad para 60000 espectadores, se ha llenado el 25%
de los partidos en él celebrados a lo largo de la competición, con una cifra media de
asistencia (incluidos los partidos en los que se llenó el estadio) de 40000 espectadores.
¿Cómo estimaría la media y varianza de la demanda de localidades?. ¿Cómo cambiaría
su respuesta si la cifra de 40000 espectadores no incluyese los partidos en que se llenó
el estadio?. Justifique brevemente su respuesta.
89. El logaritmo de la variable ingresos tiene distribución normal, y = log x , con media
µ y desviación σ . Sabiendo que el grado de truncamiento es del 98% y que los
ingresos de todos los hogares encuestados están por encima de 100000 euros con media
de 142000 euros para los más acaudalados, tal que:
E [ y y > log100] = log142 ≡ E [ y y > 4.605] = 4.956 , ¿Cuál es el valor de µ y σ ?. ¿Y
el ingreso medio?.
90. Sea el siguiente modelo de ecuaciones simultáneas:
ct = α1 yt + α 2 mt −1 + u1t
it = β1 yt + β 2 rt + u2t
yt ≡ ct + it
donde las variables endógenas son c t (consumo), ii (inversión) e yt (renta). Las otras
variables son predeterminadas ( rt es el tipo de interés, y mt es la masa monetaria), y uit ,
(
i=1,2, los residuos de ambas ecuaciones, distribuidos iid 0,σ i2 . Se pide:)
a) Identificar el modelo.
b) Obtener la forma reducida para la ecuación de consumo, inversión y renta.
31
PARTE II
CUESTIONES TIPO TEST
1. Se ha estimado un modelo probit de elección de modo de transporte para ir al trabajo

(1=coche propio; 0= guagua). Las variables explicativas son sexo (1= hombre), con
coeficiente estimado igual a 0.5 y edad, con coeficiente estimado igual a 0.03. La
constante estimada es 0.2. Según el modelo, la probabilidad de que una mujer de 60
años vaya a trabajar en su coche es:
a) Menor del 90%.

b) Mayor que la de un hombre de 30 años.
c) Menor que la del modelo logit equivalente.
d) Ninguna de las anteriores.
2. Sea un modelo de duración del paro (en meses). Si la función de supervivencia

estimada en t=4 vale 0.68:
a) La probabilidad de estar más de cuatro meses en paro es 0.68.

b) La probabilidad de estar cuatro o menos meses en el paro es mayor que 0.68.
c) La probabilidad de que pasados cuatro meses en paro se consiga trabajo en el
siguiente intervalo de tiempo es 0.32.
3. Creeemos que la nota media del expediente de un alumno de Economía depende

linealmente del género (hombre=1), de la nota media del bachillerato, de las horas de
estudio semanales y de características socioeconómicas del entorno familiar. Tenemos
una muestra aleatoria de los alumnos que han pedido una beca entre cuyos requisitos se
exige tener una nota media de expediente de 6 o mayor. Este es un caso de:
a) Modelo tobit de regresión censurada con censuración inferior en el punto 6.

b) Modelo tobit de regresión censurada con doble censuración, inferior en el punto
6 y superior en el punto 10.
c) Modelo de regresión truncada con truncación inferior en el punto 6.
d) Modelo de regresión truncada con doble truncación, inferior en el punto 6 y
superior en el punto 10.
4. En el caso anterior, el estimador del género de MCO es -0.8. Podemos interpretar

que:
a) En promedio y ceteris paribus los chicos tienen 0.8 puntos menos de media de
expediente que las chicas.
b) Considerando solo la población de alumnos cuya nota media es igual o mayor
que 6, en promedio y ceteris paribus los chicos tienen 0.8 puntos menos de
media de expediente que las chicas.
c) Como el estimador de MCO coincide en este caso particular con el de MV (por
el teorema de Frobenius), podemos hacer inferencia a la población, pero solo a
la de mujeres ya que para ellas GENERO=0.
32
5. Sea un modelo de probabilidad lineal dicotómico con una sola variable explicativa X:
Yi = α + βX i + U i .
a) Si se estima por MCO, los estimadores son insesgados, consistentes y eficientes.

b) El valor esperado de la variable dependiente condicionada a X se interpreta
como un score que es función no lineal de la probabilidad de Y=1.
c) Es heterocedástico, siendo la varianza de las perturbaciones igual a
α (1 − α ) + βX (1 − 2α − βX ) .
6. El modelo de utilidad aleatoria U ij = Z 'ij α + c'i δ j + ε ij ; j = 1,2
a) Supone que la función de utilidad que le reporta la alternativa j al individuo i es

una función de distribución.
b) Implica, dados los supuestos habituales de racionalidad del consumidor, que la
probabilidad de elegir la alternativa 1 es, en último término, una función de
densidad normal.
c) Da lugar al modelo probit binomial si las utilidades aleatorias ε ij de ambas
alternativas para el individuo i siguien distribuciones normales idénticas e
independientes.
d) Da lugar al modelo probit binomial si las utilidades aleatorias ε ij de ambas
alternativas para el individuo i siguien distribuciones normales independientes,
con idénticas varianzas entre individuos aunque con varianzas diferentes entre
alternativas.
7. Se ha estimado un modelo logit binomial con una constante (valor estimado = 2) y

una variable explicativa X (coeficiente estimado = -0.8). El 35% de los individuos de la
muestra ha elegido "actuar" (alternativa Y=1):
a) El modelo estima que la probabilidad de que una persona caracterizada por

X=2.5 elija "actuar" es exactamente del 50%.
b) El odd-ratio de la variable X es 2.2255.
c) Si X aumenta en una unidad, la probabilidad de "actuar" disminuye en 0.8.
d) Si X aumenta en una unidad, el odd-ratio disminuye en 0.8.
8. Hemos estimado un modelo logit binomial por MV, con los siguientes resultados:
Variable Coeficiente Error Estándar Individuo i

Constante 1.7 0.3
X1 -0.5 0.04 4
X2 0.6 0.002 3
El efecto marginal de X2 sobre la probabilidad de que el individuo i elija la alternativa 1

(Y=1= es:
a) 0.6
b) 1.5
33
c) 0.08949
d) 0.817574
9. En un modelo logit multinomial no ordenado con tres alternativas (la tercera es la de

referencia), el efectto marginal de xk sobre la probabilidad de elección de la alternativa
j es:
a) Pij (1 − Pij ) β jk .
J −1
b) Pij ( β ik − ∑ Pij β jk ) .
h =1
2
c) Pij ( β jk − ∑ Pih β hk ) .
h =1
10. En un modelo de regresión truncada con truncación inferior, si el grado de

truncación estimado para los valores medios muestrales es 0.5:
a) El efecto marginal sobre la esperanza de Y en la subpoblación muestreada es

0.36338 veces el coeficiente de la regresión truncada estimado por MV.
b) El efecto marginal sobre la esperanza de Y en la subpoblación muestreada es
c) El efecto marginal sobre la esperanza de Y en la subpoblación muestreada es
d) El efecto marginal sobre la esperanza de Y en la subpoblación muestreada es el
coeficiente de la regresión truncada estimado por MV.
11. El concepto de truncamiento selectivo inferior consiste en que:
a) Una variable solo se observa si otra variable con la que está correlacionada está
por debajo de un valor fijo dado.
b) Una variable solo se observa si otra variable con la que está correlacionada está
por encima de un valor fijo dado.
c) Es un modelo de regresión que mezcla el truncamiento con la censuración.
d) Es un modelo de regresión que ha pasado una selectividad previa de forma que
los valores que no alcancen un determinado nivel de la variable endógena no
pueden entrar en la muestra.
12. Una variable X está distribuída N(200, 120). Está censurada inferiormente en el
punto a=200. La esperanza de la distribución censurada es:
a) 295.7461.
b) 312.8446.
c) 162.7740.
d) 185.3312.
13. Con datos de las 3000 mayores empresas españolas por volumen de ventas
queremos estimar un modelo explicativo de las ventas (en logaritmo) válido para todas
las empresas españolas, en función de los gastos en publicidad, la plantilla, dummies de
sector y algunos ratios financieros. En este caso:
34
a) Los estimadores MCO son ELIO pero deben obtenerse mediante un algoritmo
iterativo de optimización no lineal.
b) Habrá que utilizar MCG porque las perturbaciones son heterocedásticas.
c) Como es una muestra censurada, debemos emplear el modelo tobit y estimarlo
por MV.
d) Como es una muestra truncada, debemos obtener el estimador MV del modelo
de regresión truncada.
14. Considera la elección por el consumidor racional entre una cesta compuesta de
bienes y las horas semanales de ocio. El IRPF grava en un porcentaje fijo las rentas del
trabajo pero hay un mínimo exento:
a) La frontera del conjunto de oportunidades tiene tres segmentos lineales y,

dependiendo de la forma de las curvas de indiferencia, la combinación óptima
de ambos bienes puede ser una solución de esquina, una de codo o dos tipos
diferentes de tangencia.
b) El conjunto de oportunidades tiene una frontera con agujeros.
e) La frontera del conjunto de oportunidades es de tal forma que todos los
individuos que deciden trabajar por debajo del límite de horas sujeto al IRPF
tendrán una solución de esquina.
d) En la especificación econométrica del correspondiente modelo de horas
trabajadas deberemos emplear un modelo tobit de regresión censurada con un
punto de censuración fijo igual al mínimo exento del impuesto.
15. Sea una distribución normal de media 20 y desviación igual a 15, truncada
superiormente en el punto 30:
a) La media truncada es 15.45632 y la varianza truncada es inferior a 225.

b) La media truncada es 15.45632 y la varianza truncada es superior a 225.
c) La media truncada es 9.2065 y la varianza truncada es inferior a 225.
16. Hemos estimado por MV un modelo de regresión truncada inferiormente en el punto

a. El coeficiente estimado de la variable explicativa X:
a) Es un estimador consistente del efecto marginal de X, sobre Y en la

subpoblación observada.
b) Es un estimador consistente del efecto marginal de X, sobre Y correspondiente
a la subpoblación no observada.
c) Es un estimador consistente del efecto marginal de X, sobre Y correspondiente
a toda la población.
d) Es menor que el efecto marginal de X, sobre Y correspondiente a la
subpoblación observada.
17. Sea un modelo de oferta laboral de mujeres casadas, que explica las horas anuales
trabajadas a partir de una muestra aleatoria de la población que contiene trabajadoras y
no trabajadoras. Una estrategia adecuada (consistente) de estimación de los efectos del
número de hijos pequeños sobre las horas ofertadas es:
35
a) Estimar por MV un modelo de dos ecuaciones, una probit que estima la
probabilidad de trabajar y otra censurada (censuración incidental según la
primera ecuación) que estima las horas ofertadas.
b) Estimar por MV un modelo de regresión truncada, con truncación inferior en
cero horas trabajadas.
c) Estimar por MV un modelo tobit de regresión censurada, con censuración
inferior en cero horas trabajadas.
d) Estimar primero por MCO un modelo de salarios con la submuestra de
trabajadoras y luego un modelo de regresión censurada de las horas trabajadas
en el que los salarios sombra figuren como explicativos.
18. En el modelo tobit de regresión censurada inferiormente en el punto cero, la

estimación del efecto marginal de X sobre el valor esperado de Y correspondiente a toda
la población:
a) Puede descomponerse aditivamente en dos componentes que traducen el

cambio en la media de Y para la submuestra positiva y el cambio en la
probabilidad de pertenecer a ella respectivamente.
b) Es el vector de coeficientes estimados.
c) Es el producto del vector de coeficientes estimados por la probabilidad de no
pertenecer a la submuestra positiva y la estimación es idéntica para todos los
individuos de la muestra.
19. En las dos preguntas siguientes sólo una de las alternativas es FALSA. Debes
señalar la alternativa FALSA:
1) La función de hazard o tasa de fallos condicional en t:
a) Mide la tasa de fallos en el intervalo t+)t dado que se ha llegado hasta el

instante t sin fallar.
b) Si es constante, corresponde a una distribución exponencial.
c) Es el cociente entre las funciones de densidad y de supervivencia en t.
d) Depende de t en los enfoques paramétricos, aunque no necesariamente en los
no paramétricos.
2) El modelo de Cox:
a) Es un modelo semiparamétrico de duración.

b) Supone que la tasa de fallo condicional en el momento t es proporcional a
una función lineal de las variables exógenas.
c) Si no hay variables exógenas en el modeo, se convierte como caso particular
en un modelo no paramétrico de duración.
d) Implica que el logaritmo de la tasa de fallo condicional en el momento t es
una función lineal de las variables exógenas.
20. ¿Qué se entiende, en el contexto de modelos de elección discreta, por datos

agrupados (o por observaciones repetidas)?:
36
a) La muestra constituye dos grupos, según la elección que hayan realizado.
b) Los datos se agrupan previamente para evitar la heterocedasticidad.
c) Hay grupos de individuos idénticos en las características X, que son cualitativas
o discretas.
d) Las observaciones repetidas sobran y por tanto se borran del fichero.
21. En caso de datos agrupados con suficientes observaciones por clase:
a) Tanto el MLP como el modelo logit se pueden estimar eficientemente por MCO.
b) Para estimar el modelo logit hay que emplear el método de máxima
verosimilitud.
c) Tanto el MLP como el modelo logit se pueden estimar eficientemente por MCG,
introduciendo información sobre las varianzas (heterocedásticas) de las
perturbaciones aleatorias de cada clase.
22. El riesgo relativo de dos modalidades de un atributo:
a) Es el cociente entre las probabilidades de actuar y de no actuar en los dos

supuestos o circunstancias que se comparan.
b) Si el intervalo de confianza del riesgo relativo contiene el valor uno, esto indica
que la variable explicativa (el atributo en cuestión) influye significativamente en
la probabilidad de actuar.
e) El riesgo relativo en el modelo probit depende solamente del coeficiencte beta
estimado y por tanto es constante para todos los individuos de la muestra,
mientras que en el modelo logit el riesgo relativo depende también de las
características X que definen al individuo y de su probabilidad de actuar.
f) El riesgo relativo es mayor en la zona intermedia de la función de distribución
logística que en las colas.
23. La sensibilidad de un modelo de elección discreta es:
a) El porcentaje de predicciones correctas en el grupo de los que han elegido Y=0.

b) El porcentaje de predicciones correctas en el grupo de los que han elegido Y=1.
c) El porcentaje global de aciertos, o bondad global del ajuste.
d) Las variaciones de la probabilidad frente a incrementos marginales de X.
24. En un modelo probit, los coeficientes de regresión no tienen una interpretación

directa en términos de efectos sobre la probabilidad de elección, pero:
a) Los riesgos relativos, exp(β k ) , son independientes de las probabilidades y de las

características X de los individuos.
b) La diferencia entre los coeficientes de dos variables explicativas mide el efecto
relativo unitario de ambas sobre la probabilidad de elección.
c) El cociente entre los coeficientes de dos variables explicativas mide el efecto
relativo unitario de ambas sobre la probabilidad de elección.
d) Se relacionan mediante una fórmula excata (de Amemiya) con los obtenidos en
un modelo logit.
37
25. Un modelo logit multinomial no ordenado estima las probabilidades de elección
entre J alternativas exhaustivas y mutuamente excluyentes. Para ello
a) Se estiman J ecuaciones logit binomiales independientes.

b) Se admite implícitamente la hipótesis de las alternativas irrelevantes.
c) Se admite implícitamente la hipótesis de las alternativas irrelevantes que
establece que la probabilidad relativa de elegir dos opciones cambia si se
modifica el conjunto de elección, es decir, otras alternativas no consideradas en
la comparación.
d) Se toma la primera o la última alternativa como referencia pero no debe tomarse
nunca una intermedia como referencia.
26. En el modelo dicotómico de probabilidad lineal no restringido:
a) Las perturbaciones aleatorias son heterocedásticas, siendo su varianza Pi .

b) La varianza de la perturbación aleatoria es Pi (1 − Pi ) .
c) Las predicciones de individuos fuera de la muestra pueden caer fuera del
intervalo (0,1) aunque las predicciones para los individuos de la muestra siempre
caen en dicho intervalo.
d) Los estimadores MCO son sesgados e inconsistentes.
27. La función de verosimilitud de un modelo logit dicotómico cuya única variable

explicativa sea la constante, estimado para una muestra con n1 individuos con Y=1 y n2
individuos con Y=0:
a) Es mayor o igual que la del modelo con la constante y otros regresores.

b) Su valor es diferente de la función de verosimilitud del modelo probit con solo
la constante.
c) Su logaritmo neperiano es n1LnP + n2 Ln(1 − P ) , siendo P la probabilidad global
estimada de Y=1.
d) No puede calcularse a menos que n1 < n2 .
28. Hemos estimado dos modelos logit multinomiales no ordenados alternativos. La

variable dependiente tiene cuatro categorías. El primer modelo contiene dos variables
explicativas además de la constante y el segundo tiene cinco variables explicativas
además de la constante. Para contrastar el modelo modelo 1 contra el modelo 2 y bajo
la hipótesis nula el estadístico de prueba χ 2 tiene ……….. grados de libertad.
29. Queremos estimar los determinantes de la elección de centro comercial para hacer la
compra mensual de alimentación de las familias de una gran ciudad. Hay cuatro
grandes centros comerciales. Las variables explicativas son un índice de precios
relativos, la distancia en kilómetros desde el hogar y la renta familar. Un modelo
adecuado para esta situación es:
a) Modelo logit condicional de McFadden.

b) Modelo logit multinomial ordenado.
c) Modelo logit multinomial no ordenado.
d) Modelo tobit.
38
30. Hemos estimado un modelo logit multinomial no ordenado con tres alternativas de
elección (1,2,3). Tomando como referencia la alternativa 1, los coeficientes estimados
de X, en las dos ecuaciones son respectivamente 1.2 y -0.8. Si volviéramos a estimar el
modelo tomando como referencia la alternativa 3:
a) Los dos estimadores serían iguales a los obtenidos pero con los signos
cambiados.
b) El estimador en la ecuación de Y=1 sería 0.8 y en la ecuación de Y=2 sería 2.
c) El estimador en la ecuación de Y=1 sería -1.2 y en la ecuación de Y=2 sería 0.4.
d) El estimador en la ecuación de Y=1 sería 0.4 y en la ecuación de Y=2 sería -1.2.
31. En un modelo logit binomial de decisión de aseguramiento de la vivienda (Yi=1,

indica que el individuo i ha decidido asegurarse), el coeficiente de la variable
explicativa ficticia vivienda en propiedad (Xi=1, indica que el individuo i posee una
vivienda en propiedad; Xi=0, indica que el individuo i posee una vivienda en régimen de
alquiler) vale 0.69315. Esto indica que:
a) Los propietarios de vivienda tienen el doble de odd de asegurarse (probabilidad

de asegurarse relativa a no hacerlo) que los que viven en una vivienda
alquilada.
b) Los propietarios de vivienda tienen un 69.31% más de probabilidad de
asegurarse que de no asegurarse.
c) Los que tienen la casa asegurada tienen un riesgo relativo de ser propietarios
de su vivienda igual al doble que los que no tienen seguro.
d) Los que tienen la casa asegurada tienen una probabilidad relativa de ser
propietarios de su vivienda un 69% superior respecto a 1 grupo de los que no
tienen seguro.
32. En referencia a los modelos de elección cualitativa binomial:
a) En el MLP se cumple siempre que la media muestral de las probabilidades

estimadas por el modelo coincide con la proporción muestral de éxitos, pero
esto no siempre ocurre en el modelo logit.
b) En el modelo logit se cumple siempre que la media muestral de las
probabilidades estimadas por el modelo coincide con la proporción muestral
de éxitos, pero esto no siempre ocurre en el MLP.
c) Tanto en el modelo logit como en el MLP se cumple siempre que la media
muestral de las probabilidades estimadas por el modelo coincide con la
proporción muestral de éxitos.
d) Tanto en el modelo logit como en el MLP, la probabilidad de éxito (Y=1)
evaluada para los valores medios muestrales de las X coincide con la
proporción muestral de éxitos.
33. La hipótesis de independencia de las alternativas irrelevantes en los modelos logit

multinomiales:
a) Es una propiedad muy interesante de los modelos logit multinomiales que

permite abreviar mucho los cálculos.
39
b) Indica que el odd entre dos alternativas solo depende de los atributos del
individuo y de los vectores de coeficientes de las ecuaciones
correspondintes a dichas alternativas.
c) Es una hipótesis que permite considerar la existencia de alternativas de
elección sustitutivas y complementarias.
d) Es una hipótesis en muchos casos poco realista pero desafortunadamente no
puede contrastarse.
34. Se ha estimado un modelo logit multinomial con 3 alternativas no ordenadas. La

tercera actua como referencia. Hay dos variables explicativas continuas. Para los valores
medios de la muestra, hemos obtenido los siguientes resultados:
Media Coeficientes 1ª Coeficientes 2ª

muestral ecuacion ecuación
Constante 2 0.1
X1 18 -0.3 -0.4
X2 11 .35 1.8
Probabilidad estimada 0.5197 0.1489 0.3314
por el modelo para la
media muestral
El efecto marginal de un aumento unitario de X1 sobre la probabilidad de que el

individuo promedio de la muestra elija la segunda alternativa es:
a) 0.03588.
b) 0.08526.
c) 0.12526.
d) No se puede calcular con los datos de la tabla.
40

Ejercicios Econometria III PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Ejercicios Econometria III PDF

Cargado por

Copyright:

Formatos disponibles

EJERCICIOS PROPUESTOS DE

MODELOS DE RESPUESTA CUALITATIVA

1. Una empresa de seguros encuentra que la probabilidad de poseer un seguro de hogar

sˆi = 0.07 + 0.0002 y i + 0.004 Ei

a) ¿Cuál es la probabilidad de NO poseer un seguro?.

2. Se ha estudiado la posibilidad de que el hecho de que una familia tenga la vivienda en

i Y Sexo Edad Ingresos Trabfijo

Además, se conocen los siguientes resultados de la estimación de un modelo logit y

Variables Logit Probit

Yi = 0.069 − 0.018 x1i + 0.049 x 2i + 0.057 x3i

a) ¿Qué modelos han sido estimados?.

5. En una encuesta realizada en junio de 2001 a diez alumnos de 4º curso se les

6. Demostrar que las estimaciones de mínimos cuadrados ordinarios de los modelos

7. Sea N 1 el número de individuos con Yi = 1 y N 2 el número de individuos con Yi = 0 ,

8. Suponga una distribución z ~ N (µ , σ ) , la cuál se encuentra truncada en el punto

9. Suponemos que la demanda de entradas a los conciertos (VENTAS) que se celebran

Se ha estimado el modelo y los resultados son:

a) Calcular los efectos marginales evaluados en la media de las variables.

CRI = 0.07 + 0.02 RN I + 0.004 EDI + 0.14TC I

a) Interpretar los parámetros de este modelo.

Parámetro Beta e.s. beta e.s.

yˆi = 1.22 − 1.68D1i − 2.88D2i − 4.17 D3i − 11.69 D4i

14. En el análisis de los resultados de un plan de ocupación en donde la variable

E=0,EP=0 E=0,EP=1 E=1,EP=0 E=1,EP=1 Total

b) Una vez realizada la estimación por el método de máxima verosimilitud, se obtienen

βˆ0 = 1.30(0.22), βˆ1 = −2.23(0.26), βˆ2 = −0.98(0.26 )

¿Cuál será la probabilidad estimada por el modelo de que encuentre trabajo un

c) La estimación por máxima verosimilitud proporciona los siguientes resultados:

1) Interpreta los resultados.

16. Retomando el ejercicio 1. Si la renta bruta anual fuese de 3 millones de pesetas y la

a) ¿Es la probabilidad de poseer un seguro igual al 79% y la varianza de la perturbación

a) ¿Qué diferencias sustanciales hay en la especificación y estimación de este modelo

b) )Qué significado tiene un valor -0.0815 para el parámetro de la variable RENTA1?.

Zˆ i = 0.0040 X 1i + 0.0312 X 2i + 0.4967 X 3i

a) Verificar si el modelo es significativo globalmente.

Zˆ i = 0.0380 X 1i + 0.0240 X 2i + 0.5674 X 3i + 0.0382 X 4i

¿Cuál sería la probabilidad de que la empresa quiebre cuando el ratio de reservas es

donde p es la proporción de observaciones muestrales con Yi = 1 . ¿Puede extenderse este

20. Sea el siguiente modelo no lineal:

Suponiendo normalidad en la distribución del término de perturbación del modelo, así

a) Descenso más rápido.

22. Se ha estimado un modelo probit de elección de modo de transporte para ir al

24. Calcula la esperanza de la distribución de una variable X que es N(200, 120) y

25. Formula la hipótesis de independencia de las alternativas irrelevantes en el contexto

Autores: Enrique García Pérez y Benjamín Manchado.

Título: Un modelo econométrico del fraude académico en una universidad española

Resumen: El fraude académico es un fenómeno que, en un futuro próximo, adquirirá

La variable que desempeñó el papel de endógena (FRAUDE) podía tomar los

Las variables explicativas incluidas en las especificaciones que se propusieron trataron

- VERENGEX es una variable dicotómica que toma el valor 1 si el alumno observó a

Responda a las siguientes cuestiones y diga si se cumple en los modelos estimados:

a) La percepción de una baja probabilidad de ser sorprendido, ¿implicaría un menor

CONSTANTE 2 -13,624 -12,105 -12,301 -12,426 -13,451

CONSTANTE 3 -4,5128* -5,5000* -5,1343* -6,0046* -6,2749*

28. Diferencia entre un modelo logit multinomial y un modelo logit condicional de

30. ¿Qué es truncación incidental (llamada también truncamiento selectivo?. Defínala y

Un conocido tuyo tiene x1 = 4 y x2 = 20 . Estima las probabilidades que, según el

32. ¿Cuál es el modelo probabilístico que especifica una razón de fallo

32. Se ha estimado un modelo probit de elección de modo de transporte para ir al

33. Escribe la función de verosimilitud de un modelo tobit de regresión censurada con

Variable Coeficiente Error Estándar Datos del Individuo i

Calcula el efecto marginal de X1 sobre la probabilidad de que el individuo i elija la

36. Sea la siguiente muestra de N=425 votantes. La variable dependiente representa el