Documentos de Académico
Documentos de Profesional
Documentos de Cultura
4 Contraste de Hipotesis en El Modelo de Regresion Multiple PDF
4 Contraste de Hipotesis en El Modelo de Regresion Multiple PDF
Ezequiel Uriel
Universidad de Valencia
Versin: 09-2013
4.1 El contraste de hiptesis: una panormica 1
4.1.1 Formulacin de la hiptesis nula y de la hiptesis alternativa 1
4.1.2 Estadstico de contraste 2
4.1.3 Regla de decisin 3
4.2 Contraste de hiptesis utilizando el estadstico t 5
4.2.1 Contraste de un solo parmetro 5
4.2.2 Los intervalos de confianza 16
4.2.3 Contraste de hiptesis sobre una combinacin lineal de parmetros 17
4.2.4 Importancia econmica versus significacin estadstica 22
4.3 Contraste de restricciones lineales mltiples utilizando el estadstico F 22
4.3.1 Restricciones de exclusin 22
4.3.2 Significacin global del modelo 27
4.3.3 Estimando otras restricciones lineales 28
4.3.4 Relacin entre los estadsticos F y t 29
4.4 Contrastes sin normalidad 30
4.5 Prediccin 31
4.5.1 Prediccin puntual 31
4.5.2 Prediccin por intervalos 31
4.5.3 Prediccin de y en un modelo logartmico 35
4.5.4 Evaluacin de las predicciones y prediccin dinmica 36
Ejercicios 38
1
como la hiptesis nula, a la que designa H0. As pues, una hiptesis nula es una
declaracin sobre los parmetros poblacionales.
Aunque es posible formular hiptesis nulas compuestas en el contexto del
modelo de regresin, siempre consideraremos que la hiptesis nula es una hiptesis
simple. Es decir, para formular una hiptesis nula, utilizaremos siempre el operador
igualdad. Veamos a continuacin algunos ejemplos de hiptesis nulas referidas al
modelo de regresin:
a) H0 : 1=0
b) H0 : 1+ 2 =0
c) H0 : 1=2 =0
d) H0 : 2+3 =1
Tambin vamos a definir una hiptesis alternativa, designada por H1, que
representa nuestra conclusin en el caso de que el contraste concluya que H0 es falsa.
Aunque las hiptesis alternativas pueden ser tambin simples o compuestas, en
el modelo de regresin, tomaremos siempre, como hiptesis alternativa, una hiptesis
compuesta. La hiptesis alternativa, a la que se designa H1, se formula mediante el
operador "desigualdad" en la mayor parte de los casos. As, por ejemplo, dada la H0:
H0 : j 1 (4-1)
H1 : j 1 (4-4)
2
CUADRO 4.1. Algunas distribuciones utilizadas en el contraste de hiptesis.
1 o ms
1 restriccin
restricciones
2 conocida N Chi-square
Error de tipo I
Error de tipo II
3
Enfoque clsico: Aplicacin de la regla de decisin
El mtodo clsico implica los siguientes pasos:
a) Eleccin de . El contraste de hiptesis clsico requiere que inicialmente se
especifique un nivel de significacin. Cuando se especifica un valor para ,
esencialmente lo que estamos cuantificando es nuestra tolerancia para un error de tipo I.
Si =0.05, entonces el investigador est dispuesto a rechazar H0 falsamente en un 5%
de los casos.
b) Obtencin de c, valor crtico, utilizando tablas estadsticas. El valor c se
determina por el valor de .
El valor crtico en un contraste de hiptesis es un umbral con el cual se compara
el estadstico de contraste para determinar si la hiptesis nula se rechaza o no.
c) Comparando el resultado del estadstico de contraste, s, con c, la H0 se
rechaza o no para un valor dado de .
La regin de rechazo (RR), delimitada por el valor crtico (c), es un conjunto de
valores del estadstico de contraste para los cuales se rechaza la hiptesis nula. (Vase
figura 4.1). Es decir, el espacio muestral del estadstico de contraste se divide en dos
regiones: una regin (la regin de rechazo) nos lleva a rechazar la hiptesis nula H0,
mientras que la otra no nos deja rechazar la hiptesis nula. Por lo tanto, si el valor
observado del estadstico de contraste s se encuentra en la regin crtica, rechazamos la
H0; en el caso de que no se encuentre en la regin de rechazo llegamos a la conclusin,
de no rechazar la H0 o de fracasar en rechazar la H0.
Simblicamente,
Si sc se rechaza H0
(4-7)
Si sc no se rechaza H 0
Si la hiptesis nula se rechaza con la evidencia de la muestra, sta es una
conclusin fuerte. Sin embargo, la aceptacin de la hiptesis nula es una conclusin
dbil porque no conocemos cul es la probabilidad de no rechazar la hiptesis nula
cuando debe ser rechazada. Es decir, no conocemos la probabilidad de cometer un error
de tipo II. Por lo tanto, en lugar de utilizar la expresin de la aceptacin de la hiptesis
nula, es ms correcto decir fracasar en rechazar la hiptesis nula, o no rechazar, ya que
lo que realmente sucede es que no tenemos suficiente evidencia emprica para rechazar
la hiptesis nula.
En el proceso de contrastacin, la parte ms subjetiva es la determinacin a
priori del nivel de significacin. Qu criterios se pueden utilizar para determinar ? En
general, se trata de una decisin arbitraria, aunque como ya hemos dicho, los niveles de
1%, 5% y 10% para son los ms utilizados en la prctica. A veces se efecta el
contraste condicionado a distintos niveles de significacin.
4
Regin Regin
de no de
rechazo rechazo
RNR RR
c W
FIGURA 4.1. Contraste de hiptesis: enfoque clsico.
El estadstico t
Bajo los supuestos del MCL del 1 al 9,
j ~ N j , var( j ) j 1, 2,3, , k (4-8)
Si tipificamos
j j j j
~ N 0,1 j 1, 2,3,, k (4-9)
var( j ) sd ( j )
5
puede asumir. En cualquier aplicacin, asumir o no el supuesto de normalidad de u es
realmente una cuestin emprica. A menudo, mediante una transformacin, por ejemplo,
tomando logaritmos, se obtiene una distribucin que est ms cercana a la normalidad y
que es ms fcil de manejar desde un punto de vista matemtico. Las muestras grandes
nos permiten prescindir del supuesto de normalidad sin afectar demasiado a los
resultados.
Bajo los supuestos de MLC del 1 al 9, se obtiene una distribucin t de Student
b j - b j
t n- k (4-10)
ee(b )
j
6
FIGURA 4.2.
4 Funcionees de densidad
d: normal y t para diferen
ntes grados dde libertad
j
t
j
ee( j )
est j alejada de cero. A fin de detterminar una regla paraa rechazar H 0, tenemo
os que
deciddir sobre la l hiptesis alternativva relevantte. Hay trees posibiliddades: hip tesis
alternnativas unillaterales (co
ola derecha e izquierda)) e hiptesiss alternativaa de dos collas.
Hiptesis altern
nativa de un
na cola: derrecha
En primeer lugar, vam
mos a consiiderar la hip
ptesis nula
7
H0 : j 0
contrra la hiptessis alternativ
va
H1 : j 0
Este es un
u contrastte de signifficacin possitiva. La regla de deccisin es en
n este
caso la siguientee:
R
Regla de deccisin
Si t t n k se reechaza H0
j
(4-12)
(
Si t t n k no se rechaza H 0
j
comoo puede veerse en la figura 4.3 . Est muy y claro quee para rechhazar H0 contra
c
H1 : j 0 el valor
v de t debe ser ppositivo. Un
n resultado negativo
n dee t , no im
mporta
j j
FIG
GURA 4.3. Reg gin de rechazzo utilizandoo la t: URA 4.4. El va
FIGU alor-p utilizanndo la t: hip
tesis
h
hiptesis alterrnativa de colla a la derech
ha. alternativva de cola a laa derecha.
EJEMMPLO 4.1 Es lal propensin n marginal a cconsumir men nor que la pro
opensin medidia al consumo o?
Como se vev en el ejemp plo 1.1, contraastar la proposicin 3 de la funcin de coonsumo keyneesiana,
en unn modelo lineaal, es equivaleente a contrasstar si el trmiino independiente es signifficativamente mayor
que 0. Es decir, en el modelo
ccons 1 2inc u
8
Tenem
mos que contrrastar si
1 0
Con una muestra
m aleatoria de 42 obseervaciones, see han obtenido
o los siguientess resultados
cons = 0.41 + 0.8 843 inc
i i
(0.350) (0.0
062)
Los nmeeros entre parntesis, debajjo de los coeficientes, son los errores eestndar (ee) de los
estimaadores.
La pregunnta que nos plaanteamos es laa siguiente: ees la tercera prroposicin de la teora keyn
nesiana
admissible? A continnuacin, respo
ondemos a estta pregunta.
1) En este caso, las hip
tesis nula y aalternativa son
n las siguientes:
H 0 : 1 0
H1 : 1 0
2) El contrraste estadsticco es:
1 10 1 0 0.41
0
t 1.171
ee( 1 ) ee( 1 ) 0.35
0
3) Regla de
d decisin
Es conveeniente utilizaar varios nivveles de sig gnificacin. Comencemos
C con un niv vel de
signifficacin de 0.10 porque el valor de t ess relativamentte pequeo (mmenor que 1.55). En este caso, los
gradoos de libertad son 40 (42 ob bservaciones menos 2 parmetros estimmados). Si noss fijamos en laa tabla
estadstica de la t (fila 40 y columna
c de 00.10 o 0.20, en las tablas de una colla, o de dos colas,
respecctivamente), encontramos
e q t40
que 0.10
1.3003 .
Como t<1.303, no se reechaza la H0. Si no rechazaamos la H0 paara =0.10, taampoco se recchazar
para =0.05 ( t400.05
1.684 ) o =0.01
= 0.01
( t40 22.423 ), como puede verse en la figura 44.5. En esta fig
gura la
reginn de rechazo corresponde a =0.10. Porr lo tanto, no se puede rech hazar la H0 enn favor de la H1. En
otras ppalabras, los datos
d muestrales no son connsistentes con n la proposicin 3 de Keynees.
En el enfooque alternativo, como pueede verse en la figura 4.6, el valor-p coorrespondientee a t
1
=1.1771 para una t con 40 gl ess igual a 0.1224. Para <0..124 - por ejeemplo, 0.10, 00.05 y 0.01-, no se
rechazza la H0.
FIG GURA 4.5. Ejeemplo 4.1: Reegin de rech hazo FIGURA 4.6. Ejemplo 4.1: El vaalor-p utilizan ndo la
n hiptesis altternativa de ccola a t con
utilizzando la t con n hiptesis altternativa de ccola a la dereecha.
la derecha.
Hiptesis altern
nativa de un
na cola: izq uierda
Considerremos ahoraa la hiptesiis nula
H0 : j 0
contrra la hiptessis alternativ
va
H1 : j 0
9
Este es un contraste de significacin negativa.
La regla de decisin es en este caso es la siguiente:
Regla de decisin
Si t tn k se rechaza H0
j
(4-13)
Si t tn k no se rechaza H 0
j
p-value
tnk 0 t 0
j
FIGURA 4.7. Regin de rechazo utilizando la t: FIGURA 4.8. El valor-p utilizando la t: hiptesis
hiptesis alternativa de cola a la izquierda. alternativa de cola a la izquierda.
EJEMPLO 4.2 Tiene la renta una influencia negativa sobre la mortalidad infantil?
El siguiente modelo ha sido planteado para explicar las muertes de nios menores de 5 aos por
1000 nacidos vivos (deathun5).
deathun5 1 2 gnipc 3ilitrate u
donde gnipc es la renta nacional bruta per cpita e ilitrate es la tasa de analfabetismo de adultos (15 aos
o ms) en porcentaje.
Con una muestra de 130 pases (fichero hdr2010) se ha realizado la siguiente estimacin:
deathun 5 = 27.91 - 0.000826 gnipc + 2.043 ilitrate
i i i
(5.93) (0.00028) (0.183)
Los nmeros entre parntesis, debajo de los coeficientes, son los errores estndar (ee) de los
estimadores.
Una de las preguntas formuladas por los investigadores es si la renta tiene una influencia
negativa sobre la mortalidad infantil. Para responder a esta pregunta se lleva a cabo un contraste en el que
las hiptesis nula y alternativa y el estadstico de contraste son los siguientes:
H 0 : 2 0 2 0.000826
t 2.966
H1 : 2 0
ee( 2 ) 0.00028
Dado que el valor de t es relativamente alto, vamos a empezar a contrastar con un nivel del 1%.
Para =0.01, t130 2 t60 2.390 . Teniendo en cuenta que t<-2.390, como se muestra en la figura 4.9, se
0.01 0.01
rechaza la H0 a favor de la H1. Por lo tanto, la renta nacional bruta per cpita tiene una influencia que es
significativamente negativa en la mortalidad de nios menores de 5 aos; es decir, cuanto mayor sea la
10
renta nacional brutta per cpita ms
m bajo ser el porcentajje de mortalid dad de nios m menores de 5 aos.
Comoo la H0 se ha reechazado paraa =0.01, tamb
mbin ser rech hazada por loss niveles de 5%
% y 10%.
En el enfooque alternativ
vo, como pueede verse en lal figura 4.10, el valor-p coorrespondientte a un
t =-22.966 para t con menos de 61 gl es iguall a 0.0000. Paara todos los >0.0000 com mo 0.01, 0.05 y 0.10,
1
se recchaza la H0.
Hiptesis altern
nativa con dos
d colas
Considerremos ahoraa la hiptesiis nula
H0 : j 0
contrra la hiptessis alternativ
va
H1 : j 0
Si t tn/k2 se reechaza H0
j
(4-14)
(
/2
Si t tn k no se
s rechaza H 0
j
11
n se rechazza cuando <valor-p. En
hipttesis nula no E este caso o valor-p see distribuye entre
las ddos colas de forma simtrica, comoo se muestraa en la figurra 4.12.
12
FIGURA 4.13. Ejemplo 4.3: valor-pp utilizando t:: hiptesis altternativa de ddos colas.
Hasta ahhora hemos visto el conntraste sign
nificativo dee una cola y de dos collas en
el quue un parm
metro toma ele valor 0 enn la H0. Aho
ora vamos a ver un casoo ms generral en
que eel parmetroo en la H0 to
oma un valoor especfico cualquiera:
H 0 : j 0j
En este caso,
c el estaadstico t addecuado es
j 0j
t
j
ee( j )
13
Es la fruta un bien de lujo?
Segn la teora econmica, una mercanca es un bien de lujo cuando la elasticidad del gasto con
respecto a la renta es mayor que 1. Por lo tanto, para responder a esta segunda cuestin, y teniendo en
cuenta que el estadstico t es el mismo, se ha llevado a cabo el siguiente procedimiento:
H 0 : 2 1 H1 : 2 1 .
Para =0.10, nos encontramos con que t 0.10
36 t350.10 1.31 .Cuando t>1.31, rechazamos H0 en
favor de H1. Para =0.05, t360.05 t350.05 1.69 .Como t>1.69, rechazamos la H0 en favor de la H1. Para
=0.01, t360.01 t350.01 2.44 . Como t<2.44, no rechazamos H0. Por lo tanto, la fruta es un bien de lujo para
=0.10 y =0.05, pero no se puede rechazar la H0 en favor de la H1 para =0.01.
EJEMPLO 4.5 Es la Bolsa de Madrid un mercado eficiente?
Antes de responder a la cuestin planteada, vamos a examinar algunos conceptos previos. La
tasa de rendimiento de un activo en un perodo de tiempo se define como la variacin porcentual que
experimenta el valor invertido en ese activo durante dicho perodo de tiempo. Vamos a considerar ahora
como activo especfico, a una accin de una compaa industrial adquirida en una Bolsa espaola al final
de un ao y que se mantiene hasta el final del ao siguiente. A esos dos momentos de tiempo los desig-
naremos t-1 y t respectivamente. La tasa de rendimiento de esa accin al cabo de ese ao puede
expresarse mediante la siguiente relacin:
DPt + Dt + At
RAt (4-15)
Pt-1
donde
Pt : es la cotizacin de la accin al final del perodo t
Dt : son los dividendos percibidos por la accin durante el perodo t
At : es el valor de los derechos que eventualmente han podido corresponder a la accin
durante el perodo t
As pues, en el numerador de (4-15) se recogen los tres tipos de ganancias de capital que se han
podido percibir por el mantenimiento de una accin durante el ao t : incremento - o prdida en su caso
en la cotizacin, dividendos y derechos de ampliacin. Al dividir por Pt-1 se obtiene la tasa de ganancia
sobre el valor de la accin a finales del perodo anterior. De los tres componentes el ms importante es el
incremento en la cotizacin. Teniendo en cuenta solamente a esa componente, la tasa de rendimiento de la
accin puede expresarse por
DPt
RA1t (4-16)
Pt-1
o, alternativamente si utilizamos una tasa de variacin natural, por
RA2t D ln Pt (4-17)
De la misma forma que RAt, en cualquiera de las dos expresiones, representa la tasa de
rendimiento de una accin concreta, se puede estimar tambin la tasa de rendimiento del conjunto de
acciones cotizadas en Bolsa. A esta ltima tasa de rendimiento, a la que designaremos por RMt, se le
denomina tasa de rendimiento de mercado.
Hasta ahora hemos considerado la tasa de rendimiento en un ao, pero igualmente se puede
aplicar expresiones del tipo (4-16), o (4-17), para obtener tasas de rendimiento diario. Analizando el
comportamiento de estas tasas cabe preguntarse si las tasas de rendimiento en el pasado son de utilidad
para predecir las tasas de rendimiento en el futuro. Esta pregunta est relacionada con el concepto de efi-
ciencia de un mercado. Un mercado es eficiente si los precios incorporan toda la informacin disponible,
de modo que hay posibilidad de obtener ganancias extraordinarias al utilizar esta informacin.
Para contrastar la eficiencia de un mercado vamos a definir el siguiente modelo, utilizando tasas
de rendimiento diarias definidas segn (4-16):
rmad 92t 1 2 rmad 92t 1 ut (4-18)
14
Si un mercado es eficiente, entonces el parmetro 2 del anterior modelo debe ser 0. Vamos a
contrastar ahora si la Bolsa de Madrid, en lo que respecta a la renta variable, es o no eficiente en su
conjunto.
El modelo de (4-18) se ha estimado con datos diarios de la Bolsa de Madrid para el ao 1992,
utilizando el fichero bolmadef. Los resultados obtenidos han sido los siguientes:
rmad 92 0.0004+ 0.1267 rmad 92
t t -1
(0.0007) (0.0629)
R2=0.0163 n=247
Los resultados obtenidos pueden resultar paradjicos. Por una parte, el valor del coeficiente de
determinacin es muy bajo (0.0163), lo que significa que solamente el 1.63% de la varianza total de la
tasa de rendimiento se explica por la tasa de rendimiento del da anterior. Por otra parte, sin embargo, el
coeficiente correspondiente a la tasa de significacin del da anterior es estadsticamente significativo
para un nivel del 5% pero no para un nivel de 1%, porque el estadstico t es igual a 0.1267/0.0629=2.02
0.01 0.01
que es ligeramente mayor en valor absoluto que t245 t60 =2.00. El motivo de esta aparente paradoja
se debe a que el tamao de la muestra es muy elevado. As, aunque la incidencia de la variable explicativa
sobre la variable endgena es relativamente reducida (como indica el coeficiente de determinacin), sin
embargo, esta incidencia es significativa (como lo confirma el estadstico t) debido a que se ha dispuesto
de una muestra de datos suficientemente grande.
Contestando a la pregunta de si la Bolsa de Madrid es o no un mercado eficiente, en un primer
anlisis la respuesta es que no es totalmente eficiente. Sin embargo, esta respuesta debe matizarse. En
economa financiera es conocida la existencia de una relacin de dependencia entre la tasa de rendimiento
de un da y la del da precedente. Esta relacin no es muy fuerte, aunque s es estadsticamente
significativa en muchas bolsas mundiales, y se debe a las fricciones del mercado. En cualquier caso, este
fenmeno no se puede explotar de forma lucrativa por los agentes del mercado, por lo que no se puede
calificar a estos mercados de ineficientes, de acuerdo con la definicin dada anteriormente sobre el
concepto de eficiencia.
EJEMPLO 4.6 La rentabilidad de la Bolsa de Madrid, se ve afectada por la rentabilidad de la Bolsa de
Tokio?
El estudio de la relacin entre distintos mercados de acciones (Bolsa de Nueva York, Bolsa de
Tokio, Bolsa de Madrid, Bolsa de Londres, etc.) ha recibido una gran atencin en los ltimos aos,
debido a una mayor libertad en la circulacin de capitales y a la conveniencia de utilizar mercados
extranjeros para reducir el riesgo en la gestin de carteras, ya que la ausencia de una perfecta integracin
de los mercados permite la diversificacin del riesgo. De todas formas, cada vez se camina hacia una
mayor integracin mundial de los mercados financieros, en general, y de los mercados de acciones, en
particular.
Si los mercados son eficientes, y hemos visto en el ejemplo 4.5 que se puede admitir que lo sean,
las noticias que se van produciendo, a las que se denominan innovaciones, durante un perodo de 24 horas
se irn viendo reflejadas en los distintos mercados.
Conviene distinguir entre dos tipos de innovaciones: a) innovaciones globales, que son noticias
que se generan alrededor del mundo y que se captan en los precios de las acciones en todos los mercados;
b) innovaciones especficas, que es la informacin generada durante un perodo de 24 horas que solo
afecta a los precios de un mercado particular. As, la informacin sobre evolucin de los precios del
petrleo se puede considerar como una innovacin global, mientras que una nueva regulacin del sector
financiero en un pas sera considerada posiblemente como una innovacin especfica.
De acuerdo con la exposicin anterior, en una sesin de Bolsa de un determinado mercado, los
precios de las acciones que en l se cotizan vendrn afectados por las innovaciones globales recogidas en
otro mercado que haya cerrado antes. As, las innovaciones globales recogidas en el mercado de Tokio
influirn en las cotizaciones del mercado de Madrid de ese mismo da. El siguiente modelo recoge la
transmisin de efectos entre la Bolsa de Tokio y la Bolsa de Madrid:
rmad92t =1+2rtok92t +ut (4-19)
donde rmad92t es la tasa de rentabilidad de la Bolsa Madrid en el perodo t, y rtok92t es la tasa de
rentabilidad de la Bolsa de Tokio en el perodo t. Las rentabilidades de los mercados se han calculado de
acuerdo con (4-16).
15
En el fichero madtok se pueden encontrar los ndices generales de la Bolsa de Madrid y la Bolsa
de Valores de Tokio durante los das en que ambas bolsas estaban abiertas de forma simultnea. Es decir,
se han eliminado las observaciones de los das en los que cualquiera de las bolsas estuviese cerrada. En
total, el nmero de observaciones es de 234, en comparacin con los 247 y 246 das en que las Bolsa de
Madrid y de Tokio estuvieron abiertas respectivamente.
La estimacin del modelo (4-19) es como sigue:
rmad 92 0.0005+ 0.1244 rtok 92
t t
(0.0007) (0.0375)
R2=0.0452 n=235
Obsrvese que el coeficiente de determinacin es relativamente bajo. Sin embargo, para
contrastar H0:2=0, se obtiene que el estadstico t = (0.1244/0.0375) = 3.32 lo que implica que se rechaza
la hiptesis nula de que la tasa de rendimiento de la Bolsa de Valores de Tokio no tenga ningn efecto
sobre la tasa de rentabilidad de la Bolsa de Madrid, para un nivel de significacin de 0.01.
Una vez ms nos encontramos con la misma paradoja aparente que apareci cuando se analiz la
eficiencia de la Bolsa de Madrid en el ejemplo 4.5 a excepcin de una diferencia. En este ltimo caso, la
tasa de rendimiento del da anterior apareca como significativa, debido a problemas derivados de la
elaboracin del ndice general de la Bolsa de Madrid.
En consecuencia, el hecho de que la hiptesis nula sea rechazada implica que hay evidencia
emprica que apoya la teora de que las innovaciones globales de la Bolsa de Tokyo se transmiten a las
cotizaciones de la Bolsa de Madrid ese mismo da.
j /2
Pr tn/2k j tn k 1
ee( j )
Operando para situar al parmetro j solo en el centro del intervalo, obtenemos
que
Pr j ee( j ) tn/2k j j ee( j ) tn/2k 1
j j ee( j ) tn/2k
16
la construccin del IC, no sabemos si j est o no realmente contenida dentro del
intervalo.
Una vez que el IC se ha construido, es fcil llevar a cabo contrastes de hiptesis
de dos colas. Si la hiptesis nula es H 0 : j a j , entonces la H 0 se rechaza contra la
H1 : j a j para el nivel de significacin del 5%, si y slo si, aj no est en el IC del
95%.
Para ilustrar todo lo anterior, en la figura 4.14 se han construidos intervalos de
confianza del 90%, 95% y 99%, para la propensin marginal al consumo -2-
correspondiente al ejemplo 4.1.
0,99
0,95
0,90
0.968
1.011
0.675
0.739
0.843
0.947
0.718
FIGURA 4.14. Intervalos de confianza para la propensin marginal al consumo en el ejemplo 4.1.
17
- si 2+3=1, hay rendimientos constantes a escala.
- si 2+3>1, hay rendimientos crecientes a escala.
- si 2+3<1, hay rendimientos decrecientes a escala
Los datos utilizados en este ejemplo son una muestra de 27 empresas del sector de metales
primario (fichero prodmet), donde la produccin es el valor aadido bruto, el trabajo es una medida de la
mano de obra y el capital es el valor bruto de la planta y equipo. Detalles adicionales sobre la
construccin de estos datos se ofrecen en Aigne et al. (1977) y en Hildebrand y Liu (1957). Los
resultados obtenidos en la estimacin del modelo (4-20) aparecen en el cuadro 4.4.
CUADRO 4.4. Salida estndar de la estimacin de la funcin de produccin: modelo (4-20).
Variable Coeficiente Error estndar Estadstico t Prob.
constant 1.170644 0.326782 3.582339 0.0015
ln(labor) 0.602999 0.125954 4.787457 0.0001
ln(capital) 0.375710 0.085346 4.402204 0.0002
Para responder a la pregunta planteada en este ejemplo, tenemos que contrastar:
H 0 : 2 3 1
contra la hiptesis alternativa siguiente:
H1 : 2 3 1
De acuerdo con la H0, se deduce que 2 3 1 0 . Por lo tanto, el estadstico t se basa ahora
en si la suma estimada 2 3 1 es lo suficientemente diferente de 0 como para rechazar la H0 a favor
de la H1.
Para contrastar esta hiptesis se van a utilizar dos procedimientos. En el primer procedimiento se
utiliza la matriz de covarianzas de los estimadores. En el segundo, el modelo se reparametriza
introduciendo un nuevo parmetro.
Procedimiento que utiliza la matriz de covarianzas de los estimadores
De acuerdo con H0, se estima que 2 3 1 0 . Por lo tanto, el estadstico t est basado ahora
en si la suma estimada 2 3 1 es lo suficientemente diferente de 0 para rechazar la H0 a favor de la
H1. Para tener en cuenta el error de muestreo en nuestros estimadores, se estandariza esta suma dividiendo
por su error estndar:
3 1
t 2
2 3
ee( 2 3 )
As que, si t es lo suficientemente grande, vamos a concluir, en un contraste de dos colas,
2 3
que no hay rendimientos constantes a escala. Por otro lado, si t es positivo y lo suficientemente
2 3
grande, vamos a rechazar, en un contraste alternativo de una cola (la derecha), a H0 en favor de
H1 : 2 3 1 , concluyendo que s hay rendimientos crecientes a escala.
Por otro parte, tenemos que
ee( 2 3 ) var( 2 3 )
donde
var( 2 3 ) var( 2 ) var( 3 ) 2 covar( 2 , 3 )
Por lo tanto, para estimar ee( 2 3 ) se necesita informacin sobre la covarianza estimada de
los estimadores. Muchos paquetes de software economtrico, como el E-Views, tiene una opcin para
mostrar las estimaciones de la matriz de covarianzas del vector de los estimadores. En este caso, la matriz
de covarianzas obtenida aparece en el cuadro 4.5. Con esta informacin se tiene que
ee( ) 0.015864 0.007284 2 0.009616 0.0626
2 3
2 3 1 0.02129
t
0.3402
2 3
ee( 2 3 ) 0.0626
18
CUADRO 4.5. Matriz de covarianza de la funcin de produccin.
constante ln(labor) ln(capital)
constant 0.106786 -0.019835 0.001189
ln(labor)) -0.019835 0.015864 -0.009616
ln(capital) 0.001189 -0.009616 0.007284
Teniendo en cuenta que t=0.3402, es evidente que no podemos rechazar la existencia de
rendimientos constantes de escala, para los niveles de significacin habituales. Dado que el estadstico t
toma un valor negativo, no tiene sentido contrastar si existen rendimientos crecientes a escala.
Procedimiento en el que se reparametriza el modelo mediante la introduccin de un nuevo parmetro
La aplicacin de este segundo procedimiento es una forma ms fcil de realizar este contraste.
En este procedimiento se estima un modelo diferente que proporciona directamente el error estndar en
que estamos interesados. As, en el ejemplo anterior vamos a definir:
2 3 1
por lo que la hiptesis nula de que hay rendimientos constantes a escala es equivalente a postular que
H0 : 0 .
De la definicin de se tiene que 2 3 1 . Sustituyendo 2 en la ecuacin original:
ln(output ) 1 ( 3 1) ln(labor ) 3 ln(capital ) u
Por lo tanto,
ln(output / labor ) 1 ln(labor ) 3 ln(capital / labor ) u
As pues, contrastar si existen rendimientos constantes a escala es equivalente a realizar un
contraste de significacin del coeficiente ln(labor) en el modelo anterior. La estrategia de reescribir el
modelo, de modo que contenga el parmetro de inters, funciona en todos los casos y normalmente es
fcil de implementar. Si aplicamos esta transformacin en este ejemplo, se obtienen los resultados del
cuadro 4.6.
Como puede verse se obtiene el mismo resultado:
t 0.3402
ee()
19
Utilizando una muestra de 18 reas de venta (fichero advincen), se han obtenido los resultados
de la regresin y la matriz de covarianzas de los coeficientes que aparecen en los cuadros 4.7 y 4.8,
respectivamente.
CUADRO 4.7. Salida estndar de la regresin para el ejemplo 4.8.
Variable Coeficiente Error estndar Estadstico t Prob.
constant 396.5945 3548.111 0.111776 0.9125
advert 18.63673 8.924339 2.088304 0.0542
incent 30.69686 3.604420 8.516448 0.0000
3 2 30.697 18.637
t 1.295
3 2
ee( 3 2 ) 9.3142
Para =0.10, nos encontramos con que t150.10 1.341 . Como t<1.341, no rechazamos H0 para
=0.10, ni para =0.05 o =0.01. Por lo tanto, no hay evidencia emprica de que un dlar gastado en
incentivos especiales tenga una mayor incidencia en las ventas que un dlar gastado en publicidad.
EJEMPLO 4.9 Contraste de la hiptesis de homogeneidad en la demanda de pescado
En el caso de estudio del captulo 2 fueron estimados diversos modelos, utilizando datos de corte
transversal, para explicar la demanda de productos lcteos en los que la renta disponible era la nica
variable explicativa. Sin embargo, el precio del producto estudiado y, en mayor o menor medida, los
precios de otros productos son determinantes en la demanda. El anlisis de la demanda sobre la base de
datos de corte transversal, tiene precisamente la limitacin de que no es posible examinar el efecto de los
precios en la demanda porque los precios se mantienen constantes, ya que los datos se refieren todos al
mismo punto en el tiempo. Para analizar el efecto de los precios es necesario el uso de datos de series
temporales o, alternativamente, de datos de panel. A continuacin vamos a examinar, brevemente,
algunos aspectos de la teora de la demanda de un bien para luego pasar a la estimacin de una funcin de
demanda con datos de series temporales. Como colofn a este caso, vamos a contrastar una de las
hiptesis que, en determinadas circunstancias, debe satisfacer un modelo terico.
La demanda de un bien -como el bien j- se puede expresar, de acuerdo con un proceso de
optimizacin llevado a cabo por el consumidor, en trminos de renta disponible, del precio de la
mercanca y de los precios del resto de bienes. Analticamente:
q j f j ( p1 , p2 , , p j , , pm , R ) (4-21)
donde
- R es la renta disponible de los consumidores.
20
- p1 , p2 , , p j , pm son los precios de los bienes que se tienen en cuenta por los
consumidores cuando adquieren el bien j.
En los estudios de demanda, los modelos logartmicos son atractivos, ya que los coeficientes son
directamente elasticidades. El modelo logartmico se expresa de la siguiente forma:
ln( q j 1 2 ln( p1 ) 3 ln( p2 ) j ln( p j ) m 1 ln( pm ) m 2 ln( R ) u (4-22)
Como puede verse de forma inmediata, todos los coeficientes , excluyendo el trmino
constante, son elasticidades de diferentes tipos y, por lo tanto, son independientes de las unidades de
medida de las variables. Cuando no hay ilusin monetaria, si todos los precios y la renta crecen a la
misma tasa, la demanda de un bien no se ve afectada por estos cambios. Por lo tanto, suponiendo que los
precios y la renta se multiplican por si el consumidor no tiene ilusin monetaria, se debe satisfacer que
f j (l p1 , l p2 , , l p j , , l pm , l R ) f j ( p1 , p2 , , p j , pm , R ) (4-23)
Desde un punto de vista matemtico, la condicin anterior implica que la funcin de demanda
debe ser homognea de grado 0. Esta condicin se llama la restriccin de homogeneidad. Aplicando el
teorema de Euler, la restriccin de homogeneidad, a su vez implica que la suma de la elasticidad de
demanda/renta y de todas las elasticidades de demanda/precio es cero, es decir:
m
h 1
q j ph qj R 0 (4-24)
Como se puede observar, los signos de las elasticidades son correctos: la elasticidad de la
demanda es negativo con respecto al precio del propio bien, mientras que las elasticidades con respecto al
precio del bien sustitutivo y con respecto al consumo total son positivos.
En el modelo de (4-26) la restriccin de homogeneidad implica la siguiente hiptesis nula:
2 3 4 (4-27)
Para realizar este contraste vamos a utilizar un procedimiento similar al del ejemplo 4.6. Ahora,
el parmetro se define de la siguiente forma
2 3 4 (4-28)
Haciendo 2 3 4 , se ha estimado el siguiente modelo:
ln( fish 1 ln( fishpr ) 3 ln(meatpr fishpr ) 4 ln(cons fishpr ) u (4-29)
Los resultados obtenidos han sido los siguientes:
21
ln( fishi 7.788- 0.4596 ln( fishpri ) + 0.554 ln(meatpri ) + 0.322 ln(consi )
(2.30) (0.1334) (0.112) (0.137)
Usando (4-28), contrastar la hiptesis nula (4-27) es equivalente a contrastar que el coeficiente
de ln(fishpr) en (4-29) es igual a 0. Dado que el estadstico t para dicho coeficiente es igual a -3.44 y
0.01/ 2
t24 =2.8, rechazamos la hiptesis de homogeneidad de la demanda de pescado.
22
modelo no restringido es el modelo de referencia o modelo inicial. En este ejemplo el
modelo no restringido es el modelo que figura en (4-30). El modelo restringido se
obtiene mediante la imposicin de H0 en el modelo original. En el anterior ejemplo el
modelo restringido es
y 1 2 x2 3 x3 u
Por definicin, el modelo restringido siempre tiene un menor nmero de
parmetros que el modelo no restringido. Adems, siempre se verifica que
SCRR SCRNR
donde SCRR es la SCR del modelo restringido, y SCRNR es la SCR del modelo no
restringido. Recuerde que, debido a que las estimaciones de los coeficientes por MCO
se eligen de forma que minimicen la suma de los cuadrados de los residuos, la SCR no
disminuye (y en general aumenta) cuando algunas restricciones (como la eliminacin de
variables) se introducen en el modelo.
El aumento en la SCR cuando se imponen restricciones puede indicarnos algo
sobre si es verosmil la H0. Si el incremento es grande, esto es una evidencia en contra
de H0, y esta hiptesis ser rechazada. Si el incremento es pequeo, esto no ser una
evidencia en contra de H0, y esta hiptesis no ser rechazada. La pregunta es entonces si
el aumento observado en la SCR cuando se imponen las restricciones, es
suficientemente grande, en relacin con la SCR en el modelo no restringido, para
justificar el rechazo de H0.
La respuesta depende claro est de pero no podemos llevar a cabo el
contraste sobre el seleccionado hasta que tengamos un estadstico cuya distribucin
sea conocida y est tabulado bajo la H0. Por lo tanto, necesitamos una manera de
combinar la informacin de la SCRR y de la SCRNR para obtener un estadstico de
contraste con una distribucin conocida bajo H0.
Ahora, veamos el caso general, donde el modelo no restringido es el siguiente:
y 1 2 x2 3 x3 k xk +u (4-31)
Supongamos que hay q restricciones de exclusin a contrastar. Entonces, H0
postula que q variables tienen coeficientes cero. Si se asume que son las ltimas q
variables, la H0 se expresa como
H 0 : k q 1 k q 2 k 0 (4-32)
La H1 se expresa como
H1: H0 no es cierta (4-34)
23
donde SCRR es el SCR del modelo restringido, SCRNR es el SCR del modelo no
restringido y q es el nmero de restricciones, es decir, el nmero de igualdades en la
hiptesis nula.
Para poder utilizar el estadstico F para el contraste de hiptesis, debemos
conocer su distribucin muestral bajo H0 con el fin de elegir el valor de c para un
dado, y determinar la regla de rechazo. Se puede demostrar que, bajo la H0, y
asumiendo que los supuestos del MLC se mantienen, el estadstico F se distribuye como
una variable aleatoria F de Snedecor con q y n-k grados de libertad. Escribimos este
resultado de la siguiente manera
F | H 0 Fq,n-k (4-36)
Una F de Snedecor con q grados de libertad en el numerador y n-k grados de
libertad en el denominador es igual a
2
Fq ,n k
x q
q
(4-37)
2
x nk n k
donde xq2 y xn2 k son distribuciones Chi-cuadrado independientes la una de la otra.
24
utilizarse cuando el modelo no tiene trmino independiente ni cuando la forma
funcional de la variable endgena en el modelo restringido no es la misma que en el
modelo no restringido.
Regla de decisin
La distribucin Fq,n-k est tabulada y disponible en tablas estadsticas, donde se
busca el valor crtico ( Fq,nk ), que depende de (nivel de significacin), q (gl del
numerador), y n-k, (gl del denominador). Teniendo en cuenta lo anterior, la regla de
decisin es muy simple.
Regla de decisin
Si F Fq,n k se rechaza H0
(4-40)
Si F Fq,n k no se rechaza H 0
Regin Regin de
de no Rechazo Rechazado No
rechazo RR para rechazado
RNR p-value para
<p-value
Fq ,nk
Fq ,nk
p-value
Fq,nk F
FIGURA 4.15. Regin de rechazo y regin de no
rechazo utilizando la distribucin F. FIGURA 4.16. Valor-p utilizando la distribucin F.
25
El valor-p tiene la misma interpretacin que en el estadstico t. Un valor-p
pequeo es una evidencia en contra de la H0. Por el contrario, un valor-p elevado no
constituye una evidencia en contra de la H0. Una vez que valor-p ha sido calculado, el
contraste F puede llevarse a cabo para cualquier nivel de significacin. En la figura 4.16
se representa este enfoque alternativo. Como se desprende de la observacin de la
figura, la determinacin del valor-p es la operacin inversa a la de encontrar el valor en
las tablas estadsticas para un determinado nivel de significacin. Una vez que el valor-
p ha sido determinado, se sabe que se rechaza H0 para cualquier nivel de significacin
tal que >valor-p; por el contrario, la hiptesis nula no se rechaza cuando <valor-p.
EJEMPLO 4.10 Salarios, experiencia, antigedad y edad
El siguiente modelo ha sido formulado para analizar los factores determinantes de los salarios:
ln( wage) 1 2 educ 3 exper 4 tenure 5 age u
donde wage son los salarios mensuales, educ son los aos de educacin, exper son los aos de experiencia
laboral, tenure son los aos trabajando con la empresa actual, y age es la edad en aos.
El investigador tiene la intencin de excluir tenure del modelo, ya que en muchos casos es igual
a la experiencia, y tambin la edad, ya que est altamente correlacionada con la experiencia. Es
aceptable la exclusin de ambas variables?
Las hiptesis nula y alternativa son las siguientes:
H 0 : 4 5 0
H1 : H 0 no es cierta
Utilizando una muestra de 53 observaciones del fichero wage2, se han obtenido las siguientes
estimaciones para los modelos no restringido y restringido:
ln( wagei ) = 6.476 + 0.0658educi + 0.0267experi - 0.0094tenurei - 0.0209agei SCR = 5.954
ln( wagei ) = 6.157 + 0.0457 educi + 0.0121experi SCR = 6.250
26
0.10
Regin Regin de
de no rechazo
rechazo RR
RNR
0.05 0.01
F2.48
1.193
2.42
3.23
5.18
FIGURA 4.17. Ejemplo 4.10: Regin de rechazo en la distribucin F (los valores son para F2.40).
y 1 +u (4-42)
Si tomamos esperanzas en (4-42), tenemos que
E( y) 1 (4-43)
As, la H0 en (4-41) implica que no slo que las variables explicativas no tienen
ninguna influencia sobre la variable endgena, sino tambin que la media de la variable
endgena -por ejemplo, el consumo medio- es igual a 0.
Por lo tanto, si queremos conocer si el modelo es globalmente significativo, la
H0 debe ser la siguiente:
H0 : 2 3 k 0 (4-44)
El correspondiente modelo restringido dado en (4-42) no explica nada y, por lo
tanto, RR2 es igual a 0. Entonces, contrastar la H 0 dada en (4-44) es muy fcil utilizando
la forma R-cuadrado del estadstico F:
R2 / k
F (4-45)
(1 R 2 ) / (n k )
2
donde R 2 = RNR , ya que slo es necesario estimar el modelo no restringido, debido a
que el R 2 del modelo (4-42) -modelo restringido- es igual a 0.
EJEMPLO 4.11 Salarios de los directores ejecutivos
Considere la siguiente ecuacin para explicar los salarios (salary) de los directores ejecutivos en
funcin de las ventas anuales de la firma (sales), la rentabilidad sobre recursos propios (roe) (en forma de
porcentaje), y el rendimiento de las acciones de la empresa (ros) (en forma de porcentaje):
ln(salary) =1+2ln(sales)+3roe+4ros+ u.
27
La pregunta que se plantea es si el rendimiento de la empresa medido por las variables sales, roe
y ros es crucial para establecer los salarios de los directores ejecutivos. Para responder a esta pregunta
vamos a hacer un contraste de significacin global. Las hiptesis nula y alternativa son las siguientes:
H 0 : 2 3 4 0
H1: H0 no es cierta
El cuadro 4.9 muestra una salida de E-views completa de mnimos cuadrados (ls), utilizando el
fichero ceosal1. En la parte inferior puede verse el "estadstico F" para el contraste de significacin
global, as como "Prob.", que es el valor-p correspondiente a este estadstico. En este caso valor-p es
igual a 0, es decir, se rechaza H0 para todos los niveles de significacin (Vase la figura 4.18). Por lo
tanto, podemos rechazar que el rendimiento de la empresa no tenga ninguna influencia sobre los salarios
de los directores ejecutivos.
p-value
0,0000
F3,205
0
2,12
2,67
3,92
26,93
FIGURA 4.18. Ejemplo 4.11: Valor-p utilizando la distribucin F (los valores para una F3,140).
28
valores a los parmetros y restricciones relativas a una combinacin lineal de los
parmetros.
As, consideremos el siguiente modelo
y 1 2 x2 3 x3 4 x4 5 x5 u
con la hiptesis nula:
2 3 1
H0 : 4 3
5 0
El modelo restringido correspondiente a esta hiptesis nula es
( y x2 3x4 ) 1 3 ( x3 x2 ) u
En el ejemplo 4.12, que se ver a continuacin, la hiptesis nula consiste en dos
restricciones: una combinacin lineal de parmetros y una restriccin de exclusin.
EJEMPLO 4.12 Una restriccin adicional en la funcin de produccin. (Continuacin del ejemplo
4.7)
En la funcin de produccin de Cobb-Douglas, vamos a contrastar la siguiente H0, que tiene 2
restricciones:
3 1
H0 : 2
1 0
H1 : H 0 no es cierta
En la primera restriccin se impone que hay rendimientos constantes a escala. En la segunda
restriccin que 1, el parmetro relacionado con la productividad total de los factores, es igual a 0.
Sustituyendo la restriccin de H0 en el modelo original (modelo sin restricciones), tenemos
ln(output ) (1 3 ) ln(labor ) 3 ln(capital ) u
Operando, se obtiene el modelo restringido:
ln(output / labor ) 3 ln(capital / labor ) u
En la estimacin de los modelos no restringido y restringido, obtenemos que SCRR=3.1101 y
SCRNR=0.8516. Por lo tanto, la ratio F es igual a
SCRR SCRNR / q (3.1101 0.8516) / 2
F 13.551
SCRNR / (n k ) 0.8516 / (27 3)
Hay dos razones para no utilizar R2 en este caso. En primer lugar, el modelo restringido no tiene
trmino independiente. En segundo lugar, el regresando del modelo restringido es diferente del
regresando del modelo no restringido.
Dado que el valor de F es relativamente alto, vamos a empezar el contrastar con un nivel de
significacin del 1%. Para =0.01, F2,24
0.01
5.61 . Teniendo en cuenta que F>5.61, rechazamos H0 en favor
de H1. Por lo tanto, se rechaza la hiptesis conjunta de que hay rendimientos constantes a escala y de que
el parmetro 1 es igual a 0. Si se rechaza H0 para =0.01, tambin ser rechazada para los niveles de 5%
y 10%.
29
Ahora bien,
b cul es la relac in entre unau F con un grado dde libertad en el
numeerador (paraa contrastar una sola reestriccin) y una t? Se puede
p demoostrar que
tn2k F1,nk (4-46)
(
4.4 C
Contrastess sin norm
malidad
La norm
malidad de los estimadoores de MC CO dependee crucialmen ente del sup
puesto
de noormalidad ded las pertu urbaciones. Qu sucede si las peerturbacionees no tienen n una
distriibucin norrmal? Hemo os visto quee las perturrbaciones baajo los supuuestos de Gauss-
G
Markkov, y en coonsecuenciaa, los estim madores de MCOM tienen
n una distribbucin asin
nttica
normmal, es decirr, tienen aprroximadameente una disstribucin normal.
Si las peerturbacionees no son noormales, el estadstico t no tiene uuna distribuccin t
exacta, sino sloo aproxima ada. Como ppuede versee en la tablaa de la t de Student, paara un
tamaao muestraal de 60 obsservacioness los puntoss crticos so on prcticam mente igual a los
de laa distribucin normal esstndar.
Del mism
mo modo, si las perturbbaciones no o son normales, el estaddstico F no tiene
una distribucinn F exacta, sino sloo aproximad da, cuando el tamaoo muestral es lo
suficcientemente grande y los supueestos de Gauss-Marko
G ov se cum mplen. Entoonces,
podeemos utilizaar el estadsstico F paraa contrastarr las restriccciones lineeales en mo
odelos
lineaales como unn contraste aproximadoo.
Hay otroos contrastees asintticoos (la razn n de verosimmilitud, el m
multiplicaddor de
Lagrrange y el coontraste de Wald) basaados en las funciones de d verosimillitud que pu ueden
utilizzarse en conntrastar restrricciones linneales cuan
ndo las pertu
urbaciones nno se distrib
buyen
normmalmente. Estos tres estadsticoos tambin n pueden aplicarse cuando a) las
restriicciones son no lineales, y b) el modelo es no lineal en e los parmetros. Parra las
30
restricciones no lineales, en los modelos lineales y no lineales, el contraste ms utilizado
es el contraste de Wald.
Para contrastar los supuestos del modelo (por ejemplo, los de homoscedasticidad
y no autocorrelacin) se aplica generalmente el multiplicador de Lagrange (ML). En la
aplicacin del contraste de ML se estima a menudo una regresin auxiliar. El nombre
de regresin auxiliar significa que los coeficientes no son de inters directo: de esta
regresin auxiliar slo se conserva el R2. En una regresin auxiliar el regresando es, por
lo general, los residuos o funciones de los residuos, obtenidos en la estimacin por
MCO del modelo original, mientras que las variables independientes son, a menudo, los
regresores (y/o funciones de los mismos) del modelo original.
4.5 Prediccin
En este epgrafe se examinarn dos tipos de prediccin: prediccin puntual y
prediccin por intervalos.
Por otra parte, adoptando los supuestos de Gauss Markov (1 a 8), se puede
demostrar que este predictor puntual es el estimador lineal insesgado ptimo (ELIO).
Tenemos ahora una prediccin puntual para 0, pero, cul es la prediccin
puntual para y0? Para responder a esta pregunta tenemos que predecir u0. Como el error
no es observable, el mejor predictor de u0 es su valor esperado, que es 0. Por lo tanto,
y 0 0 (4-51)
31
4.5.2 Prediccin por intervalos
Las predicciones puntuales hechas con un modelo economtrico no coincidirn,
en general, con los valores observados, debido a la incertidumbre que rodea a los
fenmenos econmicos.
La primera fuente de incertidumbre es que no podemos utilizar la funcin de
regresin poblacional, ya que no conocemos los parmetros . En su lugar tenemos que
utilizar la funcin de regresin muestral. El intervalo de confianza para el valor
esperado -es decir, para 0 -, que examinaremos a continuacin, incluye slo este tipo
de incertidumbre.
La segunda fuente de incertidumbre es que en un modelo economtrico, adems
de la parte sistemtica, hay una perturbacin que no es observable. La prediccin por
intervalo para un valor individual -es decir para y0-, que se discutir ms adelante
incluye tanto la incertidumbre derivada de la estimacin, como del trmino de
perturbacin.
Una tercera fuente de incertidumbre puede provenir del hecho de no saber
exactamente los valores que las variables explicativas tomarn en el momento de
prediccin. Esta tercera fuente de incertidumbre, que no se aborda aqu, complica los
clculos para la construccin de intervalos.
32
Prediccin por intervalos para un valor individual
Ahora vamos a construir un intervalo para y0, al que se denomina prediccin por
intervalos para un valor individual, o de un modo ms breve, prediccin por intervalos.
De acuerdo con (4-47), y0 tiene dos componentes:
y0 0 u0 (4-54)
El intervalo para el valor esperado construido previamente es un intervalo de
confianza alrededor de 0 , que es una combinacin de los parmetros. En contraste, el
intervalo para y0 es aleatorio, porque uno de sus componentes, u0, es aleatorio. Por lo
tanto, el intervalo para y0 es un intervalo probabilstico y no un intervalo de confianza.
El mecanismo para su obtencin es el mismo, pero teniendo en cuenta que ahora vamos
a considerar que el conjunto x20 , x30 ,, xk0 se encuentra fuera de la muestra utilizada para
estimar la regresin.
0
El error de prediccin de y al predecir y0 es
e20 y0 y 0 0 u0 y 0 (4-55)
Teniendo en cuenta (4-51) y (4-50), y que E(u0)=0, entonces el error de
prediccin esperado es cero. En la bsqueda de la varianza de e20 , debe tenerse en
0
cuenta que u0 no est correlacionado con y , porque x20 , x30 ,, xk0 no pertenecen a la
muestra.
Por lo tanto, la varianza del error de prediccin (condicionada a x) es la suma de
las varianzas:
Var (e20 ) Var ( y 0 ) Var (u0 ) Var ( y 0 ) 2 (4-56)
1
2
ee(e ) ee(0 ) 2
0 2
2 (4-57)
2
Por lo general, 2 es mayor que ee( 0 ) . Bajo los supuestos del MLC,
e20
tn k (4-58)
ee(e20 )
Por lo tanto, podemos escribir que
e20
Pr tn/2k 0
tn/2k 1 (4-59)
ee(e2 )
33
Al sustituir e2 y y en (4-59) y reordenando se obtiene un intervalo de
0 0 0
Por lo tanto, el estudiante tendr una confianza del 95% de obtener, en promedio, una
calificacin final situada entre 6.5 y 8.7.
La prediccin puntual puede obtenerse tambin a partir de la primera ecuacin estimada:
finalmrk = 4.155 + 0.4917 = 7.593
Ahora, vamos a estimar un intervalo de probabilidad del 95% para el valor individual. El error
estndar de e20 es igual a
1
2 2
ee(e20 ) ee( y 0 ) 2 0.497 2 1.6492 1.722
34
CUADRO 4.10. Medidas descriptivas de las variables del modelo sobre el
salario de los ejecutivos.
assets tenure profits
Media 27054 7.8 700
Mediana 7811 5.0 333
Mximo 668641 60.0 22071
Mnimo 718 0.0 -2669
N. observaciones 447 447 447
Los salarios predichos y los correspondiente ee( 0 ) para valores seleccionados (mximo, media,
mediana y mnimo), utilizando un modelo como el (4-53), se presentan en el cuadro 4.11.
CUADRO 4.11. Predicciones para los valores seleccionados.
Prediccin 0 E. estndar ee( 0 )
Valor medio 2026 71
Valor de la mediana 1688 78
Valor del mximo 14124 1110
Valor del mnimo 760 195
35
EJEMPLO 4.15 Prediciendo el salario de los directores ejecutivos con un modelo logartmico
(continuacin de 4.14)
Utilizando los mismos datos que en el ejemplo 4.14, se estim el siguiente modelo:
ln(salary ) = 5.5168 + 0.1885ln(assets ) + 0.0125 tenure + 0.00007 profits
i i i i
(0.210) (0.0232) (0.0032) (0.0000195)
36
n+h
2
( yi - yi )
i n+1
RECM (4-69)
h
Como se toman los cuadrados de los errores, se evita la compensacin entre
errores positivos y negativos. Es importante remarcar que la RECM impone una
penalizacin mayor a los errores de prediccin que el EAM.
Coeficiente de desigualdad de Theil (U)
Este coeficiente se define como sigue:
n+ h
( yi - yi )
2
i n+1
U h (4-70)
n+h n +h
yi2 yi2
i n+1 i n+1
+
h h
Cuanto ms pequeo es U ms precisas son las predicciones. La escala de U es
tal que siempre est entre 0 y 1. Si U=0, yi= y i para todas las predicciones; si U=1, la
prediccin es tan mala como pueda ser. El estadstico U de Theil puede ser reescalado y
descomponerse en 3 proporciones: el sesgo, la varianza y la covarianza. Por supuesto, la
suma de estas tres proporciones es 1. La interpretacin de estas tres proporciones es la
siguiente:
1) El sesgo refleja errores sistemticos. Cualquiera que sea el valor de U,
esperaramos que el sesgo est cercano a 0. Un sesgo grande sugiere que las
predicciones estn sistemticamente por encima, o por debajo, de los valores
reales.
2) La varianza refleja tambin errores sistemticos. El tamao de esta
proporcin es una indicacin de la incapacidad de las predicciones para
replicar la variabilidad de la variable a predecir.
3) La covarianza mide errores de carcter no sistemtico. Idealmente, sta
debera ser la mayor proporcin de la desigualdad de Theil.
Adems del coeficiente definido en (4-70), Theil propuso otros coeficientes para
la evaluacin de predicciones.
Prediccin dinmica
Sea el siguiente modelo:
yt 1 2 xt 3 yt 1 ut (4-71)
Supongamos que se desean realizar predicciones para los periodos
i=n+1,,i=n+h, y que se designa el valor real y previsto en el periodo i como yi y y i
respectivamente. La prediccin para el periodo n+1 es
y n 1 1 2 xn 1 3 yn (4-72)
Como se puede observar, para la prediccin se utiliza el valor observado de y
(yn) porque est dentro de la muestra utilizada en la estimacin. Para la prediccin del
37
resto de los perodos utilizamos de forma recursiva la prediccin del valor retardado de
la variable dependiente (prediccin dinmica), es decir,
y n i 1 2 xn i 3 y n 1i i 2,3,, h (4-73)
As, desde el periodo n+2 al n+h la prediccin realizada para un periodo se
utiliza para pronosticar la variable endgena en el periodo siguiente.
Ejercicios
Ejercicio 4.1 Para explicar el precio de la vivienda en una ciudad americana se formula
el siguiente modelo:
price 1 2rooms 3lowstat 4crime u
donde rooms es el nmero de habitaciones de la casa, lowstat es el porcentaje de
personas de "clase marginal" en la zona y crime es el nmero de delitos per cpita en la
zona. Los precios de las casas estn medidos en dlares.
Utilizando los datos del fichero hprice2, se ha estimado el modelo anterior:
price = -15694+ 6788 rooms -268 lowstat - 3854 crime
(8022) (1211) (81) (960)
2
R =0.771 n=55
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Interprete el significado de los coeficientes , y . 2 3 4
b) Tiene el porcentaje de personas de "clase marginal" una influencia
negativa sobre el precio de las casas en esa rea?
c) Tiene el nmero de habitaciones una influencia positiva sobre el precio
de la vivienda?
Ejercicio 4.2 Considere el siguiente modelo:
ln( fruit ) 1 2 ln(inc) 3hhsize 4 punder5 u
donde fruit es el gasto en frutas, inc es la renta disponible del hogar, hhsize es el nmero
de miembros del hogar y punder5 es la proporcin de nios menores de cinco aos en el
hogar.
Usando los datos del fichero demand, se ha estimado el modelo anterior:
ln( fruit ) = -9.768+ 2.005ln(inc) -1.205 hhsize -1.795 punder 5
(3.701) (0.512) (0.179) (1.302)
2
R =0.728 n=40
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Interprete el significado de los coeficientes , y . 2 3 4
b) Tiene el nmero de miembros del hogar un efecto estadsticamente
significativo sobre el gasto en fruta?
c) Es la proporcin de nios menores de cinco aos en el hogar un factor
que tiene influencia negativa en el gasto fruta?
d) Es la fruta un bien de lujo?
Ejercicio 4.3 (Continuacin del ejercicio 2.5). Teniendo en cuenta el modelo
yi 1 2 xi ui i 1,2,, n
se han obtenido los siguientes resultados con un tamao muestral de 11 observaciones:
38
n n n n n
xi 0
i 1
yi 0
i 1
xi2 B
i 1
yi2 E
i 1
x y
i 1
i i F
n n
y x y x i i i
(Recuerde que 1 i 1
n
i 1
n
)
x
i 1
2
i x xi
i 1
R2=0.996; u 2
t 0.196
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Contraste la hiptesis nula de que el coeficiente de pralim es menor que
0.
b) Obtenga un intervalo de confianza del 95% para la propensin marginal
al consumo de alimentos respecto a la renta.
c) Contraste la significatividad conjunta del modelo.
Ejercicio 4.5 Se han utilizado mnimos cuadrados ordinarios para estimar la siguiente
funcin de demanda de alquiler de viviendas:
ln(galqi)=1+2ln(palqi)+ 3ln(rentai)+i
donde galq es el gasto en alquiler de viviendas, palq es el precio de alquiler, y renta es
la renta disponible.
Utilizando una muestra de 403 observaciones, se obtienen los siguientes
resultados:
ln( galqi ) 10 0.7ln palqi 0.9ln rentai
con R2= 0.39 y la matriz estimada de covarianzas
1.0 0 0
cov( ) 0 0.09 0.085
0 0.085 0.09
a) Interprete los coeficientes de ln(galq) y ln(palq).
b) Utilizando un nivel de significacin del 0.01, contraste la hiptesis nula
de que 2=3=0.
c) Contraste la hiptesis nula de que 2=0, frente a la alternativa de que
2<0.
39
d) Contraste la hiptesis nula de que 3=1 frente a la alternativa de que
3 1.
e) Contraste la hiptesis nula de que un aumento en el precio de la vivienda
y un aumento en la renta, en la misma proporcin, no tienen ningn
efecto sobre la demanda de viviendas.
Ejercicio 4.6 Utilizando una muestra de 30 empresas se han estimado los siguientes
modelos correspondientes a las funciones del coste medio (cm):
172.46 35.72 cant
cm i i
(11.97) (3.70)
(1)
R 2 0.838 SCR 8090
310.07 85.39 cant 26.73 cant 2 1.40 cant 3
cmi i i i
(29.44) (33.81) (11.61) (1.22)
2 (2)
R 0.978 SCR 1097
donde cm es el coste medio y cant es la cantidad producida.
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Contraste si los trminos cuadrtico y cbico de la cantidad producida
son significativos en la determinacin el coste medio.
b) Contraste la significacin global del modelo 2.
Ejercicio 4.7 Utilizando una muestra de 35 observaciones, se han estimado los
siguientes modelos para explicar el gasto en caf
ln( coffee) = 21.32 + 0.11ln(inc) - 1.33 ln(cprice) + 1.35ln(tprice)
(0.01) (0.23)
(1)
R2 = 0.905 SCR = 254
ln( coffee) = 19.9 + 0.14 ln(inc) - 1.42 ln(cprice)
(0.02) (0.21)
(2)
SCR = 529
donde inc es la renta disponible, cprice es el precio del caf y tprice es el precio del t.
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Contraste la significatividad global del modelo (1)
b) El error estndar de ln(tprice) no aparece en el modelo (1), lo puede
calcular?
c) Contraste si el precio del t es estadsticamente significativo.
d) Cmo se contrastara la hiptesis de que la elasticidad del precio del
caf es igual pero con signo opuesto al de la elasticidad del precio del t?
Detalle el procedimiento.
Ejercicio 4.8 Ha sido formulado el siguiente modelo para analizar los determinantes de
la calidad del aire (airqual) en 30 reas SMSA (Standard Metropolitan Statistical Areas)
de California:
airqual 1 2 popln 3medincm 4 poverty 5 fueoil 6valadd u
donde airqual es el peso en g/m3 de partculas en suspensin, popln es la poblacin en
miles, medincm es la renta media per cpita en dlares, poverty es el porcentaje de
familias con una renta inferior al nivel de pobreza, fueloil son miles de barriles de
40
petrleo consumido en industrias manufactureras, y valadd es el valor aadido de las
industrias manufactureras en el ao 1972 en miles de dlares.
Utilizando los datos del fichero airqualy, se ha estimado el modelo anterior:
97.35 0.0956 popln 0.0170 medincm 0.0254 poverty
airquali i i i
(10.19) (0.0311) (0.0055) (0.0089)
R2=0.415 n=30
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Interprete los coeficientes de medincm, poverty y valadd
b) Son los coeficientes de pendiente significativos al 10% de forma
individual?
c) Contraste de significacin conjunta de fueloil y valadd, sabiendo que
97.67 0.0566 popln 0.0102 medincm 0.0174 poverty
airquali i i i
(10.41) (0.020) (0.0039) (0.0078)
R 0.339 n 30
2
R 0.218 n 30 2
41
Ejercicio 4.10 En una investigacin se ha formulado el siguiente modelo:
y 1 2 x2 3 x3 u
Con una muestra de 43 observaciones se han obtenido los siguientes resultados:
yi -0.06 1.44 x2i 0.48 x3i
0.1011 0.0007 0.0005
( XX) 1
0.0231 0.0162 yi2 444 yi2 424.92
0.0122
a) Contraste que el trmino independiente es menor que 0.
b) Contraste que 2=2.
c) Contraste de la hiptesis nula 2+33=0.
Ejercicio 4.11 Dada la funcin de produccin
q ak l exp(u )
se ha procedido a su estimacin con datos de la economa espaola de los ltimos 20
aos, obtenindose los siguientes resultados:
ln( q ) = 0.15 + 0.73ln(k ) + 0.47 ln(l )
i i i
4129 95 266
XX 95 5
1
3 SCR 0.017
266 5 19
a) Contraste la significatividad individual de los coeficientes de k y l.
b) Contraste si el parmetro es significativamente distinto de 1.
c) Contraste si existen rendimientos crecientes a escala.
Ejercicio 4.12 Sea el siguiente modelo de regresin mltiple:
y 0 1 x1 2 x2 u
Con una muestra de 33 observaciones se ha estimado este modelo por MCO,
obtenindose los siguientes resultados:
yi 12.7 14.2x1i 2.1x2i
4.1 0.95 0.266
XX
2 1
0.95 3.8 0.5
0.266 0.5 1.9
a) Contraste la hiptesis nula 0=1.
b) Contraste si 1 2 7
c) Son significativos individualmente loscoeficientes 0, 1, y 2?
42
Ejercicio 4.13 Con una muestra de 30 empresas se han estimado las siguientes
funciones de coste:
= 172.46+ 35.72 x
a) cost R 2 = 0.838 R 2 = 0.829 SCR = 8090
i i
(11.97) (3.70)
= 310.07- 85.39 x + 26.73 x 2 - 1.40 x3 R 2 = 0.978 R 2 = 0.974 SCR = 1097
b) costi i i i
(29.44) (33.81) (11.61) (1.22)
donde cost es el coste medio y x es la cantidad producida.
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Cul de los dos modelos elegira? En base a qu criterio?
b) Contraste si los trminos cuadrtico y cbico de la cantidad producida
influyen significativamente en la determinacin del coste medio.
c) Contraste la significatividad del modelo b).
Ejercicio 4.14 Un investigador formula el siguiente modelo:
y 1 2 x2 3 x3 +u
Utilizando una muestra de 13 observaciones obtiene los siguientes resultados:
yi 1.00 1.82 x2i 0.36 x3i
(1)
R 2 0.50 n 13
0.25 0.01 0.04
var( ) 0.01 0.16 0.15
0.04 0.15 0.81
Utilizando la informacin disponible:
a) Contraste la hiptesis nula de que 2 0 frente a la hiptesis alternativa
de que 2 0 .
b) Contraste la hiptesis nula de que 2 3 1 frente a la hiptesis
alternativa de que 2 3 1 , con un nivel de significacin del 5%.
c) El modelo en su conjunto es significativo?
d) Suponiendo que las variables en (1) estn medidas en logaritmos
naturales, cul es la interpretacin del coeficiente correspondiente a x3?
Ejercicio 4.15 Con una muestra de 50 empresas del sector del automvil se han
estimado las siguientes funciones de produccin, utilizando como variable endgena el
valor aadido bruto de la produccin de automviles (vab) y como variables
explicativas el factor trabajo (labor) y el factor capital (capital).
ln(vabi ) = 3.87 + 0.80ln(labori ) + 1.24 ln(capitali )
1) (0.11) (0.24) ,
2 2
SCR = 254 R = 0.75 R = 0.72
ln( vabi ) = 19.9 + 1.04 ln(capitali )
2)
SCR = 529 R 2 = 0.84, R 2 = 0.81
3) ln(vab labori ) = 15.2 + 0.87 ln(capitali labori )
SCR = 380
(Entre parntesis aparecen los errores estndar de los estimadores).
43
a) Contraste la significatividad conjunta de los dos factores de la funcin de
produccin.
b) Contraste si el factor trabajo tiene una influencia significativamente
positiva sobre el valor aadido de la produccin de automviles.
c) Contraste la hiptesis de rendimientos constantes a escala. Razone la
respuesta.
Ejercicio 4.16 Con una muestra de 35 observaciones anuales se han estimado dos
funciones de demanda de vino de Rioja, utilizando como variable endgena el gasto en
vino de reserva (vino) y como variables explicativas la renta disponible (renta), el
precio medio de una botella de vino de Rioja de reserva (pvinrioj) y el precio medio de
una botella de vino de Ribera de Duero de reserva (pvinduer). Los resultados son los
siguientes:
ln( vino ) = 21.32 + 0.11 ln(renta ) - 1.33 ln( pvinrioj ) + 1.35 ln( pvinduer )
i i i i
(0.01) (0.23) (0.233)
SCR=0.4277
ln(teceili pteceil ) = 0.74 + 0.26 ln(rentai ) + 0.20 ln( pcofbrasi )
(0.16) (0.15)
SCR=0.6788
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Contraste la significatividad de la renta disponible.
b) Contraste la hiptesis de que 3 1 y 4 0 , explicando el
procedimiento aplicado.
44
c) Si en lugar de disponer de informacin sobre la SCR, solo conociera el R2
de cada modelo, cmo procedera para realizar el contraste de la parte
b)?
Ejercicio 4.18 Con una muestra de 64 pases se han obtenido las siguientes
estimaciones para explicar las defunciones de menores de 5 aos por 1000 habitantes
nacidos vivos (defmen5)
1) defmen 5i = 263.64 - 0.0056 renpci + 2.23 tanalmuji ; R 2 = 0.7077
(0.0019) (0.21)
2) defmen5i = 168.31 - 0.0055 renpci + 1.76 tanalmuji +12.87tfeci , R 2 = 0.7474
(0.0018) (0.25)
donde renpc es la renta per cpita, tanalmuj es la tasa de analfabetismo de las mujeres y
tfec es la tasa de fecundidad (tfi).
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Contraste la significatividad conjunta de renta, tasa de analfabetismo y
tasa de fecundidad.
b) Contraste la significatividad de la tasa de fecundidad.
c) Cul de los dos modelos elegira? Razone la respuesta.
Ejercicio 4.19 Se ha estimado la siguiente funcin de ventas de automviles de una
determinada marca utilizando una muestra de 32 observaciones anuales:
vi 104.8 6.64 pi 2.98 gi
( 6.48) (3.19) (0.16)
45
Ejercicio 4.21 Con quince observaciones se ha obtenido la siguiente estimacin:
yi 8.04 2.46 xi 2 0.23 xi 3
(1.00) (0.60)
R 0.30
2
donde los valores entre parntesis son los errores estndar de los estimadores y el
coeficiente de determinacin es el corregido.
a) Es significativo el coeficiente de la variable x3?
b) Se rechaza la hiptesis de que un aumento en x2 de dos unidades
ocasiona una disminucin en y de ocho unidades?
c) Analice la significatividad conjunta del modelo.
Ejercicio 4.22 Considrese la siguiente especificacin economtrica:
y 1 2 x2 3 x3 4 x4 u
Con una muestra de 26 observaciones se han obtenido las dos siguientes
estimaciones:
1) yi 2 3.5 x1i 0.7 x2i 2 x3i ui R2=0.982
(1.9) (2.2) (1.5)
F
SCRR SCRNR / r
F
2
RNR RR / q
2
SCRNR / (n k ) (1 RNR2
) / (n k )
b) Contraste la hiptesis nula 2= 3.
Ejercicio 4.23 En la estimacin del modelo de Brown, realizada en el ejercicio 3.19
utilizando el fichero consumsp, se obtuvo el siguiente resultado:
7.156 0.3965 incpc 0.5771conspc
conspc t t t 1
(84.88) (0.0857) (0.0903)
46
Ejercicio 4.24 El siguiente modelo fue formulado para analizar los determinantes del
salario medio en dlares que se obtiene al graduarse en la clase del 2010 en las mejores
escuelas de negocios de EE.UU. (salMBAgr):
salMBAgr 1 2tuition 3salMBApr u
donde tuition son los derechos de matrcula, incluyendo adems todos los dems
honorarios para el programa completo, pero con exclusin de los gastos de
manutencin, y salMBApr es el salario medio anual en dlares obtenido previamente
por la clase de 2010.
Utilizando los datos del fichero MBAtui10, se ha estimado el modelo anterior:
42489 0.1881tuition 0.5992 salMBApr
salMBAgr i i i
(5415) (0.0628) (0.1015)
R2=0.703 n=39
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Cules de los regresores incluidos en el modelo anterior son
individualmente significativos al 1% y el 5%?
b) Contraste la significacin global del modelo.
c) Cul es el valor predicho de salMBAgr para un estudiante de posgrado
que pag 100000 dlares de derechos de matrcula en un mster MBA de
dos aos y que anteriormente tuvo un salario de 70000 dlares anuales?
Cuntos aos de trabajo necesita el estudiante para compensar los gastos
de matrcula? Para responder a esta pregunta suponga que la tasa de
descuento es igual a la tasa esperada de aumento salarial y que el
estudiante no recibi ningn ingreso salarial durante los 2 cursos de
duracin del mster.
d) Si aadimos el regresor rank2010 (el rango de cada escuela de negocios
en 2010), se obtienen los siguientes resultados:
61320 0.1229 tuition 0.4662 salMBApr
salMBAgr i i i
(8520) (0.0626) (0.1055)
R2=0.755 n=39
Cul de los regresores incluidos en este modelo son individualmente
significativos al 5%?
Cul es la interpretacin del coeficiente de rank2010?
e) La variable rank2010 se ha construido a partir de tres componentes:
gradpoll es una clasificacin basada en encuestas a los graduados en
MBA y contribuye con un 45 por ciento a la clasificacin final; corppoll
es una clasificacin basada en encuestas realizadas a reclutadores de los
MBA y contribuye con el 45 por ciento a la clasificacin final; e intellec
es una clasificacin basada en la revisin de la investigacin universitaria
publicada durante en un periodo de cinco aos en las 20 principales
revistas acadmicas, y en los libros universitarios revisados por The New
York Times, The Wall Street Journal y Bloomberg Businessweek en el
mismo perodo; esta ltima clasificacin aporta el 10 por ciento a
clasificacin final. En el siguiente modelo estimado rank2010 ha sido
sustituido por sus tres componentes:
47
79904 0.0305 tuition 0.3751 salMBApr
salMBAgri i i
(10700) (0.0696) (0.107)
R2=0.797 n=39
Cul es el peso en porcentaje de cada uno de estas tres componentes en
la determinacin de salMBAgr? Compare los resultados con la
contribucin de cada una en la definicin de rank2010.
f) Son gradpoll, corppoll e intellec conjuntamente significativos al 5%?
Son individualmente significativos al 5%?
Ejercicio 4.25 (Continuacin del ejercicio 3.12). El modelo poblacional que
corresponde a este ejercicio es el siguiente:
ln(wage) 1 2educ 3tenure 4age u
Utilizando el fichero wage06s, se ha estimado el modelo anterior:
ln( wage) 1.565 0.0448 educ 0.0177 tenure 0.0065 age
i i i i
(0.073) (0.0035) (0.0019) (0.0016)
R2=0.337 n=800
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Contraste la significatividad global del modelo.
b) Es tenure estadsticamente significativa al 10%? Es age positivamente
significativa al 10%?
c) Es admisible que el coeficiente de educ sea igual al de tenure? Es
admisible que el coeficiente de educ sea el triple del de tenure? Para
responder a estas preguntas dispone de la siguiente informacin
adicional:
ln( wage)i 1.565 0.0271educi 0.0177(educ tenure)i 0.0065 agei
(0.073) (0.0042) (0.0019) (0.0016)
ln( wage)i 1.565 0.0082 educi 0.0177(3 educ tenure)i 0.0065 agei
(0.073) (0.0071) (0.0019) (0.0016)
2
Se puede calcular el R en las dos ecuaciones del apartado c)? Por favor,
si la respuesta es positiva, hgalo.
Ejercicio 4.26 (Continuacin del ejercicio 3.13). Tomemos el modelo poblacional de
este ejercicio como modelo de referencia. En el modelo estimado, con el fichero
housecan, los errores estndar de los coeficientes aparecen entre parntesis:
price 2418 5827 bedrooms 19750 bathrms 5.411lotsize
i i i i
(3379) (1207) (1785) (0.388)
R2=0.486 n=546
a) Contraste la significatividad global del modelo.
b) Contraste la hiptesis nula de que un bao adicional tiene la misma
influencia sobre el precio de la vivienda que 4 dormitorios adicionales.
Por otra parte, contraste si un cuarto de bao adicional tiene ms
influencia sobre el precio de la vivienda que 4 dormitorios adicionales.
(Informacin adicional: var( 2 ) =1455813, var(3 ) =3186523 y
var( , ) =-764846).
2 3
c) Si aadimos al modelo el regresor stories (nmero de plantas, excluido el
stano), se obtienen los siguientes resultados:
48
pricei 4010 2825 bedroomsi 17105 bathrmsi
(3603) (1215) (1734)
R2=0.536 n=546
Cul es su opinin acerca del signo y magnitud del coeficiente de
stories? Es un resultado sorprendente? Cul es la interpretacin de este
coeficiente? Estime si el nmero de stories tiene una influencia
significativa sobre el precio de la vivienda.
d) Repita los contrastes del apartado b) con el modelo estimado en el
apartado c). (Informacin adicional: var( 2 ) =1475758, var(3 )
=3008262 y var( , ) =-554381).
2 3
R2=0.232 n=447
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Tiene roa un efecto significativo sobre el salario? Tiene roa un efecto
positivamente significativo sobre el salario? Realice ambos contrastes
para el 10% y el 5% de nivel de significacin.
b) En el caso de que roa se incrementara en 20 puntos, en qu porcentaje
se incrementara el salario?
c) Contraste la hiptesis nula de que la elasticidad salario/ventas es igual a
0.4.
d) Si a este modelo aadimos el regresor age, se obtienen los siguientes
resultados:
ln( salary )i 4.159 0.0055 roai 0.2903ln( salesi ) 0.0000539 profits
(0.442) (0.0033) (0.0423) (0.0000220)
R2=0.048 n=1983
49
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Es la variable de ventas (sales) individualmente significativa al 1%?
b) Contraste la hiptesis nula de que el coeficiente de las ventas es igual a
0.2?
c) Contraste la significatividad global del modelo de referencia.
d) Si aadimos el regresor ln(workers), - donde workers es el nmero de
trabajadores-, se obtienen los siguientes resultados:
0.480 0.08585ln(sales) 0.01049 exponsal 0.3422ln(workers)
rdintens
(0.750) (0.0687) (0.0021) (0.09198)
R2=0.055 n=1983
Es la variable ventas individualmente significativa al 1% en el nuevo
modelo estimado?
e) Contraste la hiptesis nula de que el coeficiente de ln(workers) es mayor
que 0.5
Ejercicio 4.29 (Continuacin del ejercicio 3.16). Tomemos el modelo poblacional de
este ejercicio como modelo de referencia. Utilizando el fichero hedcarsp, el modelo
estimado fue el siguiente:
ln( price) 14.42 0.000581cid 0.003823 hpweight 0.07854 fueleff
i i i i
(0.154) (0.0000438) (0.0079) (0.0122)
R2=0.830 n=214
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Cul de las variables explicativas incluidas en el modelo de referencia
son individualmente significativas al 1%?
b) Aada la variable volume (volumen) al modelo de referencia. Tiene
volume un efecto estadsticamente significativo sobre ln(price)? Tiene el
volumen tiene un efecto positivo estadsticamente significativo sobre el
ln(price)?
c) Es admisible que el coeficiente estimado de volume en el apartado b)
sea igual pero con signo opuesto que el coeficiente de fueloff?
d) Aada las variables length, width y height (longitud, anchura y altura) al
modelo estimado en el apartado b). Teniendo en cuenta que
volume=lengthwidthheight, hay multicolinealidad perfecta en el
nuevo modelo? Por qu? Por qu no? Estime el nuevo modelo si es
posible.
e) Aada la variable ln(volume) al modelo de referencia. Contraste la
hiptesis nula de que la elasticidad de precio/volumen es igual a 1?
f) Qu sucedera si aade al modelo estimado en el apartado e) los
regresores ln(length), ln(width) y ln(height)?
Ejercicio 4.30 (Continuacin del ejercicio 3.17). Tomemos el modelo poblacional de
este ejercicio como modelo de referencia. Utilizando el fichero timuse03, el
correspondiente modelo ajustado fue el siguiente:
141.9 3.850 educ 0.00917 hhinc 1.767 age 0.2289 paidwork
houswork i i i i i
(23.27) (1.621) (0.00539) (0.311) (0.0229)
R2=0.1440 n=1000
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Cul de las variables explicativas incluidas en el modelo de referencia
son individualmente significativas al 5% y al 1%?
50
b) Estime un modelo en el que se pueda contrastar directamente si un ao
ms de educacin tiene el mismo efecto sobre el tiempo dedicado al
trabajo domstico que 2 aos de edad adicionales. Cul es su
conclusin?
c) Contraste la significacin conjunta de educ y hhnc.
d) Estime una regresin en la que se aade la variable childup3 (nmero de
nios de hasta 3 aos) al modelo de referencia. En el nuevo modelo,
cuales de los regresores son individualmente significativos al 5% y al
1%?
e) En el modelo formulado en el apartado d), cul es la variable ms
influyente? Por qu?
Ejercicio 4.31 (Continuacin del ejercicio 3.18). Tomemos el modelo poblacional de
este ejercicio como modelo de referencia. Utilizando el fichero hdr2010, el
correspondiente modelo ajustado fue el siguiente:
0.375 0.0000207 gnipc 0.0858 lifexpec
stsfglo i i i
(0.584) (0.00000617) (0.009)
R2=0.642 n=144
(Los nmeros entre parntesis son los errores estndar de los estimadores.)
a) Cul de las variables explicativas incluidas en el modelo de referencia
son individualmente significativas al 1%?
b) Estime un modelo en el que se han aadido las variables popnosan
(porcentaje de poblacin sin acceso a servicios de saneamiento mejorado)
y gnirank (rango de la renta nacional bruta) al modelo de referencia.
Cul de los regresores incluidos en el nuevo modelo son
individualmente significativos al 1%? Interprete los coeficientes de
popnosan y gnirank.
c) Son popnosan y gnirank conjuntamente significativos?
d) Contraste la significatividad global del modelo formulado en el apartado
b).
Ejercicio 4.32 Con una muestra de 42 observaciones se ha estimado el siguiente modelo
yt 670.591 1.008xt
Para la observacin 43 se sabe que el valor de x es 1571.9.
a) Calcule el predictor puntual para la observacin 43.
b) Sabiendo que la varianza de del error de prediccin e243 y 43 y 43 es
igual a (24.9048)2, calcule un intervalo de probabilidad del 90% del valor
individual.
Ejercicio 4.33 Sobre la funcin de consumo Brown, adems de la estimacin
presentada en el ejercicio 4.23, se dispone de la siguiente estimacin:
12729 0.3965(incpc 13500) 0.5771(conspc 12793.6)
conspct t t 1
(64.35) (0.0857) (0.0903)
51
c) Obtenga un intervalo de prediccin del 95% para el valor individual del
consumo per cpita en 2011.
Ejercicio 4.34 (Continuacin del ejercicio 4.30) Conteste a las siguientes preguntas:
a) Utilizando la primera estimacin del ejercicio 4.30, obtener una
prediccin para houswork (minutos dedicados a las tareas domsticas por
da), cuando en la ecuacin se hace educ=10 (aos), hhinc =1200 (euros
al mes), age=50 (aos) y paidwork=400 (minutos por da).
b) Realice una regresin, utilizando el fichero timuse03, que le permita
calcular un IC del 95% con las caractersticas tenidas en cuenta en el
apartado a).
c) Obtenga un intervalo de prediccin del 95% para el valor individual de
houswork con las caractersticas tenidas en cuenta en el apartado a).
Ejercicio 4.35 (Continuacin del ejercicio 4.29) Conteste a las siguientes preguntas:
a) En la primera ecuacin del ejercicio 4.29 considere que cid=2000
(pulgadas cbicas de desplazamiento), hpweight=10 (relacin
potencia/peso en kg, expresados en porcentaje) y fueleff=6 (minutos por
da) Obtenga el predictor puntual del consumo per cpita en 2011,
sabiendo que incpc2011=12793.6 y conspc2010=13500.
b) Obtenga una estimacin consistente de price para las caractersticas
utilizadas en el apartado a).
c) Realice una regresin que le permita calcular un IC del 95% para las
caractersticas utilizadas en el apartado a).
d) Obtenga un intervalo de prediccin del 95% para el valor individual del
precio.
52