Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Alfonso Novales
April 29, 2003
Contents
1 Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2 Algunos conceptos estadsticos bsicos . . . . . . . . . . . . . . . . . . 5
2.1 Medidas de posicin y medidas de dispersin . . . . . . . . . . . . 5
2.1.1 La media muestral como predictor . . . . . . . . . . . . . . 5
2.1.2 La desviacin tpica como indicador de volatilidad . . . . . 7
2.2 Medidas de asociacin . . . . . . . . . . . . . . . . . . . . . . . . 9
3 Contrastacin de hiptesis estadsticas . . . . . . . . . . . . . . . . . . 9
3.1 Contrastes de Normalidad . . . . . . . . . . . . . . . . . . . . . . 14
3.2 Contrates de asociacin . . . . . . . . . . . . . . . . . . . . . . . . 14
4 Tratamiento de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
4.1 Ajuste estacional . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
4.2 Tasas de variacin . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
4.3 Estimacin de componentes . . . . . . . . . . . . . . . . . . . . . 15
5 El modelo lineal simple de regresin . . . . . . . . . . . . . . . . . . . . 15
5.1 Descripcin del modelo . . . . . . . . . . . . . . . . . . . . . . . . 15
5.1.1 Nube de puntos . . . . . . . . . . . . . . . . . . . . . . . . 15
5.2 Estimacin por mnimos cuadrados (ordinarios) . . . . . . . . . . 15
5.2.1 Representacin grfica de la recta de regresin estimada . 15
5.3 Propiedades del estimador de mnimos cuadrados ordinarios . . . 15
5.4 Residuos del modelo. Grficos de residuos . . . . . . . . . . . . . 16
5.4.1 Estimacin de la varianza del trmino de perturbacin . . 17
5.5 Cuando los coeficientes del modelo de regresin cambian a lo largo
de la muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
5.5.1 Cambio estructural en los coeficientes del modelo de regresin 18
5.5.2 Variacin gradual en los coeficientes del modelo . . . . . . 21
5.6 Algunos modelos de regresin sencillos . . . . . . . . . . . . . . . 21
5.6.1 El modelo constante . . . . . . . . . . . . . . . . . . . . . 21
5.6.2 El modelo con variables en desviaciones respecto a la media 23
5.6.3 El modelo con tendencia determinista lineal y cuadrtica . 24
5.6.4 Modelos no lineales en las variables . . . . . . . . . . . . . 25
5.7 Cmo especificar un modelo de regresin? . . . . . . . . . . . . . 26
5.7.1 Debe incluirse una constante en el modelo de regresin? . 26
5.7.2 Debemos estimar en valores originales o en logaritmos de
las variables? . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.7.3 Debe estimarse el modelo con variables en niveles o en
diferencias? . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5.7.4 La frecuencia de observacin de las variables . . . . . . . . 27
6 Contrastes de hiptesis en el modelo de regresin lineal simple . . . . . 30
6.1 Significacin estadstica versus precisin . . . . . . . . . . . . . . 30
6.1.1 Se hace una variable ms o menos significativa? . . . . . . 32
6.1.2 Cmo puede discutirse qu variable es ms relevante en
una regresin? . . . . . . . . . . . . . . . . . . . . . . . . . 32
7 Correlacin versus causalidad . . . . . . . . . . . . . . . . . . . . . . . 32
8 Variables no estacionarias . . . . . . . . . . . . . . . . . . . . . . . . . 32
8.1 Caractersticas de una variable estacionaria . . . . . . . . . . . . . 32
8.2 Tendencias deterministas y tendencias estocsticas . . . . . . . . . 33
8.3 Regresin esprea . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
8.3.1 Regresin esprea bajo tendencias deterministas . . . . . . 38
8.3.2 Regresin esprea bajo tendencias estocsticas . . . . . . . 39
8.4 Tratamiento de tendencias deterministas . . . . . . . . . . . . . . 42
8.5 Ejercicios de simulacin . . . . . . . . . . . . . . . . . . . . . . . 44
8.6 Tendencias estocsticas y races unitarias . . . . . . . . . . . . . . 44
8.7 Contrastes de raz unitaria . . . . . . . . . . . . . . . . . . . . . . 45
8.8 Cointegracin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
8.8.1 Contraste de cointegracin . . . . . . . . . . . . . . . . . . 45
8.8.2 Contraste de hiptesis sobre la relacin de cointegracin es-
timada por mnimos cuadrados . . . . . . . . . . . . . . . 47
8.8.3 Correlacin y cointegracin . . . . . . . . . . . . . . . . . 47
8.8.4 Variables cointegradas: un ejemplo . . . . . . . . . . . . . 48
8.8.5 El modelo de correccin de error . . . . . . . . . . . . . . . 49
8.8.6 El contraste de cointegracin de Johansen . . . . . . . . . 51
2
8.8.7 Aspectos comunes a varias variables temporales: tendencias
comunes, volatilidad comn. . . . . . . . . . . . . . . . . . 51
8.8.8 Qu hacer en presencia de variables con tendencias estocs-
ticas (races unitarias)? . . . . . . . . . . . . . . . . . . . . 51
9 Matrices de covarianzas no escalares . . . . . . . . . . . . . . . . . . . . 54
9.1 Deteccin de la autocorrelacin . . . . . . . . . . . . . . . . . . . 54
9.2 Tratamiento de la autocorrelacin. . . . . . . . . . . . . . . . . . 54
9.3 El estimador de mnimos cuadrados generalizados . . . . . . . . . 54
9.4 Deteccin de la heteroscedasticidad . . . . . . . . . . . . . . . . . 54
9.5 Contraste de igualdad de varianza entre submuestras . . . . . . . 54
9.6 Tratamiento de la heteroscedasticidad . . . . . . . . . . . . . . . . 54
10 El modelo de regresin lineal mltiple . . . . . . . . . . . . . . . . . . . 54
10.1 Estimacin por mnimos cuadrados . . . . . . . . . . . . . . . . . 59
11 Propiedades del estimador de mnimos cuadrados. . . . . . . . . . . . . 60
12 Bondad de ajuste del modelo . . . . . . . . . . . . . . . . . . . . . . . . 68
13 Contrastes de hiptesis . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
14 Matrices de covarianzas no escalares . . . . . . . . . . . . . . . . . . . . 74
14.1 Comparacin de estimadores de la regresin mltiple y la regresin
simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
14.2 Regresin particionada . . . . . . . . . . . . . . . . . . . . . . . . 77
15 Grado de ajuste del modelo de regresin mltiple . . . . . . . . . . . . 77
15.1 Coeficientes de correlacin parcial y de determinacin parcial . . . 78
16 Colinealidad entre variables explicativas en un modelo de regresin . . . 80
16.1 Efectos de la colinealidad entre variables explicativas . . . . . . . 81
16.2 Deteccin de la colinealidad . . . . . . . . . . . . . . . . . . . . . 84
16.3 Tratamiento de la colinealidad . . . . . . . . . . . . . . . . . . . . 85
16.3.1 Regresin ortogonalizada . . . . . . . . . . . . . . . . . . . 85
16.3.2 Otros tratamientos . . . . . . . . . . . . . . . . . . . . . . 87
17 Prediccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
18 Modelos univariantes de series temporales . . . . . . . . . . . . . . . . 88
18.1 Primeros conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . 88
18.1.1 Procesos estocsticos . . . . . . . . . . . . . . . . . . . . . 88
18.1.2 Funciones de autocorrelacin simple y parcial . . . . . . . 88
18.2 Procesos autoregresivos, AR(p) . . . . . . . . . . . . . . . . . . . 88
18.2.1 El modelo AR(1) . . . . . . . . . . . . . . . . . . . . . . . 88
18.2.2 El modelo AR(2) . . . . . . . . . . . . . . . . . . . . . . . 88
18.3 Procesos de medias mviles, MA(q) . . . . . . . . . . . . . . . . . 88
3
18.4 Procesos mixtos, ARMA(p,q) . . . . . . . . . . . . . . . . . . . . 88
18.5 Procesos integrados ARIMA(p,d,q) . . . . . . . . . . . . . . . . . 88
18.6 Prediccin con modelos univariantes . . . . . . . . . . . . . . . . . 88
18.6.1 Prediccin con modelos AR(p) . . . . . . . . . . . . . . . . 88
18.6.2 Prediccin con modelos MA(q) . . . . . . . . . . . . . . . 88
18.6.3 Prediccin con modelos ARMA(p,q) . . . . . . . . . . . . 88
18.6.4 Prediccin con modelos ARIMA(p,d,q) . . . . . . . . . . . 88
18.7 Estimacin de modelos univariantes de series temporales . . . . . 88
18.7.1 Estimacin de modelos autoregresivos . . . . . . . . . . . . 88
18.7.2 Estimacin de modelos de medias mviles . . . . . . . . . 88
18.7.3 Estimacin de modelos ARMA(p,q) y ARIMA(p,d,q) . . . 88
19 El procedimiento de variables instrumentales . . . . . . . . . . . . . . . 88
19.1 Correlacin entre variables explicativas y trmino de error . . . . 88
19.2 Errores de medida . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
20 Modelos dinmicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
20.1 Colinealidad entre variables explicativas . . . . . . . . . . . . . . 88
20.2 Estimacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
20.2.1 Perturbacin sin autocorrelacin . . . . . . . . . . . . . . . 88
20.2.2 Perturbacin con autocorrelacin . . . . . . . . . . . . . . 88
21 Simultaneidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
21.1 Identificacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
21.2 Estimacin de una ecuacin del sistema . . . . . . . . . . . . . . . 88
4
1. Introduccin
Ha sido tradicional dejar muchas decisiones a los mtodos estadsticos.
La discusin importante es si el investigador debe plantear su investigacin
incorporando sus creencias a priori o, por el contrario, la investigacin ha de ser
asptica en ese sentido, no debiendo estar condicionada en ningn aspecto por las
creencias iniciales del investigador.
5
variable Xt en un instante futuro t0 , xt0 a partir de observaciones temporales
x1 , x2 , ..., xT , T < t0 . Por supuesto que una prediccin no se ver exactamente
corroborada por los datos futuros: el dato que se reciba en el instante t0 , xt0 ,
podr exceder de la previsin xt0 que efectuamos en el instante T , o ser inferior a
la misma. Lo que el investigador quiere es que su mtodo de prediccin garantice
que el error que espera cometer sea el menor posible. no tendra sentido utilizar
un mtodo de prediccin que incumpla esta propiedad, pues equivaldra a creer
que existe algn mtodo de prediccin alternativo con una expectativa de error
inferior. Ahora bien, como el error de prediccin (definido como la diferencia entre
valor realizado y valor anticipado, xt0 xt0 ) que se materialice en t0 puede ser
positivo o negativo, es razonable buscar un mtodo de prediccin que minimice la
expresin,
M in E (xt0 xt0 )2 (2.1)
x
t0
xt0 = x
Por tanto, si hemos de predecir un valor futuro de una variable aleatoria, sin
disponer de datos de la misma, su esperanza matemtica, si es conocida, minimiza
el Error Cuadrtico Medio entre todas las predicciones posibles. Si conocemos
nicamente la media muestral, pero no disponemos de los datos individuales, dicha
media muestral tiene una propiedad anloga a la que acabamos de enunciar.
Tan importante es esta propiedad que la media muestral debe utilizarse como
referencia con respecto a la cual tratar de obtener una prediccin mejor. Cuando
decimos que una variable es impredecible, no nos referimos a que su prediccin
es cero, o que no puede obtenerse, sino a que propondremos como prediccin su
media muestral, sin hacer ningn clculo adicional. Lo importante es observar que,
si se conoce la esperanza matemtica de la variable, o se dispone de una media
muestral, stas son predicciones sencillas de obtener, y aceptables, al menos en
ausencia de informacin adicional.
Como matiz puede aadirse que, si el criterio a minimizar cuando se calcula
una prediccin no es el ECM como en (2.1) , sino el Arror Absoluto Medio de la
prediccin,
6
M in E | xt0 xt0 | (2.2)
x
t0
7
En una primera lectura, podra pensarse que es evidente que la pretensin es
la de cuantificar las fluctuaciones que experimenta una variable aleatoria respecto
a su nivel medio. Esta es la idea que subyace al uso de la desviacin tpica como
medida de volatilidad; sin embargo, es fcil ver que existen situaciones en que
dicha utilizacin no est totalmente justificada:
Cambio estructural en media: supongamos una variable X que es constante
a lo largo de cada una de las dos submuestras enque podemos dividir el
perodo muestral. Es decir, X=1 en la primera parte de la muestra, y
X=2 en la segunda parte de la muestra. En muchos sentidos, podramos
decir que esta variable es constante, y ha experimenatdo una volatilidad
nula a lo largo del intervalo muestral, si bien es verdad que en el instante t0
se produjo un cambio estructural, de carcter permanente, en el nivel medio
de la variable. Si no se tiene en cuenta dicho cambio en la media, la varianza
de X resulta ser no nula, mientras que si tenemos en cuenta el cambio en
media, la varianza que calculemos ser cero.
Presencia de una tendencia determinista: supongamos una variable X que
crece a una tasa media de , a la vez que experimenta fluctuaciones alrede-
dor de dicha tasa media de crecimiento. En este caso, la varianza muestral
de la variables, as como su desviacin tpica, sern importantes, y tanto
ms elevadas cuanto mayor sea la tendencia o tasa de crecimiento . Esta
situacin es muy frecuente en Economa en general y en Finanzas en par-
ticular, y se utiliza la desviacin tpica como indicador de volatilidad. Hay
dos dificultades que suelen ignorarse: una, que, en presencia de endencia,
carecemos de valor central de referencia. En presencia de una tendencia o
crecimiento constante , el valor medio tender a ser el valor que tom la
variable hacia el perodo central de la muestra, pero no es representativo de
los valores muestrales de la variable: la primera parte de la muestra tender
a estar por debajo de la media, estando la segunda parte de la muestra por
encima de la media muestral; en tal situacin la media muestral no es un
valor representativo de la variable y, en consecuencia, no tiene mucho sentido
calcular el tamao de las fluctuaciones alrededor de dicha media. En este
contexto, el tamao medio de las fluctuaciones alrededor de la media ser,
en realidad, un indicativo de la magnitud de , la tasa media de crecimiento
o tendencia determinista.
Este es un caso donde debemos distinguir entre corto y largo plazo: a largo
plazo, el uso de la desviacin tpica podra estar justificado, si entendemos que la
8
tendencia media de crecimiento ser eventualmente sustituida por un descenso
en la variable, y la sucesin de un ciclo u oscilacin de perodo amplio, que termi-
nara justificando el clculo de un valor central de referencia. La volatilidad a corto
plazo ser el tamao medio de las fluctuaciones alrededor de la tendencia deter-
minista. Por tanto, tendra plena justificacin extraer de la variable el crecimiento
tendencial, que haba que estimar previamente, y calcular el tamao medio de las
fluctuaciones que experimente el componente que resulta tras la extraccin de la
tendencia determinista.
Una vez ms, no se trata de discutir cul es el modo correcto de proceder; ms
bien, hay que entender que estamos hablando de estimar caractersticas diferentes
y, alguna de ellas puede no estar estadsticamente justificada. De acuerdo con la
discusin anterior, medir la volatilidad mediante la desviacin tpica de una vari-
able con tendencia determinista, tiene poca justificacin. Esto es especialmente
cierto en el anlisis financiero: en un perodo en que el precio de un activo exper-
imente un slido crecimiento, su avrianza muestral resultar relativamente alta,
por lo que podra concluirse que ofrece un riesgo importante; en consecuencia, a
pesar de su sostenida rentabilidad (variacin porcentual en precio), un inversor
podra decidir no incorporarlo en su cartera; este anlisis sera incorrecto.
9
probabilidad poblacional es conocido, por ejemplo, Normal. Este tipo de con-
trastes son contrastes paramtricos, puesto que se basan en la estimacin de al-
gunos parmetros de la distribucin de probabilidad poblacional. El investigador
no debe olvidar nunca que las propiedades de estos contrastes dependen de que
sea correcta la hiptesis que se haya establecido acerca del tipo de distribucin
poblacional de la que se extrajo la muestra disponible, as como del carcter de
dicha muestra (muestra aleatoria simple). Un contraste que tiene muy buenas
propiedades XXXX
Existen contrastes no paramtricos, que no precisan de la estimacin de parmet-
ros poblaiconales, ni descansan en ningn supuesto acerca de la distribucin de
probabilidad poblacional, que son de un enorme inters en el anlisis de datos
econmicos, a pesar de ser poco habituales. Son contrastes cuyas propiedades son
muy robustas (es decir, continan siendo vlidas total o aproximadamente) con in-
dependencia del tipo de distribucin poblacional. Una segunda razn que confiere
enorme inters a los contrates no paramtricos es que nos permiten discernir el
grado en que son vlidas hiptesis que no pueden representarse en trmios de val-
ores numricos para los parmetros de la distribucin de probabilidad poblaiconal.
As, en el primero de los ejemplos mantes mencionados, queremos contrastar la
hiptesis de que la poblacin de la que se extrajo la muestra sigue una distribu-
cin Normal. Por supuesto, que tambin podra contrastarse la hiptesis nula
de que obedecve una distribucin t de Student, o chi-cuadrao, o cualquier otra.
Asimismo, podemos contrastar la hiptesis de que dos muestra proceden de igual
distribucin de probabilidad, sin necesidad de especficar de qu tipo es ninguna
de ellas.
Un tipo de contraste de gran inters para las cuestiones examinadas en el
trabajo especfico economtrico estriba en el grado de asociacin entre variables.
Precisamente la Econometra consiste en el cnojunto de mtodos estadsticos que
permiten asignar valores numricos a los coeficientes de un modelo que trata de
representar la relacin existente entre un conjunto de variables econmicas. Es,
por tanto, un anlisis de tipo paramtrico; una vez asigndaos valores numricos a
los parmetros del modelo, generalmente se llevarn a cabo contrastes paramtri-
cos de hiptesis, utilizando los valores numricos estimados. Existen, asimismo,
contrates no paramtricos que, sin necesidad de pasar por una fase de estimacin,
permiten discutir si la evidencia muestral es consistente con la hiptesis de que dos
variables determinadas estn relacionadas entre s. Es tan fcil llevar a cabo este
tipo de contrastes que deberan formar parte, como paso previo a la estimacin
de todo modelo econmtrico. No sera razonable que las conclusiones de tales
10
contrastes dictaminen la relacin de variables que deben incluirse en un modelo
economtrico, pero es sumamente iliustrativo compementar la informacin pro-
porcionada por ambos tipos de contrastes. En definitivia, como proponamos en
la Introduccin a este texto, precisamente por su naturaleza probabilstica, los
mtodos estadsticos no deben utilizarse de manera dogmtica. En definitiva, se
trata de examinar la cuestin que est siendo objeto de anlisis en un determinado
estudio, a la luz de la informacin muestral disponible, desde diversas pticas, con
el objeto de proporcionar distintos tipos de evidencia. Por supuesto que en la gen-
eralidad de los casos, esas distintas perspectivas no sern todas consistentes entre
s. Debe esperarse del investigador que proporcione toda la informcaion gener-
ada en relacin con la cuestin que defina la investigacin, para que cada lector
pueda extraer sus propias conclusiones. En un contexto probabilstico no existen
las verdades absolutas, y un detemrinado anlisis puede conducir a conclusiones
diferentes.
En un contraste paramtrico se establece, como confrontacin a la hiptesis
nula, una hiptesis alternativa. La forma que adopte dicha hiptesis no es ir-
relevante en cuanto a la resolucin del contraste de hiptesis. Como ejemplo,
tomando como un hecho cierto que la distribucin de probabilidad poblacional
es Normal, y qeu la varianza de dicha distribucin es conocida, un investigador
puede desear contrastar la hiptesis nula H0 : = 10, frente a la hiptesis al-
ternativa H1 : 6= 10. En este caso, la hiptesis nula es simple, por cuanto que
incluye un nico valor posible para la esperanza matemtica poblaiconal, mientras
que la hiptesis alternativa es compuesta, por cuanto que incluye todo un rango
de valores, todos los distintos del incluido en la hiptesis nula. Este contraste
tiene, por tanto, otra caracterstica, y es que el conjunto de valores incluidos en
ambas hiptesis cubre todo el espacio paramtrico. Un contraste diferente, con
la misma hiptesis nula, sera aqul que considerase como hiptesis alternativa,
H10 : < 10. Esta es la hiptesis que debera especificar un investigador que sabe
que, dada la naturaleza del problema con el que trata, existen razones tericas
para creer que el valor numrico de no puede exceder de 10. Cuando se dispone
de dicha informacin, el ltimo contraste descrito, que restringe el rango de valores
numricos en la hiptesis alternativa fijando 10 como cota superior, tiene mejores
propiedades que el primero de los contrastes, que no estableca tal relacin. En
la mayora de las aplicaciones econmicas, se dispone de informacin de este tipo,
por lo que el investigador debe especificar cuidadosamente no slo la hiptesis
nual que contrasta, sino tambin la hiptesis que considera como alternativa,
de modo que su contraste de hiptesis tenga las mejores propiedades posibles.
11
Lamentablememnte, este hecho no suele tenerse en cuenta, establecindose con
demaisad frecuencia hiptesis del tipo H1 : 6= 10. No slo el contraste se re-
suelve de distinta manera, segn sea sta o H10 la hiptesis alternativa; adems,
cmoo hemos mencionado, las propiedades del contraste son distintas, y mejoran
si introducimos en la definicin del mismo, informacin procedente del modelo
terico que sea, por tanto, incuestionable.
12
que la distribucin de probabilidad del estadstico (x1 , x2 , ..., xn ) dependa del
parmetro o parmetros incluidos en la hiptesis nula. Por ejemplo,....
A su vez, el contraste de hiptesis tendr buenas propiedades si: i) ambas
hiptesis estn correctamente establecidas, ii) los supuestos sobre los que se condi-
ciona el contraste, que pueden referirse al tipo de distribucin poblacional, as
como al valor numrico de alunos parmetros que no aparecen explcitamente
en el contraste, sean correctos, iii) el estadstico utilizado en la resolucin del
contraste tenga buenas propiedades estadsticas.
Cuando la hiptesis nula es simple, es decir, incluye un nico valor numrico,
y la hiptesis alternativa es del tipo H10 , la resolucin del contraste se lleva a cabo
mediante la construccin de un intervalo de confianza alrededor del valor numrico
del estimador, utilizando la distribucin de probabilidad del mismo. As, llegamos
a una afirmacin del tipo,
h i
= P a g (X) , b (3.1)
donde , un nmero positivo prximo a 1, es el nivel de confianza del contraste.
El contraste se resuelve despejando el valor terico del parmetro desconocido
dentro de la expresin anterior, para obtener una igualdad del tipo,
h i
= P h1 ( (X)) f () h2 ( (X)) (3.2)
donde h1 ( (X)), h2 ( (X)) son nmeros reales que dependen de: i) el valor
numrico del estimador (x1 , x2 , ..., xn ) en la muestra disponible, ii) el supuesto
acerca de la distribucin poblacional, iii) el nivel de confianza (o el nivel de sig-
nifcacin) escogidos para el contraste.
En esta expresin, dada una determinada muestra, el valor numrico del esti-
mador (X) es conocido, por lo que puede comprobarse si se satisfacen o no las
desigualdades,
h1 ( (X)) f 0 h2 ( (X)) (3.3)
13
ste sera un suceso poco probable; si para = 0 , la funcin f () incumple las
cotas definidas en (3.3) diremos que dicho valor del parmetro es poco verosmil,
rechazando, en consecuencia, la hiptesis nula.
A modo de ejemplo, recordemos cmo se lleva a cabo un contraste de hiptresis
acerca del valor numrico de la esperanza matemtica de una poblacin Normal
cuya varianza se supone conocida. El punto de partida es la propiedad de la
media muestral de tal poblacin, que sigue una distribucin asimismo Normal,
con la misma esperanza matemtica que la poblacin, y con una varianza igual
a la varianza poblacional dividida por el tamao muestral. As, si la poblacin
es X N (, 25), la media muestral es una variable aleatoria con distribucin
x N (, 25
n
). Por tanto, si se trabaja a un nivel del confianza del 95%, por
ejemplo, tendremos,
x
0, 95 = P 1, 96 1, 96
5/ n
donde hemos utilizado el hecho de que x N (0, 25
n
) y x N(0, 1).
25/n
Esta igualdad es la correspondiente a (3.1) , donde el parmetro poblacional sobre
el que se establece el contraste es la esperanza matemtica, = ; el estimador
(x1 , x2 , ..., xn ) = x = 1 Pn xi es la media muestral, = 0, 95, y a = 1, 96; b =
n i=1
1, 96.
De esta igualdad, obtenemos,
5 5 5 5
0, 95 = P 1, 96 x 1, 96 x = P x 1, 96 x + 1, 96
n n n n
que es una igualdad anloga a (3.2) , con h1 ( x) = x 1, 96 5n , h2 (
x) = x +
5
1, 96 n , f () = .
En definitiva, nos queda comprobar si cuando se introduce en esta ltima
igualdad el valor de que define la hiptesis nula, la cadena de desigualdades
se satisface o no. Supongamos que en la muestra disponible, de tamao 400, se
ha calculado para la variable X una media muestral x = 7, 5;en consecuencia, el
intervalo anterior es: 0, 95 = P [7, 0 8, 0] .
14
de una relacin entre ellas por los procedimientos estadsticos disponibles. Uno
de ellos son los contrastes no paramtricos. Como ya hemos comentado ante-
riormente, una de las virtudes de este tipo de anlisis es que su validez y, en
particular, los umbrales crticos que debe sobrepasar el estadstico que define el
contraste, no dependen de ningn supuesto acerca de la distribucin de proba-
bilidad seguida por las variables cuya relacin se trata de caracterizar. Frente
a otros procedimientos que forman el ncleo tradicional de la Econometra, esto
es una ventaja pues, en el caso de los ltimos, la Normalidad de la variable cuyo
comportamiento se pretende explicar es clave. Como, adems, el supuesto de Nor-
malidad acerca de la distribucin de probabilidad de una variable econmica es
mucha veces rechazado, resulta que las buenas propiedades de las estimaciones de
un modelo economtrico quedan muchas veces en cuestin. Por eso es conveniente
su uso en combinacin con otro tipo de procedimientos estadsticos, especialmente
si sus propiedades no precisan tal hiptesis.
4. Tratamiento de datos
4.1. Ajuste estacional
4.2. Tasas de variacin
4.3. Estimacin de componentes
15
utilizar, son aleatorias, pues son funcin de la muestra que utilicemos, que es
aleatoria. Si el modelo que estamos estimando es correcto, como hemos de
suponer, la perturbacin aleatoria del mismo, ut , otorga naturaleza asimismo
aleatoria a la variable dependiente, yt . Esto significa que si cambiamos por ejem-
plo el perodo muestral que utilizamos en la estimacin, la realizacin de dicha
perturbacin, es decir, sus valores numricos, sern diferentes, con lo que las ob-
servaciones de yt tambin los ern, y la estimacin de los parmetros diferir de
la obtenida con otro perodo muestral. Asimismo, si cambiamos la frecuencia de
observacin de los datos, de diaria a mensual, por ejemplo tomando el ltimo dato
de cada mes, la muestra cambia, y con ella, las estiamciones de los coeficientes de
las variables explicativas en el modelo.
Siendo variables aleatorias, nos interesa que los estimadores tengan ciertas
propiedades deseables, lo cual depender del procedimiento de estimacin uti-
lizado, y de lasc aractersticas del modelo que estamos estimando. Las principales
propiedades en que podemos estar interesados son: insesgo, eficiencia y consis-
tencia.
El insesgo consiste en que la esperanza matemtica del estimador coincida
con el verdadero valor numrico del coeficiente que estamos estimando. Un esti-
mador eficiente es un estimador de mnima varianza. El procedimiento de mnimos
cuadrados proporciona el estimador lineal de mnima varianza, si bien pueden ex-
istir otros estimadores no lineales de varianza todava menor. Un estimador es
consistente si, al aumentar el tamao muestral, converge en probabilidad al ver-
dadero valor del parmetro desconocido que se est estimando. Se dice entonces
que su lmite en probabilidad es dicho parmetro. Bien podra ocurrir que el esti-
mador fuese sesgado en muestra pequeas, pero si es consistente, dicho sesgo ir
reducindose si ampliamos el tamao muestral. El estimador de mnimos cuadra-
dos no es siempre consistente. El estimador de mxima verosimilitud lo es, pero
siempre que la hiptesis acerca de la distribucin de probabilidad en que se basa,
sea correcta, sobre lo que no se puede tener seguridad.
yt = 0 + 1 xt + ut
16
de la que se obtiene,
ut = yt 0 1 xt
ui = yi 0 1 xi
17
a la observacin, en datos reales, de que una fuerte expansin monetaria sola
venir acompaada de un claro repunte inflacionista, mientras que, ms reciente-
mente, un robusto cecimeinto monetario puede ser compatible con una inflacin
contenida.
En una situacin de tal tipo, un procedimiento de estimacin como MCO pro-
porciona como valor numrico del parmetro un promedio de los valores numri-
cos que ha tomado durante el intervalo de tiempo correspondinte a la muestra de
datos disponible. Por tanto, resulta de suma importancia el modo en que el coe-
ficiente ha variado en el tiempo, como vamos a ver en los ejercicios de simulacin
siguientes.
18
Ejercicios de simulacin
Ejercicio 1: Simule 300 observaciones de un camino aleatorio N(10,25) como
datos muestrales de la variable explicativa x. Utilizando un valor numerico
de -1,0 para la pendiente, e ignorando el trmino de preturbacin del mod-
elo, simule los 100 primeros datos para la variable dependiente y. Luego,
utilice un valor igual a 1,0 para la pendiente y genere los datos ficticios
correspondientes a las observaciones 101 a 300 de la variable dependiente.
Estime el modelo de regresin simple con dichos datos.
Comentario: Al ejecutar el programa XXX, el lector comprobar que la esti-
macin de la pendiente del modelo se comporta de acuerdo con lo comentado en
la seccin previa.
Es recomendable ejecutar el programa varias veces, para obtener as un con-
junto de estimaciones numricas de dicho parmetro. En ningn caso se obtendr
estimaciones prximas al verdadero valor de la pendiente, que es de +1,0 en una
parte de la muestra, y de -1,0 en la otra, sino ms bien un promedio, ponderado de
acuerdo con el nmero de datos u observaciones en el que la pendiente ha tomado
uno u otro valor numrico.
El lector puede comprobar que, si aumenta la longitud muestral, las estima-
ciones que obtiene al ejecutar repetidas veces el programa, se aproximan an ms
al promedio que cabra esperar, dado el porcentaje de datos con pendiente igual
a +1,0 -1,0.
Los estadsticos resultantes de la estimacin presentan toda la apariencia de
proceder de un problema estadstico de relacin entre dos variables aleatorias. Sin
embargo, es muy importante observar que el problema que acabamos de estimar
es, en realidad, puramente determinista. No hay en el mismo ningn componente
estocstico o aleatorio pues, no hemos utilizado un lemento de perturbacin. En
nuestra simulacin, la relacin entre las variables x e y es, en todos los perdos
exacta, no faltando ninguna otra variable, ni estando sujeta a ningn elemento de
error impredecible.
Es precisamente el hecho de tratar como constante un coeficiente del mod-
elo que no lo es, lo que produce la apariencia de ser un problema de naturaleza
estocstica. Considerar tal supuesto (errneo, aunque no lo sabamos), es com-
parable a introducir una perturbacin estocstica en el verdadero modelo, que
incorporara la variacin temporal en la pendiente.
En dicha estimacin, aparentemente estadstica, obtenemos un R-cuadrado
reducido, junto con una pendiente estimada que resulta estadsticamente signi-
ficativa, si juzgamos por su estadstico tipo-t.
19
Existe asimismo evidencia de autocorrelacin en los residuos, como sugiere
el estadstico Durbin-Watson. La presencia de autocorrelacin es, en principio,
sorprendete, pues hemos generado una variable x con estructura de ruido blanco
y, por tanto, sin autocorrelacin y la variable y presenta una dependencia ex-
acta y estrictamente contempornea con ella. Por tanto, no hay ni estructuras
de autocorrelacin, ni estructuras dinmicas que pudieran producirla. Los in-
dicios de autocorrelacin provienen del cambio estructural que se produce en el
valor numrico de la pendiente. En el programa se calculan las funciones de
autocorrelacin simple de ambas variables del modelo; mientras que la variable
independiente (explicativa) no presenta autocorrelacin, como corresponde a su
estructura de ruido blanco que hemos utilizado en su generacin, la funcin de au-
tocorrelacin de la variable dependiente sugiere indicios claros de autocorrelacin.
En realidad, esta variable, por construccin, carece de autocorrelacin, lo que
sugiere una llamada de atencin al uso indiscriminado de las funciones de auto-
correlacin para detectar autocorrelacin serial en una variable o en los residuos
de una regresin.
El grfico XX que representa las observaciones de la variable dependiente junto
con los residuos dela regresin muestra la similitud entre ambas variables, loque
es, evidentemente, sinnimo de una relacin estimada pobre, a pesar de la signifi-
cacin estadstica de la pendiente del modelo. De hecho, puede observarse que
la desviacin tpica de los residuos es similar a la desviacin tpica dela variable
dependiente, lo que significa, como ya discutimos en la Seccin XX, que el modelo
no tiene una capacidad explicativa importante. Nuevamente, es importante apre-
ciar que ello ocurre junto con una valor claramente significativo del estadstico
F (F = T.R2 ) de significacin conjunta de la regresin estimada. Esta aparien-
cia de validez del modelo, de acuerdo con los estadsticos habituales es, en este
caso, falsa, lo que constituye una impoirtante llamada de atencin sobre el uso
indiscutido de contrastes de hiptesis..
De modo anlogo, el grfico XX, que presenta los valores observados de la
variable dependiente, junto con sus valores ajustados, muestra que el ajuste no
se adeca en modo alguno al comportamiento de la variable que pretendamos
explicar con el modelo, y que ha experiemntado un cambio estructural entre la
primera y la segunda submuestras. Por el contrario, precisamente porque hemos
impuesto una pendiente constante a lo largo de toda la muestra, los valores ajus-
tados, que utilizan dicho valor constante de la pendiente, dibujan un compor-
tamiento constante, promedio, durante toda la muestra, que no representa ade-
cuadamente ninguna de las dos submuestras.
20
Simule asimismo con perturbacin. Construya un grfico de varianza de la
perturbacin y varianza de la distribucin de la pendiente estimada para un
nmero de observaciones muestrales dado.
yt = 0 + ut
X = (1, 1, 1, ..., 1)
0
un vector
Pt=Tde dimensin T, se tiene X = 1T , y recordando que 1T 1T = T,
y 10T y
= t=1 yt podemos adaptar la expresin general (XX) del estimador de
mnimos cuadrados a este caso particular, teniendo,
Pt=T
1 yt
0 = (10T 1T ) 10T y = t=1 = y (5.1)
T
de modo que la estimacin de mnimos cuadrados de la constante es la media
muestral de lavariable que pretendemos explicar. En consecuencia, el residuo es,
en cada perodo,
ut = yt 0 = yt y
21
es decir, igual al producto del tamao muestral por la varianza muestral de
la variable dependiente yt . Por otra parte, la Suma Total es, como en cualquier
modelo de regresin,
t=T
X
ST = (yt y)2 = T Sy2
t=1
0 = y 1 x 0 0
que relaciona las medias muestrales de todas las variables del modelo. Por
tanto, la relevancia de la constante en el modelo estriba en ajustar las distintas
medias muestrales de las variables del mismo, corrigido cada una de ellas por el
coeficiente asociado. Pero este es un ajuste generalmnente poco relevante para
el investigador, que se interesa bsicamente en el modo en que variacioens en las
variables xt generan fluctuaciones en yt . Por tanto, en este modelo constante, en
que no se explican las fluctuacioens de yt , llevndose nicamente a cabo el ajuste
de medias muestrales a travs de (5.1) ,es lgico que el indicador de ajuste R2
22
resulte igual a cero. Ntese, por ltimo, que no hemos impuesto esta condicin,
sino que estamosminterpretan la propiedad del modelo constante, de tener un R2
igual a cero.
yt = 0 + 1 x1t +
2 x2t + ut (5.3)
y calculemos su promedio a travs de todas las observaciones muestrales. Ten-
dremos,
t=T
X t=T
X t=T
X t=T
X t=T
X
yt = 0 + 1 x1t + 2 x2t + ut (5.4)
t=1 t=1 t=1 t=1 t=1
y = 0 + 1 x1 + 2 x2 (5.5)
Restando (5.5) de (5.3) se tiene,
yt y = 1 (x1t x1 ) + 2 (x2t x2 ) + ut
23
las variables explicativas, cada una de ellas corregida por el coeficiente asociado.
Pero en el modelo con variables en desviaciones respecto a la media, todas las
vriables, dependiente y explicativas, tiene media muestral igual a cero. Por tanto,
la estimacin MCO de una hipottica constante en dicho modelo sera igual a
cero. incluso si incluimos dicha constante, su estimacin de mnimos cuadrados
ser numricamente igual a cero.
ln yt = 0 + 1 t + ut (5.6)
en el que la estimacin del coeficiente 1 nos proporciona una estimacin de
la tasa de crecimiento muestral de la variable yt . En efecto, si consideramos la
estructura,
yt = Ae 1 t (5.7)
tendremos una tasa de crecimiento dada por,
dyt /dt d (ln yt ) d (ln A + 1 t)
= = = 1
yt dt dt
En definitiva, el modelo (5.6) no es sino la versin logartmica de la ecuacin
de crecimiento (5.7), con 0 = ln(A), y donde el trmino de perturbacin ut pude
recoger cualquier fluctuacion de corto plazo alrededor de la tasa de crecimeinto
constante, 1 . Este modelo es, por tanto, apropiado cuando se pretende estimar
la tasa de crecimiento media de una variable yt a lo largo del perodo muestral.
Hay que tener en cuenta, sin emabrgo que el parmetro 1 proporciona la tasa de
crecimiento, supuesta constante, entre cada dos observaciones consecutivas. Si los
datos de que disponemos son de naturaleza anual, entonces habremos estimado el
crecimiento anual de la variable. Si los datos son trimestrales, el crecimiento anual
se obtendr a partir de la estimacin de 1 mediante = (1 + 1 )4 1, que habre-
mos de multiplicar por 100 si queremos presentar en trminos porcentuales. Si los
datos de base son de naturaleza mensual, entonces obtendremos una estimacin
del crecimeinto anual a partir de = (1 + 1 )12 1.
Este modelo de tendencia determinista lineal es tambin muy til precisamente
para extraer de una variable su comportamiento de largo plazo, cuando se supone
24
que ste est bien representado por el supuesto de una tasa de crecimiento con-
stante. As, una vez estimado el modelo (5.6) , los residuos ut nos proporcionan el
logaritmo de la variable yt desprovisto de tendencia, es decir, ut = ln yt 0 1 t,
recogiendo as el comportamiento de la variables segn flucta alrededor de su
tendencia de largo plazo. Diremos tambin que esta es la representacin de la
variable corregida de tendencia lineal. Como hemos visto, este ejercicio, efectu-
ado sobre el logaritmo de la variable original, incorpora el supuesto implcito de
que la tasa de crecimiento de dicha variable es constante.
yt = 0 + 1 xt + 2 x2t + ut (5.8)
que es un modelo con una nica variable explicativa, que aparece tanto en su
forma original, como al cuadrado. Es interesante observar que, en este modelo,
la derivada parcial, que recoge la magnitud de los cambios inducidos en yt por un
cambio en el valor numrico de xt viene dada por,
dyt
= 1 + 2 2 xt
dxt
A diferencia de la que tenamos en el caso del modelo de regresin lineal simple,
que era,
dyt
= 1
dxt
y, por tanto, constante, la derivada parcial del modelo (5.8) depende del valor
numrico de la variable explicativa. Esto puede ser muy interesante en muchas
relaciones econmicas, en las que es lgico pensar que el impacto que sobre yt tiene
una variacin unitaria en xt depende del valor numrico de xt a partir del cual
se produce dicha variacin unitaria. As, no tendra el mismo impacto negativo
sobre el consumo un incremento de un punto en el tipo impositivo del IVA si ste
25
se produce cuando dicho tipo es del 3%, que si dicho incremento se produce a
partir de un tipo del 15%. Parece lgico que as sea.
Si las variables utilizadas en la regresin son los logaritmos naturales de las
variables para las que inicialmente obtuvimos datos, como consumo y renta,
yt = ln(Yt ), xt = ln(Xt ), estaramos recogiendo en (5.8) la creencia en una elasti-
cidad no constante, como aparece en muchos modelos tericos econmicos. Si el
valor numrico del coeficiente 2 es negativo, tendremos que la variable yt crece
menos que proporcionalmente con un aumento en xt , lo que correspondera a una
nube de puntos en la forma de una funcin cncava, mientras que si estimamos
un valor numrico positivo para 2 , tendremos que la variable yt crece ms que
proporcionalmente con un aumento en xt , lo cual correspondera a una nube de
puntos convexa. Por contraposicin, en el modelo lineal incorporamos a priori
la hiptesis de elasticidad constante, es decir, el supuesto de que la variable yt
crece proporcionalmente con xt .Sin duda que, aunque no se considera habitual-
mente, parece conveniente permitir en un priemr anlisis la posibilidad de una
relacin cuadrtica contrastando, si se desea, la significatividad estadstica del
coeficiente 2 , si bien dicho contraste habra que verlo a la luz de la discusin
de la Seccion XX. As, en muchas ocasiones (como puede ser si se quiere utilizar
el modelo estimado con fines predictivos) puede resultar conveniente mantener
un posible trmino cuadrtico incluso si el coeficiente 2 asociado aparece como
estadsticamente no significativo, en trminos del habitual contraste de la t de
Student.
Queda por discutir cmo obtener estimaciones de mnimos cuadrados para este
modelo, a pesar de ser una relacin no lineal entre variables. Pero este tipo de
modelos es muy sencillo de estimar, pues basta definir una nueva variable x2t = x2t
para tener el modelo de regresin,
yt = 0 + 1 xt + 2 x2t + ut (5.9)
que, como modelo lineal que es en las variables explicativas xt y x2t , estimamos
por medio de los procedimientos descritos en la Seccin XX, teniendo el estimador
MCO de este modelo las propiedades habituales.
26
5.7.2. Debemos estimar en valores originales o en logaritmos de las
variables?
5.7.3. Debe estimarse el modelo con variables en niveles o en diferen-
cias?
5.7.4. La frecuencia de observacin de las variables
Muchas veces se alusin al aparente principio de que, en cualquier trabajo es-
tadstico con datos, ms informacin es preferible a menos, por los que, un mayor
nmero de datos es preferible a un nmero inferior. En este sentido, si el in-
vestigador tiene la posibilidad de trabajar con datos mensuales de las variables
dependiente e independiente, debe utilizar estos en preferencia al uso de datos an-
uales. Esto no es en modo alguno cierto, debido al menos a dos consideraciones.
27
las expectativas de los empresarios acerca de la demanda futura incide en sus
decisiones de inversin, la presencia de los componentes errticos en los datos que
se publican nos llevara a estimar un modelo,
donde,
inversiont = inversi
ont + t
exp ectativast = exp ectativast + t
siendo t , t , los componentes errticos a los que nos hemos referido, que supon-
dremos no relacionados, Corr(t , t ) = 0. Incluso si Corr(inversi ont , exp ectativast )
es elevada, la presencia de t , t , har que, generalmente, Corr(inversi ont , exp ectativast )
sea inferior a Corr(inversi ont , exp ectativast ), proporcionando un ajuste pero del
que habramos tenido en ausencia de dichos componentes errticos. Como conse-
cuencia de que slo podemos utilizar en la regresin las medidas inversi ont , exp ectativast ,
quiz incluso tengamos una estimacin del coeficiente 1 no significativa, debido
a la prdida de precisin en su estimacin.
inf laci
ont = 0 + 1 crecimiento monetario + ut
28
Ahora bien, verdaderamente creemos que un mayor crecimiento monetario
en marzo, por ejemplo, genera una mayor inflacin en dicho mes? Muy pocos
economistas suscribiran tal concepto. Mucha mayor uniformidad de pareceres
encontraramos en cuanto a creer que observado ao a ao, mayor crecimiento
monetario viene asociado con mayor inflacin, mientras que un ao en que se
instrumenta una poltica monetaria ms restrictiva, definida por una reduccin
del crecimiento monetario, es un ao de inflacin menor. Es decir, la proposicin
conceptual que relaciona positivamente crecimiento monetario e inflacin es una
proposicin referente al medio o largo plazo.
Incluso con datos anuales surgir, lgicamente, la cuestin de si un menor crec-
imeinto monetario conduce a una menor inflacin ese mismo ao, el ao siguiente,
o en ambos. Esta ser una cuestin que puede discutirse mediante los proced-
imientos economtricos y los contrastes estadsticos adecuados, y que conduce a
una investigacin siempre interesante. Pero sta es la perspectiva adecuada: en
modo alguno tiene sentido pensar que las fluctuaciones que, mes a mes, experi-
menta el crecimiento monetario se corresponden con las fluctuaciones mensuales
que se observan en la tasa de inflacin. este tipo deinvestuigaciones, con datos
mensuales, estn condenados al fracaso; incluso si estadsticamente detectsemos
una relacin positiva, deberamos estar dispuestos a calificarla de esprea, en el
sentido de no ser la relacin estructural que cualquier economista estara dispuesto
a admitir entre crecimiento monetario e inflacin.
Este ejemplo no debe sino sugerir que las proposiciones econmicas tericas
no dicen nada acerca de cul es la frecuencia en la que se cumplen, y no debemos
en modo alguno inferir que una proposicin terica debe cumplirse en todo tipo
de datos. Por el contrario, cuando nos proponemos examinar empricamente una
proposicin terica, hemos de pensar cuidadosamente acerca de la frecuencia de
datos en que esperamos que sta se manifieste, y ello debe determinar el tipo de
datos a utilizar. El posible cumplimiento de la proposicin puede apreciarse en
datos de una frecuencia pero no en datos de frecuencia diferente.
yt = 0 + 1 xt1 + ut
29
afirmando en este caso que la relacin es dinmica, por cuanto que no se
manifiesta contemporneamente, esdecir, durante el mismo mes. De acuerdo con
este modelo, un incremento en xt tendera a conducir a un valor ms elevado de yt
pero no este mes, sino al mes siguiente. Supongamos ahora que slo disponemos
de datos trimestrales: por ejemplo, el dato del primer trimestre ser, para ambas
variables, el promedio de los datos de enero, febrero y marzo, tenindose las
relaciones,
Aunque yenero no est relacionado con xenero , xf ebrero , o xmarzo , las relaciones
existentes entre yf ebrero , ymarzo y xenero , xf ebrero son suficientes para que los datos
del primer trimestre de ambas variables,
yenero + yf ebrero + ymarzo xenero + xf ebrero + xmarzo
yprimer trimestre = , xprimer trimestre =
3 3
estn relacionados. Sin embargo, debe apreciarse que la relacin ser entre
lso datos de x e y correspondientes ambos al primer trimestre. En consecuencia,
una relacin que con datos mensuales tena una naturaleza dinmica, pasa a ser
estrictamente contempornea con datos triemstrales.
As, es importante recordar que algunas de las propiedades de una relacin
economtrica dependen de la frecuencia de observacin de los datos, no siendo,
por tanto, propiedades de carcter absoluto de la relacin entre x e y.
30
variable asciada a dicho coeficente tiene un impacto significativo sobre la variable
dependiente, cuyo comportamiento se pretende explicar. No debemos olvidar que
con ello, lo que estamos contrastando es si dicho impacto es estadsticamente signi-
ficativo, y tratando de identificar dicha caracterstica con la existencia de un efecto
estructural significativo de la variable explicativa sobre la variables dependiente.
Pues bien, ya hemos visto que la manera de resolver el contraste de dicha
hiptesis consiste en utilizar el test t de Student, que en el caso de la hiptesis de
significacin adopta la forma,
tT k
DT ()
31
coficiente asociado, a pesar de que la variable x es un factor explicativo relevante
de la variable y.
A pesar de sus importantes implicaciones para el contraste de hiptesis estads-
ticas, esta discusin se ignora con demasiada frecuencia en el trabajo emprico. Su
importancia deriva de que, como hemos ido revisando con anterioridad, existen
distintas razones que pueden implicar una prdida de precisin en la estimacin
puntual, con independencia del contenido informativo que la variable x tiene so-
bre y. Por ejemplo, aparece una prdida de precisin apreciable cuando el valor
numrico del coeficiente ha variado a lo largo del intervalo muestral [Recurdese
el ejercicio de simulacin XXX]. en distintos puntosEsta se
numricamente de Con mucha frecuencia se ignora
mayor estadstico t
8. Variables no estacionarias
La no estacionariedad de las variables involucradas en una regresin es uno de
las situaciones que requiere una consideracin ms cuidadosa en el anlisis de
regresin. La ausencia de estacionariedad se produce con mucha frecuencia en
variables econmicas; adems, como vamos a ver, sus implicaciones en la esti-
macin de modelos de regresin pueden ser bastante negativas e importantes. Por
ltimo, su deteccin y tratamiento no son siempre evidentes.
32
puramente transitorios; pueden durar varios perodos, pero sus efectos terminan
desapareciendo. Los valores sucesivos de su funcin de auocorrelacin convergen
rpidamente hacia cero, excepto quiz en los retardos de carcter estacional. la
serie temporal correspondiente a una variable estacionaria no deambula durante
perodos largos de tiempo a un mismo lado de su media muestral, sino que cruza
frecuentemente dicho nivel medio. El nmero medio de perodos que transcurre
entre dos cruces consecutivos del nivel medio muestral es pequeo.
Por el contrario, una perturbacin de carcter transitorio sobre una variable
no estacionaria tiene efectos permanentes. La funcin de autocorrelacin de una
variable no estacionaria converge a cero muy lentamente, y su serie temporal
muestra claramente largos perodos de tiempo en que deambula sin cruzar su
nivel medio.
33
observaciones correspondientes a una misma estacin cronolgica, en el caso de
una variable estacional. La transformacin mediante diferencias resulta bastante
natural en el anlisis de datos financieros, por cuanto que la primera diferencia
del logaritmo de un precio, en logaritmos, es la rentabilidad del activo, loq ue hace
que la transformacin logartmica sea utilizada muy frecuentemente.
Como prcticamente ningn precio o ndice financiero es estacionario, el uso
indiscriminado de un estadstico como la varianza o la desviacin tpica como
indicador de riesgo conduce a medidas de volatilidad sesgadas al alza. Consider-
emos un modelo muy popular en el anlisis de mercados financieros, el camino
aleatorio:
yt = + yt1 + t , t = 1, 2, ...
V ar(yt ) = t 2
34
En el ejemplo anterior, de un camino aleatorio, la tendencia estocstica aparece
debido al coeficiente unitario del retardo de yt en la ecuacin que explica el compor-
tamiento de esta variable, por lo que una tendencia estocstica se conoce asimismo
como una raz unitaria. Con ms generalidad, recordemos que por la descomposi-
cin de Wald, todo proceso estacionario acepta una representacin autoregresiva,
quiz de orden infinito,
X
yt = 0 + j ytj = (L) yt
s=1
1 t1 X t
yt = 0 + s1 y0 + ts
1 s
1 1 s=1
0 2
E(yt ) = ; V ar(yt ) =
1 1 1 21
35
0 2u
yt N ( , )
1 1 1 21
yt N(0 + 1 yt1 , 2u )
36
Comenzamos describiendo el tipo de dificultades a que puede dar lugar la
ausencia de estacionariedad de las variables dependiente e independiente en un
modelo de regresin lineal. Para ello, pensemos en el siguiente ejercicio: comen-
zamos simulando dos ruidos blancos independientes, xt , yt , t = 1, 2, ..., T, a partir
de distribuciones de probabilidad Normal, con esperanza matemtica x , y (por
ejemplo, iguales a cero) y varianzas 2x , 2y ; el coeficiente de correlacin muestral
entre las series temporales resultantes ser, por construccin, muy reducido, si
bien no exactamente igual a cero.
Nota: Cuanto mayor sea el tamao muestral, ms probable es que dicha cor-
relacin sea igual a cero, debido a que la correlacin muestral, es decir, la cor-
relacin entre las dos series temporales simuladas es, por la ley de los grandes
nmeros, un estimador consistente de su anlogo poblacional, que es el coeficiente
de correlacin terico entre los dos procesos xt , yt , que es igual a cero. Por tanto,
al aumentar T , la distribucin de probabilidad del coeficiente de correlacin mues-
tral se concentra alrededor de cero.
El grfico de ambas variables presentar una pauta oscilando alrededor de
su media muestral que, por la misma razn apuntada para el coeficente de cor-
relacin, sern prximas, si bien no iguales, a x , y . Observaremos que cada
serie temporal cruza repetidamente su nivel medio. Si estimamos una regresin
del tipo:
yt = 0 + 1 xt + ut , t = 1, 2, ..., T
37
resultado que esperaramos: una regresin no significativa, excepto en lo relativo
al nivel escogido para el contraste.
yt = at + yt
xt = bt + xt
yt = 0 + 1 xt + vt , t = 1, 2, ..., T
38
estructura estocstica que xt , yt , por lo que ambas relaciones deberan propor-
cionar resultados anlogos. Esta apariencia ficticia de capacidad explicativa es lo
que se conoce como regresin esprea.
El grado de correlacin observado entre yt , xt depende de dos factores: la
similitud entre las constantes a y b, y la relacin entre ambas y las desviaciones
tpicas de los ruidos blancos originales, xt , yt . Si, por ejemplo, fijamos el valor
numrico de b en b = 1, y vamos tomando en cada ejercicio de simulacin val-
ores: a = [0, 1; 0, 5; 0, 9; 1; 3; 10; 100] el coeficiente de determinacin resultante,
R2 aumenta montonicamente con el valor de a. Es decir, la mayor correlacin
no se obtiene cuando hay a ambos lados de la igualdad la misma pendiente, lo
que equivaldra a utilizar a = 1, sino que dicha correlacin aumenta con a. Esto
se debe a que, segn aumenta a, cada vez hay ms tendencia determinista en
yt , en el sentidod e ques sta predomina sobre el componente estocstico yt , y
dicha tendencia determinista puede explicarse muya decuadamente mediante el
componente anlogo de xt .
yt = yt1 + yt
xt = xt1 + xt
obteniendo que el coeficiente de correlacin entre xt e yt era muy prximo a
la unidad. Esto es sorprendente, por cuanto que, a partir de condiciones iniciales
conocidas, los valores de ambas variables en cada instante de tiempo pueden
escribirse como,
t
X
yt = y0 + ys
s=1
que indican que la evolucin temporal de cada una de las variables se debe a la
acumulacin temporal de sus innovaciones. Por tanto, la naturaleza estocstica de
39
cada variable est totalmente determinada por la naturaleza de sus innovaciones.
Si xt y yt son independientes, entonces tambin deberan serlo xt e yt , en contra
de los valores obtenidos para sus coeficientes de correlacin muestrales en repetidas
simulaciones. En todo caso, nuevamente, tal elevada correlacin no refleja ninguna
relacin real entre las variables, por lo que se denomina correlacin esprea.
Si estimamos una regresin lineal entre estas variables, en cualquier orden, ten-
dremos de nuevo un R-cuadrado elevado y una pendiente significativa, de acuerdo
con el criterio habitual de utilizar su estadstico tipo t-Student, pero la evidencia
de capacidad explicativa proporcionada por esta regresin sera esprea.
Si las series temporales obtenidas mediante simulacin para las innovaciones o
ruidos blancos xt y yt tuviesen correlacin distinta de cero, las variables xt e yt
de los ejemplos anteriores mostraran correlaciones muestrales similares a las que
se encuentran en los ejercicios de simulacin descritos. En ese caso, los elevados
coeficientes de correlacin no seran tan engaosos, si bien seran numricamente
ms altos de lo que la correlacin entre xt e yt hara esperar.
En un ejercicio de simulacin como el descrito, Granger y Newbold encon-
traron una frecuencia aproximada de rechazos de la hiptesis nula H0 : 1 = 0 del
76%. La frecuencia de rechazos de la capacidad explicativa global de la regresin
se eleva muy significativamente al aumentar el nmero de variables explicativas
independientes con estructura de ruido blanco. Nuevamente los coeficientes de
determinacin son muy elevados, lo que sorprende, pues realmente, xt no explica
apenas a yt . El estadstico de Durbin-Watson habitualmente utilizado para con-
trastar ausencia de autocorrelacin se reduce hacia cero, por lo que la combinacin
de este hecho con un elevado R2 suele utilizarse como indicio de una regresin es-
prea.
Ejercicio de simulacin
40
En regresion_ori se presentan los resultados de estimar una regresin entre
las variables originalmente obtenidas por simulacin, la primera de ellas actuando
como variable dependiente, la segunda como variable explicativa. El coeficiente
de determinacin es el cuadrado de su coeficiente de correlacin y, por tanto,
muy reducido. La estimacin del coeficiente asociado a la variable explicativa
aparece como no significativamente diferente de cero, de acuerdo con el estadstico
t habitual. El grfico que presenta el ajuste de la recta a la nube de puntos muestra
un lnea sin apenas pendiente, y una nube de puntos bastante circular. Ambos
hechos reflejan una escasa correlacin: una pendiente no significativa sugiere que
la variable explicativa puede cambiar de valor sin que la variable dependiente
cambie; una nube de puntos circular muestra que el rango de valores de cada una
de las dos variables asociado a un valor determinado de la otra es muy amplio. En
consecuencia, un valor numrico de cualquiera de ellas apenas nos informa acerca
del valor de la otra variable. Esta es la manifestacin de la ausencia de correlacin
entre ambas.
Lo contrario ocurre al estimar una regresin lineal entre las variables [regre-
sion_tend], una vez que se ha aadido una tendencia determinista a cada una de
ellas. Para ello, en la hoja Datos se han generado dos nuevas variables, sumando
una tendencia lineal a la variable Y, y 0,6 veces la misma tendencia lineal a la
variable X. Los estadsticos muestrales que aparecen al pie de dichas variables
carecen de justificacin estadstica, como comentaremos en una seccin posterior.
Aunque el componente estocstico en ambas variables es el mismo de antes, la
nuebe de puntos entre ambas tiene un perfil totalmente distinto, siendo prctica-
mente una linea recta. Esto se debe a que el componente tendencial predomina
sobe el estocstico; como consecuencia, la regresin estimada entre ambas vari-
ables muestra un coeficiente de determinacin muy prximo a la unidad. Lo
que es quiz ms preocupante, es que la pendiente estimada en dicha regresin,
que es sustancialmente ms elevada que la estimada con las variables originales,
aparece como claramente significativa, sugiriendo una importante capacidad ex-
plicativa a la variable independiente, contrariamentea lo que detectamos en la
primera regresin. Aqu cabe discutir si este es un resjultado razonable: podra
argumentarse que ambas variables tienen un componente tendecial importante y
que, en ese sentido, no es sorprendente que el coeficiente de determinacin entre
ambas sea elevado. Es cierto, pero slo refleja la relacin entre los componentes
deterministas, que no son los que deben concentrar la atencin del analista: si hay
componentes deterministas en las variables dependiente y explicativas, el analista
debera indagar las razones que explican la presencia simultnea de tales elementos
41
en las variables. Esta sera uno de los elementos del anlisis; el segundo consistira
en evaluar la relacin entre los componentes estocticos en variables dependiente
y explicativas; ste elemento es importante, pues nos proporciona informacin ac-
erca del impacto que sobre la variable dependiente puede tener una intervencin
sobre alguna de las variables explicativas, o una alteracin exgena en su valor
numrico. La dificultad con la regresin anterior estriba en que si no se lleva a
cabo este anlisis por componentes, el examen mecnico de los resultados de la re-
gresin sugerira que la variable dependiente reacciona a fluctuaciones inesperadas
en la variable explicativa, cuando no es as; tal conclusin sera un error.
Posteriormente, hemos mantenido los mismos elementos tendenciales de ambas
variables, pero hemos incrementado de manera apreciable el componente aleatorio
en ellas. Siendo tales componentes variables aleatorias de esperanza matemtica
igual a cero, su tamao queda representao por su desviacin tpica, que era unitaria
para ambas en las regresiones anteriores. En la hoja Datos hemos generado otras
dos variables con desviaciones tpicas 20 y 30; la correlacin entre ellas desciende, si
bien no de manera dramtica, situndose en 0,9349. Por ltimo, hemos mantenido
estos compoenntes estocsticos, pero reduciendo el incremento perodo a perodo
de la tendencia, que pasa de ser 1,0 a ser ahora 0,10. El coeficiente de correlacin
entre ambas variables se reduce ahora a 0,2446; la regresin entre ambas variables
todava muestra una pendiente significativamente diferente de cero de acuerdo
con el uso habitual del estadstico t, pero de manera menos evidente que antes;
el coeficiente de determinacin es iguala 0, 24462 = 0, 0598, bastante reducido.
El grfico que muestra la nube de puntos, junto con la recta ajustada, ilustra la
dificultad de precisar la pendiente de la recta que mejor se ajusta a dicha nube
de puntos, es decir, la dificultad de estimar con precisin dicha pendiente.
yt = 0 + 1 t + yt (8.1)
xt = 0 + 1 t + xt (8.2)
Para ello, hay dos posibilidades: la primera consiste en incorporar en el modelo
de regresin una tendencia determinista lineal como variable explicativa,
42
yt = + t + xt + ut (8.3)
en la que el coeficiente estimado y su desviacin tpica sern, aproximada-
mente, los mismos que habramos estimado en la regresin,
yt = 0 + 1 xt (8.4)
Esto significa que si ambas innovaciones son independientes, en la regresin
(8.3) se tendr un coeficiente reducido en magnitud, y estadsticamente no signi-
ficativo, en trminos de su estadstico t de Student.
Esto es distinto del resultado que se obtiene en la estimacin de la regresin
habitual,
yt = + xt + ut (8.5)
cuando las variables tienena estructura (8.2), (8.1), en la que se tendra un R-
cuadrado muy elevado, una estimacin numrica de relativamente elevada, y un
estadstico t para dicho coeficiente, claramente por encima de 2,0 en valor absoluto,
sugiriendo que la capacidad de xt para explicar yt es significativa, contrariamente
a lo que, en realidad, ocurre.
La dificultad con el procedimiento que hemos sugerido es que todava manten-
dr un R-cuadrado muy elevado, debido a la capacidad explicativa que el trmino
t tiene sobre yt , debido a la presencia de una tendencia determinista en esta
ltima variable. este trmino aparecer como claramente significativo, con un
estadstico t muy elevado.
La diferenciacin elimina asimismo las tendencias deterministas, como fcil-
mente puede comprobarse algebraicamente. De este modo, si el precio de un
determinado activo tiene una tendencia temporal determinista lineal, su primera
diferencia estar libre de dicha tendencia. Un proceso con una tendencia deter-
minista cuadrtica sigue trayectorias con formas parablicas, cncavas o convexas.
Su primera diferencia presentar una tendencia lineal, mientras que su segunda
diferencia estar libre de tendencia. Un proceso con una tendencia determin-
ista representada por un polinomio de grado tres puede tener ciclos. La primera
diferencia de este proceso tendr una tendencia cuadrtica.
Como ejemplo, consideremos:
yt = 0 + 1 t + 2 t2 + t
cuya primera diferencia es:
43
yt = yt yt1 = ( 1 2 ) + 2 2 t + (t t1 )
y su segunda diferencia:
44
8.7. Contrastes de raz unitaria
Si utilizamos la teora de la cointegracin, comenzaramos llevando a cabo con-
trastes de raiz unitaria para ambas variables, que detectaran en un 95% de las
simulaciones que ambas variables son I(1).
8.8. Cointegracin
Un vector z de variables de naturaleza I(1) se dicen cointegradas si existe una
combinacinn lineal de las mismas, definida por un vector tal que 0 z es una
variable aleatoria I(0), es decir, estacionaria. Ms generalmente, se dice que un
vector z de variables cuyo mximo orden de integracin es q estn cointegradas
si existe una combinacin lineal de las mismas, definida por un vector tal que
0 z es una variable aleatoria I(p), con p < q. El vector se denomina vector de
cointegracin.
yt = 0 + 1 xt + vt , t = 1, 2, ..., T (8.6)
y contrastando la estacionariedad de los residuos, como propusieron Engle y
Granger (1987). Sin embargo, los niveles crticos para el contraste de esta hipte-
sis no son los mismos que para el contraste de races unitarias en una variable,
pues ahora, el contraste se lleva a cabo despus de haber estimado el modelo de
regresin (8.6). Esto no es irrelevante: el procedimiento de mnimos cuadrados
busca los valores del espacio paramtrico ( 0 y 1 en la regresin anterior) que
minimizan la varianza del residuo resultante, y ste tiene una varianza infinita
para los valores de 1 que no hacen que las variables estn cointegradas. Por
tanto, si yt , xt estn cointegradas, el mtodo de MCO tender a seleccionar el
valor de 1 que genera residuos estacionarios, es decir, la constante de cointe-
gracin. Aunque esto es lo que pretendemos, ello significa que hay una cierta
tendencia a concluir con ms frecuencia de la que debiramos que las variables
estn cointegradas. en consecuencia, los valores crticos para el contraste de raz
unitaria de los residuos de (8.6) deben ser ms elevados en valor absoluto que los
utilizados para el contraste de raz unitaria habitual.
45
Si los residuos de esta regresin resultan ser estacionarios, decimos que las
variables yt , xt estn cointegradas, siendo (8.6) la relacin de cointegracin entre
ambas. Esta relacin sera el producto 0 z anterior despus de normalizar una
de las coordenadas del vector lo cual, evidentemente, siempre es posible. Se
interpreta como la relacin de largo plazo entre ellas, alrededor de la cual exper-
imentan desviaciones a corto plazo que revierten posteriormente. Es decir, si en
un determinado perodo, yt est por encima del valor numrico de 0 + 1 xt para
ese mismo perodo, generalmente yt crecer por encima de 0 + 1 xt , de manera
que yt+1 tender a acercarse a 0 + 1 xt+1 . En el caso de dos variables yt , xt ,
decimos que 1 es la constante de cointegracin entre ambas.
En el anlisis de simulacin anterior, en el que generamos ambas series tem-
porales a partir de procesos independientes, este contraste nos sugerir en una
mayora de simulaciones que yt , xt no estn cointegradas, lo que aparecer en la
forma de residuos de naturaleza I(1) en (8.6). En tal caso, habramos de estimar
un modelo en diferencias de ambas variables,
yt = 0 + 1 xt + vt , t = 1, 2, ..., T
46
reverting. No tiene sentido analizar las relaciones entre los niveles de variables
I(1) si no estn cointegradas.
47
de las cotizaciones de los valores en l incluidos, cabra esperar que ambas series
temporales estuvieran correlacionadas. Sin embargo, las fluctuaciones que am-
bos experimentan a corto plazo pueden ser suficientes para que su coeficiente de
correlacin sea reducido.
xt = x + x wt + xt
yt = y + y wt + yt
wt = wt1 + t
48
de las posibles relaciones de cointegracin existentes entre las variables que com-
ponen el vector. De hecho, la estimacin resultante depender de la normalizacin
de coeficientes utilizada en (8.6), a diferencia de lo que ocurre en el caso de dos
variables.
m
X n
X
yt = y + y1i xti + y2i yti + y t1 + yt (8.7)
i=1 i=1
Xp Xq
xt = x + x1i xti + x2i yti + x t1 + xt
i=1 i=1
49
coeficientes tienen igual signo, x debe ser significativamente mayor que y en
valor absoluto. De hecho, podra ocurrir tambin que slo unos de los dos co-
eficientes resulte estadsticamente significativo, lo que podra interpretarse en el
sentido de que la variable asociada soporta todo el peso del ajuste hacia la relacin
de equilibrio a largo plazo.
La cointegracin entre variables no lleva aadida ninguna interpretacin conc-
reta en trminos de causalidad entre dichas variables. De hecho, como la relacin
de cointegracion puede normalizarse de distintas maneras, puede presentarse una
apariencia de causalidad en cualquiera de las dos direcciones. El modelo de cor-
reccin de error muestra que, en presencia de cointegracin, existe importante
causalidad entre ambas variables, en principio, con carcter bidireccional. Slo
si algunos de los coeficientes del modelo MCE resultan ser estadsticamente no
significativos, podra hablarse de causalidad unidireccional. Si dos variables es-
tn cointegradas, al menos una de ellas causa a la otra; sin embargo, ello podra
tambin reflejar el efecto comn de una tercera variable, no considerada en el
modelo.
Por ejemplo, al trabajar con datos de precios de contado y del futuro sobre un
determinado activo financiero, es habitual hallar un mayor nmero de retardos del
precio del futuro en la ecuacin del contado, que viceversa, lo que sugiere que los
mercados de derivados (en este caso, de futuros), incorporan la nueva informacin
ms rpidamente que los mercados de contado, por lo que los ltimos parecen
responder a fluctuaciones en los primeros. En este tipo de ejemplos, en ocasiones
el trmino de correccin de error resulta no significativo en la ecuacin de precios
del mercado de contado.
Cuando el vector zt incorpora ms de dos variables, y existe ms de una relacin
de cointegracin entre ellas, el modelo de correccin de error adopta una expresin
similar a la antes propuesta. La diferencia estriba en que aparecen retardos de
todas las variables, en diferencias, en todas las ecuaciones, y aparecen tantos
trminos de correccin de error como relaciones de cointegracin en cada una de
las ecuaciones. Dichos trminos sern los valores retardados de dichas relaciones
de cointegracin; la normalizacin esocgida afecta nicamente a la interpretacin
de los valores numricos estimados.
La bsqueda de variables cointegradas abundan en la literatura financiera,
donde trata de caracterizarse las posibles relaciones de equilibrio a largo plazo
entre precios de activos. As, se han analizado las posibles relaciones de cointe-
gracin entre tipos de cambio, entre tipos de inters dentro de una misma estruc-
tura temporal, entre mercados de contado y futuro, entre commodities, valoracin
50
de divisas. Tambin se ha utilizado este tipo de anlisis para discutir el grado
de integracin entre mercados de valores o de deuda, si bien parece existir ms
evidencia favorable en el primer tipo de mercados. Este anlisis tiene asimismo
implicaciones para la gestin financiera: en principio, debera ser posible encontrar
una cesta reducida de valores cointegrada con el ndice, lo que podra utilizarse en
la gestin pasiva de carteras. Lo mismo debera ocurrir con un pequeo conjunto
de ndices sectoriales, etc..
con
p p
X X
= Ai I, i = Aj
i=1 j=i+1
51
modelo en diferencias. En el ejercicio de simulacin descrito, la estimacin de la
relacin en primeras diferencias,
yt = 0 + 1 xt + vt , t = 1, 2, ..., T
52
agregado monetario, etc. Estas variables tienen, generalmente, una raz
unitaria, por lo que, en caso de querer relacionar dos de ellas, y en presencia
de cointegracin, deberamos estimar un modelo de correccin de error.
que un modelo,
53
9. Matrices de covarianzas no escalares
9.1. Deteccin de la autocorrelacin
9.2. Tratamiento de la autocorrelacin.
9.3. El estimador de mnimos cuadrados generalizados
9.4. Deteccin de la heteroscedasticidad
9.5. Contraste de igualdad de varianza entre submuestras
9.6. Tratamiento de la heteroscedasticidad
54
situacin, slo explicitamos una de ellas como variables expliactivas, las restantes
estarn incluidas en el trmino de error, con lo que ste recoger, adems de otros
componentes, la evolucin de las variables explicativas omitidas del modelo de
regresin. Con ello, su fluctuacin ser importante, por lo que tendr una vari-
anza notable. La nica manera de reducir dicha varianza del trmino de error es
haciendo explcitas todas las variables potencialmente explicativas.
El investigador nunca tiene convencimiento acerca de la capacidad explica-
tiva de un detemrinado conjunto de variables. Lo que debe hacer es estimar el
modelo con ellas, y proceder a contrastar la significacin de cada una de ellas
por separado, del modo que describimos en este captulo. En este proceso incide
negativamente la dificultad en estimar por separado el efecto de cada una de las
variables explicativas sobre la variable endgena, por lo que no puede sorprender
que dediquemos a este asunto una buena parte del captulo.
Si, queriendo caracterizar la determinacin de tipos de inters, estimamos el
modelo,
rt = 0 + 1 mt + 2 t + ut (10.1)
en el que aparecen el crecimiento monetario y la tasa de inflacin como vari-
ables explicativas. El coeficiente 1 mide el efecto sobre los tipos de inters de
un incremento (o disminucin) unitario en la tasa de expansin monetaria, dada
una determinada tasa de inflacin, es decir, manteniendo la tasa de inflacin con-
stante. Aunque indudablemente esta es una evaluacin interesante, el hecho de
que slo sea vlida en ausencia de variaciones en la tasa de inflacin limita algo
su uso. En todo caso, es claro que junto con este tipo de estimaciones, nos intere-
sara disponer asimismo de una estimacin del efecto que tendra dicha variacin
en el crecimeinto monetario teniendo en cuanta asimismo el impacto que dicha
variacin puede tener sobre la tasa de inflacin.
Podra pensarse que si lo que se pretende es estimar el impacto que sobre los
tipos de inters tiene una variacin unitaria en la tasa de crecimiento monetario,
podemos estimar el modelo de regresin lineal simple,
rt = 0 + 1 mt + vt (10.2)
Ahora bien, si el verdadero modelo es (10.1), entonces en el modelo (10.2),
la tasa de inflacin forma parte del trmino de error. De hecho, tendramos la
relacin entre los trminos de error de ambas ecuaciones,
vt = 2 t + ut
55
Como consecuencia, en la medida en que crecimiento monetario e inflacin no
son independientes, la variable explicativa mt y el trmino de error vt en el modelo
(10.2) estaran correlacionados,
56
que, en realidad, no coincidirn.La diferencia entre la variacin en yt y la
variacin que para dicha variable se habra previsto en funcin de los cambios que
han experimentado las variables explicativas, 1 x1t + 2 x2t + 3 x3t , se debe,
por supuesto, a la existencia del error o residuo, que confiamos que, en media,
no ser muy grande. En todo caso, la diferencia entre los dos miembros de la
igualdad anterior ser ut .
El trmino 1 x1t mide el efecto que sobre yt habra tenido la variacin en
x1t si las otras dos variables explicativas no hubiesen cambiado. Sin embargo,
este es un supuesto ficticio, pues las tres variables habrn visto alterado su valor
numrico.
A pesar de ello, el ejercicio ceteris paribus puede tener inters en el diseo
de poltica econmica. Por ejemplo, retomando el modelo (10.1), el coeficiente
estimado 2 nos dara el efecto que sobre los tipos de inters tendr una variacin
unitaria (positiva o negativa) en la tasa de inflacin, si mantenemos inalterada
la tasa de crecimiento moenatrio. Como sta es una variable de control de la
autoridad moneria en la puesta en prctica de la poltica monetaria, el ejercicio que
acabamos de describir es razonable. Incluso, una vez realizado, la propia autoridad
monetaria podra preguntarse por el impacto que sobre los tipos de inters tendra
un incremento de un punto en la tasa de inflacin (que tender a elevar los tipos
de inters), parcialmente compensada con una mayor restriccin monetaria (que
tender a reducir los tipos de inters), por ejemplo, recortando en dos puntos
el crecimiento monetario. Dicho impacto sobre los tipos de inters, sera, rt =
2 1 + 2 donde, una vez ms, hay que apuntar que, muy probablemente, 1 tomar
un valor negativo.
Si, por ejemplo, la ecuacin estimada es,
rt = 4, 25 0, 42mt + 0, 96 t + ut (10.5)
entonces la elevacin de un punto en la tasa de inflacin tendera a incrementar
los tipos de inters en 0,96. Si se reduce en dos puntos el crecimiento monetario
el efecto combinado ser mucho menor, rt = 2 1 + 2 = 0, 84 + 0, 96 = 0, 12.
El modelo lineal de regresin especifica una relacin del tipo,
57
explicativas. El trmino ut se conoce como la perturbacin o trmino de error
del modelo, y es una variable aleatoria. Tambin yt se considera que es una
variable aleatoria. La variable ut es el componente de yt que el modelo no puede
explicar. Se entiende que la lista de variables explicativas recoge todas las variables
que pueden estar relacionadas con yt , de modo que ut es el componente que el
investigador reconoce no poder explicar. En un modelo de regresin interesa que
este trmino sea lo ms pequeo posible.
La expresin anterior refleja el supuesto de que disponemos de observaciones
de series temporales para cada una de las variables del modelo. Los datos de series
temporales recogen informacin acerca de una determinada unidad econmica (un
pas, un mercado financiero, etc...) en distintos instantes de tiempo, reflejando
as la evolucin temporal de un conjunto de variables relativas a dicha unidad
econmica. Un ejemplo sera un modelo que pretende explicar la inflacin men-
sual en la zona euro utilizando como variables explicativas la tasa de crecimiento
de la M3, las variaciones en el precio del barril de petrleo, etc.. Otros ejemplos
seran: a) tratar de explicar la evolucin temporal de las rentabilidades diarias
ofrecidas por una cesta IBEX35 utilizando las rentabilidades ofrecidas por una
cesta S&P500, b) explicar la evolucin de la volatilidad del IBEX35 a partir de
la volatilidad del Futuro sobre el IBEX35, c) tratar de explicar la volatilidad im-
plcita en una opcin put sobre Telefnica a partir de la volatilidad en la cotizacin
de dicha accin, etc...
En otras ocasiones, los datos disponibles no son de dicho tipo, sino de seccin
cruzada, es decir, recogen informacin acerca de distintas unidades estadsticas,
en un mismo instante de tiempo,
que tiene la misma naturaleza que los datos utilizados, es decir, ser bien una
serie temporal o una seccin cruzada de datos.
Un buen ajuste consiste en que los residuos sean lo menor posibles, si bien no
es evidente cmo medir el tamao de una variable aleatoria de este tipo.
58
10.1. Estimacin por mnimos cuadrados
Los datos disponibles pueden organizarse en la forma de una matriz X, de dimes-
ncin Txk o Nxk para las variables explicativas, y de un vector y, de dimensin
Tx 1 o Nx 1 para la variable dependiente. Asimismo, podemos considerar el vector
u, de dimensin Tx1 o Nx 1, que contiene las T (o N ) variables aleatorias corre-
spondientes a la perturbacin correspondiente a cada observacin muestral. Con
ellas, el modelo de regresin lineal puede escribirse,
y = XB + u
El estimador de mnimos cuadrados ordinarios se obtiene mediante la expresin
matricial,
= (X 0 X)1 X 0 y
que, como puede comprobarse, es un vector columna de dimensin kx1. Es,
por tanto, una transformacin lineal de la variable dependiente y. En ese sentido,
se dice que el estimador MCO es un estimador lineal.
Este estimador proporciona un buen ajuste a los datos, en el sentido de que
los residuos que genera proporcionan la menor suma de cuadrados posible. Es
conveniente utilizar criterios como el de la suma de los cuadrados de los residuos
porque estos pueden ser positivos o negativos, de modo que su suma directa no
debe utilizarse como criterio de bondad de ajuste.
En el caso de un modelo de regresin lineal simple,
yt = 0 + 1 xt + ut , t = 1, 2, ..., T
este estimador se convierte en,
Cov(xt , yt ) DT (yt )
1 = = xy , 0 = y 1 x
V ar(xt ) DT (xt )
por lo que el coeficiente de correlacin entre xt e yt est muy relacionado con
la estimacin de mnimos cuadrados de la pendiente de la recta de regresin. Sin
embargo, como puede verse, dicho coeficiente de correlacin debe corregirse por
la volatilidad relativa de variable dependiente e independiente. La pendiente del
modelo mide el efecto que una determinada variacin en xt tiene sobre yt . Si, por
ejemplo, la correlacin fuese perfecta (supngamos que de signo positivo), pero
la variable dependiente fuese el doble de voltil que la variable explicativa, el
coeficiente de correlacin sera 1, pero el coeficiente del model.
59
11. Propiedades del estimador de mnimos cuadrados.
Generalmente, estamos muy interesados en contratar hiptesis de distinto tipo: a)
si una variable explicativa contiene informacin significativa acerca de la variable
dependiente, b) si el coeficiente de imapacto de una determinada variable es igual
a 1, c) si dos variables explicativas tienen el mismo coeficiente, etc...
Sin embargo, aunque los coeficientes del modelo de regresin son constantes,
si bien desconocidas, sus estimaciones, por cualquier procedimiento que podamos
utilizar, son aleatorias, pues son funcin de la muestra que utilicemos, que es
aleatoria. Si el modelo que estamos estimando es correcto, como hemos de
suponer, la perturbacin aleatoria del mismo, ut , otroga naturaleza asimismo
aleatoria a la variable dependiente, yt . Esto significa que si cambiamos por ejem-
plo el perodo muestral que utilizamos en la estimacin, la realizacin de dicha
perturbacin, es decir, sus valores numricos, sern diferentes, con lo que las ob-
servaciones de yt tambin los ern, y la estimacin de los parmetros diferir de
la obtenida con otro perodo muestral. Asimismo, si cambiamos la frecuencia de
observacin de los datos, de diaria a mensual, por ejemplo tomando el ltimo dato
de cada mes, la muestra cambia, y con ella, las estimaciones de los coeficientes de
las variables explicativas en el modelo.
Siendo variables aleatorias, nos interesa que los estimadores tengan ciertas
propiedades deseables, lo cual depender del procedimiento de estimacin uti-
lizado, y de lasc aractersticas del modelo que estamos estimando. Las principales
propiedades en que podemos estar interesados son: insesgo, eficiencia y consis-
tencia.
El insesgo consiste en que la esperanza matemtica del estimador coincida
con el verdadero valor numrico del coeficiente que estamos estimando. Un esti-
mador eficiente es un estimador de mnima varianza. El procedimiento de mnimos
cuadrados proporciona el estimador lineal de mnima varianza, si bien pueden ex-
istir otros estimadores no lineales de varianza todava menor. Un estimador es
consistente si, al aumentar el tamao muestral, converge en probabilidad al ver-
dadero valor del parmetro desconocido que se est estimando. Se dice entonces
que su lmite en probabilidad es dicho parmetro. Bien podra ocurrir que el esti-
mador fuese sesgado en muestra pequeas, pero si es consistente, dicho sesgo ir
reducindose si ampliamos el tamao muestral.
El estimador de mnimos cuadrados no es siempre consistente. El estimador de
mxima verosimilitud lo es, pero siempre que la hiptesis acerca de la distribucin
de probabilidad en que se basa, sea correcta, sobre lo que no se puede tener
60
seguridad.
Por construccin, el estimador MCO proporciona aqul conjunto de valores
numricos para los coeficientes del modelo de regresin que generan unos residuos
cuya suma de cuadrados es menor. Como este es el criterio seguido para calcular
el estimador de mnimos cuadrados, tal propiedad es incuestionable, y caracteriza
a dicho estimador.
u = M u
1 1
M 0 M = M M = IT X (X 0 X) X 0 IT X (X 0 X) X 0 =
1 1 1 1
= IT X (X 0 X) X 0 X (X 0 X) X 0 + X (X 0 X) X 0 X (X 0 X) X 0 = IT X (X 0 X
61
Demostracin.- La primera parte es inmediata a partir de la propiedad anterior.
Para probar la segunda parte, tenemos,
V ar(
u) = E(uu0 ) = E(u0 M M 0 u) = E(u0 Mu) =
= tr(u0 Mu) = E(uu0 M ) = E(uu0 )M = 2u IT M = 2u M
Por tanto, incluso si el trmino de perturbacin del modelo tiene una estructura
de covarianzas sencilla, el vector de residuos tendr una matriz de covarianzas
bastante ms compleja. El vector de residuos tiene, al igual que el trmino de
perturbacin, esperanza matemtica igual a cero para cada observacin muestral.
= X 0 (y X(X 0 X)1 X 0 y) = 0
X 0 u = X 0 (y X )
62
Propiedad 7: El estimador MCO es insesgado
= E (X 0 X)1 X 0 y = E (X 0 X)1 X 0 (X + u) =
E()
= E + (X 0 X)1 X 0 u = + (X 0 X)1 X 0 E(u) = 0
0 0
= E E()
V ar() E()
= E =
0 1 0 0
= E (X X) X uu X(X 0 X)1 = (X 0 X)1 X 0 E (uu0 ) X(X 0 X)1 =
= (X 0 X)1 X 0 V ar (u) X(X 0 X)1 = (X 0 X)1 X 0 V ar (u) X(X 0 X)1
D = A (X 0 X)1 X 0
tenemos,
= D + (X 0 X)1 X 0 y = D + (X 0 X)1 X 0 (X + u) = DX++ D + (X 0 X)1 X 0 u
por lo que E = DX + . El estimador ser insesgado slo si la matriz
D satisface la propiedad DX = 0, que equivale a la propiedad AX = Ik .
Supongamos que se cumple esta propiedad. La matriz de covarianzas del
estimador es entonces,
63
0 h 0 i
1 0 0
= E
V ar()
0 1 0 0
= E D + (X X) X uu D + (X X) X
= 2u (X 0 X)1 + 2u DD0
1
N (, 2u (X 0 X) )
= + (X 0 X)1 X 0 u
i N ( i , 2u aii ) 1 i k
64
Demostracin.- Recordemos que la funcin de densidad de una varaible Normal
multivariante N (, ) de dimensin T es,
1 1 1 0 1
f () = exp
(2)T /2 | |1/2 2
65
que alcance dicha cota. El estimador M V de 2u es inferior a dicha cota, pero es
sesgado, como ya hemos dicho.
Este resultado es importante, por cuanto que implica que si, adems de los
supuestos ms bsicos, de tener esperanza cero y matriz de covarianzas escalar,
aadimos el supuesto de que el trmino de perturbacin sigue una distribucin
Normal, entonces el estimador MCO tiene las mismas propiedades que el esti-
mador MV. Ahora bien, sabemos que, bajo condicioens bastante generales, el
estimador MV es eficiente; es decir, no puede encontrarse otro estimador, lineal o
no lineal, que tenga una matriz de covarianzas menor que la del estimador MV. En
trminos del concepto de precisin que introdujimos en la Seccin XX, no puede
encontrarse un estimador de mayor precisin que el estimador MV.
En consecuencia, la utilizacin del procedimiento de mnimos cuadrados est
totalmente justificada bajo el supuesto de Normalidad del trmino de pertur-
bacin, y algo menos cuando tal supuesto no se establece. Evidentemente, no se
trata de que el investigador haga o no una hiptesis acerca del tipode distribu-
cin que sigue el trmino de perturbacin, sino de que se preocupe acerca de si el
supusto de Normalidad es aceptable Por eso es que los contrastes de normalidad
deben tener una cierta importancia en el anlisis emprico.o de regresin sera
igual a 2.
Si las variables explicativas no son deterministas, sino aleatorias, como cabe
esperar, entonces el clculo de las propiedades del estimador de mnimos cuadrados
es algo ms complejo, y sus propiedades varan. En general, el estimador ser
sesgado, pero ser consistente, salvo que alguna de las variables explicativas tenga
un comportamiento tendencial. Cuando aparecen tendencias, el estimador de
mnimos cuadrados es asintticamente insesgado y eficiente,
= ; lim V ar()
lim E() =0
T T
66
E(X 0 u) = E [E(X 0 u/X)] = E [EX 0 (u/X)] = E [X 0 E(u/X)] = E(0) = 0
E(/X) = E (X 0 X)1 X 0 y/X = E (X 0 X)1 X 0 (X + u)/X =
= E + (X 0 X)1 X 0 u/X = + (X 0 X)1 X 0 E(u/X) = 0
p lim =
0
Dado que la matriz XTX se compone de momentos muestrales de orden 2, la
existencia del lmite de dicha matriz requiere existencia de segundos momentos
para el vector de variables explicativas. La presencia de una tendencia, aun siendo
determinista, genera trminos del tipo,
PT 2 PT
t=1 t t=1 txit
;
T T
cuyo lmite no existir si las restantes variables xit tienen un comportamiento
estable alrededor de un nivel de referencia.
67
En presencia de variables explicativas estocsticas, el estimador M CO no tiene
distribucin Normal en muestras finitas incluso si u N(0T , 2u IT ). Por el con-
trario, bajo ciertas condiciones de regularidad, se tiene,
1
T ( ) N (0, 2u (X 0 X) )
d
mediante aplicacin del teorema central del lmite al caso en que el trmino
de perturbacin presenta la misma distribucin de probabilidad para todas las
observaciones, con esperanza nula y varianza finita, y las variables explicativas
satisfacen condiciones de existencia de moemtnos como la que antes discutimos.
68
dependiente, b) si el coeficiente de impacto de una determinada variable es igual
a 1, c) si dos variables explicativas tienen el mismo coeficiente, etc...
Para llevar a cabo contrastes de este tipo, necesitamos hacer alguna hiptesis
acerca de la distribucin de probabilidad del trmino de error o perturbacin del
modelo de regresin. Generalmente suponemos que dicho trmino sigue una dis-
tribucin Normal, si bien esto debe contrastarse utilizando los tests paramtricos
o no paramtricos apropiados. Como hemos visto en la seccin anterior, wbajo
ciertas condiciones tenemos,
1
N (, 2u (X 0 X) )
en cutyo caso, cada uno de los coeficientes del modelo sigue asimismo una
distribucin Normal,
i N ( i , 2u aii ) 1 i k
H0 : i = 0i
i 0i
p N(0, 1)
2u aii
H1 : i 6= 0i
69
H1 : i < 0i
,
H1 : i > 0i
La hiptesis de significacin de la variable xi , 1 i k consiste en contrastar
H0 : i = 0
H1 : i 6= 0
aunque tambin podra ser de una sla cola, si tenemos informacin a priori
restringiendo el signo de dicho coeficiente.
Sin embargo, el contraste de hiptesis no puede llevarse a cabo de este modo
porque desconocemos el valor numrico de la varianza del trmino de error. Puede
sin embargo estimarse, lo cual hacemos mediante la expresin,
SR
2u =
T k
Ahora bien, si sustituimos su valor terico por su valor estimado, las propiedades
estadsticas del contraste de hiptesis cambian. Concretamente, habremos de uti-
lizar la propiedad,
2u
(T k) 2 T k
u
Como consecuencia, tenemos que,
independiente de .
i i 0
2 ii
u a
q 2
tT k
(T k) u2 /(T k)
u
es decir,
i 0i
p 2 tT k
u aii
70
con lo que podremos llevar a cabo contrastes como los mencionados.
Especficamente al llevar a cabo contrastes de significacin, conviene que dis-
tinguir entre las situaciones en que no rechazamos la hiptesis nula de ausencia de
significacin de una determinada variable porque efectivamente, no tiene capaci-
dad explicativa, de aquellos casos en que no rechazamos la hiptesis nula porque la
estimacion del coeficiente asociado a dicha variable se lleva a cabo no una precisin
reducida. Baja precisin implica una varianza elevada para el estimador de dicho
coeficiente, con lo que el valor numrico del ratio que aparece en el estadstico t de
Student ser reducido, y posiblemente inferior al nivel crtico proporcionado por
las tablas. En definitiva, hay que distinguir entre los caos en que dicho ratio es
pequeo porque el numerador es pequeo, de los casos en que el ratio es reducido
porque su denominador es muy elevado.
Asimismo, conviene recordar que para rechazar una hiptesis nula, requer-
imos que la informacin muestral contenga evidencia significativa en contra de
la hiptesis nula y favorable a la hiptesis alternativa. Esta segunda condicin
suele olvidarse con demasiada frecuencia, pero es importante, especialmente en
contrastes de una cola. En el contraste de hiptesis
H0 : i = 0
frente a la alternativa,
H1 : i > 0
si obtenemos una estimacin puntual i = 3, 5 estaramos en una situacin en
que la evidencia muestral es contraria a la hiptesis nula, pero tambin es contraria
a la hiptesis alternativa. En tal caso, los mtodos estadsticos habituales para el
contraste de hiptesis nos llevarn a no rechazar la hiptesis nula, a pesar de que
la estimacin numrica del coeficiente puede considerarse elevada. Ello se debe
a que al establecer la hiptesis alternativa, no hemos considerado la posibilidad de
que dicho coeficiente tome valores negativos, seguramente por algun conocimiento
previo o alguna razn terica. No es que nosotros queramos o no rechazar H0 ,
sino que los pprocedimientos habituals nos llevarn a no rechazar dicha hiptesis.
En una situacin as, el investigador debera cuestionar las razones que le han
llevado a establecer una hiptesis alternativa como la que hemos presentado. Si
contina pensando que tal alternativa es razonable, deber desechar la muestra
que ha utilizado; por el contrario, el resultado de la estimacin podra en algunos
casos reconsiderar la hiptesis alternativa, establecindola en la forma H1 : i 6= 0,
y volver a contrastar la hiptesis nula H0 : i = 0 de nuevo.
71
Para llevar a cabo el contraste de hiptesis de una cola
H0 : i = 0i
frente a la alternativa,
H1 : i > 0i
0, 95 = P [ tn, ]
H0 : 1 + 2 = 5
72
z
N (0, 1)
DT (z)
que puede probarse que sigue una distribucin Fq,T k , siendo q el nmero de
restricciones que se contrastan.
Por ejemplo, si contrastamos las hiptesis,...
Para contrastar un conjunto de hiptesis lineales de la forma,
H0 : R = r
frente a la alternativa,
H1 : R 6= r
el estadstico,
0
0 1 0 1
R r [R(X X) R ] R r /q
Fq,T k
u0 u/(T k)
Utilizar este estadstico matricial es equivalente al ejercicio que hemos prop-
uesto arriba. De hecho, no es dificil ver en el corchete central de este estadstico
73
tipo F la matriz de covarianzas del vector de holguras, donde el parmetro 2u
se ha sustituido por su estimacin en el denominador. Estamos, por tanto, cal-
culando el tamao del vector de holguras, utilizando su desviacin tpica como
unidad de medida.
Por ltimo, en ocasiones pueden sustituirse en el modelo las regresiones que se
pretende calcular. En ese caso, otro modo equivalente de calcular el estadstico F
anterior consiste en comparar la suma de cuadrados de los residuos que se obtienen
en el modelo sin restringir y el modelo restringido, mediante el estadstico,
(SRR SSR) /q
SSR/(T k)
que es idntico al anterior y obedece, por tanto, a una distribucin de proba-
bilidad Fq,T k .
Otros estadsticos son,
(SRR SSR)
(T k) W ald
SRR
(SRR SSR)
(T k + q) M ultiplicadores de Lagrange
SRR
T (ln SRR ln SSR) Razon de verosimilitudes
74
En estas circunstancias, el estimador M CO ya no es el estimador lineal inses-
gado de mnima varianza.
yt = 0 + 1 x1t + 2 x2t + ut
yt = 0 + 22t + vt
Resulta sorprendente que, como puede probarse sin mucha dificultad, este
estimador coincide con el estimador de mnimos cuadrados ordinarios de 2 en
(10.4),
MCO
2 =
2
Lo que hemos hecho es extraer de x2t el efecto de x1t debido a la correlacin que,
en general, existir entre estas variables. As, el residuo 2t mide el componente
de x2t que no tiene nada en comn con x1t y, de hecho, tiene correlacin nula con
esta variable.
75
Este resultado se extiende al modelo ms general, (10.3), en el que si estimamos
la regresin auxiliar,
1t = x1t
0
2 x2t ...
k xkt , t = 1, 2, ..., T
yt = 0 + 11t + vt (14.4)
tedremos que la estimacin de mnimos cuadrados de 1 en (14.4) coincidir
con la estimacin de mnimos cuadrados de 1 en (10.3).
Supongamos por un momento que en un determinado anlisis, la variable
explicativa x1t tiene correlacin cero con el resto de las variables explicativas.
Entonces, en (14.3) los coeficientes estimados deberan ser prcticamente cero, al
igual que el coeficiente de determinacin de dicha ecuacin.En tal caso, el residuo
1t ser practicamente igual a x1t , 1t ' x1t , por lo que el modelo (14.4) ser
esencialmente,
yt = 0 + 1 x1t + vt (14.5)
Pero hemos dicho que la estimacin de mnimos cuadrados de 1 en esta re-
gresin coincide con la estimacin de mnimos cuadrados de 1 en (10.3). Por
tanto, cuando una variable explicativa est incorrelacionada con todas las dems,
su coeficiente puede estimarse igualmente bien en la regresin multiple completa,
o en la regresin simple de yt sobre esta nica variable.
Una segunda situacin en que se produce este mismo resultado es cuando la
correlacin muestral entre cada una de las variables explicativas e yt es cero. La
razn es que en tal caso, las estimaciones tericas de los coeficienets asociados a
cada una de estas variables sera cero, por lo que estimar el modelo (10.3) equivale,
al menos tericamente, a estimar (14.5).
Es interesante saber que neste resultado puede asimismo aplicarse a bloques de
variables. As, supongamos que en el modelo de regresin mltiple, las k variables
explicativas pueden agruparse en dos bloques, con la condicin de que ninguna
variable de un bloque est correlacionada con ninguna variable del otro bloque.
Permitimos, sin embargo, que variables de un mismo bloque estn correlacionadas,
76
positiva o negativamente entre s. Pues bien, en tal situacin, los coeficientes
asociados a las variables en el primer bloque pueden estimarse en una regresin
de yt unicmente sobre este subgrupo de variables explicativas, y lo mismo puede
decirse acerca de los coeficientes asociados a las variables en el segundo bloque.
1 X 2
n 2
Su2 Sy.123
2u =
ui = =
n 3 i=1 n3 n3
donde la notacin que hemos introducido enla ltima igualdad hace referencia
a que se trata de la suma residual que resjulta al estimar una regresin en que la
variable dependiente Y aparece explicada por x1 , x2 , x3 . La Suma Residual puede
expresarse,
n
X n
X n
X n
X n
X
2
Sy.123 = yi2 0 yi 1 yi x1i 2 yi x2i 3 yi x3i (15.1)
i=1 i=1 i=1 i=1 i=1
77
El coeficiente de determinacin mltiple se define,
2
2
Sy.123
Ry.123 =1
Sy2
78
experimentar respecto de X2 . Cuando hay ms de dos variables explicativas, las
posibilidades de definir coeficientes de correlacin parcial se multiplican.
En el caso de dos variables explicativas,
yt = 0 + 1 x1t + 2 x2t + ut
y1 y2 12
y1.2 = q
1 2y2 (1 212 )
y2 y1 12
y2.1 = q
1 2y1 (1 212 )
79
2 2 2
2
Sy.12 Sy.2 Sy.12
Ry1.2 = 1 2
= 2
Sy.2 Sy.2
2 2 2
2
Sy.12 Sy.1 Sy.12
Ry2.1 = 1 2 = 2
Sy.1 Sy.1
80
23
(x3t , x3t ) =
2 3
yt = 1 x1t + 2 x2t + ut
1. Que las variables explicativas del modelo de regresin estn altamente cor-
relacionadas significa que, en valor absoluto, su coeficiente de correlacin
(covarianza dividido entre producto de desviaciones tpicas) sea prximo a
b2
la unidad o, lo que es equivalente, que ac est prximo a la unidad. Esto
2
implica, evidentemente, que b es aproximadamente igual al producto ac.
81
4 6.2 6.2
V ar(X) = , Corr(x1 , x2 ) = p = . 98031
6.2 10 (4) (10)
tenemos una matriz de covarianzas entre estimadores MCO,
1
4 6.2 19. 231 11. 923
V ar( MCO ) = 3.0 =
6.2 10 11. 923 7. 6923
con,
DT ( 1 ) = 19. 231 = 4. 3853, DT ( 2 ) = 7. 6923 = 2. 7735
1. Por tanto, se produce una prdida de precisin en las estiamciones, al au-
mentar las desviaciones tpicas de los estimadores MCO. En este caso, por
tanto, estimamos con una baja precisin no porque existan variaciones en el
valor de los coeficientes, sino porque las variables asociadas estn altamente
correlacionadas, positiva o negativamente.
2. Como discutimos en la Seccin XX al hablar de los contrastes de hipte-
sis estadsticas, la prdida de precisin tiene implicaciones importantes en
cuanto a efectuar contrastes acerca de valores numricos con dichos coefi-
cientes, por cuanto que la menor precisin, que es equivalente a una mayor
varianza estimada termina plasmndose en intervalos de confianza ms am-
plios. Esto hace mucho ms fcil que el valor numrico que se contrasta en
una hiptesis nula simple caiga dentro de dicho intervalo, no rechnzadose,
en consecuencia, dicha hiptesis nula. En este caso, que mla hiptesis nula
no se rechace no se debe necesariamente a que el valor hipottico del coe-
ficiente sea muy similar al valor estimado, sino a que la desviacin tpica
asociada a este ultimo es muy grande, lo que puede ampliar el intervalo de
confianza asociado de manera muy importante. En definitiva, como vimos
en su momento, la menor precisin en la estimacin viene asociada a una
prdida de potencia en la contrastacin de hipotesis estadsticas.
3. Otra consecuencia de la correlacin entre variables explicativas es que la
correlacin entre coeficientes estimados, bac tendr signo contrario al de
la correlacin entre las variables explicativas x1 , x2 , y ser cercano a 1 en
valor absoluto. Si las variables explicativas estn positivamente correla-
cionadas, entonces los estimadores MCO de sus coeficientes asociados estn
negativamente correlacionados. En el ejemplo anterior,
82
11. 923
Corr 1 , 2 = p = . 98029
(19. 231) (7. 6923)
Ello quiere decir que, mientras que, a lo largo de la muestra, las dos variables
tienden a estar simultneamente por encima o por debajo de sus respectivas me-
dias muestrales, las estimaciones numricas de sus coeficientes estarn una por
encima de su media, y otra por debajo. Esto significa que el procedimiento tiende
a sobre-estimar uno de dichos coeficientes y a sub-estimar el otro, sin que, por
supuesto, sepamos cul de ellos est en cada situacin. Pero adems, que su
correlacin sea elevada implica que tendremos una seria dificultad
en distinguir
entre una coleccin de posibles pares de estimaciones 1 , 2 , que se distinguen
unas de otras porque las que tienen un valor mayor de 1 , tienen un valor inferior
de . Este es un problema que se conoce como de falta de identificacin en la
2
estimacin del modelo economtrico.
Como hemos visto, el efecto de la colinealidad es aumentar las varianzas de
los estimadores de mnimos cuadrados, as como sus covarianzas. En general, las
correlaciones entre coeficentes son asimismo elevadas. Esto significa no slo que
exista una tendencia a que cada coeficiente individual tienda a aparecer como
estadsticamente no significativo, sino que, adems, es difcil estimar numrica-
mente cada coeficiente por separado. Es lgico esperar que as sea: si dos variables
x2 y x3 estn positivamente correlacionadas, entonces las dos tienden a desviarse
en igual direccin respecto a sus medias muestrales. Por tanto, ambas tienden a
estar simultneamente por encima o por debajo de sus respectivas medias; por
consiguiente, la misma capacidad explicativa genera la combinacin 2 x2 + 3 x3
que la combinacin ( 2 + )x2 +( 3 ) x3 . Es decir, puesto que ambas variables
se mueven generalmente en igual sentido, existen proporciones y de ambas
variables que toman valores numricos muy similares, compensndose entre s. Por
consiguiente, ambas combinaciones tomarn aproximadamente los mismos valores
numricos. Como esta sustitucin entre las variables x2 y x3 puede llevarse a cabo
en cuanlquier cuanta, siempre que se respete la proporcin dada por /, identi-
ficar con precisin por separado los valores numricos de los parmetros 2 y 3
resulta muy difcil.
83
16.2. Deteccin de la colinealidad
Puesto que la colinealidad se refiere a la presencia de corficientes de correlacin
de elevados en magniotud entre las variables explciativas, nada mejor para detec-
tar esta situacin que examinar dichos coeficientes de correlacin en la muestra.
Aunque parezca sorprendente, hay distintos procediemitnos que deben seguirse,
pues son todos ellos de una enorme sencillez.
2. En segundo lugar, deben examinarse las nubes de puntos entre tales pares de
variables; como dijimos en su momento, un grfico tan simple como una nueb
de puntos nos proporciona una perspectiva muestral completa, a diferencia
del nico valor numrico proporcionado por un coeficiente de correlacin
muestral. por ejemplo, en una nube de puntos podemos percibir que lo que
aparece como un coeficiente de correlacion muestral slo moderado, se debe
a la existencia de ua submuestra, de reducida magnitud, enla que las dos
variables en cuestin se desconectan, existiendo en el resto de la muestra
una relacin estrecha entre ambas.
84
a travs de los residuos de cada regresin, cuyo examen nos proporciona el
componente de una de las variables explicativas que no est explicado por
la utilizada como variable explicativa en la regresin auxiliar.
85
Para establecer el ranking inicial, el investigador puede servirse de regresiones
parciales de la variable dependiente sobre cada una de las variables explicativas
originales. El R2 de dichas regresiones, las desviaciones tpicas residuales, as
como un examen grfico de los residuos de cada una de ellas, ser generalmente
suficiente para establecer dicho ranking. La nica dificultad en este anlisis surge
si hay duda entre dos variables acerca de cul de ellas asignar alguno de los
primeros lugares del ranking; esto sera importante, pues si dos variables tienen
una capacidad explicativa similar, elevada en ambos casos, entonces la variable
que resultase menos favorecida en la seleccin sera sustituda por lo residuos
en una regresin de dicha variable por la que se seleccion como prioritaria en
el ranking, y dichos residuos tendrn una capacidad explicativa muy reducida,
debido a que estas dos variables eran originalmente muy similares.
En otras palabras, si dudamos entre seleccionar x1t o x2t para ocupar el primer
lugar en el ranking.....
De este modo, alteramos la regresin inicial por otra,
yt = 0 + 1 x1t + 2 2t + 3 3t + ut (16.2)
donde 2t y 2t denotan los residuos de las regresiones auxiliares, (16.1) y
3t = x3t
0
1 x1t +
2 x2t , (16.5)
En esta regresin, el coeficiente de correlacin entre dos variables explicativas
cualesquiera es cero. Por ejemplo, si consideramos 2t y 3t , tenemos que 3t tiene
correlacin nula con x1t y con x2t , mientras que 2t es una combinacin lineal de x1t
y x2t ; en consecuencia, el coeficiente de correlacin entre 2t y 3t es igual a cero.
Por tanto, a diferencia de lo que ocurra en la regresin original, los coeficientes
estimados en (16.2) pueden interpretarse como el impacto, positivo o negativo,
que se tendra sobre yt si la variable asociada, digamos que 3t , aumenta en una
unidad.
La estrategia propuesta habra resuelto, por tanto, el problema de interpretacin
de los coeficientes individuales estiamdos; sin embargo, surge otra dificultad ev-
idente, y es que el investigador no est interesado en estimar el impacto que
sobre yt puede tener una variacin unitaria en 3t , sino en la variable original, x3t .
86
Sin emabrgo, no todo est perdido: supongamos que, una vez estimada (16.2) el
investigador dispone de datos yt , x1t ,x2t y x3t . Sustituira,
Componentes principales
17. Prediccin
Como mnimo, una variable puede predecirse a partir de su valor medio muestral.
87
18. Modelos univariantes de series temporales
18.1. Primeros conceptos
18.1.1. Procesos estocsticos
18.1.2. Funciones de autocorrelacin simple y parcial
18.2. Procesos autoregresivos, AR(p)
18.2.1. El modelo AR(1)
18.2.2. El modelo AR(2)
18.3. Procesos de medias mviles, MA(q)
18.4. Procesos mixtos, ARMA(p,q)
18.5. Procesos integrados ARIMA(p,d,q)
18.6. Prediccin con modelos univariantes
18.6.1. Prediccin con modelos AR(p)
18.6.2. Prediccin con modelos MA(q)
18.6.3. Prediccin con modelos ARMA(p,q)
18.6.4. Prediccin con modelos ARIMA(p,d,q)
18.7. Estimacin de modelos univariantes de series temporales
18.7.1. Estimacin de modelos autoregresivos
18.7.2. Estimacin de modelos de medias mviles
18.7.3. Estimacin de modelos ARMA(p,q) y ARIMA(p,d,q)
21. Simultaneidad
21.1. Identificacin
21.2. Estimacin de una ecuacin del sistema