Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Resumen Certamen 2
Resumen Certamen 2
Mtodos de estimacin
(i) Mnimos cuadrados ordinarios y Mxima verosimilitud requieren de
normalidad en su residual i N 0, 2 , (media cero y homocedasticidad), as como
que estn incorrelacionados, es decir, cov i , j 0
Matriz Varianzas y covarianzas MCO
2 0
0
2
2
I 0
0
0
0 2
g1
...
Matriz Varianzas y covarianzas Var G
g n
Situaciones de G:
G I 2 I
Presencia de heterocedasticidad
y G
*
1 / 2
G
*
Var ( ) G
*
1 / 2
Var ( ) G
1 / 2
x* G
,
1 / 2
1 / 2
1 / 2
1 / 2
Var ( * ) G
2 G G
y X
*
y V
Xb V
X '* X *
MCG X ' G 1 X
'*
X y
Como obtener V?
-
Cholesky
Jordan
X G y
'
G PP'
Con:
P
P 1 , 2 ,..., n
G PP' P
1/ 2
1/ 2
...
P' , resultando:
G VV '
De donde
1 / 2
P'
Cmo obtener G?
Si hay homocedsticidad y autocorrelacin, entonces las autocorrelaciones fuera de
la diagonal, se obtienen por proceso estocstico o serie de tiempo.
Si hay heterocedasticidad y autocorrelacin, entonces la matriz G es diagonal. Y
como obtenerlo se ver mas adelante.
'*
- Es insesgado pues E * 0 y MCG X X *
- Matriz de covarianzas es
Var
MCG
X
'*
X ' (V )'V
X ' G X
*
*
Var ( MCG ) 2 X ' X
Var MCG 2
- Es MELI
E MCG
Estimacin de 2
Conocer G es requisito para aplicar MCG, para su estimacin se debe saber como es
la heterocedasticidad o la autocorrelacin.
Conocer 2 no es requisito. Sin embargo este se puede estimar mediante:
2
i
n p 1
Observaciones
Los problemas de heterocedasticidad y de autocorrelacin pueden causar lo siguiente:
-
e Y Y
Con Y x b
b ( x' x) 1 x' y
e y I x( x' x) 1 x'
CME 1 mii
Observaciones atpicas
Una observacin es atpica si posee un residual demasiado grande, en valor absoluto.
Para determinar si una observacin es atpica o no se utiliza:
n p 1;1
CME 1 mii
n p 1;1
Normalmente se dice que los valores de t varan entre 2 y 2,5, por lo que si el
residual estudentizado en valor absoluto es mayor a 2,5, se declarara como atpico.
Si la cantidad de observaciones atpicas es muy grande, puede ocurrir un efecto
sistemtico en los datos, por lo que se debe modificar el modelo
Observaciones atpicas no influyentes: No se hace nada con ellos, dado que no
influyen en la estimacin.
Observaciones atpicas influyentes: Si se determina que por un error de
medicin o de determinacin de valores, se debe revisar los datos, y si se
detecta que los casos atpicos no son de inters, entonces se eliminan de la base
de datos. Si por el contrario se da que la variable de respuesta asuma valores
dentro de lo esperado, pero uno de los predictores es muy distinto de los dems,
no se puede sacar del modelo, dado que si lo explica.
Observaciones influyentes
Una observacin es influyente si al incluirla o no en el modelo cambia
significativamente uno o mas de los coeficientes betas (pendientes de la regresin).
Existen distintos mtodos para determinar si una observacin es o no influyente:
Distancia de Cook
Este mtodo considera la distancia o discrepancia entre, Yh Y( h ) , elevndolo al
cuadrado y estandarizndolo.
Yh
Y
(h)
Estimacin del punto h- simo, usando el modelo con todos los datos.
Estimacin de Yh usando el modelo con (n 1) observaciones.
Dh
rh2 mii
~ Fp 1,n p 1,
( p 1)(1 mii )
ri
CME 1 mii
[2,5;2,5]
DFBETA Y DFBETAS
Se utiliza cuando interesa determinar si una observacin h esta afectando a una
pendiente j en particular.
Determinacin:
i)
Se calcula la regresin con y sin la h sima observacin.
ii)
Se obtienen las pendientes para ambos casos.
iii)
Si las diferencias son muy prximas a cero, la observacin h sima no
es influyente.
DFBETA b jh b j (h)
iv)
Suponiendo que los residuales y estimadores b se distribuyen normal, la
diferencia estandarizada es:
b jh b j ( h )
DFBETAS
S*
Con S* como la desviacin tpica de modelo son la variable h sima.
v)
DFBETAS
b jh b j ( h )
t La diferencia es significativa y la
S*
observacin es influyente.
vi)
DFBETAS
2
N
i 4
FRAi
n 1
4
iv)
Se calcula para cada FRA, su valor Z, que se obtiene inversamente de la
distribucin N (0,1)
v)
Se calcula la correlacin (r) entre (ri) y Z y si:
r 0,95 Hay normalidad.
vi)
De lo contrario se aplica una dcima para las hiptesis de las
correlaciones, como la de Bartlett:
H0 : 0
Ha : 0
E
r n2
1 r2
~t
n p 1;1
; con N1 1 N n 1 n
1
2
Ni
i 0,3175
n 0,365
E r Li; Ls
De donde:
Comparacin de regresiones
Dado que a veces ocurren cambios estructurales en los modelos, a travs del tiempo,
se utiliza la dcima de Chow para determinar si los coeficientes betas de dos o mas
regresiones son iguales. Esta dcima se trata simplemente de una dcima F de
varianzas.
Requisitos:
i)
Los modelos deben tener las mismas variables en todos los grupos
ii)
Los modelos deben estar estimados con intercepto.
iii)
Los modelos deben tener residuales homocedsticos,
independientes entre los modelos y distribuirse normalmente.
* La normalidad de los residuales se asume.
Sean los modelos:
Yi 0 1 X 1i 2 X 2i ... p X pi i
Y j 0 1 X 1i 2 X 2i ... p X pi i
La hiptesis es:
Csum Ci
Cdif C Csum
Cdif
( p 1)
E
F p 1;n 2( p 1);1
Csum
(n 2( p 1))
SC ( fa ) ( y Yj ) 2
CM ( fa )
SC ( fa )
d
Procedimiento:
i)
Estimar el Modelo por MCO y obtener la suma de cuadrados de los
residuales (SCE)
ii)
Ordenar los datos correspondientes de menor a mayor en relacin a la
variable X, creando grupos de datos iguales y posteriormente sacar los promedios de
cada grupo ordenado en relacin al Y promedio.
iii)
Calcular Yii Y
iv)
Calcular
v)
ii
Regresin
Gl
p
SC
SC(R)
CM
CM(R)
Residual
Falta de ajuste
np1
dp1
SC(E)
SC(FA)
CM(E)
CM(FA)
Error puro
Total
nd
n1
SC(EP)
SC(T)
CM(EP)
Estadgrafo F
CM ( R)
CM ( E )
CM ( FA)
CM ( EP )
Heterocedsticidad
Corresponde a una violacin a los requerimientos de la estimacin de los parmetros
por MCO o MV, ya que invalida los resultados.
Se da cuando los residuales no tienen varianza constante e igual y puede presentarse
para uno o ms valores de un predictor o para todos los niveles de todas las variables
predictoras.
Causas
- Coyuntural, propia de la muestra, por ejemplo en la estimacin de ingreso versus
consumo, dado que se produce Heterocedsticidad debido a la gran diferencia que existe
en el consumo a distintos estratos socioeconmicos.
- Datos son promedios: Para que no exista Heterocedsticidad se deben utilizar muestras
con la misma cantidad de observaciones. Porque por ejemplo, en Consumo vs ingreso,
los datos brutos se pueden obtener de encuestas aplicadas en distintas regiones, por lo
que las varianzas dependen inversamente de los tamaos muestrales por regin, dado
que la varianza de un promedio es
2
n
- Omisin de variables: puede provocar que los residuales crezcan con la variable
omitida. Esta causa en un error de especificacin del modelo por lo que la
Heterocedsticidad es falsa o espuria.
Consecuencias de estimar por MCO cuando existe Heterocedsticidad
Estimadores siguen siendo insesgados y lineales, pero no son eficientes y dejan de
tener varianza mnima, es decir, no son MELI.
Deteccin por grficos
- Residuales puros versus variable predictora X:
La forma habitual es una cinta horizontal.
si posee forma de embudo, significa que las varianzas dependen proporcionalmente
de X, y se dice que las varianzas son de la forma i2 CX i
i2 CX i2
i2 CX i
i2 CX i e
Desventajas
Homocedsticidad
Procedimiento:
i)
Se ordenan las variables X de menos a mayor formando grupos con los
datos iguales.
ii)
De cada grupo se obtiene la varianza muestral de los residuales y k, que
es igual al nmero de variables por grupo.
iii)
Se define la varianza total mancomunada:
k
S2
iv)
1S i2
nk
Se rechaza la H0 si:
k
E n k ln S 2 ni 1 ln S i2 > k21;1
1
Desventajas
Hay que aplicarlo para cada una de las variables X, y en cada caso hay
que estimar dos veces, por cada uno de los grupos.
H 0 : i2 2
H a1 : KX i
2
i
H a 2 : i2 KX 12
Homocedsticidad
Heterocedsticidad
Por cul de las dos hiptesis alternativas se opta? Se debe hacer un grfico para
cada una:
Ha1 ei versus x
Procedimiento:
i)
ii)
iii)
iv)
v)
vi)
Se calcula el Estadigrafo E
vii)
CME1
CME 2
(Mayor/Menor)
E F( n1 p 1);( n 2 p 1);1
* Para eliminar la Heterocedsticidad se hace:
yi
xi
0
xi
1 x1
xi
2 x2
xi
...
p xp
xi
p xp i
yi 0 1 x1 2 x2
...
xi
xi
xi
xi
xi
xi
i
xi
Para H a1 : i2 KX i
Para H a 2 : i2 KX i2
Desventajas
H 0 : i2 Cte
Homocedsticidad
H a : Cte
Heterocedsticidad
2
i
Procedimiento I:
y x por MCO
i)
Estimar el modelo
ii)
iii)
SCR
del modelo calculado en iii
SCT
iv)
2
Obtener R 2 Raux
respectivo R 2
v)
2
Calcular estadgrafo E nRaux
vi)
E 21;1
O si Valor p de E es menor a , se rechaza la Hiptesis nula.
Procedimiento II:
i)
ii)
Considerar ei2 0 j x j j x 2j jk x j xk
p
j 1
j 1
iii)
iv)
2
Obtener el R 2 Raux
respectivo R 2
v)
2
Calcular Estadgrafo E nRaux
vi)
j k
SCR
(modelo calculado en iii)
SCT
4) Dcima de Park
Ventajas
Desventajas
H a : i2 kxi ei o bien H a : ln i2 ln k ln xi i
Procedimiento:
i)
ii)
iii)
Docimar:
Ho : 0
Ha : 0
iv)
con Xj
Una vez obtenidos los beta estimados, usando el modelo transformado, estas
estimaciones se remplazan en el modelo original para poder realizar las interpretaciones.
Por su parte las dcimas e inferencias respecto a los parmetros se hacen con el modelo
transformado.
Multicolinealidad
Matemticamente Varias variables son colineales si una combinacin lineal de todas
ellas vale cero, cuando al menos un beta es distinto de cero. Por lo que la variable X
puede escribirse como una combinacin lineal de todas las dems.
Econometra Corresponde a la existencia de una relacin lineal entre alguna o todas
las variables exgenas de un modelo de regresin, en trminos de la muestra. Por lo que
es un problema muestras ms que poblacional.
i) Corr( X i , X j ) 0
ii) 0 Corr( X i , X j ) 1
iii) Corr( X i , X j ) 1
Colinealidad perfecta.
Efectos de la Multicolinealidad
Dado que la colinealidad afecta al rango de X ' X , se produce un aumento de la
varianza de los estimadores por encima de lo que debiera ver, lo que a su vez trae otras
consecuencias:
Las dcimas t de student para los son insensibles (poco potentes)
Las observaciones se tornan influyentes, pues pequeos cambios en los
datos producen cambios en las estimaciones b .
i)
ii)
Deteccin de la Multicolinealidad
max
min
max
min
Cp* p *
Cp* p *
h
Otra forma de calcular Cp es:
Cp
(n p 1)(1 R p2* )
1 Rp
n 2p*
VIFh
1
1 Rh2
Si VIFh 1
Indica colinealidad
Ademas:
Rh2 0
VIF 0,5
Tol 0,2
La Multicolinealidad existe.
Si
Eliminacin de la Multicolinealidad
-
IV.- Autocorrelacin
Introduccin
La estimacin por MCO supone que los errores son variables aleatorias
incorrelacionadas, y por MV que son independientes.
En economa y negocios muchas de las aplicaciones de la regresin tienen que ver
con datos en forma de series de tiempo, lo que implica una correlacin en el tiempo.
Autocorrelacin Correlacin de los residuales consigo mismos, lo que ocurri en el
tiempo anterior afecta a lo de hoy. Siendo un problema potencialmente serio pues
invalida las dcimas de F y t
-
AR(1)
Yt x't t
t t 1 t
Yt x't 1Yt 1 t
ii)
AR(r)
(1)
Yt x't t
t = 1,2,
t t r t
t = r+1, r+2,
(2)
En los modelos (1) y (2) los residuales cumplen los requisitos de estimacin por
MCO, pues lo que es Autocorrelacin est siendo asumido por la presencia de la
variable endgena retardada o rezagada.
La variable rezagada sigue siendo aleatoria, sin embargo para propsitos de
estimacin, se dice que los valores son historia pasada y no se pueden cambiar; es decir,
a las variables Yt k se las trata pre-fijadas, igual que las exgenas.
Sin embargo lo habitual es la inseguridad, en un modelo AR(r), en cuanto a que
autocorrelaciones son significativas por lo que se utiliza el siguiente modelo:
t 1 t 1 2 t 2 ... t r t r t
Este modelo, puede tener adems intercepto y/o variables exgenas, de manera que su
expresin escrita puede ser bastante compliacada.
El modelo AR(1)
Corresponde al caso ms frecuente en econometra, se caracteriza porque se suele
ajustar muy bien a las observaciones, aunque el verdadero modelo sea ms complejo.
Si se sabe que el modelo corecto es AR(1), la estimacin por MCO de los parmetros
se puede realizar considerando el modelo a la fecha t y el modelo a la fecha t 1, para
luego determinar:
Causas
Existencia de tendencias
La presencia de tendencia se da
principalmente por errores sistemticos en el registro de la variable de
respuesta, o por que al medir variables en trminos nominales, estas
suelen presentar una tendencia al alza en el tiempo y si las variables
predictoras no explican esta tendencia, entonces el error si la incorporar
y presentar Autocorrelacin.
Existencia de ciclos Para un modelo AR(1) si:
i) 0 Un residual alto que genere un Y por encima de
promedio, tendr una alta probabilidad de ser seguido por un
residual alto, generando un Y tambin mayor que el promedio. Lo
anterior implica que en momentos de cambio de rgimen, un
residual alto seguido por un residual bajo, generan Y por encima
y debajo del promedio respectivamente, generando ciclos de
valores altos de Y, segidos de valores Y bajos.
Deteccin de la Autocorrelacin
Graficar los residuales vs el tiempo se debe obtener una banda
horizontal en torno a t = 0, si se obtiene una banda transversal es porque
hay Autocorrelacin.
Dcima de rachas
Dcima de Durbin y Watson Se utiliza para AR (1) y supone que:
i)
ii)
DW
t 2
t 1
t T
t 1
Donde
2
t
SCE
2
t
Hiptesis:
H0 : 0
H a1 : 0
H a2 : 0
Reglas de decisin:
i)
Si 0 DW DI
ii)
Si Ds DW 4 Ds
iii)
Si 4 DI DW 4
iv)
Si DI DW D s
v)
Si 4 Ds DW 4 DI
Eliminacin de la Autocorrelacin
1.- Caso es conocido El modelo se expresa como la diferencia entre las
observaciones en el perodo t y el perodo t 1 multiplicado por , es decir, se estima
un modelo que tiene una observacin menos y que satisface los requisitos de MCO
2.- Caso es desconocido: