Documentos de Académico
Documentos de Profesional
Documentos de Cultura
HETREOCEDASTICISDA
HETREOCEDASTICISDA
INTRODUCCIN
son
poco
representativos
resultara
ms
adecuado
utilizar
2)
(2.1)
Yi = + Xi
(2.2)
E(ui)=0
Condicin de Homoscedasticidad;
(2.3)
E( ui )=
2
(2.4)
E(ui, uj)=0
Condicin de Independencia;
(2.5)
E(Xi, uj)=0
3)
3.1.
LA CONDICIN DE HOMOSCEDASTICIDAD
Intuicin
Figura 1
Heteroscedstica
.4
0
0 .4
.3
0
0 .3
.2
0
0 .2
.1
0
Submuestra 1
0 .1
-4
-2
-4
-2
-4
0 .4
0.4
0 .3
0.3
0 .2
0.2
-2
0.1
0 .1
Submuestra 2
-4
-2
0 .4
0 .3
0. 4
0 .2
0. 3
0 .1
Submuestra 3
0. 2
0. 1
-4
-2
-4
-2
Figura 2
CONS
200
175
150
125
0 .4
100
0 .3
0 .2
0 .1
-4
-2
75
50
25
0.4
0.3
50
100
150
200
ING
250
300
350
0.2
0.1
-4
-2
3.2.
Planteamiento Matricial
(3.1)
Y1 1 X 11
M = M
M
Y1 1 X 1N
X 21
M
X 2N
L X ( K 1)1 0 u1
O
M M + M
L X ( K 1) N k U N
Ntese que se tienen que cumplir las condiciones de conformidad matricial para
que permitan resolver el sistema por el mtodo de MCO, para ello la matriz debe ser
invertible, en este caso se aade un supuesto adicional que los K vectores columnas
deben ser linealmente independiente. Este supuesto se conoce como ausencia de
multicolinealidad o condicin de rango.
El modelo matricial se escribe a continuacin, sin indicar sus dimensiones por
simplicidad, como:
(3.2)
Y = X +U
5
(3.3.)
E(U)=0
(3.4)
E(UU')=2
Donde es una matriz definida positiva. Aun cuando se supone todava que las
perturbaciones estn incorrelacionadas entre observaciones, es decir, la covarianza
entre los errores son nulas (supuesto que se levanta cuando se estudia los
problemas de autocorrelacin serial) y slo en la diagonal principal de la matriz
existen valores, por lo tanto, se puede expresar la ltima matriz como:
0 L
0
1
0 L
M
2
2
=
L
L O
M
L
M N
0
(3.5)
(3.6)
i2 = 2 i
(3.7)
b =+ ( X X ) X'U
1
Siendo insesgados dado que E(U)=0 y por tanto E(b)=; pero su matriz de
varianza y covarianza sera ahora.
(3.9)
Var(b) =E {( ( X X ) X'UU'X ( X X ) }
(3.10)
Var(b) = 2 { ( X X ) X'X ( X X ) }
1
4)
CAUSAS
Para ver otros ejemplos vase a: Kamenta, 1977, Dougherty, 1992, Gujarati, 1997, Hair et al., 1999; entre otros.
Razones de escala
Distribucin espacial
Mtodo Grafico
1500
E2
1000
500
-500
25
50
75
100
125
YF
150
175
200
225
Al igual que los hogares, las empresas con mayores ganancias pueden
tener una mayor variabilidad en su comportamiento en cuanto a sus polticas
de dividendo, las empresas con una poltica de crecimiento tendran una mayor
variabilidad en sus tasas de crecimiento que empresas ms conservadoras
que prefieren mantener sus posiciones.
4.5.
Mejoras en la Informacin
En la medida que mejoran los sistemas de procesos y de recoleccin de
datos, adems de las tcnicas para explorar y utilizar con mayor eficiencia los
mismo, es posible que se reduzca las variabilidades de las perturbaciones en
las estimaciones.
4.6.
Observaciones Influyentes
Son observaciones que caen fuera de las pautas generales del conjunto
de datos o que ejercen una fuerte influencia en los resultados de la regresin.
Si no existen errores de diseo, ni de recoleccin de los datos, estas
representan los elementos diferenciadores del conjunto de datos y por tanto
no deben ser excluida aunque la inclusin o exclusin de esta (estas)
observacin (observaciones) puedan alterar sustancialmente los resultados
del anlisis de regresin, especialmente en los casos de muestras pequeas.
Estas observaciones deben identificarse para estudiar su impacto y considerar
su posible causa, entre las cuales se debe evaluar las siguientes:
a) Un error en la entrada de observaciones o datos
b) Una observacin valida pero excepcional que es explicable por una
situacin extraordinaria
c) Una observacin excepcional sin una explicacin plausible
d) Una observacin ordinaria en sus caractersticas individuales pero
excepcional en su combinacin de caractersticas.
En el caso a) se debe corregir la observacin o eliminar, en el caso b)
se debe considerar en el modelo la causa extraordinaria valida, tal vez; a
10
del modelo de
regresin.
4.7.
Problemas de Especificacin
Este problema hace referencia a la inclusin de variables irrelevantes o
a la omisin de variables relevantes o a la forma funcional elegida o a los
errores de medida lo cual puede afectar la varianza.
Aunque la inclusin de variables irrelevantes no sesgue el resultado de
las otras variables independientes, tiene cierto impacto sobre los resultados ya
que, por un lado, reduce la parsimonia del modelo y por la otra, las variables
adicionales pueden enmascarar o desplazar los efectos de variables ms
tiles y por ltimo, hace que las contrastaciones de la significacin estadstica
de las variables relevantes sea menos precisa en su significancia practica. En
el caso de los errores de omisin son ms difciles de considerar ya que no se
puede evaluar lo que no se ha incluido, slo resta de contar con un soporte
terico y practico del asunto bajo estudio.
Cuando se elige una forma funcional inadecuada existe procedimientos
de bsqueda pero un primer indicio lo da el anlisis grafico de los residuos.
Los errores de medida afectan tambin a las variables independientes ya que
reduce su poder predictivo en la medida que aumenta el error de medida. El
modelo de regresin no tiene mtodos directos para corregirlos pero si se
sospecha del problema se debe considerar la posibilidad de utilizar modelos
estructurales o variables instrumntales.
En general, la heteroscedasticidad surge con mayor probabilidad en datos de
corte transversal o en encuestas que en las series de tiempo ya que se tratan con
una poblacin en un momento a travs de un espacio que pueden originar una
variabilidad fuerte con un patrn sistemtico que afecta la constancia de la varianza.
11
5)
CONSECUENCIAS
6)
CORRECCIN
6.1.
La Matriz de Transformacin
Supngase ahora que s premultiplica el modelo descrito en la ecuacin (3.2)
(6.1)
TY=TX+TU
Donde cada elemento del Vector TY ser una combinacin lineal de los elemento de
Y, siendo lo mismo para los otros vectores, con esta transformacin si se utiliza los
MCO se obtendra estimaciones consistentes de los parmetros y de la matriz de
varianzas como
(6.2)
bg= (X'T'TX)-1X'T'TY
(6.3)
Var(bg)=2(X'T'TX)-1
6.2.
simple como el de (2.1) y que ser extensible al modelo matricial adems permitir
comprender los mtodos de deteccin.
(6.4)
Yi = + Xi + ui
13
(6.5)
(6.6)
(6.7)
Supuesto 1
Se asume que la varianza del error es proporcional al cuadrado de la variable
2
explicativa; E(ui) = Xi .
Se utiliza la siguiente transformacin:
(6.8)
Yi
u
=
+ + i
Xi Xi
Xi
(6.9)
Xi
+ + i
(6.10)
Yi
u
=
+ Xi + i
Xi
Xi
Xi
(6.11)
Ahora se tiene
Xi
+ X i + i
15
(6.12)
Yi
u
X i
=
+
+ i
E [Yi ] E [Yi ] E [Yi ] E [Yi ]
(6.13)
X i
E [Yi ] E [Yi ]
+ i
(6.14)
Yi X i ui
= +
+
Yi Yi
Yi
Yi
=
(6.15)
Yi
X i
Yi
+ i
(6.16)
E ( i ) = i2 = 2 i
2
16
dependiente,
6.3.
Un ejemplo.
A continuacin se muestra un ejemplo con el programa LIMDEP , en un
Ramrez; D. & R Helo y C. Rivera (2000)Evaluacin de bienes ambientales que no se transan en el mercado:
Caso delfines Nariz de Botellas Islas de Choros, IV Regin. . Universidad Catlica del Norte, Coquimbo, Chile.
17
Namelist
REGRESS
Significativos
al 5%
CREATE
REGRESS
; W = 1 / BX ^ 2 $
;
Lhs = Y ;Rhs = X ; Wts = W ;res=E; Keep = BX $
18
+-----------------------------------------------------------------------+
| Ordinary
least squares regression
Weighting variable = W
|
| Dep. var. = Y
Mean=
355.0380144
, S.D.=
405.6342111
|
| Model size: Observations =
282, Parameters =
7, Deg.Fr.=
275 |
| Residuals: Sum of squares= 21594882.94
, Std.Dev.=
280.22642 |
| Fit:
R-squared= .532937, Adjusted R-squared =
.52275 |
| Model test: F[ 6,
275] =
52.30,
Prob value =
.00000 |
| Diagnostic: Log-L = -2344.3117, Restricted(b=0) Log-L =
-2451.6538 |
|
LogAmemiyaPrCrt.=
11.296, Akaike Info. Crt.=
16.676 |
| Autocorrel: Durbin-Watson Statistic =
1.80280,
Rho =
.09860 |
+-----------------------------------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |t-ratio |P[|T|>t] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Constant 1030.359296
157.12548
6.558
.0000
CD
149.9108487
70.380422
2.130
.0341 .86155350
PVI
404.6595845
164.11495
2.466
.0143 .10905988E-01
SEXO
-268.8388319
51.654338
-5.205
.0000 .39036270
EDAD
-16.02714786
2.3355126
-6.862
.0000 48.403722
EDUC
32.94264757
8.5668900
3.845
.0001 5.2204400
ING
-.1163879946E-02 .27470142E-03
-4.237
.0000 86046.301
En esta ltima salida puede verse que todos los parmetros eran significativos
al 95% de confianza (5% de error tipo uno) y como puede verse la varianza
estimada, comparando con la primera salida, obtenida con la estimacin corregida de
los regresores fue en unos casos sobrestimada o subestimada en la primera salida y
el
signo
del
parmetro
de
ingreso
cambio.
Todos
los
parmetros
son
7)
DETECCIN
Anteriormente
19
Mtodos Deteccin
Ex - ante
Grficos
e
intuitivos
Ex - post
Mtodos
Comprobato rios No Constructi vos
Constructi vos
Las pruebas no constructivas poseen una mayor potencia estadstica que los
mtodos constructivos pero tienen la desventaja de no describir el tipo de proceso el
cual debe ser extrado para resolver el problema de los datos.
Se ejemplificara los diversos mtodos
consumo. Las instrucciones listadas son realizadas con el programa4 Limdep 7.0, y
tambin se incluyen ejemplos de pruebas con el programa5 Eviews 3.1.
7.1.
Mtodos Informales
4
5
20
21
225
200
175
150
125
100
75
50
25
50
100
150
200
250
300
350
la
Para el uso de esto diagramas de normalidad se recomienda revisar la obra de Hair, Anderson, Tatham y Black,
(1999). Estos diagramas hoy en da se encuentran en todos los programas de uso estadstico como el SPSS ,
ademas del LIMDEP 7.0 y el Eviews 3.1
22
12
Histogramfor Variable C
0.4
Fr e qu en cy
9
0.3
6
0.2
0.1
-4
-21
04
Bin
7 2 8u 9
0.4
F requenc y
6
0.3
4
0.2
-4
0.1
1-2 2
40 5
Bin
2
8
u9
23
Quantile
213
163
113
63
13
13
416
63
113
163
213
262
Quantile
N-Q_plot of C
vs. N( 131.7300, 49.3916)
Y
Quantile
329
241
153
65
-23
-23
65
N-Q_plot of Y
153
241
329
416
Quantile
vs. N( 187.5000, 87.3212)
24
z asimetra =
la
asimetra
se calcula como:
Skewness
. Donde N es el tamao de la muestra. Tambin se puede
6/ N
Kurtosis
. Si el valor de la z calculada excede al valor crtico de
24 / N
N K
2
Skewness 2 + 14 (Kurtosis 3) . Donde N es
6
Anlisis Ex-post
El anlisis expost se realiza con los residuos de la regresin realizada.
25
1500
U2
1000
500
-500
25
50
75
100
125
CE
150
175
200
225
7.2.
Mtodos Formales
Como se sealo, en los mtodos formales se trabaja con dos tipos:
26
7.2.1.1
Prueba de Levene
La prueba de Levene8(1960) o de homogeneidad de varianza, contrasta
hasta que punto los distintos niveles del factor tiene una varianza homognea
en la variable dependiente. Tiene la ventaja de no ser tan exigente respecto a
la distribucin de normalidad de la variable dependiente. En este caso la
variable dependiente ser el error al cuadrado9 y la variable por la cual se
categoriza (factor) es la variable dependiente o cualquiera de las variables
explicativas de la regresin. El valor se obtiene calculando para cada sujeto la
diferencia en valores absolutos entre la puntuacin y la media del grupo o nivel
del factor y realizando despus un ANOVA con estas diferencias. Se contrasta
con una prueba F bajo la hiptesis nula de Homoscedastidad.
Esta prueba se encuentra en el men de varios programas especialmente en SPSS y en el Eviews. Tambin
existe otra prueba de contraste de homogeneidad de la varianza de Kendall y Stuart (1961) descrita por Johnston
(1987) es parecida a la prueba de Levene.
9
Tambin se puede utilizar para la variable original o transformada en valor absoluto u otra transformacin
montona si lo que se quiere probar es la varianza de la misma y no del error.
27
Tabla 1
Prueba de Levene
F 5%tabla(3,56) =2.769
28
7.2.1.2
Goldfeld-Quandt (G-Q)
del
segundo
grupo
(SCR2).
Bajo
la
hiptesis
nula
de
Ho: 1=2
Ho: 12
29
(7.1)
FC =
30
7.2.1.3
Breusch-Pagan-Godfrey (BPG)
(7.2)
Y=X+U
Donde las perturbaciones ui se distribuyen como una normal, con una varianza no
constante.
(7.3)
i2 = h( zi )
Vase a Johsnton (1989) quien cita a Harvey y Phillips (1973) quienes realizaron experimentos para validar la
robustez y potencia de las pruebas de contraste del supuesto de Homocedasticidad.
31
)2
)
u i2
ii)
iii)
i =1
v)
auxiliar y
2
p-1;
se
32
Create; GI=U2/VMV$
? Estima la regresin auxiliar
REGRES; LHS=GI ; RHS= ONE, Y; Res=e; Keep=GIE$
? Calcula la Suma de cuadrados explicada
Matrix; List; XCX=GIE'*GIE$
Calc; List; SCE=XCX-NGI$
? Estima el Estadstico
CALC; List; TBPG=0.5*(SCE)$
? Calcula el valor en Tabla
Calc; List; Ctb(.95, KREG-1)$
Con la muestra de 60 datos sobre consumo-ingreso del ejemplo, se obtiene
que la suma cuadrada explicada es de: SCE=68.63 y el estadstico de BreuschPagan y Godfrey es: =34.315; para una Chi cuadrada de tabla con un grado de
libertad y 95% de confianza (21=3.84<=34.315) se rechaza la hiptesis nula de
Homocedasticidad. Es un grado de libertad ya que slo hay una variable explicativa
en la regresin auxiliar. Las salidas de las tres ltimas lneas se muestran a
continuacin:
Calc; List;
SCE
CALC; List;
TBPG
Calc; List;
Result
7.2.1.4
SCE=XCX-NGI$
= .68630387375018730D+02
TBPG=0.5*(SCE)$
= .34315193687509360D+02
Ctb(.95, KREG-1)$
= .38414591508300020D+01
Prueba de White.
(7.4)
W =
N
N
( X ' X )1 ui2 xi xiT ( X ' X )1
N k
i =1
33
V = 2 [ X ' X ]
(7.5)
Donde la varianza de los errores de la regresin por MCO ( 2 ) esta dada por;
2 = ui2 ( N k )
(7.6)
11
12
Y = + X
i
1i
2i
+ ui .
Si el modelo tiene variables dummy y censuradas se omite los productos cruzados y algunos cuadrados.
En el Eviews se construye una prueba de White usando las distribuciones F y Chi.
34
y los
u = + X + X
2
1i
+ 3 X 2i X 1i + 4 X 1 + 5 X 2 + i ;
2
2i
f) 2TW=N-R2aux~2(Kaux-1)
g) Si el Chi cuadrado calculado es mayor que el Chi cuadrado de tabla
dado el nivel de Error Tipo I13, se rechaza la hipotes nula de
homoscedasticidad.
Al construir la prueba debe tenerse en cuenta si hay variables explicativas
dicotmicas o "dummies" ya que los productos cruzados pueden crear una
multicolinealidad artificial en la regresin auxiliar.
13
Por convencin se utiliza el 5% o 1% de error tipo I esto arroja un 95% a un 99% de nivel de confianza-
35
7.2.2.1
Glejser
explora la naturaleza de la
i = + Z i + i
(7.7)
gamma
()
es
el
parmetro
que
mide
el
grado
de
36
Tabla 2
Prueba de Glejser para valores de -1, -1/2 , 1/2 y 1.5
Coeff.
t-ratio
R^2
Amemiya
Akaike
Constante
Y^-1
-
13.212
613.731
8.127
3.353
16.2%
3.961
6.799
Constante
Y^-(1/2) -
19.547
132.629
6.494
3.771
19.7%
3.919
6.757
Constante Y^(1/2)
5.866
1.099
1.650
4.233
23.6%
3.869
6.707
Constante
Y^(1.5)
3.031
0.002
1.825
4.054
22.1%
3.888
6.726
El listado de instrucciones
/* Prueba de Glejser
Se ajusta un modelo utilizando los valores
de gamma = -1 , -1/2, 1/2, 1,5
*/
? Regresion inicial
Regress; Lhs=C; Rhs=one, Y ; Res=U; Keep=YE$ GLEJSER
? Valor absoluto de la desviacin
Create; AU=Abs(U)$
? Variables de las regresiones auxiliares
Create; Z1=Y^(-1); Z2=Y^-(1/2); Z3=Y^(1/2); Z4=Y^(1.5)$
Regress; Lhs=AU; Rhs=one, Z1 $
Regress; Lhs=AU; Rhs=one, Z2 $
Regress; Lhs=AU; Rhs=one, Z3 $
Regress; Lhs=AU; Rhs=one, Z4 $
7.2.2.2
Park
(7.8)
i2 = 2 Z i e
37
(7.9)
ln ui2 = ln 2 + ln Z i + i
38
19.9 22.3
31.2 32.3
31.8 36.6
12.1 12.1
40.7 42.3
6.1
38.6 44.7
25.5 26.1
10.3 10.3
10
38.8 40.2
11
12
33.1 34.5
13
33.5 38
14
13.1 14.1
15
14.8 16.4
16
21.6 24.1
17
29.3 30.1
18
25
19
17.9 18.2
20
19.8 20.1
6.2
8.1
28.3
39
BIBLIOGRAFA
40