Formación Bruta de Capitali = f(Ventasi) + ei
FBKi = a + b Vi + ei
Empresa FBK Ventas Pronóstico Residuos Residuos
Mínimos Cuadrados Ordinarios
para Y absolutos
1 29.3 135 29.8 -0.455 0.455
2 31.5 150 31.0 0.505 0.505 Estadísticas de la regresión
3 43.2 300 43.4 -0.192 0.192 Coeficiente de correlación múltiple 0.99
4 36.9 225 37.2 -0.293 0.293 Coeficiente de determinación R^2 0.99
5 32.7 170 32.6 0.052 0.052 R^2 ajustado 0.99
6 43.2 310 44.2 -1.018 1.018 Error típico 0.73
7 42.9 285 42.2 0.748 0.748 Observaciones 30
8 30.2 145 30.6 -0.381 0.381
9 39.1 250 39.3 -0.159 0.159 ANÁLISIS DE VARIANZA
10 30.5 140 30.2 0.332 0.332 gl Sum cuad Prom cuad F Valor crítico de F
11 42.8 280 41.7 1.061 1.061 Regresión 1 1048.486 1048.486 1989.931 0.00000
12 32.8 180 33.5 -0.674 0.674 Residuos 28 14.753 0.527
13 36.3 215 36.4 -0.067 0.067 Total 29 1063.239
14 37.4 235 38.0 -0.620 0.620
15 37.9 230 37.6 0.294 0.294 Coeficientes Error típico Estadístico t Probabilidad
16 44.9 315 44.6 0.269 0.269 Intercepción 18.60 0.446 41.741 0.00000
17 45.9 330 45.9 0.029 0.029 Ventas 0.08 0.002 44.609 0.00000
18 45.8 345 47.1 -1.311 1.311
19 41.2 260 40.1 1.114 1.114
20 35.1 200 35.1 -0.027 0.027
21 28.7 120 28.5 0.185 0.185
22 38.1 250 39.3 -1.159 1.159
23 49.3 355 47.9 1.363 1.363
24 31.9 165 32.2 -0.334 0.334
25 37.8 245 38.8 -1.046 1.046
26 31.5 150 31.0 0.505 0.505
27 27.6 100 26.9 0.738 0.738
28 35.7 205 35.5 0.160 0.160
29 40.8 278 41.6 -0.773 0.773
30 46.2 320 45.0 1.155 1.155
Métodos Graficos de detección
400
Gráfico de dispersión Residuos
2.000
FRK y Ventas
350
1.500
300 1.000
250 0.500
0.000
200
11
13
15
17
19
21
23
25
27
29
-0.500
150
-1.000
100
28 33 38 43 48 53 -1.500
2.000 Gráfico de dispersión
|residuos| y ventas
1.500
1.000
0.500
0.000
-0.500
-1.000
99 149 199 249 299 349 399
Test para detectar heterocedasticidad: Prueba de Spearman Filosofia del test:
La variable sospechosa (supongamos es X1) de producir heterocedasticidad, debería
Series originales Series ordenadas provocar un crecimiento del residuo al mismo ritmo que ella va creciendo.
Por eso si ordenamos de > a < a la variable sospechosa y al valor absoluto del
Puesto Ventas (X) Residuos Ventas (X) puesto Residuos puesto d d2 residuo, X1 y | e | , en caso de existir efectivamente heterocedasticidad por X1, el
absolutos original (1) absolutos original (2) (1-2) cambio de puesto en ambas y para cada una de las observaciones debiera coincidir con
el cambio respecto al puesto original.
1 135 0.455 100 27 0.027 20 7 49
En la medida que los cambios no coincidan se puede hablar de movimientos no
2 150 0.505 120 21 0.029 17 4 16 correlacionados.
3 300 0.192 135 1 0.052 5 -4 16 Como la correlación esta entre -1 y 1, Spearman propone un grado de correlación entre
el cambio en el puesto respecto al original de cada una de las variables a partir de la
4 225 0.293 140 10 0.067 13 -3 9 diferencia entre el nuevo puesto y el original.
5 170 0.052 145 8 0.159 9 -1 1 Donde d= puesto original - puesto ordenado
6 310 1.018 150 2 0.160 28 -26 676
7 285 0.748 150 26 0.185 21 5 25 n
8 145 0.381 165 24 0.192 3 21 441 6 ∑ d 2i
9 250 0.159 170 5 0.269 16 -11 121 i=1
10 140 0.332 180 12 0.293 4 8 64
r=1− 2
n( n −1 )
11 280 1.061 200 20 0.294 15 5 25
12 180 0.674 205 28 0.332 10 18 324 Una coincidencia máxima daría lugar a 1 (porque las
distancias serían 0)
13 215 0.067 215 13 0.334 24 -11 121
Una distancia máxima, daria lugar a 0
14 235 0.620 225 4 0.381 8 -4 16
15 230 0.294 230 15 0.455 1 14 196
16 315 0.269 235 14 0.505 2 12 144
Se puede demostrar que este estadistico tiende a una t-
17 330 0.029 245 25 0.505 26 -1 1 student, entonces podemos valorar el rango y decidir si
18 345 1.311 250 9 0.620 14 -5 25 es o no grave la correlación. Si Existe correlación,
entonces hay heterocedasticidad
19 260 1.114 250 22 0.674 12 10 100
20 200 0.027 260 19 0.738 27 -8 64
21 120 0.185 278 29 0.748 7 22 484
22 250 1.159 280 11 0.773 29 -18 324 Ho: la correlación no es significativa (homocedasticidad)
23 355 1.363 285 7 1.018 6 1 1
r = 0.158
r √ N−2
24 165 0.334 300 3 1.046 25 -22 484
25 245 1.046 310 6 1.061 11 -5 25
→ t n−2
26
27
150
100
0.505
0.738
315
320
16
30
1.114
1.155
19
30
-3
0
9
0 √ 1−r 2
28 205 0.160 330 17 1.159 22 -5 25 t empírica= 0.845
29 278 0.773 345 18 1.311 18 0 0 t tabla = 2.048
30 320 1.155 355 23 1.363 23 0 0
suma 3786 Conclusión: No rechazo la Ho dado un nivel de
N=30 significación del 0.05, entonces concluyo que hay
evidencia de heterocedasticidad en el modelo que tendrá
consecuencias sobre la eficiencia de los estimadores
Test para detectar heterocedasticidad: Test de Goldfeld y Quant
Observación: solo sirve si suponemos que la heterocedasticidad modela una relación positiva
Suponemos que se da:
s2i = s2 X2i
Pasos:
1- ordenar ascendentemente las observaciones según X
2- Omitir c observaciones centrales (generalmente usamos 25% central) obtenemos dos grupos con (N-c)/2 observaciones cada uno
3- Correr el modelo en cada uno de los grupos guardandonos las sumas de los residuos al cuadrado de cada uno
4- Calculo el siguiente estadistico
SCRmayores /( N−c−2k)/2
λ= → Falignl¿ ( (N−c−2k )/2,( N−c−2 k)/2) ¿ ¿ ¿
SCRmenores /( N−c−2k)/2
Ordenamos las X ascendentemente
H0: No hay diferencia entre la SCR (homocedasticidad)
Empresa FBK Ventas
1 27.6 100 SCR mayores = 10.72
2 28.7 120 SCR menores = 1.60
3 29.3 135 (30-7-2*1)/2 = 11
4 30.5 140
5 30.2 145 F empírico = 6.71
6 31.5 150 F tabla = 2.82
7 31.5 150
8 31.9 165
9 32.7 170
10 32.8 180
11 35.1 200
12 35.7 205
13 36.3 215
14 36.9 225
Elimino aproximadamente
15 37.9 230 25% de las observaciones
16 37.4 235
17 37.8 245
18 39.1 250
19 38.1 250
20 41.2 260
21 40.8 278
22 42.8 280
23 42.9 285
24 43.2 300
25 43.2 310
26 44.9 315
27 46.2 320
28 45.9 330
29 45.8 345
30 49.3 355
Test para detectar heterocedasticidad: WHITE
Test de White, intenta detectar la existencia de un comportamiento heterocedastico en los residuos.
Para ello utiliza una regresión auxiliar, donde regresa los residuos al cuadrado contra todas las vbles.
FBK FBK Error Error Ventas Ventas explicativas y todos sus posibles productos cruzados.
pronost cuadrado cuadrado Si el modelo original es:
29 29.75 -0.45 0.21 135 18,225
Yt = b1 + b2 Xt + b3 Zt + et
32 30.99 0.51 0.26 150 22,500
43 43.39 -0.19 0.04 300 90,000 La regresión auxiliar será:
37 37.19 -0.29 0.09 225 50,625 e2t = b0 + b1 Xt + b2 Zt + b3 X2t + b4 Z2t + b5 Xt Zt + vt
33 32.65 0.05 0.00 170 28,900
-1.02 1.04 310 96,100 donde vt es el términos de error de la regresión auxiliar que cumple con los supuestos de
43 44.22 E(v)=0, Var(v)= homocedástica, el modelo está bien especificado.
43 42.15 0.75 0.56 285 81,225
30 30.58 -0.38 0.15 145 21,025 El estadístico es: n.R2 y se distribuye como un Chi-cuadrado de (k-1) gl [si incluimos al intercepto]
39 39.26 -0.16 0.03 250 62,500 Si nR2 > c(k-1) rechazo la H0 de homocedasticidad y el modelo original presenta evidencia de varianzas no
31 30.17 0.33 0.11 140 19,600 constantes (es decir, es heterocedastica).
43 41.74 1.06 1.13 280 78,400
33 33.47 -0.67 0.45 180 32,400
36 36.37 -0.07 0.00 215 46,225
37 38.02 -0.62 0.38 235 55,225 En nuestro ejemplo…
38 37.61 0.29 0.09 230 52,900
45 44.63 0.27 0.07 315 99,225 H0: la correlación no es significativa (homocedasticidad)
46 45.87 0.03 0.00 330 108,900
46 47.11 -1.31 1.72 345 119,025 Regresión Auxiliar:
41 40.09 1.11 1.24 260 67,600 Coeficientes Error típico Estadístico t Probabilidad
35 35.13 -0.03 0.00 200 40,000 Intercepción 0.9901 0.8911 1.1110 0.2764
29 28.52 0.18 0.03 120 14,400 Ventas -0.0100 0.0082 -1.2181 0.2337
38 39.26 -1.16 1.34 250 62,500 Ventas cuadrado 0.0000 0.0000 1.7564 0.0904
49 47.94 1.36 1.86 355 126,025
32 32.23 -0.33 0.11 165 27,225 R2 = 0.37
38 38.85 -1.05 1.09 245 60,025 K = 3
32 30.99 0.51 0.26 150 22,500 N = 30
28 26.86 0.74 0.54 100 10,000
36 35.54 0.16 0.03 205 42,025 Estadístico : nR2 11.16
41 41.57 -0.77 0.60 278 77,284 Chi-sqr (2 gl): 5.99
46 45.04 1.16 1.33 320 102,400 Conclusión: como el nR es mayor que el estadístico de tabla o teorica, se concluye rechazar la H0
2
Entonces hay evidencia de heterocedasticidad al 5% de significación
Receta:
1- Estimo los parámetros por MCO
2- Supongo algún modelo para los residuos:
s2i = s2 X2i
3- Divido cada observación por la raíz cuadrada de lo que está generando la heterocedasticidad
1/√X2i
4- Estimo los parámetros con las variables transformadas por MCO
variables originales variables transformadas
Empresa Y X error Y*= Y/X cte*= 1/X X*= X/X
1 29.3 135 -0.455 0.217 0.0074 1
2 31.5 150 0.505 0.210 0.0067 1
3 43.2 300 -0.192 0.144 0.0033 1
4 36.9 225 -0.293 0.164 0.0044 1
5 32.7 170 0.052 0.192 0.0059 1
6 43.2 310 -1.018 0.139 0.0032 1
7 42.9 285 0.748 0.151 0.0035 1
8 30.2 145 -0.381 0.208 0.0069 1
9 39.1 250 -0.159 0.156 0.0040 1
10 30.5 140 0.332 0.218 0.0071 1
11 42.8 280 1.061 0.153 0.0036 1
12 32.8 180 -0.674 0.182 0.0056 1
13 36.3 215 -0.067 0.169 0.0047 1
14 37.4 235 -0.620 0.159 0.0043 1
15 37.9 230 0.294 0.165 0.0043 1
16 44.9 315 0.269 0.143 0.0032 1
17 45.9 330 0.029 0.139 0.0030 1
18 45.8 345 -1.311 0.133 0.0029 1
19 41.2 260 1.114 0.158 0.0038 1
20 35.1 200 -0.027 0.176 0.0050 1
21 28.7 120 0.185 0.239 0.0083 1
22 38.1 250 -1.159 0.152 0.0040 1
23 49.3 355 1.363 0.139 0.0028 1
24 31.9 165 -0.334 0.193 0.0061 1
25 37.8 245 -1.046 0.154 0.0041 1
26 31.5 150 0.505 0.210 0.0067 1
27 27.6 100 0.738 0.276 0.0100 1
28 35.7 205 0.160 0.174 0.0049 1
29 40.8 278 -0.773 0.147 0.0036 1
30 46.2 320 1.155 0.144 0.0031 1
Y* Coeficientes Error típico Estadístico t Probabilidad
X* = B1 0.0807 0.0016 50.019 0.00000
constante = 19.0219 0.3105 61.256 0.00000
Residuos de MCP 1/Xi
0.006
0.004
0.002
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
-0.002
-0.004
-0.006
Resumen
Estadísticas de la regresión
Coeficiente de correlación
múltiple 0.9963
Coeficiente de determinación
R^2 0.9926
R^2 ajustado 0.9923
Error típico 0.0030
Observaciones 30
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crítico
F
libertad cuadrados cuadrados de F
Regresión 1 0.0344 0.0344 3752.2594391 0.000000
Residuos 28 0.0003 0.0000
Total 29 0.0347
Superior
Coeficientes Error típico Estadístico t Probabilidad Inferior 95%
95%
Intercepción 0.0807 0.0016 50.0190 0.000000 0.0774 0.0840
Variable X 1 19.0219 0.3105 61.2557 0.000000 18.3858 19.6580
Análisis de los residuales
Observación Y estim Residuos
1 0.22158851329 -0.00455148 -0.00455147625 Residuos de MCP 1/Xi
2 0.20749820276 0.002501797 0.00250179724 0.006
3 0.14409180538 -9.1805E-05 -9.18053773E-05
4 0.16522727117 -0.00122727 -0.00122727117 0.004
5 0.19257905043 -0.00022611 -0.00022610926
6 0.14204643772 -0.0026916 -0.00269159901 0.002
7 0.14742898419 0.003097332 0.003097331603
8 0.21187105775 -0.0035952 -0.00359519568
0
9 0.15677308485 -0.00037308 -0.00037308485
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
10 0.21655625953 0.001300883 0.001300883329
11 0.14862083376 0.004236309 0.004236309095 -0.002
12 0.18636273697 -0.00414051 -0.00414051474
13 0.16915945085 -0.00032224 -0.00032224155 -0.004
14 0.16162974508 -0.00248081 -0.00248080891
15 0.16338940458 0.001393204 0.001393204115 -0.006
16 0.14107245312 0.001467229 0.001467229419
17 0.13832758743 0.000763322 0.000763321657
18 0.13582140572 -0.00306778 -0.00306778253
19 0.15384663574 0.004614903 0.004614902718
20 0.17579500407 -0.000295 -0.00029500407
21 0.23920140145 -3.4735E-05 -3.47347842E-05
22 0.15677308485 -0.00437308 -0.00437308485
23 0.13426827902 0.00460496 0.004604960414
24 0.19596976687 -0.00263643 -0.00263643354
25 0.15832589459 -0.00404018 -0.0040401803
26 0.20749820276 0.002501797 0.00250179724
27 0.27090460014 0.0050954 0.005095399858
28 0.17347525782 0.000671084 0.000671083641
29 0.14910957783 -0.00234699 -0.0023469879
30 0.14012890554 0.004246094 0.004246094459