Documentos de Académico
Documentos de Profesional
Documentos de Cultura
=
=
=
n
i
i
n
i
i i
x x
y y x x
b
1
2
1
) (
) )( (
x b y a =
Regresin Lineal Simple
Resolvamos ahora el problema del promedio mvil, sobre
la proyeccin de ventas.
Segn los datos:
x = 102; y = 1087; n=12 = 8,5 y = 90,58
Luego
b = 696,68 / 143 = 4,872
a = 90,58 4,872 * 8,5 = 49,169
Compruebe los resultados!
x
y
Regresin Lineal Simple
La regresin por mnimos cuadrados funciona en base a 6
supuestos:
1. El modelo debe ser lineal Y = Xb + e
2. La matriz de regresores debe ser de rango completo, es decir no
debe haber dependencia lineal entre ellos.
3. La esperanza del error, para cualquier observacin, debe ser cero
E[e|X] =0. Es decir, el valor de e es independiente de los
valores de X.
4. La varianza de las muestras es constante. Es decir, hay
homocedasticidad. E[ee|X]=
2
I
5. Los regresores X no son estocsticos
6. Las perturbaciones estn normalmente distribuidas, con media
cero y varianza constante e|X ~ N[0,
2
I]
Regresin Lineal Simple
Cmo medimos la bondad del ajuste por mnimos cuadrados?
A travs de la descomposicin de la suma de los cuadrados totales
(SST):
Donde SSR es la suma de los cuadrados de la regresin y SSE es la
suma de los cuadrados de los errores.
Luego el coeficiente de determinacin es:
Que es la correlacin al cuadrado entre los valores observados de y y las predicciones
calculadas por la ecuacin de regresin estimada.
Este coeficiente crece a medida que se aumentan los regresores, por
lo que se debe hacer un ajuste por grados de libertad.
Este es el Coeficiente de Determinacin Ajustado
=
=
n
i
i
y y SST
1
2
) (
SSE SSR SST + =
=
=
n
i
i
x x b SSR
1
2 2
) (
SST
SSE
SST
SSR
R = = 1
2
) 1 (
) (
) 1 (
1
2
2
R
K n
n
R
=
Regresin Lineal Simple
Para contrastar hiptesis o estimar intervalos de confianza, se
necesita la varianza
2
. Ya que no se puede calcular
2
, obtendremos
su estimador insesgado S
2
.
Luego el error estndar es S
Para contrastar hiptesis respecto de la significancia de los
coeficientes, se puede utilizar el estadstico t
con
El Intervalo de Confianza de un coeficiente es:
Para un nivel 1- de confianza
) (
) (
1
2
2
K n
bx a y
S
n
i
i i
=
b
b
S
b
t
|
=
a
a
S
a
t
o
=
(
(
(
(
=
=
n
i
i
n
i
i
a
x x n
x
S S
1
2
1
2
2
) (
=
=
n
i
i
b
x x
S
S
1
2
2
) (
b b
S t b S t b
2 / 2 /
| + < <
Regresin Lineal Simple
El Intervalo de Confianza para la varianza poblacional, obtenida
usando el estadstico de Chi-cuadrado, es:
Para 95% de confianza
2
) 025 , 0 (
2
2
2
) 975 , 0 (
2
) ( ) (
_
o
_
S K n S K n
< <
=
n
i
i
y y SST
13 , 435 . 64 44 , 192 . 67 * 979 , 0 ) (
2
1
2 2
= = =
=
n
i
i
x x b SSR
9907 , 0 )
972 . 64
435 . 64
1 (
) 2 10 (
) 1 10 (
1 ) 1 (
) (
) 1 (
1
2
=
=
SST
SSR
K n
n
R
Regresin Lineal Simple
Continuemos con el ejemplo de Keynes.
La hiptesis de Keynes es que el coeficiente b es menor que 1. De
acuerdo a la muestra es esta hiptesis verdadera?
Entonces definimos H
0
: 1 y H
1
: <1
Para un nivel de confianza del 95%, el t
crtico
es -2,306, por lo tanto
no debe rechazarse ninguna de las hiptesis. Qu significa esto?
1947 , 67
2 10
558 , 537
) (
) (
1
2
2
=
=
K n
bx a y
S
n
i
i i
6641 , 0
03162 , 0
1 979 , 0
=
=
b
b
S
b
t
|
001 , 0
4 , 67192
194 , 67
) (
1
2
2
2
= =
=
n
i
i
b
x x
S
S
03162 , 0
2
= =
b b
S S
Regresin Lineal Simple
Continuemos con el ejemplo de Keynes.
Cual es el intervalo de confianza para el coeficiente b, y para la
varianza.
Para esto solo falta conocer el valor de t
/2
para un 95% de
confianza y 8 grados de libertad. Por tabla: t
/2
= 2,306
El estimador chi-cuadrado para un 95% de confianza y 10 grados
de libertad es:
0,975
= 17,54 y
0,025
= 2,18
03161 , 0 * 306 , 2 979 , 0 03161 , 0 * 306 , 2 979 , 0 + < < |
052 , 1 906 , 0 < < |
18 , 2
195 , 67 ) 2 10 (
54 , 17
195 , 67 ) 2 10 (
2
< <
o
587 , 246 648 , 30
2
< <o
Regresin Lineal Simple
Utilicemos una forma mejor para encontrar los coeficientes
y otros parmetros de una regresin Lineal: MATRICES
Sigamos con el ejemplo de Keynes
672.1 1 751.6
696.8 1 779.2
737.1 1 810.3
767.9 1 864.7
762.8 1 857.5
779.4 1 874.9
823.1 1 906.8
864.3 1 942.9
903.2 1 988.8
927.6 1 1015.7
y x
1
x
2
(XX)=
1 751.6
1 779.2
1 810.3
1 1 1 1 1 1 1 1 1 1 1 864.7 10 8792.4
752 779 810 865 858 875 907 943 989 1016 1 857.5 8792.4 7797822.2
1 874.9
1 906.8
1 942.9
1 988.8
1 1015.7
=
(XX)
-1
= 4 , 8792 * 4 , 8792 2 , 7797822 * 10
1
7797822.2 -8792.4
-8792.4 10
11.605207 -0.0130854
-0.0130854 1.48826E-05 =
y X X X ' ) ' (
1
= |
| X y =
Regresin Lineal Simple
Xy =
672.1
696.8
737.1
767.9
1 1 1 1 1 1 1 1 1 1 762.8 7934.3
752 779 810 865 858 875 907 943 989 1016 779.4 7041953.3
823.1
864.3
903.2
927.6
=
11.605207 -0.0130854 7934.3 -67.581
-0.0130854 1.4883E-05 7041953 0.9793
=
= =
y X X X ' ) ' (
1
|
1 751.6
1 779.2
1 810.3
1 864.7
1 857.5 -67.5807
1 874.9 0.9793
1 906.8
1 942.9
1 988.8
1 1015.7
= = |
X y
668.4364
695.4641
725.9193
779.1915
772.1407
789.1800
820.4186
855.7701
900.7185
927.0608
=
= )
( y y
= -
672.1 668.4364 3.6636
696.8 695.4641 1.3359
737.1 725.9193 11.1807
767.9 779.1915 -11.2915
762.8 772.1407 -9.3407
779.4 789.1800 -9.7800
823.1 820.4186 2.6814
864.3 855.7701 8.5299
903.2 900.7185 2.4815
927.6 927.0608 0.5392
2
1
|
|
Regresin Lineal Simple
= )
( )'
( y y y y
=
3.66363
1.33586
11.1807
-11.291
3.6636 1.3359 11.181 -11.29 -9.341 -9.78 2.6814 8.5299 2.4815 0.5392 -9.3407 537.006
-9.78
2.6814
8.52987
2.48152
0.53924
1257 , 67
) 2 10 (
006 , 537
) (
)
( )'
(
2
=
=
K n
y y y y
S 193 , 8 1257 , 67
2
= = = S S
=
1 2
) ' ( X X S Matriz de Covarianzas =
67.1257 11.605207 -0.0130854 779.0077 -0.8784
-0.0130854 1.4883E-05 -0.8784 0.0010
=
911 , 27 0077 . 779
1
= =
|
S 03162 , 0 001 , 0
2
= =
|
S
El Error Estndar de los coeficientes es:
Regresin Lineal Mltiple
Se realiza sobre una funcin que tiene ms de 2 regresores
Se resuelve de la misma forma que la RLS, y por lo tanto
debe cumplir con los mismos 6 supuestos.
La forma ms simple de resolverlo es con matrices.
Anlisis Economtrico
Econometra es el campo de la economa que tiene que ver
con la aplicacin de la estadstica matemtica y las
herramientas de inferencia estadstica, a las mediciones
empricas de relaciones postuladas por la economa terica
Toma la tcnica de Regresin Mltiple Lineal y la analiza
hasta eliminar algunos de sus 6 supuestos, logrando
abarcar el anlisis de una mayor cantidad de datos y
funciones.
Adicionalmente, se ha convertido en una herramienta para
desarrollar pronsticos
Anlisis Economtrico
Los dos tipos de datos que se analizan con frecuencia son:
las Series de Tiempo y los Datos de Panel.
Una serie de tiempo es por ejemplo el precio del cobre en
funcin del tiempo.
Los datos de panel son por ejemplo el precio del cobre en
funcin de la oferta, la demanda, los sustitutos, etc
c | | | | | | + + + + + + =
Sn al Cu
P P D Ps Pp P
6 5 4 3 2 1
1 2 3 1 2 1
+ + + =
t t t t
P P P uc c | | |