Documentos de Académico
Documentos de Profesional
Documentos de Cultura
En términos matriciales es
Y = X +
Y1 1 X 11 X 12 X 1k 0 1
Y 1 X 21 X 22 X 2k
Y 2 X 1 2
Yn 1 X n1 X n2 X nk k n
donde :
Es decir:
Y = X +
= Y – X
Se desea encontrar el vector de estimadores de mínimos cuadrados ˆ que
minimiza:
n
Q ( ) i2 ' (Y X )' (Y X )
i 1
Los estimadores de los parámetros 0, 1,..., k son denotados por ˆ0 , ˆ1 ,..., ˆk
, respectivamente. También se usan b0, b1, ..., bk.
2
n
(Yi Yˆi ) 2
se i 1
n k 1
Notar que se tiene las mismas unidades que los datos originales. El valor de se es
también conocido como la raíz del cuadrado medio del error (rcme) de la
regresión.
Recordar que el residual es la distancia por encima (+) o por debajo (-) de la
superficie de regresión.
ˆi i ,0
La fórmula general es: t0
se ( ˆi )
3
A menudo, estaremos interesados en preguntar ¿en realidad Y depende de Xj?
Usualmente esta pregunta se plantea así: ¿Es Xi una variable explicativa de Y?
Y depende de Xi si i 0; y no depende de Xj si i = 0.
Nuestra pregunta conduce a establecer hipótesis de la forma:
H0 : i = 0 Xi no es una variable explicativa significativa
H1 : i 0 Xi es una variable explicativa significativa
Entonces, cuando la hipótesis nula dice que i es 0 ( i = 0), se simplifica la
fórmula anterior y se convierte en:
ˆi
t0
se ( ˆi )
5
Error nk2 (Y ' Y ˆ ' X ' Y ) se2
n
Total n1 (Yi Y ) 2
i 1
La prueba del ANOVA se conoce como la prueba global del modelo de regresión
y las pruebas de cada i son conocidas como pruebas individuales.
7
Ejemplo 1.-
La matriz X’ es:
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
35 29 36 60 65 30 10 7 21 55 54 48 20 39 60 20 58 40 27 30
3 4 7 6 5 5 6 10 9 2 12 5 5 4 8 5 7 8 9 7
10 1 9 8 8 9 14 9 11 9 11 10 12 10 8 10 10 11 14 9
6 10 3 9 6 5 7 10 11 5 4 1 15 7 6 8 3 11 8 5
El vector de estimados de es :
9
424.73617304316
-4.5718555384585
-14.905697976563
0.2440169570653
6.1261807750031
Unusual Observations
Obs X1 Y Fit SE Fit Residual St Resid
2 29.0 360.0 294.0 44.4 66.0 2.32R
R denotes an observation with a large standardized residual
Ejemplo 2.-
11
Y X1 X2 X3 X4
12
5.0 2 9 29 0
9.7 4 18 50 0
28.4 8 21 41 1
8.8 8 12 55 0
21.0 8 14 34 1
26.6 10 16 36 0
25.4 12 16 61 1
23.1 12 9 29 0
22.5 12 18 64 1
19.5 12 5 30 0
21.7 12 7 28 0
24.8 13 9 29 0
30.1 14 12 35 1
24.8 14 17 59 0
28.5 15 19 65 0
26.0 15 6 30 0
38.9 16 17 40 1
22.1 16 1 23 0
33.1 19 10 58 1
48.3 21 17 44 1
Y X1 X2 X3
X1 0.841
X2 0.268 -0.115
X3 0.105 0.122 0.676
X4 0.560 0.290 0.456 0.309
13
S = 1.438 R-Sq = 98.3% R-Sq(adj) = 97.8%
Analysis of Variance
Source DF SS MS F P
Regression 4 1789.41 447.35 216.37 0.000
Residual Error 15 31.01 2.07
Total 19 1820.43
Source DF Seq SS
X1 1 1287.32
X2 1 244.77
X3 1 229.22
X4 1 28.10
14