Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PROBLEMA
El departamento de personal de la empresa P&C está interesado en estudiar la relación
que tiene el salario, el tamaño de la familia y la antigüedad en el trabajo con los gastos.
Para este estudio, el especialista en la materia escogió una muestra al azar de 10
miembros de todo el personal de la empresa y registró los datos en la tabla que sigue,
para las siguientes variables:
X 1 =salario semanal en $
X 2 =Tamaño de la familia
X 3 =Antiguedad en eltrabajo
Y =Gasto semanal en $
Y X1 X2 X3
20 25 3 5
25 28 5 8
30 35 4 6
32 35 5 2
37 40 5 7
40 45 5 4
40 50 5 5
45 45 6 4
55 70 6 5
60 80 5 3
2
DESARROLLO
a) Obtenga el sistema de las ecuaciones normales del método de mínimos
cuadrados ( X ´ X )b= X ´Y
[] [ ]
Escribiremos Y e X en su forma matricial
20 1 25 3 5
25 1 28 5 8
30 1 35 4 6
32 1 35 5 2
Y = 37 X = 1 40 5 7
40 1 45 5 4
40 1 50 5 5
45 1 45 6 4
55 1 70 6 5
60 10 x1 1 80 5 3 10 x 4
Hallaremos la transpuesta de X
[ ]
1 1 1 1 1 1 1 1 1 1
X ' = 25 28 35 35 40 45 50 45 70 80
3 5 4 5 5 5 5 6 6 5
5 8 6 2 7 4 5 4 5 3 4 ×10
[]
Hallaremos X’X
1 25 3 5
1 28 5 8
1 35 4 6
[ ]
1 1 1 1 1 1 1 1 1 1 1 35 5 2
25 28 35 35 40 45 50 45 70 80 1 40 5 7
X ´ X=
3 5 4 5 5 5 5 6 6 5 1 45 5 4
5 8 6 2 7 4 5 4 5 3 1 50 5 5
1 45 6 4
1 70 6 5
1 80 5 3
Al ser X’ una matriz de orden 4x10 y X una matriz de orden 10x4, por lo que X’X será
de orden 4x4
3
[ ]
10 453 49 49
453 23309 2295 2109
X ´ X=
49 2295 247 238
49 2109 238 269 4x4
[]
Ahora hallaremos X’Y
20
25
30
[ ]
1 1 1 1 1 1 1 1 1 1 32
25 28 35 35 40 45 50 45 70 80 37
X ´Y=
3 5 4 5 5 5 5 6 6 5 40
5 8 6 2 7 4 5 4 5 3 40
45
55
60
Al ser X’ una matriz de orden 4x10 e Y una matriz de orden 10x1, nos resultara una
matriz de orden 4x1
[ ]
384
X'Y= 19325
1950
1798 4x1
X ' X . b= X ' Y
Tenemos:
[ ] [ ]
10 453 49 49 384
453 23309 2295 2109 19325
X ´ X= X 'Y=
49 2295 247 238 1950
49 2109 238 269 4x4 1798 4 x1
4
[ ][ ] [ ]
10 453 49 49 b0 384
453 23309 2295 2109 b1
= 19325
49 2295 247 238 b2 1950
49 2109 238 269 b3 1798
[ ]
10 453 49 49
453 23309 2295 2109
X ´ X=
49 2295 247 238
49 2109 238 269 4x4
| |
10 453 49 49
det ( X ' X )= 453 23309 2295 2109 =3302679
49 2295 247 238
49 2109 238 269
5
[ ]
16862339 −7591 −2345708 −272550
3302679 1100893 3302679 1100893
[ ]
−7591 650 −6479 2019 384
−1 1100893 1100893 1100893 1100893 19325
b=[ X ' X ] [ X ' Y ] =
−2345708 −6479 683216 −8269 1950
3302679 1100893 3302679 1100893 1798
−272550 2019 −8269 45226
1100893 1100893 1100893 1100893
[ ]
−−3071783
1100893
[ ]
642418 −2.790265
0.583543
b=[ X ' X ] [ X ' Y ] = 1100893 =
−1
3765439 3.420350
1100893 −0.4089653
−450227
1100893
Obtemos el siguiente vector, aproximamos las cifras a 6 decimales para mayor precisión
[ ]
−2.790265
−1 0.583543
b=[ X ' X ] [ X ' Y ] =
3.420350
−0.4089653 4x 1
6
El estimador del parametro β 3, b 3 nos dice que si X3 aumenta en 1 unidad, Y disminuye
en -0.41.
Para poder hallar el error estándar de estimación primero debemos encontrar SCE
n n
SCE=∑ ( y i− ŷ i) =¿ ∑ ( e i ) ¿
2 2
i=1 i=1
e i= y i− ^yi
e
2
Y x1 x2 x3 ^y e
20 25 3 5 20.01453 -0.01453 0.000211
25 28 5 8 27.37897 -2.37897 5.659482
30 35 4 6 28.86135 1.138652 1.296528
32 35 5 2 33.91756 -1.91756 3.677034
37 40 5 7 34.79045 2.209552 4.88212
40 45 5 4 38.93506 1.064941 1.1341
40 50 5 5 41.44381 -1.44381 2.084583
45 45 6 4 42.35541 2.644591 6.993863
55 70 6 5 56.53502 -1.53502 2.356282
60 80 5 3 59.76803 0.231971 0.05381
38.4 SCE 28.13801
2 SCE
Se =
n−k −1
2 28.13801342
Se = =4.689668903
10−3−1
7
d) Mida el nivel de ajuste del modelo a los datos, en forma descriptiva, utilizando
el coeficiente de determinación R2. Describa esta medición.
SCR SCE
R 2= =1−
SCT SCT
y x1 x2 x3 ^ y e
20 25 3 5 20.01453 -0.01453 338.0254
( ^y − y )2
25 28 5 8 27.37897 -2.37897 121.4632
30 35 4 6 28.86135 1.138652 90.98588
32 35 5 2 33.91756 -1.91756 20.09227
37 40 5 7 34.79045 2.209552 13.02887
40 45 5 4 38.93506 1.064941 0.286288
40 50 5 5 41.44381 -1.44381 9.26477
45 45 6 4 42.35541 2.644591 15.64526
55 70 6 5 56.53502 -1.53502 328.8789
60 80 5 3 59.76803 0.231971 456.5927
38.4 SCR 1394.263
n
SCT =∑ ( y i− y i )
2
i=1
Y x1 x2 x3 ^y e ( y i− y i )
2
8
2 SCR 1394.263
Reemplazando en la fórmula R = = =0.98
SCT 1422.4
Vemos que en esta muestra el 98 por ciento de la variabilidad de los gastos semanales
en dólares del personal de la empresa esta explicada por la relación lineal con el salario,
el tamaño de la familia y la antigüedad.
2
Cov ( b )=S e ¿
Tenemos:
2 28.13801342
Se = =4.689668902
10−3−1
[ ]
16862339 −7591 −2345708 −272550
3302679 1100893 3302679 1100893
−7591 650 −6479 2019
( X ´ X )−1= 1100893 1100893 1100893 1100893
−2345708 −6479 683216 −8269
3302679 1100893 3302679 1100893
−272550 2019 −8269 45226
1100893 1100893 1100893 1100893 4x 4
2
S e¿
Y finalmente obtenemos
9
[ ]
2
Sb 0
Sb b 0 1
Sb b
0 2
Sb b
0 3
2
Sb b Sb Sb b Sb b
Cov ( b )= 1 0 1 1 2
2
1 3
Sb b
2 0
Sb b 2 1
Sb 2
Sb b
2 3
Sb b
3 0
Sb b 3 1
Sb b
3 2
Sb 2
3
[ ]
23.943831 −0.032337 −3.330809 −1.161030
−0.032337 0.002769 −0.0275997 0.008601
Cov ( b )=
−3.330809 −0.0275997 0.970139 −0.035225
−1.161030 0.008601 −0.035225 0.192657
2
Sb =23.9438→ S b =4.8932
0 0
Sb 2=0.0028→ S b =0.0529
1 1
Sb 2=0.9701→ S b =0.9849
2 2
Sb 2=0.1927→ Sb =0.43898
2 2
1.
H 0 : β 1=0
H 1 : β1 ≠ 0
Para α =0.05
b1 0.58354
t= = =11.03
Sb 0.0529
1
tα =t 0.025;6 =2.447
; n−k−1
2
Conclusión:
Por lo que se rechaza Ho y podemos concluir que β 1 es significativo por lo que X1
es una variable explicativa.
Por el método del P valor:
p=2 P [ T >11.03 ]=1−0.999983=0
10
p<α
0< 0.05
Por lo que se rechaza Ho y se acepta H1
Intervalos de confianza:
b 1 ± t ( Sb1 )=0.58354 ±2.447 ( 0.0529 ) =0.58354 ± 0.1294463
0.4540937< B1 <0.7129863
2.
H 0 : β 2=0
H 1 : β2 ≠ 0
Para α =0.05
b2 3.42035
t= = =3.47
S b 0.9849
2
tα =t 0.025;6 =2.447
; n−k−1
2
Intervalos de confianza:
b 2 ± t ( Sb2 )=3.42035 ± 2.447 ( 0.9849 )=3.42035 ± 2.4100503
1.0102997< B2 <5.8304003
Conclusión:
Por lo que se rechaza Ho y podemos concluir que β 2 es significativo por lo que X2
es una variable explicativa.
Por el método del P valor:
p=2 P [ T >3.47 ] =1−0.993348=0.007
p<α
11
0.007< 0.05
Por lo que se rechaza Ho y se acepta H1
3.
H 0 : β 3=0
H 1 : β3 ≠ 0
Para α =0.05
b3 −0.40897
t= = =−0.932
Sb 3
0.43898
tα =t 0.025;6 =2.447
; n−k−1
2
Intervalos de confianza:
b 3 ± t ( Sb3 )=−0.40897 ±2.447 ( 0.43898 )=−0.40897 ± 1.07418406
−1.48315406< B3 <0.66521406
Conclusión:
Por lo que se acepta Ho y podemos concluir que β 3 no es significativo por lo que X3
no es una variable explicativa.
Por el método del P valor:
p=2 P [ T >11.03 ]=1−0.806349=0.2
p>α
0.2>0.05
Por lo que se acepta Ho y se rechaza H1.
12
g) Contraste de todos los parámetros de un modelo de regresión
H 0 : β 1=β 2=β 3=0
H 1 : Al menosun βi≠ 0
α =0.05
SCR
K
F=
SCE
n−k −1
1394.263
3
F= =99.102
28.138
6
F 3,6,0.05=4.7570
13