Está en la página 1de 13

1

PROBLEMA
El departamento de personal de la empresa P&C está interesado en estudiar la relación
que tiene el salario, el tamaño de la familia y la antigüedad en el trabajo con los gastos.
Para este estudio, el especialista en la materia escogió una muestra al azar de 10
miembros de todo el personal de la empresa y registró los datos en la tabla que sigue,
para las siguientes variables:
X 1 =salario semanal en $

X 2 =Tamaño de la familia

X 3 =Antiguedad en eltrabajo

Y =Gasto semanal en $
Y X1 X2 X3
20 25 3 5
25 28 5 8
30 35 4 6
32 35 5 2
37 40 5 7
40 45 5 4
40 50 5 5
45 45 6 4
55 70 6 5
60 80 5 3

Si se propone un modelo de regresión lineal múltiple que relacione la variable


dependiente Y con las variables independientes X 1 , X 2 , X 3
a) Obtenga el sistema de las ecuaciones normales del método de mínimos cuadrados
(X ´ X )b= X ´ Y
b) Calcule el vector solución: b=( X ´ X)−1 X ´ Y del sistema de las ecuaciones
normales y estime el modelo de regresión lineal múltiple propuesto.
c) Obtenga la estimación insesgada de la varianza σ 2 del modelo de regresión
múltiple. ¿Cómo interpretar el error estándar de la estimación?
d) Mida el nivel de ajuste del modelo a los datos, en forma descriptiva, utilizando el
coeficiente de determinación R2. Describa esta medición.

2
DESARROLLO
a) Obtenga el sistema de las ecuaciones normales del método de mínimos
cuadrados ( X ´ X )b= X ´Y

[] [ ]
Escribiremos Y e X en su forma matricial

20 1 25 3 5
25 1 28 5 8
30 1 35 4 6
32 1 35 5 2
Y = 37 X = 1 40 5 7
40 1 45 5 4
40 1 50 5 5
45 1 45 6 4
55 1 70 6 5
60 10 x1 1 80 5 3 10 x 4

Hallaremos la transpuesta de X

[ ]
1 1 1 1 1 1 1 1 1 1
X ' = 25 28 35 35 40 45 50 45 70 80
3 5 4 5 5 5 5 6 6 5
5 8 6 2 7 4 5 4 5 3 4 ×10

[]
Hallaremos X’X

1 25 3 5
1 28 5 8
1 35 4 6

[ ]
1 1 1 1 1 1 1 1 1 1 1 35 5 2
25 28 35 35 40 45 50 45 70 80 1 40 5 7
X ´ X=
3 5 4 5 5 5 5 6 6 5 1 45 5 4
5 8 6 2 7 4 5 4 5 3 1 50 5 5
1 45 6 4
1 70 6 5
1 80 5 3

Al ser X’ una matriz de orden 4x10 y X una matriz de orden 10x4, por lo que X’X será
de orden 4x4

3
[ ]
10 453 49 49
453 23309 2295 2109
X ´ X=
49 2295 247 238
49 2109 238 269 4x4

[]
Ahora hallaremos X’Y

20
25
30

[ ]
1 1 1 1 1 1 1 1 1 1 32
25 28 35 35 40 45 50 45 70 80 37
X ´Y=
3 5 4 5 5 5 5 6 6 5 40
5 8 6 2 7 4 5 4 5 3 40
45
55
60

Al ser X’ una matriz de orden 4x10 e Y una matriz de orden 10x1, nos resultara una
matriz de orden 4x1

[ ]
384
X'Y= 19325
1950
1798 4x1

Ahora remplazaremos las matrices que hallamos en la siguiente ecuación

X ' X . b= X ' Y
Tenemos:

[ ] [ ]
10 453 49 49 384
453 23309 2295 2109 19325
X ´ X= X 'Y=
49 2295 247 238 1950
49 2109 238 269 4x4 1798 4 x1

Lo que nos daría:

4
[ ][ ] [ ]
10 453 49 49 b0 384
453 23309 2295 2109 b1
= 19325
49 2295 247 238 b2 1950
49 2109 238 269 b3 1798

b) Calcule el vector solución: b=( X ´ X)−1 X ´ Y del sistema de las ecuaciones


normales y estime el modelo de regresión lineal múltiple propuesto.

Para hallar el vector solución b primero hallaremos¿ utilizando el método adjunto-


cofactores:

[ ]
10 453 49 49
453 23309 2295 2109
X ´ X=
49 2295 247 238
49 2109 238 269 4x4

| |
10 453 49 49
det ( X ' X )= 453 23309 2295 2109 =3302679
49 2295 247 238
49 2109 238 269

Lo que nos resulta


¿

Reemplazaremos lo obtenido en la siguiente ecuación


−1
b=[ X ' X ] [ X ' Y ]

5
[ ]
16862339 −7591 −2345708 −272550
3302679 1100893 3302679 1100893

[ ]
−7591 650 −6479 2019 384
−1 1100893 1100893 1100893 1100893 19325
b=[ X ' X ] [ X ' Y ] =
−2345708 −6479 683216 −8269 1950
3302679 1100893 3302679 1100893 1798
−272550 2019 −8269 45226
1100893 1100893 1100893 1100893

[ ]
−−3071783
1100893

[ ]
642418 −2.790265
0.583543
b=[ X ' X ] [ X ' Y ] = 1100893 =
−1

3765439 3.420350
1100893 −0.4089653
−450227
1100893

Obtemos el siguiente vector, aproximamos las cifras a 6 decimales para mayor precisión

[ ]
−2.790265
−1 0.583543
b=[ X ' X ] [ X ' Y ] =
3.420350
−0.4089653 4x 1

y i=−2.790265+ 0.583543 x 1 +3.420350 x2 +−0.4089653 x 3 +e i

El estimador del parametro β 0 es −2.790265

El estimador del parametro β 1 es 0.583543 para la variable independiente X1 que es el


salario.
El estimador del parametro β 2 es 3.420350 para la variable independiente X2 que es la
tamaño de la familia.
El estimador del parametro β 3 es 0.583543 para la variable independiente X3 que es la
antigüedad en el trabajo.
El estimador del parametro β 0, b 0 que cuando las variables del salario , X2, X3 son 0 el
gasto es igaula a - 2.79, es decir es el gasto autonomo y no depende de las variables.
El estimador del parametro β 1, b 1 nos dice que si X1 aumenta en 1 unidad, Y aumenta
en 0.58.
El estimador del parametro β 2, b 2 nos dice que si X2 aumenta en 1 unidad, Y aumenta
en 3.42.

6
El estimador del parametro β 3, b 3 nos dice que si X3 aumenta en 1 unidad, Y disminuye
en -0.41.

c) Obtenga la estimación insesgada de la varianza σ 2 del modelo de regresión


múltiple. ¿Cómo interpretar el error estándar de la estimación?

Para poder hallar el error estándar de estimación primero debemos encontrar SCE

n n
SCE=∑ ( y i− ŷ i) =¿ ∑ ( e i ) ¿
2 2

i=1 i=1

Para poder calcular SCE nos ayudaremos de las siguientes ecuaciones y de la


siguiente tabla:
y i=b 0 +b1 x1 +b 2 x 2 +b3 x3 + ei

e i= y i− ^yi


2
Y x1 x2 x3 ^y  e
20 25 3 5 20.01453 -0.01453 0.000211
25 28 5 8 27.37897 -2.37897 5.659482
30 35 4 6 28.86135 1.138652 1.296528
32 35 5 2 33.91756 -1.91756 3.677034
37 40 5 7 34.79045 2.209552 4.88212
40 45 5 4 38.93506 1.064941 1.1341
40 50 5 5 41.44381 -1.44381 2.084583
45 45 6 4 42.35541 2.644591 6.993863
55 70 6 5 56.53502 -1.53502 2.356282
60 80 5 3 59.76803 0.231971 0.05381
38.4         SCE 28.13801

2 SCE
Se =
n−k −1

Reemplazando en la ecuación para k = 3 variables independientes y n = 10

2 28.13801342
Se = =4.689668903
10−3−1

Por lo tanto la estimación de la varianza de los errores es 4.689668903.

La estimación de la desviación típica del error es 2.165564338.

7
d) Mida el nivel de ajuste del modelo a los datos, en forma descriptiva, utilizando
el coeficiente de determinación R2. Describa esta medición.

SCR SCE
R 2= =1−
SCT SCT

Para poder encontrar el coeficiente de determinación primero hallaremos SCR y SCT


n
SCR=∑ ( ŷ i− y i )2
i=1

y x1 x2 x3 ^ y e  
20 25 3 5 20.01453 -0.01453 338.0254
( ^y − y )2
25 28 5 8 27.37897 -2.37897 121.4632
30 35 4 6 28.86135 1.138652 90.98588
32 35 5 2 33.91756 -1.91756 20.09227
37 40 5 7 34.79045 2.209552 13.02887
40 45 5 4 38.93506 1.064941 0.286288
40 50 5 5 41.44381 -1.44381 9.26477
45 45 6 4 42.35541 2.644591 15.64526
55 70 6 5 56.53502 -1.53502 328.8789
60 80 5 3 59.76803 0.231971 456.5927
38.4         SCR 1394.263

n
SCT =∑ ( y i− y i )
2

i=1

Y x1 x2 x3 ^y  e ( y i− y i )  
2

20 25 3 5 20.01453 -0.01453 338.56


25 28 5 8 27.37897 -2.37897 179.56
30 35 4 6 28.86135 1.138652 70.56
32 35 5 2 33.91756 -1.91756 40.96
37 40 5 7 34.79045 2.209552 1.96
40 45 5 4 38.93506 1.064941 2.56
40 50 5 5 41.44381 -1.44381 2.56
45 45 6 4 42.35541 2.644591 43.56
55 70 6 5 56.53502 -1.53502 275.56
60 80 5 3 59.76803 0.231971 466.56
38.4         SCT 1422.40

8
2 SCR 1394.263
Reemplazando en la fórmula R = = =0.98
SCT 1422.4

Vemos que en esta muestra el 98 por ciento de la variabilidad de los gastos semanales
en dólares del personal de la empresa esta explicada por la relación lineal con el salario,
el tamaño de la familia y la antigüedad.

e) Hallar la matriz de covarianza de los estimadores

2
Cov ( b )=S e ¿
Tenemos:
2 28.13801342
Se = =4.689668902
10−3−1

[ ]
16862339 −7591 −2345708 −272550
3302679 1100893 3302679 1100893
−7591 650 −6479 2019
( X ´ X )−1= 1100893 1100893 1100893 1100893
−2345708 −6479 683216 −8269
3302679 1100893 3302679 1100893
−272550 2019 −8269 45226
1100893 1100893 1100893 1100893 4x 4

Para facilitar los calculos colocamos en su frma decimal la matriz ¿


¿

2
S e¿

Y finalmente obtenemos

9
[ ]
2
Sb 0
Sb b 0 1
Sb b
0 2
Sb b
0 3

2
Sb b Sb Sb b Sb b
Cov ( b )= 1 0 1 1 2
2
1 3

Sb b
2 0
Sb b 2 1
Sb 2
Sb b
2 3

Sb b
3 0
Sb b 3 1
Sb b
3 2
Sb 2
3

[ ]
23.943831 −0.032337 −3.330809 −1.161030
−0.032337 0.002769 −0.0275997 0.008601
Cov ( b )=
−3.330809 −0.0275997 0.970139 −0.035225
−1.161030 0.008601 −0.035225 0.192657
2
Sb =23.9438→ S b =4.8932
0 0

Sb 2=0.0028→ S b =0.0529
1 1

Sb 2=0.9701→ S b =0.9849
2 2

Sb 2=0.1927→ Sb =0.43898
2 2

f) Prueba de significación individual

1.
H 0 : β 1=0

H 1 : β1 ≠ 0

Para α =0.05

b1 0.58354
t= = =11.03
Sb 0.0529
1

tα =t 0.025;6 =2.447
; n−k−1
2

Podemos ver que la t calculada es mayor a la t de la tabla


|t |>t α
; n−k−1
2

Conclusión:
Por lo que se rechaza Ho y podemos concluir que β 1 es significativo por lo que X1
es una variable explicativa.
Por el método del P valor:
p=2 P [ T >11.03 ]=1−0.999983=0

10
p<α
0< 0.05
Por lo que se rechaza Ho y se acepta H1
Intervalos de confianza:
b 1 ± t ( Sb1 )=0.58354 ±2.447 ( 0.0529 ) =0.58354 ± 0.1294463

b 1−t ( Sb1 )=0.4540937 b1+ t ( Sb1 )=0.7129863

0.4540937< B1 <0.7129863

2.
H 0 : β 2=0

H 1 : β2 ≠ 0

Para α =0.05

b2 3.42035
t= = =3.47
S b 0.9849
2

tα =t 0.025;6 =2.447
; n−k−1
2

Podemos ver que la t calculada es mayor a la t de la tabla


|t |>t α
; n−k−1
2

Intervalos de confianza:
b 2 ± t ( Sb2 )=3.42035 ± 2.447 ( 0.9849 )=3.42035 ± 2.4100503

b 2−t ( Sb2 )=1.0102997 b 2+ t ( Sb2 )=5.8304003

1.0102997< B2 <5.8304003

Conclusión:
Por lo que se rechaza Ho y podemos concluir que β 2 es significativo por lo que X2
es una variable explicativa.
Por el método del P valor:
p=2 P [ T >3.47 ] =1−0.993348=0.007
p<α

11
0.007< 0.05
Por lo que se rechaza Ho y se acepta H1

3.
H 0 : β 3=0

H 1 : β3 ≠ 0

Para α =0.05

b3 −0.40897
t= = =−0.932
Sb 3
0.43898

tα =t 0.025;6 =2.447
; n−k−1
2

Podemos ver que la t calculada es menor a la t de la tabla


|t |<t α
; n−k−1
2

Intervalos de confianza:
b 3 ± t ( Sb3 )=−0.40897 ±2.447 ( 0.43898 )=−0.40897 ± 1.07418406

b 3−t ( Sb3 ) =−1.48315406 b3 +t ( Sb3 ) =0.66521406

−1.48315406< B3 <0.66521406

Conclusión:
Por lo que se acepta Ho y podemos concluir que β 3 no es significativo por lo que X3
no es una variable explicativa.
Por el método del P valor:
p=2 P [ T >11.03 ]=1−0.806349=0.2
p>α
0.2>0.05
Por lo que se acepta Ho y se rechaza H1.

12
g) Contraste de todos los parámetros de un modelo de regresión
H 0 : β 1=β 2=β 3=0

H 1 : Al menosun βi≠ 0

α =0.05

SCR
K
F=
SCE
n−k −1

1394.263
3
F= =99.102
28.138
6

F 3,6,0.05=4.7570

Vemos que el F calculado es mayor al F de la tabla por lo que se rechaza la hipótesis


nula de que los coeficientes sean iguales a cero

13

También podría gustarte