Está en la página 1de 12

10-16 Ajustando el modelo y=β 0 + β 2 x 2 + β 7 x 7 + β 8 x 8+ ϵ , mediante Excel obtenemos la

siguiente salida.
Resumen

Estadísticas de la regresión
Coeficiente de0,87346326
correlación múltiple
Coeficiente de0,76293807
determinación R^2
R^2 ajustado 0,73330533
Error típico 1,79711325
Observaciones 28

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 3 249,453501 83,15116711 25,7464561 1,1219E-07
Residuos 24 77,5107844 3,229616016
Total 27 326,964286

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción -7,63448821 7,84780196 -0,97281866 0,34034693 -23,8315554 8,56257897
x2 0,0039765 0,00071362 5,572317651 9,838E-06 0,00250367 0,00544933
x7 0,24777098 0,08895857 2,785240111 0,01027515 0,06416951 0,43137245
x8 -0,00389329 0,00129573 -3,00469783 0,00613684 -0,00656756 -0,00121903

Ahora Ajustando el modelo y=β 0 + β 2 x 2 + β 7 x 7 + ϵ se obtiene la siguiente salida

Resumen

Estadísticas de la regresión
Coeficiente de0,82082959
correlación múltiple
Coeficiente de0,67376121
determinación R^2
R^2 ajustado 0,64766211
Error típico 2,06560822
Observaciones 28

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 2 220,295853 110,1479264 25,8154928 8,3022E-07
Residuos 25 106,668433 4,266737313
Total 27 326,964286

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción -27,2997533 4,97747067 -5,48466382 1,0694E-05 -37,551046 -17,0484606
x2 0,00428141 0,0008119 5,273332791 1,8404E-05 0,00260927 0,00595354
x7 0,43152849 0,07425432 5,811493206 4,6471E-06 0,27859885 0,58445813
a) La cantidad que contribuye la variable X8 (yardas corridas por el oponente) al aumento
de la suma de cuadrados de la regresión es:

SC R ( β 8| β0 , β 2 , β 7 )=SC R ( β 0 , β 1 , β 7 , β 8 )−SC R ( β 7 , β 1 , β 0 )
¿ 249,4535−220,2959
¿ 29,1576
Es decir la variable yardas corridas por el oponente contribuye al aumento de la suma
de cuadrados de la regresión un total de 29,1576.
b) Tenemos las hipótesis H 0 : β 8=0 contra β 8 ≠ 0 , con α =0 , 05 . Por lo tanto de la
información anterior tenemos que el estadístico de prueba está dado por:

SC R ( β 8|β 0 , β 2 , β7 ) /r 29,1576 /1 29,1576


F 0= = 2
= =¿9,0282
MS E 1,797 3,3296

Ahora como f(0.05,1,24)= 4,2596, entonces con un nivel de significancia del 5% dado
que F 0=9,0282> 4,2596 f(0.05,1,24) y p-valor=0.0061<0.05 hay evidencias para
rechazar H 0 es decir la variable X8 (yardas corridas por el oponente) contribuye
significativamente en la construcción del modelo.

10-17. Ajustando el modelo y=β 0 + β 1 x 1 + β 6 x 6 + ϵ , mediante Excel obtenemos la siguiente


salida.
Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple
0,91047788
Coeficiente de determinación 0,82896997
R^2
R^2 ajustado 0,81342178
Error típico 2,83369745
Observaciones 25

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 2 856,241077 428,120539 53,3161898 3,6627E-09
Residuos 22 176,656507 8,02984122
Total 24 1032,89758

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción 33,4491086 1,57648838 21,2174787 3,8612E-16 30,1796718 36,7185454
Variable X 1 -0,05434911 0,00632868 -8,58774639 1,784E-08 -0,06747399 -0,04122423
Variable X 2 1,07821727 0,69965403 1,54107204 0,13756107 -0,37277638 2,52921092
a) Se tiene el siguiente juego de hipótesis:

H 0 : β 1=β 6=0 Contra β j ≠ 0 , para algun j ; j=1 , 6, con α =0 , 05


De ajuste de modelo y salida de Excel tenemos que F0=53,3162 con y un p-valor
asociado a la prueba de 3,6627E-09 < 0,05, por tanto con un nivel de significancia
del 5% se rechaza H 0, es decir el modelo es significativo, esto es al menos un
variable explica el modelo.

b) Primero veamos si X1 (desplazamiento) es significativa en el modelo para esto


tenemos las hipótesis
H 0 : β 1=0 Contra β 1 ≠ 0 , con α =0 , 05
Ahora de Excel tenemos que el estadístico para esta prueba es M to=-8,5877 y un
p-valor asociado a la prueba de 1,784E-08 < 0.05 por tanto se rechaza H 0 ,es decir
la variable x1 es significativa en el modelo.

Para la variable X6 (carburador) es significativa en el modelo para esto tenemos las


hipótesis

H 0 : β 6=0 Contra β 6 ≠ 0 , con α =0 , 05


Ahora de Excel tenemos que el estadístico es t0=1,5411 y un p-valor asociado a la
prueba de 0,1376 > 0.05 por tanto no hay evidencia suficiente para rechazar
rechaza H 0 ,es decir la variable x1 no es significativa en el modelo.
Con un nivel de significancia del 5% solo la variable X1 (desplazamiento) contribuye
en la respuesta del consumo de gasolina, la variable X6 carburador no resulto
significativa por lo que puede ser sacada del modelo.

10-18 Al ajustar el modelo de regresión y=β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 +ϵ , a una muestra de


n=25, mediante Excel.

a) El P-Valor de cada uno de los estadísticos

P-valor=p(T>ltd)

β1, p-valor= 9,1782E-05

β2, p-valor=5,42232E-08

β3, p-valor=0,338242153

b) Empleando α=0.05 en la regresión X3:


Como para β3 tenemos t0=0.998 y un P-valor asociado a la prueba de
0.3382>0.05, entonces con un nivel de significancia del 5% no se rechaza H 0,
es decir la variable X3 no es significativa para el modelo, por tanto puede ser
excluida del modelo.

10-26 Con base a los datos de absorción del suelo en el ejercicio 10-2.

a) Para el coeficiente de regresión β1

Intervalo de confianza 95%


2
σ = MSE= SSE/10-3 = 56.45/7= 8,0643

t0.025,7=2,365 y de 10-2

1,17991 -7,31E-03 7,30E-04


−1
(X ´ X ) = -7,31E-03 7,98E-05 -1,24E-04
7,30E-04 -1,24E-04 4,66E-04

220
X ´ Y =¿ 3,68E+04
9,97E+03

-1,91221386

^β = 0,093089187

0,253232016

X ´ 0 ( X ´ X ) X 0 = 0,211088

Intervalo de confianza
^β−t
α
,n− p
√ σ^ C
2
ii ≤ β ≤ ^β+ t α
, n−p
√ σ^ 2
Cii
2 2

0,093089187−2,365 √ ( 8,0643 ) ( 7,9799E-5 ) ≤ β ≤0,093089187 +2,365 √ ( 8,0643 )( 7,9799E-5 )


0,0330944426 ≤ β ≤ 0,1530839314

b) Intervalo de confianza del 95% para el índice de absorción promedio del suelo

^µ y / x _ t α ,n− p √ σ^ 2 x ´ 0 ( x ´ x )−1 x 0 ≤ μ y / x ≤ ^µ y / x + t α ,n− p √ σ^ 2 x ´ 0 ( x ´ x )−1 x 0


0 0 0
2 2

^µ y
=29,36722432
x0

29,36722432-2,365√ (8,0613)(0,211088) ≤ μ y / x 0≤ 29,36722432+2,365√ (8,0613)(0,211088)

26,28215122 ≤ μ y / x 0≤ 32,45229742

c) Intervalo de predicción del 95% de absorción del suelo

^y 0−t α
2
,n− p
√ σ^ (1+ X ´ ( X ´ X )
2
0
−1
X 0 ) ≤ y 0 ≤ ^y 0 +t α
2
, n− p
√ σ^ (1+ X ´
2
0 ( X ´ X )−1 X 0 )

29,36722432−2,365 √ ( 8,0643 ) ¿ ¿

21,97623911≤ y 0 ≤ 36,75820953

10-27. los datos que aparecen en el ejercicio 10-4. (Mediante Excel tenemos la siguiente
salida)

19.0697579391 -6.941422E-04 -2.051015E-01 -2.625815E-03


−1
( X ´ X ) =¿ -0.0006941422 1.576808E-07 4.663778E-06 4.071321E-08

-0.2051014870 4.663778E-06 2.450331E-03 2.453632E-05

-0.0026258153 4.071321E-08 2.453632E-05 5.198538E-07


a) Intervalo de confianza del 95% para β 8

^β −t
8 α
,n− p
√ σ^ C
2
88 ≤ β 8 ≤ β^ 8 +t α
,n− p
√ σ^ C
2
88
2 2

Luego del ejercicio 10-16 tenemos que ^β 8= -0,00389, σ^ 2= 3,2296 y elemento de la


diagonal de ( X ´ X )−1 correspondiente β 8 es C 88 = 5,1985E-7 y t 0 ,05 ,24 = 2,0595, entonces
2

−0,00389−2,0596 √ ( 3,2296 ) ( 5,1985E-7 ) ≤ β 8 ≤−0,00389+2,0596 √ (3,2296)(5,1985E-7)

-0,00656 ≤ β 8 ≤−0,00122

b) El error estándar de u^ y / x , cuando X 2 =2000 yardas, X 7 =60%, X 8=1800 yardas viene dado por:
0


1
2000 −1
√ σ^ x ´ 0 ( x ´ x ) x 0 = ( 3,2296 ) ( 1,2000 ,¿60,1800 ) ( x ´ x ) 60
2 −1

1800

=√ (3,2296)(0,07660325)

=√ 0,24739908

=0.497

1
2000
c) Para X 0= la respuesta media está estimada está dada por:
60
1800

−7,63448
^ 0,00347
X y/ x = X ´ 0 ^β = 1,2000,60,1800 =8,17689
0
0,24777
−0,00389
Un intervalo de confianza del 95% para el número promedio de juegos ganados es:

^μ y / x -t 0.05/ 2 ,25 √ σ^ 2 x ´ 0 (x ´ x )−1 x 0 ≤ μ y / x ≤ ^μ y / x +t 0.05/ 2 ,25 √ σ^ 2 x ´ 0 (x ´ x )−1 x 0


0 0 0

8,17684 - (2,0596) (0.497) ≤ μ y / x ≤ 8,17684 + (2,0596) (0.497)


0

7,1532188≤ μ y / x ≤ 9,2004612
0

10-28. Los datos de consumo de gasolina, mediante Excel obtuvimos la siguiente salida

a) Considerando los datos del ejercicio 10-5. Tenemos que β 0=33,449, ^β 1= -0,054, ^β 6
=1,078, se( ^β 1 ¿ =0,0063, se( ^β 6)=0,699 y t 0.01/ 2 ,22= 2,818756, luego un intervalo de
confianza para ^β y ^β está dado por:
1 6

^β - t α
1 ,n− p
√ σ c 11 ≤ β 1≤ ^β 1+ t α ,n− p √ σ 2 c 11
2

2 2

-0,054 - (2,818756) (0,0063) ≤ β 1≤ -0,054 + (2,818756) (0,0063)

-0,0717 ≤ β 1≤ -0,0362

1,078 - (2,818756) (0,699) ≤ β 1≤ 1,078 + (2,818756) (0,699)

-0,8923 ≤ β 1≤ 3,0483

b) Un intervalo de confianza del 99% de la media de Y cuando x 1=300 y x 6=4 es:

x 0=(1,300,4) y σ 2=8,0298412

^μ y / x - t α / 2 ,n− p √ σ^ 2 x ´ 0 ( x ´ x )−1 x 0 ≤ μ y / x ≤ ^μ y / x + t α / 2 ,n− p √ σ^ 2 x ´ 0 ( x ´ x )−1 x 0


0 0 0

^μ y / x = ^β 0 + β 1 x 1 + β 2 x 2
0

=33,449 - 0,054(300) + (1,078)(4)

=21,561
1
−1
σ^ x ´ 0 (x ´ x ) x 0 = 8,029 1, 300 ,4 (x ´ x )
2 −1
300
4

= (8,029) (0.1473782)

=1,1832

Ahora se( ^μ y / x ) = √ 1,1832 = 1,0877


0

21,561 – (2,818) (1,0877) ≤ μ y / x ≤ 21,561 + (2,818) (1,0877)


0

18,495 ≤ μ y / x ≤ 24,626
0

c) Ajustando el modelo para X 1 , X 2 , X 6 y X 10 tenemos que

^y =32,02229−0,06399 X 1 +0,01269 X 2+1,06181 X 6 +0,00069 X 10

Además se ( β 1 )=0,023098 , se ¿ )= 0,05096, se ( β 6 )=0,99469 , se ( β10 ) =¿

0,002226 y t 0,005, 20=2,8453. Por tanto para β 1 tenemos

−0,06399−2,8453 ( 0,023098 ) ≤ β 1 ≤−0,06399+2,8453 ( 0,023098 )

-0,12971 ≤ β1 ≤0,00173

Para β 2 tenemos

0,01269-2,8453(0,05096)≤ β 2 ≤ 0,01269+2,8453(0,05096)

-0,13233 ≤ β 2 ≤0,15772
Para β 6 tenemos

1,06181−2,8453 (0,99469)≤ β 6 ≤ 1,06181+2,8453(0,99469)

-1,76845 ≤ β 6 ≤ 3,89207
Para β 10 tenemos

0,00069-2,8453(0,00226)≤ β10 ≤ 0,00069+2,8453(0,00226)

-0,00574 ≤ β10 ≤ 0,00713

d) Los intervalos c tiene mayor anchura que los del inciso a. esto indicio de que la
variable X 2 y X 10 no significativa del modelo, además se puede ver que aumenta el
error estimado.

10-29. Ajustando el modelo y=β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 +ϵ , mediante Excel obtenemos la


siguiente salida.
Resumen

Estadísticas de la regresión
Coeficiente de0,86298887
correlación múltiple
Coeficiente de0,74474978
determinación R^2
R^2 ajustado 0,59889252
Error típico 15,5793327
Observaciones 12

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 4 4957,24074 1239,31019 5,10601768 0,03030277
Residuos 7 1699,00926 242,715608
Total 11 6656,25

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95,0%Superior 95,0%
Intercepción -102,713236 207,858851 -0,49414897 0,63632864 -594,221316 388,794843 -594,221316 388,794843
x1 0,60537054 0,36889695 1,64102883 0,14479662 -0,26693215 1,47767322 -0,26693215 1,47767322
x2 8,9236442 5,30052224 1,68354056 0,13614567 -3,61009923 21,4573876 -3,61009923 21,4573876
x3 1,43745673 2,39162051 0,60103881 0,56675924 -4,21782712 7,09274059 -4,21782712 7,09274059
x4 0,01360931 0,73382144 0,0185458 0,98572098 -1,72160267 1,74882129 -1,72160267 1,74882129

a) Intervalo de confianza del 95% sobre β 1 , β 2 , β 3 y β 4 .

Un intervalo de confianza al 95% para β 1 es


-0,26693215≤ β1 ≤1,47767322

Un intervalo de confianza al 95% para β 2 es

-3,61009923 ≤ β 2 ≤ 21,4573876

Un intervalo de confianza al 95% para β 3 es

-4,21782712 ≤ β3 ≤7,09274059

Un intervalo de confianza al 95% para β 4 es

-1,72160267 ≤ β 4 ≤ 1,74882129

b) Intervalo de confianza del 95% para la media de Y

X !=(1 , 75 , 24 , 90 , 98)

^μ Y =287,5618
X0

−1
σ^ X ! (X ´ X ) X 0=101,08259
2

Se ^μ Y = √ σ^ X ! ( X ´ X ) X 0=10,053984
( )
2 −1

X0

≤μ Y ≤
287,5618−2,3646(10,053984) X0
287,5618+2,3646 (10,053984)

≤ μ Y ≤ 311,33573
263,78794
X0

c) Intervalo de predicción del 95% para el consumo de energía eléctrica

^y 0 ±t α
2
,n− p
√ σ^ (1+ X ´ ( X ´ X )
2
0
−1
X 0 )=18,54179

^y 0−t α
2
,n− p
√ σ^ (1+ X ´ ( X ´ X )
2
0
−1
X 0 ) ≤ y 0 ≤ ^y 0 +t α
2
, n− p
√ σ^ (1+ X ´
2
0 ( X ´ X )−1 X 0 )

Lo que indica es que un intervalo de predicción al 95% es


243,71745 ≤ y 0 ≤ 331,4062

UNIVERSIDAD DE CÓRDOBA

REGRESIÓN LINEAL MÚLTIPLE

ESTADÍSTICA II

-ONAR ANDRES GENES IGLESIA


-LUISA FERNANDA PALENCIA MURILLO
-YORYANIS MORALES DE HOYOS

DOC. VICTOR HUGO MORALES

PROGRAMA DE MATEMÁTICAS
13/04/2018

También podría gustarte