Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Los siguientes datos listan los precios, el nmero de pginas (P) y el tipo de encuadernacin (E), donde s =
pasta suave y d = pasta dura, de novelas publicadas por cierta editorial.
Figura 1.- Grca de dispersin de los datos, considerando solamente el tipo de encuadernado de pasta suave.
1
Figura 2.- Grca de dispersin y recta de regresin estimada de los datos, considerando solamente el tipo de
encuadernado de pasta suave.
De acuerdo al modelo planteado y la grca anterior, el precio promedio de una novela de entre 112 y 425 pginas
con encuadernacin de pasta suave crece conforme aumenta el nmero de pginas de sta, en aproximadamente
0.024050 unidades monetarias por pgina, y el precio del encuadernado de pasta suave es de aproximadamente
8.338182 unidades monetarias.
Por otro lado, el precio promedio estimado de una novela de 100 pginas con este tipo de encuadernado es de
aproximadamente 10.74315 unidades monetarias, mientras que el precio promedio estimado de una novela de 400
pginas es de aproximadamente 17.95805 unidades monetarias. Observe que el rango del nmero de pginas de los
datos originales est entre 112 y 425 pginas, por lo que la estimacin para una novela de 100 pginas podra no
ser adecuada.
2
(b) Suponga el modelo de regresin lineal simple E Y jx x; Y
( i i ) = 0 + 1 i donde i :=precio de la novela , i
xi :=nmero de pginas de la novela i
con encuadernado de pasta dura. Ajustando el modelo se obtienen las
: ; : y : :
estimaciones ^0 = 17 80451 ^1 = 0 03895. As, el ajuste de mnimos cuadrados es ^ = 17 80451 + 0 03895 . x
Figura 3.- Grca de dispersin de los datos, considerando solamente el tipo de encuadernado de pasta dura.
3
Figura 4.- Grca de dispersin y recta de regresin estimada de los datos, considerando solamente el tipo de
encuadernado de pasta dura.
De acuerdo al modelo planteado y la grca anterior, el precio promedio de una novela de entre 146 y 292
pginas con encuadernacin de pasta dura crece conforme aumenta el nmero de pginas de sta, en aproximada-
mente 0.03895 unidades monetarias por pgina, y el precio del encuadernado de pasta dura es de aproximadamente
17.80451 unidades monetarias.
Por otro lado, el precio promedio estimado de una novela de 100 pginas con este tipo de encuadernado es de
aproximadamente 21.69964 unidades monetarias, mientras que el precio promedio estimado de una novela de 400
pginas es de aproximadamente 33.38504 unidades monetarias. Observe que el rango del nmero de pginas de los
datos originales est entre 146 y 292 pginas, por lo que las estimaciones anteriores podran no ser adecuadas.
4
10. En la tabla siguiente se presentan datos sobre el rendimiento de gasolina en millas de 32 automviles de
marcas y modelos diferentes.
Rendimiento
y
de la gasolina ( )
x
Cilindrada ( 1 ) x
Peso ( 10 )
x
Nmero de gargantas del carburador ( 6 )
(millas/galn) (pulgadas cbicas) (libras)
18.9 350 3910 4
17 350 2860 4
20 250 3510 1
18.25 351 3890 2
20.07 225 3365 1
11.2 440 4215 4
22.12 231 3020 2
21.47 262 3180 2
34.7 89.7 1905 2
30.4 96.9 2320 2
16.5 350 3885 4
36.5 85.3 2009 2
21.5 171 2655 2
19.7 258 3375 1
20.3 140 2700 2
17.8 302 3890 2
14.39 500 5290 4
14.89 440 5185 4
17.8 350 3910 4
16.41 318 3660 2
23.54 231 3050 2
21.47 360 4250 2
16.59 400 3850 4
31.9 96.9 2275 2
29.4 140 2150 2
13.27 460 5430 4
23.9 133.6 2535 2
19.73 318 4370 2
13.9 351 4540 2
13.27 351 4715 2
13.77 360 4215 4
16.5 350 3660 4
5
(a)
En la grca anterior se puede observar cmo el rendimiento de la gasolina decrece conforme aumenta el tamao
de la cilindrada del motor.
(b) Suponga el modelo de regresin lineal simple E (Yi jxi1 ) = 0 + 1 xi1 ; donde Yi :=rendimiento de la gaso-
lina del automvil i, xi1 :=cilindrada del motor del automvil i. Ajustando el modelo se obtienen las estimaciones
^0 = 33:727439; ^1 = 0:047428. As, el ajuste de mnimos cuadrados es
y^ = 33:727439 : x:
0 047428 1
6
Figura 6.- Grca de dispersin y recta de regresin estimada de los datos, tomando como variable respuesta el
rendimiento de la gasolina y la cilindrada del motor como nica variable regresora.
galn
7
11. (a)
Figura 7.- Grca de dispersin del rendimiento de la gasolina contra el peso del automvil.
(b) Suponga el modelo de regresin lineal simple E (Yi jxi10 ) = 0 + 10 xi10 ; donde Yi :=rendimiento de la
gasolina del automvil i, xi10 :=peso del automvil i. Ajustando el modelo se obtienen las estimaciones ^0 =
:
39 962195 ; ^10 = :
0 005552. As, el ajuste de mnimos cuadrados es
y^ = 33:727439 : x :
0 047428 10
Figura 8.- Grca de dispersin y recta de regresin estimada de los datos, tomando como variable respuesta el
rendimiento de la gasolina y el peso del automvil como nica variable regresora.
8
(c) La tabla de anlisis de varianza obtenida fue
(d) Para este ajuste se obtuvo R2 = 0:7043; por lo que aproximadamente el 70.43 % de la variabilidad total del
rendimiento de la gasolina es explicada por el modelo con x10 como nica variable regresora.
2 2
Por ltimo, si ^1 y ^2 son los estimadores de 2 del modelo de los ejercicios 10 y 11, respectivamente, se sigue
que
282 20 :
^12 =
32 2
= :
9 4067 ;
R 2
1 = 0:772;
365 93 :
^22 =
30
= 12 19767: ;
R 2
2 = :
0 7043 ;
entonces
^12 ^22
y
R12 R22 ;
lo nos dice que la suma de cuadrados de los errores es menor, y que la variabilidad del rendimiento de la gasolina
explicada por el modelo ajustado es mayor cuando se usa el tamao de la cilindrada del motor como variable
regresora. Tomando sto en cuenta, yo preferira usar el modelo que tiene el tamao de la cilindrada del motor
como variable regresora.
9
12. (a) Suponga el modelo de regresin lineal mltiple E Y jx ; x
( i i1 i6 ) = 0 + 1 i1 + 6 i6 donde i :=rendimiento x x ; Y
de la gasolina del automvil i, xi1
:=cilindrada del motor del automvil y i6 :=nmero de gargantas del car- i x
burador del automvil i . Ajustando el modelo de regresin se obtienen las estimaciones ^0 = 32 910041 ^1 = : ;
: ; :
0 053025 ^6 = 0 929500. As, el ajuste de mnimos cuadrados es ^ = 32 910041 y : : x :
0 053025 1 + 0 929500 6 . x
(b) La tabla de anlisis de varianza obtenida fue
entonces
SCR
F0 =
2
SCE
32 3
972:9
=
2
365:93
29
= :
53 30455
y
P r(F > F0 ) = 1:934e 10
donde F ~ F2;29 , por lo tanto, la prueba es altamente signicativa y rechazamos la hiptesis de que 1 = 6 = 0,
es decir, al menos una de las variables regresoras contiene informacin signicativa acerca de la variable respuesta.
(c) Para este ajuste se obtuvo R2 = 0:7862; por lo que aproximadamente el 78.62 % de la variabilidad total del
rendimiento de la gasolina es explicada por el modelo con x1 y x6 como variables regresoras. Este valor de R es
2
mayor al obtenido en el problema 10, y es razonable ya que este nuevo modelo es el resultado de agregar una nueva
variable regresora al modelo planteado en el problema 10.
q 1
^
T1 = ;
^ 2 ( X 0 X )111
entonces, sustituyendo los datos se obtiene
T1 = :
8 628 ;
10
por lo que
donde T tiene distribucin t student con 29 grados de libertad, lo cual nos dice que la prueba es altamente
signicativa y por lo tanto rechazamos H0 ; es decir, la variable regresora x1 contribuye de manera altamente signi-
cativa en el modelo.
q 6
^
T6 = ;
^ 2 ( X 0 X )661
entonces, sustituyendo los datos se obtiene
T6 = 1:387;
por lo que
donde T t student con 29 grados de libertad, lo cual nos dice que la prueba no es signicativa
tiene distribucin
> 0:176 y no se rechaza la hiptesis H0 : ^6 = 0, es decir, la variable regresora x6 no
al nivel de signicancia de
contribuye de manera signicativa al modelo dado que x1 se encuentra en el modelo y se puede eliminar la variable
regresora x6 del modelo.
(f ) El rendimiento promedio estimado de gasolina para un motor de 275 pulgadas cbicas y 6 gargantas es de
23.90523 millas/galn.
(g) Por ltimo, considero que este modelo explica mejor el comportamiento de la variable respuesta, ya que la
suma de cuadrados de los residuos es menor en este modelo y a su vez, el valor de R2 es mayor.
13. (a) Suponga el modelo de regresin lineal mltiple
E (Yi jxi1 ; :::; xi9 ) = 0 + 1 xi1 + 2 xi2 + 3 xi3 + 4 xi4 + 5 xi5 + 6 xi6 + 7 xi7 + 8 xi8 + 9 xi9 ; donde
11
(Precio de la venta de la casa)/1000
g:l: Suma de cuadrados Media cuadrtica Valor F P r(> F )
Impuestos (locales, escuela, municipal)/1000 ( 1 ) x 1 636.16 636.16 73.1525 6.238e-07
Cantidad de baos ( 2 )x 1 29.18 29.18 3.3551 0.08836
x
Tamao del terreno (pies cuadrados x 1000) ( 3 ) 1 4.71 4.71 0.5416 0.47391
Supercie construida (pies cuadrados x 1000) (x4 ) 1 0.03 0.03 0.0032 0.95537
Cantidad de cajones en cochera (x5 ) 1 8.78 8.78 1.0091 0.33216
Cantidad de habitaciones (x6 ) 1 13.03 13.03 1.4982 0.24115
Cantidad de recmaras (x7 ) 1 9.14 9.14 1.0515 0.32254
Edad de la casa (aos) (x8 ) 1 0.64 0.64 0.0741 0.78943
Cantidad de chimeneas (x9 ) 1 5.63 5.63 0.6478 0.43435
Residuos 14 121.75 8.70
entonces
SCR
F0 =
9
SCE
24 10
707:2962
=
9
121:75
14
= :
9 036867
q j
^
Tj = ;
^ 2 X 0 X )jj1
(
^
1 1.869 0.0827
^
2 1.628 0.1258
^
3 0.304 0.7654
^
4 0.625 0.5423
^
5 1.461 0.1661
^
6 -0.172 0.8656
^
7 -0.413 0.6857
^
8 -0.557 0.5865
^
9 0.805 0.4343
12
de donde se puede observar que ocho de los coecientes de regresin no son signicativos, y no se rechaza la
hiptesisH0 : ^j = 0 vs ^j 6= 0; para j = 2; :::; 9: As, podemos eliminar alguna de las variables regresoras, digamos
x6 por tener el p-valor (P r (jT j > jT6 j)) ms grande, y luego analizar el modelo reducido para vericar si es posible
eliminar ms variables regresoras.
(d) De acuerdo a lo que representan las variables regresoras, yo esperara que el precio de la venta de una casa
aumente cuantas ms habitaciones y recmaras tenga, pero segn las estimaciones obtenidas, ^6 y ^7 tienen signo
negativo, lo que implicara lo contrario a lo que se espera, es decir, que el precio de la casa disminuye conforme
aumenta el nmero de habitaciones y de recmaras. Esto podra indicar que hay un error de signo en estas dos
estimaciones.
(e) Si consideramos el modelo de regresin lineal mltiple E (Yi jxi4 ; xi5 ; xi6 ; xi8 )=0 +4 xi4 +5 xi5 +6 xi6 +8 xi8 ,
obtenemos el ajuste de mnimos cuadrados
13