Está en la página 1de 12

4-25.

Tim Cooper planea invertir dinero en un fondo mutuo que está ligado a uno de
los principales índices del mercado, ya sea S&P 500 o Dow Jones Industrial
Averigüe (DJIA). Para obtener mayor diversificación, Tim piensa invertir en ambos.
Para determinar si esto ayudaría, Tim decide tomar 20 semanas de datos y
comparar los dos mercados. El precio de cierre de cada índice se muestra en la
tabla que sigue:

∑ 𝑥𝑦 − 𝑛𝑥̅ 𝑦̅ 235694648 − (20 ∗ 1128.3 ∗ 10442.65) 235694648 − 235648839.9


𝑏1 = = = = 6.5326
̅̅̅2
∑ 𝑥 2 − 𝑛𝑥 25468230 − (1128.32 ∗ 20) 25468230 − 25461217.8

𝑏0 = 𝑦̅ − 𝑏1 𝑥̅ = 10442.65 − (6.5326 ∗ 1128.3) = 10442.65 − 7370.73258 = 3071.917 ≅ 3072

𝑦 = 3072 + 6.5326𝑥

Al hacer los cálculos por el método de mínimos cuadrados se puede comprobar los
datos obtenidos en el software de Minitab. El cálculo de los coeficientes se presenta
a continuación:
Coeficiente de determinación:

𝑏0 Σ𝑦 + 𝑏1 Σ𝑥𝑦 − 𝑛𝑦̅ 2 (3071.917)(208853) + (6.5326)(235694648) − (20)(10442.652 ) 641579081.2 + 1539698858 − 2180978780


𝑟2 = = = = 0.7045 ≅ 70.5%
Σ𝑦 2 − 𝑛𝑦̅ 2 2181403377 − (20)(104423652 ) 2181403377 − 2180978780

Coeficiente de correlación:

𝑟 = √𝑟 2 = √0.7045 = 0.8393

Con el coeficiente de determinación se puede concluir que alrededor del 70.5% de


la varianza del marcado DJIA está explicado por el mercado S&P. Además, según
los datos de S&P, además de que sólo alrededor de 29.5% de la varianza queda sin
explicar.
En el caso del coeficiente de correlación, se puede observar que la pendiente de la
línea de regresión es positiva. Lo anterior también se puede comprobar con el
diagrama de dispersión.

¿Cuál esperaría que fuera el valor de DJIA cuando S&P es de 1,100?


𝑦 = 3072 + 6.5326𝑥 = 3070 + (6.5326 ∗ 1,100) = 10,257.86
De acuerdo a los datos obtenidos, se espera que cuando S&P tenga un valor de
1,100, el valor de DJIA será de aproximadamente 10,257.86.

4-26. Los gastos totales de un hospital se relacionan con muchos factores. Dos de
ellos son el número de camas en el hospital y el número de admisiones. Se
recolectaron datos en 14 hospitales, como se indica en la siguiente tabla:
Encuentre el mejor modelo de regresión para predecir los gastos totales de un
hospital. Analice la exactitud de este modelo. ¿Deberían incluirse ambas variables
en el modelo? ¿Por qué?
Para determinar cuál de las variables es mejor, se hará una comparación de los
resultados, utilizando el software de Minitab.

Ambas variables:
Número de camas como variable independiente:

Admisiones como variable independiente

Después de haber analizado, los coeficientes de determinación, la mejor opción


para el modelo es que se tome admisiones como única variable independiente.
𝑦 = 1.04 + 0.665𝑥
𝑟 2 = 96.9%
Con el coeficiente de determinación se puede concluir que alrededor del 96.9% de
la varianza de los gastos totales es estadísticamente explicado por el número de
admisiones. Además, que sólo, alrededor de 3.1% de la varianza queda sin explicar.
Para comprobar la anterior decisión, en seguida se muestra una prueba de
hipótesis:
𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0
Nivel de significancia: 𝛼 = 0.05
𝑆𝐶𝑅 ∑(𝑦̂ − 𝑦̅)2 29562.9228
𝑅𝑀𝐶 = = = = 29562.9228
𝑘 𝑘 1

𝑆𝐶𝐸 961.691375 961.691375


𝐸𝑀𝐶 = = = = 80.14094792
𝑛−𝑘−1 14 − 1 − 1 12
𝑅𝑀𝐶 29562.9228
𝐹= = = 368.88
𝐸𝑀𝐶 80.14094792

𝑑𝑓1 = 𝑘 = 1
𝑑𝑓2 = 𝑛 − 𝑘 − 1 = 14 − 1 − 1 = 12
𝐹0.05,1,12 = 4.75

𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎 = 368.88
Ya que 368.88 > 4.75 se rechaza la hipótesis nula, por lo que, se tienen datos
suficientes para concluir que existe una relación estadísticamente significativa entre
X y Y, de manera que el modelo es útil. La fortaleza de esta relación se mide por el
coeficiente de determinación que es igual a 96.9%. Así, podemos concluir que cerca
de 97% de la variabilidad en los gastos totales (Y) está explicada por el modelo de
regresión que se basa en el número de admisiones (X).
4-27. Se tomó una muestra de 20 automóviles y se registraron las millas por galón
(MPG), los caballos de potencia y el peso total. Desarrolle un modelo de regresión
lineal para predecir las MPG, usando los caballos de potencia como la única variable
independiente. Desarrolle otro modelo con el peso como la variable independiente.
¿Cuál de estos dos modelos es mejor? Explique.
Modelo de regresión para predecir MPG usando los caballos de potencia:

Modelo de regresión para predecir MPG usando el peso:


En base a las comparaciones del coeficiente de determinación, el modelo que ofrece
un valor más alto es en el que se utiliza los caballos de potencia para predecir MPG,
es por ello que ese modelo es útil y queda de la siguiente manera:
𝑦 = 53.9 − 0.269𝑥
𝑟 2 = 77%

Con el coeficiente de determinación se puede concluir que alrededor del 77% de la


varianza de las millas por galón es estadísticamente explicado por el valor de
caballos de potencia. Además, según el número de caballos de potencia, también
se puede concluir que sólo alrededor de 23% de la varianza queda sin explicar.
4-28. Use los datos del problema 4-27 para desarrollar un modelo de regresión
lineal múltiple. ¿Cuál es la comparación con cada uno de los modelos del problema
4-27?

La ecuación de la recta para este problema de regresión múltiple quedaría de la


siguiente manera:
𝑦 = 57.7 − 0.166𝑥1 − 0.00505𝑥2
𝑟 2 = 81.6%
Con el coeficiente de determinación se puede concluir que alrededor del 81.6% de
la varianza de las millas por galón está explicado por el valor de caballos de potencia
y el peso. Además, que también se puede concluir que sólo alrededor de 18.4% de
la varianza queda sin explicar.
Este modelo es mejor porque el coeficiente de determinación es mucho más alto
con las dos variables que si realizara individualmente.
4-29. Use los datos del problema 4-27 para encontrar el mejor modelo de regresión
cuadrática. (Existe más de uno.) ¿Cuál es la comparación con los modelos de los
problemas 4-27 y 4-28?

Datos: 𝑦 = 69.93 − 0.620𝑥1 − 0.0017474𝑥12


Y= MPG
𝑟 2 = 79.8%
X1= Caballos de fuerza
X2= Peso 𝑦 = 89.09 − 0.0337𝑥2 + 0.0000039𝑥22
𝑟 2 = 80%
𝑦 = 89.2 − 0.51𝑥1 + 0.001889𝑥12 − 0.01615𝑥2 + 0.00000162𝑥22
𝑟 2 = 88.3%

Este modelo tiene valor más alto en el coeficiente de determinación que en el


modelo que se obtuvo en el problema 4-28. Por lo que se puede concluir que
alrededor del 88.3% de la varianza de las millas por galón está explicado por el valor
de caballos de potencia y el peso. Además, que también se puede concluir que sólo
alrededor de 11.7% de la varianza queda sin explicar.
4-30. Se obtuvo una muestra de nueve universidades públicas y nueve privadas.
Se registraron el costo total por año (incluyendo hospedaje y alimentos) y la
mediana del SAT (máximo de 2,400) en cada escuela. Se piensa que las escuelas
con una mediana más alta en el SAT tendrían mejor reputación y como resultado
cobrarían más. Los datos se incluyen en la tabla. Use una regresión como ayuda
para contestar las siguientes preguntas con base en esta muestra. ¿Cobran más
colegiatura las escuelas con mayores puntuaciones del SAT? ¿Son más costosas
las escuelas privadas que las públicas cuando se toman en cuenta las puntuaciones
del SAT?

Analice qué tan precisos cree que sean estos resultados usando la información
relacionada con el modelo de regresión.

Modelo de regresión para predecir el costo total usando la mediana del SAT
𝑦 = $11,365 + 21.6𝑥
𝑟 2 = 22.1%

Modelo de regresión para predecir el costo total usando la mediana del SAT y la
categoría

𝑦 = $10,989 + 4.97𝑥1 + 14,066𝑥2

𝑟 2 = 78.7%

Con el modelo de regresión para predecir el costo total usando la mediana del Sat
y la categoría se obtiene un valor más alto en el coeficiente de determinación, por
lo que este es más útil y queda de la siguiente manera.
Con el coeficiente de determinación se puede concluir que alrededor del 78.7% de
la varianza del costo total está explicado por el valor de la mediana del SAT y de la
categoría de las universidades. Además, que también se puede concluir que sólo
alrededor de 21.2% de la varianza queda sin explicar.
4-31. En 2008, la nómina total para los Yankees de Nueva York era de $209.1
millones, en tanto que la nómina total para los Rayos de Tampa Bay era alrededor
de $43.8 millones, o cerca de un quinto de la de los Yankees. Muchas personas han
sugerido que algunos equipos pueden comprar temporadas ganadoras y
campeonatos gastando mucho dinero en los jugadores más talentosos disponibles.
La siguiente tabla presenta las nóminas (en millones de dólares) para los 14 equipos
de las Ligas Mayores de Béisbol en la Liga Americana, al igual que el número total
de victorias para cada uno en la temporada de 2008:
Desarrolle un modelo de regresión para predecir el número total de victorias con
base en la nómina de un equipo. De acuerdo con los resultados de salida de
computadora, analice qué tan preciso es el modelo. Utilice el modelo para predecir
el número de victorias de un equipo con nómina de $79 millones.

𝑌 = 78.4 + 0.0436 𝑋
𝑟 2 = 3.1%

Con el coeficiente de determinación se puede concluir que alrededor del 3.1% de la


varianza del número de victorias está explicado por la nómina en millones. Con esto,
podemos decir que el modelo es muy poco preciso.
Aplicando la ecuación que nos arrojó minitab, el número de victorias de un equipo
con nómina de 79 millones es igual a:

Y = 78.4 + 0.0436 (79) = 78.4 + 3.4444 = 81.84 ≈ 82


4-32. En 2009, Los Yankees de Nueva York ganaron 103 juegos de béisbol durante
la temporada regular. La tabla siguiente presenta el número de juegos ganados (G),
las carreras limpias permitidas (CLP) y el promedio de bateo (PROM) de cada
equipo de la Liga Americana. Las CLP son una medida de efectividad del equipo de
lanzamiento, y un número bajo es mejor. El promedio de bateo es una medida de
efectividad del bateador y un número grande es mejor.
a) Desarrolle un modelo de regresión que se pueda usar para predecir el número
de victorias con base en las CLP.

b) Desarrolle un modelo de regresión que se pueda usar para predecir el número


de victorias con base en el promedio de bateo.

c) ¿Cuál de los dos modelos es mejor para predecir el número de victorias?


Utilizar el modelo que predice el número de victorias con base a las CLP es mejor
que el otro modelo, ya que tiene un coeficiente de determinación más elevado que
el otro modelo.

d) Desarrolle un modelo de regresión múltiple que incluya las CLP y el promedio de


bateo. ¿Cuál es la comparación con los modelos anteriores?
Al emplear las dos variables para poder obtener el número de victorias podremos
tener un coeficiente de terminación más alto, con esto, podemos concluir que
alrededor del 84.1% de la varianza del número de victorias es estadísticamente
explicado por las carreras limpias permitidas y el promedio de bateo. Por lo que se
puede notar que el modelo es mucho más preciso
4-33. El precio de cierre para dos acciones se registró durante un periodo de 12
meses. El precio de cierre para el Dow Jones Industrial Average (DJIA) también se
registró para este mismo periodo. Los valores se muestran en la siguiente tabla:
a) Desarrolle un modelo de regresión para predecir el precio de la acción 1 según
el Dow Jones Industrial Average.

b) Desarrolle un modelo de regresión para predecir el precio de la acción 2 según


el Dow Jones Industrial Average.

c) ¿Cuál de las dos acciones tiene la correlación más alta con el Dow Jones en este
periodo?
La acción 2 ya que tiene un coeficiente de determinación mayor que del número 1.

También podría gustarte