Está en la página 1de 6

a. Estime la puntuación en la evaluación general de un televisor cuyo precio es $3200.

Y = 0,0127(3200) + 12,017=52,66
22. PC World publicó evaluaciones de las cinco mejores impresoras láser de oficina y de las cinco
mejores impresoras láseres corporativos (PC World, febrero 2003). La impresora de oficina mejor
evaluada fue la Minolta-QMS PagePro 1250W, que en la evaluación general obtuvo una
puntuación de 91 puntos. La impresora láser corporativa mejor evaluada fue la Xerox Phase
4400/N, que en la evaluación general obtuvo una puntuación de 83 puntos. En la tabla siguiente se
da rapidez, en páginas por minuto (ppm), en la impresión de texto y precio de cada impresora.

a. Dé la ecuación de regresión estimada empleando velocidad como variable independiente.

b. Calcule r2. ¿Qué porcentaje de la variación del precio puede ser explicado por la velocidad de la
impresora?

c. ¿Cuál es el coeficiente de correlación muestral entre velocidad y precio? ¿Refleja este


coeficiente una relación fuerte o débil entre la velocidad de la impresora y el costo?

6. En el béisbol, el éxito de un equipo se suele considerar en función del desempeño en bateo y en


lanzamiento del equipo. Una medida del desempeño en el bateo es la cantidad de cuadrangulares
que anota el equipo y una medida del desempeño en lanzamiento es el promedio de carreras
ganadas por el equipo que lanza. En general, se cree que los equipos que anotan más cuadrangulares
(home run) y tienen un promedio menor de carreras ganadas ganan un mayor porcentaje de juegos.
Los datos siguientes pertenecen a 16 equipos que participaron en la temporada de la Liga Mayor de
Béisbol de 2003; se da la proporción de juegos ganados, la cantidad de cuadrangulares del equipo
(HR, por sus siglas en inglés) y el promedio de carreras ganadas (ERA, por sus siglas en inglés)
(www.usatoday.com, 17 de enero de 2004).
a. Obtenga la ecuación de regresión estimada para predecir la proporción de juegos ganados en
función de la cantidad de cuadrangulares.

b. Obtenga la ecuación de regresión estimada para predecir la proporción de juegos ganados en


función del promedio de carreras ganadas por los miembros del equipo que lanza.

c. Obtenga la ecuación de regresión estimada para predecir la proporción de juegos ganados en


función de la cantidad de cuadrangulares y del promedio de carreras ganadas por los miembros del
equipo que lanza. d. En la temporada de 2003, San Diego ganó sólo el 39.5% de sus juegos, siendo
el más bajo de la liga nacional. Para mejorar para el año siguiente, el equipo trató de adquirir nuevos
jugadores que hicieran que la cantidad de cuadrangulares aumentara a 180 y que el promedio de
carreras ganadas por el equipo que lanza disminuyera a 4.0. Use la ecuación de regresión estimada
obtenida en el inciso

c) para estimar el porcentaje de juegos que ganaría# Variable dependiente: Datos proporción de
juegos ganados

Y =
c(0.519,0.623,0.543,0.426,0.457,0.562,0.537,0.525,0.420,0.512,0.410,0.531,0.463,0.395,0.621,0.5
25)

Primera variable independiente: Datos HR

X1 = c(152,235,172,182,198,157,191,124,196,144,124,166,163,128,180,196)

Segunda variable independiente: Datos ERA

X2 =
c(3.857,4.106,3.842,5.127,5.269,4.059,3.880,3.162,5.058,4.027,4.517,4.072,4.664,4.904,3.734,4.6
42)

Agrupar las dos variables independientes X1 y X2 en una sola matrix X

X = cbind(X1,X2)

Ajustar el modelo de regresión lineal múltiple para X1 usando función lm()

res1 = lm(Y~X1)

res1

Ajustar el modelo de regresión lineal múltiple para X2 usando función lm()

res2 = lm(Y~X2)
res2

Ajustar el modelo de regresión lineal múltiple para X1 y X2 usando función lm()

res = lm(Y~X)

res

Predecir valores con el modelo estimado con X1 y X2

x1 = cualquier valor

x2 = cualquier valor

yest = 0.709188 + 0.001401*x1 - 0.102597*x2

Calcular tabla ANOVA

anova(res

Calcular Coeficiente de determinación R2

Ybar = mean(Y) Media de Y

Yest = 0.709188 + 0.001401*X1 - 0.102597*X2 Y estimado

SSE = sum((Y-Yest)^2) Suma de cuadrados del error

SSR = sum((Yest - Ybar)^2) Suma de cuadrados de la regresión

SST = SSR + SSE Suma de cuadrados del total

R2 = SSR/SST

R2

Valor de la estadística de prueba F

p=2 Número de variables independientes (X1, X2)

n = length(Y) Número de datos

F = (SSR/p)/(SSE/(n-p-1))

alfa = 0.05

F_tabla = qf(1-alfa,p,n-p-1)

Decisión: Si F > F_tabla, entonces se rechaza Ho.

Resumen de resultados del modelo

Con el resumen de resultados pueden sacar los datos para hacer

la prueba t para cada beta

Para beta1

t1 = 5.709822

t1_tabla = qt(1-(alfa/2),n-p-1)

Decisión: Si t1 > t1_tabla, entonces se rechaza Ho.


Para beta2

t2 = -8.043286

t2_tabla = qt((alfa/2),n-p-1)

Decisión: Si t2 < t2_tabla, entonces se rechaza Ho.

14. En el ejercicio 4, se dio la siguiente ecuación de regresión estimada, la cual relacionaba las ventas
con la inversión en inventario y los gastos de publicidad. Los datos empleados para desarrollar este
modelo eran los datos de 10 tiendas; con estos datos STC

16 000 t SCR y 12 000.

a. Calcule R2 para la ecuación de regresión estimada.

Coeficiente de correlación múltiple -- 96.66%

Coeficiente de determinación R^2 -- 93.44%

R^2 Ajustado -- 88.52%

Error Típico -- 64.67%

Observaciones -- 8

¿Parece explicar este modelo una gran cantidad de la variabilidad de los datos? Explique.
Nos permite ver una variabiliada pero que no se hace demasiado evidente

24. Véanse los datos del ejercicio 6. Emplee la cantidad de cuadrangulares del equipo y el promedio
de carreras ganadas por el equipo que lanza para predecir la proporción de juegos ganados.

Analisis de regresion: Propagación de ganados versus HR, ERA


La ecuación de regresión es
Propagación de ganados = 0.709 + 0.00140 HR - 0.103 ERA

Predictor Coeficiente SE Coeficiente T P


Constante 0.70900 0.06008 11.80 0.000
HR 0.0014024 0.0002455 5.71 0.000
ERA -0.10263 0.01277 -8.04 0.000

S = 0.0283114 R-Sq = 85.8% R-Sq(adj) = 83.6%

Análisis de varianza
fuente DF SS MS F P
Regresión 2 0.063049 0.031525 39.33 0.000
Residual Error 13 0.010420 0.000802
Total 15 0.073469

Fuente DF Seq SS
HR 1 0.011253
ERA 1 0.05

Use la prueba F para determinar la significancia global de la relación. ¿Cuál es la


conclusión empleando 0.05 como nivel de significancia?

H_0: β_1=β_2=0

H_1:Al menos uno de los parámetros no es igual a cero

P = 0.000 < α = 0.05


Se rechaza H_0 y se acepta H_1.
Si existe una relación significativa entre la cantidad de cuadrangulares del equipo
(HR) y el promedio de carreras ganadas (ERA) con la proporción de juegos ganados
del equipo.

f=((0.063049 )/2)/(0.010420/13)=39.3299
¿Cuál es la conclusión empleando 0.05 como nivel de significancia?

CUADRANGULARES
H_0: β_1=0
H_1: β_1≠0
P = 0.000 < α = 0.05
Se rechaza H_0 y se acepta H_1.
Si existe una relación significativa en la relación entre la cantidad de cuadrangulares
del equipo y la proporción de juegos ganados del equipo.
PROMEDIO DE CARREAS GANADAS
H_0: β_2=0
H_1: β_2≠0
P = 0.000 < α = 0.05
Se rechaza H_0 y se acepta H_1.
Si existe una relación significativa en la relación entre el promedio de carreras
ganadas del equipo y la proporción de juegos ganados del mismo.