Samuel Martı́nez
August 13, 2019
1 Introducción
Los modelos de regresión lineal múltiple son la extensión natural de los modelos
de regresión lineal simple con varias variables independientes es decir:
y = β0 + β1 x1 + ... + βk xk
Donde β0 , ..., βk son los coeficientes estimados para cada una de las variables
independientes.
1
1.2 Ejercicios
1. Borron’s realiza revisiones anuales de los corredores de bolsa en lı́nea, en
la que se incluyen tanto corredores a los que se les puede contactar vı́a
un explorador de Internet, ası́ como corredores que tienen acceso directo
y que ponen al cliente en contacto directo con el servidor de una red de
corredores de bolsa. La oferta y el desempeño de cada corredor se evalúa
en seis áreas, empleando para cada área una escala de 0 a 5. Los resultados
se ponderan para obtener una evaluación general y a cada corredor se le
asigna una evaluación final que va de cero a cinco estrellas. Tres de las
áreas evaluadas son ejecución de la operación, facilidad de uso y gama
de ofertas. Un 5 en ejecución de la operación significa que la llegada del
pedido y el proceso de ejecución fluyó con facilidad de un paso a otro.
En facilidad de uso, 5 significa que el sitio es de fácil uso y que se puede
ajustar para ver lo que le interesa al usuario ver. Un 5 en gama de ofertas
significa que todas las transacciones pueden realizarse en lı́nea. En los
datos siguientes se presentan las puntuaciones obtenidas en ejecución de
la operación, facilidad de uso y gama de ofertas y el número de estrellas
obtenidas por los integrantes de una muestra de 10 corredores de bolsa
(Barron’s, 10 de marzo de 2003).
2
de regresión estimada que recomienda? Compare R2 con el valor de
R2 para el inciso a). Analice las diferencias.
2. La sección “Guı́a para el usuario” del sitio en la Red de la revista Car and
Driver proporciona información sobre pruebas viales (road test) de au-
tomóviles, camiones, SUV (acrónimo en inglés de Sport Utility Vehicle) y
vans. Abajo se presentan las puntuaciones generales para calidad general,
modelo de vehı́culo, frenado, manejo, economı́a de combustible, confort
interior, aceleración, confiabilidad, ajuste y terminado, transmisión dadas
a diversos vehı́culos empleando una escala del 1 (lo peor) a 10 (lo mejor).
Aquı́ se presenta una parte de los datos de 14 automóviles Deportivos/GT
(www.caranddriver.com, 7 de enero de 2004).
3
3. Un estudio realizado a lo largo de 10 años por la American Heart Asso-
ciation proporcionó datos sobre la relación que tienen la edad, la presión
sanguı́nea y el fumar sobre el riesgo de sufrir un infarto. Los datos que se
dan a continuación se obtuvieron como parte de este estudio. El riesgo se
interpreta como la probabilidad (multiplicada por 100) de que el paciente
sufra un infarto en los próximos 10 años. Para fumar, defina una variable
ficticia que tome el valor 1 si la persona es fumadora y el valor 0 si no es
fumadora.
4
4. En los datos siguientes se presenta peso en vacı́o, caballos de fuerza y
velocidad en 14 de milla de 10 automóviles deportivos y GT. Supóngase
que se tiene también el precio de cada uno de estos automóviles. Todo el
conjunto de datos es el siguiente.
1
Automóvil deportivo y GT Precio (miles de $) Peso en vacio (lb) Caballos de fuerza (lb) velocidad en 4 de milla (mph)
Accura Integra Type R 25035 2577 195 90.7
Accura NSX-T 93758 3066 290 108.0
BMW Z3 2.8 40900 2844 189 93.2
Chevrolet Camaro Z28 24865 3439 305 103.2
Chevrolet Corvette Convertible 50144 3246 345 102.1
Dodge Viper RT/10 69742 3319 450 116.2
Ford Mustang GT 23200 3227 225 91.7
Honda Prelude Type SH 26382 3042 195 89.7
Mercedes-Benz CLK320 44988 3240 215 93.0
Mercedes-Benz SLK230 42762 3025 185 92.3
Mitsubishi 3000GT VR-4 47518 3737 320 99.0
Nissan 240SX SE 25066 2862 155 84.6
Pontiac Firebird Trans Am 27770 3455 305 103.2
Porsche Boxster 45560 2822 201 93.2
Toyota Supra Turbo 40989 3505 320 105.0
Volvo C70 41120 3285 236 97.0
5
5. La revista SmartMoney evaluó 65 zonas metropolitanas para determinar si
el valor de las casas (home values) estaba cambiando (are headed). La pun-
tuación para una ciudad ideal era 100 y significaba que todos los factores
medidos eran tan favorables como era posible. Zonas cuya puntuación
era 60 o más, eran zonas en las que era posible una revalorización de los
precios; zonas cuya puntuación era menor a 50 eran zonas que podrı́an
ver una disminución en el valor de la vivienda. Dos de los factores evalu-
ados fueron resistencia a la recesión y accesibilidad de la zona. Estos dos
factores se evaluaron empleando una escala de 0 (evaluación más baja) a
10 (evaluación más alta). Acontinuación se presentan los datos obtenidos
en una muestra de 20 ciudades evaluadas por SmartMoney (SmartMoney,
febrero de 2002).
(a) Dé una ecuación de regresión estimada que sirva para dar la pun-
tuación conociendo la resistencia a la recesión. Empleando como
nivel de significancia 0.05, pruebe la significancia de la relación
(b) ¿Proporciona la ecuación obtenida en el inciso a) un buen ajuste a
los datos? Explique.
(c) Obtenga una ecuación de regresión estimada que sirva para predecir
la puntuación a partir de la resistencia a la recesión y la accesibilidad.
Empleando como nivel de significancia 0.05 pruebe la significancia
global.
6
6. The State of Vermont is divided into 10 Health Planning Districts—they
correspond roughly to counties. The following data represent the percent-
age of live births of babies weighing under 2500 grams (Y ), the fertility
rate for females 17 years of age or younger (X1 ), total high-risk fertil-
ity rate for females younger than 17 or older than 35 years of age (X2 ),
percentage of mothers with fewer than 12 years of education (X3 ), per-
centage of births to unmarried mothers (X4 ), and percentage of mothers
not seeking medical care until the third trimester (X5 ).
Y X1 X2 X3 X4 X5
6.1 22.8 43.0 23.8 9.2 6
7.1 28.7 55.3 24.8 12.0 10
7.4 29.7 48.5 23.9 10.4 5
6.3 18.3 38.8 16.6 9.8 4
6.5 21.1 46.2 19.6 9.8 5
5.7 21.2 39.9 21.4 7.7 6
6.6 22.2 43.1 20.7 10.9 7
8.1 22.3 48.5 21.8 9.5 5
6.3 21.8 40.0 20.6 11.6 7
6.9 31.2 56.7 25.2 11.6 9
7
7. Una empresa de paqueterı́a evalúa los tiempos de entrega, por lo que
recaba información sobre los tiempos de recorrido de rutas junto con las
distancias recorridas y el número de paquetes entregados. En la tabla
siguiente se muestran los datos.
8
9. En la tabla siguiente se muestran las calificaciones que obtuvieron 15 es-
tudiantes en 4 asignaturas.
9
10. En un estudio de gastos con tarjeta de crédito se reunieron datos sobre
ingreso anual, número de miembros de la familia y gasto anual con tarjeta
de crédito y se obtuvieron los siguientes resultados:
10
Ingreso anual Miembros de la familia Gastos anuales con tarjeta
640000 3 4160
220000 4 3580
290000 5 3890
390000 3 3980
360000 2 3130
390000 5 4190
540000 4 3830
230000 7 4130
270000 3 2920
260000 8 4610
610000 3 4270
300000 8 3070
220000 3 3080
460000 3 4820
660000 5 5150
11
11. En una muestra de 10 supermercados se recopiló información sobre la
proporción de clientes que preferı́an una marca de determinado producto,
junto con el promedio de ingresos mensuales y el ı́ndice de escolaridad de
las familias del área de influencia de cada supermercado, con los resultados
que se muestran a continuación:
12
12. Para evaluar la efectividad de los anuncios en periódicos y en radio para
la promoción de cierto artı́culo, se recopilaron datos sobre cantidades de
anuncios en ambos medios y en 20 ciudades de tamaño similar y se obtu-
vieron los siguientes resultados:
13
13. En un estudio de hábitos de ahorro, se recopiló información sobre 15 fa-
milias:
14
14. En la tabla siguiente se resumen los datos de 20 modelos de automóviles.
Auto Tamaño del motor (cm3) Peso (kg) Longitud Rendimiento de gasolina (km/l)
1 3020 2148 4.50 5.67
2 1400 1225 3.23 10.00
3 4400 2500 4.78 4.00
4 3510 2263 4.60 5.00
5 3500 2035 4.50 6.00
6 3050 1925 4.30 6.00
7 850 1013 2.98 11.00
8 3050 1983 4.25 5.67
9 1300 1495 3.83 7.33
10 2320 1600 3.25 66.67
11 3180 2070 4.45 5.67
12 850 1010 3.08 9.67
13 850 985 2.93 11.33
14 4000 2343 4.68 4.33
15 2500 1675 3.93 7.33
16 2250 1685 4.03 7.67
17 910 880 2.75 14.67
18 2500 1688 3.95 8.00
19 970 1133 3.13 10.67
20 1110 1078 3.28 9.00
15
15. Un despacho de auditores analiza la relación entre el tiempo que sus au-
ditores dedican a su labor, junto con el tiempo de computadora que se
utiliza y la magnitud de los errores contables que se detectan y encuentra
los siguientes datos para los meses de un año determinado
Mes Magnitud de los errores contables Horas de trabajo de los auditores Horas de computadora
Ene. 500000 21 34
Feb. 470000 19 29
Mar. 490000 20 32
Abr. 500000 18 30
Mayo 480000 18 31
Jun. 510000 19 33
Jul. 490000 21 35
Ago. 500000 21 33
Sept. 490000 20 33
Oct. 480000 20 32
Nov. 520000 21 29
Dic. 550000 22 31
16
16. Jon Grant, supervisor de la Carven Manufacturing Facility, está exami-
nando la relación existente entre la calificación que obtiene un empleado
en una prueba de aptitud, su experiencia previa y el éxito en el trabajo.
Se estudia y se pondera la experiencia de un empleado en trabajos an-
teriores, y se obtiene una calificación entre 2 y 12. La medida del éxito
en el empleo se basa en un sistema de puntuación que incluye producción
total y eficiencia, con un valor máximo posible de 50. Grant tomó una
muestra de seis empleados con menos de un año de antigüedad y obtuvo
lo siguiente:
17
17. The Money Bank desea abrir nuevas cuentas de cheques para clientes que
emitirán al menos 30 cheques al mes. Como ayuda en la selección de
los nuevos clientes, el banco ha estudiado la relación entre el número de
cheques expedidos y la edad y el ingreso anual de ocho de sus clientes
actuales. La variable EDAD se registró al año más cercano, y la variable
INGRESO anual se registró en miles de dólares. Los datos se presentan a
continuación:
(a) Desarrolle una ecuación de estimación que utilice las variables edad
e ingreso para predecir el número de cheques emitidos por mes.
(b) ¿Cuántos cheques al mes se esperarı́a de un cliente de 35 años de
edad con un ingreso anual de $22,500?
18
18. David Ichikawa es un agente de bienes raı́ces que trabaja con urbanistas
que construyen casa nuevas. Aunque gran parte de su trabajo es vender
las casas terminadas, también consulta con los constructores cuánto deben
pagar por cada lote. En un área residencial, recolectó la siguiente infor-
mación de ventas cerradas de lotes aptos para construir; registró PRECIO
de venta (en miles de dólares), TAMAÑO (pies lineales de frente en la
calle) y una variable indicativa (0 o 1) de si el lote tiene VISTA. De las
listas de impuestos puede estimar el área del lote a partir de un avalúo
basada en el frente.
19
19. Camping-R-Us, un fabricante nuevo de equipo para acampar, planea com-
ercializar tiendas de campaña para dos personas que se pueden utilizar en
casi cualquier clima. Para establecer un precio justo, toma en consid-
eración ocho tiendas de campaña comparables que se encuentran en el
mercado, en términos de peso y superficie. Los datos obtenidos son los
siguientes:
20
20. Home Depot es una cadena en crecimiento de centros de descuento en
materiales para mejorar las casas. La tabla proporciona información de los
reportes anuales, que son los datos tı́picos que usan los analistas financieros
para predecir el ingreso futuro de la compañı́a.
Año Número de tiendas Tamaño promedio de tienda ingreso total Número de empleados
1 31 77 433 4000
2 50 80 701 5400
3 60 80 1001 6600
4 75 82 1454 9100
5 96 86 2000 13000
6 118 88 2758 17500
7 145 92 3815 21500
8 174 95 5136 28000
9 214 98 7148 38900
10 264 100 9239 50600
11 340 103 12477 67300
21