Está en la página 1de 4

No compartir

con otros grupos


PRACTICA CALIFICADA DE REGRESIÓN MULTIPLE

Indicaciones:
 Trabajar en Excel, una pregunta por cada hoja y grabar como:      
“Apellidos y Nombres_Practica de Regresión multiple.xls”
 Desarrollar únicamente los temas tratados en las clases dictadas en los dias previos.
 Se calificará el tiempo de entrega de la práctica.

1. La mayoría de las soluciones en computadora para la regresión múltiple empiezan con una matriz
de correlación. Cuando se analiza un problema de regresión que involucra más de una variable
dependiente, el primer paso generalmente es examinar esta matriz. Conteste las siguientes
preguntas sobre la matriz de correlación mostrada en la tabla siguiente:

Número de Número de la variable


la variable 1 2 3 4 5 6
1 1.00 0.55 0.20 -0.51 0.79 0.70
2   1.00 0.27 0.09 0.39 0.45
3     1.00 0.04 0.17 0.21
4       1.00 -0.44 -0.14
5         1.00 0.69
6           1.00

a) ¿Por qué todos los datos en la diagonal principal son igual a 1?


b) ¿Por qué la mitad inferior de la matriz está debajo de la diagonal principal está en blanco?
c) Si la variable 1 es la variable dependiente, ¿Cuáles variables independientes tienen el grado
más alto de asociación lineal con la variable 1?
d) ¿Que tipo de asociación existe entre las variables 1 y 4?
e) ¿Existe alguna evidencia de muticolinealidad en esta matriz de correlación?
f) En su opinión, ¿qué variable o variables deben ser incluidas en el mejor modelo de pronóstico?
g) Si los datos proporcionados en la matriz de correlación anterior se corren en un programa por
pasos, ¿qué variable independiente (2, 3, 4, 5, o 6) será la primera en entrar a la función de
regresión?

2. Deborah Pérez, supervisora de la cadena de tiendas de descuento Avelino Boulevard, quiere


pronosticar el tiempo que le toma a un cliente pagar en la caja. Decide usar las siguientes variables
independientes: número de artículos comprados y la cantidad total de la compra. Entonces,
recolecta los datos de muestra de 18 clientes, como se ve en la tabla:

Tiempo para Número de


Cantidad ($)
Cliente Pagar Artículos
(X1)
(Y) (X2)
1 3 36 9
2 1.3 13 5
3 0.5 3 2
4 7.4 81 14
5 5.9 78 13
6 8.4 103 16
7 5 64 12
8 8.1 67 11
9 1.9 25 7
10 6.2 55 11
11 0.7 13 3
12 1.4 21 8
13 9.1 121 21

Docente: Ing. Ferly Urday Luna


Tiempo para Número de
Cantidad ($)
Cliente Pagar Artículos
(X1)
(Y) (X2)
14 0.9 10 6
15 5.4 60 13
16 3.3 32 11
17 4.5 51 15
18 2.4 28 10

a) Determine la ecuación de regresión.


b) Cuando se compra un artículo adicional, ¿cuál es el aumento promedio en el tiempo que tardan
en pagar en la caja?
c) Calcule el residual del cliente 18.
d) Calcule el error estándar de la estimación.
e) Interprete el inciso (d) en los términos de las variables utilizadas en este problema.
f) Calcule un pronóstico del tiempo para pagar si un cliente compra 14 artículos y paga una
cantidad de 70 dólares.
g) Calcule el intervalo estimado de 95% para su predicción del inciso f.
h) ¿A qué conclusión debe llegar Deborah?

3. La tabla siguiente contiene datos de gastos en alimentos, ingreso anual y el tamaño de la familia
para un ejemplo de 10 familias.

Gastos
Ingreso
anuales en Tamaño de
Famili Anual
alimentos la familia
a (Miles)
(Cientos) X2
X1
Y
A 24 11 6
B 8 3 2
C 16 4 1
D 18 7 3
E 24 9 5
F 23 8 4
G 11 5 2
H 15 7 2
I 21 8 3
J 20 7 2

a) Construya la matriz de correlación para las tres variables. Interprete las correlaciones en la
matriz.
b) Verifique la multicolinealidad e interprete.
c) Ajuste un modelo de regresión múltiple al relacionar los gastos en alimentos con el ingreso y el
tamaño de la familia. Interprete los coeficientes de regresiones parciales del ingreso y tamaño
de la familia. ¿Parecen razonables?

4. Las ventas de cerveza de CERVESUR para su cerveza AREQUIPEÑA se analizan usando como
variables independientes la temperatura y el número de personas (de 18 años de edad o más) que
están en la calle. Se seleccionó en forma aleatoria 20 días para medir estas tres variables.

Docente: Ing. Ferly Urday Luna


Y = Número de paquetes de seis cervezas vendidos al día
X1 = Temperatura máxima diaria.
X2 = Conteo diario de tráfico

Los datos son analizados mediante un análisis de regresión múltiple. El resultado parcial en
computadora aparece en la tabla P.10.
a) Analice la matriz de correlación.
b) Pruebe la significancia de los coeficientes parciales de regresión en un nivel de significancia de
0.01.
c) Pronostique el volumen de cerveza vendida un día en que la temperatura más alta es de 60
grados y el conteo de tráfico es de 500 personas.
d) Calcule R2 e interprete su significado en los términos de este problema.
e) Calcule el error estándar de la estimación.
f) Explique cómo son afectadas las ventas de cerveza con el incremento de un grado en la
temperatura máxima.
g) Manifieste sus conclusiones para este análisis sobre la exactitud de la ecuación de pronóstico y
también sobre las contribuciones de las variables independientes.

5. En un estudio se investigó la relación entre la duración de una auditoría (Delay), el intervalo de


tiempo entre el fin de año fiscal de la empresa y la fecha del informe de auditoría y variables que
describen al cliente y al auditor. Algunas de las variables independientes que se incluyeron en esta
investigación fueron las siguientes:

Industry Variable indicadora que vale 1 si la empresa es industrial, o 0 si es un banco,


prestamista o aseguradora.
Public Variable indicadora que vale 1 si la empresa es de ventas en mostrador, o 0 en
cualquier otro caso.
Quality Medida de la calidad general de los controles internos, a juicio del auditor, en una
escala de cinco puntos, que va de “aparentemente ninguno” (1) a “excelente” (5).
Finished Medida que va de 1 a 4, a juicio del auditor; 1 indica “todo el trabajo se hace al final
del año”, y 4 indica “la mayor parte del trabajo se hace antes del final de año”.

Suponga que en un estudio semejante se obtuvieron los datos siguientes sobre 40 empresas:

Docente: Ing. Ferly Urday Luna


Delay Industry Public Quality Finished
62 0 0 3 1
45 0 1 3 3
54 0 0 2 2
71 0 1 1 2
91 0 0 1 1
62 0 0 4 4
61 0 0 3 2
69 0 1 5 2
80 0 0 1 1
52 0 0 5 3
47 0 0 3 2
65 0 1 2 3
60 0 0 1 3
81 1 0 1 2
73 1 0 2 2
89 1 0 2 1
71 1 0 5 4
76 1 0 2 2
68 1 0 1 2
68 1 0 5 2
86 1 0 2 2
76 1 1 3 1
67 1 0 2 3
57 1 0 4 2
55 1 1 3 2
54 1 0 5 2
69 1 0 3 3
82 1 0 5 1
94 1 0 1 1
74 1 1 5 2
75 1 1 4 3
69 1 0 2 2
71 1 0 4 4
79 1 0 5 2
80 1 0 1 4
91 1 0 4 1
92 1 0 1 4
46 1 1 4 3
72 1 0 5 2
85 1 0 5 1

a) Obtenga la ecuación de regresión estimada con todas las variables independientes.


b) Tuvo buen ajuste la ecuación de regresión estimada obtenida en el inciso a) Explique por qué.
c) Trace un diagrama de dispersión con Delay en función de Finished. Qué indica este diagrama
acerca de la relación entre Delay y Finished?
d) Con base en sus observaciones sobre la relacion entre Delay y Finished, obtenga una ecuación
de regresión estimada alternativa, de la que obtuvo en el inciso a), para explicar tanta variación
de Delay como sea posible.

Docente: Ing. Ferly Urday Luna

También podría gustarte