Está en la página 1de 3

ANÁLISIS DE REGRESIÓN

PRÁCTICA 2: Regresión Múltiple

1. Una empresa que vende notebooks y que también brinda el servicio técnico de las mismas
está interesada en estimar el tiempo en minutos que demora un técnico en realizar el
servicio técnico (Y) en función de las siguientes variables:
X1: cantidad de desperfectos a ser reparados.
X2: antigüedad de la notebook (meses).
X3: años de experiencia del técnico que realiza el servicio.
Para ello, relevó la información necesaria a partir de 18 servicios técnicos brindados en el
mes. Los datos se encuentran en el archivo ‘Datos_práctica 2_1.xlsx’.

1.1. Plantee un modelo de regresión lineal múltiple que incluya las tres variables
explicativas consideradas.
1.2. Estime el modelo e interprete los coeficientes de regresión estimados.
1.3. Construir la tabla ANOVA y realizar el test de regresión.
1.4. Obtenga la matriz (X’X)-1 y a partir de ella obtenga las variancias estimadas de los
coeficientes de regresión. Corrobore los resultados obtenidos a través de los resultados que se
encuentran en la parte “estimadores del parámetro”. También obtenga la covariancia estimada
entre b1 y b2.
1.5. Construya un intervalo de confianza para el coeficiente de regresión que mide el
cambio en la duración promedio del service a medida que la cantidad de desperfectos
aumenta en una unidad, mientras la antigüedad de la notebook y los años de experiencia
del técnico permanecen constantes en el modelo. Mediante la estadística t-student
plantee un test de hipótesis para este coeficiente de regresión.
1.6. ¿Considera que la “antigüedad de la notebook” aporta significativamente en
explicación de la duración promedio del service cuando las otras 2 variables están en el
modelo? Utilizar la estadística F y obtener la suma de cuadrados parcial correspondiente
mediante la diferencia del modelo completo y el modelo reducido.
1.7. El gerente de la empresa cree que para una notebook con una antigüedad
determinada y con una cierta cantidad de desperfectos, los años de experiencia del
técnico es una variable muy relevante en la explicación de la duración promedio del
service. Según el modelo ajustado ¿El gerente está en lo cierto?
1.8. Realizar el test de hipótesis que pruebe que las variables “cantidad de desperfectos” y
“años de experiencia del técnico” no son necesarias en la explicación de la duración
promedio del service cuando la variable “antigüedad de la notebook” ya está en el
modelo.
1.9. Se necesita realizar una estimación de la duración del próximo service de una
notebook comprada hace 19 meses con 4 desperfectos. El service lo realizará el técnico
Juan Cruz que cuenta con 2,5 años de experiencia. Acompañe la estimación puntual con
un intervalo de predicción del 95%.
1.10. Realice el análisis de residuos. ¿Qué sugieren los gráficos de regresión parcial y de
residuo parcial?
1.11. Proponga una solución.

2. Una ONG de defensa al consumidor desea estimar la emisión promedio de monóxido de


carbono (CO) de los cigarrillos de una marca en particular a partir del peso de los mismos y
de los niveles de alquitrán y nicotina. Para ello, realizó un estudio en donde incluyó 24

Práctica 2 – Análisis de Regresión - Licenciatura en Estadística Página 1


cigarrillos de esa marca y en primer lugar midió el peso de cada uno. Luego, utilizando un
método estándar, una máquina construida para tal fin “fuma” el cigarrillo hasta un punto
cercano a la punta del filtro y mide los niveles de monóxido de carbono (mg/cig), alquitrán
(mg/cig) y nicotina (mg/cig) contenidos en el humo del cigarrillo. Los datos se encuentran
en el archivo “Datos_practica 2_2.xlsx”.
2.1. Plantee un modelo de regresión lineal múltiple que estime la emisión promedio de
monóxido de carbono de los cigarrillos a partir del peso y de los niveles de alquitrán y
nicotina.
2.2. Estime el modelo planteado e interprete los coeficientes.
2.3. Evalúe si las tres variables explicativas consideradas contribuyen en la explicación de la
emisión promedio de monóxido de carbono de los cigarrillos.
2.4. Realice los test parciales con la estadística F.
2.5. Evalúe la multicolinealidad. Obtenga los valores de los FIV (factor de inflación de la
variancia) para cada variable mediante la fórmula correspondiente:
1
FIV ( X j ) 
1  R 2j
Donde R2j es el coeficiente de determinación de una regresión entre la variable Xj y demás
variables regresoras. Compárelos con los que se obtienen con R. ¿Qué sugieren los
resultados?
2.6. Plantee y estime el modelo sin considerar la variable “nivel de alquitrán”.
2.7. Realice el análisis de residuos.

3. Se desea explicar el salario de los profesores de matemática de un Instituto (Y) a través de


las siguientes variables:
X1: calidad de las publicaciones (puntaje que varía de 0 a 10).
X2: años de experiencia.
X3: índice de buen desempeño en sus funciones (puntaje que varía de 0 a 10).
Para ello, se realizó un estudio en donde se incluyeron 24 profesores seleccionados al azar.
Los datos relevados se encuentran en el archivo “Datos_practica2_3.xlsx”.
3.1. Postular un modelo de regresión lineal que incluya las tres variables regresoras
mencionadas. Escribirlo también en notación matricial.
3.2. Estimar el modelo postulado e interpretar los coeficientes estimados.
3.3. Construir la tabla ANOVA y realizar el test de regresión.
3.4. Realizar los test parciales con la estadística t-student.
3.5. Realizar los test parciales con la estadística F. Comparar resultados con los del punto
anterior.
3.6. Calcular el R2 y el R2 ajustado. Interpretar.
3.7. Construir un intervalo de confianza para 1 del 95%. Interpretar
3.8. ¿Cuál es el salario promedio esperado para un profesor que tiene 10 años de
experiencia, un puntaje de calidad de las publicaciones de 5.3 y un índice de buen
desempeño en sus funciones de 6.4? Acompañar esta estimación con un intervalo de
confianza del 95% para la respuesta media. Interpretar.
3.9. Realice el análisis de residuos.

4. En una industria se evalúa la relación de las ventas mensuales de una empresa (en millones
de pesos) con las siguientes variables:
X1: inversión en publicidad (en millones de pesos)

Práctica 2 – Análisis de Regresión - Licenciatura en Estadística Página 2


X2: volumen de producción no defectuosa (en millones de unidades)
X3: costos de producción (en millones de pesos)
Para ello, se registran los valores de estas variables durante los 12 últimos años y se estima
el siguiente modelo:
Yˆ  186  5 * X 1  10 * X 2  8 * X 3
R 2  0.876
s(b1 )  0.3 s(b2 )  4.7 s (b3 )  0.2
4.1. Interprete los coeficientes en término del problema.
4.2. Obtenga un intervalo de confianza del 95% para el coeficiente de regresión
correspondiente a X3.
4.3. ¿Las tres variables en forma conjunta contribuyen en forma significativa a la
explicación de las ventas mensuales promedio?
4.4. ¿Los costos de producción contribuyen en la explicación de las ventas mensuales
promedio, cuando se considera la inversión en publicidad y el volumen de la producción
no defectuosa?
4.5. ¿La inversión en publicidad contribuye en la explicación de las ventas mensuales
promedio, cuando se considera el volumen de la producción no defectuosa y los costos
de producción?
4.6. ¿El volumen de la producción no defectuosa contribuye en la explicación de las ventas
mensuales promedio, cuando se considera la inversión en publicidad y los costos de
producción?

Práctica 2 – Análisis de Regresión - Licenciatura en Estadística Página 3

También podría gustarte