Está en la página 1de 2

PRÁCTICA TEMA 1 2019 GRUPO A

En un laboratorio de desarrollo de materiales para construcción es estudia la relación


que existe entre la resistencia del hormigón y distintas variables que influyen en su
producción. Se han tomado medidas de dicha resistencia y de las variables que se
relacionan. Los datos están en el fichero RESISTENCIA.xlsx.

1. Importar el fichero Excel a sas. Seleccionar una muestra aleatoria de 75


observaciones creando el fichero resistencia_ma (Utilizar como semilla la fecha
de hoy SEED=21022019). Incluir en este fichero la variable Indicador=M para
saber que estos son los valores de la muestra. (solo sintaxis)
2. Con el fichero creado para estimar el modelo, realizar una selección de variables.
a. Comparando todos los posibles modelos según el criterio Cp de Mallows
¿Cuántas variables intervienen en el mejor modelo? ¿Qué variables son?
¿Cuánto vale su R cuadrado?
b. Utilizando el método por pasos STEPWISE con un nivel de significación de
entrada de 0.10. ¿Cuántas variables intervienen en el mejor modelo?
¿Qué variables son? ¿Cuánto vale su R cuadrado?

3. Realizar un análisis de multicolinealidad en el mejor modelo obtenido según el


criterio Cp y también sobre el modelo obtenido por el método STEPWISE,
calculando el VIF y el IC .
a. Comparar los dos modelos según el índice de inflación de la varianza
¿Qué variables presentan problemas de multicolinealidad?
b. ¿Qué nos dice el IC para cada uno de los modelos?
c. Comparar también los intervalos de confianza de los coeficientes del
modelo para las variables comunes, ¿Qué estimadores son más
eficientes?
d. Teniendo en cuenta los apartados a, b y c ¿Cuál de los dos modelos es el
mejor? ¿Cuál es la expresión algebraica del modelo elegido?
4. Crear un fichero para predecir la Resistencia en las observaciones no incluidas
en la muestra de estimación. Calcular las predicciones sobre estas observaciones
con el modelo elegido en el apartado anterior. ¿En que observación se ha
cometido mayor error?

5. Incluir la variable Temperatura en el modelo de regresión anterior incluyendo todas


las interacciones con las variables numéricas.

a) ¿Cómo ha variado el R2?

b) ¿Qué variables y que interacciones son ahora significativas?

6. Estimar las rectas de regresión de la Resistencia en función de las dos variables más
significativas incluyendo la variable cualitativa Temperatura con pendientes
diferentes.
a. Comparar la representación de las rectas de regresión de cada variable, su R2 y
los gráficos de residuos
b. ¿Qué variable explica mejor la Resistencia en función de la temperatura? ¿Con
que temperatura obtenemos mayores resistencias?

También podría gustarte