Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tarea 5 RYE
Tarea 5 RYE
Considere los datos proporcionados en la siguiente tabla (autos. csv), los cuales pertenecen
al rendimiento en kilómetros por litro de diferentes marcas de automóviles.
1
EJERCICIO 1. Importe los datos y construya el modelo (transforme las variables “entero” por
“factor”). Para fines empíricos, el modelo de regresión se representa de la siguiente manera:
a) Muestre las pruebas de hipótesis individual y conjunta, y determine si los coeficientes son
estadísticamente significativos a un nivel 1%. Establezca cuál es el rendimeinto en autos
manuales y automáticos.
El rendimiento de autos
manuales será la adición
entre 26.58 y 5.27 = 31.85
El rendimiento de autos
automáticos está cargado
en el intercepto por lo
tanto es de 26.58
2
EJERCICIO 2. El Efecto sobre los coeficientes que acompañan a la variable explicativa.
La introducción de las variables ficticias (dummy) puede realizarse también, de forma tal que, se
modifique la pendiente de alguno o de todas las regresadas del modelo (esquema multiplicativo).
Las variables binarias se incluyen multiplicadas por la variable explicativa cuyo coeficiente
suponemos que cambia. Es por ello que ahora queremos estudiar el efecto diferencial de los
caballos de fuerza (CFi) sobre el Rendimiento (KPLi) de acuerdo con la trnasmisión
Manual/Automática, se agrega además la variable “peso” El modelo de regresión se representa de
la siguiente manera:
Donde la variable CF*MANi toma el valor de CFi, cuando la transmisión es manual (MANUAL=1),
y vale cero cuando la transmisión es AUTOMÁTICA (MANUAL=0). Por tanto, hay un efecto
diferencial de los CFi, según la transmisión que posea el auto:
Otra gran ventaja de las variables binarias, es que podemos combinar en un mismo modelo el
efecto diferencial sobre todos los coeficientes, tanto del término independiente como en el resto.
La especificación más general para este modelo seria:
V. Estadísticamente V. Estadísticamente no
significativas (|t.value|) significativas (|t.value|)
Intercepto = 11.48 Peso = 1.96
Man = 3.25 Man:cf = 1.45
Cf = 3
Man:peso = 2.78
4
b) Realice un contraste de variables redundantes (hipótesis lineal = linearHypothesis) sobre
aquellas variables que resulten estadísticamente no significativas, y determine si deben permanecer en
el modelo, con un nivel de significancia del 5%.
Un análisis adicional que podemos realizar cuando disponemos de varias variables tanto
cualitativas como cuantitativas es el estudio del efecto diferencial de un factor sobre el
comportamiento del otro (CIL = # de cilindros y MAN = Transmisión del auto).
Los datos sobre CIL corresponden al número de cilindros, donde: cil = 1 si el automóvil es de 4
cilindros; cil = 2 si el automóvil es de 6 cilindros; cil = 3 si el automóvil es de 8 cilindros.
Si quisiéramos considerar un efecto diferente del tipo de transmisión (manual/automática) sobre
el rendimiento (KPLi), según el número de cilindros del automóvil. El modelo que recoge este
comportamiento es:
5
KPLi = B0 + B1*MANUALi + B2*c1i + B3*c2 i + B4*(MANi*c1i) + B5*(MANi*c2i) + B6*CFi +
B7* DESPi + B8*PESOi + Ui
a) Estime los efectos diferenciales de la transmisión respecto al número de cilindros que se derivan del
modelo anterior. Para ello, deberá construir tres variables Dummy para cada número de cilindros que
poseen los autos. Posteriormente, indique si las variables son estadísticamente significativas a un nivel
de significancia del 5%.
6
b) Construya un modelo que incluya todas las variables dummy, evitando caer en la trampa de la
variable dicotoma.
c) Identifique cuales son aquellas variables que no son estadísticamente significativas, posteriormente
deberá realizar una prueba de contraste de variables redundantes (hipótesis lineal = linearHypothesis)
sobre aquellas variables que resulten estadísticamente no significativas, y determine si deben
permanecer en el modelo, con un nivel de significancia del 5%.
7
d) ¿Cuál sería el mejor modelo de acuerdo con la metodología “STEPWISE”, (comando stepAIC())?.
Considerando que el modelo más completo es el modelo del inciso b).
8
e) Estime los siguientes dos modelos:
1) KPLi = B0 + B1*CFi + Ui
Aplique una prueba de análisis de varianza para determinar si el segundo modelo es mejor que el
primero (al nivel de significancia del 1%).