Está en la página 1de 9

PRÁCTICA CLASE

NOV/2020 A-71 7 ACTUARÍA

Dr. EDUARDO ROSAS


Rosado Yañez Eliza 1729281

PRUEBAS SOBRE AUTOS

Considere los datos proporcionados en la siguiente tabla (autos. csv), los cuales pertenecen
al rendimiento en kilómetros por litro de diferentes marcas de automóviles.

Las variables incluidas dentro de la base de datos son las siguientes:

#[1] KPL Kilometros/litro (RENDIMIENTO)


#[2] CIL Numero de cilindros
#[3] DESP Desplazamiento (cu.in.)
#[4] CF Caballos de fuerza
#[5] PESO peso del automovil (1000 kilos)
#[6] MAN Transmision (0 = automatico, 1 = manual)

cil = 1 si el automóvil es de 4 cilindros


cil = 2 si el automóvil es de 6 cilindros
cil = 3 si el automóvil es de 8 cilindros

1
EJERCICIO 1. Importe los datos y construya el modelo (transforme las variables “entero” por
“factor”). Para fines empíricos, el modelo de regresión se representa de la siguiente manera:

KPLi = B0 + B1*MANi + B2*CF + Ui

a) Muestre las pruebas de hipótesis individual y conjunta, y determine si los coeficientes son
estadísticamente significativos a un nivel 1%. Establezca cuál es el rendimeinto en autos
manuales y automáticos.

Los coeficientes son


estadísticamente
significativos a un nivel del
1%.

El rendimiento de autos
manuales será la adición
entre 26.58 y 5.27 = 31.85

El rendimiento de autos
automáticos está cargado
en el intercepto por lo
tanto es de 26.58

b) ¿Cómo se podria construir la variable para AUTOMÁTICO, que es la contraparte de MANUAL?


Construya dicha variable, y vuelve a estimar el modelo, pero esta vez incluyendo la nueva
variable y omitiendo el intercepto. ¿Qué auto proporciona un mejor rendimiento, los manuales
o los automáticos?

Los autos que proporcionan un


mejor rendimiento son los
manuales con un rendimiento
superior a los automáticos de
5.27

2
EJERCICIO 2. El Efecto sobre los coeficientes que acompañan a la variable explicativa.

La introducción de las variables ficticias (dummy) puede realizarse también, de forma tal que, se
modifique la pendiente de alguno o de todas las regresadas del modelo (esquema multiplicativo).
Las variables binarias se incluyen multiplicadas por la variable explicativa cuyo coeficiente
suponemos que cambia. Es por ello que ahora queremos estudiar el efecto diferencial de los
caballos de fuerza (CFi) sobre el Rendimiento (KPLi) de acuerdo con la trnasmisión
Manual/Automática, se agrega además la variable “peso” El modelo de regresión se representa de
la siguiente manera:

KPLi = B0 + B1*CFi + B2*(CFi*MANi) + B3*PESO i+ Ui

Donde la variable CF*MANi toma el valor de CFi, cuando la transmisión es manual (MANUAL=1),
y vale cero cuando la transmisión es AUTOMÁTICA (MANUAL=0). Por tanto, hay un efecto
diferencial de los CFi, según la transmisión que posea el auto:

Si la transmisión es automática, CFi*MANi = 0, el modelo es:

KPLi = B0 + B1*CFi + B2*(CFi*MANi) +PESOi + Ui

Si la transmisión es automática, CFi*MANi = 1, el modelo es:

KPLi = B0 + (B1+ B2)*CFi + B3*PESOi + Ui

a) Estime el modelo general, y determine si los estimadores son estadísticamente significativos


al 5%. ¿Cuál es la influencia de los CFi sobre el rendimiento (KPLi) para los automóviles
manuales y automáticos (manteniendo todo lo demás constante)?.

Cargando la influencia de autos automáticos en cf


Cargando la influencia de autos automáticos en su
variable misma

Si mantenemos lo demás constante la influencia • Automático: -0.03895


de los Caballo de Fuerza sobre los autos es: • Manual: -0.3238 3
b) Si alguno de los coeficientes, o varios de ellos resultaran no significativos
individualmente, se pide realizar un contraste de variables redundantes (hipótesis lineal =
linearHypothesis) sobre aquellas variables que resulten estadísticamente no significativas, y determine
si deben permanecer en el modelo, con un nivel de significancia del 5%.

Tras realizarse el contraste


la variable Cf:man, que
resultó ser no significativa
en la regresión anterior, se
determina que se acepta la
Ho y por lo tanto no es
estadísticamente
significativa.

EJERCICIO 3. El efecto sobre todos los coeficientes del modelo.

Otra gran ventaja de las variables binarias, es que podemos combinar en un mismo modelo el
efecto diferencial sobre todos los coeficientes, tanto del término independiente como en el resto.
La especificación más general para este modelo seria:

KPLi = B0 + B1*MANi + B2*CFi + B3*(CFi*MANi) + B4* PESOi + B5*(PESOi*MANi) + Ui

Esto conduce a las siguientes relaciones:

Para los autos con transmisión manual (MANUAL=1)

KPLi = (B0 + B1) + (B2+B3)*CFi + (B4+B5)*PESOi + Ui

Mientras que para los autos con transmisión automática, (AUTOMÁTICA=0)

GTOi = B0 + B2*CFi + B4*PESOi + Ui

a) Estime la regresión general y determine qué variables son


estadísticamente significativas y cuáles no lo son, a un nivel
de significancia del 5%.

V. Estadísticamente V. Estadísticamente no
significativas (|t.value|) significativas (|t.value|)
Intercepto = 11.48 Peso = 1.96
Man = 3.25 Man:cf = 1.45
Cf = 3
Man:peso = 2.78

4
b) Realice un contraste de variables redundantes (hipótesis lineal = linearHypothesis) sobre
aquellas variables que resulten estadísticamente no significativas, y determine si deben permanecer en
el modelo, con un nivel de significancia del 5%.

Tras realizarse el contraste


las variables Peso y Cf:man,
que resultó ser no
significativa en la regresión
anterior, se determina que
se rechaza la Ho y por lo
tanto son estadísticamente
significativas.

c) Realice el mismo modelo que en el inciso a) pero sin incluir el intercepto.

Cargando la influencia de autos automáticos en cf y


en peso respectivamente por su multiplicación Cargando la influencia de autos automáticos en su
variable misma

EJERCICIO 4. Interacción entre los factores cualitativos.

Un análisis adicional que podemos realizar cuando disponemos de varias variables tanto
cualitativas como cuantitativas es el estudio del efecto diferencial de un factor sobre el
comportamiento del otro (CIL = # de cilindros y MAN = Transmisión del auto).

Los datos sobre CIL corresponden al número de cilindros, donde: cil = 1 si el automóvil es de 4
cilindros; cil = 2 si el automóvil es de 6 cilindros; cil = 3 si el automóvil es de 8 cilindros.
Si quisiéramos considerar un efecto diferente del tipo de transmisión (manual/automática) sobre
el rendimiento (KPLi), según el número de cilindros del automóvil. El modelo que recoge este
comportamiento es:

5
KPLi = B0 + B1*MANUALi + B2*c1i + B3*c2 i + B4*(MANi*c1i) + B5*(MANi*c2i) + B6*CFi +
B7* DESPi + B8*PESOi + Ui

a) Estime los efectos diferenciales de la transmisión respecto al número de cilindros que se derivan del
modelo anterior. Para ello, deberá construir tres variables Dummy para cada número de cilindros que
poseen los autos. Posteriormente, indique si las variables son estadísticamente significativas a un nivel
de significancia del 5%.

V. Estadísticamente significativas V. Estadísticamente no significativas


(|t.value|) (|t.value|)
Intercepto = 7.01 Man = 0.62
Peso = 2.11 C1=0.63
C2=0.06
Cf=1.73
Desp=0.19
Man:c1 = 0.33
Man:c2 =0.44

6
b) Construya un modelo que incluya todas las variables dummy, evitando caer en la trampa de la
variable dicotoma.

c) Identifique cuales son aquellas variables que no son estadísticamente significativas, posteriormente
deberá realizar una prueba de contraste de variables redundantes (hipótesis lineal = linearHypothesis)
sobre aquellas variables que resulten estadísticamente no significativas, y determine si deben
permanecer en el modelo, con un nivel de significancia del 5%.

V. Estadísticamente significativas V. Estadísticamente no significativas


(|t.value|) (|t.value|)
C1=10.70 Cf= 1.73
C2= 9.23 Desp=0.19
C3 = 7.01 Man:c1 = 1.52
Peso = 2.11 Man:c2 = 0.21
Man:c3 = 0.62

Tras realizarse el contraste las


variables Cf, desp, man:c1,
man:c2 y man:c3, que
resultaron ser no significativa
en la regresión anterior, se
determina que se acepta la Ho
y por lo tanto no son
estadísticamente significativas.

7
d) ¿Cuál sería el mejor modelo de acuerdo con la metodología “STEPWISE”, (comando stepAIC())?.
Considerando que el modelo más completo es el modelo del inciso b).

Tras realizarse el criterio de


información de Akaike y por lo
que he aprendido, deduzco que
el modelo que es más completo
es el que señalo, porque el
criterio es el resultado más
pequeño de los cuatro que se
presentan

8
e) Estime los siguientes dos modelos:

1) KPLi = B0 + B1*CFi + Ui

2) KPLi = B0 + B1*CFi + B2*MAN + Ui

Aplique una prueba de análisis de varianza para determinar si el segundo modelo es mejor que el
primero (al nivel de significancia del 1%).

Tomando como referencia R2


ajustada el modelo #2 es mejor
que el primero y por lo tanto el
análisis de varianza se encentra
debajo de la regresión

También podría gustarte