Está en la página 1de 20

Pauta Ayudantía 6 2022-02

1.- Considere la base de datos adjunta, la cual incluye las siguientes variables:

EXP: Experiencia del trabajador


SEM: Semanas trabajadas en el año
TEC: Si es técnico = 1, Si no es técnico=0
IND: Si trabaja en industria = 1, Si no trabaja en Industria = 0
EDU: Años de educación
SLD: Sueldo (en dólares)

a) Se definen 2 modelos:
Modelo A: SLD = b0 + b1*EXP + b2*SEM + b3*TEC + b4*IND + b5*EDU;

Modelo B: SLD = b0 + b1*EXP + b2*SEM + b3*TEC + b4*IND;

Según el criterio del R^2 ajustado, ¿cuál es el mejor modelo para describir la variable Sueldo?

Modelos R^2 ajustado


A 0.7099948104245 El modelo A es aquel que describe mejor la variable sueldo, ya que posee el
B 0.5841442879916

b) En un MRL ¿qué sucede con el valor de la SCTOTAL al incorporar una nueva variable exógena? ¿Quiénes

Cuando se agrega una variable exógena al modelo, el valor de SCTOTAL se mantiene constante, esto
variabilidad de la variable endógena explcada por el MRL y SCError es la variabilidad de la variable en
estos 2 elementos es la que permite mantener const

Un aumento en la variabilidad de Y explicada por el MRL es igual a la disminución en la variabilidad de


Es decir, Δ˖ SCREG = Δ˗

c) Mediante la dócima adecuada determine si es significativo agregar la variable EDU al modelo B.

Modelo B1: SLD = b0 + b1*EXP + b2*SEM + b3*TEC + b4*IND;


Modelo B2: SLD = b0 + b1*EXP + b2*SEM + b3*TEC + b4*IND + b5*EDU;

Dócima F-Parcial
H0: β_{5} = 0
Con q = 5 ; p = 4
Hα: β_{5} != 0

SCReg(B1) 5493058.8947341
SCReg(B2) 6430406.2177383
p 5
q 4
CMError(B2) 124823.30944727
n 20

Estadístico 7.509393294849
Valor de tabla 4.6001099366694

Como el estadístico de F-Parcial es MAYOR al valor de tabla, se rechaza la hipótesis nula, es decir se
puede inferir que la variable exógena EDU tiene un aporte significativo al modelo, es decir, la variable
educación es una componente importante para modelar el sueldo en este modelo.

d) Para el modelo: LN(SLD) = b0 + b1*LN(EXP) + b2*EDU indique cuál de las variables es candidata para el

La variable que es candidata a salir del modelo es aquella que tiene un estadístico de F- parcial menor, ya que
significativa, que se acepte la hipótesis nula y por lo tanto que no tenga imp

LN(SLD) = b0 + b1*LN(EXP) + b2*EDU


Resumen

Estadísticas de la regresión
Coeficiente de cor 0.7621566912985
Coeficiente de de 0.5808828220911
R^2 ajustado 0.5315749188076
Error típico 0.385425589964
Observaciones 20

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadradosPromedio de los cuadrados
Regresión 2 3.50012122009857 1.75006061004928
Residuos 17 2.525399051785 0.148552885399117
Total 19 6.02552027188356

Coeficientes Error típico Estadístico t


Intercepción 3.8943762037422 0.8538383178547 4.56102299733613
EDU 0.1177525779538 0.024937314839 4.72194294830752
LN(EXP) 0.4882385980678 0.224001140862 2.1796254973923

Análisis para la variable EDU


SCReg(mod1) 0.1878753845792
SCReg(mod2) 3.5001212200986
p 2
q 1
CMError(mod2) 0.1485528853991
n 20

Estadístico 22.296745207071

Por lo tanto la variable LN(EXP) es aquella que es candidata a ser eliminada, ya que tiene un F
por ende tiene mayores probabilidades a ser menor que el valor de tabla y por tanto ser no sign
modelo.

e) Utilizando el criterio de CP de Mallows defina cuál es el mejor modelo entre A y B.

Modelos SCError CMError p*


A 1747526.3322617 124823.309447266 5
B 2684873.6552659 178991.577017725 4

Según el criterio indicado, todos los modelos serían igualmente buenos.


ntía 6 2022-02

s variables:

a describir la variable Sueldo?

e mejor la variable sueldo, ya que posee el mayor indicador de bondad de ajuste.

una nueva variable exógena? ¿Quiénes son los elementos que permiten que esto suceda?

SCTOTAL se mantiene constante, esto sucede porque SCTOTAL = SCReg + SCError, donde SCReg es la
ror es la variabilidad de la variable endógena NO explicada por el MRL. De esta forma la interacción de
ntos es la que permite mantener constante SCTOTAL.

l a la disminución en la variabilidad de Y NO explicada por el MRL.


Es decir, Δ˖ SCREG = Δ˗ SCERROR

ar la variable EDU al modelo B.


za la hipótesis nula, es decir se
o al modelo, es decir, la variable
ueldo en este modelo.

ál de las variables es candidata para eliminar justificando mediante el criterio F - parcial.

un estadístico de F- parcial menor, ya que tiene mayor probabilidades de que la dócima no sea
tesis nula y por lo tanto que no tenga impacto en el modelo.

F Valor crítico de F
11.7807244561248 0.000616384089479903

Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%


0.00027716121398 2.09293481978128 5.69581758770304 2.092934819781 5.6958175877
0.0001968297131 0.0651394426371185 0.170365713270486 0.065139442637 0.17036571327
0.04363641847568 0.0156375016246976 0.96083969451087 0.015637501625 0.96083969451

Análisis para la variable Ln(EXP)


SCReg(mod1) 2.79438102850425
SCReg(mod2) 3.50012122009857
p 2
q 1
CMError(mod2) 0.148552885399117
n 20

Estadístico 4.75076730888265

ndidata a ser eliminada, ya que tiene un F-Parcial menor,


que el valor de tabla y por tanto ser no significativo para el
modelo.

modelo entre A y B.

CP-Mallows ~p+1 Modelo A: SLD = b0 + b1*EXP + b2*SEM + b3*TEC + b4*IND + b5*EDU;


6 6
5 5 Modelo B: SLD = b0 + b1*EXP + b2*SEM + b3*TEC + b4*IND;
LN(SLD) = b0 + b1*LN(EXP)
Resumen

Estadísticas de la regresión
Coeficiente de 0.176578436
Coeficiente d 0.031179944
R^2 ajustado -0.02264339
Error típico 0.569485386
Observaciones 20

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 0.187875385 0.187875385 0.579301583 0.4564424466639
Residuos 18 5.837644887 0.324313605
Total 19 6.025520272

Coeficientes Error típico Estadístico t Probabilidad Inferior 95%


Intercepción 6.169833179 1.041459568 5.924217676 1.3167E-05 3.9818078192984
LN(EXP) 0.245167525 0.32211473 0.761118639 0.456442447 -0.43157041022
b3*TEC + b4*IND + b5*EDU;

b3*TEC + b4*IND;
LN(SLD) = b0 + b1*EDU
Resumen

Estadísticas de la regresión
Coeficiente de 0.68099752907
Coeficiente d 0.4637576346
R^2 ajustado 0.43396639207
Error típico 0.42368353254
Observaciones 20

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Regresión 1 2.794381029
Residuos 18 3.231139243
Total 19 6.025520272

Superior 95% Inferior 95,0% Superior 95,0% Coeficientes Error típico


8.3578585382805 3.98180781929837 8.357858538 Intercepción 5.61973653338 0.351818631
0.9219054593505 -0.4315704102198 0.921905459 EDU 0.10526167365 0.026678969
Promedio de los cuadradosF Valor crítico de F
2.794381029 15.56691146 0.000948253
0.179507736

Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0%Superior 95,0%


15.97339094 4.48137E-12 4.880593017 6.358880049 4.880593017 6.358880049
3.94549255 0.000948253 0.04921124 0.161312108 0.04921124 0.161312108
Pauta Ayudantía 6 2022-02

2.-
Suponga que dispone de cuatro variables exógenas y de 80 observaciones.
Se sabe que la suma de cuadrados total es de 97. En la tabla siguiente se
presenta el coeficiente de determinación de los modelos a medida se
agregan las variables exógenas.

Modelo R^2
Y vs X1, X2 0.76
Y vs X1, X2, X3 0.82
Y vs X1, X2, X3, X4 0.84

Mediante test F-parcial, indique si se justifica incorporar de manera conjunta las variables X3, X4 al mo

DATOS Se sabe que R^2 = SCReg / SCTot


n 80
SCTOTAL 97

Dócima F-Parcial
H0: β_{3} = β_{4} = 0
Con q = 2 ; p = 4
Hα: β_{3} != β_{4} != 0

Modelo R^2 SCReg SCError p


Y vs X1, X2 0.76 73.72 23.28 2
Y vs X1, X2, X3 0.82 79.54 17.46 3
Y vs X1, X2, X3, X4 0.84 81.48 15.52 4

Modelo 1: Y= b0 + b1*X1 + b2*X2


Modelo 2: Y= b0 + b1*X1 + b2*X2 + b3*X3 + b4*X4

SCReg(mod1) 73.72
SCReg(mod2) 81.48
p 4
q 2
CMError(mod2) 0.206933333333333
n 80

Estadístico 18.75
Valor de tabla 3.11864212800612

Como el estadístico es mayor al valor de tabla, se puede inferir desde la dócima de F parcial que se rechaza la hipó
significativo el aporte que entregan simultáneamente las variables X3 Y X4 al modelo para la descripción de Y. Sin
asegurar si es que el aporte lo están generando ambas variables o una de ellas, ya que la dócima permite infer
Como el estadístico es mayor al valor de tabla, se puede inferir desde la dócima de F parcial que se rechaza la hipó
significativo el aporte que entregan simultáneamente las variables X3 Y X4 al modelo para la descripción de Y. Sin
asegurar si es que el aporte lo están generando ambas variables o una de ellas, ya que la dócima permite infer
hipótesis alternativa al menos 1 de los coeficientes es distinto de 0, entonces puede ser que β_{3} !=0 o β_{
simultáneamente, es por ello que con esta solución no se puede asegurar la significancia individual de β_{3} o β_{4
desea estudiar el aporte individual al modelo debe realizarse la dócima considerando que solo se está agreg
s variables X3, X4 al modelo Y vs X1, X2.

R^2 = SCReg / SCTotal

CMError
0.302337662337662
0.229736842105263
0.206933333333333

cial que se rechaza la hipótesis nula, entonces es


ra la descripción de Y. Sin embargo, no se puede
ue la dócima permite inferir que al aceptar la
cial que se rechaza la hipótesis nula, entonces es
ra la descripción de Y. Sin embargo, no se puede
ue la dócima permite inferir que al aceptar la
de ser que β_{3} !=0 o β_{4} != 0 o ambos
a individual de β_{3} o β_{4} para el modelo, si se
ndo que solo se está agregando 1 variable.
EXP SEM TEC IND EDU SLD EDU LN(EXP) LN(SLD)
21 48 1 0 12 680 12 3.04452244 6.5220928
22 47 0 1 14 1250 14 3.09104245 7.13089883
34 42 1 1 4 628 4 3.52636052 6.44254017
20 48 0 1 15 1583 15 2.99573227 7.36707706
14 23 0 0 16 1500 16 2.63905733 7.31322039
51 46 1 0 8 397 8 3.93182563 5.98393628
21 41 0 0 10 1313 10 3.04452244 7.18006987
16 49 1 1 12 680 12 2.77258872 6.5220928
32 48 0 0 14 1200 14 3.4657359 7.09007684
37 48 0 1 16 2492 16 3.61091791 7.82084088
37 44 0 1 17 2750 17 3.61091791 7.91935619
38 46 1 1 8 1350 8 3.63758616 7.20785987
27 48 0 0 11 552 11 3.29583687 6.31354805
43 48 1 1 14 1250 14 3.76120012 7.13089883
32 46 0 1 17 2100 17 3.4657359 7.64969262
14 48 0 0 16 1300 16 2.63905733 7.17011954
17 42 0 0 17 1100 17 2.83321334 7.00306546
15 49 1 0 13 516 13 2.7080502 6.24610677
16 50 1 0 8 425 8 2.77258872 6.05208917
28 36 1 0 12 1171 12 3.33220451 7.06561336
REGRESIÓN Modelo A: SLD = b0 + b1*EXP + b2*SEM + b3*TEC + b4*IND + b5*EDU;

Resumen

Estadísticas de la regresión
Coeficiente d 0.88674233
Coeficiente d 0.78631197
R^2 ajustado 0.70999481
Error típico 353.303424
Observacione 20

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 5 6430406.22 1286081.24 10.3032138 0.00026564
Residuos 14 1747526.33 124823.309
Total 19 8177932.55

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción 609.190666 783.43535 0.77758894 0.44975261 -1071.11104 2289.49237
EXP 16.7332531 8.41000629 1.98968378 0.06652636 -1.30441646 34.7709226
SEM -21.2646478 13.7344036 -1.54827602 0.1438596 -50.7220138 8.19271823
TEC -401.333379 213.40942 -1.8805795 0.08099551 -859.051061 56.3843034
IND 524.741191 177.569362 2.95513361 0.01043927 143.892787 905.589596
EDU 82.9315553 30.2633768 2.74032722 0.01594489 18.0230676 147.840043
REGRESIÓN Modelo B: SLD = b0 + b1*EXP + b2*SEM + b3*TEC + b4*IND;

Resumen

Estadísticas de la regresión
Coeficiente d 0.8195687
Coeficiente d 0.67169286
R^2 ajustado 0.58414429
Error típico 423.073962
Observacione 20

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF
Regresión 4 5493058.89 1373264.72 7.67223099
Residuos 15 2684873.66 178991.577
Total 19 8177932.55

Inferior 95,0%
Superior 95,0% Coeficientes Error típico Estadístico t Probabilidad
-1071.11104 2289.49237 Intercepción 1928.71298 740.028858 2.60626725 0.01984975
-1.30441646 34.7709226 EXP 12.4124092 9.89223468 1.25476292 0.22876383
-50.7220138 8.19271823 SEM -21.6738935 16.4457082 -1.31790576 0.20730873
-859.051061 56.3843034 TEC -771.524909 197.835234 -3.89983569 0.00142171
143.892787 905.589596 IND 600.812015 210.021401 2.86071805 0.01190546
18.0230676 147.840043
M + b3*TEC + b4*IND;

Valor crítico de F
0.00142224

Inferior 95% Superior 95%Inferior 95,0%


Superior 95,0%
351.378805 3506.04715 351.378805 3506.04715
-8.67238988 33.4972084 -8.67238988 33.4972084
-56.7270908 13.3793038 -56.7270908 13.3793038
-1193.20073 -349.849088 -1193.20073 -349.849088
153.161994 1048.46204 153.161994 1048.46204

También podría gustarte