Está en la página 1de 9

AJUSTE DE UN MODELO LINEAL

UNIVERSIDAD DEL VALLE


ESCUELA DE INGENIERÍA INDUSTRIAL Y ESTADÍSTICA
CURSO DE LABORATORIO DE ESTADÍSTICA III
JUNIO DEL 2003
AJUSTE DE UN MODELO LINEAL
APLICADO A UN CASO PRÁCTICO EN LOS RUBROS DEL
MUNICIPIO

PRESENTADO AL PROFESOR
VÍCTOR GONZÁLEZ

EGOR MERIK SÁNCHEZ GONGORA

UNIVERSIDAD DEL VALLE


ESCUELA DE INGENIERÍA INDUSTRIAL Y ESTADÍSTICA
CURSO DE LABORATORIO DE ESTADÍSTICA III
JUNIO DEL 2003
APLICACIÓN DEL CASO PRÁCTICO

El objetivo es encontrar un modelo que explique el gasto total denotado (Y) en


función de cuatro variables correspondientes a diferentes ingresos, que son, por
capital activo (X1), por transferencias (X2), por predial y complementario (X 3) e
industria y comercio (X4), que ingresan periódicamente en los rubros del municipio.

La base de datos asociada al problema es la siguiente

GASTO CAPITAL TRANSFERENCIAS PREDIAL Y INDUSTRIA Y


AÑO TOTAL ACTIVO NACIONALES COMP. COMERCIO
1987 1653,89 42,92 454,6 323,3 458,8
1988 2665,8 69,84 676,7 408,3 654,3
1989 4207,4 99,51 843,4 810 834,2
1990 4648,82 160,54 1006,65 697,03 1032,99
1991 9495,74 274,62 1667,24 943,53 1403
1992 11962,22 386,7 2161,83 1604,5 1690,30
1993 18742 591,29 3576,61 2670,66 2519,72
1994 26318,02 637,31 4955,35 4004,53 3206,01
1995 35420,06 716,12 7189,59 4823,09 4658,67
1996 52695,67 2209,37 9854,32 13870,15 7314,94
1997 60067,3 1946,94 12676,28 16555,68 8082,25
1998 56942,7 4963,68 16528,68 17432,82 14836,11

Nuestro objetivo del trabajo es estimar para cada variable el año 1999 utilizando
el concepto de la media geométrica, y aumentando 0.13 a la media geométrica,
así con esta nueva base de datos ajustamos el modelo de regresión.

En la siguiente tabla se muestran los datos, mas el estimado del año 1999.

GASTO CAPITAL TRANSFERENCIAS PREDIAL Y INDUSTRIA Y


AÑO TOTAL ACTIVO NACIONALES COMP. COMERCIO
1987 1653.89 42.92 454.6 323.3 458.8
1988 2665.8 69.84 676.7 408.3 654.3
1989 4207.4 99.51 843.4 810 834.2
1990 4648.82 160.54 1006.65 697.03 1032.99
1991 9495.74 274.62 1667.24 943.53 1403
1992 11962.22 386.7 2161.83 1604.5 1690.30
1993 18742 591.29 3576.61 2670.66 2519.72
1994 26318.02 637.31 4955.35 4004.53 3206.01
1995 35420.06 716.12 7189.59 4823.09 4658.67
1996 52695.67 2209.37 9854.32 13870.15 7314.94
1997 60067.3 1946.94 12676.28 16555.68 8082.25
1998 56942.7 4963.68 16528.68 17432.82 14836.11
1999 83677.17 8091.46 24402.15 26618.53 21685.28

Ahora realizamos un análisis exploratorio de los datos.


Estadísticos Descriptivos

N Rango Mínimo Máximo Suma Media Desv. típ. Varianza


GASTO TOTAL 13 82023.29 1653.89 83677.18 368496.80 28345.9075 27025.8825 730398323.934
CAPITALACT. 13 8048.54 42.92 8091.46 20190.30 1553.1003 2397.2241 5746683.350
TRANSF. NAL. 13 23947.55 454.60 24402.15 85993.40 6614.8769 7396.5218 54708535.211
PREDIAL Y COM 13 26295.24 323.30 26618.54 90762.13 6981.7023 8643.6684 74713002.782
IND. Y COM. 13 21226.49 458.80 21685.29 68376.58 5259.7366 6423.3164 41258993.108
N válido (según 13
lista)

Ahora revisamos y verificamos los resultados de la Anova.

ANOVA
Modelo Suma de cuadrados gl Media cuadrática F Sig.
1 Regresión 8680758753.972 4 2170189688.493 206.633 .000
Residual 84021133.240 8 10502641.655
Total 8764779887.213 12
2 Regresión 8680495481.838 3 2893498493.946 308.972 .000
Residual 84284405.375 9 9364933.931
Total 8764779887.213 12
3 Regresión 8664500781.079 2 4332250390.539 432.019 .000
Residual 100279106.134 10 10027910.613
Total 8764779887.213 12
a Variables predictoras: (Constante), INDUSTRIA Y COMERCIO, PREDIAL COMPLEMENTO,
CAPITAL ACTIVO, TRANSFERENCIAS NACIONALES
b Variables predictoras: (Constante), INDUSTRIA Y COMERCIO, PREDIAL COMPLEMENTO,
TRANSFERENCIAS
c Variables predictoras: (Constante), INDUSTRIA Y COMERCIO, TRANSFERENCIAS
NACIONALES
d Variable dependiente: GASTO TOTAL

Resumen del modelo

R R cuadrado R cuadrado Error típ. de la Estadísticos de


corregida estimación cambio
Modelo Cambio en R cuadrado
Cambio gl1 gl2 Sig. del
en F cambio en
F
1 .995 .990 .986 3240.7779 .990 206.633 4 8 .000
2 .995 .990 .987 3060.2180 .000 .025 1 10 .878
3 .994 .989 .986 3166.6876 -.002 1.708 1 11 .224
a Variables predictoras: (Constante), INDUSTRIA Y COMERCIO, PREDIAL COMPLEMENTARIO,
CAPITAL ACTIVO, TRANSFERENCIAS NACIONALES
b Variables predictoras: (Constante), INDUSTRIA Y COMERCIO, PREDIAL COMPLEMENTARIO,
TRANSFERENCIAS
c Variables predictoras: (Constante), INDUSTRA Y COMERCIO , TRANSFERENCIAS
Observamos el alto valor de R Y R 2 (.99 y .98) ahora podemos pensar que este es
el modelo, además el valor de la suma de los cuadrados y cuadrados medios es
bastante grande , entonces rechazamos la hipótesis nula es decir los β i en su total
si aportan a explicar el modelo.

Variables introducidas /eliminadas

Modelo Variables Variables Método


introducidas eliminadas
1 INDUSTRI, . Introducir
PREDIAL,
CAPITAL,
TRANSFER
2 . CAPITAL Hacia atrás (criterio: Prob. de F para eliminar >= .100).
3 . PREDIAL Hacia atrás (criterio: Prob. de F para eliminar >= .100).
a Todas las variables solicitadas introducidas
b Variable dependiente: GASTO TOTAL

Revisando los βi se observa una sobre estimación en los coeficientes, entonces no


se rechaza la hipótesis nula, es decir ningún β i por separado aporta a la
explicación del modelo.

Coeficientes

Coeficientes Coeficientes t Sig. Estadísticos


no estandarizad de colinealidad
estandarizad os
os
Modelo B Error típ. Beta Tolerancia FIV
1 (Constante) 2918.341 1856.113 1.572 .155
CAPITALA -1.055 6.662 -.094 -.158 .878 .003 291.374
TRANSFER 6.890 2.657 1.886 2.593 .032 .002 441.212
PREDIAL .854 .753 .273 1.133 .290 .021 48.420
INDUSTRI -4.652 4.685 -1.106 -.993 .350 .001 1034.788
2 (Constante) 3111.460 1321.106 2.355 .043
TRANSFER 7.255 1.244 1.986 5.830 .000 .009 108.550
PREDIAL .791 .605 .253 1.307 .224 .029 35.060
INDUSTRI -5.376 .953 -1.278 -5.639 .000 .021 48.054
3 (Constante) 2444.667 1261.003 1.939 .081
TRANSFER 8.522 .807 2.332 10.554 .000 .023 42.680
INDUSTRI -5.793 .930 -1.377 -6.230 .000 .023 42.680
a Variable dependiente: GASTO TOTAL

Mediante el uso de la selección de variables hacia atrás, construimos un modelo


lineal general de la forma:

Yˆ = 29180,341 –1,055X1 + 6.890X2 +0.854X3 –4.652X4


Analizando el modelo observamos que la variable predictora, transferencias
nacionales es la que mas aporta al modelo, mientras que las variables Capital
Activo e Industria y Comercio tienen una relación inversa con el modelo planteado.

Multicolinealidad

En el primer modelo se tiene colinealidad muy baja en las dos primeras


dimensiones, y ya en la tercera dimensión se acerca bastante al limite (I.C. 
10) y una colinealidad moderada en la cuarta y quinta dimensión para el primer
modelo, que es el que incluye todas las variables predictoras; así pues cuando se
elimina la variable capital activo, la tercera dimensión del modelo adquiere una
colinealidad moderada.

Diagnósticos de Colinealidad
Autovalor Indice de Proporcione
condició s de la
n varianza
Modelo Dimensión (Constante) CAPITAL TRANSFE PREDIAL INDUSTRI
A R
1 1 4.404 1.000 .01 .00 .00 .00 .00
2 .541 2.852 .37 .00 .00 .00 .00
3 4.612E-02 9.772 .07 .02 .00 .12 .00
4 7.736E-03 23.861 .26 .05 .07 .47 .01
5 3.370E-04 114.328 .29 .93 .93 .42 .99
2 1 3.494 1.000 .02 .00 .00 .00
2 .481 2.696 .71 .00 .00 .00
3 2.165E-02 12.704 .00 .00 .42 .25
4 3.341E-03 32.338 .27 1.00 .58 .74
3 1 2.560 1.000 .05 .00 .00
2 .434 2.429 .82 .00 .00
3 6.548E-03 19.771 .13 .99 .99
a Variable dependiente: GASTO TOTAL

Coeficientes
Estadísticos
de colinealidad
Modelo Tolerancia FIV
1 (Constante)
CAPITALA .003 291.374
TRANSFER .002 441.212
PREDIAL .021 48.420
INDUSTRI .001 1034.788
2 (Constante)
TRANSFER .009 108.550
PREDIAL .029 35.060
INDUSTRI .021 48.054
3 (Constante)
TRANSFER .023 42.680
INDUSTRI .023 42.680
a Variable dependiente: GASTO TOTAL
Vemos que los anteriores datos lastiman las estimaciones y nos elevan las
varianzas para los estadísticos de Colinealidad: Tolerancia y FIV.
Se tiene una moderada Colinealidad para la variable predial y complementario
(30<I.C<100), y finalmente existe un grave problema para las variables Capital
Activo, Transferencias Nacionales e Industria y Comercio, para el primer modelo,
ya en el segundo modelo las variables Predial e Industria se tiene una moderada
colinealidad y así mismo para el tercer modelo en las variables transferencias e
industria se modera la colinealidad.

Ahora corregimos el modelo mediante Regresión Ridge. Lo primero que se hace


es estandarizar la matriz de las variables independientes, quedando de la
siguiente forma:
Estandarización
-0.1818568 -0.24042627 -0.22237262 -0.21576464
-0.17861508 -0.23175804 -0.21953385 -0.2069785
-0.1750422 -0.22525199 -0.20611816 -0.19889345
-0.16769293 -0.21888059 -0.20989105 -0.18995946
-0.15395535 -0.19309875 -0.20165862 -0.1733305
-0.14045861 -0.17379565 -0.17958401 -0.16039982
-0.11582177 -0.11857891 -0.14397715 -0.12314299
-0.11028001 -0.06476875 -0.0994295 -0.09229982
-0.10078966 0.02242911 -0.07209181 -0.02701453
0.07902838 0.12643069 0.23005551 0.09236328
0.0474264 0.23656755 0.31974495 0.12684765
0.41070401 0.38692094 0.34903905 0.43037891
0.78735363 0.69421066 0.65581723 0.73819388

A la matriz estandarizada se le hallan los valores propios, los cuales son los
siguientes:

Matriz de Vectores Propios (P)


PC1 PC2 PC3 PC4
C1 -0.497 -0.654 0.409 -0.398
C2 -0.503 0.261 -0.666 -0.486
C3 -0.496 0.659 0.555 0.107
C4 -0.504 -0.264 -0.285 0.771

Teniendo estas dos matrices se multiplican quedando la siguiente matriz:


Matriz X*=XP'
0.24254554 0.2816845 -0.21474356 0.05215002
0.23292955 0.27615563 -0.20812345 0.05419285
0.22916804 0.26319237 -0.19729731 0.05308462
0.21624972 0.25932945 -0.19788181 0.05566192
0.18930956 0.24558403 -0.18135712 0.05240645
0.17385955 0.22284728 -0.16169576 0.04418637
0.12523828 0.18304553 -0.11377952 0.03576924
0.09323659 0.14964396 -0.05304318 0.02985432
0.01669006 0.1176934 0.02187095 0.04459467
-0.06463066 -0.20485839 0.18168343 -0.06756174
-0.09799578 -0.23670944 0.32340566 -0.07968452
-0.48570002 -0.54722191 0.29103893 -0.07679594
-0.87090044 -1.0103864 0.50992273 -0.19785827

Ahora con esta matriz se realiza un procedimiento similar al de mínimos


cuadrados y se obtienen los primeros betas estimados:

Primeros
Betas
-59475.1408
83682.2312
123862.881
-129371.018

Con estos betas procedemos a realizar una serie de iteraciones, que resultan de
sumarle a la matriz X’X de valores estandarizados la matriz D , la cual contiene en
su diagonal el cociente de la varianza del modelo mínimos cuadrados ordinarios
entre la suma de cuadrados de las nuevas estimaciones de los betas, y volviendo
a repetir el procedimiento similar al de mínimos cuadrados cada vez se obtiene un
conjunto diferente de estimaciones de betas hasta lograr que la diferencia entre
una suma de cuadrados de los Betas no presente un cambio significativo respecto
a la suma anterior. Llegando a este punto se escogen estos últimos betas, que
para el presente problema son:

Betas
Estimados
1.6773E-33
0.00010528
109052.123
6.871E-184

Con estas últimas estimaciones se devuelve el proceso de estandarización, para


obtener unos betas en función de la variable dependiente original.

También podría gustarte