Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Integrantes:
Paralelo: 7
Fecha: 09-11-2009
Universidad Técnica Federico Santa María
Campus Santiago, Vitacura
Departamento de Industrias
En este caso se cuenta con una base de datos inicial de 51 datos desde el año 1950 hasta el 2000
con distintos indicadores y cifras anuales de la economía mexicana y algunos de USA que podrían
influir en ésta. Mediante estos datos se pretende modelar el Producto Interno (PIB) de México
(variable dependiente).
El problema consiste en verificar la correcta predicción del PIB de México, mediante las variables
exógenas definidas a continuación. Para esto una vez estimado el modelo por MCO mediante el
programa “SPSS Statistics” se procederá a realizar una serie de pruebas para detectar posibles
problemas dentro del modelo creado, tales como por el lado de las observaciones: datos atípicos e
influyentes y por el lado de los residuos: dócimas de heterocedasticidad, correlaciones altas,
multicolinealidad, autocorrelación, normalidad, entre otras. De presentarse alguno de estos
problemas se irán corrigiendo a medida que vallan apareciendo.
Definición de variables
PIB: El Producto Interno Bruto (PIB) de una nación es el valor monetario total de la producción de
bienes y servicios generados en el curso de un año, un trimestre u otro período de tiempo
establecido. De allí que cuando nos dicen que el PIB crece, significa que se genera una mayor
producción en el período, por el contrario, cuando nos dicen que disminuye significa descenso de
la producción.
Inflación en USA y México: El término inflación hace referencia a la subida generalizada de los
precios en una economía o territorio determinados. Índice de Precios al Consumo, o IPC, mide la
variación de precios de los bienes y servicios necesarios para la vida cotidiana de los hogares y
familias. En concreto, se miden mensualmente los precios de una serie de productos a los que se
llama cesta básica. En esa cesta se excluyen e incluyen productos según varíen los usos y
costumbres de los consumidores.
Deuda externa pública: Suma de las obligaciones que tiene un país con respecto de otros
contraída por el estado.
Tipo de cambio Fact. Incr.: Moneda extranjera expresada en unidades de moneda nacional (Dólar
en peso mexicano).
Universidad Técnica Federico Santa María
Campus Santiago, Vitacura
Departamento de Industrias
Salario mínimo: Mínimo establecido legalmente, para cada periodo laboral (hora, día o mes), que
los empleadores deben pagar a sus trabajadores por sus labores.
Reservas internacionales: Las reservas están formadas por metales preciosos y divisas que se
encuentran en posesión del banco central.
Turismo: Corresponde a la suma de los conceptos por Turismo y Transacciones Fronterizas, que
aparecen anualmente en la Balanza de Pagos.
Año: Periodo en el cual se realizan las mediciones de las variables anteriormente descritas.
Valid N (listwise) 51
Correlaciones
Coeficiente de Pearson
X2 0,087 1 -0,118 0,146 -0,333 -0,074 0,188 -0,279 0,283 -0,070 0,012 -0,113
-0,785 -0,118 0,391 -0,127 -0,257 0,335 0,083 - -0,314 -0,377 0,621
X3 1 0,704
-0,245 0,146 0,391 -0,022 -0,775 -0,097 -0,162 - -0,695 -0,781 0,258
X4 1 0,030
X5 0,134 -0,333 -0,127 -0,022 1 0,032 0,155 0,189 0,206 -0,078 0,074 -0,170
X6 0,102 -0,074 -0,257 -0,775 0,032 1 0,195 0,280 0,135 0,385 0,525 -0,131
X7 -0,206 0,188 0,335 -0,097 0,155 0,195 1 0,091 0,063 -0,271 0,356 -0,077
Universidad Técnica Federico Santa María
Campus Santiago, Vitacura
Departamento de Industrias
Lo que se desea en la primera tabla de correlación, es que la primera fila o la primera columna las
correlaciones sean lo más cercano a 1, para así tener un modelo en que todas las variables
exógenas estén altamente correlacionadas con la variable endógena y expliquen el PIB mexicano.
El problema al analizar la matriz es que no todas las variables están lo suficientemente
correlacionadas. Si la correlación es baja, la variable asociada no es necesaria para el modelo
porque no resultan ser significativas. Esto se analiza posteriormente con mayor rigurosidad a
través de las dócimas individuales t.
Las variables que presentan una baja correlación con la dependiente son: X2(Paridad), X5(Deuda
externa pública), X7(Salario mínimo) y X9(Petróleo). Por el contrario, las que presentan mayor
correlación, por sobre 0,8, son: X4(Inflación en México), X6(Factor tipo de cambio), X8(Reservas
internacionales), X10(Turismo) y X11(Remesas). De las variables restantes no se puede concluir
nada a priori.
Como se explica con anterioridad, lo que se busca es la máxima correlación entre las variables
exógenas y endógena, y en su contraparte, lo que no se desea por ningún motivo, es la correlación
entre las variables independientes en estudio, ya que, el modelo presentaría problemas para
explicar realmente que información contribuye cada una de ellas sobre el PIB. Si la correlación es
alta, mayor a 0.8, quiere decir que lo que explica una variable es lo mismo que lo que explica otra,
por lo tanto, la mejor solución a ese problema es eliminar la variable que menos información
proporcione.
En ambas tablas se muestran las correlaciones parciales entre las variables exógenas y se puede
ver claramente que hay algunas que mantienen una correlación bastante alta, como por ejemplo,
X1(Población) e X3(inflación en USA). Esto se puede explicar porque mientras más baja sea la
inflación en USA los residentes de México consideran más atractiva la situación del país vecino,
emigrando hacia él.
Se aprecia además que la población (X1) tiene una gran correlación con la variable X12(tiempo),
esto tiene sentido porque con el paso del tiempo la población crece a nivel mundial.
Universidad Técnica Federico Santa María
Campus Santiago, Vitacura
Departamento de Industrias
Hay una gran correlación entre X4(Inflación en México) y X6(Factor tipo de cambio), esto se debe a
que el tipo de cambio se encuentra en función del comportamiento de los precios en USA y
México, y como la inflación está en base a las diferentes fluctuaciones de precios se justifica que
estas dos variables mantengan una correlación grande. Además, la inflación en México mantiene
una correlación muy fuerte con las remesas, respecto a esto, se puede decir que también es
esperable, ya que, según la ecuación cuantitativa se sabe que los precios están en función de la
cantidad de dinero que circula en el mercado, así, si existe inflación, ésta afecta directamente a la
cantidad de dinero que circula en el periodo.
Con este análisis se empieza a clarificar el panorama final con respecto a las variables significativas
para el modelo.
Diagramas de caja
Y X1
X2 X3
Universidad Técnica Federico Santa María
Campus Santiago, Vitacura
Departamento de Industrias
X4 X5
X6 X7
X8 X9
Universidad Técnica Federico Santa María
Campus Santiago, Vitacura
Departamento de Industrias
X10 X11
X12
Con los diagramas de cajas de las respectivas variables se obtienen las siguientes observaciones
atípicas e influyentes:
Atípicas Influyentes
Y 1991, 1993 1992, 1994, 1995, 1996, 1997, 1998, 1999, 2000
X1 - -
X2 - 1982,1983,1984,1985,1986,1987,1988,1989,1990,1991
X3 - -
X4 1993,1994 1995,1996,1997,1998,1999,2000
X5 1983 1982,1984,1985,1986,1987,1988,1989,1990,1991,1992
X6 1995 1996,1997,1998,1999,2000
X7 - -
X8 1991,1992,1993,1995,1996 1997,1998,1999,2000
X9 - -
X10 1994 1995,1996,1997,1998,1999,2000
Universidad Técnica Federico Santa María
Campus Santiago, Vitacura
Departamento de Industrias
Para evaluar que datos se mantendrán en la base de datos inicial, se procede a analizar qué datos
son atípicos y no son de interés y se eliminan.
1) Criterio [2,-2]:
Se verifica que los errores estandarizados se encuentren dentro del intervalo [-2,2].
Para esto mediante SPSS se calculan los errores estandarizados por cada observación (año)
obteniéndose 4 datos cuyos residuales no pertenecen al intervalo anterior. Éstos son los años:
1993, 1996, 1997, 2000.
1950 -0,0641 1960 0,3675 1970 -0,2532 1980 0,0266 1990 1,9761
1951 0,0149 1961 0,1960 1971 0,0692 1981 -0,7701 1991 0,0444
1952 -0,1139 1962 -0,0239 1972 -0,0204 1982 -0,9168 1992 -0,4900
1953 0,1866 1963 0,1309 1973 0,4579 1983 -0,0114 1993 2,5939
1954 -0,0574 1964 -0,3453 1974 0,1101 1984 -0,0057 1994 -1,0839
1955 0,1030 1965 -0,5508 1975 0,5110 1985 0,2305 1995 1,3644
1956 -0,2044 1966 -0,5476 1976 0,1044 1986 0,9609 1996 3,0998
1957 0,0044 1967 0,1326 1977 0,6140 1987 -0,7344 1997 -3,8955
1958 0,2219 1968 -0,1046 1978 0,7389 1988 -0,7956 1998 -1,7026
1959 0,1645 1969 -0,2210 1979 -0,7711 1989 -1,2122 1999 -1,4181
2000 4,7655
Debido a que el criterio anteriormente desarrollado no garantiza que las observaciones sean
atípicas, procedemos a realizar otra prueba mediante este nuevo criterio el cual sí garantiza la
existencia de ellas. Si los residuales estandarizados pertenecen al intervalo, se determinará que se
trata de una observación atípica.
Se calcula entonces el intervalo de la forma: eest ∉ [tα / 2, g ; t1−α / 2, g ] , es decir, [ eest < t 0.025,38 = -
2,024 o eest > t 0.975,38 = 2,024] obteniéndose las mismas observaciones anteriores
correspondientes a los años: 1993, 1996, 1997, 2000.
Universidad Técnica Federico Santa María
Campus Santiago, Vitacura
Departamento de Industrias
Para analizar la influencia de las observaciones se procedió a analizar la Distancia de Cook, la cual
estudia si las pendientes verdaderas son iguales a sus estimaciones realizadas con la h-esima
observación omitida.
Para esto, mediante SPSS se calcula la distancia de Cook para cada dato. Luego se compara dicho
valor con valor de tabla de la distribución de Fisher de la forma: D.Cook > F p +1,n − p −1,α . Si esto se
cumple, se concluye que las observaciones son influyentes.
1950 0,0001 1960 0,0012 1970 0,0005 1980 0,0000 1990 0,1943
1951 0,0000 1961 0,0003 1971 0,0001 1981 0,0205 1991 0,0001
1952 0,0002 1962 0,0000 1972 0,0000 1982 0,0244 1992 0,0119
1953 0,0004 1963 0,0001 1973 0,0022 1983 0,0000 1993 1,3868
1954 0,0000 1964 0,0008 1974 0,0001 1984 0,0000 1994 0,3244
1955 0,0001 1965 0,0028 1975 0,0022 1985 0,0011 1995 0,5788
1956 0,0003 1966 0,0024 1976 0,0003 1986 0,0594 1996 2,0862
1957 0,0000 1967 0,0001 1977 0,0055 1987 0,0200 1997 0,2639
1958 0,0004 1968 0,0001 1978 0,0089 1988 81,8293 1998 0,1284
1959 0,0002 1969 0,0004 1979 0,0146 1989 0,0534 1999 0,0982
2000 2,4901
D.Cook > F13,38,0.05 = 0,42
Por lo tanto las siguientes observaciones son influyentes: 1988, 1993, 1996, 2000.
1,899 · 10
8285,28
0,810
3432,633
49728,777
1,702 · 10
120,115
338,825
4,112
5,148
1,999
162,882
9811,822
Al hacer la regresión nos encontramos con diferentes parámetros para cada variable. Algunas
resultan ser negativas y otras positivas. A continuación se interpretará cada uno de ellos.
Para el caso de X1 es de esperar que sea positivo su parámetro, porque a medida que aumenta la
población en México, mayor es el PIB. Esto se debe a que existe un mayor consumo familiar y
privado, por esto la producción del país se eleva y hace que el PIB se incremente.
Universidad Técnica Federico Santa María
Campus Santiago, Vitacura
Departamento de Industrias
Para el caso de X2 y X6 que sean negativos se explica debido a que un aumento del tipo de cambio
implica que el consumo por exportaciones netas disminuya, valorizando la moneda local lo que a
su vez disminuye las exportaciones y por ende también el PIB.
Para el caso de X4 es correcto decir que mientras más alta sea la inflación mexicana mayor es el
PIB total porque la producción se encarece. Esto no quiere decir que el país esté creciendo más,
solo implica que se está consumiendo a un mayor precio.
Para X5, variable con menor correlación respecto del PIB, se tiene un parámetro negativo cercano
a cero. Esto permite deducir que la deuda externa pública no tiene relación alguna, o es ínfima,
con la variable endógena. Cualquier cambio en ella no genera grandes variaciones en la variable de
respuesta.
Para X7 se tiene un coeficiente positivo que resulta bastante simple de entender, ya que, al
aumentar el salario, mayor es el poder adquisitivo y por ende se incremente el consumo el cual
aumenta a su vez el PIB.
Con relación a X8, el valor negativo del coeficiente se entiende porque mientras mayores sean las
reservas en el extranjero, menor es el dinero circulante en el país, por lo tanto, menores son las
transacciones y por ende menor PIB.
Para X9, X10 y X11 es de esperar que sea positivo, ya que, mientras más turismo y exportaciones
netas de petróleo dentro del país existan, más crece la producción en términos de transacción por
estos bienes. Además, podemos decir que la cantidad de dinero que hay dentro del país hace que
los precios decaigan o suba, si hay más activos circulantes enviados fuera del país, la oferta
monetaria decae y genera un aumento de precios por ende la producción final.
En el caso de X12 no se entiende muy bien la razón de porque el valor es negativo y de tal
magnitud. Contradice la lógica de que con el paso del tiempo, que trae consigo mejoras
tecnológicas, la producción final de un país se incrementa.
Modelo SC df CM E Sig.
a
1 Regresión 5,828E13 12 4,857E12 6022,712 ,000
Total 5,831E13 49
Estadígrafo
Modelo t
1 (Constant) 1,188
Población 1,030
Paridad -,111
Inflación_USA -1,969
Inflación_Mexico 13,079
Deuda_Externa -,009
Fact_tipo_cambio -12,030
Salario 1,169
Reservas_int -2,337
Petroleo 2,151
Turismo 6,190
Remesas 3,495
Año -1,185
Prueba global de F
#, : -./ú1 %& 2 0
Universidad Técnica Federico Santa María
Campus Santiago, Vitacura
Departamento de Industrias
|4| 5 2,0477
Por lo tanto se rechaza H0, se comprueba empíricamente que existe al menos un coeficiente % 2
0, con un 95% de confianza.
Dócimas individuales de t
6 ,
! 6 . 2,0262
,
#, : %& 2 0
Solo seis variables (Remesas, reservas internacionales, turismo, tipo de cambio, inflación de
México y petróleo) poseen un estadígrafo mayor al valor de tabla de la distribución t-student.
Podemos concluir empíricamente, con un 95% de confianza, que éstas variables son significativas
para el modelo.
Análisis de residuales
Normalidad de residuales
Se ordenan los residuales estandarizados de manera ascendente y luego se calculo el Frai con su
respectivo Z, obteniéndose:
Se realizo una regresión entre residuales estandarizados y los Z para obtener su correlación:
SRE_ORDENADOS Z
N 50 50
N 50 50
Obteniéndose un R= 0,797
Docimando:
H0 : ρ = 0
H0 : ρ ≠ 0
R* n − 2
Se calcula el estadígrafo: E = = 9,142 y se compara con t n − 2,0,975 = t 48,0,975 = 2,01
1− R2
Por lo tanto, como E > t Se rechaza Ho, es decir, existe Normalidad entre los residuales.
Universidad Técnica Federico Santa María
Campus Santiago, Vitacura
Departamento de Industrias
Heterocedasticidad
En primer lugar, mediante el uso de Spss, se obtienen los valores de los Y estimados y los
residuales al cuadrado al realizar la regresión con las variables que resultaron significativas en las
dócimas individuales de t. Luego, se realiza una regresión entre ambas variables, obteniéndose:
7 7,89 0,6874
4 1 · 7,89 50 · 0,6874 34,37 ~
/. 1
,!
,, 3,8414
Docimando:
Como |4| J
,, 3,84 , no se Rechaza Ho, y se puede decir que el modelo es homocedástico.
Independencia de residuales
Desviación Estd.
2 2
Modelo R R R adj De la estimación Durbin-Watson
a
1 1,000 ,999 ,999 30343,54350 2,087
Multicolinealidad
Con los valores obtenidos del VIF en la estimación del modelo, al compararlos con 5, es posible
determinar si las variables presentan colinealidad seria son.
a
Coefficients
Estadísticas colinealidad
1 (Constante)
Por lo tanto las variables: X4, X6, X8, X10 y X11 (Inflación México, Fact_tipo_cambio, Reservas_int,
Petróleo, Turismo, Remesas respectivamente) presentan colinealidad seria, ya que, <L 5 5.
660,295
57763,885
132,562
1,869
Variables Ingresadas/Removidas
Variables Variables
Modelo Ingresadas Removidas Método
ANOVA
Modelo SC df CM F Sig.
a
1 Regresión 5,754E13 1 5,754E13 3561,511 ,000
Total 5,831E13 49
b
2 Regresión 5,816E13 2 2,908E13 9029,189 ,000
Total 5,831E13 49
c
3 Regresión 5,827E13 3 1,942E13 19147,763 ,000
Total 5,831E13 49
Universidad Técnica Federico Santa María
Campus Santiago, Vitacura
Departamento de Industrias
Change Statistics
Bibliografía:
Anexo
Base de datos
Deuda externa Fact. Incr. Salario Reservas Int. Petróleo Turismo Remesas Año
240,63 8,92 42,11 215 -4,08 2,01 72,38 1950
1381,23 8,92 35,62 225 -0,19 2,24 120,61 1951
1927,46 8,92 71,97 259 -2,32 2,40 68,17 1952
2081,47 8,92 70,50 299 -7,58 2,69 41,82 1953
3387,70 11,69 72,34 240 -0,99 3,77 93,16 1954
3306,40 12,89 66,10 446 1,50 4,75 105,36 1955
5853,27 12,89 90,36 502,8 -4,04 5,14 126,39 1956
10772,89 12,89 84,78 489,3 -25,20 5,53 131,59 1957
11050,00 12,89 89,02 412 -21,07 5,62 100,27 1958
11049,58 12,89 89,05 468 -9,54 6,24 133,00 1959
10574,56 12,89 102,64 459,4 -11,71 6,32 78,43 1960
9975,06 12,89 102,98 437,9 10,01 6,68 119,26 1961
9641,20 12,89 120,52 454,8 23,41 7,10 126,48 1962
3433,09 12,89 120,28 564,5 20,28 7,94 117,48 1963
Universidad Técnica Federico Santa María
Campus Santiago, Vitacura
Departamento de Industrias