Está en la página 1de 30

1

MÉTODOS MULTIVARIANTES PARA RELACIONAR
ÍNDICES DE PRODUCCION INDUSTRIAL (IPI) EN
ESPAÑA POR SUBSECCIONES.
Sergio Rubilar Contreras.*
1
1
Departamento de ingeniería civil industrial
Universidad católica de la ssma. Concepción, Concepción (Chile)

Junio 2012



Resumen

El índice de producción industrial (IPI) mide la evolución mensual de la productividad de las distintas ramas o
subsecciones de las industrias por lo tanto se obtuvo una base de datos de los distintos índices de
productividad por subsección a lo largo de 8 años tomados desde el año 2000, mes a mes. Se estudió cómo
relacionar dos conjuntos de variables utilizando tres métodos multivariantes los cuales fueron análisis de
correlaciones canónicas, análisis de redundancias y análisis factorial inter-baterías. Cada uno de estos
métodos tiene metodologías similares para relacionar las variables, así, el análisis de correlaciones canónicas
busca encontrar subconjuntos de datos o componentes que resuman la mayor cantidad de información posible
de la variable original y que a su vez tengan correlación máxima entre ellas. Lo mismo ocurre en el análisis de
redundancia pero ahora se busca un subconjunto que resuma la información y que a su vez explique al otro
conjunto de datos y el análisis factorial inter-baterías es similar a correlaciones canónicas pero ahora ambos
subconjuntos son capases de explicarse a sí mismo y al conjunto contrario. Con estos métodos se llegó a la
conclusión que basta con una sola componente para resumir la información contenida en las matrices de datos
originales, esto ocurrió en los tres métodos con valores distintos por su puesto pero llegando siempre a la
misma conclusión, esto producto de trabajar con series de tiempo pues cada índice está altamente
correlacionado con el anterior, por lo tanto es necesario aislar tendencias y estacionalidades para obtener
resultados mas óptimos y ver la variación que se produce al aplicar nuevamente los métodos.

Abstract

The industrial production index (IPI) measures the global production of productivity of different branches or
sub-industries so was obtained a database of individual productivity indices subsection by 8 yeras since 2000
month by month. Was studied how to relate two sets of variables using three multivariate methods. Which
were: canonical correlation analysis, redundancy analysis and inter-battery factor analysis. Each of these
methods have similar methodologies to relate the variables, and then, Canonical correlation analysis tries to
find subsets of data or components to summarize as much information as possible to the original variable and
which in turn have a high correlation between them. The same happens in the redundancy analysis but now it
looking for a subset that summarizes the information and which in turn explains the other data set. The inter-
battery factor analysis is similar to canonical correlation but now both subsets are able to explain to himself
and to all otherwise. These methods concluded that a single component is sufficient to summarize the
information contained in the original data matrix, this occurred in all three methods with different values of
course but always reaching the same conclusion products of working with time series for each index is highly
correlated with the previous So, is so necessary to isolate trends and seasonalities to get the most optimal
results and see the variation that occurs when you apply the methods again.
Keywords: canonical correlation analysis, redundancy analysis, inter-battery factor analysis, Trend
analysis, seasonality
2

1 Introducción

En este artículo veremos distintos métodos para poder analizar una base de datos, mas
específicamente, identificar y cuantificar las asociaciones lineales entre dos grupos de variables
(Menéndez C. J., 2001). Para ello utilizaré tres métodos los cuales son Análisis de correlación
canónica (CCA), Análisis de redundancias (AR) y Análisis factorial inter-baterías (FIA).
Estos tres métodos tienen el mismo fin pero con cada uno con características propias como por
ejemplo en análisis de correlaciones canónicas las variables X e Y se tratan del mismo modo, es
decir, que no existe un conjunto de variables que sea causa del otro conjunto; o en el caso de
análisis de redundancias que un conjunto de variables puede explicar a otro pero no al revés.
La base de datos que se utilizaré será un conjunto de variables las cuales son industrias de España
en las cuales se recopiló su índice o tasa de productividad por ramas de actividad por secciones y
subsecciones. El índice de producción industrial (IPI) es un indicador coyuntural que mide la
evolución mensual de la actividad productiva en las ramas industriales contenidas en la
clasificación nacional de actividades económicas 2009 (CNAE-2009), es decir, mide la evolución
conjunta de la calidad de las industrias eliminando la influencia de los precios.
Además, nos encontramos con un problema en nuestra base de datos ya que presentamos series de
tiempo y por lo tanto es necesario analizar las series para ver si encontramos tendencias y/o
estacionalidades en nuestros datos. Lo curioso de trabajar con series de tiempo es que lo cada
observación está relacionada con la anterior, por lo tanto es probable que con solo una dimensión en
cada método podamos resumir la información de nuestros conjuntos de datos. Por lo tanto se
trataran de aislar las tendencias y desestacionalizar las observaciones pero solo será mencionado en
el anexo del artículo, así los tres métodos y resultados que veremos a continuación serán obtenidos
a partir de los datos originales.
El articulo está articulado de la siguiente manera, en la sección 1 se encuentra la introducción, en la
sección 2 se encuentran los antecedentes del problema, en la sección 3, el material y métodos es
decir, descripción de mis variables y la descripción detallada de los métodos a emplear, en la
sección 4 estarán los resultados del problema el cual fue resuelto por los 3 métodos multivariantes,
en la sección 5 se encuentra las conclusiones y comentarios, en la sección 6 se encuentra las
referencias y en la sección 7 el anexo.
2 Antecedentes
Este problema en particular no ha sido resuelto puesto que el instituto nacional de estadística solo se
limita a realizar estudios sencillos de sus datos los cuales se pueden ver en su página Web oficial,
pero como el estudio es en base a series de tiempo si es posible encontrar a personas que han
estudiado las series de tiempo utilizando los métodos que se ocupan en este articulo, como es el
caso de Hirotugu Akaike el cual utilizo el método de análisis de correlaciones canónicas para el uso
de series de tiempo en su artículo publicado en el instituto de matemática y estadística en Tokio,
Japón. Por lo tanto no existe algún antecedente de querer relacionar industrias y a su vez, sus
índices de producción industrial y por tanto yo sería la primer persona en intentar hacerlo.
srubilar@ing.ucsc.cl
3

3 Material y métodos

Los datos de los índices de productividad fueron obtenidos de la página web del instituto nacional
de estadística español y la base de datos o los datos propiamente tal están compuestos por 108
observaciones correspondientes a los IPI de los meses de 8 años consecutivos, es decir, desde enero
del año 2000 hasta diciembre del año 2008. El conjunto de variables X e Y se presentan a
continuación siendo las 3 primeras mis variables Y y las 13 restantes mis variables X.
a. D1: Industria manufacturera.
b. D2: Industria pesada.
c. D3: industrias extractivas.
d. DA: Industria de la alimentación, bebidas y tabaco.
e. DB: Industria textil y de la confección.
f. DC: Industria del cuero y del calzado.
g. DD: Industria de la madera y del corcho.
h. DE: Industria del papel; edición, artes gráficas y reproducción de soportes grabados.
i. DF: Refino de petróleo y tratamiento de combustibles nucleares.
j. DG: Industria química.
k. DH: Industria de la transformación del caucho y materias plásticas.
l. DI: Industrias de otros productos minerales no metálicos.
m. DJ: Metalurgia y fabricación de productos metálicos.
n. DK: Industria de la construcción de maquinaria y equipo mecánico.
o. DL: Industria de material y equipo eléctrico, electrónico y óptico.
p. DM: Fabricación de material de transporte.

Análisis de correlaciones canónicas

El análisis de correlación canónica se refiere a una representación canónica de la correlación entre
los dos conjuntos de variables aleatorias (Akaike H. 1976). La idea es determinar el par de
combinaciones lineales que tienen la correlación más alta, luego el segundo par cuya correlación es
menor o igual a la primera, y así sucesivamente. A estos pares de combinaciones lineales se los
denomina variables canónicas, por consiguiente sus correlaciones son llamadas correlaciones
canónicas, las mismas que miden la fuerza de asociación entre los dos grupos de variables.
Figura 1.- representación simple del análisis de correlaciones canónicas



4

La combinación lineal de las primeras p variables es:
¿
=
= =
p
i
i i
x X x
1
* o o
Y para la combinación lineal de las primeras q variables es:
¿
=
= =
q
j
j j
x X y
1
* | |
Notamos que existen dos vectores o y | . Estos vectores son necesarios pues, como lo dijimos
anteriormente, queremos que nuestras variables canónicas x* e y* tengan correlación máxima.
Estos vectores se obtienen maximizando el cuadrado de las correlaciones ente (x*, y*) respecto a
o y | suponiendo que las varianzas de las variables canónicas son unitarias.
La función que se maximiza es:
( )
( )( ) | | o o
| o
µ
22 11
2
12 2
' '
'
V V
V
=

Con las restricciones de varianza unitaria correspondientes para cada variable canónica y una serie
de pasos obtenemos lo siguiente:
( ) o ì o
2
21
1
22 12
1
11
=
÷ ÷
V V V V

Por lo tanto
o
es el vector propio ligado al valor propio
2
ì
de la matriz cuadrada de dimensión p:



Y lo mismo se puede utilizar para el vector
|
quedando así:


Así construyendo estas dos matrices cuadradas es posible obtener las variables canónicas
máximamente correlacionadas las cuales son posibles de resumir la información contenida en X e Y
que es básicamente lo que esperamos hacer con mis conjuntos de variables, pero no solamente con
un par de variables canónicas se resume toda la información ya que podemos tener r=min(p,q)
Variables canónicas las que se pueden ordenar por orden de importancia. Estos pares de variables
canónicas están icorreladas entre si cada una de ellas esta máximamente correlacionada con una
variable canónica del par siguiente por lo tanto el numero de variables canónicas permite juzgar el
numero de dimensiones distintas que tiene la relación entre X e Y o el número de dimensiones
distintas que tiene el problema que estamos estudiando.

Análisis de redundancias

Es una técnica desarrollada por Van den Wollemberg en el año 1977, la cual, así como en el
análisis de correlación canónica maximiza la correlación entre dos combinaciones lineales de ambos
grupos de variables, el análisis de redundancia obtiene combinaciones lineales incorrelacionadas de
las variables predictoras, con varianza uno, tales que la media de las correlaciones al cuadrado con
las variables del otro grupo sea máxima, es decir se trata de maximizar el índice de la redundancia
entre una combinación lineal del grupo de variables predictor y el otro conjunto (Carmona F. 1988)
previo a Wollemberg, Steward y Love (1968) definen un índice como medida de predicción o
redundancia. El llamado índice de la redundancia es la media de los coeficientes al cuadrado de la
21
1
22 12
1
11
V V V V A
pxp
÷ ÷
=
12
1
11 21
1
22
V V V V B
qxq
÷ ÷
=
5

correlación múltiple para predecir las variables de un conjunto por otro. Este índice a diferencia de
las correlaciones canónicas, es una medida en general no simétrica.

Figura 2.- representación simple del análisis de redundancia


Trataremos de buscar las componentes t
h
=Xa
h


tal que las componentes estén centradas y no
reducidas, y las componentes maximicen el siguiente criterio:
¿¿ ¿¿
= = = =
=
s
h
q
k
h k
s
h
q
k
h k
Xa y cor t y cor
1 1
2
1 1
2
) , ( ) , (
La expresión anterior es equivalente a:
¿
=
s
h
h h
a R R a
1
21 12
'
Si realizamos un cambio de variables
h h
a R c
2
1
11
= obtenemos la siguiente expresión

h
s
h
h
c R R R R c ) ( '
2 / 1
11 21 12
1
2 / 1
11
÷
=
÷
¿

La restricción que expusimos más arriba (t
h
centradas y reducidas) es equivalente a decir que los
vectores
s
c c ,.......,
1
son ortonormales y dichos vectores son los vectores propios normalizados de
la matriz simétrica
2 / 1
11 21 12
2 / 1
11
÷ ÷
R R R R asociados a los s valores propios más grandes
s
ì ì ,.......,
1
.
A partir de los c
i
se obtienen los valores de a
h
y
h
t
.
Cabe recordar que los vectores a
h
son los
vectores propios de la matriz
21 12
2 / 1
11
R R R
÷
asociados a los mismos valores propios
h
ì .
El vector
h h
t Y d ' = es el vector propio de la matriz
12
2 / 1
11 21
R R R
÷
asociado al vector propio
h
ì .
Este vector representa al vector de correlaciones de cada
k
y con la componente
h
t

y con norma
h
ì y además representa los vectores propios de norma
h
ì de la matriz de covarianzas de
k
yˆ .
Estos
k
yˆ son la proyección de
k
y en el espacio generado por las columnas X.
Sabemos que
h
t es la h-esima componente principal reducida de las proyecciones
k
yˆ y además
h
t
se puede representar de la siguiente forma:
h
h
h
d Y t
ˆ
1
ì
=


6

Por lo tanto la componente
h
t es obtenida por regresión de Yd
h
sobre X más una normalización.

De
h
d Y Y
n
ˆ
'
ˆ
1
y ) ,...., ( ) ˆ var(
1
2
p k k
X MX y R y = se puede obtener lo siguiente:

) , ˆ ( ) ,..., , ( ) , ˆ cov( ) , (
1 h k p k h k h k
t y cor X X y R t y t y cor × = =

Estas correlaciones nos permites visualizar la relación de las variables X e Y con las componentes
h
t .

Análisis factorial inter-baterías.

El método de análisis factorial inter-baterías propuesto por Ledyard R. Tucker se diseñó para
proporcionar información relevante para la estabilidad de los factores sobre selecciones diferentes
de pruebas. Dos series de pruebas, postuló que depender de los mismos factores comunes, pero no
pruebas paralelas, se dan a una muestra de individuos. Los factores que se determina a partir de la
correlación de las pruebas en una batería con las pruebas en la otra batería
1
. Estos factores son sólo
aquellos que son comunes a las dos baterías. (Tucker, 1958, p.111).La existencia de estimaciones de
comunalidad no es obligatoria. Una prueba estadística se proporciona para juzgar el número mínimo
de factores implicados. La rotación de los ejes se lleva a cabo de forma independiente para las dos
baterías. Un paso final ofrece la correlación entre los factores determinados por las puntuaciones en
las pruebas en las dos baterías. Las correlaciones entre los factores correspondientes se toman como
coeficientes de fiabilidad de los factores. En resumen es un método estricto de análisis de
componentes desde dos sets de combinaciones observables de líneas de variables se emplean para
investigar la relación entre dos baterías de pruebas (Brown M.W. 1979).
Figura 3.- representación simple análisis factorial de inter-baterías







1
Tucker, L. R. (1958) An inter-battery method of factor analysis. Psychometrika
7

Ahora bien adentrándonos más al método propuesto por Turker buscaremos los vectores t
h
=Xa
h
y
u
h
=Yb
h
de manera que expliquen bien su propio grupo de variables y al mismo tiempo estén
máximamente correlacionadas (igual que en correlaciones canónicas); Además a
h
y b
h
son
ortonomales las que serán tomadas como restricciones al problema de maximización

El criterio a maximizar es:

) var( ) var( ) , ( ) , cov(
h h h h h h
Yb Xa Yb Xa cor Yb Xa =




La covarianza entre
h
t y
h
u puede ser expresada por: Figura 4.- grafico del cálculo de R
12
b
h


h h h h h h h h
b R b R a b R a Yb Xa
12 12 12
) cos( ' ) , cov( = = = ¸

Por lo tanto la covarianza será máxima cuando
h
a y
h
b R
12
sean colineales y de este modo el valor
de
h
¸ es de
h
b R
12
. Del mismo modo el vector
h
b es colineal con
h
a R
21
y por lo tanto
h h
a R
21
= ¸ .
Existen ecuaciones de de transición o de de componentes para
h
a y
h
b las cuales están definidas
por:
h
h
h
b R a
12
1
¸
= (1)
h
h
h
a R b
21
1
¸
= (2)
Si reemplazamos la ecuación (2) en (1) obtenemos lo siguiente:

h
h h
h
a R R a
21 12
1 1
¸ ¸
= ¬
h h h
a R R a
21 12
2
= ¸
Lo mismo sucede si reemplazamos (1) en (2) obteniendo:


h h h
b R R b
12 21
2
= ¸
8


Estas dos ecuaciones anteriores son las ecuaciones de estacionalidad.
Cuando la matriz R
12
es no-singular podemos hacer una descomposición en valores singulares de la
siguiente forma:
¿
=
=
s
h
h h h
b a R
1
12
' ¸
Esta descomposición y utilizando las ecuaciones de transición mencionadas anteriormente
obtenemos:
) , ( ) , (
) , (
1
) , (
1
h k h j
s
h h h
k j
t y cor u x cor
u t cor
y x cor × × =
¿
=

Con esto se puede visualizar la matriz de correlaciones inter-grupos o inter-baterías usando las
correlaciones entre las variables de un grupo y las componentes del otro grupo. Además con esto
obtenemos la mejor aproximación de R
12
en el sentido de mínimos cuadrados.
Por último Tuker propuso el estadístico
m
u el cual determina el numero mínimo de m
componentes. Además este componente permite calcular si el residuo
¿
+ =
=
s
m h
h
m
R R
1
2 ) (
21 12
~
¸ es
significativo.


























9

4 Resultados



En los estadísticos descriptivos de las variables observamos que en general las medianas poseen
valores más alto que las medias por lo tanto podemos decir que las medias de las variables se ubican
por debajo del valor central que tomas las variables por lo tanto la distribución de los datos debieran
tender a tener una cola o sesgo hacia la izquierda, por ejemplo, en las variables D1, DB, DD y DM
poseen medias de 0.483, -5.710, -3.359 y 0.526 respectivamente y las medianas son 0.850, -4.767, -
1.500 y 1.000 respectivamente lo cual corrobora lo antes mencionado. También podemos apoyar la
información anterior observando los histogramas de las variables.

El coeficiente de asimetría muestran más evidencia a favor de que la distribución de los datos es
asimétrica pues observamos que la gran mayoría de las variables poseen coeficientes de asimetría
negativas exceptuando a DC y DL (1.024 y 0,338 respectivamente), así decimos que los
coeficientes de asimetría positivos poseen un sesgo hacia la derecha y los negativos, hacia la
izquierda. El coeficiente de curtosis, para la mayoría de las variables es mayor a 3 lo que indica un
apuntalamiento en sus distribuciones y además nos lleva a concluir que los la distribución de los
datos está en torno a la media exceptuando a D2, DB, DK y DM ya que en el caso de la primera,
está poseen un coeficiente de curtosis de casi 3 (2,995) lo que es casi una distribución
completamente normal, lo mismo ocurre con DB. En el caso de las dos últimas su coeficiente de
curtosis es claramente inferior a 3 lo que indicaría un achatamiento en su distribución y, por ende, la
dispersión de los datos. Cabe señalar que la dispersión de los datos se puede analizar de mejor
manera observando la desviación típica o desviación estándar, así, la mayoría de las variables que
poseen valores de curtosis inferiores a 3 poseen desviaciones típicas altas, y cuando me refiero a
altas significa que está alejado de la media, es decir los datos u observaciones de las variables están
dispersos. Por ejemplo en D2 la desviación típica es de 11.928 y la media es de 0.108, esto muestra
valores muy separados indicando una dispersión de los datos pero observamos que su curtosis es
Estadísticos
,483 ,850 3,9 6,0856 37,034 -,791 4,103 -19,3 12,4
,108 -1,333 -1,1 11,9282 142,282 -,068 2,995 -31,9 24,1
-2,381 -2,100 -4,8 8,1055 65,699 -,386 3,618 -26,3 16,7
1,066 1,600 -,4 5,4712 29,934 -,595 4,811 -19,5 14,6
-5,710 -4,767 -7,2 7,0696 49,979 -,223 2,977 -22,9 11,9
-7,598 -9,825 -15,9 10,2776 105,629 1,024 4,829 -26,4 33,6
-3,359 -1,500 -3,0 11,5526 133,463 -,333 3,107 -30,9 28,7
1,433 1,900 2,6 5,7915 33,541 -,440 3,810 -13,8 17,5
1,899 1,133 -1,9 7,3340 53,787 ,464 3,549 -18,0 24,6
1,002 1,075 1,0 6,2380 38,913 -,009 3,894 -17,1 17,4
1,185 1,550 -,1 8,0910 65,464 -1,222 7,607 -35,6 20,8
-1,012 1,150 -1,2 8,7563 76,673 -1,983 7,488 -36,2 14,0
1,301 2,125 2,2 7,9234 62,780 -,678 4,461 -28,3 20,2
2,671 2,750 -6,3 9,8777 97,570 -,001 2,880 -23,4 27,5
1,983 1,350 13,3 10,2878 105,838 ,338 3,058 -22,2 28,3
,526 1,000 3,9 10,6511 113,447 -,514 1,016 -32,2 28,0
D1
D2
D3
DA
DB
DC
DD
DE
DF
DG
DH
DI
DJ
DK
DL
DM
Media Mediana Moda Desv. típ. Varianza Asimetría Curtosis Mínimo Máximo
10

casi 3 por lo tanto podemos concluir que la distancia entre la desviación estándar y la media no es
tan alejada ya que sus observaciones pueden distribuirse prácticamente como una distribución
normal; en la práctica podemos decir que esta industria es una de las más estables en su
productividad ya que es sabido que en la realidad es difícil encontrar este tipo de distribuciones. Del
mismo modo podemos hablar de DB aunque en este caso la distancia entre la desviación estándar y
la media es mucho mayor que en la variable anterior (12.779).



Figura 5.- Histogramas de cada variable

Cabe destacar que existen variables con datos atípicos como lo son D3, DA, DB, DC, DH o DK
por nombrar algunas ya que se observa en los histogramas valores alejados de la distribución,
destacando a la variable DH ya que posee muchos datos atípicos a la izquierda de la distribución.
Observamos también que por ejemplo en la variable DK posee datos atípicos en ambos lados de la
distribución (no apreciables en los diagramas de caja). Todo esto se podría apreciar de mejor
manera al hacer box-plot de cada variable para ver que observaciones son las atípicas, por lo tanto
para corroborar lo que en primera instancia vemos en los histogramas observamos que para DH en
noviembre y diciembre del año 2008 sus índices de productividad fueron de -27 y -35.6
respectivamente lo que queda expuesto en el diagrama de caja como valores atípicos ubicados
debajo del límite inferior definido como el tercer cuartil mas 1.5 veces la diferencia intercuartílica.
11

Existen dos variables a destacar por una particularidad que poseen, la que es una mezcla de
distribuciones que son en el caso de las variables DE y DI ya que en los histogramas podemos ver
como se existen otros grupos pequeños de datos a la izquierda de ambas distribuciones lo que
podemos apreciar también en los diagramas de caja como en DI ya que el pequeño grupo de
observaciones ubicado a la izquierda está conformado por los índices de productividad encontrados
desde marzo del 2008 hasta diciembre exceptuando al mes de abril. Estos 9 índices tienen valores
superiores a -20% de productividad y el resto de los meses de todos los años los índices no superan
los 2 dígitos excepto abril del 2006, marzo del 2005 y febrero del 2000 (14%, 11.9% y 12.8%
respectivamente)por lo tanto es claro que en los meses anteriormente mencionados algo pasa en esa
industria en ese periodo de tiempo puesto que esos índices son muy bajos en comparación con el
resto o que lleva a formar un grupo aparte dentro de la distribución de los datos. Lo mismo ocurre
con DE ya que el grupo de observaciones que se aprecia en los histogramas corresponden a los
meses de marzo, mayo, junio, agosto, septiembre, octubre, noviembre y diciembre del año 2008 con
valores también negativos, es decir bajos índices de productividad en esos meses.


Figura 6.- Conjunto N°1 de Diagramas de caja
12


Figura 7.- Conjunto N°2 de Diagramas de caja

Correlaciones canónicas
La Tabla (1) nos muestra asociaciones de todo tipo mayoritariamente asociaciones lineales positivas
bajas, moderadas y fuertes. La variable Industria textil y de la confección (DB) se relaciona de
manera positiva y fuerte con la Fabricación de material de transporte (DM) con una correlación de
0.811 y de manera moderada con las variables Industria de la transformación del caucho y materias
plásticas (DH), Metalurgia y fabricación de productos metálicos (DJ), Industria de la construcción
de maquinaria y equipo mecánico (DK) y la Industria de material y equipo eléctrico, electrónico y
óptico (DL) con correlaciones de 0.631, 0.622, 0.682, 0.678 y 0.811 respectivamente. Otras
variables que poseen un grado de dependencia lineal alto y positivo son DH con DJ (0.854) y DM
(0.802), y con valores un poco más bajos como por ejemplo DE con DH (0.748) y DL con DK
(0.718) y DM (0.730). El hecho de que todas sean positivas nos lleva a decir que en ambas variables
aumentar su índice de productividad si es que en una de ellas llegase aumentar, es decir si el índice
de productividad de la Industria de material y equipo eléctrico, electrónico y óptico aumenta el
índice de productividad de la Industria de la construcción de maquinaria y equipo mecánico también
lo hará. En base a esta matriz podríamos decir que con 4 o 5 variables se puede resumir la
información contenida en la matriz X y que las variables DM, DJ, DH, DI y quizás DB serian las
que más aportarían en la construcción de la primera variable canónica.

13

Tabla (1).- matriz de correlaciones de las variables X (V11)
DA DB DC DD DE DF DG DH DI DJ DK DL DM
DA 1 0.440 0.421 0.477 0.506 0.209 0.629 0.550 0.371 0.572 0.263 0.249 0.439
DB 0.440 1 0.473 0.348 0.357 -0.085 0.540 0.631 0.578 0.622 0.682 0.678 0.811
DC 0.421 0.473 1 0.338 0.324 -0.074 0.541 0.578 0.321 0.496 0.294 0.270 0.524
DD 0.477 0.348 0.338 1 0.661 -0.008 0.471 0.638 0.682 0.737 0.481 0.433 0.442
DE 0.506 0.357 0.324 0.661 1 0.030 0.514 0.748 0.677 0.653 0.252 0.286 0.488
DF 0.209 -0.085 -0.074 -0.008 0.030 1 0.161 0.077 0.001 0.081 -0.120 -0.081 0.068
DG 0.629 0.540 0.541 0.471 0.514 0.161 1 0.749 0.571 0.674 0.457 0.467 0.683
DH 0.550 0.631 0.578 0.638 0.748 0.077 0.749 1 0.763 0.854 0.470 0.527 0.802
DI 0.371 0.578 0.321 0.682 0.677 0.001 0.571 0.763 1 0.721 0.513 0.459 0.613
DJ 0.572 0.622 0.496 0.737 0.653 0.081 0.674 0.854 0.721 1 0.572 0.670 0.783
DK 0.263 0.682 0.294 0.481 0.252 -0.120 0.457 0.470 0.513 0.572 1 0.718 0.587
DL 0.249 0.678 0.270 0.433 0.286 -0.081 0.467 0.527 0.459 0.670 0.718 1 0.730
DM 0.439 0.811 0.524 0.442 0.488 0.068 0.683 0.802 0.613 0.783 0.587 0.730 1

En el caso de la tabla (2) observamos solo asociaciones lineales positivas y moderadas-altas y
vemos como la industria manufacturera se correlaciona bien con la industria pesada (0.727) y un
poco mejor con las industrias extractivas (0.755). Como todas las correlaciones son moderadas o
altas es probable que todas las variables contribuyan fuertemente a la construcción o formación de
la primera variable canónica.

Tabla (2).- matriz de correlaciones de la variables Y
(V22)
D1 D2 D3
D1 1 0.727 0.755
D2 0.727 1 0.601
D3 0.755 0.601 1

La Tabla (3) muestra mayormente correlaciones moderadas y solo una negativa, D2 con DF
(-0.165). El resto de correlaciones son todas positivas en las que destacamos las que son altas como
la industria manufacturera con la Metalurgia y fabricación de productos metálicos con una
correlación de 0.924 y con la Industria de la transformación del caucho y materias plásticas con una
correlación de 0.887. Las otras dos variables correspondientes de Y poseen correlaciones
moderadas con las variables X y solo la variable del Refino de petróleo y tratamiento de
combustibles nucleares tiene correlaciones muy bajas con las 3 variables Y. Sumando las
correlaciones de las variables Y encontramos que todas las variables se relacionan con las variables
X y las variables X que más se asocian a las industrias manufacturera, pesada y extractiva son la
Industria textil y de la confección, Industria de la transformación del caucho y materias plásticas,
Industrias de otros productos minerales no metálicos, Metalurgia y fabricación de productos
metálicos y la Fabricación de material de transporte. Así estas cinco variables más la industria,
manufacturera, industria pesada e industria extractiva debiesen aportar más a la formación de las
primeras variables canónicas.

14

Tabla (3).- matriz de correlaciones entre las variables X e Y (V12)
DA DB DC DD DE DF DG DH DI DJ DK DL DM suma
D1 0.649 0.779 0.549 0.705 0.679 0.066 0.802 0.887 0.785 0.924 0.689 0.742 0.876 9.132
D2 0.375 0.611 0.278 0.591 0.435 -0.165 0.528 0.551 0.675 0.605 0.721 0.645 0.511 6.361
D3 0.551 0.598 0.500 0.645 0.622 0.143 0.572 0.687 0.725 0.668 0.485 0.404 0.614 7.214
suma 1.575 1.988 1.327 1.941 1.736 0.044 1.902 2.125 2.185 2.197 1.895 1.791 2.001


La tabla (4) canónicas muestra los valores propios que obtuvimos de las matrices
21
1
22 12
1
11
V V V V
÷ ÷
y
12
1
11 21
1
22
V V V V
÷ ÷
con las cuales se obtuvieron 3 dimensiones como era de esperarse puesto que tengo 3
variables Y y 13 variables X por lo tanto el rango de la matriz será menor o igual a 3. Observamos
que los valores propios representan el cuadrado de las correlaciones canónicas de x* e y*. Como
vemos en la tabla los tres pares de variables canónicas están correlacionados, unos más fuertes que
otros, como el primer par de variables canónicas que es el mejor correlacionado del grupo con una
correlación casi igual a uno (0.9978), luego viene el segundo par con una correlación de 0.704 y por
último el tercer par de variables canónicas con una correlación de 0.586


Tabla (4).- correlaciones canónicas
dimensión
valores
propios
correlaciones
canónicas
1 0.995803 0.9978991
2 0.495443 0.7038772
3 0.343313 0.5859294


En la tabla de (5) encontramos los ponderadores de cada variable y el aporte que tienen para la
construcción o formación de las variables canónicas por lo tanto las variables (DA) Industria de la
alimentación, bebidas y tabaco, (DG) Industria química, (DJ) Metalurgia y fabricación de productos
metálicos y (DM) Fabricación de material de transporte son las que más peso tienen en la
construcción de la primera variable canónica (con ponderadores iguales a -0.025, -0.022, -0.029 y -
0.018 respectivamente) y la que menos aporta es la variable (DH) Industria de la transformación del
caucho y materias plásticas contradiciendo lo obtenido a partir de las matrices de correlaciones de X
e Y. para el caso de la segunda variable canónica vemos que nuevamente se repiten las variables
DG, DJ y DM como las que más aportan a la formación de la variable canónica siendo esta ultima
la que más aporta de todas las variables X (-0.105) y la que menos aporta es la variable (DD)
Industria de la madera y del corcho (0.005). El mismo análisis hacemos para la tercera variable
canónica destacando nuevamente a DJ que posee la mayor ponderación favorable a la formación de
la variable canónica. Lo mismo observamos en la tabla de los coeficientes para las variables Y en
donde la variable (D1) industria manufacturera tiene el mayor peso para formar la primera variable
canónica con una ponderación de –0.170; para la segunda variable canónica (D1) Industria
manufacturera e (D2) Industria pesada poseen coeficientes altos que aportan en la formación de la
15

segunda variable canónica y para la tercera variable canónica nuevamente D1 aporta en la
formación y ahora la variable (D3) Industrias extractivas se hace presente con un peso considerable
en la formación de la variable canónica.

Tabla (5).- coeficientes para las variables X ( o )
dimension 1 2 3
DA -0.025 -0.008 -0.019
DB -0.009 0.028 -0.053
DC -0.004 -0.024 -0.049
DD -0.003 0.005 -0.045
DE -0.016 -0.034 -0.041
DF -0.003 -0.045 -0.048
DG -0.022 0.046 0.065
DH -0.001 0.021 0.062
DI -0.014 0.043 -0.097
DJ -0.029 -0.044 0.102
DK -0.008 0.044 -0.014
DL -0.013 0.062 0.041
DM -0.018 -0.105 0.012

Tabla (6).- coeficientes para las variables Y ( | )
dimensión 1 2 3
D1 -0.170 -0.114 0.211
D2 0.005 0.121 -0.02
D3 -0.001 -0.052 -0.182


Podemos apreciar en las siguientes matrices las correlaciones entre el conjunto de variables X e Y
con las variables canónicas x* e y*. En la tabla (7) notamos que las correlaciones entre X y x*, para
la primera variable canónica, en general son altas y todas negativas destacando las asociaciones más
altas como DJ, DM, DH y DG con correlaciones superiores a -0.8. Existe la excepción con la
variable DF que posee una asociación lineal negativa muy baja con la primera variable canónica (-
0.079). En cambio para las variables canónicas 2 y 3 las correlaciones son moderadas a bajas y
cerca de un 60% son asociaciones negativas para el caso de la segunda variable canónica.
En el caso de las correlaciones entre las variables Y y las variables canónicas x* notamos como las
variables Y están altamente correlacionadas con la primera variable canónica ya que D1, D2 y D3
poseen correlaciones de -0.997 -0.699 y -0.754 respectivamente representando una asociación
lineal negativa entre ellas. Par la segunda variable canónica solo una variable posee una asociación
lineal moderada que es (D2) Industria pesada (0.484) y el resto son correlaciones bajas; del mismo
modo para la variable tercera variable canónica que en este caso la variable (D3) industrias
extractivas posee una asociación moderada negativa (-0.381).
16

Del mismo modo anterior, las correlaciones entre X e y* para la primera variable canónica son en
general altas y ahora todas negativas destacando como siempre a DJ como la mejor asociada con la
primera variable canónica (-0.927). Notamos como las correlaciones de la primera variable
canónica son muy parecidas con las obtenidas de la matriz de variables X con las x*. Nuevamente
las asociaciones lineales de las variables X con la segunda y tercera variable canónica bajan a
asociaciones moderadas y bajas como DG (-0.035), DE (-0.105) y DJ (-0.050) por ejemplo.
Por último observamos en la tabla (10) como las variables Y se correlacionan con las variables
canónicas y* y notamos que para la primera variable canónica D1 posee una asociación lineal
negativa casi perfecta (-0.999) y el resto posee correlaciones altas superiores a -0.7. Para las
variables canónicas restantes solo las variables D2 y D3 poseen correlaciones moderadas de 0.687
para D2 en la segunda y* y de -0.650 para D3 en la tercera y*.
En la figura se puede corroborar lo antes dicho ya que observamos cómo se correlacionan las
variables X e Y con las 2 dimensiones correspondiente a los pares de variables canónicas. En
general observamos en la dimensión 1 como todas las variables poseen correlaciones negativas y la
industria manufacturera (D1) es la que más al límite está del circulo de correlaciones lo que indica
una correlación de valor 1 o muy cercana a dicho valor, contrastando lo que ocurre con Refino de
petróleo y tratamiento de combustibles nucleares (DF) el cual tiene una correlación my baja ya que
se encuentra ubicado cerca de la vertical o del cero en la dimensión 1. De la misma manera vemos
la ubicación de las variables en la dimensión 2 pro ahora se ven correlaciones positivas y negativas
y en general moderadas y podemos distinguir 2 grupos de variables, uno de correlaciones positivas
en la cual están las variables Metalurgia y fabricación de productos metálicos (DJ), Industria
química (DG), Industria de la transformación del caucho y materias plásticas (DH), Fabricación de
material de transporte (DM), Industria del papel; edición. artes gráficas y reproducción de soportes
grabados (DE), Industria de la alimentación. bebidas y tabaco (DA), Industria del cuero y del
calzado (DC) y la industria extractiva (D3); y uno de correlaciones negativas que tiene variables
Industria textil y de la confección (DB), Industria de la madera y del corcho (DD), Industrias de
otros productos minerales no metálicos (DI), Industria de la construcción de maquinaria y equipo
mecánico (DK), Industria de material y equipo eléctrico. electrónico y óptico (DL) y la industria
pesada (D2). Notemos que estos dos grupos de variables está conformado prácticamente con
variables X y que cada grupo posee una variable Y. por último en la figura () se muestra la
proyección de los individuos asociado a las dimensiones 1 y 2. Notamos como las observaciones se
concentran en gran medida cerca del punto (0,0) pero en general se nota una dispersión de las
observaciones por ejemplo la observaciones 1, 10, 7, 22, 30 las cuales corresponden a diciembre,
junio , marzo del año 2008, marzo del 2007 y julio del 2006 son las observaciones que más lejos
están.




17

Tabla (7).- matriz de correlación entre las variables
X y las variables canónicas x*
1 2 3
DA -0.656 -0.201 -0.119
DB -0.778 0.128 -0.048
DC -0.558 -0.271 -0.170
DD -0.703 0.131 -0.320
DE -0.684 -0.149 -0.256
DF -0.079 -0.490 -0.147
DG -0.806 -0.050 0.101
DH -0.894 -0.155 -0.011
DI -0.781 0.177 -0.381
DJ -0.929 -0.070 0.096
DK -0.677 0.511 -0.005
DL -0.736 0.351 0.347
DM -0.884 -0.184 0.167

Tabla (8).- matriz de correlación entre las variables Y y
las variables canónicas x*
1 2 3
D1 -0.997 0.027 -0.003
D2 -0.699 0.484 -0.112
D3 -0.754 -0.054 -0.381

Tabla (9).- matriz de correlación entre las variables X y
las variables canónicas y*
1 2 3
DA -0.655 -0.141 -0.069
DB -0.776 0.090 -0.028
DC -0.557 -0.191 -0.100
DD -0.701 0.092 -0.188
DE -0.683 -0.105 -0.150
DF -0.079 -0.345 -0.086
DG -0.804 -0.035 0.059
DH -0.892 -0.109 -0.006
DI -0.780 0.125 -0.223
DJ -0.927 -0.050 0.056
DK -0.676 0.360 -0.003
DL -0.734 0.247 0.203
DM -0.883 -0.129 0.098

Tabla (10).- matriz de correlación entre las variables
Y y las variables canónicas y*
1 2 3
D1 -0.999 0.038 -0.005
D2 -0.701 0.687 -0.192
D3 -0.756 -0.077 -0.650

18


Figura 8.- Circulo de correlaciones


Figura 9.- plano de proyección de individuos en las dimensiones 1 y 2




19

ANÁLISIS DE REDUNDANCIAS
Primero que todo mencionamos que las matrices de correlaciones de las variables son exactamente
iguales a las obtenidas por el método de correlaciones canónicas
2
, por lo tanto las interpretaciones
de dichas tablas se encuentran en la sección del análisis de correlaciones canónicas.
En la tabla (11) están los valores de c
h
extraídos de la matriz simétrica los cuales están asociados a
los s valores propios, en particular con un s=3. estos vectores fueron calculados a partir de mi
matriz de variables X.
Tabla (11).- vectores normalizados c
h
(Vectores
propios de la matriz simétrica R
11
-1/2
R
12
R
21
R
11
-1/2
)
h 1 2 3
DA -0,25794 -0,16764 0,00825
DB -0,32041 0,01867 -0,13261
DC -0,17909 -0,35281 -0,15012
DD -0,31573 -0,01523 -0,31710
DE -0,25300 -0,23211 -0,11208
DF -0,01440 -0,46366 -0,08465
DG -0,27552 0,10325 0,26721
DH -0,24708 -0,08751 0,24376
DI -0,41464 0,05982 -0,48982
DJ -0,28518 -0,10203 0,43091
DK -0,33316 0,41959 -0,13159
DL -0,28028 0,44653 0,35351
DM -0,23466 -0,41259 0,37526

Los vectores de pesos a
h
representan la cantidad de información aportada para la construcción de las
componentes, en este caso son 3 componentes pues ese es el rango de la matriz R
12
. Estos vectores
corresponden a las combinaciones lineales asociadas a mi matriz X para formar el conjunto
resumido de información correspondiente a los t
h
. Para el caso de la primera componente notamos
que los valores son bajos, negativos y que la única variable que aporta significativamente dentro de
del conjunto de variables es Industrias de otros productos minerales no metálicos (DI) puesto que
posee el valor más alto de todas las otras variables
3
(-0,33792), el resto de variables no aporta en
mucho en la construcción de la primera componentes. Para el caso de la segunda componente
observamos que existe una variable, y la única por lo demás, que posee un valor en su peso mayor a
1 que es la variable Fabricación de material de transporte (DM) lo que indica que esta variable es la
que mayor información aporta a la formación de la segunda componente, además de DM
encontramos otras 3 variables que tienen pesos significativos para la formación de dicha
componente las cuales son Refino de petróleo y tratamiento de combustibles nucleares (DF) E
industria de material y equipo eléctrico. Electrónico y óptico (DL) con pesos de -0,41174 y 0,71473
respectivamente. Por último la componente 3 posee tres variables que pueden aportar mucho a su
2
V
11
= R
11
; V
12
=R
12
; V
22
=R
22

3
para ver cuánto aporta solo nos interesa la magnitud del vector.
20

Formación y notamos como la variable DI vuelve a repetirse pues ya aportaba a la formación de
la componente 1 y ahora lo hace con la componente 3 la cual lo hace con un peso de 0,87086 lo
cual es bastante bueno, también otras existen variables que aportan a la formación de esta
componente que son Industria de la madera y del corcho (DD) y Metalurgia y fabricación de
productos metálicos (DJ) ambos con pesos de -0,49205 y 0,89651 respectivamente.
Tabla (12).- Vectores de pesos a
h
, (vectores
propios de la matriz R
11
-1/2
R
12
R
21
)
h 1 2 3
DA -0,14596 -0,08573 -0,05796
DB -0,16105 0,08104 -0,39111
DC -0,08669 -0,37442 -0,40498
DD -0,13691 -0,09285 -0,49205
DE -0,10138 -0,26538 -0,15674
DF -0,03044 -0,41174 -0,24427
DG -0,10493 0,37105 0,34032
DH 0,05766 0,30232 0,43253
DI -0,33792 0,11352 -0,87086
DJ -0,02440 -0,13499 0,89651
DK -0,17432 0,36555 -0,21522
DL -0,15544 0,71473 0,27213
DM 0,02256 -1,05823 0,44125

Con los vectores de pesos a
h
es posible calcular las componentes t
h
las cuales son mostradas en la
tabla de componentes centradas-reducidas y no correlacionadas. Observamos como están
relacionadas nuestras observaciones con la componente 1 y notamos que las observaciones 1, 2, 3,
4, 5, 7, 8, 9 y 10 (correspondientes a los últimos 10 meses del año 2008, exceptuando julio) están
altamente relacionadas (2,859380, 2,879101, 2,015322, 1,298764, 2,696219, 2,304839, 1,896752, -
1,442171 y 3,019577 respectivamente); ésta componente se relacionaba con la variable de las
Industrias de otros productos minerales no metálicos por lo tanto podemos decir que a fines del año
2008 el IPI de dicha subseccion de industria es donde mejor productividad poseía. Para el caso de la
segunda componente no se aprecia bien algún tipo de tendencia en su productividad , en los meses
de diciembre, noviembre, octubre, agosto, febrero y enero del año 2008 se relacionan altamente con
la componente 2 y finalmente en la componente 3 ocurre algo similar que con la componente 1 pues
desde diciembre hasta noviembre, desde septiembre hasta enero del 2008 y agosto del 2007 (-
1,284717, -1,403276, 1,880780, 2,063794, 1,614159, 2,313846, 2,194634, 2,591292, 0,951716 y
1,033695 respectivamente) la relación con la componente 3 es alta y si nos fijamos la componente 3
se relacionaba bien con es Industrias de otros productos minerales no metálicos (DI) y Metalurgia y
fabricación de productos metálicos (DJ), industrias que claramente siguen un base similar y por lo
tanto debiesen tener IPI parecidos o que se van distribuyendo de la misma manera a medida que
pasa el tiempo.


21

4
Tabla (12).- componentes centradas-reducidas
y no correlacionadas t
h

obs t 1 t 2 t 3
1 2,859380 -0,788461 -1,284717
2 2,879101 0,830357 -1,403276
3 2,015322 1,106304 0,163722
4 1,298764 0,710026 1,880780
5 2,696219 1,716010 2,063794
6 0,726761 -0,475786 1,614159
7 2,304839 0,180878 2,313846
8 1,896752 0,478532 2,194634
9 -1,442171 -0,309901 2,591292
10 3,019577 -0,563071 0,951716
11 -0,288578 -1,877380 0,272659
12 0,325817 -0,995340 -0,087469
13 0,256892 0,869151 0,367997
14 0,444058 0,496100 0,235489
15 -0,501817 0,602475 1,033695

El vector de correlaciones d
h
nos indica cuán bien correlacionadas están las componentes que me
resumen la información de X con mis variables Y, por lo tanto observamos que la componente 1
presenta correlaciones negativas con las 3 variables Y pero con la que mejor se relaciona es con la
industria manufacturera (D1) (-0,65888), la componente 2 se relaciona de manera fuerte y positiva
con la industria pesada (D2) con un correlación de 0.80933 y finalmente la componente 3 posee dos
correlaciones altas, una positiva y una negativa las cuales son la industria manufacturera y la
industria extractiva (D3) con correlaciones de 0.725722 y 0.637709 respectivamente.
Tabla (13).- vector de correlaciones d
h
,
normalizado de cada y
k
con la componente t
h

1 2 3
D1 -0,6588834 -0,1979879 0,7257227
D2 -0,5275614 0,8093363 -0,2581739
D3 -0,5362384 -0,5529698 -0,637709

Tabla (14).- Matriz R
12
R
11
-1/2
R
21
O matriz de covarianzas de las valores ajustados de Y, Y Y
n
ˆ
'
ˆ
1

R
12
R
11
1/2
R
21


Y Y
n
ˆ
'
ˆ
1


D1* D2* D3* D1* D2* D3*
D1* 0,995054 0,710539 0,751716 D1* 0,9858404 0,7039596 0,7447557
D2* 0,710539 0,735472 0,543940 D2* 0,7039596 0,7286621 0,5389033
D3* 0,751716 0,543940 0,716984 D3* 0,7447557 0,5389033 0,7103455

4
Tabla (12) solo con 15 observaciones para mejor interpretación
22

D1 0,99505
D2 0,73547
D3 0,71698
Tabla (15).- coeficiente de determinacion de las regresiones de yk las sobre las X
) , , ; (
3 2 1
2
x x x y R
k
=

El circulo de correlaciones muestra mis variables X, Y y las variables canónicas. Observamos que
las variables canónicas poseen correlaciones altas en el plano de la componente t
1
y moderadas a
bajas en la componente t
2
, todas negativas y notamos 2 grupos de variables, el primero conformado
por D2, D2*, DK y DL y el segundo grupo por todas las otras variables restantes exceptuando a la
variable DF pues está totalmente alejado de las otras variables con una correlación negativa en
ambas componentes y de valor casi cero en la componente 1.

Figura 10.- Circulo de correlaciones
ANÁLISIS FACTORIAL INTER-BATERÍAS
Lo que queremos lograr con este método es poder conformar un conjunto de datos de menor
dimensión tanto para X como para Y que resuman la mayor información posible y que esos
conjuntos t
h
y u
h
tengan máxima varianza.
Tabla (16).- valores propios
2
h
¸ de la matriz
R
12
R
21

h 1 2 3
valor propio 2,17577 0,19001 0,08173

23

De la tabla (16) podemos observar los valores propios obtenidos a través del método inter-baterías
los cuales explican la variabilidad o varianza explicada por cada componente y observamos como la
primera componente explica en gran medida la variabilidad de las componentes (2,17577) mientras
que la segunda y la tercera explican en menor medida la varianza de las componentes pues la
segunda solo explica un 0.19001 de la varianza mientras que la componente 3 explica solo un
0.08173, una cuarta componente no es significativa debido a si valor que es prácticamente cero
5
. El
hecho de que explique con solo una componente toda la variabilidad es debido a hacer el análisis en
base a series de tiempo en la cual cada observación está altamente correlacionada con las otras.
Luego si miramos la tabla de la varianza de las componentes nos percatamos que con una
componente obtenemos un alto valor de varianzas tanto en la componente t
h
como en la componente
u
h
, corroborando la información que obtuvimos a través de los valores propios. Las otras dos
componentes poseen baja variabilidad explicada en t
h
y en menor medida en u
h
.
Tabla (17).- varianza de las
componentes t
h
y u
h

7
h t
h
u
h
1 7,071465 2,36434678
2 1,25990371 0,39934294
3 0,68270509 0,23631028

De las proyecciones de mis observaciones en el plano conformado por las componentes t
h
y u
h
destacamos nuevamente los meses de diciembre hasta marzo exceptuando julio pues se relacionan
de buena manera con las componentes t
h
(8,367255, 8,298691, 5,755451, 2,930638, 6,541035,
5,106998, 4,112312, -4,917980 y 7,092082 respectivamente) y para el caso de las u
h
ocurre similar
pero en menor intensidad ya que los últimos 5 meses del año septiembre los scores son
medianamente altos en comparación al resto (3,856875, 5,132162, 3,206351, 1,925987 y 4,199700).
A continuación mostramos las tablas de correlaciones entre las variables X y las componentes t
h
y
u
h
, y las correlaciones entre las variables Y y las componentes t
h
y u
h.
para las variables X y t
h

encontramos que todas las correlaciones son negativas y moderada-alta destacando las más altas
como por ejemplo Industria de la transformación del caucho y materias plásticas(DH) y Metalurgia
y fabricación de productos metálicos (DJ) con correlaciones de -0.91088 y -0.91760. era de
esperarse que encontráramos una alta correlación entre mis variables X y la primera componente
pues como lo vimos con los valores propios, el primero de ellos era demasiado alto comparado con
el resto, estos resultados de correlaciones altas en la primera componente debemos esperarlo para
todas las otras correlaciones entre variables y componentes restantes. Volviendo a la tabla en la
segunda componente solo podemos mencionar a dos variables que tienen correlaciones moderadas
que son Refino de petróleo y tratamiento de combustibles nucleares (0.62249) y Industria de la
construcción de maquinaria y equipo mecánico (-0.49756). Para la tabla () las correlaciones que
tienen mis variables con u
1
son esperablemente altas y precisamente DH, DI y DJ tiene
correlaciones que son de -0.81, -0.81 y -0.83 respectivamente. Para la segunda componente se hace
el mismo análisis que en la tabla anterior. Efectivamente si se revisan las tablas siguientes
observarán como las correlaciones de las variables Y tienen correlaciones altísimas con la primera
componente.
24


Tabla (19).- correlación entre las variables X y las componentes t
h

t 1 t 2 t 3


DA -0,63284016 0,43932569 -0,04837974


DB -0,78266263 -0,18390445 -0,29420904


DC -0,58755421 0,30218035 -0,15763857


DD -0,73556755 0,05970153 0,38411073


DE -0,70738491 0,33573732 0,29128494


DF -0,03354218 0,62249564 -0,13006667


DG -0,79305245 0,26155921 -0,26767402


DH -0,91088117 0,2661817 -0,09644679


DI -0,80650134 0,02966967 0,30076262


DJ -0,91760201 0,11031393 -0,14031597


DK -0,69011489 -0,49759992 -0,10791991


DL -0,71393068 -0,42950508 -0,46413402


DM -0,86709154 0,02637629 -0,4527543

Tabla (20).- correlación entre las variables X y las
componentes uh
u 1 u 2 u 3
DA -0,6016109 0,16225327 0,004400875
DB -0,7518243 -0,06929302 0,018545489
DC -0,508043 0,21752934 0,025149355
DD -0,7286948 -0,02098238 0,176464152
DE -0,6586052 0,15392629 0,090519537
DF -0,0257827 0,35534174 -0,008254009
DG -0,7263522 0,02188117 -0,098668062
DH -0,8111818 0,11343966 -0,057809579
DI -0,8187594 -0,03945548 0,215998245
DJ -0,8387555 0,03742651 -0,104304505
DK -0,7080358 -0,33342532 0,067337158
DL -0,6787911 -0,29244209 -0,162783433
DM -0,7681895 0,09932893 -0,163167828

Tabla (21).-correlación entre las variables Y y las componentes uh

u 1 u 2 u 3


D1 -0,9422874 -0,02561316 -0,02602886


D2 -0,8551069 -0,58294097 0,33262354


D3 -0,8774133 0,28847342 0,57776369

Tabla (22).- correlación entre las variables Y y las
componentes th

t 1 t 2 t 3
D1 -0,9923409 0,0612351 -0,17145084
D2 -0,7168767 -0,3095264 0,07061369
D3 -0,7714752 0,2088547 0,15491926

25

Las tablas (23) y (24) siguientes muestran la comunalidad inter-grupos, es decir cuánto explican
mis componentes t
h
a mis variables Y e idénticamente u
h
a mis variables X, para la tabla ()
observamos que la variable Metalurgia y fabricación de productos metálicos pues las 3
componentes explican de buena manera su varianza, 0.703 para la primera componente, 0.7182 para
la segunda componente y 0.865 para la tercera componente. En general las componentes explican
de forma moderada a todas las variables exceptuando a la variable DF que con la componente 1
solo se explica un 0.066% de la variabilidad. La tabla () muestra lo mismo que la anterior, las
componentes t
h
explican de buena forma la variabilidad de mis variables Y y notamos como la
industria manufacturera es explicada casi en su totalidad por las 3 componente bordeando el 99% de
la varianza explicada. Para el resto de las variables poseen relaciones moderadas con las
componentes, es decir que cada componente t
h
esta explicando más de un 50% de la variabilidad
para la industria extractiva y para la industria pesada.

Tabla (23).- comunalidad inter-grupos: parte de la varianza de las xj
explicadas por las componentes uh

1 2 3


DA 0,36193563 0,4116852 0,4539254


DB 0,56523973 0,5652681 0,6115498


DC 0,25810772 0,3306121 0,3559838


DD 0,53099616 0,5336560 0,5358161


DE 0,43376076 0,4823197 0,4998414


DF 0,00066475 0,1300307 0,1328954


DG 0,52758748 0,5365019 0,6518752


DH 0,65801590 0,6959969 0,8071295


DI 0,67036692 0,6721300 0,6731500


DJ 0,70351072 0,7182115 0,8651639


DK 0,50131476 0,5712637 0,5862796


DL 0,46075742 0,5119276 0,6411792


DM 0,59011503 0,6212389 0,8052472

Tabla (24).- comunalidad inter-grupos: parte de la varianza de las
yk explicadas por las componentes th

1 2 3


D1 0,9847404 0,9847934 0,9884263


D2 0,5139123 0,6434182 0,6776738


D3 0,5951739 0,6195016 0,6722746






26

A continuación se presenta Tabla (25) donde se comparan los tres métodos
Tabla (25) comparación de los 3 métodos según sus coeficientes de las combinaciones lineales
variable correlación canónica redundancias factorial interbaterías
a1 a2 a3 a1 a2 a3 a1 a2 a3
DA -0.025 -0.008 -0.019 -0,146 -0,086 -0,058 -0,240 0,241 0,011
DB -0.009 0.028 -0.053 -0,161 0,081 -0,391 -0,300 -0,103 0,045
DC -0.004 -0.024 -0.049 -0,087 -0,374 -0,405 -0,203 0,324 0,061
DD -0.003 0.005 -0.045 -0,137 -0,093 -0,492 -0,291 -0,031 0,430
DE -0.016 -0.034 -0.041 -0,101 -0,265 -0,157 -0,263 0,229 0,220
DF -0.003 -0.045 -0.048 -0,030 -0,412 -0,244 -0,010 0,529 -0,020
DG -0.022 0.046 0.065 -0,105 0,371 0,340 -0,290 0,033 -0,240
DH -0.001 0.021 0.062 0,058 0,302 0,433 -0,324 0,169 -0,141
DI -0.014 0.043 -0.097 -0,338 0,114 -0,871 -0,327 -0,059 0,526
DJ -0.029 -0.044 0.102 -0,024 -0,135 0,897 -0,335 0,056 -0,254
DK -0.008 0.044 -0.014 -0,174 0,366 -0,215 -0,283 -0,496 0,164
DL -0.013 0.062 0.041 -0,155 0,715 0,272 -0,271 -0,435 -0,396
DM -0.018 -0.105 0.012 0,023 -1,058 0,441 -0,307 0,148 -0,397
b1 b2 b3 b1 b2 b3
D1 -0.170 -0.114 0.211

-0,686 0,162 -0,710
D2 0.005 0.121 -0.02

-0,495 -0,818 0,292
D3 -0.001 -0.052 -0.182 -0,533 0,552 0,641

De la tabla (25) podemos decir que notoriamente la magnitud de los coeficientes en el análisis
factorial interbaterías es mayor por lo tanto dicho método representaría mejor para la formación de
la componente 1 ya que la variable de industria pesada tiene un valor de -0.3 para el análisis
interbaterías mientras que para redundancias dicha variable tiene un valor de -0.16 y para
correlaciones canónicas posee el valor más bajo que es -0.009. En general todos los valores de a
h

para interbaterías son mayores que el resto por lo tanto ese método es el mejor para calcular la
componente t
h
. Del mismo modo cuando observamos los vectores b
h
notamos que en todos sus
valores el análisis interbaterias es mejor pues sus magnitudes son mayores por lo tanto podemos
decir que el método multivariante de análisis factorial interbaterías es el mejor método para
desarrollar estos datos.
5 Conclusiones
En el artículo que se presentó pudimos aplicar 3 métodos multivariantes para encontrar una relación
entre dos conjuntos de variables que en este caso eran 13 variables X y 3 variables Y. mediante los
tres métodos pudimos establecer subconjuntos de variables llamadas canónicas o componentes de
los cuales se obtuvo siempre que con una sola componente o par de variables canónicas era posible
representar mis conjuntos de variables inicial y que me entregara la misma información. Pudimos
comparar los 3 métodos basándonos en los vectores de peso que sirven a la construcción de las
componentes y observamos que el mejor método para desarrollar nuestra base de datos es el análisis
factorial interbaterías puesto que los pesos eran mucho más grandes tanto para la creación de la
componente t
h
como para la componente u
h
. Es posible que estos resultados no sean los adecuados
debido a un problema de trabajar con series de tiempo, pues estos tipos de datos por lo general
27

presentan estacionalidad y tendencias como por ejemplo que dentro de un año específico se genere
aumento en el índice de producción y esto se repita cada año, eso vendría siendo una tendencia y la
estacionalidad es que los datos siempre sigan un mismo valor o que su variación a través del tiempo
sea muy leve. Es por esto que no me fue posible realizar un modelo de pronósticos pues
básicamente no tengo aun los conocimientos adecuados para realizarlo con éxito y me vi en la
obligación de buscar información en la Web para tratar de comprender la materia, es por eso que
agregué en el anexo un par de graficas de secuencia con los datos normales y las mismas graficas
con los datos ahora desestacionalizados.

6 Referencias
[1] www.ine.es
[2] J. Menéndez, “Determinación del nivel de conocimientos en Matemáticas y Lenguaje de los
estudiantes de séptimo año de educación básica de las escuelas particulares urbanas del cantón
Guayaquil: Análisis estadístico” (Tesis, Facultad de Ingeniería en Estadística e Informática, Escuela
Superior Politécnica del Litoral, 2001)
[3] Akaike, H “Canonical correlation analysis of time series and the use of an information
criterion”, Tokyo, Japan, 1976

[4] Carmona, F. “Aplicaciones de los teoremas de separación para valores singulares de matrices al
análisis de la redundancia” Barcelona, España, 1988

[5] Brown M. W. “the maximun- likelihood solution in interbattery factor analysis”, british journal
of mathematical and statistical phychology, 1979.

[6] Tuker L. R. “An inter-battery method of factor analysis. Phychometrika”, educational testing
service and Princeton university, new jersey EE.UU., 23(2) p. 111-136.

[7] http://www.uhu.es/45110/Ficheros%20de%20datos/CURSO%202009%202010/spss3.pdf

[8] http://www.uncp.edu.pe/universidad/investigacion/bodycenter/pdf/formato.pdf







28

7 Anexo
Tabla de datos originales de los primeros 60 observaciones (5 años)


obs D1 D2 D3 DA DB DC DD DE DF DG DH DI DJ DK DL DM
1 3,4 -1,4 4,3 -4 -8,4 33,6 17,3 3,3 -6,4 3,7 10,5 9,3 4,3 12,8 5,8 3,9
2 9,4 15 12,2 0,3 -3,4 9,3 12,1 6,2 12,2 10,7 14,6 12,8 15,4 11,5 15,2 10
3 9,1 14 13 4,3 -1,2 17,6 28,7 8,7 -5,8 1,4 12,3 8,8 13,6 7,9 13,3 13,9
4 -1,9 -1,4 -8,1 -2,6 -10,2 -10,7 6,6 -3,2 -0,9 -13,3 1,5 -0,3 5,5 -5,2 2,9 1,6
5 9,4 13,7 3,4 5,6 5,7 5,1 9,4 3,2 0,2 -0,3 8,1 3,2 20,2 12,6 18,3 14,8
6 4,5 2,2 1,4 2,5 -2 -1 12,9 0 -1,9 -4,4 1,3 1,9 13,3 8 12,6 7
7 -0,9 -4,7 -5,3 0,5 2,3 -13 -6,4 -1,2 -7,1 -7 1 2,4 -2,6 6 4,2 -0,5
8 7,3 -7 -6,2 -0,4 11,9 -2 -10,1 1,5 6 5,2 9,7 3 9,1 27,2 24,2 28
9 -0,3 -7,8 -4,3 -0,4 -2 -13,9 -8,9 2,6 -0,3 1,2 3,3 4,5 1,3 -10,1 -1,1 2,6
10 2,7 7,2 5,9 2,7 3,9 -11 -17,3 1,3 5,5 -4,8 5,4 2,7 3,1 0,4 13,4 7,5
11 3,9 1,3 6,6 3,2 4 -6,1 -14,7 0,3 5,5 -1,3 2,6 3,6 2,9 1,2 9,2 15,6
12 -5,4 -7,9 -8,1 -19,5 -13,6 -18,4 -23 -1 -1,5 -3,5 -0,9 -0,3 -5,1 5,5 5,7 1,1
13 5,9 6 3,9 -5,5 11,9 13,8 -13,1 0 -1,9 7,2 7,9 6,8 7,4 3,9 7,7 19,4
14 -3,9 -8,1 -9,5 -1,6 -2,7 -1,5 -18,3 -3,2 -18 -0,1 -1 -5,5 -8,4 -6,2 -5,6 -0,2
15 -4,3 -8,2 -9,2 -0,5 -3,6 -9,6 -25,8 -6 5,4 -2,4 1 -2,6 -6,6 -9,8 -4,1 -1,8
16 0 -3,5 3,4 1,3 -0,4 -0,9 -21,8 1 1 1,3 1,6 2 -3,9 3 -3,1 3,9
17 -1,7 -2 -3,4 1 -0,5 2,8 -21,6 -2,7 2,1 5,4 1,2 2,9 -8,8 -2,9 -8 0,4
18 -3,5 -3 -4,8 -0,7 -5 -6,6 -27,5 -4,3 -3,4 1,2 -2,2 1,9 -9,2 -0,9 -7 -1,7
19 -1 4,7 -3,6 1,6 -2,5 8,4 -13,8 -3,7 2,9 3,2 0,9 2,5 -4,2 -4,6 -8,8 1,2
20 2,4 10,4 -2,2 3,8 3,2 -5,2 -3,5 -5 -3,1 1,8 6,7 2,9 0,6 27,5 -2,2 -2,9
21 -3,7 11 -5,3 -3,8 -10,7 -4,7 -8,7 -3,4 -0,8 -4 -6,2 0,1 -1,5 11 -10,4 -9,9
22 2,5 17 6,4 3,8 -0,6 -5,2 13,4 3,7 0,2 5 0,6 6,7 1,5 12,9 -4,5 -6,7
23 -6,4 11,2 -7,5 -0,5 -15 -13,2 -6,1 -0,8 -10 1 -7 1,4 -6 -6,3 -13,3 -19,7
24 -7,6 6,1 -4,1 6 -9,8 -13,1 -1,7 -1,2 -5,1 -8,7 -9,7 -4,1 -11,1 3,8 -22,2 -23,8
25 -2,8 5 0,6 2,3 -13,6 -10,8 -3,3 10,5 6,5 -1,7 5,3 0,1 -5,8 -0,7 -11,6 -12,1
26 -1,4 1 7 2,5 -12,5 -4,2 4 8,9 10 -2,4 8 3,9 2,2 -6,6 -11,2 -9,2
27 -12,1 -17 -6,7 -8,6 -22,9 -14,1 -8,5 0,9 -0,2 -9,2 -8,4 -6,8 -11,8 -16,6 -17,5 -21,2
28 11 20,5 8,4 14,6 -5,1 6,2 18,7 13,6 3,3 17,4 20,8 5,4 15,2 5,1 4,1 7,5
29 -2,3 -2,5 -4,4 5 -13,4 -14,1 0,4 8,9 -0,4 -3,5 4,7 -1,9 0,7 -10,3 -7 -8,5
30 -6 -9,4 -8 -2,4 -17,6 -21 -2,3 4,6 16,3 -0,9 1,8 -5,3 -4,4 -15,8 -15,1 -10
31 3,9 2,7 6,3 7,3 -6,4 -7,2 -0,8 17,5 2,7 7,1 10 0 8,2 -3,1 0,3 -2,2
32 0,1 -16,4 -12,2 3,6 -7,2 11,6 -18,7 9,8 -3 5,5 4,2 -9,6 -1,9 -23,4 -9,9 5,4
33 2,9 -6,7 3,9 7 -7,3 4 3,8 10,2 -2 4,7 13,5 -1 5,9 -12,6 -1,4 6,7
34 5,5 -14 3,2 13,4 -6,6 5,8 -6,6 8,4 2,2 8,6 10,3 3,6 11,2 -5,2 -3,9 10,7
35 1,2 -24,9 -0,8 5 -7,2 -3,1 -1,3 7,9 2,8 2,1 8,7 -1,5 6,5 -4 -10,9 9,3
36 7 -14,4 -4,5 5,3 -10,8 17,2 4,6 9,2 9,1 9,7 19,2 -2,3 13,4 0,6 3 12,4
37 0,3 -3,1 -6,5 3,3 -7,1 -3,5 2,1 -1 4 7,1 3,1 -2 1,8 -10,7 0,4 -0,1
38 1,1 -2,1 -1 0,5 -2,5 -0,6 1,2 2,2 -8 7,2 -0,3 0,8 0,7 -0,9 0,1 3,7
39 10,9 9,4 8,3 10,1 1,2 2,1 5,3 7,4 11,7 17,3 15 8,3 13,9 8,6 3,7 17,4
40 -4,5 -8,1 -7,3 -4,2 -9,6 -18,5 -11 -0,8 11,5 -2,7 -6,3 -2,1 -6,3 -6,3 -8,6 -3,3
41 -1,1 -5,8 -1,2 -0,9 -12,3 -15,9 -3 1,7 21 3,5 -0,8 0,9 -3,8 -1,7 -3,6 -1,2
42 5,1 13 3,3 8,4 -5,3 -7,8 6,7 4,1 7,1 10,5 5,1 5,6 1,9 0,6 4 6,5
43 1,9 -1,7 -1 6,2 -8 -6,1 4,4 -2,4 24,6 4,4 2,5 4,1 2,2 -1,2 -1,9 1
44 -3,3 -2,5 -4,1 -2,5 -13,4 -23,4 -13,3 -2,9 15 1,1 -5 -3,5 -6,6 -4,9 -2,1 -4,5
45 2,4 -5,2 4,1 6,5 -3,6 -15,4 6,5 1 10,5 5,3 1,1 2,6 1,7 1,3 1,8 2,1
46 0,5 -5,9 -2,1 -0,3 -5 -11,1 2,9 0,8 13,4 -1,7 3,6 -0,8 2,7 0,2 -0,8 4
47 0,9 -4,8 0,1 -3,2 -5,9 -18,7 -2,8 4,8 11,6 -3,2 3,2 3,1 4,1 1,9 4,7 2,4
48 3,6 1,6 10,6 5,5 -0,7 -22,3 1,9 2,6 2,4 3,9 -0,1 3,2 0,2 2,6 8,8 13,6
49 -3,3 -12,3 -3 -3,5 -9,3 -17,3 -2,4 3,1 3,8 -8,1 -2,2 -3,5 -1,2 4,7 -6,6 -4,5
50 1,6 -4,8 -6,5 3 -4,2 -17 0,1 2,3 17,8 -2,5 2,2 2,6 4,3 7,3 3,4 -1,7
51 6,4 4,1 1,1 9,8 1 1 8,2 9,6 5,9 2,4 6,3 1,9 8,1 6,9 11,4 4,7
52 -0,2 -1,6 -5,4 1,2 -6,7 -11,2 2,9 -1,5 -3,3 -3,3 -0,1 -1,2 4,1 -2,7 9,4 -2,3
53 2,1 -0,7 -7,6 -0,2 -4,9 -13,4 -0,5 5,4 -1,9 0,1 1,7 0,2 5,8 2,4 7,9 4,1
54 5,4 -3,2 -0,7 2,8 -2 -9,6 4,4 8,3 -3 1 5,2 2,7 9,4 13 10,8 10,7
55 -0,6 -2,6 -8,7 -5,6 -4,1 -14,6 -5,2 1,4 -8,8 -0,7 -0,1 -0,4 0,9 3,6 3,8 5,6
56 6 2,1 -5,5 5,2 3,4 -11,9 10,8 7,3 0,6 5,5 9,3 5,7 5,9 9,6 13,3 6,6
57 3,4 5,3 -7,4 2,4 -1 -12 4,3 3 2,2 1,8 2,9 2,2 2,8 6,7 6,7 7,9
58 -8 -9,5 -16,4 -7,8 -15,4 -25,4 -1,5 -1,1 -12 -7,3 -6,7 -5,8 -11,1 -6,3 -7,4 -9,4
59 3,9 5 3,6 8,3 -4,6 -14,7 4,1 3,5 2,3 4,1 2,9 2,1 2,5 5,1 7,7 3,9
60 0,4 -4,7 2,3 4,9 -4,3 -14,9 -1 5,7 -1 -3,3 0,5 4,9 1,7 1,5 -0,3 -8,5
29

Tabla de datos con los primeros 60 datos desestacionalizados mediante descomposición
estacional con el programa SPSS.

obs D1 D2 D3 DA DB DC DD DE DF DG DH DI DJ DK DL DM
1 2,65 -3,43 4,59 -4,11 -10,10 30,38 16,68 2,42 -6,18 2,83 9,78 8,49 3,34 12,96 5,38 3,05
2 9,34 15,29 12,69 -0,11 -3,75 7,27 10,75 5,77 12,64 10,78 14,66 12,44 15,35 12,36 16,08 9,99
3 10,69 16,47 14,30 5,71 0,68 18,71 30,34 9,75 -6,95 2,63 13,68 10,06 15,02 10,84 14,74 16,33
4 -4,15 -5,25 -11,25 -4,49 -10,82 -12,98 4,51 -4,87 -1,47 -16,01 -1,04 -1,72 3,21 -7,64 0,59 -1,50
5 9,87 14,24 4,15 5,68 7,61 5,77 10,32 3,64 -0,95 0,06 8,41 3,31 20,89 14,21 18,08 15,65
6 5,30 2,41 2,45 3,48 -0,54 0,47 14,95 0,97 -2,41 -4,11 1,98 2,35 14,31 9,29 13,06 7,67
7 -0,43 -5,06 -5,43 0,13 1,73 -13,14 -5,85 -0,75 -6,04 -6,53 1,66 2,24 -1,58 6,96 4,80 0,93
8 5,70 -7,48 -4,66 -0,95 7,21 -4,65 -10,51 1,70 5,57 3,25 7,68 4,13 8,05 21,68 20,60 23,70
9 0,41 -6,82 -4,10 -0,03 -1,26 -12,34 -9,16 2,74 -0,80 2,04 4,16 4,53 1,96 -8,01 0,33 3,68
10 1,97 6,15 3,73 1,49 3,11 -10,58 -18,15 0,85 5,72 -4,80 4,87 1,88 2,03 -0,38 12,87 6,87
11 4,14 2,39 5,51 2,78 4,53 -3,76 -14,29 0,25 6,54 -0,42 3,22 3,18 2,54 1,85 10,07 15,82
12 -4,28 -5,71 -7,18 -17,39 -11,40 -15,67 -23,00 -0,78 -0,17 -2,12 0,34 0,72 -4,10 3,68 7,11 3,32
13 5,15 3,97 4,19 -5,61 10,20 10,58 -13,72 -0,88 -1,68 6,33 7,18 5,99 6,44 4,06 7,28 18,55
14 -3,96 -7,81 -9,01 -2,01 -3,05 -3,53 -19,65 -3,63 -17,56 -0,02 -0,94 -5,86 -8,45 -5,34 -4,72 -0,21
15 -2,71 -5,73 -7,90 0,91 -1,72 -8,49 -24,16 -4,95 4,25 -1,17 2,38 -1,34 -5,18 -6,86 -2,66 0,63
16 -2,25 -7,35 0,25 -0,59 -1,02 -3,18 -23,89 -0,67 0,43 -1,41 -0,94 0,58 -6,19 0,56 -5,41 0,80
17 -1,23 -1,46 -2,65 1,08 1,41 3,47 -20,68 -2,26 0,95 5,76 1,51 3,01 -8,11 -1,29 -8,22 1,25
18 -2,70 -2,79 -3,75 0,28 -3,54 -5,13 -25,45 -3,33 -3,91 1,49 -1,52 2,35 -8,19 0,39 -6,54 -1,03
19 -0,53 4,34 -3,73 1,23 -3,07 8,26 -13,25 -3,25 3,96 3,67 1,56 2,34 -3,18 -3,64 -8,20 2,63
20 0,80 9,92 -0,66 3,25 -1,49 -7,85 -3,91 -4,80 -3,53 -0,15 4,68 4,03 -0,45 21,98 -5,80 -7,20
21 -2,99 11,98 -5,10 -3,43 -9,96 -3,14 -8,96 -3,26 -1,30 -3,16 -5,34 0,13 -0,84 13,09 -8,97 -8,82
22 1,77 15,95 4,23 2,59 -1,39 -4,78 12,55 3,25 0,42 5,00 0,07 5,88 0,43 12,12 -5,03 -7,33
23 -6,16 12,29 -8,59 -0,92 -14,47 -10,86 -5,69 -0,85 -8,96 1,88 -6,38 0,98 -6,36 -5,65 -12,43 -19,48
24 -6,48 8,29 -3,18 8,11 -7,60 -10,37 -1,70 -0,98 -3,77 -7,32 -8,46 -3,08 -10,10 1,98 -20,79 -21,58
25 -3,55 2,97 0,89 2,19 -15,30 -14,02 -3,92 9,62 6,72 -2,57 4,58 -0,71 -6,76 -0,54 -12,02 -12,95
26 -1,46 1,29 7,49 2,09 -12,85 -6,23 2,65 8,47 10,44 -2,32 8,06 3,54 2,15 -5,74 -10,32 -9,21
27 -10,51 -14,53 -5,40 -7,19 -21,02 -12,99 -6,86 1,95 -1,35 -7,97 -7,02 -5,54 -10,38 -13,66 -16,06 -18,77
28 8,75 16,65 5,25 12,71 -5,72 3,92 16,61 11,93 2,73 14,69 18,26 3,98 12,91 2,66 1,79 4,40
29 -1,83 -1,96 -3,65 5,08 -11,49 -13,43 1,32 9,34 -1,55 -3,14 5,01 -1,79 1,39 -8,69 -7,22 -7,65
30 -5,20 -9,19 -6,95 -1,42 -16,14 -19,53 -0,25 5,57 15,79 -0,61 2,48 -4,85 -3,39 -14,51 -14,64 -9,33
31 4,37 2,34 6,17 6,93 -6,97 -7,34 -0,25 17,95 3,76 7,57 10,66 -0,16 9,22 -2,14 0,90 -0,77
32 -1,50 -16,88 -10,66 3,05 -11,89 8,95 -19,11 10,00 -3,43 3,55 2,18 -8,47 -2,95 -28,92 -13,50 1,10
33 3,61 -5,72 4,10 7,37 -6,56 5,56 3,54 10,34 -2,50 5,54 14,36 -0,97 6,56 -10,51 0,03 7,78
34 4,77 -15,05 1,03 12,19 -7,39 6,22 -7,45 7,95 2,42 8,60 9,77 2,78 10,13 -5,98 -4,43 10,07
35 1,44 -23,81 -1,89 4,58 -6,67 -0,76 -0,89 7,85 3,84 2,98 9,32 -1,92 6,14 -3,35 -10,03 9,52
36 8,12 -12,21 -3,58 7,41 -8,60 19,93 4,60 9,42 10,43 11,08 20,44 -1,28 14,40 -1,22 4,41 14,62
37 -0,45 -5,13 -6,21 3,19 -8,80 -6,72 1,48 -1,88 4,22 6,23 2,38 -2,81 0,84 -10,54 -0,02 -0,95
38 1,04 -1,81 -0,51 0,09 -2,85 -2,63 -0,15 1,77 -7,56 7,28 -0,24 0,44 0,65 -0,04 0,98 3,69
39 12,49 11,87 9,60 11,51 3,08 3,21 6,94 8,45 10,55 18,53 16,38 9,56 15,32 11,54 5,14 19,83
40 -6,75 -11,95 -10,45 -6,09 -10,22 -20,78 -13,09 -2,47 10,93 -5,41 -8,84 -3,52 -8,59 -8,74 -10,91 -6,40
41 -0,63 -5,26 -0,45 -0,82 -10,39 -15,23 -2,08 2,14 19,85 3,86 -0,49 1,01 -3,11 -0,09 -3,82 -0,35
42 5,90 13,21 4,35 9,38 -3,84 -6,33 8,75 5,07 6,59 10,79 5,78 6,05 2,91 1,89 4,46 7,17
43 2,37 -2,06 -1,13 5,83 -8,57 -6,24 4,95 -1,95 25,66 4,87 3,16 3,94 3,22 -0,24 -1,30 2,43
44 -4,90 -2,98 -2,56 -3,05 -18,09 -26,05 -13,71 -2,70 14,57 -0,85 -7,02 -2,37 -7,65 -10,42 -5,70 -8,80
45 3,11 -4,22 4,30 6,87 -2,86 -13,84 6,24 1,14 10,00 6,14 1,96 2,63 2,36 3,39 3,23 3,18
46 -0,23 -6,95 -4,27 -1,51 -5,79 -10,68 2,05 0,35 13,62 -1,70 3,07 -1,62 1,63 -0,58 -1,33 3,37
47 1,14 -3,71 -0,99 -3,62 -5,37 -16,36 -2,39 4,75 12,64 -2,32 3,82 2,68 3,74 2,55 5,57 2,62
48 4,72 3,79 11,52 7,61 1,50 -19,57 1,90 2,82 3,73 5,28 1,14 4,22 1,20 0,78 10,21 15,82
49 -4,05 -14,33 -2,71 -3,61 -11,00 -20,52 -3,02 2,22 4,02 -8,97 -2,92 -4,31 -2,16 4,86 -7,02 -5,35
50 1,54 -4,51 -6,01 2,59 -4,55 -19,03 -1,25 1,87 18,24 -2,42 2,26 2,24 4,25 8,16 4,28 -1,71
51 7,99 6,57 2,40 11,21 2,88 2,11 9,84 10,65 4,75 3,63 7,68 3,16 9,52 9,84 12,84 7,13
52 -2,45 -5,45 -8,55 -0,69 -7,32 -13,48 0,81 -3,17 -3,87 -6,01 -2,64 -2,62 1,81 -5,14 7,09 -5,40
53 2,57 -0,16 -6,85 -0,12 -2,99 -12,73 0,42 5,84 -3,05 0,46 2,01 0,31 6,49 4,01 7,68 4,95
54 6,20 -2,99 0,35 3,78 -0,54 -8,13 6,45 9,27 -3,51 1,29 5,88 3,15 10,41 14,29 11,26 11,37
55 -0,13 -2,96 -8,83 -5,97 -4,67 -14,74 -4,65 1,85 -7,74 -0,23 0,56 -0,56 1,92 4,56 4,40 7,03
56 4,40 1,62 -3,96 4,65 -1,29 -14,55 10,39 7,50 0,17 3,55 7,28 6,83 4,85 4,08 9,70 2,30
57 4,11 6,28 -7,20 2,77 -0,26 -10,44 4,04 3,14 1,70 2,64 3,76 2,23 3,46 8,79 8,13 8,98
58 -8,73 -10,55 -18,57 -9,01 -16,19 -24,98 -2,35 -1,55 -11,78 -7,30 -7,23 -6,62 -12,17 -7,08 -7,93 -10,03
59 4,14 6,09 2,51 7,88 -4,07 -12,36 4,51 3,45 3,34 4,98 3,52 1,68 2,14 5,75 8,57 4,12
60 1,52 -2,51 3,22 7,01 -2,10 -12,17 -1,00 5,92 0,33 -1,92 1,74 5,92 2,70 -0,32 1,11 -6,28
30

Gráficos de secuencia datos normales v/s datos desestacionalizados (solo de dos variables)


Tabla (18) de componentes para el método de análisis factorial interbaterías.
Tabla (18) componentes th y uh
obs t 1 t 2 t 3 u 1 u 2 u 3
1 8,367255 0,295309 0,278167 3,856875 0,473035 0,544861
2 8,298691 -0,731430 0,136566 5,132162 0,040144 -0,369557
3 5,755451 -0,170415 -0,756489 3,206351 0,066601 -0,146483
4 2,930638 -0,432991 -1,576290 1,925987 -0,427956 -0,689197
5 6,541035 -0,735666 -1,444271 4,199700 -0,202253 -0,936265
6 1,188139 0,444165 -1,773191 1,281128 0,230359 -0,656868
7 5,106998 -0,180992 -1,955417 3,445451 -0,014785 -0,743493
8 4,112312 -0,650935 -1,614128 2,711171 -0,363396 -0,669125
9 -4,917980 0,357245 -2,278745 -2,768500 0,309742 -0,013314
10 7,092082 -0,032169 -0,808459 3,432652 0,406352 0,499654
11 -1,134830 1,564115 -1,105759 -0,729189 0,618013 0,147096
12 0,504321 0,718186 -0,584817 0,199404 -0,092065 0,106633
13 0,765213 -0,809503 -0,480538 1,051865 -0,296127 -0,740628
14 0,900386 -0,408888 0,087411 0,514080 0,105232 0,102240
15 -1,744998 -0,942070 -0,525165 -0,947068 0,117515 0,011945