Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tecnicas - Analisis - Multivariante Banco Central Costa Rica PDF
Tecnicas - Analisis - Multivariante Banco Central Costa Rica PDF
DIVISIN ECONMICA
DEPARTAMENTO DE INVESTIGACIONES ECONMICAS
DIE-NT-01-95
ENERO, 1995
TCNICAS DE ANLISIS MULTIVARIANTE1
INTRODUCCIN
El anlisis multivariable tiene una historia que data desde el uso de la regresin lineal por parte
de Gauss en 1809 y, posteriormente, por otros estadsticos como Markov en 1900. Las
tcnicas ms recientes datan desde los aos de 1930. En la actualidad, los paquetes
estadsticos y economtricos incluyen procedimientos para aplicar estas otras tcnicas del
anlisis de datos. A continuacin se resumen las principales caractersticas de estas tcnicas.
EL ANLISIS MULTIVARIABLE
1 y 1i + 2 y 2i + . . . + k 1 y k1 i + 1 x1i + 2 x 2i +. . . + k 2 x k2 i + ui = 0 1
1
Autorizado por Lic. Hermgenes Arguedas Troyo.
1
Sin embargo, la discusin de estas tcnicas se tornara relativamente difcil si se trabajara
directamente con la ecuacin (1). Es por ello que el enfoque matricial permitira un manejo de
las relaciones estadsticas ms adecuado. En este sentido defnanse las siguientes matrices:2
y 1 1
y 2 1
y k 1 ,1
y y y
1 2 2 2 k 1 ,2
y =
y 1 N
y 2 N
y k 1 , N
Orden : (Nxk1)
y 1 1
y 2 1
y k 1 ,1
y y y
1 2 2 2 k 1 , 2
x =
y y y
1 N 2 N k 1 ,N
Orden: (Nxk2)
'= 1 2
k 1
Orden: (k1xN)
'= 1 2
k2
Orden: (k2xN)
U'= u1 u2 u N
Orden: (NxN)
2
En notacin matricial, el signo de comilla (') denota la transposicin de una matriz.
2
Los componentes de las matrices de coeficientes y corresponden a vectores de orden
(1xN). Con esta definicin matricial, las relaciones algebraicas de la ecuacin (1) se pueden
especificar como:
Y + X + U = 0 2
N N 1
(2 )- 2 | |- 2 e- 2 [U - E(U)]
-1[U - E(U)]
3
En su aplicacin ms sencilla, la regresin lineal slo considera una variable y, por lo que la
matriz Y se convierte en un vector de orden (Nx1), mientras que el vector de los coeficientes
corresponde a un escalar. En trminos matriciales, la regresin lineal transforma a la ecuacin
(2) de la siguiente manera:
yi = X (- -11 ) + U 1
-1
4
yi = X + 5
3
Los coeficientes representan el efecto de la variabilidad de las x sobre la variabilidad de la y.
Para obtener estos coeficientes se recurre, generalmente, a los estimadores mnimo
cuadrticos ordinarios definidos por:
$ = (x x )-1 x y
6
La teora de los mnimos cuadrados permite evaluar la calidad de los estimadores en trminos
de su insesgamiento y eficiencia, as como tambin el cumplimiento de los supuestos de la
regresin lineal.
Bajo el supuesto de que las utilidades de los bancos no ejercen influencia entre ellas mismas y
que los trminos aleatorios son independientes de una ecuacin a la otra, el mtodo de
mnimos cuadrados ordinarios es el recomendable para analizar el comportamiento de las
utilidades bancarias. Sin embargo, si existiera un efecto cruzado de utilidades bancarias, en el
sentido de que las utilidades de un banco afectan las de otros bancos (una ecuacin tiene dos o
ms variables y), sera necesario aplicar un mtodo como el de mnimos cuadrados en dos
etapas, por ejemplo. An ms, si los componentes estocsticos de las ecuaciones estn
relacionados entre ellos, sera indispensable aplicar un mtodo como el de mnimos cuadrados
en tres etapas.
Para un conjunto de datos (x,y), como los de la ecuacin (2), la tcnica de componentes
principales permite obtener combinaciones lineales de aquellas variables (x,y) que aportan una
mayor contribucin a la explicacin de la variancia del conjunto de datos. Para obtener tales
combinaciones es necesario construir la matriz de variancias y covariancias de esas variables.
Por consiguiente, una de las tcnicas recomendadas para evitar estos problemas de
multicolinealidad es la de construir una combinacin de las variables linealmente dependientes y
para ello se usa la tcnica de componentes principales.
4
mayor variancia y los que le siguen van disminuyendo su contribucin a la variancia total.
Defnase entonces la combinacin como:
z1i = a 11 x1i + a21 x 2i + . . . + a k 2i x k 2 i , i = 1,..., N 7
En forma matricial:
z1 = X a 1 8
donde z es un vector (Nx1), X es una matriz de orden (Nxk2) y a es un vector (k2x1). La suma
de cuadrados de la nueva variable z est dada por:
z 1 z1 = a 1 X X a1 9
Este proceso de maximizacin con restriccin conduce a una solucin de orden de la forma:
(X X)a 1 = 1 a1 10
Si se supone que la matriz (X'X) contiene k races caractersticas, entonces los k componentes
principales, ortogonales entre ellos mismos, se especificaran como:
Z = XA 11
Z Z = A X XA= 12
1 0 0
0 2
0
=
0 0 k
5
En otras palabras, los elementos de la diagonal de la matriz proporcionan la ponderacin que
tienen los componentes principales en la variancia total de (X'X) de forma tal que 1 es mayor
que 2 y as sucesivamente.
ANLISIS FACTORIAL
El anlisis factorial, variante del anlisis de componentes principales, consiste en extraer los
componentes principales de una matriz de correlacin de las variables x y de las y. Se
diferencia del anlisis de componentes principales en que las ponderaciones i se transforman
de forma tal que su suma de cuadrados es igual al valor caracterstico de la matriz . El
anlisis factorial permite seleccionar el nmero de factores retenidos en la solucin final.
Considere que existen ciertos factores comunes F que influyen a las variables y y x
simultneamente. De la misma forma, existen factores especficos G1 que slo afectan a las
variables y y factores G2 que afectan exclusivamente a las x. Bajo estas condiciones, las
variables pueden ser expresadas como:
Y = A1 F + G1 13
X = A2 F + G2 14
El anlisis factorial requiere que los factores F no estn relacionados con los factores G.
Tampoco se permite que haya covariancias entre los factores G. Adicionalmente, se supone
que los factores F poseen una matriz de variancias y covariancias igual a la matriz identidad (I).
Bajo estos supuestos, las variancias de las variables y y x estn dadas por:
var(Y) = 11 = A1 A1 + var(G1 ) 15
var(X) = 22 = A2 A2 + var( G2 ) 16
cov(Y, X) = 12 = A1 A 2 17
6
La ecuacin (17) significa que la correlacin entre y y x se explica solamente por sus factores
comunes. El menor nmero de factores comunes est dado por:
m = R 12 18
Las correlaciones cannicas se definen como las correlaciones mltiples mximas entre unas
variables y varias funciones lineales de otras variables. Defnanse 11, 22 y 12 como las
matrices de variancias y covariancias entre y y x. Defnanse tambin dos combinaciones
lineales de variancia unitaria de la forma L'Y y M'X. El anlisis de correlacin cannica escoge
los coeficientes de las matrices L y M tal que la correlacin entre esas dos combinaciones
lineales es la mxima. En trminos matemticos, el problema consiste en maximizar la
covariancia de las combinaciones lineales:
L 12 M 19
L 11 L = 1 20
M 22 M = 1 21
1 = L 12 M 22
2 = M 21 L 23
En vista de que los multiplicadores de Lagrange son iguales, se puede decir que 1 = 2 = .
Ello implica que corresponde a la raz caracterstica de la ecuacin determinante:
| 21 -111 12 - 2 22 | = 0 24
Para este caso de dos combinaciones lineales, 1 y 2 son las correlaciones cannicas.
Cuando se consideran ms de dos combinaciones lineales se definen races caractersticas
7
1...s para los correspondientes vectores M1...Ms. Al agrupar estos vectores en una matriz =
[ M1. . . M2 ] tal que:
22 = I 25
R = 21 -111 12 26
ANLISIS DISCRIMINANTE
(b)Conocer las probabilidades a priori 1,..., z para las poblaciones, las cuales son
frecuencias relativas de unidades estadsticas de los z grupos.
(c)Especificar valores rij que representen la prdida por identificar una variable y en el
grupo i cuando en realidad pertenece a la poblacin j.
A las variables y se les asocia un puntaje S que consiste en un promedio ponderado de las
probabilidades de que cada variable muestre los atributos que definen a una poblacin en
particular. Es decir:
8
Z
Si = n Pn (y) r ni 27
n=1
1 1
S i = - ln| i | - ( y - y i ) i ( y - y i ) + ln i
-1
28
2 2
Cuando existen slo dos poblaciones (bancos con utilidades altas o con utilidades bajas), la
regla de decisin para la asignacin de un banco en un grupo o en el otro est dada por la
diferencia de dos puntajes discriminantes: S1 - S2. En trminos de la verosimilitud normal, la
diferencia de los discriminantes sera:
1
( y 1 - y 2 ) -1 Y - ( y 1 -1 y 1 - y 2 -1 y 2 ) + ln 1 - ln 2 29
2
Si se denota el primer sumando de la ecuacin (29) como L(Y) y los dos ltimos como c, la
regla de decisin es la siguiente: asigne el i-simo banco al grupo de bancos con utilidades
altas si L(Y)>c o, al contrario, al grupo con utilidades bajas si L(Y)<c.
ANLISIS DE CONGLOMERADOS
Los procedimientos de agrupacin son los siguientes: (a) se escogen puntos iniciales contra los
cuales se comparan y aglomeran las siguientes observaciones; (b) se definen conglomerados
amplios a partir de los cuales se comienzan a extraer aquellas observaciones ms diferentes.
Este ltimo mtodo consiste en los clculos de distancias mximas y mnimas.
9
Para las restantes tcnicas de anlisis multivariante destaca el paquete SPSS, el cual contiene
una serie de comandos que permiten un uso flexible y rpido de las tcnicas, con la ventaja de
el manual incorpora discusiones tericas y prcticas de los resultados estadsticos. Otro
paquete avanzado es SAS, pero no contiene la discusin de los resultados. Como una ltima
opcin se podra contar con STATGRAPHS, el cual tiene la limitacin en cuanto al nmero de
variables y observaciones que permite manipular.
BIBLIOGRAFA
Johnston, J. (1984). Econometric Methods. Third Edition. New York: McGraw-Hill Book Co., 568
pginas.
Rao, C. Radhakrishna (1973). Linear Statistical Inference and Its Applications. Second Edition.
New York: John Wiley & Sons, 625 pginas.
F:\INVESTIG\DIE\NT\NT95\NT0195.DOC
10