Está en la página 1de 10

Componentes Principales

MODELOS ECONOMTRICOS II

OBJETIVO

Reducir la dimensionalidad de las


variables con las que se trabaja (p
variables) a un subconjunto menor
(q<p), con lo cual se reduce la
dimensin del problema a costa de una
pequea prdida de informacin

En qu consiste?
Consiste

en representar adecuadamente la
informacin de n observaciones de p variables
observables relacionadas a travs de un nmero
menor de variables q no observables que son
combinaciones lineales de las originales.
Para que haya una reduccin considerable las p
variables observables deben estar altamente
correlacionadas. Mientras que las q variables no
observables son incorrelacionadas.

En qu consiste?
Matemticamente,
el
anlisis
de
componentes principales escoge un nuevo
sistemas de coordenadas para el conjunto
original en el cual la varianza de mayor
tamao del conjunto de datos es capturada
en el primer eje, la segunda varianza ms
grande es el segundo eje, y as
sucesivamente

Clculo de las Componentes Principales


La primera componente principal es la combinacin lineal

de las variables originales que tiene varianza mxima.


Vectorialmente se lo representa como:
Z1 =a1X
Donde a es el vector de coeficientes de la combinacin
lineal de dimensin p y X es el vector de dimensin p de
variables originales.
La media del primer componente principal es E(Z1)=a1 y
su varianza es V(Z1)=a1a1.
Donde es la matriz de varianzas y covarianzas de X.

Clculo de las Componentes Principales


La primera componente representar la mxima varianza de las

variables originales. A fin de obtener el valor del vector a1, se


aplican multiplicadores de Lagrange a fin de mximizar la
varianza con la restriccin de que a1a1=1.

Es decir se debe maximizar M= a1a1 (a1a1-1), derivando


con respecto a a1, se tiene a1 =a1; lo que implica que a1 es un
vector propio de .
Si multiplicamos a1 en a1 =a1 tendremos la varianza de Z1, es
decir a1a1= a1 a1 = . Por tanto para que la varianza sea
mxima, debe ser el mayor valor propio de y a1 el vector
correspondiente

Clculo de las Componentes Principales


Para la segunda Componente Principal Z2 =a2X, su

varianza a2a2 ser la segunda mayor y esta componente


ser ortogonal a la primera, esto es incorrelacionada.

El multiplicador de Lagrange sera


M= a1a1 + a2a2 1(a1a1-1)- 2(a2a2-1)
Derivando con respecto a a1 y a2 tenemos:
M/ a1=2 a1 2 1a1=0
M/ a2=2 a2 2 2a2=0
La solucin sera:
a1 =a1
a2 =a2

Clculo de las Componentes Principales


Y si se realiza este procedimiento para las p componentes

principales, los vectores ai (vectores de carga) seran los


vectores propios correspondientes a los valores propios i
ordenados de mayor a menor de la matriz .
Para eliminar el efecto escala de las variables X, se la
estandariza o se trabaja con los valores y vectores propios
de la matriz de correlacin.

APLICACIONES
En

el anlisis exploratorio que permite descubrir


interrelaciones entre los datos.
Reducir la dimensionalidad de la matriz de datos con el fin
de evitar redundancias y destacar relaciones.
Construir variables no observables a partir de variables
observables. Ejemplo la inteligencia de una persona no es
observable directamente, pero se puede medir distintos
aspectos de sta mediante pruebas psicomtricas.
Usar estos componentes incorrelacionados como datos de
entrada para otros anlisis

Cuntos componentes retener


El criterio de Kaiser consiste en retener aquellos

componentes cuyos valores propios sean superior a la


unidad.
El Grfico de sedimentacin: Basndonos en este grfico;
el punto de corte para decidir el nmero de componentes
es el que marca el punto de inflexin.

También podría gustarte