Está en la página 1de 21

MODELOS ESTADÍSTICOS III

ANÁLISIS DE
CORRESPONENCIAS
DESARROLLO MATEMÁTICO
ANÁLISIS DE CORRESPONDENCIAS:
DATOS DE ENTRADA

 x11 x12  x1 p 
 
 x 21 x 22  x2 p 
X  xij  0
   
 
x xn 2  x np 
 n1

xij
f ij  n

 x
p

kl
F=X/N
k 1 l 1

n p
N  x kl
k 1 l 1
ANÁLISIS DE CORRESPONDENCIAS:

 f 1 0 0 0   f 1 0 0 0 
   
 0 f 2  0   0 f 2  0 
Dp   Dn  
0 0  0  0 0  0 
   
 0 0  f  p   0 0  f n  
 

Estas matrices sirven para ponderar distancias y para “estandarizar”

p
f i    f ij
j 1

n
f  j   f ij
i 1
ANÁLISIS DE CORRESPONDENCIAS:

f ij xij f ij xij
 
f i xi  f j x j

1 1
D F n
FD p

Perfiles de renglones Perfiles de las columnas


Vectores p-dimensionales Vectores n-dimensionales
ANÁLISIS DE CORRESPONDENCIAS:

1 1
u´D u
n
v´D v
p

Métrica en Rn Métrica en Rp
ANÁLISIS DE CORRESPONDENCIAS:
Maximizar

( F´Dn1u )´D p1 ( F´Dn1u ) ( FD p1v)´Dn1 ( FD p1v)

Sujeto a:

1
u´D u  1 v´D p1v  1
n

Espacio de columnas Espacio de renglones


ANÁLISIS DE
CORRESPONDENCIAS:

1 1 1 1
( FD )( F ´D )u  u
p n ( F ´D )( FD )v  v
n p

u  1/ 2 FD p1v
Ejes
principales
v  1/ 2 F ´Dn1u

Fórmulas de transición
Análisis de Correspondencias
ANÁLISIS DE CORRESPONDENCIAS:
FACTORES
1
Columnas D u
n

1
Renglones  D v
p
ANÁLISIS DE CORRESPONDENCIAS:

COORDENADAS

Columnas ˆk  k  k

Renglones ˆ k  k  k
ANÁLISIS DE CORRESPONDENCIAS:
1 1 1/ 2 1 / 2 1 / 2 1 / 2 1 / 2 1 / 2
FD F´D  D D
p n n n FD p D p F´D n D
n 
1/ 2 1 / 2 1 / 2 1 / 2 1 / 2 1 / 2
D (D
n n FD p )( D p F´D n )D n
1/ 2 1 / 2 1 / 2 1 / 2 1 / 2 1 / 2
 D (D
n n FD p )( D n FD p )´D n 
Dn1/ 2WW ´Dn1/ 2
ANÁLISIS DE CORRESPONDENCIAS:

Dn1 / 2WW ´Dn1 / 2 u  u D 1p/ 2W 'WD p1 / 2 v  v


WW ´x  x W ´Wy  y
uD 1/ 2
n x v  D 1p/ 2 y

( Dn1 / 2 FD p1 / 2 )  W
ANÁLISIS DE CORRESPONDENCIAS:

El problema matemático consiste en obtener


la Descomposición en Valores Singulares de
la siguiente matriz:

X es la tabla de
contingencias
1 / 2 1 1 / 2
Dr ( X ) Dc
Dr y Dc son matrices N
diagonales de
“estandarización”
1/ 2
Φ y Ψ definen a los
  ´
factores
ANÁLISIS DE CORRESPONDENCIAS:

Supongamos que p < n.

Existen (p-1) ternas (,Φ,Ψ) en donde los  son escalares, Φ son


vectores en Rp, Ψ son vectores en Rn que satisfacen:

1   2     p 1  0

 k ´Dn l   kl ( FD p1 ) F ´  Dn Dn1 F  1 / 2

 k ´Dnl   kl F ´Dn1 F  D p D p1 F ´  1 / 2


ANÁLISIS DE CORRESPONDENCIAS:

Existe una solución trivial: un valor propio es


cero o uno, dependiendo de si los datos
fueros centrados o no.

Esto es consecuencia de que la suma total


de todos los datos normalizados es uno.
ANÁLISIS DE CORRESPONDENCIAS:

f ij  f i  f  j p 1
   k  ik  jk
f i f  j k 1

p 1
f ij  f i  f  j (1   k  ik  jk )
k 1

Fórmulas de reconstrucción
ANÁLISIS DE CORRESPONDENCIAS:

K
f ij  f i  f  j (1   k  ik  jk )
k 1

La proyección a los primeros K factores es óptima con


respecto a un criterio de mínimos cuadrados generalizados:

El primer factor describe la mejor proyección uni-dimensional

El plano de los primeros dos factores es la mejor proyección


bi-dimensional


ANÁLISIS DE CORRESPONDENCIAS:

CA k ( j )  f  j  jk2

CA k (i )  f i  ik2
p

 CA
j 1
k
( j)  1

Contribuciones absolutas:
Contribución al factor
ANÁLISIS DE CORRESPONDENCIAS:

k  jk2
CR k ( j )  p 1

 l jl
 
l 1
2

p 1

 ( j)  1
CR k

k k ik2 k 1
CR (i )  p 1

 l il
 
l 1
2

Contribuciones relativas:
“Correlaciones”
cuadradas con el factor
ANÁLISIS DE CORRESPONDENCIAS:

Elementos
suplementarios

p f sj
Renglón ˆ sk    kj
j 1 f s

ˆ
n
f is
Columna  sk    ik
i 1 f  s
ANÁLISIS DE CORRESPONDENCIAS:
ANÁLISIS DE CORRESPONDENCIAS:

También podría gustarte