Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tecnicas de Anal Multi PDF
Tecnicas de Anal Multi PDF
Curso 2009-2010
Introducción PCA PLS MLR CCA Resumen
Contenido
1 Introducción
6 Resumen
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Contenido
1 Introducción
6 Resumen
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Introducción
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Introducción
Herramientas Matemáticas
Álgebra
SVD: A = UΛVT
EVD: A = XΣX−1
Para matrices simétricas (AT = A) semidefinidas positivas SVD y
EVD coinciden
Propiedades:
Traza del producto
Tr(AB) = Tr(BA)
Optimización
arg máx Tr(UT AV) sujeto a UT U = VT V = I
U,V
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Contenido
1 Introducción
6 Resumen
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Desarrollo Teórico
x̂ = Vx̃ x̂ ∈ Rn×1
VT V = I
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Desarrollo Teórico
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Desarrollo Teórico
Solución
Nuestro problema es:
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Ejemplo Bidimensional
2
2
0
x
−2
−4
−6
−8
−8 −6 −4 −2 0 2 4 6 8
x1
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Ejemplo Bidimensional
2
2
0
x
−2
−4
−6
PCA (1ª dir.)
PCA (2ª dir.)
−8
−8 −6 −4 −2 0 2 4 6 8
x1
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Ejemplo Bidimensional
−2
−4
−6
−8
−10
−10 −5 0 5 10
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Ejemplo Bidimensional
2
x2
−2
−4
−6
−8
−10
−10 −5 0 5 10
x1
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Propiedades y Aplicaciones
Interpretación
Las proyecciones proporcionadas por PCA constituyen la mejor
representación p-dimensional de los datos originales (n-dimensionales)
Las proyecciones PCA son las de máxima energı́a
Ortogonalidad:a
Proyectores ortogonales: uTk ul = 0 k 6= l
Proyecciones ortogonales: E [x̃k x̃l ] = uTk Rx,x ul = 0
Gracias a la ortogonalidad los proyectores se pueden obtener de
manera sucesiva (deflación)
Dada la solución PCA p-dimensional, para obtener la solución
p + 1-dimensional bastará con añadir un nuevo proyector: up+1
au representa la k-ésima columna de U. x̃k = uT
k k x es el k-ésimo elemento de x̃
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Propiedades y Aplicaciones
x = As + n
Solución:
 = UB (B ∈ Rp×p representa una ambigüedad)
ŝ = B−1 UT x = B−1 x̃
x̂ = Âŝ es la representación PCA p-dimensional de x
σ̂ 2 se obtiene promediando los n − p menores autovalores de Rx,x
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Propiedades y Aplicaciones
J = E kx − x̂k2 ≤ D
ˆ ˜
donde
ν, si ν < λk
Dk =
λk , si ν ≥ λk
Pn
y ν se escoge de manera que k=1 Dk = D
a Cover and Thomas, “Elements of information theory”, Wiley-Interscience, 1991
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Propiedades y Aplicaciones
ν
λk
D1 D2 D3 D4 D
5
D6
1 2 3 4 5 6
Componentes principales
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Algoritmo Adaptativo
Algoritmo adaptativo
¿Como realizar PCA cuando se dispone de los datos secuencialmente?
Regla de Oja: Extracción del autovector principal
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Algoritmo Adaptativo
Ejemplo
Estima ciega de canales MIMO-STBC:a x[n] = W(H)s[n] + n[n]
μ=0.2
−10 μ=0.1
μ=0.05
−15
−20
−25
0 100 200 300 400 500
Iteraciones (Bloques OSTBC)
systems based on principal component analysis”, IEEE Int. Conf. on Acoust., Speech,
and Signal Processing (ICASSP 2006), Bordeaux, France, Mayo 2006
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Resumen PCA
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Contenido
1 Introducción
6 Resumen
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
x ∈ Rn×1 y ∈ Rm×1
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Propiedades
Las soluciones PLS se pueden obtener a partir del GEV:
0 Rx,y U I 0 U
= Λ
Ry,x 0 V 0 I V
VT V = UT U = I
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Ejemplo Bidimensional
2
2
0
x
−2
−4
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Ejemplo Bidimensional
2
2
0
y
−2
−4
PCA (1ª dir.)
PCA (2ª dir.)
PLS
−6
−6 −4 −2 0 2 4 6
y1
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Ejemplo Bidimensional
2
yproy
−2
−4
−6
−8 PCA
PLS
−10
−10 −5 0 5 10
xproy
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Contenido
1 Introducción
6 Resumen
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Desarrollo Teórico
VT V = I
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Desarrollo Teórico
con
ŷ = Vx̃ = VUT x V ∈ Rm×p , U ∈ Rn×p
J se puede reescribir como
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Desarrollo Teórico
Solución
Nuestro problema es:
Ry,x R−1
x,x Rx,y
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Desarrollo Teórico
Solución (Continuación)
Soluciones MLR:
V: Autovectores principales de Ry,x R−1
x,x Rx,y
Ry,x R−1
x,x Rx,y V = VΛ Λ = diag([λ1 , . . . , λp ])
R−1
x,x Rx,y Ry,x U = UΛ Λ = diag([λ1 , . . . , λp ])
−1
U y V se pueden obtener a partir de la SVD de Rx,x2 Rx,y
Formulación alternativa (GEV):
1 1
0 Rx,y UΛ− 2 Rx,x 0 UΛ− 2 1
= Λ2
Ry,x 0 V 0 I V
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Propiedades
Interpretación
Para y = x, MLR se reduce a PCA
MLR se puede ver como una generalización de PCA
MLR equivale a PLS tras preblanquear x:
Se está maximizando la covarianza entre las proyecciones de y
(VT y) y las proyecciones de la versión preblanqueada de x
Ortogonalidad:
Ortogonalidad (incorrelación) en las proyecciones x̃ (no en U)
UT Rx,x U = Λ UT U 6= diagonal
VT V = I VT Ry,y V 6= diagonal
Ejemplo Bidimensional
2
2
0
x
−2
−4
PCA (1ª dir.)
−6 PCA (2ª dir.)
PLS
MLR
−8
−8 −6 −4 −2 0 2 4 6 8
x1
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Ejemplo Bidimensional
2
2
0
y
−2
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Ejemplo Bidimensional
2
yproy
−2
−4
−6
PCA
−8 PLS
MLR
−10
−10 −5 0 5 10
xproy
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Contenido
1 Introducción
6 Resumen
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Desarrollo Teórico
E[x̃k ỹk ]
ρk = p k = 1, . . . , p
E[x̃2k ]E[ỹk2 ]
Definiciones:
Proyector: U ∈ Rn×p
Proyección: x̃ = UT x ∈ Rp×1
Proyector: V ∈ Rm×p
Proyección: ỹ = VT y
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Desarrollo Teórico
Maximización de la correlación:
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Desarrollo Teórico
Solución
Soluciones a partir del GEV:
0 Rx,y U Rx,x 0 U
= Λ
Ry,x 0 V 0 Ry,y V
Formulaciones alternativas:
V se puede obtener como
R−1 −1
y,y Ry,x Rx,x Rx,y V = VΛ
2
R−1 −1
x,x Rx,y Ry,y Ry,x U = UΛ
2
−1 −1
U, V también a partir de la SVD de Rx,x2 Rx,y Ry,y2
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Propiedades y Aplicaciones
Propiedades
Ortogonalidad: A diferencia de PLS, la ortogonalidad se da entre
las proyecciones, y no entre los proyectores
UT Rx,x U = VT Ry,y V = I UT U 6= diagonal VT V 6= diagonal
rate and capacity IEEE Transactions on Signal Processing, 2000, 48, 824-831
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Propiedades y Aplicaciones
x = Ax s + nx y = Ay s + ny
con
Ax ∈ Rn×p Ay ∈ Rm×p
s ∈ Rp×1 ∼ N (0, I) nx ∈ Rn×1 ∼ N (0, Nx ) ny ∈ Rm×1 ∼ N (0, Ny )
y con ruidos independientes
E[nx nTy ] = 0
Queremos estimar Ax , Ay , Nx y Ny
El estimador de máxima verosimilitud se obtiene a partir del análisis de
correlaciones canónicasa (de rango p) de x e y
a Wong, K. M.; Wu, Q. and Stoica, P. Generalized correlation decomposition applied
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Ejemplo Bidimensional
2
2
0
x
−2
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Ejemplo Bidimensional
2
2
0
y
−2
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Ejemplo Bidimensional
2
yproy
−2
−4
−6 PCA
PLS
−8 MLR
CCA
−10
−10 −5 0 5 10
xproy
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Algoritmo adaptativo
¿Como obtener las soluciones CCA de manera adaptativa?
Idea: Problemas de regresión LS acopladosa
Función de coste:
Obtención de v y u: Regresión LS
v̂T Y+ûT X
Obtención de z: Promediado z = 2
Correlation Analysis of Several Data Sets, Neural Networks, 2007, 20, 139-152
b Sayed, A. H. Fundamentals of Adaptive Filtering, John Wiley and Sons, 2003
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
C = E[x̃x̃T ] ∈ RM ×M
58, 433-451
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Ejemplo
Igualación ciega de canales MIMO-FIR:a
Ejemplo: Canal SIMO-FIR
Longitud conocida: L
Fuente desconocida s[n]
Canales desconocidos hk [n] ∈ RL×1
h1 x1 [n]
s[n] h2 x2 [n]
hM xM [n]
a Via, J.; Santamaria, I. and Pérez, J. Deterministic CCA-Based Algorithms for Blind
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Ejemplo (Continuación)
Modelo de señal:
y[n] = T (H)s[n]
Observaciones:
h iT
y[n] = xT [n] . . . xT [n − K + 1] x[n] = [x1 [n], . . . , xM [n]]T
Fuente:
Matriz de filtrado:
··· h[L − 1] ···
2 3
h[0] 0
6 . .. .. .. ..
T (H) = 4 ..
7
. . . . 5
0 ··· h[0] ··· h[L − 1]
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Ejemplo (Continuación)
Igualación:
Bajo condiciones sencillas, T (H) es completa en rango
Por lo tanto, existe una matriz W tal que
WH y = s
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Ejemplo (Continuación)
Canales SIMO 1 × 2 y 1 × 4 con L = 2
0 0
CCA CCA
−2 −2
−4 −4
−6 −6
−8 −8
MSE (dB)
MSE (dB)
−10 −10
−12 −12
−14 −14
−16 −16
−18 −18
−20 −20
−20 −10 0 10 20 30 −20 −10 0 10 20 30
SNR (dB) SNR (dB)
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Ejemplo (Continuación)
Canal SIMO 1 × 3, L = 7, SNR=30dB: Algoritmo adaptativo (CCA-RLS)
10
−5
ISI (dB)
−10
−15
−20
−25
−30
−35
0 500 1000 1500 2000
Iteraciones
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Contenido
1 Introducción
6 Resumen
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Resumen
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Resumen
Extensiones
Extensión sencilla a datos complejos
Formulación determinista
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones
Introducción PCA PLS MLR CCA Resumen
Resumen
Un Problema no Tratado
¿Cómo seleccionar el orden p de la reducción de rango?
Criterio de Akaikea
Criterio MDL (Minimum Description Length)b
Ejemplo
1
Umbral
0.8 Selección
Perfil de Autovalores
de Orden
0.6
0.4
0.2
0
0 5 10 15 20 25 30
Índice (k)
a Akaike,
H. A new look at the statistical model identification, IEEE Transactions on
Automatic Control, 1974, 19, 716-723
b Rissanen, J. Universal coding, information, prediction, and estimation. IEEE
Técnicas de Análisis Estadı́stico Multivariado Basadas en Estadı́sticos de Segundo Orden Tratamiento Avanzado de Señal en Comunicaciones