Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Multivariante PDF
Multivariante PDF
Multivariante PDF
Anlisis Multivariante
Anlisis multivariante
Anlisis multivariante
Objetivo: estudio de varias variables simultneamente:
X1
X2
X3
X4
X5
Objeto 1 12
34
126
0.1
0.7
Objeto 2 24
36
32
0.5
0.3
Objeto 3 100
240
0.4
0.2
...
...
...
......
....
...
Anlisis multivariante
X1
X2
X2
X4
Objeto 1
12
34
126
0.1
0.7
Objeto 2
24
36
32
0.5
0.3
Objeto 3
100
240
0.4
0.2
......
....
...
...
...
...
Anlisis multivariante
X2
X3
X4
X5
Objeto 1
12
34
126
0.1
0.7
Objeto 2
24
36
32
0.5
0.3
Objeto 3
100
240
0.4
0.2
......
....
...
...
...
...
Anlisis de clusters
Jerrquicos
K-medias
Mtodos biplot
X2
X3
X4
X5
Objeto 1
34
126 0.1
0.7
Objeto 2
36
32 0.5
0.3
Objeto 3
240 0.4
0.2
Objeto 4
23
45
0.3
37
MANOVA
Anlisis en variables cannicas
Anlisis discriminante
Anlisis multivariante
SSQ = (y i ( a + bx i )) 2
(SSQ)
= .......... ..... = 0 a = .........
a
(SSQ)
= .......... ..... = 0 b = ..........
b
Anlisis multivariante
Anlisis multivariante
1=vivo
0=muerto
variables: X1 , X2 , X3 ,......
p(1) = probabilidad de que y = 1
p(1)
log
= L = a 0 + a1 X 1 + a 2 X 2 + a1 X 3.....
1 p(1)
La aplicacin importante es estimar p(1) para un caso nuevo:
1
p(1) =
1 + eL
VI curso de Anlisis de Datos (30 Marzo de 2009)
Anlisis multivariante
Anlisis de clusters
X1
X2
X3
Objeto 1 12
34
126
...
0.7
Objeto 2 24
36
32
...
0.3
Objeto 3 100
240
...
0.2
......
Xm
....
...
...
...
...
Objeto n 27
77
54
...
0.8
Aglomerativos o divisivos
Procedimientos:
Jerrquicos
Supervisados (k-medias)
Anlisis multivariante
X2
X3
Paciente 1
12
34
126
0.7
Objeto 2
24
36
32
0.3
Objeto 3
10
240
0.2
......
....
...
...
...
Transformar variables?
4 grupos
Sin transformar
Mtrica distancia entre objetos
m
ij
= xik x jk
CML
k =1
ALL
AML
i , jk
= min d ij , d ik
Anlisis multivariante
RCML
Etapas de un anlisis
jerrquico de clusters
(variables cuantitativas)
Anlisis multivariante
1) Transformacin de variables
para uniformar sus escalas
(slo variables cuantitativas)
x=
Anlisis multivariante
x j2
Dij = xik x jk
k =1
xi1
Distancia Euclidia :
Dij = (xik x jk )
m
k =1
1/ 2
2 variables
(plano)
xi 2
x j1
2 variables
(plano)
Anlisis multivariante
X2
X3
X4
X5
Objeto 1 12
34
126
...
0.7
Objeto 2 24
36
32
...
0.3
Objeto 3 100
240
...
0.2
......
....
...
...
...
...
Objeto 5 27
77
54
...
0.8
Objeto
0 d12
d 21 0
d
d 32
31
d 41 d 42
d
51 d 52
d13
d14
d 23 d 24
0 d 34
d 43 0
d 53 d 54
d15
d 25
d 35
d 45
0
Matriz de distancias
VI curso de Anlisis de Datos (30 Marzo de 2009)
2 3 4 5
1
2
10 9 4
5
8 5 3
Matriz de distancias
Anlisis multivariante
Por centroides
Cluster 1
Vecino ms prximo
(single link)
Cluster 3
Cluster 2
Vecino ms lejano
(complete link)
VI curso de Anlisis de Datos (30 Marzo de 2009)
Anlisis multivariante
Matriz distancias
3 4 5
1
2
10 9
5 3
Dendrograma (rbol)
5
8
Distancia
Cluster
1,2,3,4,5
(1, 2), 3, 4, 5
(1, 2, 3, 4, 5)
Distancia
entre 4 y 5
(rama)
Anlisis multivariante
Cluster B
DAB =
4
2
5
6
7
8
Y anlogamente:
DAC =
Cluster C
etc
Anlisis multivariante
2 3 4 5
Dendrograma (rbol)
1
2
10 9 4
9 8 5 3
Distance matrix
Distancia Cluster
0
1,2,3,4,5
(1, 2), 3, 4, 5
4.5
7.8
(1, 2, 3, 4, 5)
Anlisis multivariante
X2
X3
Paciente 1
12
34
126
0.7
Paciente 2
24
36
32
0.3
Paciente 3
10
240
0.2
......
....
...
...
...
2 grupos
3 grupos
4 grupos
Transformar variables?
Sin transformar
Mtrica distancia entre objetos
CML
ALL
AML
vecino ms prximo
VI curso de Anlisis de Datos (30 Marzo de 2009)
Anlisis multivariante
RCML
Estandarizados, distancia
euclidia, vecino ms prximo
Estandarizados, distancia
ciudad, promedio de grupo
Anlisis multivariante
Anlisis de 20 pacientes
Caso
X1
X2
X3
X4
X5
12
34
126
0.1
0.7
24
36
32
0.5
0.3
100
240
0.4
0.2
......
....
...
...
...
...
X2 X3
X4
X5
12
34
126 0.1
0.7
24
36
32
0.5
0.3
100
240 0.4
0.2
CML
ALL
AML
Anlisis multivariante
Semilla 1
Semilla 2
Semilla 3
Anlisis multivariante
X1
X2 X3
X4
X5
X5
X3 .... X15
12
34
34
34
34
126 ...
34
Caso
12
34
34
24
36
36
.....
162
..
..
..
2
3
24
36
36
36
36
36
32
......
162
.. .. .. .. .. .. ....
...
CP1 = a 11 X 1 + a 12 X 2 + ... + a 1 m X m
CP2 = a 21 X 1 + a 22 X 2 + ... + a 2 m X m
.......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... .......... ...
CPm = a m 1 X 1 + a m 2 X 2 + ... + a mm X m
- Estas CPi explicarn la mayor variabilidad de las variables originales
- Las CPi presentan incorrelacin entre ellas
VI curso de Anlisis de Datos (30 Marzo de 2009)
Anlisis multivariante
CP1
Eigenvalores Proporcin Acumulativa
CP1 6.833E+00
0.4555
0.4555
CP2 3.724E+00
0.2483
0.7038
CP3 2.321E+00
0.1548
0.8586
CP4 1.055E+00
0.0703
0.9289
CP5 5.849E-01
0.0390
0.9679
CP6 2.691E-01
0.0179
0.9858
CP7 1.968E-01
0.0131
0.9989
CP8 7.668E-03
0.0005
0.9995
CP9 4.829E-03
0.0003
0.9998
CP10 3.070E-03
0.0002
1.0000
CP11 2.153E-04
0.0000
1.0000
CP12 6.593E-05
0.0000
1.0000
CP13 3.677E-06
0.0000
1.0000
CP14 1.308E-06
0.0000
1.0000
CP15 2.115E-07
0.0000
1.0000
CP2
CP3
CP4
Se extraen 4 componentes:
CP1, CP2, CP3 y CP4
Anlisis multivariante
Las 15 variables
originales
Anlisis multivariante
Anlisis multivariante
X1
X2
Sujeto 1
12
34
Sujeto 2
24
36
Sujeto 3
10
......
....
...
X2 (Peso)
21
38
25
12
Si
29
22
16
5
27
33
9
7
5
X1 (Talla)
Anlisis multivariante
X3
Xm
Sujeto 1 12
34
126
0.7
Sujeto 2 24
36
32
0.3
Sujeto 3 10
240
0.2
......
....
...
...
...
Sujeto n ....
...
...
...
Sujeto 4
Var 5
Sujeto 6
Sujeto 3
Sujeto 2
Var 4
Sujeto 5
Var 3
Sujeto 1
Var 2
VI curso de Anlisis de Datos (30 Marzo de 2009)
Anlisis multivariante
Sujeto 4
Var 5
Sujeto 6
Sujeto 2
Sujeto 3
Var 4
Sujeto 5
Var 3
Sujeto 1
Anlisis multivariante
Anlisis multivariante
Anlisis multivariante
X = UV
3) Nos quedamos con la aproximacin dada por los 2 primeros valores singulares:
Anlisis multivariante
Grupo
X2
X3
X4
X5
Objeto 1
34
126 0.1
0.7
Objeto 2
36
32 0.5
0.3
Objeto 3
240 0.4
0.2
Objeto 4
23
45
0.3
37
MANOVA
Anlisis en variables cannicas
Anlisis discriminante
Anlisis multivariante
Grupo
X1 X2
X3
X4
Objeto 1
Grupo 1
34
126 0.1
0.7
Objeto 2
Grupo 1
36
32 0.5
0.3
Objeto 3
Grupo 1
52
24
0.4
0.2
Objeto 4
Grupo 2
21
25
34
39
Objeto 5
Grupo 2
16
12
15
18
Objeto 6
Grupo 2
15
25
29
33
Objeto 7
Grupo 3
23
25
29
13
Objeto 8
Grupo 3
23
21
25
26
Objeto 9
Grupo 3
22
67
24
32
x11
x21
x
31
x12
x13
x22
x23
x32
x33
x14
x24
x34
Anlisis multivariante
GROUP 1
GROUP 2
GROUP 3
POOLED MEAN
VARIABLE 1
5.00600E+00
5.93600E+00
6.58800E+00
5.84333E+00
VARIABLE 2
3.42800E+00
2.77000E+00
2.97400E+00
3.05733E+00
VARIABLE 3
1.46200E+00
4.26000E+00
5.55200E+00
3.75800E+00
VARIABLE 4
2.46000E-01
1.32600E+00
2.02600E+00
1.19933E+00
Anlisis multivariante
VARIABLE 1
5.00600E+00
5.93600E+00
6.58800E+00
5.84333E+00
VARIABLE 2
3.42800E+00
2.77000E+00
2.97400E+00
3.05733E+00
VARIABLE 3
1.46200E+00
4.26000E+00
5.55200E+00
3.75800E+00
VARIABLE 4
2.46000E-01
1.32600E+00
2.02600E+00
1.19933E+00
Value
2.344E-02
3.219E+01
3.248E+01
1.192E+00
Transform deg.free.
4.149E+00
8 288
p
0.0001
Reject H0
5.846E+02
0.0000
Reject H0
144
Anlisis multivariante
Anlisis multivariante
X1
X2
X3
X4
Objeto 1
34
126
0.1
0.7
Objeto 2
36
32
0.5
0.3
Objeto 3
240
0.4
0.2
Objeto 4
23
45
37
0.3
Objetivos:
Para discriminar entre los grupos todo
lo posible se busca una combinacin
lineal de las variables que maximice la
la relacin de la variabilidad entre
grupos respecto a la variabilidad intra
grupos.
x1
x12
x22
Direccin de mxima
separacin
Y1 = a11 X 1 + a12 X 2
x11 x21
x2
Anlisis multivariante
Anlisis multivariante
CV1
Proportions
0.9912
0.0088
Chi-sq.
546.1153
36.5297
NDOF
p
8 0.0000
3 0.0000
CV2
Anlisis multivariante
?
6.2 3.4 5.4 2.3
+ + a1p x p + a10
y m = a m1x1 + + a mp x p + a m0
VI curso de Anlisis de Datos (30 Marzo de 2009)
Anlisis multivariante
4.6
5.9
6.2
3.6
3.2
3.4
1.0
4.8
5.4
0.2
1.8
2.3
Anlisis multivariante
Anlisis multivariante
Anlisis multivariante
#genename
R06581
H13205
AA088678
AA126760
R08434
A101777
AI023731
AA456314
T95268
AA775957
t-statistic
-3.789523125
-3.342012644
-3.105088949
2.934455395
-2.872010231
-2.790141583
-2.698203802
2.660455942
-2.629109144
2.592031002
pvalue
0.00067859
0.002239682
0.004130574
0.006351529
0.007416606
0.009068974
0.011333359
0.012407669
0.013371006
0.014599937
Anlisis multivariante
Anlisis multivariante
Anlisis multivariante
Componentes principales
Anlisis multivariante
ANALISIS DISCRIMINANTE
Distancia de Mahalanobis al cuadrado
Anlisis multivariante