Documentos de Académico
Documentos de Profesional
Documentos de Cultura
GEOLOGA
TEMA 1: INTRODUCCIN AL ANLISIS MULTIVARIANTE
FRANCISCO DE ASIS TORRES RUIZ
MARIA DOLORES MARTINEZ MIRANDA
Dpto. Estadstica e Investigacion Operativa
Universidad de Granada
Granada, curso 2008-2009
1.- Introduccin
1.- Introduccin
Definicin
1.- Introduccin
Definicin
Anlisis Multivariante: Coleccin de tcnicas estadsticas
que consideran, simultneamente, diversas variables.
1.- Introduccin
Definicin
Anlisis Multivariante: Coleccin de tcnicas estadsticas
que consideran, simultneamente, diversas variables.
Alternativas. A partir de la definicin anterior:
1.- Introduccin
Definicin
Anlisis Multivariante: Coleccin de tcnicas estadsticas
que consideran, simultneamente, diversas variables.
Alternativas. A partir de la definicin anterior:
Anlisis Multivariante: las variables deben ser
aleatorias, con distribucin conjunta normal
multidimensional y son correlacionadas (no pueden
ser tratadas de forma aislada).
1.- Introduccin
Definicin
Anlisis Multivariante: Coleccin de tcnicas estadsticas
que consideran, simultneamente, diversas variables.
Alternativas. A partir de la definicin anterior:
Anlisis Multivariante: las variables deben ser
aleatorias, con distribucin conjunta normal
multidimensional y son correlacionadas (no pueden
ser tratadas de forma aislada).
Anlisis Multivariable: en otro caso.
1.- Introduccin
Notas histricas:
1.- Introduccin
Notas histricas:
Karl Pearson (1901) y Spearman (1904) establecen las primeras ideas
del anlisis de componentes principales.
1.- Introduccin
Notas histricas:
Karl Pearson (1901) y Spearman (1904) establecen las primeras ideas
del anlisis de componentes principales.
La mayora de las tcnicas multivariantes se desarrollan alrededor de
los aos treinta: Hotelling (1931, 1933), Wilks (1932, 1935), Fisher
(1935, 1936), Mahalanobis (1936) y Bartlett (1939).
1.- Introduccin
Notas histricas:
Karl Pearson (1901) y Spearman (1904) establecen las primeras ideas
del anlisis de componentes principales.
La mayora de las tcnicas multivariantes se desarrollan alrededor de
los aos treinta: Hotelling (1931, 1933), Wilks (1932, 1935), Fisher
(1935, 1936), Mahalanobis (1936) y Bartlett (1939).
En los aos 60 empiezan a utilizarse los ordenadores en el proceso de
anlisis de datos. El proceso mecnico de clculo deja de tener
importancia y comienza a aplicarse el Anlisis Multivariante en
Psicologa, Educacin, Biologa, Economa, Geologa, etc.
1.- Introduccin
Notas histricas:
A partir de los aos 80 la informtica pasa a ser de dominio pblico y
desde este momento la mayora de las investigaciones de carcter
emprico se plantean la conveniencia de emplear el Anlisis
Multivariante.
x11
.
.
X=
xi1
xN 1
.
.
.
x1j
.
.
.
.
.
.
x1p
.
.
.
.
.
.
xij
.
.
.
.
.
.
xip
.
.
.
xN j
xN p
N p
x11
.
.
X=
xi1
xN 1
.
.
.
x1j
.
.
.
.
.
.
x1p
.
.
.
.
.
.
xij
.
.
.
.
.
.
xip
.
.
.
xN j
xN p
N p
x11
.
.
X=
xi1
xN 1
.
.
.
x1j
.
.
.
.
.
.
x1p
.
.
.
.
.
.
xij
.
.
.
.
.
.
xip
.
.
.
xN j
xN p
N p
x11
.
..
X=
x1j
.
.
.
x1p
.
.
.
xi1
.
.
.
.
.
.
xN 1
.
.
.
.
.
.
xij
.
.
.
.
.
.
xN j
.
.
.
xip
xN p
pN
x11
.
.
X=
xi1
xN 1
.
.
.
x1j
.
.
.
.
.
.
x1p
.
.
.
.
.
.
xij
.
.
.
.
.
.
xip
.
.
.
xN j
xN p
x11
.
.
X=
xi1
xN 1
.
.
.
x1j
.
.
.
.
.
.
x1p
.
.
.
.
.
.
xij
.
.
.
.
.
.
xip
.
.
.
xN j
xN p
x11
.
.
X=
xi1
xN 1
X=
x1
.
.
.
x1j
.
.
.
.
.
.
x1p
.
.
.
.
.
.
xij
.
.
.
.
.
.
xip
.
.
.
xN j
xN p
xj
xp
x11
.
.
X=
xi1
xN 1
X=
x1
.
.
.
x1j
.
.
.
.
.
.
x1p
.
.
.
.
.
.
xij
.
.
.
.
.
.
xip
.
.
.
xN j
xN p
xj
xp
x11
.
.
X=
xi1
xN 1
X=
x1
.
.
.
x1j
.
.
.
.
.
.
x1p
.
.
.
.
.
.
xij
.
.
.
.
.
.
xip
.
.
.
xN j
xN p
xj
xp
Pj =
1
xj 1
N
1
1=
N
N
1 X
xij
N i=1
1 = xj 1
N
1 X
1
=
(xij xj )2 =
||ej ||2
N i=1
N
N
1 X
1
=
(xij xj )2 =
||ej ||2
N i=1
N
Covarianza muestral
N
1 X
1
=
(xij xj )2 =
||ej ||2
N i=1
N
Covarianza muestral
sjk
N
1 X
1
e ek
=
(xij xj )(xik xk ) =
N i=1
N j
N
1 X
1
=
(xij xj )2 =
||ej ||2
N i=1
N
Covarianza muestral
sjk
N
1 X
1
e ek
=
(xij xj )(xik xk ) =
N i=1
N j
Correlacin muestral
N
1 X
1
=
(xij xj )2 =
||ej ||2
N i=1
N
Covarianza muestral
sjk
N
1 X
1
e ek
=
(xij xj )(xik xk ) =
N i=1
N j
Correlacin muestral
rjk
ej ek
sjk
= cos(ej , ek )
=
=
sjj skk
||ej ||||ek ||
s11
.
..
S=
sj1
.
.
.
sp1
.
..
s1j
.
..
.
..
s1p
.
..
.
..
sjj
.
..
.
..
sjp
.
..
spj
spp
s11
.
..
S=
sj1
.
.
.
sp1
.
..
s1j
.
..
.
..
s1p
.
..
.
..
sjj
.
..
.
..
sjp
.
..
spj
spp
s11
.
..
S=
sj1
.
.
.
sp1
.
..
s1j
.
..
.
..
s1p
.
..
.
..
sjj
.
..
.
..
sjp
.
..
spj
spp
r11
.
..
R=
rj1
.
.
.
rp1
.
..
r1j
.
..
.
..
r1p
.
..
.
..
rjj
.
..
.
..
rjp
.
..
rpj
rpp
s11
.
..
S=
sj1
.
.
.
sp1
.
..
s1j
.
..
.
..
s1p
.
..
.
..
sjj
.
..
.
..
sjp
.
..
spj
spp
r11
.
..
R=
rj1
.
.
.
rp1
.
..
r1j
.
..
.
..
r1p
.
..
.
..
rjj
.
..
.
..
rjp
.
..
rpj
rpp
Varianza generalizada
s11
.
..
S=
sj1
.
.
.
sp1
.
..
s1j
.
..
.
..
s1p
.
..
.
..
sjj
.
..
.
..
sjp
.
..
spj
spp
r11
.
..
R=
rj1
.
.
.
rp1
.
..
r1j
.
..
.
..
r1p
.
..
.
..
rjj
.
..
.
..
rjp
.
..
rpj
rpp
Varianza generalizada
Traza(S) = s11 + + spp
p N
1 XX
=
(xij xj )2
N j=1 i=1
s11
.
..
S=
sj1
.
.
.
sp1
.
..
s1j
.
..
.
..
s1p
.
..
.
..
sjj
.
..
.
..
sjp
.
..
spj
spp
r11
.
..
R=
rj1
.
.
.
rp1
.
..
r1j
.
..
.
..
r1p
.
..
.
..
rjj
.
..
.
..
rjp
.
..
rpj
rpp
Varianza generalizada
Traza(S) = s11 + + spp
N
X
i=1
p N
1 XX
=
(xij xj )2
N j=1 i=1
(xij x2j ):
s11
.
..
S=
sj1
.
.
.
sp1
.
..
s1j
.
..
.
..
s1p
.
..
.
..
sjj
.
..
.
..
sjp
.
..
spj
spp
r11
.
..
R=
rj1
.
.
.
rp1
.
..
r1j
.
..
.
..
r1p
.
..
.
..
rjj
.
..
.
..
rjp
.
..
rpj
rpp
Varianza generalizada
Traza(S) = s11 + + spp
N
X
i=1
p N
1 XX
=
(xij xj )2
N j=1 i=1
s11
.
..
S=
sj1
.
.
.
sp1
.
..
s1j
.
..
.
..
s1p
.
..
.
..
sjj
.
..
.
..
sjp
.
..
spj
spp
r11
.
..
R=
rj1
.
.
.
rp1
.
..
r1j
.
..
.
..
r1p
.
..
.
..
rjj
.
..
.
..
rjp
.
..
rpj
rpp
Varianza generalizada
Traza(S) = s11 + + spp
N
X
i=1
p X
N
X
j=1 i=1
p N
1 XX
=
(xij xj )2
N j=1 i=1
(xij xj )2 :
s11
.
..
S=
sj1
.
.
.
sp1
.
..
s1j
.
..
.
..
s1p
.
..
.
..
sjj
.
..
.
..
sjp
.
..
spj
spp
r11
.
..
R=
rj1
.
.
.
rp1
.
..
r1j
.
..
.
..
r1p
.
..
.
..
rjj
.
..
.
..
rjp
.
..
rpj
rpp
Varianza generalizada
Traza(S) = s11 + + spp
N
X
i=1
p X
N
X
j=1 i=1
p N
1 XX
=
(xij xj )2
N j=1 i=1