Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ANALISIS MULTIVARIADO
CLASE 6
ANÁLISIS MULTIVARIADO DE
LA VARIANZA
Adriana Pérez – EGE, FCEN, UBA
2
V. respuesta
V.explicatoria
5 anovas de un factor tasa de error global (con =0,05 para cada anova) =
0,23
Como todas las v. respuesta son medidas en las mismas UE y pueden estar
asociadas, múltiples anovas univariados no son independientes entre sí
Manova
3
Outliers MV?
Distancia de Mahalanobis por grupo
ggpairs(saltamontes)
Hipótesis
Se genera una nueva v.rta que maximiza las diferencias entre grupos
Esta nueva variable es una combinación lineal de las v.respuesta
medidas, combinadas de manera tal de separar los grupos tanto como
sea posible
. . ... . . . ... .
SPCentre p1 SPCp 2 ... SCentre p SPCerror p1 SPCerror p 2 ... SCerror p
. . ... .
SPCtotal p 1 SPCtotal p2 ... SCtotal p
Matrices
SCPC Anova de un factor para Tegmina
H=
T=
14
Equivalente a la descomposición de SC en anova
¿Cómo se halla la función
15
discriminante?
Se calcula la matriz HE-1, es decir el producto de la matriz H por la
inversa de E. Equivale al cociente de H (entre) y E (error), y equivale a la F
de anova
De todas las combinaciones lineales posibles, se elige aquella que
maximiza el autovalor de HE-1 (maximiza el cociente F): función
discriminante
El autovector de dicha combinación contiene los coeficientes o pesos de
cada variable original contribución de cada variable en la separación
de los grupos
Cantidad máxima de funciones discriminantes: mín (p, grupos-1)
Evaluando significación
16
Traza Hotelling-Lawley
Es una medida de cuánto de la varianza
generalizada total se explica por las H
Traza de Hotelling
diferencias entre grupos E
Cuanto mayor diferencia entre centroides Tr( HE 1 )
de los grupos, mayor Traza
Evaluando significación (cont)
17
22
Comparaciones entre grupos
Equivalente a comparaciones en anova univariada, pero ahora entre
centroides
Distintos métodos
Si dos grupos difieren, significa que difieren en al menos una de las p
variables medidas
Evaluando significación de las VR
24
Scores
autovector de FD1
La 1ra FD explica el 91% de la
variabilidad entre grupos
Es posible calcular para cada individuo su puntaje o score para cada FD y graficarlo
10 especies de árboles
Se seleccionaron árboles de cada sp
Se extrajeron de 5 a 10 hojas de cada
árbol y se midió fotosíntesis (moles.m-
2seg-1), contenido de N (mmoles.m-2) y
O lo que es lo mismo,
corregido
p
Bonferroni secuencial (Holm, 1979)
False discovery rate (Benjamini y Hochberg, 1995)
33
5 anovas de un factor
Sin corrección de Bonferroni tasa de error global (con =0,05 para
cada anova) = 0,23
0,05
corregido 0,01
Con corrección de Bonferroni p 5
=0,01 para cada anova tasa de error global = 0,05
Métodos de corrección por
múltiples tests
Corrección de Bonferroni más
conservador
más
Sin corrección potente