Está en la página 1de 9

Tema-4-ANALISIS-MULTIVARIANTE.

pdf

Anónimo

Análisis Multivariante

2º Grado en Estadística

Facultad de Ciencias
Universidad de Salamanca

Reservados todos los derechos.


No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
1

Tema 4: Estudio de las diferencias entre grupos

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
ANÁLISIS DE LA ESTRUCTURA DE GRUPOS
- Objetivo general: Estudiar las diferencias entre los grupos y caracterizarlas mediante
técnicas multivariantes.
o Necesitamos un nuevo grupo de técnicas ya que, en general, las direcciones de
máxima variabilidad no coinciden con las direcciones de máxima separación entre
grupos.

Reservados todos los derechos.


- Objetivos particulares
o Comparación de los grupos a través de sus vectores de medias: ANÁLISIS
MULTIVARIANTE DE LA VARIANZA
o Representación de la estructura de los grupos en dimensión reducida: ANÁLISIS
CANÓNICO O ANÁLISIS DISCRIMINANTE DESCRIPTIVO
o Representación de la estructura de los grupos y de las variables responsables de la
separación: BIPLOT CANÓNICO O MANOVA BIPLOT.
o Clasificar un nuevo individuo en una de varias poblaciones: ANÁLISIS
DISCRIMINANTE

ANÁLISIS MULTIVARIANTE DE LA VARIANZA (MANOVA)


Contraste de la hipótesis de igualdad de vectores de medias (no hay diferencias entre grupos)
𝐻0 : µ1 = µ2 =. . . = µ𝑔 = µ
𝐻𝑎 : ∃𝑘, 𝑘 ′ , µ𝑘 ≠ µ𝑘’

Para un experimento diseñado, la hipótesis de que no hay efecto de los tratamientos es:
𝐻0 : 𝛼1 = 𝛼2 = ⋯ = 𝛼𝑔 = 0
𝐻𝑎 : ∃𝑘, 𝛼𝑘 ≠ 0

- 𝑄 = 𝑄ℎ + 𝑄𝑒
𝑟
- 𝑄ℎ = ∑𝑖=1 𝑛𝑖 (𝑥̅𝑖 − x̅)2
𝑔
𝑛𝑖 2
- 𝑄𝑒 = ∑ ∑ (𝑥𝑖𝑗 − 𝑥̅𝑖)
𝑗=1
𝑖=1

2º GRADO EN ESTADÍSTICA |ANÁLISIS MULTIVARIANTE

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1618237
2

Fuente Suma de cuadrados Grados de Estimador 𝐅𝐞𝐱𝐩


libertad
Entre 𝑄𝑛 g-1 𝑄ℎ 𝑆𝑛2
𝑆𝑛2 = 𝐹exp =
𝑔−1 𝑆𝑒2
Residual 𝑄𝑒 n-g 𝑄𝑒
𝑆𝑒2 =
𝑛−𝑔
Total 𝑄 n-1

- Matriz de medias
1

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
o 𝑋1 = (𝑥𝑖𝑗 ) → x̅1 = (x̅11 , … , x̅1𝑝 )
2
o 𝑋2 = (𝑥𝑖𝑗 ) → x̅ 2 = (x̅ 21, … , x̅ 2𝑝 )
o …
𝑔
o 𝑋𝑔 = (𝑥𝑖𝑗 ) → x̅𝑔 = (x̅𝑔1 , … , x̅𝑔𝑝 )

x̅1 x̅11 … x̅1𝑝



𝑥̅ = [ ] = [ ⋮ ⋱ ⋮ ]
x̅𝑔 x̅𝑔1 … x̅𝑔𝑝

̅ ̅ i1 , … , ̅
X = (X X ip )’
̅, 𝑄𝑒 = 𝑄𝑡 − 𝑄ℎ
̅𝐷𝑔 X
𝐷𝑔 = 𝑑𝑖𝑎𝑔(𝑛1 , … , 𝑛𝑔 ), 𝑄𝑡 = 𝑋 ′ 𝑋, 𝑄ℎ = X

Reservados todos los derechos.


- Covarianzas entre y dentro de los grupos
1 1
o 𝑋1 = (𝑥𝑖𝑗 ) → 𝑆1 = (𝑋1 ′𝑋1 )
𝑛1 −1
2 1
o 𝑋2 = (𝑥𝑖𝑗 ) → 𝑆2 = (𝑋2′𝑋2 )
𝑛2 −1
o …
1
o 𝑋𝑇 = (𝑥𝑖𝑗𝑇 ) → 𝑆𝑇 = (𝑋𝑔 ′𝑋𝑔 )
𝑛𝑔 −1

1
𝑆= ∑𝑔𝑘=1(𝑛𝑘 − 1) 𝑆𝑘 , 𝑛 = ∑𝑔𝑘=1 𝑛𝑘
𝑛−𝑔

𝑄ℎ 𝑄ℎ
𝐻= ,𝑆 =
𝑔−1 𝑛−𝑔

- Tabla de análisis de la varianza

Fuente Suma de cuadrados Grados Estimadores Cociente


de
libertad
Entre/hipótesis ‾ ‾
k-1 𝑄ℎ 𝑆 −1 𝐻
𝑄ℎ = 𝑋 ‘𝐷𝑔 𝑋 𝑆𝑛2 =
𝑔−1

Dentro/Error 𝑘
n-g 𝑄𝑒
𝑆𝑒2 =
𝑄𝑒 = ∑(𝑛𝑖 − 1)𝑆𝑖 = 𝑄𝑡 − 𝑄ℎ 𝑛−𝑔
𝑖=1

Total 𝑄𝑡 = 𝑋′𝑋 n-1

El cálculo de la significación del Análisis Multivariante de la varianza es más complejo que en el


caso univariante. Existen varias aproximaciones diferentes.

2º GRADO EN ESTADÍSTICA |ANÁLISIS MULTIVARIANTE

Abre tu cuenta N26 y llévate 10 € en 10 minutos ¡Clic aquí!


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1618237
3

- Tests multivariantes:
o Roy statistic: La mayor raíz característica de |𝐻 − 𝜆𝑆| que es el mayor valor propio de
𝐻𝑆 −1 .
o Lawley and Hotteling: 𝑇 = 𝑡𝑟𝑎𝑜𝑒(𝐻𝑆 −1 ) = ∑𝑠𝑖=1 𝜆𝑖 , 𝑠 = min −1, 𝑝)
|𝑆| 𝑝−𝑔+2
o Wilk’s 𝛬-statistic: 𝛬𝑝,𝑔−1,𝑛−𝑔 = |𝐻+𝑆|
= |𝑆(𝐻 + 𝑆)−1 | = ∏𝑠𝑖=1 𝜆𝑖 , −((𝑛 − 𝑔) )𝑙𝑛𝛬 ≈
2
2
𝜒𝑝(𝑔−1)
1
1 − 𝛬𝑏 (𝑎𝑏 − 𝑐)
1 ≈ 𝐹𝑝(𝑔−1),𝑎𝑏−𝑐
𝛬𝑏 𝑝(𝑔 − 1)

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
𝑝−𝑔+2
• 𝑎 = (𝑛 − 𝑔) −
2
𝑝2 (𝑔−1)2 −4
• 𝑏=√
𝑝2 +(𝑔−1)2 −5
𝑝(𝑔−1)−2
• 𝑐=
2
𝑠
𝜆𝑖
o Pillai statistic: 𝑉 = 𝑡𝑟𝑎𝑜𝑒[𝐻(𝐻 + 𝑆)−1 ] = ∑
𝑖=1 1+𝜆𝑖
- ¿Por qué utilizamos MANOVA y no 18 ANOVAS?
o Trabaja con todas las variables simultáneamente
buscando una combinación lineal de las
variables que tenga la F de Snedecor univariante
máxima.

Reservados todos los derechos.


o Control del nivel de significación
o Eliminación de la información redundante
controlando las correlaciones entre las variables
mediante las distancias de Mahalanobis.
o Puede que ninguna de las variables originales sea
significativa y existir diferencias en una
combinación lineal de ellas.

ANÁLISIS DISCRIMINANTE LINEAL


- Análisis discriminante para dos grupos: Buscamos una nueva variable y, combinación
lineal de las variables observadas y=Xa, que muestre las mayores diferencias entre las
medias de los dos grupos de forma que nos permita la clasificación de uno de ellos con la
máxima resolución posible.
o La media de los valores de la nueva variable para cada grupo son 𝑦̅1 = 𝑎’x̅1 𝑒 y̅2 =
𝑎’x̅ 2 .
o La diferencia de las medias es, entonces, 𝑦̅1 − y̅2 = 𝑎’x̅1 – 𝑎’x̅ 2 = 𝑎’(x̅1 − ’x̅ 2 ).
o Se trata, por tanto, hacer máximo |𝑎’(x̅1 − x̅ 2 )| sujeto a la restricción 𝑎’𝑆𝑎 = 1 para
evitar las indeterminaciones en los coeficientes producidas por la indeterminación
en la escala de la variable combinada. La restricción significa que la variabilidad
dentro de los grupos en la nueva variable es la unidad.
o La solución viene dada por 𝑎 = 𝑆 −1 (x̅1 − x̅ 2 ) y la función discriminante lineal es 𝑦 =
𝑋𝑎 = 𝑋𝑆 −1 (x̅1 − x̅ 2 )
o La función discriminante puede usarse para clasificar nuevos individuos en uno de
los dos grupos, de la misma forma que o hacíamos con una sola variable. Después
de obtener los coeficientes, los valores medios de la función discriminante para los
dos grupos serán 𝑦̅1 = (x̅1 − x̅ 2 )‘𝑆 −1 x̅1 e y̅2 = (x̅1 − x̅ 2 )‘𝑆−1 x̅ 2, y el punto medio de
1
ambos 𝑦̅ = (𝑦̅1 + y̅2 ) = (x̅1 − x̅ 2 )’𝑆−1 (x̅1 + x̅ 2 ) que puede ser utilizado como punto de
2
corte para la clasificación.

2º GRADO EN ESTADÍSTICA |ANÁLISIS MULTIVARIANTE

Llévate 1 año de WUOLAH PRO con BBVA. ¿Cómo? ¡+Info aquí!


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1618237
4
1
o Es decir, asignamos el individuo l grupo 1 si (x̅1 − x̅ 2 )‘𝑆−1 𝑥 > (x̅1 − x̅ 2 )’𝑆 −1 (x̅1 + x̅ 2 ) y al
2
1
grupo 2 si (x̅1 − x̅ 2 )‘𝑆 −1 𝑥 ≤ (x̅1 − x̅ 2 )’𝑆 −1 (x̅1 + x̅ 2 ).
2

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
1
o O bien si tomamos 𝑊 = (x̅1 − x̅ 2 )‘𝑆 −1 𝑥 − (x̅1 − x̅ 2 )’𝑆 −1 (x̅1 + x̅ 2 ) la regla es, asignar a la
2
población 1 si 𝑊 > 0 y sino, asignar a la población 2.
- Distancia de Mahalanobis: La distancia de Mahalanobis (al cuadrado) entre dos individuos
con vectores de observaciones x y z, es 𝑑𝑀 2
= 𝑑𝑀 2 (𝑥,
𝑧) = (𝑥 − 𝑧)’𝑆−1 (𝑥 − 𝑧)
o La distancia de Mahalanobis de u individuo al grupo i es la distancia al centroide
del grupo 𝑑𝑀 2
= 𝑑𝑀 2
(𝑥, 𝑥̅ 𝑖 ) = (𝑥 − 𝑥̅ 𝑖 )’𝑆 −1 (𝑥 − 𝑥̅ 𝑖 ) y la distancia entre dos grupos es la
distancia entre sus centroides 𝑑𝑀 2
= 𝑑𝑀 2
(𝑥̅ 𝑖 , 𝑥̅𝑗 ) = (𝑥̅ 𝑖 − 𝑥̅𝑗 )’𝑆 −1 (𝑥̅ 𝑖 − 𝑥̅𝑗 ).
o Propiedades:
▪ La distancia de Mahalanobis tiene en cuenta las correlaciones entre las
variables utilizando sólo la información de cada variable no redundante.
▪ Es invariante por transformaciones no singulares, en particular, por cambios
de escala.
- Interpretación geométrica: Geométricamente el criterio consiste en asignar el individuo a

Reservados todos los derechos.


la población más cercana, midiendo al cercanía a partir de la distancia de Mahalanobis.
La regla es, asignamos la observación a la población 1 si 𝑑𝑀 2 (𝑥, 2 (𝑥,
𝑥̅ 1 ) < 𝑑𝑀 2 (𝑥,
𝑥̅ 2 )𝑜 𝑑𝑀 𝑥̅ 2) −
2 (𝑥,
𝑑𝑀 𝑥̅ 1 ) > 0.
o La regla puede expresarse como 𝑑𝑀 2 (𝑥,
𝑥̅ 2 ) − 𝑑𝑀 2 (𝑥,
𝑥̅ 1 ) = (𝑥 − 𝑥̅ 2 )‘𝑆−1 (𝑥 − 𝑥̅ 2 ) −
(𝑥 − 𝑥̅ 1 )‘𝑆 (𝑥 − 𝑥̅ 1 ) = 𝑥’𝑆 𝑥 + 𝑥̅ 2‘𝑆 𝑥̅ 2 − 2𝑥’𝑆 𝑥̅ 2 − 𝑥’𝑆−1 𝑥 − 𝑥̅ 2′ 𝑆 −1 𝑥̅ 2 + 2𝑥’𝑆−1 𝑥̅ 2 =
−1 −1 −1 −1

(𝑥̅ 2 − 𝑥̅ 1 )’𝑆−1 (𝑥̅ 2 + 𝑥̅ 1 ) + 2𝑥’𝑆 −1 (𝑥̅ 2 − 𝑥̅ 1 )’ > 0 que es idéntica a la regla desarrollada
anteriormente.
- Análisis discriminante para más de dos grupos:
o Cuando disponemos de varios grupos tenemos varias posibles reglas de
1
clasificación por parejas 𝑊𝑖𝑗 = (𝑥̅ 𝑖 − 𝑥̅𝑗 )‘𝑆 −1 𝑥 − (𝑥̅ 𝑖 − 𝑥̅𝑗 )‘𝑆 −1 (𝑥̅ 𝑖 + 𝑥̅𝑗 ) aunque una de
2
ellas es redundante.

- Bondad del ajuste: Probabilidad de clasificación errónea (número de individuos mal


clasificados dividido por el número total de individuos).
o La probabilidad de clasificación errónea queda subestimada cuando se realiza
sobre el mismo conjunto de individuos que se utilizó para estimar la función
discriminante. Para evitar esto, pueden utilizarse dos conjuntos de individuos, uno
ara estimar la función y otro para valorar la clasificación.
o Otra forma de valoración puede realizarse clasificando cada individuo a partir de
la función calculada con el resto.

2º GRADO EN ESTADÍSTICA |ANÁLISIS MULTIVARIANTE

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1618237
5

- Discriminante basado en distribuciones de probabilidad: Cuando es posible asignar


distribuciones de probabilidad 𝑓1 y 𝑓2 a cada una de las poblaciones, la regla
discriminante para una observación x es:
𝑓1 (𝑥) 𝑓1 (𝑥)
o Asignar a la población 1 si 𝑓1 (𝑥) > 𝑓2 (𝑥) o bien > 1 ó también log[ ] > 0.
𝑓2 (𝑥) 𝑓2 (𝑥)
o Si se conocen las probabilidades a priori 𝜋1 y 𝜋2 de que los individuos pertenezcan a
𝑓1 (𝑥) 𝜋1
cada una de las poblaciones, la regla sería asignar a la población 1 si > ,ó
𝑓2 (𝑥) 𝜋2
𝑓 (𝑥)
log [ 1 (𝑥)] > 0.
𝑓2
o En definitiva, se trata de asignar la observación a aquella población que tenga la
verosimilitud más alta.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
- Matrices de covarianzas distintas: discriminante cuadrático
o Cuando las matrices de covarianzas no son las mismas en los dos grupos y
suponemos que las poblaciones son normales multivariantes, el método de máxima
verosimilitud proporciona el siguiente discriminado cuadrático:
1 1 1 1
𝑄(𝑥) = 𝑥′(𝑆2−1 − 𝑆1−1 )𝑥 − 𝑥’(𝑆1−1 𝑥̅1 − 𝑆2−1 𝑥̅ 2 ) + 𝑥̅ 2 ′𝑆2−1 𝑥̅ 2 − 𝑥̅ 1 ′𝑆1−1 𝑥̅1 + log|𝑆1−1 | > 0
2 2 2 2
- Discriminante logístico: Cuando no se verifican las condiciones de aplicación del análisis
discriminante (distribuciones normales y varianzas iguales) puede utilizarse el denominado
discriminante logístico basado en la regresión logística.
o En este análisis tratamos de estimar la probabilidad de que un individuo pertenezca
a cada uno de los grupos cuando tiene una combinación concreta de variables

Reservados todos los derechos.


explicativas, mediante un modelo de respuesta logística de la forma (para dos
𝛽∘+𝛽1 𝑥𝑖 +⋯+𝛽𝑝 𝑥𝑖𝑝
𝑒 𝑥𝑖 ′𝛽 𝑒 1
poblaciones) 𝑃(𝑖 ∈ 𝑃𝑜𝑏1, 𝑥𝑖 ) = 𝑥𝑖 ′𝛽 = 𝛽∘+𝛽1 𝑥 𝑖 +⋯+𝛽𝑝 𝑥𝑖𝑝
1+𝑒 1+𝑒 1
1
o Naturalmente 𝑃(𝑖 ∈ 𝑃𝑜𝑏2, 𝑥𝑖 ) = 1 − 𝑃(𝑖 ∈ 𝑃𝑜𝑏1, 𝑥𝑖 ) =
1+𝑒 𝑥𝑖 ′𝛽
o Una vez que se han estimado los parámetros y se han calculado las probabilidades
de pertenencia a cada una de las poblaciones, el individuo será asignado a
aquella población para la que la probabilidad sea mayor, es decir, asignar a la
población 1 si 𝑃(𝑖 ∈ 𝑃𝑜𝑏1, 𝑥𝑖 ) > 0.5 y a la población 2 en caso contrario.

ANÁLISIS CANÓNICO (DE POBLACIONES)


- Obtención de las variables canónicas: Se trata de una representación, en dimensión
reducida, de los resultados de un MANOVA o de un análisis discriminante. Se conoce
también como coordenadas discriminantes o Análisis Factorial Discriminante en la escuela
francesa.
o Se pretende, a partir de las medias de las variables 𝑋1 , 𝑋2 , … , 𝑋𝑗 , consideradas
simultáneamente, separar los grupos tanto como sea posible. Ara lograr este
propósito, se busca una combinación lineal del vector de variables de partida X, en
una nueva variable, la cual haga máxima la variabilidad ente los grupos relativa a
la variabilidad dentro de ellos. Si la transformación la denotamos por 𝑦 = 𝑣 ′ 𝑥 ; lo que
𝑣𝑇 𝐻𝑣
se busca es hallar el máximo de la función: 𝑔(𝑣) = .
𝑣𝑇 𝑆𝑣
▪ La función g(v) que se quiere maximizar es la relación de la varianza entre los
grupos, sobre la varianza dentro de los grupos. Para hacer que la solución
sea única imponemos la restricción 𝑣 𝑇 𝑆𝑣 = 1, es decir se restringe la solución
para que la variabilidad dentro de los grupos en la contribución lineal sea
igual a 1.

2º GRADO EN ESTADÍSTICA |ANÁLISIS MULTIVARIANTE

Llévate 1 año de WUOLAH PRO con BBVA. ¿Cómo? ¡+Info aquí!


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1618237
6

o El vector v que maximiza g(v) es el vector propio de la matriz (𝑆 −1 𝐻) asociado al


mayor valor propio 𝜆2. A la transformación asociada al vector v corrrespondiante al
máximo vector propio se le denomina primera variable canónica.
o La segunda variable canónica puede obtenerse del valor propio asociado al
segundo valor propio más grande de (𝑆 −1 𝐻) y así se construyen las demás variables
canónicas sucesivamente.
o El número posible de variables canónicas es igual 𝑟 = 𝑟𝑎𝑛𝑔𝑜(𝑆 −1 𝐻).
o Como la matriz (𝑆 −1 𝐻) es no simétrica, su descomposición espectral puede hallarse
1 1
utilizando la diagonalización de la matriz 𝑆 −2 𝐻𝑆 −2 .
o La proyección de las medias de cada grupo sobre el espacio canónico se calcula

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
como 𝑌̅ = X ̅𝑉.
o La proyección de todo el conjunto de individuos sobre el espacio canónico se
calcula como XV.
- Propiedades de las variables canónicas:
o Las distancias euclídeas entre las medias en el espacio de las variables canónicas
coinciden con las distancia de Mahalanobis en el espacio de las variables
originales. Así que el espacio de las variables canónicas se puede pensar como un
Espacio Euclídeo.
o Además, dado que H es la matriz de covarianzas entre los grupos, lo que se obtiene
es la transformacón ortogonal que hace máxima la separación entre los grupos,
pero relativa la variabilidad dentro de estos.
o El Análisis Canónico de Poblaciones puede además considerarse como un análisis

Reservados todos los derechos.


de Componentes Principales de la matriz ̅ X relativo a la matriz de covarianzas
dentro de los grupos, es decir 𝑆 −1 , se utiliza como métrica para medir las distancias
entre los vectores de medias.

BIPLOT CANÓNICO
- Obtención: Tratamos de obtener una representación simultánea de las filas, que en este
caso son centroides, y de las columnas, de la matriz X̅. Para tener en cuenta el efecto de
la dispersión de los individuos y de las escalas de medida de las variables, introducimos
una ponderación con respecto a la matriz de convarianzas dentro de los grupos y otra
con relación a los tamaños muéstrales, esto debido a que la precisión de las medias
depende del tamaño con el que se han calculado.
o Definimos: ̅ Y = 𝐷1⁄2 ̅
X𝑆 −1/2
o La representación Biplot de la matriz Y ̅ puede obtenerse a partir de su
descomposición en valores iguales, es decir: Y̅ = 𝑃𝛬𝑄 𝑇 .
1
o Despejando X
̅ en la ecuación y sustituyendo Y ̅ = (𝐷−2 𝑃𝛬) (𝑄 𝑇 𝑆 1⁄2 )
̅ tenemos: X
o Se puede entonces obtener el RMP Biplot construyendo los marcadores como:
1
▪ 𝐴 = 𝐷 −2 𝑃𝛬
▪ 𝐵 = 𝑆 1⁄2 𝑄
- Propiedades:
o Los marcadores son A la proyección de X ̅ sobre el espacio de máxima separación
de los grupos, generado por las columnas de la matriz V, y la distancia euclídea
entre dos vectores de medias, en el espacio de las variables canónicas, es
aproximadamente la distancia de Mahalanobis en el espacio de partida.
o Los marcadores A son las coordenadas sobre las combinaciones lineales que
proporcionan la F univariante más grande en el sentido MANOVA

2º GRADO EN ESTADÍSTICA |ANÁLISIS MULTIVARIANTE

Llévate 1 año de WUOLAH PRO con BBVA. ¿Cómo? ¡+Info aquí!


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1618237
7

o La calidad de representación (ó bondad de ajuste de las filas), se puede estimar


𝑠
∑ 𝜆2𝑖
como: 𝑖=1
𝑟

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
∑𝑖=1 𝜆2𝑖

o Los marcadores B aproximan a la matriz de covarianzas dentro de los grupos, así:


𝐵𝐵𝑇 = 𝑆 1⁄2 𝑄𝑄 𝑇 𝑆 1⁄2 = 𝑆
o La longitud de los marcadores columna, es proporcional a la variabilidad dentro de
los grupos.
o Se puede superponer una escala de predicción de las variables originales.
- Ventajas:
o Muestra las diferencias entre las medias
o Obtiene la combinación de variables con máximo poder discriminante
o Obtiene la combinación de variables con máxima F de Snedecor univariante
o Modela la relación entre/dentro
o Los datos de cada grupo pueden proyectarse en la representación final para
valorar la calidad de la discriminación entre grupos
o Permite contrastar diferencias entre medias

Reservados todos los derechos.


- Inconvenientes:
o Neesita software especializado
o Las matrices de covarianzas dentro de los grupos tienen que ser iguales.

2º GRADO EN ESTADÍSTICA |ANÁLISIS MULTIVARIANTE

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-1618237

También podría gustarte