Está en la página 1de 8

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/233811140

MANOVA BIPLOT para arreglos de tratamientos con dos factores basado en


modelos lineales generales multivariantes

Article  in  Interciencia · January 2004

CITATIONS READS

27 732

3 authors:

Isidro Rafael Amaro Jose Luis Vicente Villardon


Universidad de Salamanca Universidad de Salamanca
7 PUBLICATIONS   58 CITATIONS    127 PUBLICATIONS   1,215 CITATIONS   

SEE PROFILE SEE PROFILE

Mª Purificación GALINDO VILLARDÓN


Universidad de Salamanca
326 PUBLICATIONS   2,869 CITATIONS   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Thèse doctorale en Expression Corporelle View project

ENSO, EL NIÑO View project

All content following this page was uploaded by Mª Purificación GALINDO VILLARDÓN on 22 May 2014.

The user has requested enhancement of the downloaded file.


MANOVA BIPLOT PARA ARREGLOS
DE TRATAMIENTOS CON DOS FACTORES
BASADO EN MODELOS LINEALES GENERALES
MULTIVARIANTES
ISIDRO RAFAEL AMARO, JOSÉ LUIS VICENTE-VILLARDÓN Y MARÍA
PURIFICACIÓN GALINDO-VILLARDÓN

n muchos experimentos 1992; Gower y Hand, 1996), que per- bles canónicas usando el estadístico
diseñados se dispone miten una representación ponderada de Lawley-Hotelling, pero no estudian de-
de varias variables res- la matriz de medias que consigue las talladamente la interacción entre facto-
puesta y se quiere buscar las diferen- direcciones con máximo poder discri- res y no presentan estimadores sobre
cias entre varios grupos. El análisis minante entre grupos. Esta técnica per- la calidad de las representaciones grá-
adecuado para este tipo de situación es mite poner de manifiesto las principa- ficas y estudios sobre los intervalos de
el Análisis Multivariante de la Varian- les diferencias entre grupos, las varia- confianza.
za, MANOVA; aunque también se ha bles responsables de las diferencias y En el presente trabajo
utilizado el análisis de variables canó- realizar inferencias sobre las variables se propone la generalización del Ma-
nicas o ambas técnicas combinadas. canónicas y originales mediante círcu- nova-Biplot al caso de diseños de dos
La limitación funda- los de confianza situados sobre los vías, utilizando cuatro representaciones
mental a la hora de trabajar con las puntos que representan a los grupos. que recogen las diferentes fuentes de
técnicas multivariantes es la compleji- La incorporación de variación: el Biplot Total, el Biplot de
dad en la presentación de los resulta- pruebas gráficas de significación intro- Interacción, y los Biplots de Filas y
dos y la interpretación de los mismos, duce una característica diferencial im- Columnas. El trabajo se complementa
sobre todo cuando se tienen muchas portante con respecto a los Biplots con la propuesta de índices de calidad
variables, debido a las interrelaciones Clásicos de Gabriel (1971), en el sen- de la representación de medias y varia-
entre ellas y a la variabilidad de carac- tido que se usa el Biplot para estudiar bles, que permiten determinar qué se
terísticas asociadas a los modelos. Ésto aspectos inferenciales y no solo des- interpreta en cada eje, así como regio-
ha conducido a muchos investigadores criptivos. nes de confianza para medias o combi-
a realizar análisis univariantes para De esta forma, los mé- naciones de medias. Los Biplots y los
cada una de las variables por separado, todos Biplot se usan como representa- índices propuestos se aplican a un con-
con los consecuentes errores u omisio- ciones de los resultados de un MANO- junto de datos.
nes en la interpretación de sus resulta- VA y permiten reducir la dimensionali-
dos. dad del problema y facilitar la inter- Métodos
Con el propósito de pretación de los modelos.
subsanar estos problemas se han usado Generalmente se ha es- Se describen a conti-
los métodos Biplot para representar los tudiado el caso en el que se dispone nuación algunas propiedades básicas
resultados de un MANOVA. Así han de una clasificación simple. Lejeune y de la teoría general de MANOVA y de
nacido los denominados Manova-Biplot Calinski (2000) abordan el problema Manova-Biplot, así como la descrip-
de una vía (Gabriel, 1972, 1995) o Bi- para la clasificación de dos vías desde ción detallada de los Biplots propues-
plot Canónico (Vicente-Villardón, el punto de vista del análisis de varia- tos. La justificación de muchos de los

PALABRAS CLAVES / Biplot / Calidad de Representación / MANOVA / Manova-Biplot / Modelo Lineal General Multivariante /
Recibido: 07/10/2003. Aceptado: 14/01/2004.

Isidro Rafael Amaro. Doctor en Estadística, Universidad de Salamanca, España. Profesor,


Facultad de Ingeniería, Núcleo de Cagua, Universidad Central de Venezuela. Dirección: Facultad de Ingeniería, UCV. Cagua
2122, Estado Aragua, Venezuela. e-mail: amaror@hotmail.com
José Luis Vicente-Villardón. Doctor en Estadística, Universidad de Salamanca. Profesor, De-
partamento de Estadística, Universidad de Salamanca, España
María Purificación Galindo-Villardón. Doctora en Matemáticas, Universidad de Salamanca.
Directora, Departamento de Estadística, Universidad de Salamanca. España.

26 0378-1844/04/01/026-07 $ 3. 00/0 JAN 2004, VOL. 29 Nº 1


resultados presentados aquí puede en- ción de las matrices de medias cuya in- Las matrices Ci cam-
contrarse en Gabriel (1972, 1995), terpretación es semejante a la que se bian según las hipótesis a probar y, al
Mardia et al. (1979), Morrison (1978) hace en los Biplots clásicos. igual que las Ai, son matrices de 0 y 1
o Seber (1984). En las representaciones convenientemente ubicados.
de las medias conservamos la propiedad A partir de estos pro-
Manova-Biplot de que el eje maximiza la F para la hipó- ductos se calculan las mayores raíces
tesis estudiada y además podemos inter- características: c 1s, c 2s, c 3s y los esta-
El modelo MANOVA pa- pretar las medias en términos de patrones dísticos (c1s /1+c 1s) se buscan en la ta-
ra p variables, puede expresarse en forma geométricos que describiremos más ade- bla adecuada (tablas 6 al 14 del apén-
matricial como lante. dice en Morrison, 1978; y apéndice D4
en Seber, 1984), para finalmente apli-
X = AB + U (1)
Manova de Dos Vías car el criterio de la mayor raíz carac-
donde X denota la matriz n·p de las ob- terística.
servaciones, A es una matriz de diseño La diferencia en un MA-
apropiada de rango r, B es la matriz de NOVA de dos vías es que pueden contras- Manova-Biplot de Dos Vías
parámetros desconocidos, y la matriz U, tarse varias hipótesis, para los efectos
n·p, contiene los residuales. principales y para la interacción; asociados Se proponen 4 tipos de
La hipótesis lineal gene- con cada una de las hipótesis pueden Biplot para representar los resultados
ral multivariante es construirse distintas representaciones canó- de un MANOVA para un diseño de dos
nicas que permiten el estudio separado de vías, todos construidos a partir del Bi-
H0: CB = 0 (2)
cada una de ellas. plot de la matriz de parámetros del mo-
donde C, tiene dimensiones g·q y rango Si xijkh es la k-ésima ob- delo MANOVA: el primero que denomi-
g≤r. servación sobre la respuesta h obtenida namos Biplot Total; y, los otros tres:
La matriz C puede ele- bajo el i-ésimo tratamiento de la primera Biplot de interacción, de filas y de co-
girse de muchas formas distintas. Cam- vía de clasificación (fila) y el j-ésimo tra- lumnas.
biando la forma de C es posible construir tamiento de la segunda (columna), el mo- Cada uno con un obje-
Biplots para las distintas hipótesis a estu- delo lineal para cada observación es tivo particular, y que se diferencian, bá-
diar. Generalmente C contiene un conjun- sicamente, en la forma de escoger las
to de coeficientes para los contrastes. xijkh = µh + αih + τjh + ηijh + εijkh matrices R y en la descomposición
Un Biplot para la matriz donde µh: parámetro general de la res- inicial.
= C se puede construir a partir de la puesta h, h=1, ..., p; αih: efecto del trata-
Descomposición en Valores Singulares miento fila i sobre la respuesta h, i=1, ..., Biplot Total. En este caso R = (A’A)-1, =
Generalizada: r; τjh: efecto del tratamiento columna j (A’A)-1A’X, y C = I. Se sustituyen estas
R-½ E-½ = UDλV’ (3) sobre la respuesta h, j=1, ..., c; ηijh: efec- expresiones en (3) y se obtienen los res-
to de la interacción entre el tratamiento i pectivos marcadores para filas y colum-
-1
donde R = C(A’A) C y = C = y el j sobre la respuesta h, k=1, ..., n; y nas de las ecuaciones (4) y (5).
C(A’A)-1A’X, E es la matriz de suma de εijkh: término del error. Esto es equivalente a to-
cuadrados y productos ‘dentro’ de grupos, Ésto puede escribirse en mar todos los tratamientos (combinacio-
y los λs son los valores propios corres- forma matricial compacta como X = AB nes de niveles de los factores) y así se
pondientes según el proceso de Descom- + U, donde X = (rcn) · (p), A = (rcn) · trata el problema como el MANOVA de
posición en Valores Singulares. (r+1)(c+1), B = (r+c)(c+1) · (p), y U = una vía (Gabriel, 1995).
A partir de aquí se to- (rcn) · (p). Por lo tanto, el Mano-
man como marcadores para las filas a Llamando α i = (αi1, …, va-Biplot obtenido de esta forma tiene
αip)’, τ j = (τj1, …, τjp)’, y η ij = (ηij1, …, las mismas propiedades que el Mano-
P = R½UDλ (4) ηijp)’ las hipótesis de interés son va-Biplot de una vía. En particular nos
y como marcadores para las columnas a permite estudiar semejanzas y diferen-
H0 : α 1 = … = α r, no hay efecto fila cias entre grupos, que en este caso son
Q = E½V (5) H’0 : τ 1 = … = τ c, no hay efecto columna las combinaciones de niveles de los
H’’0 : η 11 = … = η rc = 0, no hay interac- factores; variables que más importan
de manera que ción en las comparaciones entre los grupos,
PQ’ = R½UDλV’E½ = R½R-½ E-½E½ = Para escribir estas hipó- la dirección de máxima separación en-
tesis en forma matricial compacta, CB = tre grupos, y las calidades de represen-
Esta descomposición 0, es necesario usar una matriz C distinta tación. Sin embargo, en general no es
puede interpretarse como una Descom- según la hipótesis que se quiere probar. la forma más adecuada para estudiar la
posición en Valores Singulares Generali- Morrison (1978) indica interacción, ni los efectos de filas y/o
zada de la matriz de estimadores de los que para probar estas hipótesis, usando el columnas, ya que muestra combinados
parámetros usando R-½ y E-½ como Principio de Unión-Intersección, se for- los efectos principales y la interacción.
métricas, de esta manera, el primer valor man los productos H1E-1 para efecto fila, En este tipo de Biplot,
propio de la descomposición Biplot coin- H2E-1para efecto columna, y H3E-1 para el eje es la combinación de variables
cide con el de MANOVA, y así se logran efecto interacción, donde que maximiza la parte controlada en el
las direcciones de máxima separación en- MANOVA, por lo que estará dominado
tre grupos. H i = X’A i(A’ iA i) -1C’ i[C i(A’ iA i) -1C’ i] -1
fundamentalmente por aquella parte en
Sin embargo, en general, Ci(A’iAi)-1A’iX (6)
la que el efecto sea más claro. No
el Biplot obtenido es difícil de interpre- y E = X’[I – A(A’A)-1A’]X obstante, el Biplot seguirá siendo útil
tar, por lo que se propone para el estudio para estudiar las características del
una representación alternativa, la proyec- donde A1 (rcn)·r, A2 (rcn)·c, A3 (rcn)·(rc) problema.

JAN 2004, VOL. 29 Nº 1 27


Biplot de Interacción. En este caso se sustitu- distancia explicada por la interacción, 1- El Biplot de filas es equivalente a la
yen R y en (3) por R = C3(A’3A3)-1C’3 y esto es obtención de las variables canónicas para
= C3(A’3A3)-1A’3X, donde A3 y C3 son la hipótesis de efecto de filas; por lo tan-
las matrices usadas en (6). P̄ P̄’ = X̄inE-½VV’E-½X̄’in = X̄inE-1X̄’in to, los ejes son aquellas combinaciones
Los marcadores para los lineales de las variables que maximizan
centroides de los grupos son P̄ = X̄inE-½V, 7- El Biplot de medias puede utilizarse la F de Snedecor para el efecto del factor
donde X̄in es la matriz de las medias de para estudiar la interacción mediante pa- fila.
las celdas que se expresa como X̄in = trones gráficos de forma similar a como 2- Este Biplot permite estudiar semejanzas
(A’3A3)-1A’3X. se utilizan los gráficos de interacción en y diferencias entre los grupos construidos
Los marcadores para las el análisis univariante. según el factor de clasificación por filas,
variables son Q = E½V y los marcadores Si x̄(ij),l representa la me- cuando el efecto es significativo.
para el conjunto de contrastes son P = dia de la variable l (l=1, ..., p) del grupo 3- Se pueden construir círculos de con-
R½UDλ . i,j-ésimo (i=1, ..., r), (j=1, ..., c), enton- fianza alrededor de los centroides de los
Las propiedades del ces, no existe interacción entre los dos grupos, de tal forma que si los círculos
Biplot de Interacción son: factores de variación si x̄(ij), l - x̄(ij’), l - x̄(i’j), l - no se interceptan el efecto del factor fila
1- El Biplot obtenido de esta forma es x̄(i’j’), l = 0, que sobre la representación es significativo. Si se interceptan es nece-
equivalente a la obtención de las varia- Biplot vienen aproximadas como p’ijql - sario hacer otras pruebas para estudiar la
bles canónicas para la hipótesis de in- p’ij’ql - p’i’jql + p’i’j’ql = (p’ij - p’ij’ - p’i’j significación.
teracción, es decir, los ejes son aque- + p’i’j’)ql para p y q tomados apropiada- 4- Se puede interpretar la importancia de
llas combinaciones lineales de varia- mente. Esta cantidad es aproximadamente las variables en la separación de los gru-
bles que maximizan la F de Snedecor cero si p’ij - p’ij’ = p’i’j - p’i’j’. pos, de manera análoga a como se hace en
para la interacción. Este hecho el Manova-Biplot de una vía.
nos permite la interpretación 5- La calidad de representación
de la interacción con máxima se estudia más adelante.
resolución, a diferencia del
Biplot Total que la combina Biplot de Columnas. En este caso
con los efectos principales. se sustituyen R y en (3) por R
2- El producto escalar p’kq = C2(A’2A2)-1C’2, y =
aproxima el contraste k-ésimo C2(A’2A2)-1A’2X. La matriz X̄co de
sobre la variable l y el producto las medias para columnas, se ex-
escalar p̄’(i,j)q aproxima la media presa como X̄co = (A’2A2)-1A’2X.
x̄(i,j)l de la combinación del nivel Los marcadores para los
i de las filas y el j de las colum- grupos son Pco1 = X̄coE-½V, y los
nas sobre la variable l. marcadores para las variables son
3- La bondad del ajuste para la Q = E½V.
representación de los contrastes El Biplot de Columnas tiene
será propiedades semejantes a las del
d r
Biplot de filas, solo que en este
Σj=1λj
2
/ Σj=1λ j
2 Figura 1. Representación de la interacción. caso se hacen comparaciones en-
tre los grupos que resultan del
factor columna.
y la bondad del ajuste para la representa- Para que estas cantida- Regiones de Confianza
ción de las medias no se calcula porque des sean aproximadamente iguales, los
el propósito de la representación es la in- cuatro marcadores fila correspondientes Se puede construir un intervalo de
terpretación de la interacción. han de formar un paralelogramo. Si no es confianza univariante sobre la proyección
4- Para cada uno de los contrastes, la lon- así, el efecto interacción puede estimarse de cada una de las medias en cada una
gitud al cuadrado del marcador aproxima como el vector que hay que trasladar uno de las variables. El estimador de la media
la distancia de Mahalanobis al vector nulo, de los puntos para que forme un paralelo- es
es decir, aproxima la desviación de la hi- gramo con los otros tres (Figura 1). x̄(ij),l = p’ij ql = proy (pij,ql)·||ql||
pótesis nula de igualdad a cero para ese La interacción será
contraste particular. máxima para aquellos vectores varia- por tanto, el intervalo puede calcularse
5- Las contribuciones calculadas en la bles paralelos al vector de interacción sobre las proyecciones directamente
forma habitual como el cociente entre la resultante, y mínima para los perpendi- como
coordenada al cuadrado y la suma de culares. proy (pij,ql) ± tj,a / √nij
cuadrados de las coordenadas para los ya que la longitud es la misma para to-
distintos ejes, puede interpretarse como la Biplot de Filas. En este caso R = dos los grupos. El intervalo construido de
parte de la desviación de la hipótesis C1(A’1A1)-1C’1, y = C1(A’1A1)-1A’1X. esta forma sirve para la proyección en
nula recogida por el eje. La matriz X̄fi de las me- cualquier dirección. Luego, en el espacio
6- En la proyección de las medias, la dias para filas, se expresa como X̄fi = multidimensional puede construirse una
longitud al cuadrado del marcador que (A’1A1)-1A’1X. hiperesfera de radio tj,a / √nij de forma
representa a una media aproxima tam- Los marcadores para los que, al proyectarla sobre cada variable,
bién la distancia de Mahalanobis al grupos son P̄fi = XfiE-½V y los marcadores obtenemos un intervalo de confianza uni-
vector nulo, pero la aproximación no para las variables son Q = E-½V. variante.
es óptima en relación a las medias. Las propiedades del Bi- La proyección de las
Puede interpretarse como la parte de la plot de Filas son: esferas de confianza sobre el espacio ca-

28 JAN 2004, VOL. 29 Nº 1


nónico en dimensión reducida produce con el mismo radio que el utilizado para parte del efecto del tratamiento recogida
una prueba conservadora en el sentido las medias. Si el círculo se cruza con el por el eje.
de que si las proyecciones no se cortan, del cuarto punto, el contraste no es signi-
se encuentran diferencias entre las me- ficativo. Aplicación
dias, pero si se cortan, puede ser un
efecto debido simplemente a la proyec- Calidad de Representación El siguiente ejemplo ha
ción. Con el software adecuado, se po- sido tomado de Seber (1984; página
drían obtener radios exactos en cada va- La calidad de represen- 460). Se ha realizado un experimento de
riable por separado, ajustando los radios tación en este caso se define en forma laboratorio para determinar el efecto de
de los círculos usando la calidad de re- análoga a como se define en el Biplot una infección de hongos sobre el creci-
presentación. clásico, esto es, el coseno al cuadrado miento de un determinado tipo de cés-
Las pruebas propuestas del ángulo que forma el vector que re- ped. Para el análisis, el grupo infectado
de esta forma sirven tanto para las medias presenta a una variable y uno de los ejes (GI) fue comparado con un grupo con-
de las celdas como para las medias de los es la correlación al cuadrado entre la va- trol (GC). El experimento se realizó a
efectos principales sin más que adecuar riable y el eje. temperaturas de 14, 18, 22, y 26ºC (T1,
los tamaños muestrales. Este coseno al cuadrado T2, T3 y T4; factor columna). Para cada
Los contrastes para la in- es la calidad de representación (CLRjt) tratamiento (factor fila) se midieron 6
teracción suelen realizarse para subtablas de la j-ésima variable sobre el eje t, si- réplicas.
dos por dos, tomando una categoría de fi- guiendo la terminología de la escuela Las variables observa-
las y una de columnas como base, y reali- Francesa. Esta cantidad puede ser calcu- das fueron peso de las raíces frescas
zando todas las comparaciones con ellas, lada a partir del producto interno del (g, X 1), longitud máxima de la raíz
tendríamos así (r-1)(c-1) comparaciones vector que representa al i-ésimo grupo y (mm, X2), y peso fresco de la parte aé-
posibles, que serán generalmente las que cualquier vector en la dirección del eje. rea (g, X 3) Todos los análisis fueron
se incluyan en la matriz C. Sea p = (pi1, …, pir)’, y et = (0, …, dt, realizados utilizando programas desa-
En el mismo sentido que …, 0) un vector en la dirección del eje rrollados por los autores bajo
antes, dado un contraste de medias de la t, entonces MATLAB versión 4.2.
forma Como paso previo al
CLRit = cos2(θt) = (p’iet)2 / (p’ipi)(e’tet) =
Ψ(i,j,i’,j’) = µ(i,j),l - µ(ij’),l - µ(i’j),l + µ(i’j’),l análisis, los datos fueron centrados
p2itd2t / Σp d = p2it / Σp
2 2 2
.
j i j j ij por columnas para eliminar el efecto
para cualquiera de las variables l, en el
La calidad de repre-
espacio global, el contraste se estima
sentación así definida es TABLA I
como
una medida aditiva que ANÁLISIS MULTIVARIANTE DE LA VARIANZA
= (pij - pij’ - pi’j + pi’j’)ql
(i,j,i’,j’) puede ser calculada para
es decir cualquier subespacio facto- Fuente Lambda Aproximación gl p-valor
proy[(pij - pij’ - pi’j + pi’j’), ql ] ||ql|| rial sumando las calidades Filas 0,765 9,7781 3 0,02055
de representación para los Columnas 0,0126 164,1014 9 0
Es necesario recordar ejes que forman el Interacción 0,8017 8,2883 9 0,50537
que la longitud de ql coincide con la va- subespacio. Además, es una Global 0,0105 184,5145 21 0
riabilidad dentro de los grupos para la medida relativa porque la
variable l. suma para todos los ejes es
El contraste es significati- 1. En una forma análoga pueden definir- común a todas las observaciones re-
vo si (i,j,i’,j’) ≥tj,α√(4/q)Sl cuando el diseño se calidades de representación para las presentado por la media global. El
es balanceado, es decir, si proy[(pij - pij’ - variables. centrado no modifica los resultados
pi’j + pi’j’), ql ] ≥tj,α√(4/q). Luego, la can- Una interpretación adi- de los análisis de la varianza univa-
tidad ≥tj,α√(4/q) puede ser utilizada como cional es: siguiendo a Lejeune y Calins- riantes o multivariantes, y es impor-
patrón de comparación del vector resul- ki (2000) la distancia al cuadrado de un tante para la obtención de las repre-
tante en el punto anterior. punto fila al origen, coincide con la dis- sentaciones canónicas, ya que si los
Si representamos direc- tancia de Mahalanobis a la fila nula y, datos no se centran, el primer eje
tamente los contrastes sobre el gráfico, por tanto puede entenderse como la des- mostrará solamente el desplazamiento
el contraste será significativo si el cír- viación de la hipótesis nula para esa fila del centro de gravedad de las nubes
culo de confianza no contiene al cero. (reacuérdese que la fila es un grupo o de puntos de las medias.
De la misma forma que en los casos un contraste entre grupos). De esta for- En primer lugar se rea-
anteriores, el contraste es conservador ma lo que hemos llamado contribución lizaron los análisis de la varianza para
en el sentido de que si la proyección relativa del factor al elemento (o la cali- cada una de las variables por separado
no contiene al cero hay significación, dad de representación) puede interpretar- y el análisis de la varianza multivarian-
mientras que si lo contiene, no esta- se como la parte de la desviación de la te (MANOVA). Los resultados del MA-
mos seguros, la significación puede es- hipótesis nula del grupo o el contraste NOVA se muestran en la Tabla I. Para
tar en otro eje. recogida por el eje canónico. el contraste multivariante se ha utiliza-
Otra forma de interpre- Cuando se trata directa- do la lambda de Wilks con la aproxi-
tar la interacción, pero ahora sobre el mente de las medias centradas en la for- mación χ2. Para todas las variables y
Biplot de medias, es que para cada una ma que se ha hecho en los puntos ante- para el caso multivariante se observa
de las subtablas 2x2 representadas en el riores, la longitud al cuadrado es la dis- que no se detecta interacción significa-
gráfico por cuatro puntos, se toman tres tancia de Mahalanobis con respecto a la tiva y se detectan efectos fila y colum-
de ellos y se busca el punto sobre el que media global, es decir, mide el efecto na significativos. En el contraste multi-
formarían un paralelogramo; sobre este (multivariante) del correspondiente trata- variante el efecto fila es significativo
punto se coloca un círculo de confianza miento. La contribución es, entonces, la solamente al 5%.

JAN 2004, VOL. 29 Nº 1 29


TABLA II TABLA III En la Figura 3 se ha re-
VALORES PROPIOS, INERCIAS E CALIDADES DE LA REPRESENTACIÓN presentado el efecto interacción para algu-
INERCIAS ACUMULADAS PARA EL DE LAS MEDIAS EN LA PROYECCIÓN nas de las subtablas 2x2, en concreto,
BIPLOT CANÓNICO DE INTERACCIÓN SOBRE EL BIPLOT DE INTERACCIÓN como la interacción tiene 3 grados de li-
bertad, en tres subtablas que descomponen
Eje Valores Porcentaje Inercia Grupos Eje 1 Eje 2 Acumulada el efecto en tres partes independientes, uti-
propios de inercia acumulada lizando las últimas categorías de ambos
T1-GC 3,1963 44,2412 47,4375
1 5,8399 79,1750 79,1750 T2-GC 94,3761 0,0173 94,3935 factores de variación como base para las
2 2,9939 20,8084 99,9833 T3-GC 23,1342 24,3144 47,4486 comparaciones, de la misma forma que se
3 0,0847 0,0167 100,0000 T4-GC 7,3722 45,9505 53,3227 hace con los contrastes.
T1-GI 3,2933 44,1634 47,4567 En un diseño balancea-
T2-GI 69,5029 6,9569 76,4598 do como es el caso, el efecto resulta
T3-GI 9,1085 57,3411 66,4495 significativo si la longitud del vector,
Biplot de interacción. La interacción, a T4-GI 30,5940 37,0271 67,6211 en alguna de las proyecciones sobre
pesar de no resultar significativa, nece- las variables o sobre los ejes, es
sita tres dimensiones para ser repre- aproximadamente el doble del radio
sentada, si bien las dos primeras reco- del círculo de confianza alrededor de
gen el 99,98% de la información (Ta- ción se hace tomando tres puntos cua- las medias. Por esta razón, se ha situa-
bla II). Junto con los contrastes de in- lesquiera de la subtabla y calculando do sobre el punto que cierra el para-
teracción, es posible la representación la posición que tendría el cuarto punto lelogramo, un círculo de confianza con
de la proyección de las medias de los para que formaran un paralelogramo. el mismo radio. El efecto será signifi-
tratamientos sobre el Biplot (Figura 2) La distancia entre el punto real y el cativo si este círculo y el del cuarto
lo que permite la interpretación del Bi- punto teórico mide el efecto de la in- punto de la tabla no se cruzan. El con-
plot en términos más intuitivos, al ba- teracción para dicha subtabla. traste para una variable particular se
sarse en las medias directa- hará proyectando los círculos
mente en lugar de combinacio- sobre la dirección adecuada.
nes lineales (contrastes) de las Sobre el gráfico se han
mismas. A la vista del gráfico sombreado los círculos corres-
observamos que la variable X 1 pondientes a los puntos que cie-
está asociada fundamentalmen- rran los paralelogramos que, en
te con el primer eje, es decir, todos los casos, se cruzan con
está directamente relacionada los círculos que representan a la
con la dirección del espacio en celda restante de la subtabla.
la que la interacción es mayor. Como los círculos se cruzan so-
Para las otras dos la asociación bre el espacio global, también
no es tan clara. se cruzarán en las proyecciones
Es posible también calcular sobre cualquiera de las direccio-
las calidades de la representa- nes del mismo.
ción de las medias sobre esta re- Si, en lugar de interpretar
presentación, haciendo notar que las interacciones, queremos in-
la aproximación de las mismas terpretar las medias de los gru-
no es óptima sobre este Biplot, pos, el Biplot a utilizar es dife-
que fue calculado para represen- Figura 2. Proyección de las medias de los grupos sobre el rente, será el que en la parte
tar los contrastes de interacción Biplot de interacción. teórica hemos denominado
(Tabla III). Biplot Total. El Biplot Total
La interpretación de la in- busca las direcciones que más
teracción sobre el Biplot de separan a las medias del con-
medias necesita alguna aclara- junto total de tratamientos y
ción ya que no es tan sencilla contiene los efectos combinados
como la relativa a los contras- de los factores principales y las
tes. En la Figura 2 se muestra interacciones.
la interpretación de algunos de
los posibles contrastes. Dada Biplot Total. Los valores pro-
una subtabla 2x2 cualquiera, es pios, inercias e inercias acumu-
decir, seleccionando dos nive- ladas para el Biplot Total se
les del factor fila y dos niveles muestran en la Tabla IV. Los
del factor columna, y obtenien- dos primeros ejes absorben
do la subtabla de medias co- prácticamente el 100% de la va-
rrespondiente, la interpretación riabilidad entre medias, por lo
es que a cada una de las cel- que las diferencias pueden in-
das de la tabla le corresponde terpretarse en el primer plano
un punto sobre el gráfico. Si principal.
no existe interacción, los 4 La representa-
puntos asociados deberían estar Figura 3. Cálculo de los efectos de interacción a partir de las ción total (Figura 4) será útil
sobre un paralelogramo. La de- medias proyectadas sobre el Biplot de interacción. Sobre el gráfi- para la interpretación directa de
terminación del efecto interac- co se ha representado con una flecha el efecto en cada caso. las medias de los grupos, aun-

30 JAN 2004, VOL. 29 Nº 1


TABLA IV TABLA V
VALORES PROPIOS, INERCIAS E CALIDADES DE REPRESENTACIÓN DE LAS MEDIAS POR GRUPOS
INERCIAS ACUMULADAS PARA EL Y VARIABLES EN EL BIPLOT TOTAL
BIPLOT TOTAL
Grupos Eje 1 Eje 2 Acumulada Variables Eje 1 Eje 2 Acumulada
Eje Valores Porcentaje Inercia
T1-GC 99,6858 0,3129 99,9987 X1 77,0349 22,9651 100,0000
propios de inercia acumulada
T2-GC 8,0247 91,7094 99,7341 X2 77,5299 22,4324 99,9623
1 120,1159 98,3906 98,3906 T3-GC 84,4923 14,7232 99,2156 X3 98,4058 1,5942 100,0000
2 15,3571 1,6083 99,9989 T4-GC 84,7892 15,1628 99,9520
3 0,4073 0,0011 100,0000 T1-GI 99,6542 0,3445 99,9987
T2-GI 40,1811 59,6367 99,8178
T3-GI 94,2286 2,6050 96,8336
T4-GI 57,1625 42,7607 99,9232
que como la calidad de la representación
es buena servirá también para interpretar
las interacciones y los efectos principales. parece que el efecto de la infección no es nor que en el Biplot específico, que no
En la Tabla V se mues- muy grande. Si aparecen diferencias cla- se realiza aquí porque la dimensión
tran las calidades de la representación ras entre las distintas temperaturas, espe- efectiva para filas es 1 y no tiene sen-
para las medias y para las variables. To- cialmente entre la más baja y las demás. tido una representación plana.
Las variables no se si- Puede comprobarse que
túan paralelas a ningu- las calidades de la representación son
no de los ejes, y todas elevadas y que, sobre el gráfico, se ob-
ellas tienen direcciones serva la pequeña diferencia que existe
casi paralelas, por lo entre el control y la infección por hon-
que el efecto de los gos, como cabría esperar del hecho de
tratamientos parece te- que el efecto fila es significativo solo
ner el mismo sentido al 5%.
en todas ellas. Cabe También es posible la
destacar que parecen proyección de las medias de las colum-
más asociadas al se- nas sobre el Biplot Total, pero la calidad
gundo eje, aunque las
calidades de represen- TABLA VI
tación son mayores ABSORCIÓN DE INERCIA Y VALORES
para el primero. Esto PROPIOS PARA EL BIPLOT DE
es así porque las cali- COLUMNAS
dades de representación
se han calculado sobre Eje Valores Porcentaje Inercia
Figura 4. Representación de las medias en el Biplot Total
las coordenadas princi- propios de inercia acumulada
pales, mientras que en
la representación se 1 279,5514 98,8244 98,8244
han tomado como co- 2 30,4903 1,1756 100,0000
ordenadas estándar pa- 3 0,1483 0,0000 100,0000
ra mantener la interpre-
tación Biplot de las
proyecciones. de representación es menor que en el
Utilizando la in- Biplot de Columnas que se muestra a
terpretación habitual continuación.
del Biplot mediante
proyección de las me- Biplot de columnas. La absorción de
dias sobre las variables, inercia para el Biplot de columnas se
las temperaturas inter- muestra en la Tabla VI. Aunque, en
medias presentan valo- principio, la dimensión del problema
res más altos de las va- es 3, los dos primeros ejes recogen
riables mientras que las prácticamente el 100% de la variabili-
extremas presentan va- dad de las medias de columnas, por lo
lores más bajos. Esto que las diferencias entre las columnas
sugiere una curva de pueden interpretarse sobre el primer
Figura 5. Representación de las medias de filas en el Biplot total. respuesta cuadrática, de plano, ya que las calidades de repre-
la misma forma que sentación para todas ellas será prácti-
das ellas, tanto para las medias como aparece en la explicación original de camente del 100%.
para las variables, son altas, por lo que Seber (1984). Las calidades de la re-
pueden interpretarse sobre la Figura 4. Sobre el Biplot Total presentación de las variables en rela-
De la representación se deduce que, para pueden proyectarse las medias de las ción a las medias de columnas se
una misma temperatura, los puntos co- filas (Figura 5) realizando las corres- muestran en la Tabla VII y son prácti-
rrespondientes al control y la infección pondientes interpretaciones, aunque la camente del 100% para todas ellas. El
están cercanos en el gráfico, por lo que calidad de las representaciones sea me- gráfico correspondiente (Figura 6)

JAN 2004, VOL. 29 Nº 1 31


TABLA VII bría ninguna dificultad para adaptar los
CALIDADES DE REPRESENTACIÓN DE LAS COLUMNAS Y VARIABLES EN círculos utilizando, por ejemplo la co-
EL BIPLOT DE LAS COLUMNAS rrección de Bonferroni o cualquier otra
de las utilizadas para comparaciones
Grupos Eje 1 Eje 2 Acumulada Variables Eje 1 Eje 2 Acumulada
múltiples.
T1 99,6234 0,3748 99,9982 X1 81,6214 18,3786 100,0000 Aunque los intervalos
T2 13,2106 86,2463 99,4569 X2 83,4358 16,5632 99,9990 de confianza hayan sido calculados
T3 92,0380 7,7795 99,8175 X3 98,8201 1,1799 100,0000 para el supuesto univariante, serían vá-
T4 72,4175 27,5707 99,9882 lidos para las proyecciones en cual-
quiera de las direcciones del espacio
de la representación por lo que, de al-
guna manera, pueden considerarse tam-
de que no lo sea. El bién como regiones de confianza mul-
Biplot de medias glo- tivariantes apelando al principio de
bales puede utilizarse unión-intersección.
como paso intermedio Los conceptos clási-
para cualquiera de las cos de contribución relativa del factor
situaciones descritas, al elemento y de calidad de representa-
ya que permite inter- ción han sido generalizados para los
pretar el problema en distintos Manova-Biplot y pueden ser
términos de las medias interpretados sobre los gráficos en tér-
de las celdas. minos de desviación de las respectivas
Hay que tener en hipótesis nulas.
cuenta que cualquiera En la representación
de las matrices de me- Manova-Biplot Total, la longitud del
dias puede ser proyec- vector que representa a cada una de
tada sobre cualquiera las medias se corresponde con la dis-
de los Biplots propues- tancia de Mahalanobis entre la media
tos pero que, en cada del grupo que representa y la media
caso, la aproximación global. Por tanto, la contribución del
Figura 6. Representación de las medias de columnas en el es óptima solamente factor al elemento en esta representa-
Biplot de columnas para algunas de las re- ción es la parte de la desviación de la
presentaciones. hipótesis nula, de que no existe ningún
muestra la significación del factor co- Cuando el número de niveles de efecto, recogida por el factor.
lumna en la separación de los grupos: cada uno de los factores no es muy
ninguno de los círculos se intercepta, elevado, todas las representaciones REFERENCIAS
por lo que el efecto temperatura es producirán resultados similares y la
significativo. También se observa, de más útil de ellas será probablemente el Gabriel KR (1971) The Biplot graphic display of
nuevo, la tendencia cuadrática. Biplot Total, ya que todas las proyec- matrices with applications to principal com-
ponents analysis. Biometrika 58: 453-467.
ciones estarán bien representadas. Ade-
Discusión más, la interpretación del Biplot de las Gabriel KR (1972) Analysis of meteorological
medias de las celdas estará dominada data by means of canonical decomposition
and Biplots. J. Appl. Meteorol. 11: 1071-
Se han mostrado dis- por los efectos más importantes. 1077.
tintas representaciones que pueden re- Es posible representar
sultar útiles para la interpretación de sobre los gráficos Biplot círculos de Gabriel KR (1995) MANOVA Biplots for two-
los resultados de un MANOVA y per- confianza multivariantes que muestran, way contingency tables. En Krzanowski W
(Ed.) Recent Advances in Descriptive Multi-
miten conocer las razones por las que de forma aproximada, diferencias sig- variate Analysis. Clarendon Press. Oxford,
se rechaza la hipótesis nula, de igual- nificativas entre los grupos, o contras- RU. pp. 227-268.
dad a cero, del conjunto de contrastes. tes, cuando su intersección es nula. En
Teniendo en cuenta particular cuando la intersección en la Gower JC, Hand DJ (1996) Biplots. Chapman and
Hall. Londres, RU. 277 pp.
que el Análisis Multivariante de la Va- proyección de una variable concreta es
rianza de dos vías puede ser expresado vacía, es posible afirmar que existen Lejeune M, Calinski T (2000) Canonical analysis
como caso particular del Modelo Li- diferencias significativas para esa va- applied to multivariate analysis of variance. J.
Multivar. Anal. 72: 100-119.
neal General Multivariante, se ha gene- riable.
ralizado el Manova-Biplot de una vía, Todos los intervalos de Mardia KV, Kent JT, Bibby JM (1979) Multivari-
propuesto por Gabriel (1972), al caso confianza mostrados en los gráficos ate Analysis. Academic Press. Londres, RU.
de dos vías, en el que es posible llevar corresponden, en realidad, a situacio- 521 pp.
a cabo cuatro formas de Manova- nes univariantes para cada una de las Morrison DF (1978) Multivariate Statistical Meth-
Biplot: Manova-Biplot Total, Manova- variables; es decir, muestran intervalos ods. McGraw-Hill. Londres, RU. 415 pp.
Biplot para filas, Manova-Biplot para de confianza para las proyecciones de Seber GA (1984) Multivariate Observations.
columnas y Manova-Biplot de interac- los círculos sobre los vectores que re- Wiley. Nueva York, EEUU. 712 pp.
ción. presentan a las variables. En ningún
El procedimiento habi- caso se ha realizado corrección alguna Vicente-Villardón JL (1992) Una alternativa a
las técnicas factoriales clásicas basada
tual de análisis consistirá en estudiar la para las posibles comparaciones múlti- en una generalización de los métodos
interacción, en caso de que sea signifi- ples, ya que se trata de una aproxima- Biplot. Tesis. Universidad de Salamanca.
cativa y los efectos principales en caso ción general casi descriptiva. No ha- España. 248 pp.

32 JAN 2004, VOL. 29 Nº 1

View publication stats

También podría gustarte