A
11.6.2 Anilisis con los datos en una eseala transformada
En muchas ocasiones la heterogeneidad de las varianzas viene acompatiad:
y es reflejo, de una no Normalidad de los datos (e incluso de la presencia de i
| anova es de dos vias). Por ejemplo, con obseryaciones de Pois-
son Ia efectividad de los tratamientos implica una variabilidad de las medias 2
de cada poblaci6n y, por consiguiente, de las varianzas (que también son A en
dicha distribuci6n). Para tales situaciones hay ciertas formas de teansformar los
datos que tienden a conventirlos por un lado en Normales y, por otro, a hacer
homogéneas las varianzas (y eliminar las interacciones, llegado el caso). Si re-
cordamos lo indicado en In seccién 4.9, a los efectos actuales pueden darse las
siguientes reglas:
7° Regia; Cuando la varianza de x sea proporcional a la media de x sustituir los
valores x por Vx (iransformacién de la ratz cuadrada), aunque evando al
gunos datos son pequefios es mas efectivo cambiar x por Jx-+1. Asf se
hard en particular para datos de Poisson -aunque la segunda expresién de
(4.35) sugiere otra transformacién mejor-, en cuyo caso la varianza es de Vs.
2° Regia: Cuando la varianza de x sea proporcional al cuadrado de la media de x
sustituir los valores x por In x, aunque cuando haya datos iguales a cero de-
berd cambiarse x por In (x-+1) (transformacién logaritmica). Asi se hard cn
particular para datos siguiendo la distribucién log-Normal o una distribu-
cin con asimetrfa positiva (eola larga a la derecha). La base del logaritmo
a utilizar es indiferente (decimal, neperiano,...) y la varianza asintética es
siempre la misma: 2(n-1).ANALISIS DE. LA VARIANZA 461
3* Regla; Cuando los dates x sean proporciones procedentes de Binomiales, con
tamafios n, no demasiado diferentes, sustituir los valores x por arc sen x.
(transformacion del arco sen o angular), aunque cuando n<50 las propor-
ciones cero deben sustituitse por 1/4n y las proporciones 1 por (n—1/4yin
antes de transformar en Angulos, Cuando todas las proporciones estdn entre
0,3 y 0,7 el método no es necesario. Si la variable transformada se mide, en
radianes Ia varianza asintética es 1/4n; si se mide en grades es 8.100/na* g&
es el tamaiio de muestra comin en que estén basadas las proporciones). La
segunda expresi6n de (4.56) sugiere otra transformacién mejor.
Las transformaciones anteriores, que junto con otras son Hamadas de modo
general sransformaciones estabilizadoras de ta varianza, persiguen todas ellas
un mismo fin: hacer homogéneas las varianzas. Asi, en el tercer caso, sabemos
que la varianza de una proporcién Binomial de media p es pqfn, variando en
consecuencia la varianza con la media. embargo, como la varianza tras la
transformacién ¢s L/4n entonces Jas varianzas serén cstables sin cs sicmpre el
mismo ntimero. En otro caso es preciso utilizar métodos especiales que no se
dan aqu{ (ver Snedecor and Cochran, 1980). Nétese gue las transformaciones
anteriores se utilizan en el caso de que Ja varianza vane: con la media. Tal ten-
dencia sistematica es especialmente peligrosa y contra ella se ha alertado al lec-
tor en secciones anteriores.La transformacisn logaritmica se ha dicho que estabiliza las varianzas de
los datos que tienen un coeficiente de variacién censtante, pero la transforma-
cién suele tener otro efecto beneficioso: convierte los efectos proporcionales en
aditivos, esto cs, hace desaparecer las interacciones. El modelo de anova ut
zado asume que un tratamiento puede ser mejor que otro en una cantidad cons-
tante de, digamos, 20 unidades, y asf los efectos son aditivos; cuando un trata-
Miento es mejor que otro en, digamos, un 20% del valor del primero, los efectos.
son proporcionales, pero al tomar logaritmos se convierten en aditivos. El Pro-
blema 11.1 presenta un ejemplo de esta situacién.B Un primer ejemplo es cl de la Tabla 11.22(a). Como los datos de cada
casilla aluden a proporciones de una Binomial (el que se expresen en % es cir-
cunstancial) es apropiada la transformacién angular, pues los n; son aproxima-
damente iguales (de 34 a 38). La parte (b) presenta los valores transformados.
Por ojemplo, para la primera casilla arc sen (0,424)"* = 40,6°. La parte (c) reali-
za el anova de dos vias usual (aunque, equivalentemente, podria haberse reali-
zado una comparacién de dos medias con muestras apareadas, dado que sélo
hay dos tratamientos). Se observa que hay diferencias entre los tratamientos (cl
primero es mejor que cl segundo) y alguna evidencia de diferencias entre hospi-
tales (aunque la validez de esto ultimo esta condicionada por la no presencia de
interaccidn). Si esos hespitales son objeto de interés especifico, el modelo es el
Ty los dos tests ; serin vilides sdlo si las interacciones estén ausentes. Sin em-
bargo la transformacién angular no solo hace homogéneas las varianzas sino
que también tiende a anular las posibles interacciones, pudiendo fiarnos de las
conclusiones anteriores. El lector puede ya realizar la comparacién de los hospi-
tales de dos en dos.
Si los datos de la tabla provienen realmente de Binomiales, la varianza de-
berfa ser 8100/362" = 22,8 (con 36 el promedio de individuos por grupo), valor
no demasiado diferente de la estimacién muestra! s3,=21,94 que proporciona elanova, El modelo Binomial se ajusta bien. En otro caso serfa conveniente loca-
ir Ta causa del fallo (muy probablemente se deberia a la no aditividad).
Tabla 11.22
(a) Poreentaje de curaciones de diez grupos de entre 34 y 38 Individuos
someildos a das tratamientos en cinco hospliates distintes.
Hospital :
Pratamiento 2 “ g us =
T mil 35 | 553
t 50) 263 | 302
(b) Angulos en grados = are sen /proporcion (en tantos por uno)
Hospital]
[Pratamiiento A 6 C DE | Totat
389 48,2
1 06 358 2A
u 352 35.2 309333.
Total 58 70 423 698 BLS
(e) Andilisis de tn varianza para los datos en graces.
206.12 939
M447 5.22
21.94En realidad, cada hospital da lugar a una Tabla 2x2 con los tratamientos en
filas y el S10 el NO curado en columnas. Los 5 hospitales proporcionan por
tanto 3 tablas 2x2 cuyo andlisis global se ha emprendido aquf por la técnica de
anova en lugar de por la técnica del andlisis de varias tablas 2x2. El enfoque ac-
tual es ventajoso pues pone a disposicién del investigador toda la potente meto-
dologia del andlisis de la varianza (aunque mas adelante se vera que los datos
también son analizables mediante la técnica de regresién logistica de 12.5),c La Tabla 11.23 presenta los datos de un segundo ejemplo. De los datos de
la parte (a) se desprende que las medias allas vienen acompaiiadas de amplitu-
des (y por tanto varianzas) altas, por lo que las varianzas no son homogéneas y
Ja téenica de anova no es aplicable. Esto era evidente de antemano pues los da-
tos son de Poisson, y asf la transformacién apropiada es la de la rafz cuadrada.
Efectudndola, los nuevos datos, redondeados en un solo decimal para simplifi-
car, se presentan en la parte (b) de dicha tabla, pudiendo observarse cémo las
amplitudes son mas homogéneas en la nueva escala: el cociente entre a miixima
y la mfnima de ellas en Ja tabla (a) es 20/7=2,9 contra sélo 1 ,3/0,7=1,9 en la (b).
Por otro lado, si los datos fueran de Poisson Ja varianza en la escala transforma-
da deberia ser 0,25; como la estimaci6n de ella es 5520, 14, regularmente lejana
del 0,25 ideal, pudiera ser que los datos no fueran de Poisson. Sin embargo, uti-
lizando el test de (7.20) para contrastar Hp = 9, = =0,25 el lector puede probar que
tal hip6tesis es aceptable y, de rechazo, que los datos pueden ser de Poisson.
La parte (c) de la tabla presenta el anova de dos vias, indicando que hay di-
ferencias entre trimestres pero no entre ciudades. Sean las ciudades un factor fi-
jo (Modelo I) 0 aleatorio (Modelo Mixto) la segunda afirmacién, por tratarse de
una no significacién, solo ser valida si las interacciones estén ausentes, pero la
primera es fiable en cualquier caso.ANALISIS. DE LA VARIANZA 463
Si el Modelo es el Mixto puede estudiarse a qué es debida la significncién
i Ja tabla (d) efecttia todas las camparaciones por parejas por cl
método clisico encontrando que I # Hx (IIf=1V) y asf Ia prevalencia de 1a en-
fermedad aumenta en el primer semestre del aio y Se estabiliza en el segunda.
Tabla 11.23
Ka) Némero de Individues, catia tres meses ¥ en cuatro chudades distintas,
son una eierta onfermedad oeular rara.
Frimeste Gf a
T wa 50 | sae
1 Ti a | iss
a 2 so | 485
Ww aa 4s | a5
{c) Anilisis de ta yarianca para. los dates transformades.
(Facnte ah fi Fag Sigaifficaciin
[Bineee eeinnestres 3 760 54.25 1
Entre ciudades 3 ol NO.
[Dentro 3 on gis
{d) Todas las comparaciones por parcjus: Méoda de Newsan-Keuls,
Trimeaires iv Tir 7 WT
Medias ) Aas 188. 518 785