Está en la página 1de 9
A 11.6.2 Anilisis con los datos en una eseala transformada En muchas ocasiones la heterogeneidad de las varianzas viene acompatiad: y es reflejo, de una no Normalidad de los datos (e incluso de la presencia de i | anova es de dos vias). Por ejemplo, con obseryaciones de Pois- son Ia efectividad de los tratamientos implica una variabilidad de las medias 2 de cada poblaci6n y, por consiguiente, de las varianzas (que también son A en dicha distribuci6n). Para tales situaciones hay ciertas formas de teansformar los datos que tienden a conventirlos por un lado en Normales y, por otro, a hacer homogéneas las varianzas (y eliminar las interacciones, llegado el caso). Si re- cordamos lo indicado en In seccién 4.9, a los efectos actuales pueden darse las siguientes reglas: 7° Regia; Cuando la varianza de x sea proporcional a la media de x sustituir los valores x por Vx (iransformacién de la ratz cuadrada), aunque evando al gunos datos son pequefios es mas efectivo cambiar x por Jx-+1. Asf se hard en particular para datos de Poisson -aunque la segunda expresién de (4.35) sugiere otra transformacién mejor-, en cuyo caso la varianza es de Vs. 2° Regia: Cuando la varianza de x sea proporcional al cuadrado de la media de x sustituir los valores x por In x, aunque cuando haya datos iguales a cero de- berd cambiarse x por In (x-+1) (transformacién logaritmica). Asi se hard cn particular para datos siguiendo la distribucién log-Normal o una distribu- cin con asimetrfa positiva (eola larga a la derecha). La base del logaritmo a utilizar es indiferente (decimal, neperiano,...) y la varianza asintética es siempre la misma: 2(n-1). ANALISIS DE. LA VARIANZA 461 3* Regla; Cuando los dates x sean proporciones procedentes de Binomiales, con tamafios n, no demasiado diferentes, sustituir los valores x por arc sen x. (transformacion del arco sen o angular), aunque cuando n<50 las propor- ciones cero deben sustituitse por 1/4n y las proporciones 1 por (n—1/4yin antes de transformar en Angulos, Cuando todas las proporciones estdn entre 0,3 y 0,7 el método no es necesario. Si la variable transformada se mide, en radianes Ia varianza asintética es 1/4n; si se mide en grades es 8.100/na* g& es el tamaiio de muestra comin en que estén basadas las proporciones). La segunda expresi6n de (4.56) sugiere otra transformacién mejor. Las transformaciones anteriores, que junto con otras son Hamadas de modo general sransformaciones estabilizadoras de ta varianza, persiguen todas ellas un mismo fin: hacer homogéneas las varianzas. Asi, en el tercer caso, sabemos que la varianza de una proporcién Binomial de media p es pqfn, variando en consecuencia la varianza con la media. embargo, como la varianza tras la transformacién ¢s L/4n entonces Jas varianzas serén cstables sin cs sicmpre el mismo ntimero. En otro caso es preciso utilizar métodos especiales que no se dan aqu{ (ver Snedecor and Cochran, 1980). Nétese gue las transformaciones anteriores se utilizan en el caso de que Ja varianza vane: con la media. Tal ten- dencia sistematica es especialmente peligrosa y contra ella se ha alertado al lec- tor en secciones anteriores. La transformacisn logaritmica se ha dicho que estabiliza las varianzas de los datos que tienen un coeficiente de variacién censtante, pero la transforma- cién suele tener otro efecto beneficioso: convierte los efectos proporcionales en aditivos, esto cs, hace desaparecer las interacciones. El modelo de anova ut zado asume que un tratamiento puede ser mejor que otro en una cantidad cons- tante de, digamos, 20 unidades, y asf los efectos son aditivos; cuando un trata- Miento es mejor que otro en, digamos, un 20% del valor del primero, los efectos. son proporcionales, pero al tomar logaritmos se convierten en aditivos. El Pro- blema 11.1 presenta un ejemplo de esta situacién. B Un primer ejemplo es cl de la Tabla 11.22(a). Como los datos de cada casilla aluden a proporciones de una Binomial (el que se expresen en % es cir- cunstancial) es apropiada la transformacién angular, pues los n; son aproxima- damente iguales (de 34 a 38). La parte (b) presenta los valores transformados. Por ojemplo, para la primera casilla arc sen (0,424)"* = 40,6°. La parte (c) reali- za el anova de dos vias usual (aunque, equivalentemente, podria haberse reali- zado una comparacién de dos medias con muestras apareadas, dado que sélo hay dos tratamientos). Se observa que hay diferencias entre los tratamientos (cl primero es mejor que cl segundo) y alguna evidencia de diferencias entre hospi- tales (aunque la validez de esto ultimo esta condicionada por la no presencia de interaccidn). Si esos hespitales son objeto de interés especifico, el modelo es el Ty los dos tests ; serin vilides sdlo si las interacciones estén ausentes. Sin em- bargo la transformacién angular no solo hace homogéneas las varianzas sino que también tiende a anular las posibles interacciones, pudiendo fiarnos de las conclusiones anteriores. El lector puede ya realizar la comparacién de los hospi- tales de dos en dos. Si los datos de la tabla provienen realmente de Binomiales, la varianza de- berfa ser 8100/362" = 22,8 (con 36 el promedio de individuos por grupo), valor no demasiado diferente de la estimacién muestra! s3,=21,94 que proporciona el anova, El modelo Binomial se ajusta bien. En otro caso serfa conveniente loca- ir Ta causa del fallo (muy probablemente se deberia a la no aditividad). Tabla 11.22 (a) Poreentaje de curaciones de diez grupos de entre 34 y 38 Individuos someildos a das tratamientos en cinco hospliates distintes. Hospital : Pratamiento 2 “ g us = T mil 35 | 553 t 50) 263 | 302 (b) Angulos en grados = are sen /proporcion (en tantos por uno) Hospital] [Pratamiiento A 6 C DE | Totat 389 48,2 1 06 358 2A u 352 35.2 309333. Total 58 70 423 698 BLS (e) Andilisis de tn varianza para los datos en graces. 206.12 939 M447 5.22 21.94 En realidad, cada hospital da lugar a una Tabla 2x2 con los tratamientos en filas y el S10 el NO curado en columnas. Los 5 hospitales proporcionan por tanto 3 tablas 2x2 cuyo andlisis global se ha emprendido aquf por la técnica de anova en lugar de por la técnica del andlisis de varias tablas 2x2. El enfoque ac- tual es ventajoso pues pone a disposicién del investigador toda la potente meto- dologia del andlisis de la varianza (aunque mas adelante se vera que los datos también son analizables mediante la técnica de regresién logistica de 12.5), c La Tabla 11.23 presenta los datos de un segundo ejemplo. De los datos de la parte (a) se desprende que las medias allas vienen acompaiiadas de amplitu- des (y por tanto varianzas) altas, por lo que las varianzas no son homogéneas y Ja téenica de anova no es aplicable. Esto era evidente de antemano pues los da- tos son de Poisson, y asf la transformacién apropiada es la de la rafz cuadrada. Efectudndola, los nuevos datos, redondeados en un solo decimal para simplifi- car, se presentan en la parte (b) de dicha tabla, pudiendo observarse cémo las amplitudes son mas homogéneas en la nueva escala: el cociente entre a miixima y la mfnima de ellas en Ja tabla (a) es 20/7=2,9 contra sélo 1 ,3/0,7=1,9 en la (b). Por otro lado, si los datos fueran de Poisson Ja varianza en la escala transforma- da deberia ser 0,25; como la estimaci6n de ella es 5520, 14, regularmente lejana del 0,25 ideal, pudiera ser que los datos no fueran de Poisson. Sin embargo, uti- lizando el test de (7.20) para contrastar Hp = 9, = =0,25 el lector puede probar que tal hip6tesis es aceptable y, de rechazo, que los datos pueden ser de Poisson. La parte (c) de la tabla presenta el anova de dos vias, indicando que hay di- ferencias entre trimestres pero no entre ciudades. Sean las ciudades un factor fi- jo (Modelo I) 0 aleatorio (Modelo Mixto) la segunda afirmacién, por tratarse de una no significacién, solo ser valida si las interacciones estén ausentes, pero la primera es fiable en cualquier caso. ANALISIS. DE LA VARIANZA 463 Si el Modelo es el Mixto puede estudiarse a qué es debida la significncién i Ja tabla (d) efecttia todas las camparaciones por parejas por cl método clisico encontrando que I # Hx (IIf=1V) y asf Ia prevalencia de 1a en- fermedad aumenta en el primer semestre del aio y Se estabiliza en el segunda. Tabla 11.23 Ka) Némero de Individues, catia tres meses ¥ en cuatro chudades distintas, son una eierta onfermedad oeular rara. Frimeste Gf a T wa 50 | sae 1 Ti a | iss a 2 so | 485 Ww aa 4s | a5 {c) Anilisis de ta yarianca para. los dates transformades. (Facnte ah fi Fag Sigaifficaciin [Bineee eeinnestres 3 760 54.25 1 Entre ciudades 3 ol NO. [Dentro 3 on gis {d) Todas las comparaciones por parcjus: Méoda de Newsan-Keuls, Trimeaires iv Tir 7 WT Medias ) Aas 188. 518 785

También podría gustarte