Está en la página 1de 5

En los temas precedentes hemos estudiado contrastes de hiptesis sobre la

media que se corresponden con diseos realizados con uno y dos grupos
(tanto si se trata de dos grupos independientes como de dos grupos
relacionados). Sin embargo, no siempre nos encontramos con diseos tan
simples. Con mucha frecuencia, lo que tenemos que comparar son ms de
dos grupos pues ello nos dar una idea ms amplia de la relacin que se
pueda establecer entre nuestras variables. En este caso se utiliza el Anlisis
de Varianza
Ejemplo 5.1. En este caso vamos a trabajar con tres grupos porque,
adems de estar interesados en si el frmaco influye o no en la ansiedad,
queremos averiguar si influye de forma distinta en funcin de que se le
suministre 0,05 o 0,10 mg.
Supongamos que hemos obtenido los siguientes resultados:

ni

S 2i

Sin
frmac
o
30
50
30
60
20
5
190
38
270

Con 0,05
mg de
frmaco
10
20
30
20
5
5
85
17
95

Con 0,10
mg de
frmaco
20
40
10
10
10
5
90
18
170

CONCEPTOS BSICOS DEL ANLISIS DE VARIANZA


Antes de entrar en el fundamento del ANOVA, veamos algunas ideas y
terminologa que deben ser manejadas con precisin.
Siguiendo con nuestro ejemplo, si nosotros comparamos los grupos que
han tomado las distintas dosis del frmaco (0, 0,05 mg y 0,10 mg), la
variabilidad que aparezca entre ellos puede deberse tanto a los efectos
del frmaco como a la influencia de otros factores que no hayamos
podido controlar, dado que por muy perfecto que sea el diseo, las
variables que existen entre los sujetos y su entorno son tantas que es
imposible controlarlas todas. Aunque, por ejemplo, aislsemos e
incomunicsemos a los sujetos, esto podra influir de forma distinta en
cada uno de ellos.
As pues, a la hora de realizar el estudio hay que ser conscientes de ello,
por lo que podemos considerar la variabilidad que se observa entre las
puntuaciones, despus de haber introducido la variable independiente,
como formada por dos partes o componentes:

A) la que se debe al efecto del factor estudiado, en nuestro ejemplo, a


las distintas dosis del frmaco.
B) La que se debe a los factores extraos y no controlados, que es lo que
recibe el nombre de error experimental, dado que introduce una
fuente de error en nuestro diseo.
La tarea estar en discernir qu variabilidad corresponde a cada parte y
ste es el cometido del Anlisis de Varianza.
En la terminologa del ANOVA, las variables independientes que se
estudian reciben el nombre de factores y las categoras en que se
dividen, el de niveles. As, en nuestro ejemplo, tenemos una sola
variable independiente (un solo factor, el frmaco) con tres niveles (0,
0,05 y 0,10 mg, es decir, las distintas dosis suministradas).

Tras ver en qu consiste el Anlisis de Varianza, vamos a analizar ahora


las condiciones que deben cumplir los datos para que pueda aplicarse el
ANOVA.
Estas son:
a) Independencia. Es decir, que las distintas muestras o grupos a
comparar hayan sido obtenidas aleatoriamente. Esto implica que tanto
las muestras como las observaciones deben ser independientes.
b) Normalidad de las distribuciones. Las muestras o grupos que
comparamos deben proceder de poblaciones que se distribuyan
normalmente en la variable estudiada.
c) Homogeneidad de las varianzas (homocedasticidad). Los grupos a
comparar
deben
roceder
de
poblaciones
que
no
difieran
significativamente en sus varianzas en la variable estudiada.

4. Supuestos acerca del modelo estadstico

(1) Aditividad: Los factores o componentes del modelo estadstico son aditivos, es
decir la variable respuesta es la suma de los efectos del modelo estadstico.
(2) Linealidad: La relacin existente entre los factores o componentes del modelo
estadstico es del tipo lineal.
(3) Normalidad: Los valores resultado del experimento provienen de
distribucin de probabilidad Normal con media _ y variancia _2:

una

(4) Independencia: Los


independientes entre s.

son

resultados

observados

de

un

experimento

(5) Variancias Homogneas (Homocedasticidad): Las diversas poblaciones


generadas por la aplicacin de dos o ms tratamientos tienen variancias
homogneas (variancia comn).
5. Diseo completamente al azar (DCA) y ANOVA
El diseo completamente al azar (DCA) es el ms simple de todos los diseos,
slo considera dos fuentes de variabilidad: los tratamientos y el error aleatorio.
Se llama completamente al azar por que todas las corridas experimentales se realizan en orden aleatorio completo; en apariencia no existe ninguna restriccin a la
aleatorizacin, es decir, si durante el estudio se hacen en total N pruebas, estas
se corren al azar, de manera que los posibles efectos ambientales y temporales se
repartan equitativamente entre los tratamientos.
Definicin 1. En un DCA se tienen k poblaciones o tratamientos, independientes y con medias desconocidas _1; _2; :::; _k, y varianzas tambin desconocidas
pero que se suponen iguales _21
; _22
; :::; _2
k (= _2). Las poblacin pueden ser k mtodos de produccin, k tratamientos, k grupos, etc. y sus medias se re.eren o son
medidas en trminos de la variable de respuesta. Se comparan las poblaciones, en
principio mediante la hiptesis de igualdad de medias.

6. ANOVA para el diseo completamente al azar (DCA)


El nombre de anlisis de varianza (ANOVA) viene del hecho de que se utilizan
cocientes de varianzas para probar la hiptesis de igualdad de medias. La idea
general de esta tcnica es separar la variacin total en dos partes: la variabilidad
debida a los tratamientos y la debida al error. Cuando la primera predomina
.claramente. sobre la segunda es cuando se concluye que los tratamientos tienen
efecto, es decir, las medias son diferentes. Cuando los tratamientos contribuyen
igual o menos que el error, se concluye que las medias son iguales (vea .gura 1).
6.1. Notacin de puntos. Sirve para representar de manera abreviada cantidades
numricas que se pueden calcular a partir de los datos en un DCA, como los de la
tabla 3, en la cual Yij representa la j-sima observacin en el i-simo tratamiento,
con i = 1; 2; :::; k y j = 1; 2; :::; ni: Las cantidades de inters son las siguientes:

donde _ i es el efecto del i-simo tratamiento sobre la variable respuesta. Si se


acepta H0 se con.rma que los efectos sobre la respuesta de los k tratamientos son
estadsticamente nulos y en caso de rechazar se estara concluyendo que almenos
un efecto es diferente de cero.
Para probar la hiptesis dada por las relaciones (6.2) o (6.3) mediante la tcnica de
ANOVA con un criterio de clasi.cacin, lo primero es decomponer la variabilidad
total de los datos en sus dos componentes: la variabilidad debida a tratamientos y
la debida al error aleatorio, como se hace a continuacin. Una medida de la
variabilidad total presente en las observaciones de la tabla 3 es la suma total de
cuadrados dada por :