Está en la página 1de 20

DISEÑOS DE INVESTIGACIÓN Y

ANÁLISIS DE DATOS

Tema 5
Diseños de más de dos grupos
independientes

Profesor D. Joaquín Antón Duce 1


ANÁLISIS DE VARIANZA
El análisis de varianza (ANOVA) es una técnica de análisis estadístico que se utiliza
para comparar las medias de más de dos grupos, aunque su nombre hace referencia al
estudio de la variabilidad observada en los datos.
Esta técnica presenta algunas ventajas respecto a las comparaciones de dos en dos
con la prueba T de Student:
• El número de comparaciones aumenta con el número de grupos.
• La posibilidad de cometer error tipo I se incrementa con el número de
comparaciones.

Profesor D. Joaquín Antón Duce 2


CONCEPTOS BÁSICOS DEL ANOVA
En la terminología del ANOVA, las variables independientes que se estudian reciben
el nombre de factores y las categorías en que se dividen, el de niveles.
Si nuestras hipótesis se refieren a unos niveles concretos el diseño se llama de
efectos fijos o modelos fijos .
Si por el contrario no estamos interesados en unos niveles concretos el diseño se
llama de efectos aleatorios o modelo aleatorio.
Si todos los grupos son muestras tienen el mismo número de sujetos hablamos de
un modelo equilibrado y en caso contrario de modelo no equilibrado.

Profesor D. Joaquín Antón Duce 3


ANOVA DE UN FACTOR DE
EFECTOS FIJOS

Profesor D. Joaquín Antón Duce 4


MODELO
En este modelo nos interesa estudiar la influencia de un solo factor (al que
llamaremos genéricamente factor A) qué tiene distintos niveles (a1, a2, a3…)
Yij = μ + αi + εij
Donde Yij → puntuación del sujeto que ocupa el lugar j dentro del nivel i
μ → constante común para todos los sujetos y que es la media de la población
αi → componente común a todos los sujetos de ese nivel del factor
εij → Componente del error experimental formado por todos los factores no
controlados en el experimento

Profesor D. Joaquín Antón Duce 5


ANOVA DE UN FACTOR (I)
1. Hipótesis
H0: μ1 = μ2 = … = μa σ 𝛼𝑖 = 0
H1: μ1 ≠ μ2 ≠ … ≠ μa al menos para un μi
2. Supuestos
• Independencia de las observaciones .
• Normalidad de las distribuciones.
• Homogeneidad de las varianzas (homocedasticidad).
3. Estadístico de contraste
MC
F = MCinter se distribuye según Fa-1, N-a
intra

Profesor D. Joaquín Antón Duce 6


ANOVA DE UN FACTOR (II)
4. Región de rechazo
F > 1-αfa-1;N-a (como si fuera un contraste unilateral derecho)
5. Nivel crítico
p = p(f > F) (como si fuera un contraste unilateral derecho)
6. Decisión
• Rechazo H0 si el estadístico de contraste F está en la región crítica, es decir, si:
F > 1-αfa-1;N-a
• Rechazo H0 si p  

Profesor D. Joaquín Antón Duce 7


TABLA DEL ANOVA (I)

Fuentes de Sumas de Grados de Medias


F
variación cuadrados libertad cuadráticas

Inter SCinter a-1 MCinter

Intra SCintra N-a MCintra

Total SCtotal N-1

Profesor D. Joaquín Antón Duce 8


TABLA DEL ANOVA (II)

Fuentes de Sumas de Grados de Medias


F
variación cuadrados libertad cuadráticas

Inter SCinter / a-1 = MCinter


MCinter
+ + / =
MCintra
Intra SCintra / N-a = MCintra
=

=
Total SCtotal N-1

Profesor D. Joaquín Antón Duce 9


RAZONES BÁSICAS

T = ෍ Ai Y = ෍ ෍ Yij2

A2i T2
A =෍ T =
ni N

SCinter = [A] – [T]


SCintra = [Y] – [A]
SCtotal = [Y] – [T]

Profesor D. Joaquín Antón Duce 10


ANOVA DE UN FACTOR DE
EFECTOS ALEATORIOS

Profesor D. Joaquín Antón Duce 11


ANOVA DE EFECTOS ALEATORIOS
Aunque el planteamiento es distinto, cuando se trata de un solo factor, este hecho
no tiene consecuencias para el cálculo. El estadístico de contraste sigue siendo el mismo:
MC
F = MCinter que se distribuye según Fa-1, N-a
intra

Profesor D. Joaquín Antón Duce 12


COMPARACIONES MÚLTIPLES

Profesor D. Joaquín Antón Duce 13


TIPOS DE COMPARACIONES MÚLTIPLES
En la situación más común, el investigador, una vez realizado el análisis de varianza y
rechazada la H0 desea conocer entre qué medias hay diferencias no debidas al azar. Se
trata de las comparaciones no planificadas a posteriori o post hoc.
Cuando el investigador no está interesado en realizar un análisis de varianza para
probar todas las medias, sino sólo en algunas comparaciones entre los niveles del factor y
sabe de antemano qué comparaciones le interesan, se trata de comparaciones
planificadas o a priori.

Profesor D. Joaquín Antón Duce 14


COMPARACIONES A POSTERIORI
Prueba de Scheffé
Una vez rechazada la hipótesis nula, diremos que existen diferencias significativas
entre dos medias si su diferencia es mayor que un valor crítico llamado CR (Critical Range)

𝑐𝑖2
𝐶𝑅𝑆𝑐ℎ𝑒𝑓𝑓é = 𝑎 − 1 ∙ 𝐹1−𝛼;𝑎−1,𝑁−𝑎 𝑀𝐶𝑖𝑛𝑡𝑟𝑎 ෍
𝑛𝑖

Profesor D. Joaquín Antón Duce 15


EJEMPLO (I)
SITUACIÓN 2. Un agrónomo desea conocer el efecto que sobre el rendimiento de
una variedad de trigo tiene la adición de 3 tipos diferentes de fosfatos al terreno. Para ello
parcela un terreno en 12 áreas del mismo tamaño y trata cada cuatro parcelas con un tipo
distinto de fosfato (A, B o C). A continuación siembra trigo en cada uno de ellos y, después
de la recolección, mide la cantidad de trigo producida por cada superficie (en hectólitros
por hectárea o hl/ha). Nivel de confianza: 95%. Sabemos que:
𝑆𝐶𝑆/𝐴 = 𝑆𝐶𝑑𝑒𝑛𝑡𝑟𝑜_𝑛𝑖𝑣𝑒𝑙𝑒𝑠 = 6; 𝑆𝐶𝐴 = 𝑆𝐶𝑒𝑛𝑡𝑟𝑒_𝑛𝑖𝑣𝑒𝑙𝑒𝑠 = 8
Y la siguiente tabla muestra el rendimiento obtenido en función del tipo de fosfato
añadido.
Fosfato A 48 49 50 49
Fosfato B 47 49 48 48
Fosfato C 49 51 50 50

Profesor D. Joaquín Antón Duce 16


EJEMPLO (II)
1- Se trata de un diseño: A) de una muestra con 12 observaciones; B) de un factor
con tres niveles (tipo de fosfato); C) de un factor (parcela de terreno) con cuatro niveles.
2- La hipótesis nula es A) 𝐻0: 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐴 = 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐵; B) 𝐻0: 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐴 = 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐵 =
𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐶 ; C) 𝐻0: 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐴 ≠ 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐵 ≠ 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐶
3- Los grados de libertad del estadístico F de contraste valen: A) (3;9); B) (2;11); C)
(2;9).
4 - El estadístico de contraste para evaluar la significatividad del “Tipo de Fosfato”
vale aproximadamente: A) 6; B) 3,295; C) 0,392.
5 - El diseño presentado es: A) de efectos fijos; B) desequilibrado; C) las dos opciones
anteriores son incorrectas.

Profesor D. Joaquín Antón Duce 17


EJEMPLO (III)
6- El modelo estadístico que podemos aplicar a estos datos es: A) 𝑌𝑖𝑗 = 𝜇 + 𝛼𝑖 + 𝜀𝑖𝑗 ; B)
1
𝐸 𝑀𝐶𝑖𝑛𝑡𝑒𝑟 = 𝜎 2 + 𝐼−1 𝑛𝑖 𝛼𝑖2 ; C) 𝑌𝑖𝑗 = 𝜇 + 𝛼𝑖 + (𝛼𝜀)𝑖𝑗 + 𝜀𝑖𝑗

7- El rendimiento medio para los diferentes tratamientos es: A) {49, 48, 50}; B) {196,
192, 200}; C) {2/3, 2/3, 2/3}.
8- La variación entre tratamientos vale: A) 4; B) 8; C) 14.
9- La variación dentro de los tratamientos vale aproximadamente: A) 5/3; B) 4/3; C)
2/3.

Profesor D. Joaquín Antón Duce 18


EJEMPLO (IV)
10- El tipo de fertilizante ha resultado significativo: A) Sí, porque la MCIntra es
superior en, aproximadamente, 6 veces a la MCInter; B) No, porque la SCintra es casi igual a la
SCinter indicando que la variabilidad asociada al tratamiento es casi idéntica a la del error;
C) Sí, porque la F obtenida (6) es superior al valor crítico 𝐹2;9;0,05 = 4,256
11- ¿Entre qué niveles podemos asegurar que existen diferencias según CR de
Scheffé? A) sólo entre los niveles B y C; B) Sólo entre los niveles A y C; C) sólo entre los
niveles A y B.
12- El diseño presentado no permite evaluar la interacción: A) porque el factor
manipulado (tipo de fertilizante) no puede interaccionar con ningún otro factor; B) porque
tal interacción no ha sido incluida en el modelo; C) porque sólo existe un factor
manipulado y la interacción siempre se predica, como mínimo, de dos factores.

Profesor D. Joaquín Antón Duce 19


FIN DEL TEMA 5

Muchas gracias por vuestra atención

Profesor D. Joaquín Antón Duce 20

También podría gustarte