Está en la página 1de 13

ANOVA

ANÁLISIS DE VARIANZA SIMPLE


COMPARACIONES MÚLTIPLES
ESTADÍSTICA II
JUNIO 2021
COMPARACIONES MÚLTIPLES DE MEDIAS
• LA RAZÓN F ES UN TEST ÓMNIBUS DE COMPROBACIÓN DE HIPÓTESIS O UNA PRUEBA DE SIGNIFICACIÓN GENERAL.
EN CONSECUENCIA, EL OBJETIVO DE DICHA PRUEBA CONSISTE EN VERIFICAR SI LAS MEDIAS DE LOS GRUPOS DE
TRATAMIENTO, CONSIDERADAS CONJUNTAMENTE, PRESENTAN MAYORES DIFERENCIAS DE LAS QUE CABE ESPERAR
POR AZAR.
• ESTA INFORMACIÓN RESULTA MUY ÚTIL PARA INFERIR SI LA VARIABLE INDEPENDIENTE EJERCE INFLUENCIA SOBRE LA
CONDUCTA, PERO NO PERMITE CONOCER LA NATURALEZA DE TAL EFECTO. POR ELLO, CUANDO LA VARIABLE
INDEPENDIENTE ES CUALITATIVA Y SE OBTIENE UNA F SIGNIFICATIVA, RESULTA CONVENIENTE PLANTEAR HIPÓTESIS
QUE REALICEN PREDICCIONES MÁS ESPECÍFICAS SOBRE LOS EFECTOS DE LA VARIABLE INDEPENDIENTE.

• DADO QUE EN EL DISEÑO MULTIGRUPOS ALEATORIOS HAY MÁS DE DOS GRUPOS DE TRATAMIENTO, EXISTE MÁS DE
UNA COMPARACIÓN POSIBLE, POR ELLO PUEDEN PLANTEARSE DIVERSAS HIPÓTESIS PARTICULARES SUSCEPTIBLES DE
CONTRASTARSE MEDIANTE LOS ANÁLISIS DENOMINADOS CONTRASTES O COMPARACIONES MÚLTIPLES (BALLUERKA
Y VERGARA, 2002).

M1 M2 M3 M4
COMPARACIONES MÚLTIPLES DE MEDIAS
• HAY DOS FORMAS PARA FIJAR EL NÚMERO DE COMPARACIONES (PASCAL, 1995):
1. RAZÓN TEÓRICA: LA CANTIDAD Y EL TIPO DE CONTRASTES A REALIZAR DEBEN ESTAR EN CONSONANCIA CON LA
NATURALEZA Y CON LOS OBJETIVOS DE LA INVESTIGACIÓN. SI NO HAY UN SIGNIFICADO TEÓRICO, NO SE
DEBERÍAN LLEVAR A CABO LOS CONTRASTES.

2. RAZÓN DE TIPO ESTADÍSTICO: COMO CRITERIO GENERAL, HAY K-1 COMPARACIONES POSIBLES NO
REDUNDANTES (NO ORTOGONALES). SIENDO K EL NÚMERO DE GRUPOS. SE BUSCA HACER SOLO
COMPARACIONES ORTOGONALES, OBTENIENDO LA MAYOR INFORMACIÓN POSIBLE, CON EL MENOR NÚMERO
DE CONTRASTES.
LAS COMPARACIONES DE MEDIAS PUEDEN PLANTEARSE ANTES DE LLEVAR A CABO LA PRUEBA GENERAL O UNA VEZ QUE
ESTA HA SIDO REALIZADA. AL PRIMER TIPO SE LE CONOCE COMO COMPARACIONES A PRIORI O PLANIFICADAS, A LAS
SEGUNDAS COMO COMPARACIONES A POSTERIORI O NO PLANIFICADAS.
ALGUNAS ALTERNATIVAS PARA EL CONTRASTE A POSTERIORI
Asumiendo varianzas iguales
• Bonferroni. Utiliza las pruebas de t para realizar comparaciones por pares entre las medias de los grupos, pero controla la tasa de error global estableciendo que la tasa de error de cada prueba sea
igual a la tasa de error por experimento dividida entre el número total de contrastes. Así, se corrige el nivel de significación observado por el hecho de que se están realizando múltiples comparaciones.
• Sidak. Prueba de comparaciones múltiples por parejas basada en un estadístico t. La prueba de Sidak corrige el nivel de significación para las comparaciones múltiples y da lugar a límites más
estrechos que los de Bonferroni.
• Scheffe. Realiza comparaciones múltiples conjuntas por parejas para todas las parejas de combinaciones de las medias posibles. Utiliza la distribución muestral F. Puede utilizarse para examinar todas
las combinaciones lineales de grupos de medias posibles, no sólo las comparaciones por parejas.
• R-E-G-W F. Procedimiento múltiple por pasos (por tamaño de las distancias) de Ryan-Einot-Gabriel-Welsch que se basa en una prueba F.
• R-E-G-W Q. Procedimiento múltiple por pasos (por tamaño de las distancias) de Ryan-Einot-Gabriel-Welsch que se basa en el rango estudentizado.
• S-N-K. Realiza todas las comparaciones por parejas entre las medias utilizando la distribución del rango de Student. Con tamaños de muestras iguales, también compara pares de medias dentro de
subconjuntos homogéneos utilizando un procedimiento por pasos Las medias se ordenan de mayor a menor y se comparan primero las diferencias más extremas.
• Tukey. Utiliza el estadístico del rango estudentizado para realizar todas las comparaciones por pares entre los grupos. Establece la tasa de error por experimento como la tasa de error para el conjunto
de todas las comparaciones por pares.
• Tukey-b. Prueba que emplea la distribución del rango estudentizado para realizar comparaciones por pares entre los grupos. El valor crítico es el promedio de los valores correspondientes a la
diferencia honestamente significativa de Tukey y al método de Student-Newman-Keuls.
• Duncan. Realiza comparaciones por pares utilizando un orden por pasos idéntico al orden usado por la prueba de Student-Newman-Keuls, pero establece un nivel de protección en la tasa de error para
la colección de contrastes, en lugar de usar una tasa de error para los contrastes individuales. Utiliza el estadístico del rango estudentizado.
• GT2 de Hochberg. Prueba de comparaciones múltiples y de rango que utiliza el módulo máximo estudentizado. Es similar a la prueba de la diferencia honestamente significativa de Tukey.
• Gabriel. Prueba de comparación por parejas que utiliza el módulo máximo estudentizado y que es generalmente más potente que la GT2 de Hochberg, si los tamaños de las casillas son desiguales. La
prueba de Gabriel se puede convertir en liberal cuando los tamaños de las casillas varían mucho.
• Waller-Duncan. Prueba de comparaciones múltiples basada en un estadístico t. Utiliza la aproximación Bayesiana.
• Dunnett. Prueba t de comparaciones múltiples por parejas que compara un conjunto de tratamientos respecto a una única media de control.

No asumiendo varianzas iguales


• T2 de Tamhane. Prueba conservadora de comparación por parejas basada en la prueba t. Esta prueba es adecuada cuando las varianzas son desiguales.
• T3 de Dunnett. Prueba de comparación por parejas basada en el módulo máximo estudentizado. Esta prueba es adecuada cuando las varianzas son desiguales.
• Games-Howell. Prueba de comparación por parejas que es en ocasiones liberal. Esta prueba es adecuada cuando las varianzas son desiguales.
• C de Dunnett. Prueba de comparación por parejas basada en el rango estudentizado. Esta prueba es adecuada cuando las varianzas son desiguales.
Tabla resumen del ANOVA (apa)
Fuente SC gl CM F p 2 LI LS

Entre 20.13 2 10.06 5.12 .025 .46 .04 .62


90%
Intra 23.6 12 1.97

Total 43.73 14

gl Entre k-1 CM Entre SCE/glentre


gl Intra N-k CM Intra SCI/glintra
gl Total N-1
Cálculos
ANOVA Simple: un ejercicio
La ciudad de Maumee está dividida en cuatro distritos.
El jefe de policía quiere determinar si hay alguna
diferencia en el número promedio de crímenes
cometidos en cada distrito. Registró el número de
crímenes reportados en cada distrito en una muestra
de seis días. Al nivel de significancia 0,05 ¿puede el
funcionario concluir que hay diferencia en el número
promedio de crímenes?

Datos e hipótesis 2 ≤ 0,3 Significativo pero débil


0,3 < 2 ≤ 0,6 Moderado 2= SCE/SCT
2 > 0,6 Fuerte
CONTRASTE A POSTERIORI: HSD DE TUKEY (MINITAB, 2019)
El HSD (Honestly-significant-difference) de Tukey es un test de comparaciones múltiples, muy usado. Permite
comparar las medias de los k niveles de un factor después de haber rechazado la H0, trata de especificar una
H1 genérica como la de cualquiera ANOVA.
Se basa en la distribución del rango estudentizado que es la distribución que sigue la diferencia del máximo y
del mínimo de las diferencias entre la media muestral y la media poblacional de k variables normales N(0, 1)
independientes e idénticamente distribuidas.
Se establece un umbral, se calculan todas las diferencias de medias entre los k niveles del factor estudiado. Las
diferencias que estén por encima de ese umbral serían significativas, las que no lo estén se considerarán
diferencias no significativas.
q Is a value from a table of the studentized range statistic
based on alpha, dfW and k, the number of groups.
MSW
HSD = q MSW Is the mean square within groups

NA NA Is the number of people in each group

 is the Type I error rate


MSW
10
HSD.05 = 3.77 = 5.33 Result
5
From table NA
Número de medias: k
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Distrito Media S 5 3,64 4,60 5,22 5,67 6,03 6,33 6,58 6,80 6,99 7,17 7,32 7,47 7,60 7,72 7,83 7,93 8,03 8,12 8,21
6 3,46 4,34 4,90 5,30 5,63 5,90 6,12 6,32 6,49 6,65 6,79 6,92 7,03 7,14 7,24 7,34 7,43 7,51 7,59
Rec Center 14,33 0,82 7 3,34 4,16 4,68 5,06 5,36 5,61 5,82 6,00 6,16 6,30 6,43 6,55 6,66 6,76 6,85 6,94 7,02 7,10 7,17
Key Str. 18,00 2,68 8 3,26 4,04 4,53 4,89 5,17 5,40 5,60 5,77 5,92 6,05 6,18 6,29 6,39 6,48 6,57 6,65 6,73 6,80 6,87

Grados de libertad (gl) del CME


Monclov 13,50 1,38 9 3,20 3,95 4,41 4,76 5,02 5,24 5,43 5,59 5,74 5,87 5,98 6,09 6,19 6,28 6,36 6,44 6,51 6,58 6,64
Whiteho 17,33 1,75 10 3,15 3,88 4,33 4,65 4,91 5,12 5,30 5,46 5,60 5,72 5,83 5,93 6,03 6,11 6,19 6,27 6,34 6,40 6,47
11 3,11 3,82 4,26 4,57 4,82 5,03 5,20 5,35 5,49 5,61 5,71 5,81 5,90 5,98 6,06 6,13 6,20 6,27 6,33
12 3,08 3,77 4,20 4,51 4,75 4,95 5,12 5,27 5,39 5,51 5,61 5,71 5,80 5,88 5,95 6,02 6,09 6,15 6,21
HSD= 3.96 3.2/6 = 2.89 13 3,06 3,73 4,15 4,45 4,69 4,88 5,05 5,19 5,32 5,43 5,53 5,63 5,71 5,79 5,86 5,93 5,99 6,05 6,11
14 3,03 3,70 4,11 4,41 4,64 4,83 4,99 5,13 5,25 5,36 5,46 5,55 5,64 5,71 5,79 5,85 5,91 5,97 6,03
15 3,01 3,67 4,08 4,37 4,59 4,78 4,94 5,08 5,20 5,31 5,40 5,49 5,57 5,65 5,72 5,78 5,85 5,90 5,96
|Diferencia de Medias| 16 3,00 3,65 4,05 4,33 4,56 4,74 4,90 5,03 5,15 5,26 5,35 5,44 5,52 5,59 5,66 5,73 5,79 5,84 5,90
17 2,98 3,63 4,02 4,30 4,52 4,70 4,86 4,99 5,11 5,21 5,31 5,39 5,47 5,54 5,61 5,67 5,73 5,79 5,84
18,00 13,50 17,33 18 2,97 3,61 4,00 4,28 4,49 4,67 4,82 4,96 5,07 5,17 5,27 5,35 5,43 5,50 5,57 5,63 5,69 5,74 5,79
14,33 3.67* 0,83 3,00* 19 2,96 3,59 3,98 4,25 4,47 4,65 4,79 4,92 5,04 5,14 5,23 5,31 5,39 5,46 5,53 5,59 5,65 5,70 5,75
18,00 -- 4,50* 0,67 20 2,95 3,58 3,96 4,23 4,45 4,62 4,77 4,90 5,01 5,11 5,20 5,28 5,36 5,43 5,49 5,55 5,61 5,66 5,71
13,50 -- -- 3,83* 24 2,92 3,53 3,90 4,17 4,37 4,54 4,68 4,81 4,92 5,01 5,10 5,18 5,25 5,32 5,38 5,44 5,49 5,55 5,59
30 2,89 3,49 3,85 4,10 4,30 4,46 4,60 4,72 4,82 4,92 5,00 5,08 5,15 5,21 5,27 5,33 5,38 5,43 5,47
*Significativa al 5%
40 2,86 3,44 3,79 4,04 4,23 4,39 4,52 4,63 4,73 4,82 4,90 4,98 5,04 5,11 5,16 5,22 5,27 5,31 5,36
60 2,83 3,40 3,74 3,98 4,16 4,31 4,44 4,55 4,65 4,73 4,81 4,88 4,94 5,00 5,06 5,11 5,15 5,20 5,24
120 2,80 3,36 3,68 3,92 4,10 4,24 4,36 4,47 4,56 4,64 4,71 4,78 4,84 4,90 4,95 5,00 5,04 5,09 5,13
121 2,77 3,31 3,63 3,86 4,03 4,17 4,29 4,39 4,47 4,55 4,62 4,68 4,74 4,80 4,85 4,89 4,93 4,97 5,01
Presentación gráfica de resultados: Gráfico de Duncan

Tabla resumen del ANOVA

Fuente SC gl CM F Fc

Entre 100 3 33.3 22 5.29 Gráfico de Duncan


Intra 24 16 1.5
Media 3 5 7 9
Total 124 19 2 =.81

HSD = {5.19  1.5 / 5} = 2.84


Medias XA2=5 XA3=7 XA4=9
Grupo A1 A2 A3 A4
XA1=3 2 4* 6*
XA2=5 - 2 4*
XA3=7 - - 2
Otra presentación gráfica de resultados
ANOVA
Fuente gl SC CM F P
Tratamiento 2 34.74 17.37 6.45 0.006
Error 22 59.26 2.69
Total 24 94.00
IC 95% para las medias
basados en la desviación combinada
Nivel N Media DT ----------+---------+---------+------
A 8 7.250 1.669 (-------*-------)
B 8 8.875 1.458 (-------*-------)
P 9 10.111 1.764 (------*-------)
----------+---------+---------+------
7.5 9.0 10.5

Desviación Combinada = 1.641


Met1 X12 Met2 X22 Met3 X32 Met4 X42
4 16 9 81 8 64 1 1
3 9 11 121 6 36 3 9
5 25 8 64 6 36 4 16
4 16 7 49 9 81 5 25
Una lista de palabras sin 6 36 7 49 5 25 3 9 Suma
sentido se presenta en la Suma Xi 22 42 34 16 114
pantalla del ordenador con Suma Xi2 102 364 242 60 768
cuatro métodos diferentes, Media 4,4 8,4 6,8 3,2
asignados al azar a un grupo DT 1,14 1,67 1,64 1,48
de 5 sujetos a cada método.
Fmax= 2,15 SCT= 118,2
Posteriormente se les realiza
Fc= 49 SCE= 82,2
una prueba de recuerdo de
C= 649,8 SCI= 36
dichas palabras. ¿Hay
diferencias entre los métodos? Fuente SC gl CM F p 2
(alfa=5%) Entre 82,2 3 27,40 12,18 0,00 0,70
Intra 36 16 2,25 Fc=3.24
Total 118,2 19
H0: 1=2=3=4
q5%= 4,05 Met2 Met3 Met4
H1: 1234 HSD= 2,72 8,4 6,8 3,2
Met1 4,4 4* 2,4 1,2
H0: 21=22=23=24 Met2 8,4 1,6 5,2*
H1: 21222324 Met3 6,8 3,6*

Met4 Met1 Met3 Met2


3,2 4,4 6,8 8,4
Así parece …

Eso dices tu .. en
realidad esto nunca
termina …

También podría gustarte