Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ANOVA
El análisis de varianza (ANOVA) es un test de hipótesis paramétrico que se utiliza para
comparar tres o más grupos de observaciones independientes cuando la variable de
interés es numérica.
H0 : 1 = 2 = 3
Escenario A: Escenario B:
Escenario C: Escenario D:
1
Programa de Efectividad Clínica - Bioestadística -
Suma de cuadrados
(X X )
1
2
( X 2 X 2 ) 2 ( X k X k ) 2 dentro de cada grupo
s w2 Grados de libertad
N K
Donde,
Suma de cuadrados
2 n ( X X ) 2 n2 ( X 2 X ) 2 nk ( X k X ) 2
s 1 1
n ( X
i i X ) entre grupos
w
K 1 K 1 Grados de libertad
Donde,
Cuanto mayor sea la variabilidad entre las medias muestrales y menor la variabilidad
dentro de cada grupo, mayor será la evidencia en contra de la hipótesis nula.
2
Programa de Efectividad Clínica - Bioestadística -
Analysis of Variance
PlanC
49
24
a b c
Conclusión:
Los supuestos:
3
Programa de Efectividad Clínica - Bioestadística -
Existen varios tests de hipótesis para chequear homogeneidad de varianzas. Los más
utilizados son el test de Barlett (paramétrico) y el test de Levene (no paramétrico).
En ambos casos las hipótesis que se testean son las siguientes:
H0 : 1 = 2 = 3
Analysis of Variance
Source SS df MS F Prob > F
------------------------------------------------------------------------
Between groups 20539.4732 2 10269.7366 1489.84 0.0000
Within groups 2936.48951 426 6.89316786
------------------------------------------------------------------------
Total 23475.9627 428 54.8503801
Siempre que realicemos comparaciones múltiples, será necesario ajustar el nivel alfa
del test al número de comparaciones efectuadas. Existen varias correcciones
propuestas: Bonferroni, Sidak, Scheffé, Tuckey.
En Stata:
4
Programa de Efectividad Clínica - Bioestadística -
Conclusión:
Recordar:
- Sólo cuando el estadístico F se asocia a una p significativa, tiene sentido explorar cuál o
cuáles son los grupos que difieren.
- Cuando se realizan comparaciones múltiples, siempre se debe emplear alguna corrección
del nivel alpha.
sort educacion
gr box depression, box by(educacion) histogram depression, bin(10)
by(educacion)
depresion educategorica==0 educategorica==1
32 .196552
Fraction
0
1 32
educategorica==2
.196552
0
1 32
1 depresion
0 1 2 Histograms by educacion
Analysis of Variance
Source SS df MS F Prob > F
------------------------------------------------------------------------
Between groups 306.328898 2 153.164449 3.58 0.0283
Within groups 40551.8437 947 42.8213767
------------------------------------------------------------------------
Total 40858.1726 949 43.0539227
5
Programa de Efectividad Clínica - Bioestadística -
Conclusión:
| Summary of autoestima
tto | Mean Std. Dev. Freq.
------------+------------------------------------
1 | 10.536232 7.1412511 207
2 | 10.797583 6.6963215 331
3 | 10.891051 7.1586239 257
------------+------------------------------------
Total | 10.759748 6.9576908 795
autoestima
30
1
1 2 3
Analysis of Variance
Source SS df MS F Prob > F
------------------------------------------------------------------------
Between groups 15.246206 2 7.623103 0.16 0.8546
Within groups 38421.8657 792 48.5124567
------------------------------------------------------------------------
Total 38437.1119 794 48.4094609
Conclusión:
6
Programa de Efectividad Clínica - Bioestadística -
| Summary of enojo
plan | Mean Std. Dev. Freq.
------------+------------------------------------
1 | 7.4886878 6.5393356 44
2 | 8.0657895 7.2938975 15
3 | 11.578947 19.983502 7
------------+------------------------------------
Total | 8.0835821 9.3052631 66
plan==1 plan==2
.771493
Fraction
0
1 140
plan==3
.771493
0
1 140
enojo
Histograms by plan
Estrategia incorrecta:
. oneway enojo plan
Analysis of Variance
Source SS df MS F Prob > F
Between groups 1085.00754 2 542.503772 5.02 0.0018
Within groups 6842.31192 63 108.603172
----------------------------------------------------------------------
Total 7927.3194 65 121.958760
7
Programa de Efectividad Clínica - Bioestadística -
Conclusión:
Si el test de Kruskal Wallis detecta una diferencia significativa, el o los grupos que difieren se exploran
de a pares con test de Wilcoxon y el nivel alpha a partir del cuál el resultado se considera significativo,
siempre se corrige para comparaciones múltiples (por ejemplo, Bonferroni).