Está en la página 1de 8

Programa de Efectividad Clínica - Bioestadística -

ANOVA
El análisis de varianza (ANOVA) es un test de hipótesis paramétrico que se utiliza para
comparar tres o más grupos de observaciones independientes cuando la variable de
interés es numérica.

Ejemplo 1: Planes de cobertura de una empresa de medicina prepaga.

Interesa comparar la media de edad de los afiliados a tres planes de cobertura


diferentes. Para ello, se toma una muestra aleatoria de afiliados correspondientes a
cada uno de los planes y se comparan las medias de edad obtenidas a partir de estos
datos.

H0 : 1 = 2 = 3

H0 : Por lo menos una de las medias es diferente.

Escenario A: Escenario B:

Escenario C: Escenario D:

- Variabilidad o varianza dentro de cada grupo: Se obtiene a partir de un


promedio de la varianza dentro de cada grupo, asignando mayor peso en la
estimación a los grupos que contienen un mayor número de observaciones.

1
Programa de Efectividad Clínica - Bioestadística -

Suma de cuadrados
(X  X )  
1
2
( X 2  X 2 ) 2   ( X k  X k ) 2 dentro de cada grupo
s w2  Grados de libertad
N K

Donde,

s w2 : Variabilidad intragrupo (within)


N : Número total de observaciones
K : Número de grupos

- Variabilidad entre los grupos: Es la suma de cuadrados desde la media de cada


grupo a la media general, dividido el número de grupos menos uno. La suma de
cuadrados se pesa de acuerdo al número de observaciones de cada grupo,
asignándole mayor peso a los grupos más grandes.

Suma de cuadrados
2 n ( X  X ) 2  n2 ( X 2  X ) 2  nk ( X k  X ) 2
s  1 1 
 n ( X
i i  X ) entre grupos
w
K 1 K 1 Grados de libertad

Donde,

s B2 : Variabilidad entre grupos (between)


n : Número total de observaciones
K : Número de grupos

X : Media general o Gran Media

Cuanto mayor sea la variabilidad entre las medias muestrales y menor la variabilidad
dentro de cada grupo, mayor será la evidencia en contra de la hipótesis nula.

¿Cómo se construye el estadístico F?

Variabilidad entre grupos Suma de cuadrados entre / k - 1


F = =
Variabilidad dentro de cada grupo Suma de cuadrados intra / n – k

Si la hipótesis nula es verdadera, el estadístico F tendrá valores cercanos a 1.


Mientras mayor sea el valor de F, menor será el valor de p asociado al mismo.

2
Programa de Efectividad Clínica - Bioestadística -

Retomando el ejemplo de los planes de cobertura:

Plan n Media (años) SD


A 143 30 2.65
B 143 31 2.76
C 143 45 2.46

oneway edad plan

Analysis of Variance

Source SS df MS F Prob > F


------------------------------------------------------------------------
Between groups 20539.4732 2 10269.7366 1489.84 0.0000
Within groups 2936.48951 426 6.89316786
------------------------------------------------------------------------
Total 23475.9627 428 54.8503801

PlanC
49

24
a b c

Conclusión:

Los supuestos:

1- Independencia: Las observaciones corresponden a muestras aleatorias


independientes de las k poblaciones.

2- Normalidad: La distribución de la variable respuesta en las k poblaciones es


normal.

3
Programa de Efectividad Clínica - Bioestadística -

3- Homocedasticidad: La varianza de la variable respuesta es la misma en las k


poblaciones.

Existen varios tests de hipótesis para chequear homogeneidad de varianzas. Los más
utilizados son el test de Barlett (paramétrico) y el test de Levene (no paramétrico).
En ambos casos las hipótesis que se testean son las siguientes:

H0 : 1 = 2 = 3

H0 : Por lo menos una de las varianzas es diferente.

oneway edad plan

Analysis of Variance
Source SS df MS F Prob > F
------------------------------------------------------------------------
Between groups 20539.4732 2 10269.7366 1489.84 0.0000
Within groups 2936.48951 426 6.89316786
------------------------------------------------------------------------
Total 23475.9627 428 54.8503801

Bartlett's test for equal variances: chi2(2) = 1.8280 Prob>chi2 = 0.401

¿Cuál es el / los grupos que difieren? : Comparaciones múltiples.

Siempre que realicemos comparaciones múltiples, será necesario ajustar el nivel alfa
del test al número de comparaciones efectuadas. Existen varias correcciones
propuestas: Bonferroni, Sidak, Scheffé, Tuckey.

Corrección de Bonferroni : alpha general / número de comparaciones


(alphaBonf)

valor de p obtenido * número de comparaciones


(pBonf)

En Stata:

oneway edad plan, bonferroni sidak

Comparison of PlanC by plan Bonferroni) Comparison of PlanC by plan Sidak)

Row Mean-| Row Mean-|


Col Mean | a b Col Mean | a b
---------+---------------------- ---------+----------------------
b | .636364 b | .636364
| 0.123 | 0.118
| |
c | 14.986 14.3497 c | 14.986 14.3497
| 0.000 0.000 | 0.000 0.000

4
Programa de Efectividad Clínica - Bioestadística -

Conclusión:

Recordar:

- Sólo cuando el estadístico F se asocia a una p significativa, tiene sentido explorar cuál o
cuáles son los grupos que difieren.
- Cuando se realizan comparaciones múltiples, siempre se debe emplear alguna corrección
del nivel alpha.

Ejemplo 2: Score de depresión (0 a 20) según nivel de educación (0 – 1 – 2)

. sum depresion, by(educacion)

educacion | Summary of educacion


| Mean Std. Dev. Freq.
------------+------------------------------------
0 | 13.258621 6.4565633 290
1 | 13.872611 6.5769353 471
2 | 14.89418 6.5937929 189
------------+------------------------------------
Total | 13.888421 6.5615488 950

sort educacion
gr box depression, box by(educacion) histogram depression, bin(10)
by(educacion)
depresion educategorica==0 educategorica==1

32 .196552
Fraction

0
1 32
educategorica==2
.196552

0
1 32

1 depresion
0 1 2 Histograms by educacion

oneway depression educacion, bonferroni

Analysis of Variance
Source SS df MS F Prob > F
------------------------------------------------------------------------
Between groups 306.328898 2 153.164449 3.58 0.0283
Within groups 40551.8437 947 42.8213767
------------------------------------------------------------------------
Total 40858.1726 949 43.0539227

Bartlett's test for equal variances: chi2(2) = 0.1489 Prob>chi2 = 0.928

5
Programa de Efectividad Clínica - Bioestadística -

Comparison of depresion by educacion (Bonferroni)


Row Mean-|
Col Mean | 0 1
---------+----------------------
1 | .613991
| 0.627
|
2 | 1.63556 1.02157
| 0.023 0.210

Conclusión:

Ejemplo 3: Score de autoestima con tres estrategias de psicoterapia.


sum autoestima, by(tto)

| Summary of autoestima
tto | Mean Std. Dev. Freq.
------------+------------------------------------
1 | 10.536232 7.1412511 207
2 | 10.797583 6.6963215 331
3 | 10.891051 7.1586239 257
------------+------------------------------------
Total | 10.759748 6.9576908 795

autoestima
30

1
1 2 3

oneway autoestima tto

Analysis of Variance
Source SS df MS F Prob > F
------------------------------------------------------------------------
Between groups 15.246206 2 7.623103 0.16 0.8546
Within groups 38421.8657 792 48.5124567
------------------------------------------------------------------------
Total 38437.1119 794 48.4094609

Bartlett's test for equal variances: chi2(2) = 1.6460 Prob>chi2 = 0.439

Conclusión:

6
Programa de Efectividad Clínica - Bioestadística -

Ejemplo 4: Score de quejas por plan.

. sum enojo, by(plan)

| Summary of enojo
plan | Mean Std. Dev. Freq.
------------+------------------------------------
1 | 7.4886878 6.5393356 44
2 | 8.0657895 7.2938975 15
3 | 11.578947 19.983502 7
------------+------------------------------------
Total | 8.0835821 9.3052631 66

. histogram enojo, bin(10) by(plan)

plan==1 plan==2
.771493
Fraction

0
1 140
plan==3
.771493

0
1 140

enojo
Histograms by plan

Estrategia incorrecta:
. oneway enojo plan
Analysis of Variance
Source SS df MS F Prob > F
Between groups 1085.00754 2 542.503772 5.02 0.0018
Within groups 6842.31192 63 108.603172
----------------------------------------------------------------------
Total 7927.3194 65 121.958760

Bartlett's test for equal variances: chi2(2) = 25.5138 Prob>chi2 = 0.000

Alternativa no paramétrica: Kruskal Wallis.


H0 : rankings1 = rankings2 = rankings3 = rankingsk

H1 : Al menos el ranking correspondiente a uno de los grupos es diferente.

. kwallis enojo, by(plan)

Test: Equality of populations (Kruskal-Wallis test)

plan _Obs _RankSum


1 44 143834.00
2 15 52641.00
3 7 28310.00

chi-squared = 4.452 with 2 d.f.


probability = 0.1080

chi-squared with ties = 4.478 with 2 d.f.


probability = 0.1066

7
Programa de Efectividad Clínica - Bioestadística -

Conclusión:

Si el test de Kruskal Wallis detecta una diferencia significativa, el o los grupos que difieren se exploran
de a pares con test de Wilcoxon y el nivel alpha a partir del cuál el resultado se considera significativo,
siempre se corrige para comparaciones múltiples (por ejemplo, Bonferroni).

También podría gustarte