15 Anova

Programa de Efectividad Clínica - Bioestadística -
ANOVA
El análisis de varianza (ANOVA) es un test de hipótesis paramétrico que se utiliza para
comparar tres o más grupos de observaciones independientes cuando la variable de
interés es numérica.
Ejemplo 1: Planes de cobertura de una empresa de medicina prepaga.
Interesa comparar la media de edad de los afiliados a tres planes de cobertura

diferentes. Para ello, se toma una muestra aleatoria de afiliados correspondientes a
cada uno de los planes y se comparan las medias de edad obtenidas a partir de estos
datos.
H0 : 1 = 2 = 3
H0 : Por lo menos una de las medias es diferente.
Escenario A: Escenario B:
Escenario C: Escenario D:
- Variabilidad o varianza dentro de cada grupo: Se obtiene a partir de un

promedio de la varianza dentro de cada grupo, asignando mayor peso en la
estimación a los grupos que contienen un mayor número de observaciones.
1
Suma de cuadrados
(X  X )  
1
2
( X 2  X 2 ) 2   ( X k  X k ) 2 dentro de cada grupo
s w2  Grados de libertad
N K
Donde,
s w2 : Variabilidad intragrupo (within)

N : Número total de observaciones
K : Número de grupos
- Variabilidad entre los grupos: Es la suma de cuadrados desde la media de cada

grupo a la media general, dividido el número de grupos menos uno. La suma de
cuadrados se pesa de acuerdo al número de observaciones de cada grupo,
asignándole mayor peso a los grupos más grandes.
Suma de cuadrados
2 n ( X  X ) 2  n2 ( X 2  X ) 2  nk ( X k  X ) 2
s  1 1 
 n ( X
i i  X ) entre grupos
w
K 1 K 1 Grados de libertad
Donde,
s B2 : Variabilidad entre grupos (between)

n : Número total de observaciones
K : Número de grupos
X : Media general o Gran Media
Cuanto mayor sea la variabilidad entre las medias muestrales y menor la variabilidad
dentro de cada grupo, mayor será la evidencia en contra de la hipótesis nula.
¿Cómo se construye el estadístico F?
Variabilidad entre grupos Suma de cuadrados entre / k - 1

F = =
Variabilidad dentro de cada grupo Suma de cuadrados intra / n – k
Si la hipótesis nula es verdadera, el estadístico F tendrá valores cercanos a 1.

Mientras mayor sea el valor de F, menor será el valor de p asociado al mismo.
2
Retomando el ejemplo de los planes de cobertura:
Plan n Media (años) SD

A 143 30 2.65
B 143 31 2.76
C 143 45 2.46
oneway edad plan
Analysis of Variance
Source SS df MS F Prob > F

------------------------------------------------------------------------
Between groups 20539.4732 2 10269.7366 1489.84 0.0000
Within groups 2936.48951 426 6.89316786
------------------------------------------------------------------------
Total 23475.9627 428 54.8503801
PlanC
49
24
a b c
Conclusión:
Los supuestos:
1- Independencia: Las observaciones corresponden a muestras aleatorias

independientes de las k poblaciones.
2- Normalidad: La distribución de la variable respuesta en las k poblaciones es

normal.
3
3- Homocedasticidad: La varianza de la variable respuesta es la misma en las k

poblaciones.
Existen varios tests de hipótesis para chequear homogeneidad de varianzas. Los más
utilizados son el test de Barlett (paramétrico) y el test de Levene (no paramétrico).
En ambos casos las hipótesis que se testean son las siguientes:
H0 : 1 = 2 = 3
H0 : Por lo menos una de las varianzas es diferente.
oneway edad plan
------------------------------------------------------------------------
Between groups 20539.4732 2 10269.7366 1489.84 0.0000
Within groups 2936.48951 426 6.89316786
------------------------------------------------------------------------
Total 23475.9627 428 54.8503801
Bartlett's test for equal variances: chi2(2) = 1.8280 Prob>chi2 = 0.401
¿Cuál es el / los grupos que difieren? : Comparaciones múltiples.
Siempre que realicemos comparaciones múltiples, será necesario ajustar el nivel alfa
del test al número de comparaciones efectuadas. Existen varias correcciones
propuestas: Bonferroni, Sidak, Scheffé, Tuckey.
Corrección de Bonferroni : alpha general / número de comparaciones

(alphaBonf)
valor de p obtenido * número de comparaciones

(pBonf)
En Stata:
oneway edad plan, bonferroni sidak
Comparison of PlanC by plan Bonferroni) Comparison of PlanC by plan Sidak)
Row Mean-| Row Mean-|

Col Mean | a b Col Mean | a b
---------+---------------------- ---------+----------------------
b | .636364 b | .636364
| 0.123 | 0.118
| |
c | 14.986 14.3497 c | 14.986 14.3497
| 0.000 0.000 | 0.000 0.000
4
Conclusión:
Recordar:
- Sólo cuando el estadístico F se asocia a una p significativa, tiene sentido explorar cuál o
cuáles son los grupos que difieren.
- Cuando se realizan comparaciones múltiples, siempre se debe emplear alguna corrección
del nivel alpha.
Ejemplo 2: Score de depresión (0 a 20) según nivel de educación (0 – 1 – 2)
. sum depresion, by(educacion)
educacion | Summary of educacion

| Mean Std. Dev. Freq.
------------+------------------------------------
0 | 13.258621 6.4565633 290
1 | 13.872611 6.5769353 471
2 | 14.89418 6.5937929 189
------------+------------------------------------
Total | 13.888421 6.5615488 950
sort educacion
gr box depression, box by(educacion) histogram depression, bin(10)
by(educacion)
depresion educategorica==0 educategorica==1
32 .196552
Fraction
0
1 32
educategorica==2
.196552
0
1 32
1 depresion
0 1 2 Histograms by educacion
oneway depression educacion, bonferroni
------------------------------------------------------------------------
Between groups 306.328898 2 153.164449 3.58 0.0283
Within groups 40551.8437 947 42.8213767
------------------------------------------------------------------------
Total 40858.1726 949 43.0539227
5
Comparison of depresion by educacion (Bonferroni)

Row Mean-|
Col Mean | 0 1
---------+----------------------
1 | .613991
| 0.627
|
2 | 1.63556 1.02157
| 0.023 0.210
Conclusión:
Ejemplo 3: Score de autoestima con tres estrategias de psicoterapia.

sum autoestima, by(tto)
| Summary of autoestima
tto | Mean Std. Dev. Freq.
------------+------------------------------------
1 | 10.536232 7.1412511 207
2 | 10.797583 6.6963215 331
3 | 10.891051 7.1586239 257
------------+------------------------------------
Total | 10.759748 6.9576908 795
autoestima
30
1
1 2 3
oneway autoestima tto
------------------------------------------------------------------------
Between groups 15.246206 2 7.623103 0.16 0.8546
Within groups 38421.8657 792 48.5124567
------------------------------------------------------------------------
Total 38437.1119 794 48.4094609
Conclusión:
6
Ejemplo 4: Score de quejas por plan.
. sum enojo, by(plan)
| Summary of enojo
plan | Mean Std. Dev. Freq.
------------+------------------------------------
1 | 7.4886878 6.5393356 44
2 | 8.0657895 7.2938975 15
3 | 11.578947 19.983502 7
------------+------------------------------------
Total | 8.0835821 9.3052631 66
. histogram enojo, bin(10) by(plan)
plan==1 plan==2
.771493
Fraction
0
1 140
plan==3
.771493
0
1 140
enojo
Histograms by plan
Estrategia incorrecta:
. oneway enojo plan
Between groups 1085.00754 2 542.503772 5.02 0.0018
Within groups 6842.31192 63 108.603172
----------------------------------------------------------------------
Total 7927.3194 65 121.958760
Alternativa no paramétrica: Kruskal Wallis.

H0 : rankings1 = rankings2 = rankings3 = rankingsk
H1 : Al menos el ranking correspondiente a uno de los grupos es diferente.
. kwallis enojo, by(plan)
Test: Equality of populations (Kruskal-Wallis test)
plan _Obs _RankSum

1 44 143834.00
2 15 52641.00
3 7 28310.00
chi-squared = 4.452 with 2 d.f.

probability = 0.1080
chi-squared with ties = 4.478 with 2 d.f.

probability = 0.1066
7
Conclusión:
Si el test de Kruskal Wallis detecta una diferencia significativa, el o los grupos que difieren se exploran
de a pares con test de Wilcoxon y el nivel alpha a partir del cuál el resultado se considera significativo,
siempre se corrige para comparaciones múltiples (por ejemplo, Bonferroni).

15 Anova

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

15 Anova

Cargado por

Copyright:

Formatos disponibles

Programa de Efectividad Clínica - Bioestadística -

Ejemplo 1: Planes de cobertura de una empresa de medicina prepaga.

Interesa comparar la media de edad de los afiliados a tres planes de cobertura

H0 : Por lo menos una de las medias es diferente.

- Variabilidad o varianza dentro de cada grupo: Se obtiene a partir de un

s w2 : Variabilidad intragrupo (within)

- Variabilidad entre los grupos: Es la suma de cuadrados desde la media de cada

s B2 : Variabilidad entre grupos (between)

X : Media general o Gran Media

¿Cómo se construye el estadístico F?

Variabilidad entre grupos Suma de cuadrados entre / k - 1

Si la hipótesis nula es verdadera, el estadístico F tendrá valores cercanos a 1.

Retomando el ejemplo de los planes de cobertura:

Plan n Media (años) SD

oneway edad plan

Source SS df MS F Prob > F

1- Independencia: Las observaciones corresponden a muestras aleatorias

2- Normalidad: La distribución de la variable respuesta en las k poblaciones es

3- Homocedasticidad: La varianza de la variable respuesta es la misma en las k

H0 : Por lo menos una de las varianzas es diferente.

oneway edad plan

Bartlett's test for equal variances: chi2(2) = 1.8280 Prob>chi2 = 0.401

¿Cuál es el / los grupos que difieren? : Comparaciones múltiples.

Corrección de Bonferroni : alpha general / número de comparaciones

valor de p obtenido * número de comparaciones

oneway edad plan, bonferroni sidak

Comparison of PlanC by plan Bonferroni) Comparison of PlanC by plan Sidak)

Row Mean-| Row Mean-|

Ejemplo 2: Score de depresión (0 a 20) según nivel de educación (0 – 1 – 2)

. sum depresion, by(educacion)

educacion | Summary of educacion

oneway depression educacion, bonferroni

Bartlett's test for equal variances: chi2(2) = 0.1489 Prob>chi2 = 0.928

Comparison of depresion by educacion (Bonferroni)

Ejemplo 3: Score de autoestima con tres estrategias de psicoterapia.

oneway autoestima tto

Bartlett's test for equal variances: chi2(2) = 1.6460 Prob>chi2 = 0.439

Ejemplo 4: Score de quejas por plan.

. sum enojo, by(plan)

. histogram enojo, bin(10) by(plan)

Bartlett's test for equal variances: chi2(2) = 25.5138 Prob>chi2 = 0.000

Alternativa no paramétrica: Kruskal Wallis.

H1 : Al menos el ranking correspondiente a uno de los grupos es diferente.

. kwallis enojo, by(plan)

Test: Equality of populations (Kruskal-Wallis test)

plan _Obs _RankSum

chi-squared = 4.452 with 2 d.f.

chi-squared with ties = 4.478 with 2 d.f.

También podría gustarte