Está en la página 1de 8

6/24/2021

ANOVA
y Comparaciones mùltiples

Vilma Irazola
Junio 2021

Ejemplo 1:

Planes de cobertura de una empresa de medicina


prepaga.

Interesa comparar la media de edad de los afiliados a tres


planes de cobertura diferentes. Para ello, se toma una
muestra aleatoria de afiliados correspondientes a cada
uno de los planes y se comparan las medias de edad
obtenidas a partir de estos datos.

Plan n Media SD
(años)
A 143 30 2.65

B 143 31 2.76

C 143 45 2.46

N total = 429

1
6/24/2021

Ejemplo 1:

Planes de cobertura de una empresa de medicina


prepaga.

Interesa comparar la media de edad de los afiliados a tres


planes de cobertura diferentes. Para ello, se toma una
muestra aleatoria de afiliados correspondientes a cada
uno de los planes y se comparan las medias de edad
obtenidas a partir de estos datos.

H 0 : 1 = 2 = 3
H1 : Por lo menos una de las medias es diferente

Variabilidad o varianza dentro de cada grupo:

Se obtiene a partir de la suma de cuadrados dentro de cada


grupo. Es un promedio ponderado de la varianza dentro de
cada grupo, asignando mayor peso en la estimación a los
grupos que tienen un mayor número de observaciones.

( n1  1) s12  ( n2  1) s22  ( n3  1) s32


2
sw 
N K

Variabilidad o varianza entre los grupos:

Es la suma de cuadrados desde la media de cada grupo a la


media general, dividido el número de grupos menos uno.
La suma de cuadrados se pondera de acuerdo al número de
observaciones de cada grupo, asignándole mayor peso a los
grupos más grandes.

sb2 
n1 ( X 1  X ) 2  n2 ( X 2  X ) 2  nk ( X k  X ) 2

n (X
i i  X)
K 1 K 1

2
6/24/2021

El estadístico F:

Variabilidad entre grupos


F=
Variabilidad dentro de cada grupo

oneway edad plan

Analysis of Variance

Source SS df MS F Prob > F


-----------------------------------------------------------------
Between groups 20539.4732 2 10269.7366 1489.84 0.0000
Within groups 2936.48951 426 6.89316786
-----------------------------------------------------------------
Total 23475.9627 428 54.8503801

Supuestos:

•Independencia
•Normalidad
•Homocedasticidad

3
6/24/2021

Normalidad
PlanC
49

24
a b c

Normalidad
-> plan = A
-------------------------------------------------------------
Percentiles Smallest
1% 24 24
5% 26 24
10% 26 24 Obs 142
25% 28 25 Sum of Wgt. 142

50% 30 Mean 29.98592


Largest Std. Dev. 2.633623
75% 32 35
90% 34 36 Variance 6.93597
95% 34 36 Skewness -.0080564
99% 36 36 Kurtosis 2.624882

Normalidad
-> plan = B
-------------------------------------------------------------
Percentiles Smallest
1% 26 26
5% 26 26
10% 27 26 Obs 143
25% 28 26 Sum of Wgt. 143

50% 31 Mean 30.65035


Largest Std. Dev. 2.758492
75% 33 35
90% 34 35 Variance 7.609278
95% 35 35 Skewness -.1664818
99% 35 35 Kurtosis 1.992528

4
6/24/2021

Normalidad
-> plan = C
-------------------------------------------------------------
Percentiles Smallest
1% 41 41
5% 41 41
10% 41 41 Obs 143
25% 44 41 Sum of Wgt. 143

50% 45 Mean 45
Largest Std. Dev. 2.463823
75% 46 49
90% 49 49 Variance 6.070423
95% 49 49 Skewness 0.000
99% 49 49 Kurtosis 2.20742

by plan: swilk edad


-> plan = A Shapiro-Wilk W test for normal data
Variable | Obs W V z Prob>z
-------------+-------------------------------------------------
edad | 142 0.99793 0.230 -3.324 0.99956

-> plan = B Shapiro-Wilk W test for normal data


Variable | Obs W V z Prob>z
-------------+-------------------------------------------------
edad | 143 0.97661 1.612 1.172 0.14955

-> plan = C Shapiro-Wilk W test for normal data


Variable | Obs W V z Prob>z
-------------+-------------------------------------------------
edad | 143 0.98513 1.661 1.148 0.12548

Homocedasticidad

H0 : 1 = 2 = 3

H1 : Por lo menos una de las varianzas es


diferente.

5
6/24/2021

Comparaciones múltiples
Corrección de Bonferroni:

Valor de p ajustado por Bonferroni:

Valor de p * número de comparaciones


(pBonf)

oneway edad plan, bonferroni

Comparison of Plan by plan


PlanC
(Bonferroni) 49

Row Mean-|
Col Mean | a b
---------+--------------------
b | .636364
| 0.123
|
c | 14.986 14.3497
| 0.000 0.000 24
a b c

Recordar:

• ANOVA, test paramétrico (2 ó más grupos)


• Supuestos: independencia, normalidad y
homocedasticidad
• Estadístico F
• H 0 : 1 = 2 = 3 = 4
• H1 : Al menos una de las  es diferente
• Corrección para comparaciones múltiples
• Alternativa no paramétrica: Kruskal Wallis

6
6/24/2021

Score de quejas por plan

| Summary of enojo
plan | Mean Std. Dev. Freq.
------------+------------------------------------
1 | 7.4886878 6.5393356 44
2 | 8.0657895 7.2938975 15
3 | 11.578947 19.983502 7
------------+------------------------------------
Total | 8.0835821 9.3052631 66

Normalidad
plan==1 plan==2
.771493

0
Fraction

1 140
plan==3
.771493

0
1 140

enojo
Histograms by plan

Homocedasticidad

H0 : 1 = 2 = 3

H1 : Por lo menos una de las varianzas es diferente.

7
6/24/2021

Estrategia incorrecta: ANOVA

. oneway enojo plan

Analysis of Variance
Source SS df MS F Prob > F
----------------------------------------------------------------------
Between groups 1085.00754 2 542.503772 5.02 0.0018
Within groups 6842.31192 63 108.603172
----------------------------------------------------------------------
Total 7927.3194 65 121.958760

Bartlett's test for equal variances: chi2(2) = 25.5138


Prob>chi2 = 0.000

Alternativa no paramétrica: Kruskal Wallis

kwallis enojo, by(plan)

Test: Equality of populations (Kruskal-Wallis test)

plan _Obs _RankSum


1 44 143834.00
2 15 52641.00
3 7 28310.00

chi-squared = 4.452 with 2 d.f.


probability = 0.1080

chi-squared with ties = 4.478 with 2 d.f.


probability = 0.1066

También podría gustarte