Está en la página 1de 26

16/12/2011

Análisis de datos y gestión veterinaria

Análisis de la varianza

Departamento de Producción Animal – Facultad de Veterinaria


Universidad de Córdoba

Córdoba, 16 de Diciembre de 2011

Diseño de experimentos

¿Ambos alimentos tienen la misma digestibilidad?

Diseño experimental: mecanismo


utilizado para generar las observaciones
muestrales.

1
16/12/2011

Diseño por parejas: se controla la


Diseño de experimentos
variabilidad debida al factor animal
¿Ambos alimentos tienen la misma digestibilidad?
Contraste de igualdad de medias con datos pareados
¿con qué probabilidad se puede dar por cierto que la media de A es
diferente a la media de B?

Alimento A Alimento B

n = 5 ovejas

Oveja 1 Oveja 2 Oveja 3 Oveja 4 Oveja 5

A B A B A B A B A B

DiseñoDiseñoaleatorio: se controla la
de experimentos
variabilidad debida al factor animal
mediante
¿Ambos la aleatoriedad
alimentos tienen la misma digestibilidad?
Contraste de igualdad de medias de muestras aleatorias
independientes
¿con qué probabilidad se puede dar por cierto que la media de A es
diferente a la media de B?
Alimento A Alimento B

n = 10 ovejas

Ovejas 1, 3, 8, 9, 10 Ovejas 2, 4, 5, 6, 7

A B

2
16/12/2011

Diseño de experimentos

¿Ambos alimentos tienen la misma digestibilidad?


Factor. Es la variable objeto de estudio (en este caso,
la digestibilidad del alimento)
Tratamiento. Cada uno de los niveles del factor
Alimentode
objeto A estudio (en este caso 2, alimento
Alimento
A yB
alimento B).

X A = µA + ε A X A = µA + ε A
¿¿A qué se debe el
error?

Diseño de experimentos

¿Ambos alimentos tienen la misma digestibilidad?


P. e.
- Diferencias individuales entre ovejas.
- El investigador que medía estaba cansado cuando
midió lasAúltimas ovejas.
Alimento Alimento B
- El grupo con alimento A estaba a la sombra y el del
alimento B al sol.

X A = µA + ε A X A = µA + ε A

A las condiciones experimentales

3
16/12/2011

Diseño de experimentos

¿Ambos alimentos tienen la misma digestibilidad?


Factor. Es la variable objeto de estudio (en este caso,
la digestibilidad del alimento)
Tratamiento. Cada uno de los niveles del factor
Alimentode
objeto A estudio (en este caso 2, alimento
Alimento
A yB
alimento B).

X A = µA + ε A X A = µA + ε A
¿¿Cómo afecta el
error?

Diseño de experimentos

¿Ambos alimentos tienen la misma digestibilidad?


El error aleatorio se controla en el experimento:
- Que todo lo que afecte al experimento suceda igual
en todos los tratamientos (Que los animales pasen el
mismo
Alimentotiempo
A al sol que a la sombra). Alimento B
- Que lo que no se pueda controlar, que ocurra por
azar (P.e. cada día las mediciones se hacen en orden
aleatorio).
Si el error es aleatorio, el problema se soluciona
X A = µA + ε A incrementando n
X A = µA + ε A
(recuerden: σ )
E .E . = X

Si el error es aleatorio, las medias muestrales


y sus varianzas serán afectadas por igual

4
16/12/2011

Diseño de experimentos

¿Ambos alimentos tienen la misma digestibilidad?


Si el error no es aleatorio, sino sistemático (es
decir, afecta más a uno de los tratamientos y menos en
otros), existe sesgo.
Alimento A Alimento B
P.e. un grupo de ovejas estaba al sol.
P.e. un grupo de ovejas estaba enfermo.
Si el error es sistemático, el problema no se puede
solucionar. El experimento no es válido: no podemos saber si
X A = µ Alas
+ εdiferencias
A
X A = µA + ε A
se deben al sesgo o al tratamiento.

Si el error no es aleatorio, sino sistemático,


sólo afectará a las varianzas y medias
muestrales de algunos tratamientos.

Comparación de las medias de dos


poblaciones
¿Ambos alimentos tienen la misma digestibilidad?

Diseño aleatorio: se controla la


variabilidad debida al factor animal
Alimento A
mediante la aleatoriedad Alimento B

X A = µA + ε A X A = µA + ε A

Diseño por parejas: se controla la


variabilidad debida al factor animal

5
16/12/2011

Comparación de las medias de dos


poblaciones

Alimento A Alimento B

Alimento C

Comparación de las medias de dos


poblaciones

Alimento A Alimento B

Análisis de la varianza (ANOVA)

Alimento C

6
16/12/2011

¿Son diferentes las medias?


El factor crítico es la variabilidad.
¿laAnálisis de laavarianza
variabilidad entorno cada media esde un respecto
pequeña factora la
variabilidad entre las diferentes medias?
Alimento A Alimento B Alimento C
(%) (%) (%)
50 55 60
60 65 70
55 60 65
54 59 64
56 62 66
medias 55 60,2 65
Alimento A Alimento B
70
Digestibilidad

66

H 0 : µ A = µ B = µC 62

58

54

50
A
Alimento CB C
Alimento

¿Son diferentes las medias?

Análisis de la varianza de un factor


Alimento A Alimento B Alimento C
(%) (%) (%)
50 55 60
60 65 70
55 60 65
54 59 64
56 62 66
medias 55 60,2 65
Alimento A Alimento B
68
Digestibilidad

65

H 0 : µ A = µ B = µC 62

59

56

53
A B C
El factor crítico es la variabilidad.
Alimento
¿la variabilidad entorno a cada media es pequeña C Alimento
respecto a la variabilidad entre
las diferentes medias?

7
16/12/2011

¿Son
Análisis dediferentes las medias?
la varianza de un factor
El factor crítico es la variabilidad.
¿la variabilidad entorno a cada media es pequeña
respecto a la variabilidad entre las diferentes medias?

Si la variabilidad entorno a cada media es “pequeña”


respecto
Alimento Aa la variabilidad entre las medias, Alimento
Ho tieneB
evidencias en contra.

H 0 : µ A = µ B = µC Si la variabilidad entorno a cada media


es “grande” respecto a la variabilidad
entre las medias, Ho tiene evidencias a
favor.

Alimento C

Si la variabilidad entorno a Si la variabilidad entorno a


cada media Análisis ¿Son
dediferentes
es “pequeña” lascada
la varianza medias?
media
de un es “grande”
factor
respecto a la variabilidad entre respecto a la variabilidad entre
las medias, Ho tiene las medias, Ho tiene
evidencias en contra. evidencias a favor.
68 73
Digestibilidad

Digestiblidad

65 69
65
62
61
59
57
56
53
53 49
A B C A B C
Los datos se concentran H 0 : aµ A = µ B =Los
Alimento entorno µC datos están
Alimento
muy dispersos.
las medias.
70
Alimento A Alimento B Alimento C 81
Alimento A Alimento B Alimento C
Digestibilidad

(%) (%) (%)


Digestibilidad

66 71
50 55 60 (%) (%) (%)
62 60 65 70 70 70 74
55 60 65 61 68 62 70
58 45 67 58
54 59 64
56 62 66 51 51 42 72
54
medias 55 60,2 65 41 60 51
50 41
medias 55 60,2 65
A B C A B C
Alimento Alimento

8
16/12/2011

H 0 : µ A = µ B = µC
Análisis de la varianza de un factor

Alimento A Alimento B Alimento C


(%) (%) (%)
Alimento A Alimento B
50 55 60
60 65 70
55 60 65
54 59 64
56 62 66
medias 55 60,2 65

Alimento C

H 0 : µ A = µ B = µC
Análisis de la varianza de un factor
Alimento A
(%)
Alimento B
(%)
Alimento C
(%)
X A = 55
50 55 60 X B = 60, 2
60 65 70
55 60 65 X C = 65
54 59 64
56 62 66
medias 55 60,2 65 K ni
K

∑∑ ∑∑
x
ni
x
i =1 ijj =1
ij

X =
ABCi =1 j =1
X ABC = n = 60, 06
n

9
16/12/2011

H 0 : µ A = µ B = µC
Análisis de la varianza de un factor
Alimento A Alimento B
(%) (%)
Alimento C
(%)
X A = 55
50 55 60 X B = 60, 2
60 54,8 65 70
52 55 60 65 X C = 65
54 59 52 64
56 62 66 SCD = 158,8
medias 55 60,2 65

SCD (suma de cuadrados dentro de los grupos). Indica la


variabilidad entorno a las medias. K n
SCD = ∑∑ ( xij − xi )
i
2

i =1 j =1

SCT = SCD + SCG

H 0 : µ A = µ B = µC
Análisis de la varianza de un
X
factor
= 60, 06 ABC

Alimento A Alimento B
(%) (%)
Alimento C
(%)
X A = 55
50 55 60 X B = 60, 2
60 54,8 65 70
52 55 60 65 X C = 65
54 59 52 64
56 62 66 SCD = 158,8
medias 55 60,2 65

SCG = 5—(52-60,06)2 + 5—(54,8-60,06)2 + 5—(52-60,06)2 = 250,1


SCG (suma de cuadrados entre grupos). Indica la
variabilidad entre las medias. K
SCG = ∑ ni ( xi − x )
2

i =1

SCT = SCD + SCG

10
16/12/2011

H 0 : µ A = µ B = µC
Análisis de la varianza de un
X
factor
= 60, 06 ABC

Alimento A
(%)
Alimento B
(%)
Alimento C
(%)
X A = 55
50 55 60 X B = 60, 2
60 65 70
55 60 65 X C = 65
54 59 64
56 62 66 SCD = 158,8
medias 55 60,2 65
SCG= 250,01

SCG (suma de cuadrados entre grupos). Indica la


variabilidad entre las medias. K
SCG = ∑ ni ( xi − x )
2

i =1

SCT = SCD + SCG

H 0 : µ A = µ B = µC
Análisis de la varianza de un
X
factor
= 60, 06 ABC

Alimento A
(%)
Alimento B
(%)
Alimento C
(%)
X A = 55
50 55 60 X B = 60, 2
60 65 70
55 60 65 X C = 65
54 59 64
56 62 66 SCD = 158,8
medias 55 60,2 65
SCG = 250,1
SCT = 408,9

SCT (suma de cuadrados total). Indica la variabilidad


entre todas las observaciones con la media global

SCT = SCD + SCG

11
16/12/2011

H 0 : µ A = µ B = µC
Análisis de la varianza de un factor
Alimento A Alimento B Alimento C
(%) (%) (%)
50 55 60
60 65 70
55 60 65
54 59 64
56 62 66
medias 55 60,2 65

SCD
es un estimador
CMD = insesgado de la
n−K
varianza poblacional

Si Ho fuese cierta,
SCG
CMG = CMG también es un
K −1
estimador insesgado de
la varianza poblacional

H 0 : µ A = µ B = µC
Análisis de la varianza de un factor

Si F>1, CMG ha
estimado la varianza
común poblacional
más la variación
debida al factor
SCD estudiado
CMD =
n−K
CMG
F=
CMD
SCG
CMG = Si F tiende a 1,
K −1 ambos estimadores lo
son de la misma
varianza

12
16/12/2011

H 0 : µ A = µ B = µC
Análisis de la varianza de un factor

X = 55
1. CMD, es muy pequeño respecto a CMG.A
X = 60, 2
2. Como CMD es la estimación correctaB de la
varianza común, CMG incorpora, además X C = de
65 la
varianza común, otras fuentes de variación.
3. Como el experimento está bien hecho (no hay
sesgo), no hay otras fuentes de variación más que el
alimento

4. Luego, hay evidencias en contra de Ho

… esto significa que…

H 0 : µ A = µ B = µC
Análisis de la varianza de un factor

X = 55
1. CMD, es muy pequeño respecto a CMG.A
X = 60, 2
2. Como CMD es la estimación correctaB de la
varianza común, CMG incorpora, además X C = de
65 la
varianza común, otras fuentes de variación.
3. Como el experimento está bien hecho (no hay
sesgo), no hay otras fuentes de variación más que el
alimento

4. Luego, hay evidencias en contra de Ho

vale, hay evidencias en contra de Ho pero…


… ¿¿cómo de verosímiles son esas evidencias??

13
16/12/2011

H 0 : µ A = µ B = µC
Análisis de la varianza de un factor

Suma Grados Cuadrados Cociente Valor


Fuente
cuadrados libertad medios F P
Entre SGC k–1 CMG CMG
grupos CMD
Dentro SCD n–k CMD
grupos
Total SCT n–1
vale, hay evidencias en contra de Ho pero…
… ¿¿cómo de verosímiles son esas evidencias??

H 0 : µ A = µ B = µC
Análisis de la varianza de un factor

Distribución F de Fisher – Snedecor:

χ v2
Valor
P
F= 2
χn CMG
CMD

0,8

SCG 0,6
densidad

F = k −1 0,4
SCD
0,2
n−k
0
0 1 2 3 4 5
x

14
16/12/2011

H 0 : µ A = µ B = µC
Análisis de la varianza de un factor

Si Ho fuese cierta, F sigue una distribución F de Fisher –


Snedecor:
SCG
F = k −1
SCD
n−k

Rechazar Ho si F > Fα

H 0 : µ A = µ B = µC
Análisis de la varianza de un factor

Normalmente se calcula la probabilidad Valor


a la que se puede rechazar Ho P
0,8

0,6
densidad

0,4

0,2
1−α

0 α
0 1 2 F 3 4 5
x

15
16/12/2011

H 0 : µ A = µ B = µC
Análisis de la varianza de un factor

Si Ho fuese cierta, F sigue


una distribución F de Fisher
– Snedecor:

SCG 250,1
F = k −1 F = 3 −1
SCD 158,8
n−k 15 − 3 F(2,12)
Rechazar Ho si F > Fα

H 0 : µ A = µ B = µC
Análisis de la varianza de un factor

Suma Grados Cuadrados Cociente Valor


Fuente
cuadrados libertad medios F P
Entre SGC k–1 CMG CMG
grupos 250,1 3–1 125,1 CMD
Dentro SCD n–k CMD
9,45
grupos 158,8 15 – 3 13,23
Total SCT n–1
408,9 14
Alimento A Alimento B Alimento C
(%) (%) (%)
50 55 60
60 65 70
55 60 65
54 59 64
56 62 66
medias 55 60,2 65

16
16/12/2011

H 0 : µ A = µ B = µC
Análisis de la varianza de un factor
F(2,12) CMG
CMD

1,2 9,45
1
α = 0, 003343
densidad

0,8
0,6 F = 9, 45
0,4
0,2
0
0 2 4 6 8 10 12
x

H 0 : µ A = µ B = µC
Análisis de la varianza de un factor
Alimento A Alimento B Alimento C
(%) (%) (%)
50 55 60
Suma 65 Grados 70 Cuadrados Cociente Valor
Valor
Fuente 60
cuadrados
55 60 libertad 65 medios F PP
54 59 64
Entre 56 SGC 62 k – 1 66 CMG CMG
CMG 0,00334
0,00334
medias 55 60,2 65
grupos 250,1 3–1 125,1 CMD
CMD
Dentro SCD n–k CMD
9,45
9,45
grupos 158,8 15 – 3 13,23
Total SCT n–1
408,9 14

17
16/12/2011

Análisis de la varianza de un factor

Supuestos básicos

1. Independencia

2. Normalidad

3. Homocedasticidad

Análisis de la varianza de un factor

Supuestos básicos

1. Independencia

2. Normalidad
0,6
densidad

0,4

0,2

0
-3 1 5 9
0 3 6
x

18
16/12/2011

Análisis de la varianza de un factor

3. Homocedasticidad

0,6
0,5
densidad

0,4
0,3
0,2
0,1
0
-4 6 16
0 3 6
x

Análisis de la varianza de un factor

3. Homocedasticidad

0,6
densidad

0,4

0,2

0
-3 1 5 9
0 3 6
x

19
16/12/2011

Análisis de la varianza de un factor

3. Homocedasticidad

0,6
densidad

0,4

0,2

0
-3 1 5 9
x

0,4

Análisis de
0,3 la varianza de un factor
densidad

0,2
3. Homocedasticidad
0,1

0
-26 -16 -6 4 14 24
x
0,6
densidad

0,4

0,2

0
-3 1 5 9
x

20
16/12/2011

Análisis de la varianza de un factor

Supuestos básicos

1. Independencia

2.
2. Normalidad
Normalidad?¿?¿

3. Homocedasticidad

Prueba de Kruskal – Wallis

Prueba de Kruskal – Wallis

Prueba de Kruskal – Wallis

Método no paramétrico

Idéntico a ANOVA, sustituyendo los datos por rangos

Extensión de la prueba U de Mann–Whitney con 3 o más


categorías

En cada categoría n≥5

Más robusto que ANOVA, aunque menos potente

21
16/12/2011

H 0 : µ A = µ B = µC
Prueba de Kruskal – Wallis
Alimento A Alimento B Alimento C
(%) (%) (%)
50 55 60
60 65 70
55 60 65
54 59 64
56 62 66
medias 55 60,2 65

Extensión de la prueba U de Mann–Whitney con 3 o más


categorías

1. Ordenar los datos de modo ascendente

2. Asignar los rangos

3. Reordenar los rangos


4. Sumar los rangos

H 0 : µ A = µ B = µC
Prueba de Kruskal – Wallis

Alimento Alimento %
A Alimento Rango
Alimento
B Alimento C % Rango
A (%) 50 (%) A (%) 50
A 50 60 55 A 60 54
60 65 A 70 55
A 55
55 60 65
A 54 54 59 B 64 55
A 56 56 62 A 66 56
medias
B 55 55 60,2 B 65 59
B 65 A 60
B 60 B 60
B 59 C 60
B 62 B 62
C 60 C 64
C 70 B 65
C 65 C 65
C 64 C 66
C 66 C 70
1. Ordenar los datos de modo ascendente

22
16/12/2011

H 0 : µ A = µ B = µC
Prueba de Kruskal – Wallis
Alimento
Alimento A % B
Alimento Rango
Alimento C
A(%) 50
(%) (%) 1
A50 55
60 60 2
A60 65
55 70
3,5
55 60 65
A54 54
59 64 3,5
A56 56
62 66 5
medias B55 60,2
55 65 6
B 65 8
B 60 8
B 59 8
B 62 10
C 60 11
C 70 12,5
C 65 12,5
C 64 14
C 66 15

2. Asignar los rangos

H 0 : µ A = µ B = µC
Prueba de Kruskal – Wallis
Alimento % B Alimento
Alimento A Alimento Rango
RangoC
A(%) 50
(%) (%) 1
A50 55
60 60 2
60 65 70
A 55 3,5
55 60 65
A54 54
59 64 3,5
A56 56
62 66 5
medias 55 60,2 65 6
Alimento A B Rango 55
Alimento B Rango Alimento C Rango
(%) B 65 (%) 8 (%)
50 B 1 60 55 8 3,5 60 8
60 B 8 59 65 8 12,5 70 15
55 B 3,5 62 60 10 8 65 12,5
54 C 2 60 59 11 6 64 11
56 C 5 70 62 12,510 66 14
C 65 12,5
C 64 14
C 66 15

3. Reordenar los rangos

23
16/12/2011

H 0 : µ A = µ B = µC
Prueba de Kruskal – Wallis
Alimento A Alimento B Alimento C
(%) (%) (%)
50 55 60
60 65 70
55 60 65
54 59 64
56 62 66
medias 55 60,2 65
Alimento A Rango Alimento B Rango Alimento C Rango
(%) (%) (%)
50 1 55 3,5 60 8
60 8 65 12,5 70 15
55 3,5 60 8 65 12,5
54 2 59 6 64 11
56 5 62 10 66 14
19,5 40 60,5

4. Sumar los rangos

H 0 : µ A = µ B = µC
Prueba de Kruskal – Wallis

12 k
Ri2
W= ∑ − 3 ( n + 1)
n ( n + 1) i =1 ni

12  (19,5) 2 (40) 2 (60,5) 2 


W= + + − 3 (15 + 1) = 8, 405
15 (15 + 1)  5 5 5 

Alimento A Rango Alimento B Rango Alimento C Rango


(%) (%) (%)
50 1 55 3,5 60 8
60 8 65 12,5 70 15
55 3,5 60 8 65 12,5
54 2 59 6 64 11
56 5 62 10 66 14
19,5 40 60,5

24
16/12/2011

H 0 : µ A = µ B = µC
Prueba de Kruskal – Wallis

12 k
Ri2
W= ∑ − 3 ( n + 1)
n ( n + 1) i =1 ni

12  (19,5) 2 (40) 2 (60,5) 2 


W= + + − 3 (15 + 1) = 8, 405
15 (15 + 1)  5 5 5 

Si Ho fuese cierta, W sigue una distribución


2
k −1 χ

Rechazar Ho si χ k2−1 > χ k2−1,α

H 0 : µ A = µ B = µC
Prueba de Kruskal – Wallis

W = 8, 405 χ 2,2 α
0,6
0,5
α = 0, 0149
densidad

W = 8, 05
0,4
0,3
0,2
0,1
0
0 2 4 6 8 10 12
x

25
16/12/2011

H 0 : σ A2 = σ B2 = σ C2
Contrastes de homocedasticidad

Todos tienen como hipótesis nula igualdad de varianzas.

Test de Levene. ANOVA de los valores absolutos de las


desviaciones de los valores muestrales respecto a un
estadístico de centralidad (media, mediana o media
truncada) para cada grupo.

26

También podría gustarte