Está en la página 1de 99

EXPERIMENTOS CON

UN SOLO FACTOR:
EL ANALISIS DE
VARIANZA
CAPITULO 3
Diseo y Anlisis de Experimentos
Montgomery
Compendi: Ing. Rodrigo Wadnipar, M.Sc.
rwadnipa@uninorte.edu.co
NDICE
Experimentos con un solo factor: anlisis de
variancia.
Estimacin de los parmetros del modelo.
Comparacin de Medias de Tratamientos
Individuales
Ccomparacin de Parejas de Medias de
Tratamientos
Efecto de Modelos Aleatorios
UN EJEMPLO
Ejemplo 3.1 Pag. 70 - Peso porcentual del algodn
Un ingeniero de desarrollo de producto tiene inters en investigar la resistencia
a la tensin de la fibra sinttica nueva que se usar para hacer tela de camisas
para caballero. El ingeniero sabe por experiencia previa que la resistencia a la
tensin se afecta por el peso porcentual del algodn utilizado en la mezcla de
materiales de la fibra. Adems, sospecha que al aumentar el contenido de
algodn se incrementar la resistencia. Sabe asimismo que el contenido de
algodn deber variar entre 10 y 40 por ciento para que el producto final tenga
otras caractersticas de calidad que se desean (como la capacidad de ser
sometido a un tratamiento de planchado permanente). El ingeniero decide
probar ejemplares en cinco niveles del peso porcentual del algodn: 15, 20, 25,
30 y 35 por ciento. Tambin decide probar cinco ejemplares en cada nivel del
contenido de algodn.

Peso Observaciones
porcentual
del algodn 1 2 3 4 5
15 7 7 15 11 9
20 12 17 12 18 18
25 14 18 18 19 19
30 19 25 22 19 23 39
35 7 10 11 15 11
Peso porcentual del algodn (continuacin)

Peso
porcentual Nmero de corrida experimental
del algodn
15 1 2 3 4 5
20 6 7 8 9 10
25 11 12 13 14 15
30 16 17 18 19 20
35 21 22 23 24 25
Peso porcentual del algodn (continuacin)
Secuencia de prueba Nmero de corrida Porcentaje de algodn

1 8 20
2 18 30
3 10 20
4 23 35
5 17 30
6 5 15
7 14 25
8 6 20
9 15 25
10 20 30
11 9 20
12 4 15
13 12 25
14 7 20
15 1 15
16 24 35
17 21 35
18 11 25
19 2 15
20 13 25
21 22 35
22 16 30
23 25 35
24 19 30
25 3 15
Resultados del Experimento

Peso porcentual del Observaciones


algodn 1 2 3 4
15 7 7 15 11
20 12 17 12 18
25 14 18 18 19
30 19 25 22 19
Peso porcentual del algodn (continuacin)

Figura 3-1 9
Peso porcentual del algodn (continuacin)

Observaciones Individuales
Promedio de la resistencia a la Tensin 57
Figura 3-2
LSD
(Diferencia Significativa Minima de Fisher)

1 1 Criterio de Rechazo 02 2,a 1


LSD t MS E
, N a n n
2
i j
KRUSKAL-WALLIS
(Metodo no parametrico del analisis de varianza)
1 a ni
N N 1 2

S Rij
2 2

N 1 i 1 j 1 4

1 a Ri2 N N 1
2
H 2
S i 1 i
n 4

Transformacion de rangos Aplicando F


H
F0
a 1
N 1 H
N a
EL ANALISIS DE VARIANZA
MODELO PARA LOS DATOS
Es til describir las observaciones mediante el modelo
estadstico lineal
yij = i + eij , donde i = 1, 2, ... , a; j = 1, 2, ... n (3.1)
yij es la observacin ij-sima.
i es la media del nivel del factor o tratamiento i-simo.
eij es un componente del error aleatorio que incorpora todas las
dems fuentes de variabilidad del experimento
A la ecuacin (3.1) se le llama modelo de medias. Una forma
alternativa de describir un modelo de los datos es definiendo
i = + i , i = 1, 2, , a
De tal modo que la ecuacin (3.1) se convierte en
yij = + i + eij , donde i = 1, 2, ... , a; j = 1, 2, ... n (3.2)
es la media global
i es el efecto del tratamiento i-simo
A la ecuacin (3.2) se le llama el modelo de los efectos.
ANALIS DEL MODELO CON
EFECTOS FIJOS
Anlisis del Modelo con Efectos Fijos
n


i 1
i 0
n _
yi. yij , , , , , y i. y i./ n, _ donde _ i 1,2,..., a.
j 1
(3.3)
a n
y.. yij , , , , y.. y.. / N
i 1 j 1
Donde N = an es el nmero total de observaciones.
El subndice punto implica la operacin suma sobre el
subndice que reemplaza.

a = Nmero de niveles o nmero de tratamientos.


n = Nmero de observaciones por nivel o tratamiento.
Anlisis del Modelo con Efectos Fijos (continuacin)
El inters se encuentra en probar la igualdad de las
a medias de los tratamientos; es decir,
E(yij) = + i = i, i = 1, 2, , a. Las hiptesis son:
Ho: 1 = 2 = ... = a
H1: i j para al menos un par (i, j)
En el modelo de los efectos, la media i del tratamiento i-simo
se descompone en dos componentes tales que i = + i. Por
lo general, se considera como una media global, de tal modo
que
a
a
i 1
a
i
Esta definicin implica que i0
i 1

Es decir, los efectos del tratamiento o factor pueden
considerarse como desviaciones de la media global. Una forma
de escribir las hiptesis anteriores es en trmino de los efectos
de los tratamientos i
Ho: 1 = 2 = ... = a = 0 El procedimiento apropiado para
probar la igualdad de las medias,
H1: i 0 for at least one i es el anlisis de varianza
DESCOMPOSICION DE LA SUMA DE
CUADRADOS TOTAL
El nombre anlisis de varianza se deriva de la particin de
variabilidad total en sus partes componentes. La suma de cuadrados

y y
total corregida 2 a n
SS T ij
i 1 j1
..

se usa como una medida de la variabilidad global de los datos.


La suma de cuadrados total corregida SST se puede escribir como

yij y..
a

i 1 j1
n
2

a

i 1 j1
n
(y y )(y y )
i. .. ij i.
2
(3.4)


a n
y y y y
ij ..
2
n
a

i. ..
2


a n
y y ij i.
2
2
a n
yi. y.. yij yi. (3.5)

y y y n y y nyi. / n 0
i 1 j 1 i 1 i 1 j 1 i 1 j 1
n
Sin embargo :
ij i. i. i. i.

y y yi. y.. yij yi.


j 1 2
a n 2 a a n 2
ij n (3.6)
i 1 j 1
.. i 1 i 1 j 1

16 SS SS T Tratamientos
SS E
DESCOMPOSICION DE LA SUMA DE
CUADRADOS TOTAL (continuacin)
Es til examinar los dos trminos del lado derecho de la identidad
fundamental del ANOVA.

E
a n

i 1 j 1

SS y ij y i. y ij y i.
2 a

i 1
n

j 1

2

En esta forma es fcil ver que el trmino entre corchetes, si se divide


por n-1, es la varianza muestral del tratamiento i-simo, o

y ij y i.
n
2

S , , , , , para :, , , , i 1,2,..., a
2 j 1
i
n1
Si se combinan las a varianzas muestrales se obtiene una sola


estimacin de la varianza poblacional

... n 1 S y ij y i.
a n 2

n 1 S n 1 S
2
1
2
2

2
a i 1 j 1
SS E

(n 1) (n 1) ... (n 1) n 1
a
N a
i 1
DESCOMPOSICION DE LA SUMA DE
CUADRADOS TOTAL (continuacin)
La relacin NSS a es una estimacin combinada
E

de la varianza comn dentro de cada uno de los a


tratamientos.
De manera similar, si no hubiera diferencia entre
las medias de los tratamientos, podra usarse la
variacin de los promedios de los tratamientos y el
gran promedio para estimar s2. Especficamente

SS
a
n yi. y..
2

Tratamientos
i 1
a 1 a 1
Es una estimacin de s2 si las medias de los
tratamientos son iguales.
DESCOMPOSICION DE LA SUMA DE
CUADRADOS TOTAL (continuacin)
La identidad del anlisis de varianza (ecuacin 3.6) proporciona dos
estimaciones de s2:
Una basada en la variabilidad inherente dentro los tratamientos.
Una basada en la variabilidad entre los tratamientos.
Si no hay diferencias en las medias de los tratamientos, estas dos
estimaciones debern ser muy similares, y si no lo son, se sospecha
que la diferencia observada puede ser causada por diferencias en las
medias de los tratamientos.
SS Tratamientos
A las cantidades MS Tratamientos (entre los tratamientos)
a 1
MS E SS E
y
N a (dentro de los tratamientos)

se les llama cuadrados medios.


TEOREMA DE COCHRAN
Si Zi igual a NID(0, 1) para i = 1, 2,, v y
v

Z Q Q ... Q
2
i 1 2 S
i 1

Donde s < v, y Qi tiene vi grados de libertad (i = 1, 2,, s).


Entonces Q1, Q2,.., Qs son variables aleatorias ji-cuadrada
independientes con v1, v2,, vs grados de libertad, respectivamente, si y
solo si
v v v ... v
1 2 s

Puesto que los grados de libertad de SSTratamientos y SSE suman N 1,


el nmero total de grados de libertad, el teorema de Cochran implica que
SSTratamientos /s2 y SSE / s2 son variables aleatorias ji-cuadrada con una
distribucin independiente. Por lo tanto, si la hiptesis nula de que no
hay diferencias en las medias de los tratamientos es verdadera, el
coeficiente SS / a 1 MS
F
Tratamientos Tratamientos

SS / N a
0
E MS E

se distribuye como F con a -1 y N a grados de libertad. F0 es el


estadstico de prueba para la hiptesis. H0 se rechaza si:
F F 0 ,a 1, N a
TEOREMA DE COCHRAN (continuacin)
Es posible obtener frmulas para calcular estas sumas de
cuadrados reescribiendo y simplificando las definiciones de
SSTratamientos y SST, as:
2
ya n

SS y
2 ..
T ij
N
i 1 j 1

2
1 y a
y
2 ..
SS Tratamientos i.
n N i 1

La suma de cuadrados del error se obtiene por substraccin como:

SS SS SS
E T Tratamientos

El procedimiento de prueba se resume en las siguiente tablas:


Anlisis de Variancia
Anlisis de Variancia (continuacin)

(Tabla Analisis de Varianza para un Factor)


Fuente de Suma Cuadrados Grados de Cuadrado Medio
Fo
Variacion (SS) libertad (Dof) (MS)
1 a 2 y..2 MS
y
Entre los SS Trat
SS Trat . a 1 MS Trat . F0 Trat .
tratamiento n i 1 i. N Dof Trat MS E

Error (Dentro de SS E
SSE SST SSTrat. N a MS E
los tratamientos) Dof E
2
a n
y ..
Total SS T
i 1 j 1
y ij2
N
N 1
Peso porcentual del algodn Anlisis de Variancia

Datos de la resistencia a la tensin ( lb / pulg. 2 ) Totales


Porcenataje Observaciones
yi.
de algodn 1 2 3 4 5
15 7 7 15 11 9 49
20 12 17 12 18 18 77
25 14 18 18 19 19 88
30 19 25 22 19 23 108
35 7 10 11 15 11 54
y.. 376
Peso porcentual del algodn Anlisis de
Variancia (continuacin)

(Tabla Analisis de Varianza para un Factor)


Grados
Suma Cuadrado
Fuente de de
Cuadrados Medio Fo Fc P value
Variacion libertad
(SS) (MS)
(Dof)
Entre los
475,76 4 118,94 14,76 2,87 0,00000913
tratamiento
Error (Dentro
de los 161,2 20 8,06 Puesto que F0 = 14.76 > 2.87, se rechaza H 0 y se concluye
tratamientos) que la media de los tratamientos difieren; es decir, el peso
porcentual del algodn en la fibra afecta de manera
significativa la resistencia a la tensin media. Puesto que P
Total 636,96 24 value = 0.00000913 < 0.05, resfuerza la conclusin dada.

74
Ejercicio en clases
La fuerza de la tensin de la adhesin del mortero de cemento
portland es una caracterstica importante del producto. Un ingeniero
est interesado en comparar la fuerza de una formulacin
modificada en la que se han agregado emulsiones de ltex de
polmeros durante el mezclado, con la fuerza del mortero sin
modificar. El experimentador ha reunido 10 observaciones de la
fuerza de la formulacin modificada y otras 10 observaciones de la
formulacin sin modificar. Los datos se muestran a continuacin.
Podra hacerse referencia a las dos formulaciones diferentes como
dos tratamientos o como dos niveles del factor formulaciones.
Mortero Mortero sin
j
modificado modificar
1 16.85 17.50
2 16.40 17.63
3 17.21 18.25
4 16.35 18.00
5 16.52 17.86
6 17.04 17.75
7 16.96 18.22
8 17.15 17.90 Experimentos
9 16.59 17.96 Comparativos Simples
10 16.57 18.15
ESTIMACIN DE LOS PARMETROS DEL MODELO

Es necesarios desarrollar estimadores para los parmetros


del modelo de clasificacin, partiendo de:

yij i e ij
i es el efecto del tratamiento i-simo

Luego de desarrollar el mtodo de mnimos cuadrados,


derivar y simplificar obtenemos un sistema de ecuaciones
lineales, cuya solucin es la siguiente:


y ..

i y y , , , , , , , i 1,2,..., a
i. ..
ESTIMACIN DE LOS PARMETROS DEL MODELO (continuacin)

Ahora, es posible determinar un intervalo de confianza


para estimar la media del i-simo tratamiento, dicha media


es:
i i

Un intervalo de confianza para (1100% para el i-simo


tratamiento podra ser:

y t / 2, N a MS E
y t / 2, N a MS E
i. n i i. n
De la misma manera para una diferencia de medias, digamos
i j, sera:

y y t / 2, N a 2MS E
y y t / 2, N a 2MS E
i. j. n i j i. j. n
Ejemplo 3.3 Pag. 75: Siguiendo el ejemplo 3-1 pueden
encontrarse las estimaciones de la media global y de los

efectos de los tratamientos como: 376 / 25 15.04


Datos de la resistencia a la tensin ( lb / pulg. 2 )
Observaciones Totales Promedios
1 2 3 4 5
7 7 15 11 9 49 9.8
12 17 12 18 18 77 15.4
14 18 18 19 19 88 17.6
19 25 22 19 23 108 21.6
7 10 11 15 11 54 10.8
376 15.04

Y utilizando la ecuacin: i y y , , , , , , , i 1,2,..., a


i. ..

Calculamos los efectos de 1 a 5.


1 y y 9.80 15.04 5.24


1. ..

2 y y 15.40 15.04 0.36


2. ..

3 y y 17.60 15.04 2.56


3. ..

4 y y 21.60 15.04 6.56


4. ..

5 y y 10.80 15.04 4.24


5. ..
Ejemplo 3.3 (continuacin)

y t / 2, N a MS E
y t / 2, N a MS E
i. n i i. n
Con un intervalo de confianza del 95% para la media del
tratamiento 4 (30% de algodn), obtenemos: 21.60 2.651,
por lo que el intervalo quedara de la siguiente manera:

21.60 2.086
8.06 8.06
21.60 2.086
5 4 5
21.60 2.65 21.60 2.65
4

Por lo tanto, el intervalo de confianza de 95% es:

18.95 4 25.25
VERIFICACION DE LA
ADECUACION DEL
MODELO
EL SUPUESTO DE NORMALIDAD
La verificacin del supuesto de normalidad podra hacerse graficando
un histograma de los residuales.
Si se satisface el supuesto NID(0, s2) para los errores, esta grfica
deber parecerse como una muestra de una distribucin normal con
centro en cero. Pero con muestras pequeas suelen ocurrir
fluctuaciones significativas y pueden aparecer una desviacin
moderada de la normalidad.
Un procedimiento en extremo til es construir una grfica de
probabilidad normal de los residuales.
Los residuales se calculan as: Re sidualij yij yi .
Residuales - Peso porcentual del algodn
Peso porcentual Residuales
del algodn 1 2 3 4 5
15 -2.8 -2.8 5.2 1.2 -0.8
20 -3.4 1.6 -3.4 2.6 2.6
25 -3.6 0.4 0.4 1.4 1.4
30 -2.6 3.4 0.4 -2.6 1.4
35 -3.8 -0.8 0.2 4.2 0.2
EL SUPUESTO DE NORMALIDAD (continuacin)
RESIDUALES ORDENADOS

pj = (( j 0.5) / N) * 100
% Probabilidad
Secuencia j Residual
Normal
1 -3,8 2
2 -3,6 6
3 -3,4 10
4 -3,4 14
5 -2,8 18
6 -2,8 22 Grfica de Probabilidad Norm al de los Residuales
7 -2,6 26

% de Probabilidad
8 -2,6 30 150

0.5)/N)100)
9 -0,8 34

(Pj = (( j -
Normal
10 -0,8 38 100
11 0,2 42 50
12 0,2 46
13 0,4 50 0
14 0,4 54 -6 -4 -2 0 2 4 6
15 0,4 58
16 1,2 62 Residual (eij = yij - ybi.)
17 1,4 66
18 1,4 70
19 1,4 74
20 1,6 78
21 2,6 82
22 2,6 86
23 3,4 90
24 4,2 94
25 5,2 98
EL SUPUESTO DE NORMALIDAD (continuacin)

pj = (( j 0.5) / N) * 100
Grfica de Probabilidad Normal de los Residuales

120
% de Probabilidad Normal

100
(Pj = (( j - 0.5)/N)100)

80

60

40

20

0
-6 -4 -2 0 2 4 6
Residual (eij = yij - ybi.)
GRAFICA DE LOS RESIDUALES EN
SECUENCIA EN EL TIEMPO
RESIDUALES EN ORDEN
CRONOLOGICO
1 -3.4 GRAFICA DE LOS RESIDUALES CONTRA EL TIEMPO
2 0.4
3 2.6
4 0.2
5 3.4 6
6 -0.8
7 1.4
8 -3.4
RESIDUALES 4
9 1.4
10 1.4 2
11 2.6
12 1.2
13 0.4 0
14 1.6
15 -2.8 0 5 10 15 20 25 30
16 4.2
-2
17 -3.8
18 -3.6 -4
19 -2.8
20 0.4
21 -0.8 -6
22 -2.6
23 0.2 TIEMPO
24 -2.6
25 5.2
GRAFICA DE LOS RESIDUALES CONTRA
LOS VALORES AJUSTADOS
yi eij GRAFICA DE LOS RESIDUALES CONTRA LOS VALORES
9.8 -2.8 AJUSTADOS
9.8 -2.8
9.8 5.2
9.8 1.2 6
9.8 -0.8
5
15.4 -3.4
15.4 1.6 4
15.4 -3.4
15.4 2.6 3
15.4 2.6
2
Residuale eij

17.6 -3.6
17.6 0.4 1
17.6 0.4
17.6 1.4 0
17.6 1.4 -1 0 5 10 15 20 25
21.6 -2.6
21.6 3.4 -2
21.6 0.4
21.6 -2.6 -3
21.6 1.4 -4
10.8 -3.8
10.8 -0.8 -5
10.8 0.2
yij barra
10.8 4.2
10.8 0.2
GRAFICA DE LOS RESIDUALES
VS. LOS NIVELES
NIVEL RESIDUAL
15 -2.8 GRAFICA DE LOS RESIDUALES
15 -2.8
15 5.2 6
15 1.2 GRAFICA DE LOS RESIDUALES
15 -0.8 5
20 -3.4 6
20 1.6 4 4

RESIDUALES
20 -3.4
2 3
20 2.6
20 2.6 0
2
25 -3.6 0 5 10 15 20 25 30 35 40
RESIDUALES
-2
25 0.4 1
-4
25 0.4
25 1.4 -6 0
25 1.4 0 5 10 15
NIVELES 20 25 30 35 40
-1
30 -2.6
30 3.4 -2
30 0.4
30 -2.6 -3
30 1.4
35 -3.8 -4
35 -0.8
-5
35 0.2
35 4.2 NIVELES
35 0.2
DATOS NO BALANCEADOS
DATOS NO BALANCEADOS
En algunos experimentos de un solo factor, el nmero de
observaciones recolectadas en cada tratamiento pueden ser
diferentes, cuando esto ocurre, se dice que el diseo est
desequilibrado, es no balanceado.
Sigue siendo posible aplicar el anlisis de varianza
anteriormente establecido para datos no balanceados, pero
deben hacerse ligeras modificaciones en las frmulas de las
sumas de cuadrados.
Hay dos ventajas al elegir un diseo equilibrado:
Primera con muestras del mismo tamao, la estadstica
de la prueba es relativamente insensible a pequeas
desviaciones de la suposicin de la igualdad de las
varianzas en los tratamientos.
Segunda, el poder de la prueba se maximiza cuando las
muestras tienen el mismo tamao.
DATOS NO BALANCEADOS (continuacin)
Sea que se hagan ni observaciones bajo el tratamiento
i (i = 1, 2, , a) y que
N i 1 ni
a

Las frmulas para calcular manualmente SST y


SSTratamientos quedan como:

a
yi2. y..2
SSTratamientos
i 1 ni N
2
a n
y ..
SST y 2
ij
i 1 j 1 N
No se requieren ms cambios.
Ejercicio en clase (datos no balanceados)
Se estn investigando cuatro catalizadores que
pueden afectar la concentracin de un componente en
una mezcla lquida de tres componentes. Se obtienen
las siguientes concentraciones:
Catalizador
1 2 3 4
58.2 56.3 50.1 52.9
57.2 54.5 54.2 49.9
58.4 57.0 55.4 50.0
55.8 55.3 51.7
54.9
a) Tienen los cuatro catalizadores el mismo efecto
sobre la concentracin?
b) Analizar los residuales de este experimento.
c) Construir la estimacin de un intervalo de confianza de
99% para la respuesta media del catalizador 1.
PRUEBAS ESTADSTICAS
DE IGUALDAD DE
VARIANZA
PRUEBAS ESTADISTICAS PARA
IGUALDAD DE VARIANZA
Aun cuando es frecuente el uso de las grficas residuales para
diagnosticar la desigualdad de varianzas, se han propuesto tambin
varias pruebas estadsticas.
Estas pruebas pueden considerarse como pruebas formales de las
hiptesis H0: s21 = s22 = ... = s2a
H1: s2i s2j Para al menos un par (i, j)
Un procedimiento muy til es la prueba de Barlett.
La igualdad de varianza se conoce como homocedasticidad.

0 q
2 a
2.3026 donde q ( N a ) log10 S p ni log10 S i
2
( 1)
2

c i 1

Si2es la varianza c 1
1 a

3a 1 i 1
ni 1 N a
1

1


muestral de la

n 1S
a
poblacin i-sima 2
i i

2 i 1
S p
N a
PRUEBAS ESTADISTICAS PARA
IGUALDAD DE VARIANZA (continuacin)
La cantidad q es grande cuando la diferencia entre las
varianzas muestrales Si2 es considerablemente grande, y es
igual a cero cuando todas las Si2 son iguales.
H0 deber rechazarse para los valores de 02 que sean muy
grandes; es decir, se rechaza H0 slo cuando
20 > 2,a-1
Donde 2,a-1 es el punto porcentual superior a la
distribucin ji-cuadrada con a - 1 grados de libertad.
La prueba de Barlett es muy sensible al supuesto de
normalidad. Por consiguiente, cuando la validez de este
supuesto est en duda, no deber usarse la prueba de
Barlett.
Ejemplo 3.4 Pag. 82
Ya que el supuesto de normalidad no est entre dicho en
este ejemplo, se puede usar la prueba de Barlett.
Se calculan primero las varianzas muestrales de cada
tratamiento y se encuentra que: S21=11.2, S22=9.8, S23=4.3,
S24=6.8, S25=8.2. Entonces

4(11.2) 4(9.8) 4(4.3) 4(6.8) 4(8.2)


Sp 8.06
2

25 5
10 10 10 10 10

q 20 log (8.06) 4 log 11.2 log 9.8 log 4.3 log 6.8 log 8.2 0.45
10

1 5 1
c 1 1.10
3(4) 4 20

Y el estadstico de prueba es 0 2.3026 1.10 0.93


0.45 2

Puesto que 20.05, 4= 9.49, no puede rechazarse la hiptesis


nula y se concluye que las cinco varianzas son iguales.
3
PRUEBAS ESTADISTICAS PARA
IGUALDAD DE VARIANZA (continuacin)
La prueba de Levene modificada es un procedimiento muy til
ya que es robusto en cuanto a las desviaciones de normalidad.
Para probar la hiptesis de que las varianzas son iguales en
todos los tratamientos, la prueba de Levene modificada utiliza
las desviaciones absoluta dij de las observaciones yij de cada
tratamiento de la mediana de los tratamientos, por ejemplo yi.
Sea que estas desviaciones se denoten por
dij = I yij - yi I para i = 1, 2, , a; j = 1, 2, , ni
La prueba de Leveve modificada evala entonces si la media
de estas desviaciones es igual o no para todos los tratamientos.
Cuando las desviaciones medias son iguales, la varianza de las
observaciones de todos los tratamientos sern iguales.
El estadstico de prueba para la prueba de Levene es
simplemente el estadstico FANOVA usual para probar la
igualdad de las medias que se aplica a las desviaciones
absolutas.
Ejemplo 3.5 Pag. 83
Un ingeniero civil est interesado en determinar si cuatro
mtodos diferentes para estimar la frecuencia de las
inundaciones producen estimaciones equivalentes de la
descarga pico cuando se aplican a la misma cuenca.
Cada procedimiento se usa seis veces en la cuenca, y los
datos de las descargas resultantes son:

Mtodo de
Observaciones
Estimacin
1 0,34 0,12 1,23 0,70 1,75 0,12
2 0,91 2,94 2,14 2,36 2,86 4,55
3 6,31 8,37 9,75 6,09 9,82 7,24
4 17,15 11,82 10,95 17,20 14,35 16,82
Ejemplo 3.5 Pag. 83 (continuacin)
Mtodo de
Estimacin
Observaciones yi yi Si
1 0.34 0.12 1.23 0.70 1.75 0.12 0.71 0.52 0.66
2 0.91 2.94 2.14 2.36 2.86 4.55 2.63 2.61 1.19
3 6.31 8.37 9.75 6.09 9.82 7.24 7.93 7.81 1.65
4 17.15 11.82 10.95 17.20 14.35 16.82 14.72 15.59 2.80
El anlisis de varianza implica que hay una
diferencia en las estimaciones de las descargas
pico promedio obtenidas en los cuatro
procedimientos como se muestra a continuacin.
ANOVA Table for Col_2 by Col_1

Source Sum of Squares Df Mean Square F-Ratio F0.05,3,20 P-Value

Between groups 708.3470 3 236.1160 76.0700 3.0984 0.0000


Within groups 62.0811 20 3.1041
Total (Corr.) 770.4280 23
Ejemplo 3.5 Pag. 83 (continuacin)
La grfica de los residuales contra los valores ajustados es preocupante
porque la forma de embudo con la boca hacia afuera indica que no se
satisface el supuesto de una varianza constante.
yi eij Grafica de los residuales contra yij
0.71 -0.370
0.71 -0.590
0.71 0.520 3
0.71 -0.010
0.71 1.040
2
0.71 -0.590
2.63 -1.717
2.63 0.313
1
2.63 -0.487 Residuales eij

2.63 -0.267 0
2.63 0.233 0 2 4 6 8 10 12 14 16
2.63 1.923 -1
7.93 -1.620
7.93 0.440 -2
7.93 1.820
7.93 -1.840 -3
7.93 1.890
7.93 -0.690 -4
14.72 2.435
14.72 -2.895 -5
14.72 -3.765
14.72 2.485 yij
14.72 -0.365
14.72 2.105
Ejemplo 3.5 Pag. 83 (continuacin)
Las desviaciones dij alrededor de las medianas de los
tratamientos se muestran a continuacin:
Mtodo de Desviaciones dij para la prueba de Levene
Estimacin modificada dij = I yij - yi I
1 0.180 0.400 0.710 0.180 1.230 0.400
2 1.700 0.330 0.470 0.250 0.250 1.940
3 1.495 0.565 1.945 1.715 2.015 0.565
4 1.565 3.765 4.635 1.615 1.235 1.235
La prueba de Levene consiste en realizar un anlisis de
varianza estndar en las dij.
El estadstico de prueba F que resulta en este caso es
F0= 4.57, para el cual el valor P es P = 0.0136. Por lo tanto,
la prueba de Levene rechaza la hiptesis nula de que las
varianzas son iguales, coincidiendo en esencia con el
diagnstico que se hizo a partir del examen visual de la
grfica de los residuales contra los valores ajustados.
Ejemplo 3.5 Pag. 83 (continuacin)

La tabla ANOVA para los datos ajustados, con


la cual se lleg a la anterior conclusin, se
muestra a continuacin
ANOVA Table for Col_2 by Col_1
Source Sum of Squares Df Mean Square F-Ratio F0.05,3,20 P-Value
Between groups 11.5697 3 3.8566 4.5700 3.0984 0.0136
Within groups 16.8835 20 0.8442
Total (Corr.) 28.4532 23

Los datos de la descarga pico son un buen


candidato para una trasformacin de datos.
Ejemplo 3.5 Pag. 83 (continuacin)
Seleccin emprica de una trasformacin:
Si los experimentadores conocieran la relacin entre la
varianza de las observaciones y la media, podran usar
esta informacin como gua para la seleccin de la forma
de la transformacin. Se desarrolla ahora este punto:
Sea E(y) = la media de y, y suponga que la desviacin
estndar de y es proporcional a una potencia de la media
de y tal que: sy
Quiere encontrarse una transformacin de y que produzca
una varianza constante. Suponga que la transformacin es
una potencia de los datos originales, por ejemplo y* = yl
Puede demostrarse entonces que: sy* l1
Evidentemente, si se hace l 1 , la varianza de los datos
transformados y* es constante.
Ejemplo 3.5 Pag. 83 (continuacin)
En la siguiente tabla se resumen varias de las transformaciones
comunes y se enlistan en el orden de fuerza creciente. Por fuerza
de una transformacin se entiende la cantidad de curvatura que
induce.
Una transformacin suave aplicada a datos que se extienden en un
rango estrecho tiene escaso efecto sobre el anlisis, mientras que
una transformacin fuerte aplicada a un rango amplio puede tener
resultados dramticos.
Con frecuencia las transformaciones tienen escaso efecto a menos
que el cociente ymx/ymn sea mayor que 2 3.
Transformaciones para estabilizar la varianza
Relacin entre
l 1 Transformacin Comentario
sy y
sy constante 0 1 Sin transformacin
sy 1/2 1/2 1/2 Raz cuadrada Datos (nmeros) de Poisson
sy 1 0 Log
sy 3/2 3/2 -1/2 Raz cuadrada recproca
sy 2 2 -1 Recproco
Ejemplo 3.5 Pag. 83 (continuacin)
Al graficar log Si contra log yi. de los datos originales , se
observa que la pendiente de la recta que pasa por los cuatro
puntos est cerca de ; por la tabla de transformaciones
para estabilizar la varianza, se considera que la
transformacin de la raz cuadrada puede ser apropiada.
log yi. log Si
Grfico log Si contra log Yi barra
-0.15 -0.18 0.50

0.42 0.08 y = 0,446x - 0,120


0.40
0.90 0.22
0.30
1.17 0.45
0.20
log Si

0.10

0.00
-0.40 -0.20 0.00 0.20 0.40 0.60 0.80 1.00 1.20 1.40
-0.10

-0.20

-0.30
log yi
Ejemplo 3.5 Pag. 83 (continuacin)
La tabla de los datos originales ya transformados,
se mustra a continuacin:
Mtodo de
Observaciones Transformadas
Estimacin
1 0.58 0.35 1.11 0.84 1.32 0.35
2 0.95 1.71 1.46 1.54 1.69 2.13
3 2.51 2.89 3.12 2.47 3.13 2.69
4 4.14 3.44 3.31 4.15 3.79 4.10

El anlisis de varianza es entonces:


ANLISIS DE VARIANZA
Origen de las Suma de Grados de Promedio de Valor crtico
F0 P value
variaciones cuadrados libertad los cuadrados para F
Entre grupos 32.6842 3 10.8947 76.9965 3.1274 0.0000000001
Dentro de los grupos 2.6884 19 0.1415

Total 35.3726 22
Ejemplo 3.5 Pag. 83 (continuacin)
La grfica residual muestra una mejora sensible
en comparacin con la anterior.
Val Ajust Residuales
0.71 -0.18 Grfica de los Residuales contra el valor Ajustado de los yij
0.71 -0.41
0.71 0.35 0.80
0.71 0.08
0.71 0.56
0.60
0.71 -0.41
1.61 -0.63
1.61 0.13 0.40
1.61 -0.12
1.61 -0.04 0.20
1.61 0.11
Residuales

1.61 0.55 0.00


2.79 -0.29 0.00 0.50 1.00 1.50 2.00 2.50 3.00 3.50 4.00 4.50
2.79 0.09
2.79 0.32 -0.20

2.79 -0.33
2.79 0.33 -0.40
2.79 -0.11
3.94 0.32 -0.60
3.94 -0.38
3.94 -0.51
-0.80
3.94 0.33
3.94 -0.03 Valor ajustado de yij
3.94 0.28
INTERPRETACION
PRCTICA DE LOS
RESULTADOS
INTERPRETACION PRCTICA
DE LOS RESULTADOS

8
Un Modelo de Regresin

.
Un Modelo de Regresin (continuacin)
Peso Observaciones
porcentual Promedioi
del algodn 1 2 3 4 5
15 7 7 15 11 9 9,8
20 12 17 12 18 18 15,4
25 14 18 18 19 19 17,6
30 19 25 22 19 23 21,6
35 7 10 11 15 11 10,8
2
y = -0,0886x + 4,5926x - 3 2
30 30 y = -0,0076x + 0,4814x -
39,989 Serie1 9,0114x + 62,611 Serie1
2
R = 0,7921 2
R = 0,9286
25 25
Serie2 Serie2

20 20
Serie3 Serie3

15 Serie4 15 Serie4

10 Serie5 10 Serie5

5 Serie6 5 Serie6

Polinmica Polinmica
0 0
(Serie6) (Serie6)
0 20 40 0 20 40
Un Modelo de Regresin (continuacin)
Ecuacin Cbica
y = -0,0076x3 + 0,4814x2 - 9,0114x + 62,611
Coeficientes Ecuacin Cbica
-0,0076 0,4814 -9,0114 62,611

Trmino Trmino Trmino


Peso
con con con
Porcentual Valor de y
potencia potencia potencia
Algodn X
3 2 1
25,00 -118,75 300,875 -225,29 19,4510000
26,00 -133,58 325,426 -234,3 20,1634000
27,00 -149,59 350,941 -243,31 20,6530000
27,50 -158,06 364,059 -247,81 20,8000000
27,90 -165,05 374,727 -251,42 20,8654576
28,00 -166,84 377,418 -252,32 20,8742000
28,10 -168,63 380,118 -253,22 20,8798024
28,20 -170,44 382,829 -254,12 20,8822192
28,25 -171,34 384,187 -254,57 20,8822188
28,30 -172,26 385,548 -255,02 20,8814048
28,50 -175,93 391,017 -256,82 20,8699000
29,00 -185,36 404,857 -261,33 20,7814000
30,00 -205,2 433,26 -270,34 20,3290000
31,00 -226,41 462,625 -279,35 19,4714000
32,00 -249,04 492,954 -288,36 18,1630000
Comparacin Grfica de Medias
Es muy sencillo desarrollar un procedimiento grfico para la comparacin
de las medias despus de un ANOVA. _ _ _
Suponga que el factor de inters tiene a niveles y que y1. , y2. ... y a. son
los promedios de los tratamientos. Si se conoce s, el promedio de
cualquier tratamiento tendr una desviacin estndar s / n .
Entonces, si todas las medias de_ los niveles del factor son idnticas, las
medias muestrales observadas y se comportaran como un conjunto de _
i.

observaciones tomadas al azar de una distribucin normal con media y..


y desviacin estndar s / n .
Visualice una distribucin normal con la_ capacidad
_ _ de ser deslizada sobre
un eje abajo del cual estn graficadas y y y . Si todas las medias
1. , 2. ... a.
de las tratamientos son iguales, deber haber una _ posicin de esta
distribucin que haga evidente que los valores y se sacaron de la misma
i.
distribucin.
_
Si no es este el caso, los valores y i. que no parecen haberse sacado de
esta distribucin se asocian con los niveles del factor que producen
respuestas medias diferentes.
Comparacin Grfica de Medias (continuacin)
Punto dbil: se desconoce s, en este caso s se sustituye con MS E del
anlisis de varianza y usar una distribucin t con factor de escala
MSE / n en lugar de la distribucin normal.
Ejemplo: Para trazar la distribucin t, simplemente se multiplica el valor de
la abscisa t por el factor de escala MS E 8.06
1.27 y se grafica
contra la ordenada de t en este punto. n 5
En la figura se ve que no hay ninguna posicin de la distribucin tal que
los cinco promedios puedan considerarse como observaciones tpicas
seleccionadas al azar de la distribucin.
Esto implica que las cinco medias no son iguales; por lo tanto, la figura es
una representacin grfica de los resultados del anlisis de varianza.
La figura indica que el 30% de algodn produce resistencia a la tensin
mucho ms alta que 20 25 por ciento de algodn y que 15 35 por
ciento de algodn producirn resistencias aun ms bajas.

15 35 20 25 30 Niveles (% Algodn)
5 10 15 20 25 Media (Res.Ten.)
Resistencia a la tensin promedio (lb/pulg2)
Contrastes
Muchos mtodos de comparacin mltiple utilizan el concepto de
contrastes.
Puesto que se rechaz la hiptesis nula en el caso de la resistencia del
algodn, se sabe que algunos pesos porcentuales del algodn
producen resistencia a la tensin diferente de otros, pero, cules son
los que causan en realidad esta diferencia?
Al principio podra sospecharse que los niveles 4 y 5 (30% y 35%)
producen la misma resistencia a la tensin, lo que implica que la
hiptesis a probar sera H0: 4 = 5
Hi: 4 5 (3.23)
Si desde el principio del experimento se hubiera sospechado que el
promedio de los niveles ms bajos del peso porcentual del algodn
(1 y 2) no difera del promedio de los niveles ms altos del peso
porcentual del algodn (4 y 5), entonces la hiptesis habra sido
H0: 1 + 2 = 4 + 5
Hi : 1 + 2 4 + 5 (3.24)
Contrastes (continuacin)
En general, un contraste es una combinacin lineal de parmetros de

c
a
la forma i
donde las constantes de los contrastes c1, c2,.., ca
i
i 1 a
suman cero; es decir, c 0
i 1
i

Las dos hiptesis anteriores pueden expresarse en trminos de


contrastes.
H : c
a

0 i
0
i
i 1 (3.25)

H : c
a

1 i
0
i
i 1

Las constantes de los contrastes para las hiptesis de la ecuacin 3.23


son c1 = c2 = c3 = 0; c4 = +1; c5 = -1; mientras que para la ecuacin 3.24
son c1 = c2 = +1; c3 = 0; c4 = c5 = -1.
Contrastes (continuacin)
Las pruebas de hiptesis que incluyen contrastes pueden hacerse de
dos maneras bsicas. En el primer mtodo se utiliza la prueba t.
El contraste de inters se escribe en trminos de los totales de los
tratamientos, obtenindose a
C ci y
i.
i 1
a
La varianza de C es V (C )
n s c
2 2
(3.26) cuando los
i
i 1
tamaos de las muestras de cada tratamiento son iguales. Si la
hiptesis nula de la ecuacin 3.25 es verdadera, el cociente
a

c y i i. tiene la distribucin N(0,1). Entonces se sustituira


i 1
a
la varianza desconocida s2 con su estimacin, el
n s c error cuadrtico medio MSE, y se utilizara el
2 2

i 1
i
estadstico
a

c y i
(3.27) para probar la hiptesis de la ecuacin
t
i.
i 1
0 a 3.25. La H0 se rechaza si It0I excede
n MS c
2
E i t/2, N-a
i 1
Contrastes (continuacin)
En el segundo enfoque se utiliza la prueba F. Entonces, el cuadrado de
una variable aleatoria t con v grados de libertad es una variable
aleatoria F con un grado de libertad en el numerador y v grados de
libertad en el denominador. Por lo tanto puede obtenerse

a

c y
2
i
Como un estadstico F para probar la
F t
i.
2 i 1
0 0 a (3.28) ecuacin 3.25. La hiptesis nula se
n MS c
2
E
i 1
i rechazara si F0>F,1,N-a
Este estadstico de prueba de la ecuacin 3.28 puede escribirse como

MS C
SS /1 C
F 0
MS E MS E

Donde la suma de cuadrados de los contrastes con un solo grado de


libertad es a 2


c y i 1
i i.

SS C a (3.29)
n c 2
i
i 1
Intervalos de Confianza para un Contraste
En lugar de probar hiptesis acerca de un contraste, puede ser ms til
construir un intervalo de confianza. Entonces el contraste suele
expresarse en trmino de los promedios de los tratamientos yi.
Suponga que el contraste de inters es:
a

i 1
c i i

Al sustituir las medias de los tratamientos


a
con los promedios de los
tratamientos se obtiene C c y i i.
i 1

V (C ) s c
2 a
2
i
n i 1

cuando los tamaos de las muestras son iguales. Si se usa MSE para
estimar s2, el intervalo de confianza de 100(1-a) por ciento para el
contraste i 1 ci
a
es
i
a

c y t MS y
E
a
2
a a
MS E
a
2
i , N a c c c
i t i
(3.30) i , N a c i
i 1
i. 2
n i 1 i 1
i
i 1
i. 2
n i 1

Evidentemente, si este intervalo de confianza incluye al cero, no podra


rechazarse la hiptesis nula en la ecuacin 3.25.
70
Contraste Estandarizado
Cuando hay inters en ms de un contraste, con frecuencia es
til evaluarlos en la misma escala. Una forma de hacer esto es
estandarizando el contraste para que su varianza sea s2.
c
a
Si el contraste i 1 i
se expresa en trminos de los
totales de los tratamientos como ci y al dividirlo por
i a
i 1 i.
ni 1 ci
a 2
se obtendr un contraste estandarizado con
varianza s2. Entonces el contraste estandarizado es en
y
a *
realidad
i 1 ci i.

donde c
*
c i
i a
n c
2
i
i 1
Tamao de las Muestras Desiguales
Cuando los tamaos de las muestras de cada tratamiento son
diferentes, se introducen modificaciones menores en los resultados
anteriores. Primero, observe que la definicin de un contraste
nc
a
requiere ahora que
i 1
0 i i

Otros cambios requeridos son directos. Por ejemplo, el estadstico t


a
de la ecuacin 3.27 queda como ci y
t
i.
i 1
0 a

MS ni c
2
E i
i 1

Y la suma de cuadrados de los contrastes de la ecuacin 3.29


queda como a


c y
2

i 1
i i.

SS C a

ni c
2

i
i 1
Contrastes Ortogonales ( caso especial )
Dos contrastes con coeficientes { ci } y { di } son
a
ortogonales, si:
c d
i 1
0i i

o, para un diseo no balanceado, si n c d


i 1
i i i
0

Para a tratamientos, el conjunto de a-1 de contrastes


ortogonales hace la particin de la suma de cuadrados
debida a los tratamientos en a-1 componentes
independientes con un solo grado de libertad. Por lo tanto,
las pruebas que se realizan en los contrastes ortogonales
son independientes.
Contrastes Ortogonales ( caso especial )
Ejemplo: Si hay a = 3 tratamientos, donde el tratamiento 1 es el control y
donde los niveles del factor en los tratamientos 2 y 3 son de inters para
el experimentador, los contrastes ortogonales apropiados podran ser
los siguientes:

Tratamientos Coeficientes para contrastes ortogonales


1 ( control ) -2 0
2 ( nivel 1 ) 1 -1
3 ( nivel 2 ) 1 1

Contraste 1: ci = -2,1,1 ( compara el efecto promedio del factor con el


control ).
Contraste 2: di = 0,-1,1 ( compara los dos niveles del factor de inters )
En general, el mtodo de contrastes (o de contrastes ortogonales) es til
para lo que se llama comparaciones preplaneadas.
Ejemplo 3.6 Pag. 94
Considere los datos del ejemplo 3.1
Datos de la resistencia a la tensin ( lb / pulg.2 )
Observaciones Totales Promedios
1 2 3 4 5
7 7 15 11 9 49 9.8
12 17 12 18 18 71 15.4
14 18 18 19 19 88 17.6
19 25 22 19 23 108 21.6
7 10 11 15 11 54 10.8
370 15.04

Suponga que antes de correr el experimento se especific la


siguiente serie de comparaciones entre las medias de los
tratamientos

5 medias de tratamientos y 4 grados de libertad.


Hiptesis Contraste
Ho: 4 = 5 C1 = -y4. + y5.
Ho: 1 + 3 = 4 + 5 C2 = y1. + y3. - y4. - y5.
Ho: 1 = 3 C3 = y1. - y3.
Ho: 42 = 1 + 3 + 4 + 5 C4 = -y1. + 4y2. - y3. - y4. - y5.
Ejemplo 3.6 (continuacin)
Los coeficientes de los contrastes son ortogonales. Con los
datos de la tabla, se determina el valor numrico de los
contrastes y la suma de los cuadrados.

Remplazando:
c y
a

i 1
i i.
2

SS C a
n c 2
i
i 1

C1 = -54 SSc1 = ( -54 )2 / (5 * ( 2 )) = 291.6

C2 = -25 SSc2 = ( -25 )2 / (5 * ( 4 )) = 31.25

C3 = -39 SSc3 = ( -39 )2 / (5 * ( 2 )) = 152.1

C4 = 9 SSc4 = ( 9 )2 / (5 * ( 20 )) = 0.81
Ejemplo 3.6 (continuacin)
ANOVA - Resistencia a la Tensin del Peso porcentual del algodn
Grados Cuadra
Suma
de do
Fuente de Variacion Cuadrados Fo F0.05,4,20 P value
libertad Medio
(SS)
(Dof) (MS)
Peso porcentual del algodn 475.76 4 118.94 14.76 2.87 0.00000913
Contrastes ortogonales
C1 = -y 4. + y 5. 291.6 1 291.6 36.18 4.35 0.00000701
C2 = y 1. + y 3. - y 4. - y 5. 31.25 1 31.25 3.88 4.35 0.06295952
C3 = y 1. - y 3. 152.1 1 152.1 18.87 4.35 0.00031474
C4 = -y 1. + 4y 2. - y 3. - y 4. - y 5. 0.81 1 0.81 0.10 4.35 0.75452031

Error (Dentro de los tratamientos) 161.20 20 8.06


Total 636.96 24

Por los valores de P se concluye que hay diferencias


significativas entre los niveles 4 y 5, y 1 y 3 del peso porcentual
del algodn, pero que el promedio de los niveles 1 y 3 no
difiere del promedio de los niveles 4 y 5 con el nivel = 0.05,
y que el nivel 2 no difiere del promedio de los otros 4 niveles.
77 26
Mtodo de Scheff para Comparar todos
los Contrastes
Scheff ha propuesto un mtodo para comparar todos y cada uno de los
contrastes posibles entre las medias de los tratamientos.
Supongamos que se ha determinado un conjunto de m contrastes de las medias
de tratamientos.

u = c1u1 + c2u2 + .... + caua u = 1, 2, ..., m (3.31)


yi
El contraste correspondiente usando los promedios de tratamiento es:
.
Cu = c1u y1.+ c2u y2. + .... + cau ya. u = 1, 2, ..., m (3.32)

c
a
Scu MS
2
El error estndar de este contraste es: E iu
/ ni (3.33
i 1

ni es el nmero de observaciones en el tratamiento i-simo.


El valor crtico con el que debe ser comparado Cu es:
(3.34)
Sa,u S C (a 1) F ,a1, N a
u

Para probar la hiptesis nula de que el contraste u difiere de manera significativa


de cero, se compara Cu con el valor crtico. Si S ,u se rechaza la
C u
hiptesis de que el contraste u es igual a cero.
Mtodo de Scheff para Comparar todos
los Contrastes (continuacin)
Para ilustrar el procedimiento, considere los datos del ejemplo 3.1 y suponga
que los contrastes de inters son:
1 = 1 3 4 5
2 = 1 4
Los valores numricos de estos contrastes son:
C1 = y1. + y3. - y4. - y5. Puesto que | C1 | < S0.01,1, se
= 9.80 + 17.60 21.60 10.80 = 5.00 concluye que el contraste
C2 = y1. - y4. 1 = 1 3 4 5 es igual
= 9.80 - 21.60 = -11.80 a cero; es decir, no existe
Los errores estndar se calculan con 3.33: evidencia slida para concluir
que las medias de los tratamientos
Sc MS c / n 8.06(1 1 1 1) / 5 2.54
5
2
1 E
i 1
i1 i 1 y 3 como grupo difieren de las
Medias de los tratamientos 4 y 5
Sc MS c / n 8.06(1 1) / 5 1.80
5

2 E
2
i2 i
como grupo.
i 1
Sin embargo, como | C2 | > S0.01,2,
Por la ecuacin 3.34, los valores crticos de 1% son
se concluye que el contraste
S 0.01,1 S C (a 1) F0.01,a 1, N a 2.54 4(4.43) 10.69 1 = 1 4 no es igual acero; es
1

S 0.01, 2 S C (a 1) F0.01,a 1, N a 1.80 4(4.43) 7.58 decir, las resistencias medias de


1
los tratamientos 1 y 4 difieren
significativamente.
Mtodo de las Diferencias Significativas
Mnimas (LSD) de Fisher
En este procedimiento se utiliza el estadstico F para probar H0: i = j
y y
t i. j.

1
0

1 (3.39)
MS E
ni n j

Suponiendo una hiptesis alternativa de dos colas, los pares de medias i


y j se declararan significativamente diferentes si 1 1

y y t
i.

j.

MS n n .
1 / 1 /
, N a E i j

A la cantidad LSD t , N a MS E (3.40)
ni n j

se le llama diferencia significativa mnima, para un diseo no balanceado.


Si el diseo es balanceado, n1 = n2 = = na = n, y

LSD t , N a
2MS E
n
Para usar el procedimiento LSD de Fisher, simplemente se compara la
diferencia observada entre cada par de promedios con la LSD
correspondiente. Si y y LSD, se concluye que las medias poblacionales
i. j.

i y j difieren.
Ejemplo 3.8 Pag. 99
Para ilustrar el procedimiento, se usan los datos del experimento 3.1, la
LSD con = 0.05 es
LSD t 0.05, 20
2MS E 2.086
2(8.06)
3.75
5
n
Por lo tanto, cualquier par de promedios de los tratamientos que difiera
del valor absoluto por ms de 3.75 implicara que el par correspondiente
de medias poblacionales es significativamente diferente. Las diferencias
en los promedios son:
y y 9.8 15.4 5.6 *
1. 2. RESUMEN DE LOS RESULTADOS
y y 9.8 17.6 7.8 *
1. 3.

y 9.8 21.6 11.8 *


y y y y y
y 1. 5. 2. 3. 4.
1. 4.
9.8 10.8 15.4 17.6 21.6
y y 9.8 10.8 1.0
1. 5.

y y 15.4 17.6 2.2 Los valores marcados con asterisco indican


2. 3.

y y 15.4 21.6 6.2 * pares de medias que son significativamente


2. 4.

y y 15.4 10.8 4.6 * diferentes.


2. 5.
Los nicos pares de medias que no difieren
y y 17.6 21.6 4.0 *
3. 4.
significativamente son 1 y 5 y 2 y 3, y el
y y 17.6 10.8 6.8 *
3. 5. trmino 4 produce una resistencia
y y 21.6 10.8 10.8 * significativamente mayor que los otros
4. 5.

tratamientos.
85
Prueba de Rango Mltiple de Duncan
Un procedimiento muy utilizado para comparar todos los pares de medias es
la prueba de rango mltiple desarrollada por Duncan.
Para aplicar esta prueba cuando los tamaos de las muestras son iguales,
los a promedios de los tratamientos se arreglan en orden ascendente, y el
error estndar de cada promedio se determina como MS
S yi E
(3.42)
n
Para tamaos de las muestras desiguales, se sustituye n en la ecuacin
(3.42) con la media armnica nh del {nj}, donde a
h

n a

(1 / n )
(3.43)
i
i 1
Observe que si n1 = n2 = = na, nh = n. En la tabla de Duncan de rangos
significativos se obtienen los valores r(p,f) para p = 2, 3, , a donde es
el nivel de significacin y f es el nmero de grados de libertad del error.
Estos rangos se convierten en un conjunto de a 1 rangos mnimos de
significacin (por ejemplo Rp) para p = 2, 3, , a calculando

R r
p a
( p, f ) S y para p 2,3,..., a
i
Prueba de Rango Mltiple de Duncan
(continuacin)
Entonces, se prueban las diferencias observadas entre las medias,
empezando con la ms grande contra la menor, la cual se comparara
con el rango mnimo de significacin Ra.
Despus se calcula la diferencia de la mayor y la segunda menor y se
comparara con el rango mnimo de significacin Ra-1.
Estas comparaciones se continan hasta cuando todas las medias se
han comparado con la media mayor.
Por ltimo, se calcula la diferencia entre la segunda media mayor y la
menor y se compara con el rango mnimo de significacin Ra-1.
Este proceso se contina hasta cuando se han considerado las
diferencias entre todos los a(a-1)/2 pares de medias posibles.
Si una diferencia observada es mayor que el rango de significacin
mnima correspondiente, se concluye que el par de medias en
cuestin es significativamente diferente.
Para evitar contradicciones, ninguna de las diferencias entre un par
de medias se considera significativa si las dos medias en cuestin se
localizan entre otras dos medias que no difieren significativamente.
Ejemplo 3.9 Pag. 101 y 1.
9.8
La prueba del rango mltiple de Duncan puede aplicarse al y 10.8
5.
experimento de ejemplo 3.1. Recuerde que MSE = 8.06,
y 15.4
N = 25, n = 5 y hay 20 grados de libertad del error. Al arreglar 2.

los promedios en orden ascendente se tiene: y 17.6


3.

y 21.6
4.

El error estndar de cada promedio es


S y 8.06 / 5 1.27 . En el conjunto de R r
2 0.05
2,20 S y i.
(2.95)(1.27) 3.75
i.

rangos significativos basado en la tabla


R r
3 0.05
3,20 S y i.
(3.10)(1.27) 3.94
VII del apndice del texto para 20 GL y
= 0.05 se obtiene r0.05(2, 20) = 2.95, R r
4 0.05
4,20 S y i.
(3.18)(1.27) 4.04
r0.05(3, 20) = 3.10, r0.05(4, 20) = 3.18,
R r
5 0.05
5,20 S y (3.25)(1.27) 4.13
r0.05(5, 20) = 3.25. Los rangos son i.

4 vs. 1: 21.6 - 9.8= 11.8 > 4.13


4 vs. 5: 21.6 - 10.8= 10.8 > 4.04
4 vs. 2: 21.6 - 15.4= 6.2 > 3.94
4 vs. 3: 21.6 - 17.6= 4.0 > 3.75
3 vs. 1: 17.6 - 9.8= 7.8 > 4.04
Los resultados de las comparaciones son 3 vs. 5: 17.6 - 10.8= 6.8 > 3.94
3 vs. 2: 17.6 - 15.4= 2.2 < 3.75
2 vs. 1: 15.4 - 9.8= 5.6 > 3.94
2 vs. 5: 15.4 - 10.8= 4.6 > 3.75
5 vs. 1: 10.8 - 9.8= 1.0 < 3.75
Ejemplo 3.9 (continuacin)
Por el anlisis se observa que hay diferencias
significativas entre todos los pares de media con
excepcin de la 3 y la 2 y la 5 y la 1.
En la grfica las medias que no son significativamente
diferentes aparecen subrayadas.
y1.
y 5.
y 2.
y 3.
y 4.

9.8 10.8 15.4 17.6 21.6


Resultados de la prueba de rangos
mltiples de Duncan
Prueba de Newman-Keuls
La diferencia con la prueba de Duncan, es que los valores crticos para
calcular la diferencia de medias son calculados de acuerdo a:
Kp= qa(p,f)S . p= 2,3,...,a (3-45)
i
Donde qa(p,f) es el punto porcentual superior de tamao del intervalo
studentizado para grupos de medias de tamao p y f grados de
libertad.

El rango se define mediante:


q = (max min)/[sqr(MSE/n)]
Donde ymax y ymin corresponden a las medias muestrales
mxima y mnima. Una vez se calculan los valores de Kp, los pares
extremos de medias en grupos de tamao p se comparan con Kp
exactamente como la prueba de intervalos mltiples de Duncan.
Prueba de Newman-Keuls (continuacin)
Esta prueba es ms conservadora que la de Duncan en el sentido
que generalmente la razn del error tipo I () es menor.

Observamos que si p > 2, se tiene que q(p,f) > r(p,f). Es decir, es


ms difcil declarar que dos medias son significativamente diferentes
al utilizar la prueba de Newman-Keuls que cuando se usa el
procedimiento de Duncan. Esto se ilustra a continuacin para el caso
en que = 0.01, a = 8 y f = 20:

p 2 3 4 5 6 7 8
r 0.01 (p,20) 4.02 4.22 4.33 4.40 4.47 4.53 4.58
q 0.01 (p,20) 4.02 4.64 5.02 5.29 5.51 5.69 5.84
DETERMINACIN DEL
TAMAO DE LA MUESTRA
DETERMINACIN DEL TAMAO DE
LA MUESTRA
En cualquier problema de diseo
experimental, una decisin crtica es la
eleccin del tamao de la muestra; es
decir, determinar el nmero de rplicas
que se deben correr.
Si el experimentador tiene inters en
detectar efectos pequeos, se necesitan
ms rplicas que cuando se interesa en
detectar efectos grandes.
DETERMINACIN DEL TAMAO DE LA
MUESTRA (continuacin)
Curva de operacin caracterstica:
DETERMINACIN DEL TAMAO DE LA
MUESTRA (continuacin)
Curva de operacin caracterstica (cont.):
Curva de operacin caracterstica
Curva de operacin caracterstica (continuacin)
Curva de operacin caracterstica (continuacin)
Curva de operacin caracterstica (continuacin)
Ejercicio 3.11
Ejercicio 3.11 (continuacin)
Curva de operacin caracterstica

0.15

2,11
Ejercicio en clases
Una compaa textil utiliza un gran nmero de telares. Se
desea que los telares sean homogneos con el objeto de
producir tela de resistencia uniforme. El ingeniero de
procesos supone que, aparte de la variacin usual en la
resistencia de la tela en muestras del mismo telar, puede
existir una variacin significativa de la resistencia entre
los distintos telares. Para investigar esto, selecciona
cuatro telares al azar y realiza cuatro determinaciones de
la resistencia de la tela manufacturada por cada uno.
Este experimento es realizado en orden aleatorio y los
datos que se recopilan aparecen en la Tabla 1. Se lleva a
cabo un anlisis de varianza cuyos resultados se
muestran en la Tabla 2. De este anlisis se concluye que
existe diferencia significativa entre los telares de la
planta.
Tablas

Tabla 2. Anlisis de varianza para los datos de resistencia

Fuente de Suma de Grados de Media de


Fo Pvalue
variacin cuadrados Libertad Cuadrados

Looms 89.19 3 29.73 15.68 0.00018787


Error 22.75 12 1.9
Total 111.94 15

También podría gustarte