Está en la página 1de 18

Tcnicas para interpretar

resultados de Anlisis de Varianza:


con Ejemplos usando SAS:
Por
Prof. S. P. Sinha
Indice del Contenido:

Esta seccin hace uso de programas fuentes, salidas SAS
y esquemas de Anlisis de varianza, que Ud. puede consultar
por los enlaces que se presentan a continuacin:
Programa Fuente y Salida SAS Andeva Esquemtico
IMPORTANT NOTICE ABOUT THE COPYRIGHTS.
Anlisis Grfico: 1
2 3 4

Objetivos de esta Pgina:

Esta pgina tiene los siguientes objetivos:
(1): Ilustrar mediante ejemplos como se debe hacer la interpretacin de
resultados que se obtienen por el procesamiento de datos experimentales
por SAS.
(2): Plantear y realizar diferentes aspectos de discusin en el anlisis de
datos experimentales tales como supuestos de ANDEVA y modelo lineal del
diseo usado, alternativas que existen para analizar datos, complicaciones
que pueden surgir para el anlisis posterior de promedios cuando existen
interacciones significativas y otros tipos de problemas variados que
pueden presentarse debido a las caractersticas
propias de datos y el diseo usado.
(3) Capacitar al lector para extraer conclusiones que sean vlidas
estadsticamente.
Se asumir que el lector de esta pgina cumple con los siguientes
requisitos:
(i): ha asistido en alguna ocasin un curso bsico de diseo de experimento.
(ii): tiene el conocimiento del lenguaje SAS por lo menos al nivel prctico.
IMPORTANT NOTICE ABOUT THE COPYRIGHTS.
The author of this Web Page makes the following declaration as regards to the examples used in
this work:
I have used in this publication, examples which, come from different books which, I have used
in the past for teaching courses in Experimental Designs to both graduate and undergraduate
students. In each the of examples used here, a reference to the names of the authors is given, who
are the owners of corresponding copyrights. If no such reference appears in the example, then
this is because the example has been artificially constructed. En consequence, the comments
and explanations which I have given in this publication, should be considered as a bibliographic
review, which I have written in order to express my own views about the statistical methods
which can be used to analyze data in these examples.












Diseo Completamente aleatorio
(1.1): Caso fijo y balanceado: Tratamientos
cualitativos
(1.2): Caso fijo y balanceado: Tratamientos
cuantitativos

(1.1): Caso fijo y balanceado: Tratamientos cualitativos
Este ejemplo proviene del libro de Montgomery, D. (2da. edicin: ingls), Pgina 63.
Se trata de un modelo fijo balanceado. Hay 5 tratamientos que representan diferentes porcentaje de
algodn, que son: 15, 20, 25, 30 y 35 respectivamente. Se usaron 5 replicaciones. La variable respuesta es
la resistencia de fibra sinttica (lb/in cuadrado.). Ejemplo 1 no toma en cuenta la informacin que los 5
tratamientos se pueden considerar cuantitativos caracterizados as por sus valores respectivos de
porcentaje de algodn. Los datos de este experimento se vuelven a analizar en el ejemplo 1.2
considerando los tratamientos como cuantitativos.
Tabla 1.1.1: Datos experimentales:
Los datos que corresponden a un mismo tratamiento se tabulan en una misma fila.
Tratamiento 1: 7 7 15 11 9
Tratamiento 2: 12 17 12 18 18
Tratamiento 3: 14 18 18 19 19
Tratamiento 4: 19 25 22 19 23
Tratamiento 5: 7 10 11 15 11
Salida SAS
Tabla 1.1.2: Tabla de ANDEVA: Diseo Completamente aleatorio
General Linear Models Procedure

Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 4 475.76000 118.94000 14.76 0.0001
Error 20 161.20000 8.06000
Corrected Total 24 636.96000

R-Square C.V. Root MSE Y Mean

0.746923 18.87642 2.8390 15.040
Source DF Type I SS Mean Square F Value Pr > F
Tratamientos 4 475.76000 118.94000 14.76 0.0001
Fijaremos el nivel de significacin o = 0,05 para sacar las conclusiones estadsticas.
El Valor de F para tratamientos es significativo al nivel de significacin o = 0,05 ya que Pr >F
(Probabilidad mayor que el F calculado) es igual = 0,0001, siendo este ltimo valor menor que
0,05 , el cual es el valor del nivel de significacin que estamos considerando. Tambin el valor
de F para tratamientos es significativo para o = 0,01 por la misma razn, o sea Pr >F = 0,0001 <
0,01 . (obsrvese que si F calculado es significativo para o = 0,01, entonces esto implica que el F
calculado tambin es significativo para o = 0,05 . Sin embargo la afirmacin inversa no
necesariamente es cierta.)
Podemos decir de esta manera que el valor de F para tratamientos es altamente significativo.

Modelo Lineal:
Y
ij
= + t
i
+ c
ij
; i = 1,...,k ; j = 1,..,n ; c
ij
~

NID(0, o
2
) ; t. = 0 ;
t
i
= el efecto del tratamiento i - simo; c
ij
= error aleatorio para j - sima observacin en el
tratamiento i - simo.
En este ejemplo tenemos k = 5 y n = 5 ;
Hiptesis nula y alternante:
H
0
: t
i
= 0 ; para todo i = 1,...,k; H
A
: t
i
= 0 ; para algn i = 1,...,k;
Otra forma equivalente de enunciar las mismas hiptesis es:
H
0
:
1
=
2
= ... =
k
;

en que
i
es el promedio poblacional del tratamiento i - simo, i =
1,...,k ;
H
A
: No todos los promedios poblacionales de tratamientos son iguales.
Ya que el valor de F para tratamientos es significativo para o = 0,05, obtenemos la conclusin
estadstica que los promedios poblacionales de los 5 tratamientos son diferentes. Debemos
realizar anlisis posterior por el mtodo del Rango mltiple de Duncan para determinar cual es el
mejor tratamiento.
Tabla 1.1.3: Comparacin de promedios de tratamientos por el mtodo
de Duncan:
General Linear Models Procedure
Duncan's Multiple Range Test for variable: Y
NOTE: This test controls the type I comparisonwise error
rate,
not the experimentwise error rate
Alpha= 0.05 df= 20 MSE= 8.06
Number of Means 2 3 4 5
Critical Range 3.745 3.931 4.050 4.132

Means with the same letter are not significantly different.

Duncan Grouping Mean N X

A 21.600 5 30

B 17.600 5 25
B
B 15.400 5 20

C 10.800 5 35
C
C 9.800 5 15
Observamos que por la aplicacin del Mtodo de Duncan se forman 3 grupos de tratamientos.
Los promedios poblacionales de tratamientos dentro de los grupos entre ellos no son diferentes.
El promedio poblacional dentro de un grupo es diferente del promedio poblacional del
tratamiento de cualquier otro grupo.
El mejor tratamiento tiene 30 % del algodn.
Conclusiones:
(1): El Valor de F para tratamientos es significativo al nivel de significacin a = 0,05 y en
consecuencia los promedios poblacionales de los 5 tratamientos son diferentes.
(2): La aplicacin del mtodo del Rango mltiple de Duncan revela que el mejor tratamiento
tiene 30 % del algodn.
Observacin:
Los Tratamientos en este experimento son cuantitativos, pero en este ejemplo fueron analizados
como cualitativos. Los datos de este ejemplo se volvern a analizar en el Ejemplo 1.2, tomando
en cuenta la naturaleza cuantitativa de los tratamientos.
















(2): Caso fijo y balanceado: Tratamientos cuantitativos
(Este Ejemplo usa datos de la Tabla 1.1.1)
Tabla 1.2.1: Prueba de significacin de los componentes del
polinomio ortogonal:
General Linear Models Procedure
Dependent Variable: Y
Contrast DF Contrast SS Mean Square F
Value Pr > F
LINEAL 1 33.62000 33.62000
4.17 0.0545
CUADRATICO 1 343.21429 343.21429
42.58 0.0001
CUBICO 1 64.98000 64.98000
8.06 0.0101
CUARTICO 1 33.94571 33.94571
4.21 0.0535
Ya que los tratamientos son caracterizados por diferentes porcentajes del algodn (15, 20, 25, 30
y 35 ) y se encuentran igualmente espaciados, podemos usar el mtodo de polinomios
ortogonales como un mtodo del anlisis posterior.Como un primer paso calculamos por SAS la
significacin de los diferentes componentes de polinomios ortogonales (ver la Tabla 1.2.1). El
polinomio ortogonal es de grado tres, ya que el componente cuartico no es significativo (estamos
usando o = 0,05) y adems el componente cbico si es significativo. A continuacin se
desarrolla el 2do. paso que consiste en hallar la ecuacin polinmica ortogonal estimada de
tercer grado.

Tabla 1.2.2: AJUSTE DE UNA REGRESION CUBICA DE Y SOBRE X:
General Linear Models Procedure
Dependent Variable: Y
Sum of Mean
Source DF Squares Square F
Value Pr > F
Model 3 441.81429 147.27143
15.85 0.0001
Error 21 195.14571 9.29265
Corrected Total 24 636.96000

R-Square C.V. Root MSE Y Mean
0.693630 20.26852
3.0484 15.040

Source DF Type I SS Mean Square F
Value Pr > F
X 1 33.62000 33.62000
3.62 0.0710
X*X 1 343.21429 343.21429
36.93 0.0001
X*X*X 1 64.98000 64.98000
6.99 0.0152

T for H0: Pr > |T| Std Error of
Parameter Estimate Parameter=0
Estimate

INTERCEPT 62.61142857 1.57 0.1302
39.75743623
X -9.01142857 -1.73 0.0976
5.19660897
X*X 0.48142857 2.23 0.0369
0.21604552
X*X*X -0.00760000 -2.64 0.0152
0.00287405
En este 2do. paso , se vuelve a usar el Proc. GLM pero esta vez considerando ambas variables y
e x, en que y es la variable respuesta, siendo x el porcentaje del algodn. En la instruccin
Model del Proc GLM, se declara un modelo del tercer grado y se obtiene la tabla del Andeva y
la estimacin de los parmetros.
No se debe tomar en cuenta la significacin de los componentes en la tabla de Andeva 1.2.2,
porque este paso ya se hizo en la tabla 1.2.1. El clculo de significacin en la tabla 1.2.2. usa el
error de la tabla 1.1.2 que tiene 20 g.l. En cambio la tabla 1.2.2 usa error con 21 g.l. Este grado
de libertad adicional es por el componente cuartico que automticamente el Proc GLM suma al
trmino del error en la tabla 1.2.2 ya que al no ser significativo en la tabla 1.2.1, se excluy este
trmino en la declaracin del modelo del Proc GLM para generar la tabla 1.2.2 .


La informacin mas
importante que se
consigue en la tabla
1.2.2 es la funcin
polinmica estimada
de tercer grado, la
cual es:
Y(estimada) =
62.61142857 -
9.01142857*X +
0.48142857*X*X
-0.0076*X*X*X
en que Y es la
resistencia y X es el
porcentaje del
algodn.
Se puede maximizar
esta funcin y para
hacer esto se calcula
la derivada de
Y(estimada ) con
respecto X. Luego se
iguala la expresin
de la derivada a cero
y se obtiene una
ecuacin cuadrtica
cuya solucin
produce el valor del X
para el cual se obtiene
mximo de
Y(estimada).
Se podr verificar
que el mximo de
la resistencia se
produce para X =
28.23 y el valor
del mximo es
20.90

Conclusin:
La relacin ente la resistencia de la fibra sinttica y el porcentaje del algodn se puede
representar por la siguiente funcin polinmica estimado de grado tres:
Y(estimada) = 62.61142857 -9.01142857*X + 0.48142857*X*X -
0.0076*X*X*X
El valor de la resistencia de la fibra sinttica crece a medida que aumenta el valor del porcentaje
del algodn, alcanzando su valor mximo de 20.90 cuando el porcentaje del algodn asume el
valor igual a 28.23


Diseo Bloques aleatorios:
(2.1): Diseo Bloques aleatorios: (balanceado con
efectos fijos)
(2.2): Diseo Bloques aleatorios: (no balanceado con
efectos fijos)

(2.1): Diseo Bloques aleatorios: (balanceado con efectos fijos)
Fuente de datos: Li, J.C.R. Captulo 14
Hay 6 tratamientos de Variedades y 5 bloques. Este experimento se hizo en el campo experimental.
Tabulacin de datos: por filas como Variedades y por columnas como bloques;
La variable repuesta es el rendimiento.
Datos:
32.6 41.0 17.9 23.8 19.6
38.4 39.4 37.1 42.8 21.8
65.1 59.9 41.9 36.1 21.1
54.2 46.4 43.6 35.1 43.4
83.7 37.9 69.3 63.8 50.7
77.1 70.8 57.7 51.1 46.5
Tabla 2.1.1: Anlisis de varianza para Diseo B. A.

General Linear Models Procedure

Dependent Variable: Y
Sum of Mean
Source DF Squares Square F
Value Pr > F
Model 9 6529.2027 725.4670
7.14 0.0001
Error 20 2033.4093 101.6705
Corrected Total 29 8562.6120

R-Square C.V. Root
MSE Y Mean
0.762525 22.08317
10.083 45.660

Source DF Type I SS Mean Square F
Value Pr > F
VARIEDADES 5 4541.6840 908.3368
8.93 0.0001
BLOQUES 4 1987.5187 496.8797
4.89 0.0065
Comentarios:
El Modelo Lineal del diseo usado en este experimento es:
Y
ij
= + t
i
+ |
j
+ c
ij
; i = 1,...,k ; j = 1,..,n ; t
.
= 0 ; |
.
= 0 ;
en que, t
i
= el efecto del tratamiento i - simo ; |
j
= el efecto del bloque j - simo ;
c
ij
= error aleatorio para la observacin en el j - simo bloque y el tratamiento i - simo. c
ij
~

NID(0, o
2
) ;
para (i = 1,...,k ; j = 1,..,n ;)
Hiptesis nula y alternante:
H
0:
t
i
= 0 ; para todo i = 1,...,k; H
A:
t
i
= 0 ; para algn i ;
H
0:
|
j
= 0 ; para todo j = 1,...,n; H
A:
|
j
= 0 ; para algn j ;
Nota: Las hiptesis antes especificadas tambin se pueden enunciar en trminos de
promedios de poblaciones de varidades y bloques respectivamente en una forma
similar tal como se hizo en el ejemplo 1.1 .
El valor del F calculado para variedades es altamente significativo. Por lo tanto ser
necesario usar un mtodo del anlisis posterior para determinar cual es la mejor
variedad.
El valor del F calculado para bloques es altamente significativo y esto indica que se
justific el uso del diseo bloques aleatorios ya que una parte de la variabilidad total
que se particiona en el anlisis de varianza como bloques es significativa. (Si F para
bloques en un diseo bloques aleatorios usado en el campo experimental no es
significativo, entonces diramos que los bloques no fueron construidos y ubicados
con una orientacin correcta. La orientacin correcta consiste en ubicar los
bloques en forma perpendicular a la direccin en que vara la fertilidad del suelo. El
Contraste de hiptesis acerca de los bloques an cuando no es de inters directo para
el Investigador, se considera como un paso importante para confirmacin de criterios
usado en el planeamiento del experimento.)
Tabla 2.1.2: Anlisis posterior por el Mtodo de
Duncan:
General Linear Models Procedure
Duncan's Multiple Range Test for variable: Y
NOTE: This test controls the type I comparisonwise error rate,
not the experimentwise error rate
Alpha= 0.05 df= 20 MSE= 101.6705
Number of Means 2 3 4 5 6
Critical Range 13.30 13.96 14.38 14.68 14.89

Means with the same letter are not significantly different.

Duncan Grouping Mean N VARIEDAD

A 61.080 5 5
A
A 60.640 5 6

B 44.820 5 3
B
B 44.540 5 4
B
C B 35.900 5 2
C
C 26.980 5 1
Comentarios:
El uso del Rango mltiple de Duncan produce tres conjunto disjuntos de variedades. El grupo
con el mejor rendimiento consta de dos variedades que son las variedades nmeros 5 y 6.
Cualquiera de estas dos variedades se pueden usar y entre ellas no existe diferencia significativa.



(2.2): Diseo Bloques aleatorios: (no balanceado con efectos
fijos)
Hay 3 tratamientos de Variedades y 5 bloques.
Existe un dato faltante que se encuentra en el primer tratamiento y primer bloque.
Tabulacin de datos: por filas como Tratamientos y por columnas como bloques:

. 887 897 850 975
857 1189 918 968 909
917 1072 975 930 954

Tabla 2.2.1: Diseo B. A. con un dato faltante
General Linear Models Procedure

Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 6 62501.989 10416.998 1.79 0.2316
Error 7 40713.725 5816.246
Corrected Total 13 103215.714

R-Square C.V. Root MSE Y Mean
0.605547 8.029030 76.264 949.86

Source DF Type I SS Mean Square F Value Pr > F
BLOCK 4 42255.048 10563.762 1.82 0.2303
TRAT 2 20246.942 10123.471 1.74 0.2435

Source DF Type III SS Mean Square F Value Pr > F
BLOCK 4 49805.025 12451.256 2.14 0.1785
TRAT 2 20246.942 10123.471 1.74 0.2435
Comentarios:
Este ejemplo tiene el propsito de ilustrar el procedimiento a usar y los aspectos
computacionales cuando existe(n) dato(s) faltante(s) en un diseo B. A. con efectos fijos.
Generalmente un diseo B. A. se planifica como un diseo balanceado pero al perder uno o ms
datos experimentales, el diseo llega a ser un diseo no balanceado. Pueden surgir muchas
complicaciones en el anlisis estadstico y prdidas de propiedades ptimas del diseo por el no
balanceo, por ejemplo: El error estndar de promedios de tratamientos ya no es un valor
constante sino varia segn si se trata del promedio de un tratamiento que tiene el problema de
dato(s) faltante(s) o no. Se pierde la propiedad de ortogonalidad del diseo ya que no se cumplir
la propiedad que S.C. Total = S.C. Bloques + S.C. Tratamientos + S.C. Error experimental. En
general se reduce la potencia de la dcima del estadstico F , lo cual pudiera hacer difcil
detectar las diferencias significativas.
En cuanto al procedimiento computacional a usar, se hace necesario usar Sumas de cuadrados,
cuadrados medios y F del tipo III (Type III ) en la salida del SAS, para ambas fuentes de
variacin que seran bloques y tratamientos. En este ejemplo el valor de F para bloques es 2,14
y el valor de F para tratamientos es 1,74

Diseo Cuadrado Latino
(3.1): Cuadrado Latino:

4 Filas: 4 Columnas: 4 Tratamientos(Variedades de Trigo) ;
y = Rendimiento por parcela en Kg. ;
Ejemplo: Steel, R.G.D y Torrie, J.H.: Capitulo 8 ;
DATOS:
C 10.5 D 7.7 B 12.0 A 13.2
B 11.1 A 12.0 C 10.3 D 7.5
D 5.8 C 12.2 A 11.2 B 13.7
A 11.6 B 12.3 D 5.9 C 10.2
General Linear Models Procedure
Dependent Variable: Y
Sum of Mean

Source DF Squares Square F
Value Pr > F
Model 9 87.680000 9.742222
21.49 0.0007
Error 6 2.720000 0.453333
Corrected Total 15 90.400000

R-Square C.V. Root
MSE Y Mean
0.969912 6.443065
0.6733 10.450

Source DF Type I SS Mean Square F
Value Pr > F
FILAS 3 1.955000 0.651667
1.44 0.3219
COLUMNAS 3 6.800000 2.266667
5.00 0.0452
TRATAMIENTOS 3 78.925000 26.308333
58.03 0.0001
Comentarios:
Considerando el nivel de significacin o = 0,05, observamos que el F calculado
para Filas no es significativo mientras el valor de F calculado para columnas es
significativo. Esto podra indicar que ha habido una falla en
el planeamiento del diseo y/o la construccin de las columnas. Surgen dudas sobre la
justificacin del diseo utilizado, ya que se pudo utilizar el diseo bloques aleatorios
para controlar la variabilidad por columnas.
F para tratamientos es altamente significativo. Por lo tanto, se debe realizar Anlisis del
Rango Mltiple de Duncan para determinar el mejor tratamiento. . Se omite este
cmputo aqu, ya que sera similar como se ha hecho esto en ejemplos anteriores.

(4): Experimentos Factoriales
(4.1): Experimento Factorial 2x4 en el Diseo B. A.

(4.1): Experimento Factorial 2x4 en el Diseo B. A.

* Datos: Li, J C. R., Capitulo 18: Introduction to Statistical
Inference
* Factores: Fecha de siembra con 2 niveles: Temprana , Tarda
;
* Factor: Abono con 4 niveles: Abono estndar, Areo, Na, y,
K ;
* Nmero de bloques = 4 ;
* Variable respuesta: rendimiento por parcela de soya ;
* Tabulacin de datos:
*
Bloques ;
* Fecha de siembra Abono 1 2 3 4
* Temprana Abono estndar - - - -

* Temprana Areo - - - -

* Temprana Na - - - -

* Temprana K - - - -

* .... Despus siguen 4 lineas siguientes para fecha de
siembra tarda ....;

Datos:
28.6 36.8 32.7 32.6
29.1 29.2 30.6 29.1
28.4 27.4 26.0 29.3
29.2 28.2 27.7 32.0
30.3 32.3 31.6 30.9
32.7 30.8 31.0 33.8

30.3 32.7 33.0 33.9
32.7 31.7 31.8 29.4

General Linear Models Procedure

Dependent Variable: Y
Sum of Mean
Source DF Squares Square F
Value Pr > F
Model 10 94.100000 9.410000
2.97 0.0169
Error 21 66.438750 3.163750
Corrected Total 31 160.538750

R-Square C.V. Root
MSE Y Mean
0.586151 5.773807
1.7787 30.806


Source DF Type I SS Mean Square F
Value Pr > F
BLOQUE 3 7.306250 2.435417
0.77 0.5238
FECHA 1 32.000000 32.000000
10.11 0.0045
ABONO 3 16.401250 5.467083
1.73 0.1919
FECHA*ABONO 3 38.392500 12.797500
4.05 0.0204
Comentarios:
Usaremos el nivel de significacin igual a 0,05 . Observamos que el valor de F para bloques no
es significativo. Esto indica que hubo una falla en el planeamiento del experimento y/o en la
construccin o orientacin de los bloques en el campo experimental.

La interaccin Fecha x Abono es significativa y en consecuencia no se puede realizar el anlisis
posterior entre los promedios de niveles de ninguno de los dos factores. El Anlisis grfico de
esta interaccin revela que las lneas de promedios correspondientes a las fechas de siembra
muestran una interseccin indicando que existe una interaccin por el cambio en la direccin de
la respuesta. Ya que el factor Abono no es significativo, no necesitamos hacer ningn anlisis
posterior entre los promedios de 4 niveles del factor abono. La interaccin Fecha x Abono
significativa, implica que la que ser la mejor fecha depender del nivel del factor Abono con
que esta se combina. Pero si se puede aplicar cualquier mtodo del anlisis posterior, (por
ejemplo Duncan) sobre los 8 promedios de tratamientos formados por todas las combinaciones
posibles entre los 2 niveles del factor Fecha y los 4 niveles del Factor abono.
Tomando en cuenta la informacin que se presenta en el cuadro ms arriba, podemos hacer
diferentes tipos de comparaciones:
Comparacin entre promedios de diferentes tipos de Abono para la siembra Temprana.
Comparacin entre promedios de diferentes tipos de Abono para la siembra Tarda.
Comparacin entre promedios de los dos tipos de fechas de siembra separadamente para cada
tipo de abono.
(No se requiere a volver a hacer otro cmputo del mtodo de Duncan, sino usar los resultados
del Anlisis de Duncan ya disponible)
El tratamiento que tiene el rendimiento ms alto es cuando se combina el Abono estndar con
una siembra temprana.
Diseos de Parcelas Divididas:
Los datos utilizados en este ejemplo proviene del libro de Steel, R.G.D. y Torrie, J.H. 4 lotes de
semillas de avena fueron usados como tratamientos principales. Hay 4 sub tratamientos que
consisten en un testigo mas tres productos qumicos que sirven para controlar una enfermedad de
plantas. Se usaron 4 bloques.
Este diseo asigna la mxima precisin de estimacin al factor productos qumicos (Sub
Tratamientos) y la mnima precisin a al factor Lotes de semillas(Tratamiento principal).
Tabulacin de datos:
Los datos se muestran en el programa de SAS. Las primeras 4 filas de datos corresponden a los
datos de los bloques 1 - 4, para el primer nivel del Tratamiento principal. Dentro de cada fila hay
4 datos correspondientes a los 4 niveles de sub tratamientos.
Las prximas 4 filas de datos corresponden a los datos de los bloques 1 - 4, para el segundo
nivel del Tratamiento principal. Dentro de cada fila hay 4 datos correspondientes a los 4 niveles
de sub tratamientos.
etc. y as sucesivamente hasta la tabulacin de las ltimas 4 filas correspondientes al cuarto y
ltimo nivel del Tratamiento principal.
Programa fuente SAS:
data pdivid ;
do tratprin = 1 to 4;
do bloques = 1 to 4;
do subtrat = 1 to 4;
input Y @;
output;
end;
input;
end;
end;
cards;
42.9 53.8 49.5 44.4
41.6 58.5 53.8 41.8
28.9 43.9 40.7 28.3
30.8 46.3 39.4 34.7
53.3 57.6 59.8 64.1
69.6 69.6 65.8 57.4
45.4 42.4 41.4 44.1
35.1 51.9 45.4 51.6
62.3 63.4 64.5 63.6
58.5 50.4 46.1 56.1
44.6 45.0 62.6 52.7
50.3 46.7 50.3 51.8
75.4 70.3 68.8 71.6
65.6 67.3 65.3 69.4
54.0 57.6 45.6 56.6
52.7 58.5 51.0 47.4
proc print; run;
proc GLM;
class Bloques Tratprin Subtrat;
model Y = Bloques Tratprin Bloques*Tratprin Subtrat Tratprin*Subtrat /ss1 ;
test h= Bloques Tratprin e=Tratprin*Bloques;
means Tratprin subtrat Tratprin*subtrat;
title 'Diseo Parcela Dividida';
run;
Salida SAS:
Nota: La salida SAS, tal como imprime el computador no se puede usar, sino
ser necesario reordenar la informacin obtenida en una tabla de Andeva
definitiva. Esta tabla que se obtenga, se llamar como tabla de andeva del diseo de
parcelas divididas, sin usar el calificativo "definitiva". Se usa este calificativo "definitiva"
simplemente para indicar que hay un trabajo que hacer y una vez que este trabajo esta
hecho, se obtendr la tabla de andeva, la que se va a usar. Esta tabla se muestra
despus de la salida SAS, la cual lleva algunas indicaciones en color rojo para preparar
la tabla de Andeva definitiva:
Diseo Parcela Dividida
General Linear Models Procedure

Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 27 7066.1919 261.7108 12.89 0.0001
Error 36 731.2025 20.3112 Nombrarla como Error(b)
Corrected Total 63 7797.3944

R-Square C.V. Root MSE Y Mean
0.906225 8.534077 4.5068 52.809


Source DF Type I SS Mean Square F Value Pr > F
BLOQUES 3 2842.8731 947.6244 46.66 0.0001 No usar esta Fila.
TRATPRIN 3 2848.0219 949.3406 46.74 0.0001 No usar esta Fila.
BLOQUES*TRATPRIN 9 618.2944 68.6994 3.38 0.0042 Nombrarla como Error(a)
SUBTRAT 3 170.5369 56.8456 2.80 0.0539
TRATPRIN*SUBTRAT 9 586.4656 65.1628 3.21 0.0059

Tests of Hypotheses using the Type I MS for
BLOQUES*TRATPRIN as an error term

Source DF Type I SS Mean Square F Value Pr > F

BLOQUES 3 2842.8731 947.6244 13.79 0.0010 Usar esta Fila.
TRATPRIN 3 2848.0219 949.3406 13.82 0.0010 Usar esta Fila.
A continuacin se muestra la Tabla de Andeva definitiva.
Anlisis de Varianza
Fuentes de Variacin G.L. S.C. C.M. F Pr > F
BLOQUES 3 2842.8731 947.6244 13.79 0.0010
TRATPRIN 3 2848.0219 949.3406 13.82 0.0010
Error(a) 9 618.2944 68.6994
SUBTRAT 3 170.5369 56.8456 2.80 0.0539
TRATPRIN*SUBTRAT 9 586.4656 65.1628 3.21 0.0059
Error(b) 36 731.2025 20.3112
Corrected Total 63 7797.3944
Comentarios:
Consideraremos el nivel de significacin o = 0,05.
F para bloques es significativo y esto indica que hubo justificacin en usar bloques en el diseo
para controlar la variabilidad.
Tratprin es la abreviatura para Tratamientos principales y tiene el valor de F significativo, lo cual
implica que hay diferencias significativas entre los promedios poblacionales de los 4 lotes de
semillas de avena.
La fuente de variacin Sub tratamientos no tiene el valor de F significativo y esto seala que no
existen diferencias significativas entre los promedios poblacionales de los 4 productos qumicos.
La interaccin tratamientos principal*subtratamientos es significativa lo cual indica que el
mejor lote de semilla de avena podra ser diferente para los diferentes productos qumicos
usados. Tambin observamos que debido a la presencia de la interaccin significativa no
podemos aplicar el mtodo del anlisis posterior a los promedios de los 4 lotes de semillas de
avena sino que los mismos deben ser comparados separadamente por cada uno de 4 productos
qumicos y as tambin podemos comparar las 16 combinaciones de tratamientos.


Anlisis Grfico:
En la grfica de la interaccin Tratamiento Principal x Sub tratamiento, se
observa la presencia de una interaccin por el cambio en la direccin de la
respuesta, ya que las lneas, correspondientes a los tratamientos
principales, muestran puntos de interseccin.
La lnea de promedios correspondiente al Tratamiento principal
nmero 4, siempre se encuentra arriba de las otras tres lneas
restantes. Por lo tanto, el mejor tratamiento principal, debera ser
el cuarto, sujeto a confirmacin del resultado del Anlisis de
Duncan
Anlisis de Duncan:
Ya que la interaccin Tratamiento Principal x Sub Tratamiento es
significativa, no podemos realizar anlisis posterior sobre los
promedios de Tratamientos principales y asimismo tampoco sobre
los promedios de Sub Tratamientos (adems este ltimo es no
significativo). Se puede hacer la comparacin entre los 16
tratamientos combinaciones por el Anlisis de Duncan y el
resultado de este procedimiento podr ser usado para responder
preguntas inicialmente planteadas en el objetivo del experimento.
Para realizar el cmputo del mtodo de Duncan, es necesario
obtener un estimacin del error experimental, la cual se puede
hallar por el promedio ponderado de los cuadrados medios de los
dos errores (a) y (b) en el diseo. En este ejemplo, esta estimacin
mancomunada tendr 45 g.l.
El Anlisis de Duncan revela que el mejor tratamiento es la
combinacin 42. Tambin se ha formado otro grupo que contiene
las combinaciones de tratamientos: 14 y 11, que tiene los
promedios ms bajos para la variable respuesta rendimiento.
Utilizando los resultados del del Anlisis de Duncan, tambin se
puede determinar: (No se requiere a volver a hacer otro cmputo
del mtodo de Duncan, sino usar los resultados del Anlisis de
Duncan ya disponible.)
(a): el mejor subtratamiento para cada uno de los tratamientos
principales separadamente.
(b): el mejor Tratamiento Principal para cada uno de los
Subtratamientos separadamente.



(6): Diseo de Parcelas Sub Divididas
Los datos utilizados en este ejemplo proviene del libro de Montgomery, D. Se trata de una
investigacin mdica para estudiar el tiempo de absorcin de un cierto tipo de cpsula
antibitica. En esta investigacin se utilizaron 3 tcnicos como Tratamientos principales, 3 dosis
como Sub Tratamientos y 4 niveles de grosor de la pared de cpsula como Sub Sub
Tratamientos. El experimento se hizo en 4 bloques.
Este diseo asigna la mxima precisin de estimacin al factor grosor (Sub Sub Tratamientos) ,
la mediana precisin al factor dosis (Sub Tratamientos) y la mnima precisin al factor tcnico
(Tratamiento principal).
Tabulacin de datos:
El esquema de la tabulacin de datos se presenta a continuacin. Los datos se muestran en el
programa de SAS.
Tcnico
-----------------------------------------------------
1 2 3
-----------------------------------------------------
Bloques Dosis 1 2 3 1 2 3 1 2 3
-----------------------------------------------------
Grosor - - - - - - - - -
1 - - - - - - - - -
1 2 - - - - - - - - -
3 - - - - - - - - -
4 - - - - - - - - -
- indica un dato. Cada fila tiene 9 datos. Este esquema se repite para los 3 bloques restantes.

Programa fuente SAS:
title Parcelas sub divididas;
data psubdiv ;
do Bloques = 1 to 4;
do Grosor = 1 to 4;
do Tecnico = 1 to 3;
do dosis = 1 to 3 ;
input y @@;
output;
end;
end;
input;
end;
end;
cards;
95 71 108 96 70 108 95 70 100
104 82 115 99 84 100 102 81 106
101 85 117 95 83 105 105 84 113
108 85 116 97 85 109 107 87 115
95 78 110 100 72 104 92 69 101
106 84 109 101 79 102 100 76 104
103 86 116 99 80 108 101 80 109
109 84 110 112 86 109 108 86 113
96 70 107 94 66 100 90 73 98
105 81 106 100 84 101 97 75 100
106 88 112 104 87 109 100 82 104
113 90 117 121 90 117 110 91 112
90 68 109 98 68 106 98 72 101
100 84 112 102 81 103 102 78 105
102 85 115 100 85 110 105 80 110
114 88 118 118 85 116 110 95 120
;
proc print; run;
PROC GLM;
class Bloques Tecnico Dosis Grosor ;
model y = bloques tecnico bloques*tecnico dosis tecnico*dosis
dosis*bloques(tecnico)
grosor tecnico*grosor dosis*grosor tecnico*dosis*grosor/ss1 ;

test h=bloques tecnico e=bloques*tecnico;
test h=dosis tecnico*dosis e=dosis*bloques(tecnico);
Run;
Salida SAS:
Parcelas
subdivididas
General Linear Models Procedure

Dependent Variable: Y
Sum of Mean
Source DF Squares Square F Value Pr >
F
Model 62 25921.472 418.088 46.83
0.0001
Error 81 723.188 8.928
Nombrar esta F.V. como Error(c)
Corrected Total 143 26644.660

R-Square C.V. Root MSE Y
Mean
0.972858 3.074926 2.9880
97.174
Source DF Type I SS Mean Square F Value Pr >
F

BLOQUES 3 48.410 16.137 1.81
0.1524 No usar esta Fila.
TECNICO 2 248.347 124.174 13.91
0.0001 No usar esta Fila.
BLOQUES*TECNICO 6 161.153 26.859 3.01
0.0105 Nombrarla como Error(a)
DOSIS 2 20570.056 10285.028 1151.97
0.0001 No usar esta Fila.
TECNICO*DOSIS 4 125.944 31.486 3.53
0.0105 No usar esta Fila.
BLOQUE*DOSIS(TECNIC) 18 226.000 12.556 1.41
0.1514 Nombrarla como Error(b)
GROSOR 3 3806.910 1268.970 142.13
0.0001
TECNICO*GROSOR 6 126.486 21.081 2.36
0.0375
DOSIS*GROSOR 6 402.278 67.046 7.51
0.0001
TECNICO*DOSIS*GROSOR 12 205.889 17.157 1.92
0.0435

Tests of Hypotheses using the Type I MS for
BLOQUES*TECNICO as an error term
Source DF Type I SS Mean Square F Value Pr >
F
BLOQUES 3 48.40972 16.13657 0.60
0.6378
TECNICO 2 248.34722 124.17361 4.62
0.0609

Tests of Hypotheses using the Type I MS for
BLOQUE*DOSIS(TECNIC) as an error term

Source DF Type I SS Mean Square F Value Pr >
F
DOSIS 2 20570.056 10285.028 819.16
0.0001
TECNICO*DOSIS 4 125.944 31.486 2.51
0.0784
A continuacin se muestra la Tabla de Andeva definitiva.
Anlisis de Varianza
Fuentes de Variacin G.L. S.C. C.M. F Pr >
F
BLOQUES 3 48.40972 16.13657 0.60
0.6378
TECNICO 2 248.34722 124.17361 4.62
0.0609
Error(a) 6 161.153 26.859
DOSIS 2 20570.056 10285.028 819.16
0.0001
TECNICO*DOSIS 4 125.944 31.486 2.51
0.0784
Error(b) 18 226.000 12.556
GROSOR 3 3806.910 1268.970 142.13
0.0001
TECNICO*GROSOR 6 126.486 21.081 2.36
0.0375
DOSIS*GROSOR 6 402.278 67.046 7.51
0.0001
TECNICO*DOSIS*GROSOR 12 205.889 17.157 1.92
0.0435
Error(c) 81 723.188 8.928
Corrected Total 143 26644.660
Comentarios:
El valor de F para Tcnico no es significativo. Esto indica que los tres Tcnicos han tenido xito en
conducir el experimento de una manera uniforme. Puesto que F para dosis es significativo, podemos
concluir que existen diferencias significativas entre las potencias de las 3 dosis que se han probado en este
experimento. La interaccin Tcnico*Dosis al no ser significativa, asegura que las 3 dosis entre ellas
mantienen las mismas diferencias relativas del tiempo de absorcin , no importa cual es el Tcnico quin
lo prepara. Esta informacin es importante ya que esto asegura la uniformidad en la calidad del producto
elaborado.
Grosor es significativo, lo cual implica que la potencia del antibitico depende del grosor de la pared de
cpsula. La interaccin DOSIS*GROSOR es significativa. Esto indica que el factor dosis y el factor
grosor de la cpsula no son independientes. La interaccin TECNICO*GROSOR es significativa
indicando que el nivel del factor grosor que tenga el mejor tiempo de absorcin depende del tcnico
quin ha elaborado el antibitico. La interaccin triple Tecnico*Dosis* Grosor, por ser una interaccin de
tres factores puede ser causada de una manera compleja por la significacin de cualesquiera de las
siguientes interacciones: Tcnico por Dosis*Grosor, o Dosis por Tcnico*Grosor o por Grosor por
Tcnico*Dosis.
A continuacin se presenta la informacin necesaria para hacer el Anlisis grfico de las 3 interacciones
dobles:

Anlisis Grfico:
Sabemos que una interaccin doble es causada por una o ambas de las siguientes raznes:
(1): Existe diferencia en la magnitud de respuesta. (Se identifica esta situacin en la grfica
cuando algunas o todas
de las lneas no son paralelas pero no existe interseccin entre ellas.)
(2): Existe diferencia en la direccin de respuesta. (Se identifica esta situacin en la grfica
cuando algunas o todas
de las lneas intersectan entre ellas.)
Cuando todas las lneas en la grfica son paralelas, entonces no existe interaccin.
En las 3 grficas que se presentan arriba, podemos observar que:
(1): Ninguna de las 3 grficas muestran lneas paralelas y en consecuencia suma de cuadrados
para interaccin para
cada una de los 3 interacciones ser mayor que cero.
(2): Ninguna de las 3 grficas presentan la diferencia en la direccin de respuesta, ya que no
existe interseccin
entre las lneas.
(3): Cada una de las 3 grficas muestra diferencia en la magnitud de respuesta, siendo esta de un
grado leve para la
interaccion Tcnico*Dosis la cual no alcanza significacin para o = 0,05 .
En cambio, las interacciones Tcnico*grosor y Dosis*Grosor muestran las diferencias en la
magnitud de
respuesta en un grado ms pronunciado y as alcanzan significacin para o = 0,05 en la tabla
de ANDEVA.
Anlisis Posterior:
Ya que la interaccin triple Tecnico*Dosis*Grosor y dos interacciones dobles son significativas,
no se puede hacer
el anlisis posterior sobre los promedios de los niveles de ninguno de los 3 factores.
Podemos realizar el anlisis de Duncan sobre los promedios tridimensionales de Tcnico, Dosis
y Grosor. Este
clculo requiere la estimacin de la varianza del promedio tridimensional y se puede obtener
por el promedio
ponderado de los cuadrados medios de los 3 tipos de errores a, b, y c. Esta estimacin tendr 105
g.l.. A
continuacin se representa en forma resumida el resultado obtenido por el uso del anlisis de
Duncan:
Duncan Grouping Mean N TRAT
A 115.250 4 413
A
A 115.000 4 313
A
A 115.000 4 433
A
B A 112.750 4 423
B A
B A 112.000 4 421
........................................
Se omiten los valores intermedios
........................................
N 71.750 4 112
N
N 71.000 4 132
N
N 69.000 4 122
El grupo de combinaciones de tratamiento con promedios que tengan valores ms altos de la
variable respuesta
son: 413, 313 y 433 . Asimismo, el grupo formado por las combinaciones de tratamientos:
112, 132 y 122, tiene
promedios con valores ms bajos de la respuesta.

Tomando en cuenta los resultados del del Anlisis de Duncan, tambin se puede determinar:
(a): El mejor Tcnico para cada una de las combinaciones de Dosis por Grosor.
(b): La mejor Dosis para cada una de las combinaciones de Tcnico por Grosor.
(c): El mejor Grosor para cada una de las combinaciones de Tcnico por Dosis.
(No se requiere a volver a hacer otro cmputo del mtodo de Duncan, sino usar los resultados
del Anlisis de
Duncan ya disponible.)