Está en la página 1de 123

(1): Introducción

(2): Aproximación de una superficie de respuesta por polinomios:

(3-1): Requerimientos y propiedades deseables de los diseños óptimos:


(3-2): Estrategia experimental
(3-3): Método del ascenso más pronunciado:
 (4): Diseños de primer orden: (5-1): Diseños de segundo orden:
(5-2): Construcción de diseños compuestos centrales:
 (6): Diseños Rotables:

(7): Análisis Canónico:

(8): Bibliografía:
 

(1): INTRODUCCION

Supóngase que la dependencia de una variable respuesta Y sobre los


niveles x 1, x 2, ..., x k
de k variable cuantitativas o factores se puede expresar por el siguiente
modelo matemático:
Y =  (x 1, x 2, ..., x k) +  ; ~ N( 0, ).
Esta relación funcional en general se llama una superficie de respuesta.
Uno de los objetivos
más frecuente en una investigación por experimentación consiste en
determinar los valores
de las k variables independientes, x i ; (i = 1,...,k), l as cuales pueden
producir un máximo
( o mínimo) de E(Y).

Se asumirá que en la mayoría de los casos prácticos, la forma de función 


es desconocida
y aún cuando en un caso dado  puede ser muy complejo, siempre será
posible aproximar la
función satisfactoriamente por un polinomio en x i ; (i = 1,...,k); de algún
grado adecuado
dentro de una región experimental previamente planificada.

A fin de estimar los parámetros de una función polinomial , que puede servir
para aproximar
la superficie de respuesta , necesitaremos emplear un diseño de
experimento el cual se
puede denotar por : (x 1u, x 2u, ..., x ku); u = 1,...,N; que constituye una
selección de
N puntos en una región experimental de interés.
Después de realizar el experimento, utilizando el diseño indicado, se
obtendrá la estimación
de la función , que a su vez se puede someter a un análisis para averiguar
acerca de las
condiciones que se deben imponer sobre las variables x 1, x2, ..., xk; para que
E(Y) alcance
un valor óptimo, que podría ser un máximo o un mínimo, según sea el caso
bajo estudio.
 

(2): Aproximación de una superficie de respuesta por polinomios:

La aproximación de una relación funcional desconocida  , se puede hacer


de la manera mas
simple por el modelo lineal de primer orden:
Y = 01x 12x 2 +. . . +kx k; ~ N( 0, ).
el cual representa la ecuación de un plano.

En el caso de que el modelo de primer orden no sea adecuado, el siguiente


modelo de segundo
orden se puede utilizar:

Y = 0ix iiix i2 + ijx ix j; (i,j =1, ..., k ; i < j); ~ N( 0, ).

La superficie de respuesta del segundo orden dado por E(Y) puede ser una
parábola, híperbola,
elipse o sus generalizaciones correspondientes en el caso k-dimensional.
Así también en el
caso de que fuera necesario, superficies polinomiales de orden superior a
dos, se pueden
utilizar. Una superficie polinomial de esta naturaleza, se debe considerar
solo como una
aproximación de la verdadera relación funcional en el interior de una
región considerada en
el experimento. Una extrapolación que intenta hacer predicciones fuera de
la región experimental
puede ser arriesgada y no confiable.
 

(3-1): Requerimientos y propiedades deseables de los diseños óptimos:

Box y Hunter(1951) sugirieron las siguientes propiedades que deberían


poseer los diseños multifactoriales de orden d:
(1): El diseño debe permitir la estimación de parámetros de una superficie
de respuesta
polinomial con una precisión satisfactoria dentro de la región de interés.

(2): El número de puntos experimentales en el diseño no debe ser muy


grande.

(3): El diseño debe posibilitar una verificación con exactitud, que el


polinomio asumido
en el estudio es del grado adecuado.

(4): Debe permitir el uso de bloques cuando así sea conveniente.

(5): Debe formar un núcleo, del cual un diseño satisfactorio del grado d+1
se puede construir
en el caso de que se verifica que el grado d del polinomio no es adecuado.

 
(3-2): Estrategia experimental

En la selección de los puntos experimentales de un diseño, el investigador debe


tomar en cuenta
las siguientes circunstancias que podrían influir su estrategía:
 Magnitud del error experimental
 Complejidad de la superficie de respuesta
 Si o no es posible ejecutar el experimento en forma secuencial
(3-3): Método del ascenso más pronunciado:

Este método establece una regla que se utiliza en una serie de experimentos
secuenciales para
pasar a una región de respuesta más alta en la búsqueda de una respuesta
máxima.

Sea (0,0, ... ,0) el centro del primer experimento. Entonces esta regla de decisión
determina las coordenadas del punto P = (x'1, x'2, ..., x'k), el cual será el centro del
próximo experimento.

Esta técnica consiste en seleccionar un diseño con pocos puntos experimentales y


luego al
conducir el experimento, se obtienen las estimaciones de los parámetros
correspondiente a un
modelo polinomial de grado uno.
Sea
Y(estimado) = b0 + b1X1 + b2X2 + .... +bkXk
la estimación de ecuación del plano en un experimento. Entonces el camino del
ascenso mas pronunciado se toma al pasar al centro del próximo diseño a lo largo
de los ejes :
X1, X2 ,..., Xk en cantidades proprcionales a : b1 , b2 , .... , bk respectivamente.
 

(4) Diseños de primer orden:

Los diseños de primer orden son aquellos que permiten la estimación de


parámetros de un
modelo polinomial de grado uno.
 
Ejemplos de diseños de primer orden:
 Experimentos factoriales de la serie 2k

 Repitición fraccionada 1/2p del factorial 2k

Estos diseños son muy convenientes en trabajos exploratorios para obtener el


ajuste de una
relación lineal entre la respuesta como variable dependiente y las variables
independientes.
Estos diseños también se pueden utilizar en las etapas iniciales de un programa
de
experimentación secuencial en la búsqueda de la respuesta óptima.

Mas abajo, se presenta una lista de algunos diseños factoriales fraccionados que
son útiles
como diseños de primer orden en las etapas priliminares en la exploración de una
superficie
de respuesta.
 

  Tabla 1: Algunos diseños útiles de primer orden formados por diseños factoriales 2 k-p 
Número de Tamaño del Fracción   G.L. por falta
factores  experimento  de ajuste 


3  8  1/2  4 
4  8  1/4  3 
5  8  1/2  2 
5  16  1/8  10 
6  8  1 
 
Propiedades:
El diseño factorial fraccionado 1/2p tiene las siguientes propiedades:
 Existen 2k-p puntos experimentales.

o de un total de 2k-1 efectos principales e interacciones


correspondientes al experimento

factorial comple to, 2p-1 serán inseparable del parámetro 0 en el modelo y los
restantes
2k - 2p efectos serán mutuamente inseparables en conjuntos de 2p, siendo el
número de
tales conjuntos igual a 2k-p.
  Mayores detalles de la construcción de los experimentos factoriales
fraccionados se pueden
obtener en Raghava Rao (1971).
 
(5-1): Diseños de segundo orden:

Los diseños de segundo orden permiten la estimación de parámetros de un


modelo polinomial
de grado dos. Ejemplos simples de este tipo de diseños son las series de 3k 
factorial. La
desventaja de la serie 3k es que con k >3, el número de puntos
experimentales que se requieren
para conducir el experimento, llega a ser muy alto. Además los parámetros
11, ... , kk ; en
general se estiman con precisión relativamente baja. Box y Wilson (1951)
han desarrollado una
familia de diseños llamados diseños compuestos que son mas
convenientes para este propósito
y se presentan a continuación:
 

(5-2): Construcción de diseños compuestos centrales:

Construcción del diseño:


Los puntos experimentales de este diseño consisten en:
 (i): Puntos del factorial 2k o su fracción, ampliado por :

 (ii): 2k puntos axiales sobre los ejes de las variables independientes,


denotados por:
(-, 0, ... , 0); (, 0, ... , 0); (0, -, ... ,0); (0, , ... ,0); ... ; (0, 0, ... , -,); (0,
0, ... , ,)
 
 (iii): Punto(s) sobre el centro del diseño.

El valor de  se puede elegir para :


 (a): Dar la propiedad de ortogonalidad al diseño o

 (b): Minimizar el sesgo que surge si el modelo planteado en una


investigación es de grado
dos pero el modelo verdadero tiene grado superior a dos o
 
 (c): Dar la propiedad de rotabilidad al diseño.

Uso de un diseño compuesto central en experimentación secuencial:


Los diseños compuestos centrales se pueden incorporar en un programa de
experimentación secuencial. Este programa se puede iniciar con un factorial 2k con
meta exploratoria y hará
posible obtener la estimación de un modelo de primer grado. Si en esta etapa,
mediante el uso
de F.V. de falta de ajuste, se verifica que el modelo cuadrático debería ser el más
apropiado,
entonces se procederá a agregar (2k+1) puntos adicionales, el cual lo convierte en
un diseño
compuesto central. En la segunda etapa se utilizan ( 2k+2k +1) puntos expeimentales
en el análisis estadístico y se estiman los parámetros de grado dos.
 
Construcción de un diseño compuesto central ortogonal:
Box y Wilson(1951) han demostrado que para dar la propiedad de ortogonalidad al
diseño, se
elige el valor de  tal que:

mF/4) 1/4 , donde m = ((F+T) 1/4 - F1/2)2

en que F = número de puntos de 2k completo o su fracción apropiada y T = número


de puntos adicionales para construir un diseño compuesto central.
cuando = 1.215, este diseño se llama un diseño compuesto ortogonal.
 

(6): Diseños Rotables:

En consideración del problema de selección de diseños óptimos, Box y Hunter


(1951),
propusieron el criterio de rotabilidad de un diseño.
 

Definición del concepto de rotabilidad de un diseño:


Sea (0, 0, ... , 0) el centro de un diseño. Sea:

Y(est.)(u) = b0bix iubiix iu2 + bijx iux ju; (i,j =1, ..., k ; i < j); (u = 1, ... , N);

la respuesta estimada en el punto (x 1u, x 2u, ..., x ku); Sea:


Var.(Y(est.)(u)) = (a'(X' X)-1a)donde
a' = (1, x 1u , ... , x ku ; x 21u , ... , x2 ku ; x 1u x 2u , ... , x k-1 , u x ku ;)

Un diseño se llama rotable si y solo si Var.(Y(est.)(u)) es invariante para todos los


puntos que
sean equidistante desde el centro del diseño.
 

Nota : Si un diseño es rotable, entonces Var.(Y(est.)(u)) será una función solamente


de
x 21u + x 22u + , ... , + x 2ku
 
Construcción de un diseño Compuesto central rotable:
Los puntos experimentales de este diseño consisten en:
 
 (i): nc puntos del factorial 2k o su fracción apropiada , denotados por :
(
 (ii): na puntos axiales sobre los ejes de las variables independientes, denotados
por:
(, 0, ... , 0); (0, , ... ,0); ... ; (0, 0, ... , );  donde  = (F)1/4 , en que F es igual
al
número de puntos experimentales del factorial 2k o su fracción apropiada.
 
 (iii): no punto(s) sobre el centro del diseño. (0, 0, ... , 0); Sea  nc + 4(1 +
(nc) 1/2 )),  el parámetro del diseño rotable. La selección del valor
de fija el número de puntos centrales de un diseño. Los valore de
recomendados por
Box y Wilson se presentan en la tabla a continuación:
 
Tabla 2: Valores de recomendados por Box y Wilson
 
                                                                            k                   
2  0,7844 
3  0,8385 
4  0,8704 
5  0,8918 
6  0,9070 
7  0,9184 
8  0,9274 
 
 
 
 
 

 
 
 
 
 
(7): Análisis Canónico:
(7-1): Ejemplo1:  Khuri y Cornell, Página 170
                                                    1

                   OBS      Y      OTEMP    OTIEMPO      TEMP      


TIEMPO
                     1    93.6    125.90     171.9     -1.00000   
-1.00000
                     2    91.7    125.90     218.1     -1.00000    
1.00000
                     3    92.5    145.90     171.9      1.00000   
-1.00000
                     4    92.9    145.90     218.1      1.00000    
1.00000
                     5    96.2    135.90     195.0      0.00000    
0.00000
                     6    97.0    135.90     195.0      0.00000    
0.00000
                     7    92.7    121.75     195.0     -1.41421    
0.00000
                     8    92.8    150.04     195.0      1.41421    
0.00000
                     9    93.4    135.90     162.3      0.00000   
-1.41421
                    10    92.7    135.90     227.7      0.00000    
1.41421
                                                                          
                    

                       

                         Response Surface for Variable Y: RENDIMIENTO

                               Response Mean           93.550000


                               Root MSE                 0.336892
                               R-Square                   0.9825
                               Coef. of Variation         0.3601

                           Degrees
                              of       Type I Sum
          Regression       Freedom     of Squares     R-Square    F-
Ratio    Prob > F

          Linear                 2        0.782267      0.0302     


3.446     0.1349
          Quadratic              2       23.346250      0.9012     
102.9     0.0004
          Crossproduct           1        1.322500      0.0511    
11.652     0.0269
          Total Regress          5       25.451016      0.9825    
44.849     0.0013

                         Degrees
                            of         Sum of
        Residual         Freedom       Squares       Mean Square    F-
Ratio    Prob > F

        Lack of Fit            3        0.133984        0.044661     


0.140     0.9247
        Pure Error             1        0.320000        0.320000
        Total Error            4        0.453984        0.113496

                                                                          
          
                   
Degrees                                                         
                      of       Parameter     Standard     T for
H0:                
 Parameter          Freedom    Estimate        Error     Parameter=0 
Prob > |T|    

 INTERCEPT             1        96.600000      0.238218      405.5     


0.0000       
 TEMP                  1         0.030178      0.119109      0.253     
0.8125       
 TIEMPO                1        -0.311244      0.119109     -2.613     
0.0592       
 TEMP*TEMP             1        -1.981250      0.157567    -12.574     
0.0002       
 TIEMPO*TEMP           1         0.575000      0.168446      3.414     
0.0269        
 TIEMPO*TIEMPO         1        -1.831250      0.157567    -11.622     
0.0003       

             Degrees
                of       Sum of
  Factor     Freedom     Squares     Mean Square  F-Ratio  Prob > F

  TEMP           3       19.274250      6.424750   56.608   0.0010  


TEMPERATURA (CENTIGRADO)
  TIEMPO         3       17.427660      5.809220   51.184   0.0012  
TIEMPO (SEGUNDOS)
                             Ejemplo: Khuri y Cornell, Página
170                             4

                            Canonical Analysis of Response Surface


                                     (based on coded data)

                                 Critical Value


             Factor           Coded          Uncoded
             TEMP            -0.003412       -0.004826    TEMPERATURA
(CENTIGRADO)
             TIEMPO          -0.060627       -0.085739    TIEMPO
(SEGUNDOS)

                       Predicted value at stationary point     96.613270

                                                 Eigenvectors
                          Eigenvalues        TEMP           TIEMPO

                            -3.218257        0.611383        0.791335


                            -4.406743        0.791335       -0.611383

                                Stationary point is a maximum.

 
  
 

(7-2): Ejemplo 2:   Puntos de Ensilladura


 
 
 
 
 

Bibliografía:

(1): Box, G.E. P. y J.S. Hunter (1951): Multifactor experimental designs for
exploring response
surfaces. J.R.S.S. ser. B, vol. 13, No. 1, 195-240.

(2): Box, G.E. P. y K.B. Wilson (1951): On experimental attainment of optimum


conditions.
J.R.S.S. ser. B, vol 13, No. 1 -45.

(3): Cornell, John A:(1990.): How to apply response surface methodology.


Milwaukee, WI .

(4): Khuri, André I. y John A. Cornell.(1996): Response surfaces : designs and


analyses .
Marcel Dekker, New York .
(5): Myers, Raymond H. y Douglas C. Montgomery.(1995.): Response surface
methodology :
process and product optimization using designed experiments. Wiley, New York.

(6): Raghava Rao, D. (1971): Construction and combinatorial problems in Design


of Experiments.
Wiley, New York.

(7): S.P.Sinha: Comparación de precisión y sesgo de algunos Diseños


Experimentales de
superficie de respuesta. Publicación 80-01, I.E.A.C., U.L.A. 1980.

 
     Análisis de Varianza esquemático:
1.  Diseño Completamente Aleatorio
1. Caso balanceado con efectos fijos
2. Caso no balanceado con efectos fijos
3. Caso balanceado con efectos aleatorios
2. Diseño Bloques Aleatorios
1.  Caso balanceado con efectos fijos
2.  Caso balanceado con efectos aleatorios
3.  Caso balanceado y mixto
3. Diseño Cuadrado Latino
1.  Caso fijo y balanceado
4. Experimento Factorial
1.  Experimento Factorial de 2 factores
2.  Experimento Factorial de 3 factores

                
 
 
 
 
 
 
 
 
Diseño Completamente Aleatorio
(Caso balanceado con efectos fijos)
Modelo Lineal: Yij = iij ; i = 1,...,k ; j = 1,..,n ; ij ~ NID(0, )  
efecto medio ; iel efecto del tratamiento i - ésimo;
ij = error aleatorio para j - ésima observación en el tratamiento i - ésimo.
F.V. G.L. S.C. C.M. F H0
Tratamientos  (k-1) S1 M1 = S1 / (k-1) F = M1/M2 i; para todo i = 1,...,k
Error experimental k(n-1) S2  M2 = S2 / k(n-1)
Total       kn-1
      Regresar al Menú anterior:                                                                                                      
Regresar al Menú anterior
     Comentarios:
1. Este diseño también se llama el Diseño de clasificación simple.
2. El diseño completamente aleatorio solo debe ser usado cuando el material
experimental es totalmente homogéneo.
3. Este diseño no es apto para ser usado en el campo experimental, pero puede ser
usado en un experimento en laboratorios y también invernaderos.

     Regresar al Menú anterior:


 
Diseño Completamente Aleatorio
(Caso no balanceado con efectos fijos)
Modelo Lineal: Yij = iij ; i = 1,...,k ; j = 1,..,ni   ij ~ NID(0, )  
efecto medio ;iel efecto del tratamiento i - ésimo;
ij  = error aleatorio para j - ésima observación en el tratamiento i - ésimo.
 
 F.V. G.L. S.C. C.M. F H0
Tratamientos  (k-1) S1 M1 = S1 / (k-1) F = M1/M2 i; para todo i =
1,...,k
Error      ni. -          M2 = S2 / (ni. -
  S2
experimental k k)
Total      ni. -1

Diseño Completamente Aleatorio


(Caso balanceado con efectos aleatorios)
Modelo Lineal: Yij = iij ; i = 1,...,k ; j = 1,..,n ;
efecto medio ;iel efecto del tratamiento i - ésimo;  i~ NID(0, ) 
ij  = error aleatorio para j - ésima observación en el tratamiento i - ésimo. ij ~
NID(0, ) 

F.V. G.L. S.C. C.M. F H0
Tratamientos  (k-1) S1 M1 = S1 / (k-1) F = M1/M2 
Error experimental k(n-1) S2  M2 = S2 / k(n-1)
Total       kn-1
       Regresar al Menú anterior:                                                                                                   
Regresar al Menú anterior
 
Diseño en Bloques Aleatorios
(Caso balanceado con efectos fijos)
Modelo Lineal: Yij = ij + ij ;  i = 1,...,k ;  j = 1,..,n ;   .= 0 ;    .= 0 ;
efecto medio ;iel efecto del tratamiento i - ésimojel efecto del bloque  j -
ésimo
ij  = error aleatorio para la observación en el  j - ésimo bloque y el tratamiento i -
ésimo.  ij ~ NID(0, ) 

F.V. G.L. S.C. C.M. F H0
F1 = i; para todo i =
Tratamientos  (k-1) S1 M1 = S1 / (k-1)
M1/M3 1,...,k
F2 = j; para todo j =
Bloques  (n-1)   S2 M2 = S2 / (n-1)
M2/M3 1,...,n
Error (k-1)(n- M3 = S3 /[ (k-1)(n-
S3
experimental 1) 1)]
Total  kn-1 S4
       Regresar al Menú anterior:                                                                                                     
Regresar al Menú anterior
Diseño en Bloques Aleatorios
(Caso balanceado con efectos aleatorios)
Modelo Lineal: Yij = ij + ij ; i = 1,...,k ; j = 1,..,n ;
efecto medio ;
iel efecto del tratamiento i - ésimojel efecto del bloque  j - ésimoi~ NID(0,
) j~ NID(0, ) 
ij  = error aleatorio para la observación en el  j - ésimo bloque y el tratamiento i -
ésimo.  ij ~ NID(0, ) 

F.V. G.L. S.C. C.M. F H0
Tratamientos  (k-1) S1 M1 = S1 / (k-1) F1 = M1/M3 
Bloques  (n-1)    S2 M2 = S2 / (n-1) F2 = M2/M3 
Error experimental (k-1)(n-1) S3 M3 = S3 /[ (k-1)(n-1)]
Total  kn-1 S4
      Regresar al Menú anterior:                                                                                                     
Regresar al Menú anterior
 
Diseño en Bloques Aleatorios
(Caso balanceado y mixto)
Modelo Lineal: Yij = ij + ij ; i = 1,...,k ; j = 1,..,n ;
efecto medio ;
iel efecto del tratamiento i - ésimojel efecto del bloque  j - ésimo.= 0 ; j~
NID(0, ) 
ij  = error aleatorio para la observación en el  j - ésimo bloque y el tratamiento i -
ésimo.  ij ~ NID(0, ) 

F.V. G.L. S.C. C.M. F H0
F1 = i; para todo i =
Tratamientos  (k-1) S1 M1 = S1 / (k-1)
M1/M3 1,...,k
F2 =
Bloques  (n-1)   S2 M2 = S2 / (n-1) 
M2/M3
Error (k-1)(n- M3 = S3 /[ (k-1)(n-
S3
experimental 1) 1)]
Total  kn-1 S4
      Regresar al Menú anterior:                                                                                                      
Regresar al Menú anterior


Diseño en Cuadrados Latinos
(Caso fijo y balanceado )
Modelo Lineal: Yijk = ij +  ijk ; i = 1,...,a ;  j = 1,..,a ; k = 1,..,a ;
efecto medio ;
iel efecto de la fila  i - ésimajel efecto de la columna  j - ésimakel efecto del
tratamiento  k - ésimo
.= 0 ;     .;  .
ij  = error aleatorio para la observación   i j k - sima .    ij ~ NID(0, ) 

F.V. G.L. S.C. C.M. F H0
F1 = i; para todo i =
Filas  (a -1) S1 M1 = S1 / (a-1)
M1/M4 1,...,a
F2 = j; para todo i =
Columnas  (a -1)   S2 M2 = S2 / (a-1)
M2/M4 1,...,a
F3 = k; para todo i =
Tratamientos  (a-1)   S3 M3 = S3 / (a-1)
M3/M4 1,...,a
Error (a-1)(a M4 = S4 /[ (a-1)(a-
S4
experimental -2) 2)]
Total  a2-1 S5
      Regresar al Menú anterior:                                                                                           
Regresar al Menú anterior
 

                                                                                   

Experimento Factorial de 2 factores en el diseño completamente aleatorio


(Caso fijo y balanceado )
Yijr = ij ij   ijr ;
. = 0 ; . = 0 ;. j = ( i .= 0 ;
       i = 1,...,a ;  j = 1,..,b ; r = 1,..,n ;
Yijr =  la variable respuesta   i j r - sima .
    efecto medio,iel efecto  del  i - ésimo nivel del factor A
jel efecto del  j - ésimo nivel del factor B 
ij    es la  interacciones doble.
ijr  = error aleatorio para la observación   i j r - sima .    ijr ~ NID(0, ) 

F.V. G.L. S.C. C.M. F H0
F1 =
A  (a -1)  S1 M1 = S1 / (a-1) i; para todo i = 1,...,a
M1/M4
B  (b -1)   S2 M2 = S2 / (b-1) F2 = j; para todo j = 1,...,b
M2/M4
 (a-1)(b- M3 = S3 / [(a-1) F3 = ij; para todo i =
AB   S3
1) (b-1)] M3/M4 1,...,a; j = 1,...,b
Error M4 = S4 /
 ab(n-1) S4
experimental [ ab(n-1)]
Total  abn-1 S5
      Regresar al Menú anterior:                                                                                                      
Regresar al Menú anterior

Experimento Factorial de 3 factores en el diseño completamente aleatorio


(Caso fijo y balanceado )
Modelo Lineal: Yijkr = ij +  kij ikjk ijk +  ijkr ;
i = 1,...,a ;  j = 1,..,b ; k = 1,..,c ; r = 1,...,n ;
...
. j = ( i .= 0 ;     (i .(. k(j.  =   (. k = ;
Yijkr =  la variable respuesta   i j kr - sima .
efecto medio; iel efecto del  i - ésimo nivel del factor Ajel efecto del  j - ésimo nivel
del factor B 
kel efecto del  k - ésimo nivel del factor C ij , ik y jk  son interacciones dobles.
ijk  es la interacción triple.
ijkr = error aleatorio para la observación   i j kr - sima .    ijkr ~ NID(0, ) 

F.V. G.L. S.C. C.M. F H0
F1 = i; para todo i =
A  (a -1) S1 M1 = S1 / (a-1)
M1/M8 1,...,a
F2 = j; para todo j =
B  (b -1)   S2 M2 = S2 / (b -1)
M2/M8 1,...,b
F3 = k; para todo k =
C  (c-1)   S3 M3 = S3 / (c-1)
M3/M8 1,...,c
M4 = S4 /(a -1)(b F4 = ij = 0 para todo i
AB (a -1)(b -1)   S4
-1) M4/M8 yj
M5 = S5 /(a -1) F5 = ik = 0 para todo i y
AC (a -1)(c-1)   S5
(c-1) M5/M8 k
M6 = S6 /(b -1) F6 = jk = 0 para todo j
BC (b -1)(c-1)   S6
(c-1) M6/M8 yk
(a -1)(b -1) M7 = S7 /(a -1)(b -1)(c- F7 = ijk = 0 para todo
ABC   S7 1)
(c-1) M7/M8 i, j,  k
Error M8 = S8
abc(n-1) S8
experimental /[ abc(n-1)]
Total abcn -1 S9
Técnicas para interpretar
resultados de Análisis de Varianza:
con Ejemplos usando SAS:
Por
Prof. S. P. Sinha
 Indice del Contenido:
  Objetivos de esta Página:
(1):  Diseño Completamente
aleatorio
(2):  Diseño en bloques
aleatorios  
(3):  Diseño Cuadrado Latino 

(4):  Experimentos
Factoriales 
(5):  Diseño de Parcelas
Divididas 
(6):  Diseño de Parcelas Sub
Divididas 
 
Esta sección hace uso de programas fuentes, salidas  SAS
y esquemas de Análisis de varianza, que Ud. puede consultar
por los enlaces que se presentan a continuación:
                                                        Programa Fuente y Salida SAS       Andeva Esquemático
IMPORTANT NOTICE ABOUT THE COPYRIGHTS.
Análisis Gráfico: 1    
2     3     4
 

Matchmaker.com: Sign up now for a free trial. Date Smarter!

Objetivos de esta Página:


 
Esta página tiene los siguientes objetivos:
(1): Ilustrar mediante ejemplos como se debe hacer la interpretación de
resultados que se obtienen por el procesamiento de datos experimentales por
SAS.
(2): Plantear y realizar diferentes aspectos de discusión en el análisis de datos
experimentales tales como supuestos de ANDEVA y modelo  lineal  del diseño 
usado, alternativas que existen  para  analizar  datos, complicaciones que
pueden surgir  para el  análisis  posterior  de  promedios cuando  existen
interacciones significativas y otros tipos de  problemas  variados  que  pueden 
presentarse  debido a las características
propias de datos y el diseño usado.
(3) Capacitar al lector para extraer conclusiones que sean válidas
estadísticamente.

Se asumirá que el lector de esta página cumple con  los siguientes  requisitos:
(i):  ha asistido en alguna ocasión  un curso básico de diseño de experimento.
(ii): tiene el conocimiento  del lenguaje SAS por lo menos al nivel práctico.
 
 

 IMPORTANT NOTICE ABOUT THE COPYRIGHTS.


The author of this Web Page makes the following declaration as regards to the examples used in this
work:
I have used in this publication, examples which, come from different books which, I have used in the
past for teaching courses in Experimental Designs to both  graduate and undergraduate students. In
each the of examples used here, a reference to the names of the authors is given, who are the owners
of corresponding  copyrights. If no such reference appears in the example, then this  is because  the
example has been artificially constructed. En consequence, the comments and explanations which I
have given  in this publication, should be considered as a bibliographic review, which I have written 
in order to express my own views about the statistical methods which can be used to analyze data  in
these examples.
 Diseño Completamente aleatorio
(1.1): Caso fijo y balanceado: Tratamientos
cualitativos
(1.2): Caso fijo y balanceado: Tratamientos
cuantitativos
 
 
                                                                  
                                           (1.1): Caso fijo y balanceado: Tratamientos cualitativos
  Este ejemplo proviene del libro de Montgomery, D. (2da. edición: inglés), Página 63.
  Se trata de un modelo fijo balanceado. Hay 5 tratamientos que representan diferentes
porcentaje de algodón, que son :
  15, 20, 25, 30 y 35 respectivamente. Se usaron 5 replicaciones. La variable respuesta es la
resistencia de fibra sintética
  (lb/in cuadrado.) . Ejemplo 1 no toma en cuenta la información que los 5 tratamientos se
pueden considerar cuantitativos
  caracterizados así por sus valores respectivos de porcentaje de algodón. Los datos de este
experimento se vuelven a
  analizar en el ejemplo 1.2 considerando los tratamientos como cuantitativos.

     Tabla 1.1.1:  Datos experimentales:


     Los datos que corresponden a un mismo tratamiento se tabulan en una misma fila.
       Tratamiento 1:      7     7   15   11    9
       Tratamiento 2:    12   17   12   18  18
       Tratamiento 3:    14   18   18   19  19
       Tratamiento 4:    19   25   22   19  23
       Tratamiento 5:      7   10   11   15  11
                                                                                   Salida SAS

 
Tabla 1.1.2: Tabla de ANDEVA: Diseño Completamente aleatorio
                        General Linear Models Procedure

Dependent Variable: Y   


                                  Sum of         Mean
Source                  DF       Squares       Square  F Value   
Pr > F
Model                    4     475.76000    118.94000    14.76   
0.0001
Error                   20     161.20000      8.06000
Corrected Total         24     636.96000

                  R-Square          C.V.     Root MSE             Y


Mean

                  0.746923      18.87642       2.8390            


15.040
Source                  DF     Type I SS  Mean Square  F Value   
Pr > F
Tratamientos            4     475.76000    118.94000    14.76   
0.0001
Fijaremos el nivel de significación  = 0,05 para sacar las conclusiones estadísticas.

El Valor de F  para tratamientos es significativo al  nivel de significación  = 0,05 


ya que Pr >F  (Probabilidad mayor que el F calculado) es igual = 0,0001, siendo
este último valor menor que 0,05  ,  el cual es el valor del nivel de significación que
estamos considerando. También el valor  de F para tratamientos es significativo
para  = 0,01 por la misma razón, o sea Pr >F = 0,0001 < 0,01 . (obsérvese que si F
calculado es significativo para  = 0,01, entonces esto implica que el F calculado
también es significativo para  = 0,05  . Sin embargo la afirmación inversa no
necesariamente es cierta.)
Podemos decir  de esta manera  que el valor de F para tratamientos es altamente
significativo.
 
Modelo Lineal:
Yij = iij ; i = 1,...,k ; j = 1,..,n   ij ~ NID(0, )  
iel efecto del tratamiento i - ésimo;  ij  = error aleatorio para j - ésima observación
en el tratamiento i - ésimo.
En este ejemplo tenemos k = 5 y n = 5 ;
Hipótesis nula y alternante:
0 :i ; para todo i = 1,...,k; A :i ; para algún i = 1,...,k;

Otra forma equivalente de enunciar las mismas hipótesis es:


0 : 1  =  2  =  ...  =  k ;  en que i es el promedio poblacional del tratamiento i -
ésimo,  i = 1,...,k ;
HA : No todos los promedios poblacionales de tratamientos son iguales.

Ya que  el valor de F para tratamientos es significativo para  = 0,05, obtenemos la


conclusión estadística que los promedios poblacionales de los 5 tratamientos son
diferentes. Debemos realizar análisis posterior por el método del Rango múltiple de
Duncan para determinar cual es el mejor tratamiento.

                
Tabla 1.1.3:   Comparación de promedios de tratamientos por el método de
Duncan:
                            General Linear Models Procedure
                   Duncan's Multiple Range Test for variable: Y
            NOTE: This test controls the type I comparisonwise error
rate,
                  not the experimentwise error rate
                     Alpha= 0.05  df= 20  MSE= 8.06
                Number of Means     2     3     4     5
                Critical Range  3.745 3.931 4.050 4.132

      Means with the same letter are not significantly different.

              Duncan Grouping              Mean      N  X

                            A            21.600      5  30

                            B            17.600      5  25


                            B
                            B            15.400      5  20

                            C            10.800      5  35


                            C
                            C             9.800      5  15
Observamos que por la aplicación del Método de Duncan se forman 3 grupos de
tratamientos. Los promedios poblacionales de tratamientos dentro de los grupos
entre ellos no son diferentes. El promedio poblacional dentro de un grupo es
diferente del promedio poblacional del tratamiento de cualquier otro grupo.
El mejor tratamiento  tiene 30 % del algodón.

Conclusiones:
(1): El Valor de F  para tratamientos es significativo al  nivel de significación a =
0,05  y en consecuencia  los promedios poblacionales de los 5 tratamientos son
diferentes.
(2): La aplicación del método del Rango múltiple de Duncan revela que el mejor
tratamiento tiene 30 % del algodón.
Observación:
Los Tratamientos en este experimento son cuantitativos, pero en este ejemplo
fueron analizados como cualitativos. Los datos de este ejemplo se volverán a
analizar en el Ejemplo 1.2,  tomando en cuenta la naturaleza cuantitativa de los
tratamientos.
 

 
(2): Caso fijo y balanceado: Tratamientos cuantitativos
(Este Ejemplo usa datos de la Tabla 1.1.1)
Tabla 1.2.1:   Prueba de significación de los componentes del
polinomio ortogonal:
                        General Linear Models Procedure
Dependent Variable: Y   
Contrast                DF   Contrast SS  Mean Square  F Value   
Pr > F
LINEAL                   1      33.62000     33.62000     4.17   
0.0545
CUADRATICO               1     343.21429    343.21429    42.58   
0.0001
CUBICO                   1      64.98000     64.98000     8.06   
0.0101
CUARTICO                 1      33.94571     33.94571     4.21   
0.0535
Ya que los tratamientos son caracterizados por diferentes porcentajes del algodón
(15, 20, 25, 30 y 35 )  y se encuentran igualmente espaciados, podemos usar el
método de polinomios ortogonales como un método del análisis posterior.Como un
primer paso calculamos por SAS la significación de los diferentes componentes de
polinomios ortogonales (ver la Tabla 1.2.1). El polinomio ortogonal es de grado
tres, ya que el componente cuartico no es significativo (estamos usando  = 0,05) y
además el componente cúbico si es significativo. A continuación se desarrolla el
2do. paso que consiste en hallar la ecuación polinómica ortogonal estimada de
tercer grado.
                            
                    
                    Tabla 1.2.2:   AJUSTE DE UNA REGRESION CUBICA DE Y
SOBRE X:                   
                             General Linear Models Procedure

Dependent Variable: Y   


                                  Sum of         Mean
Source                  DF       Squares       Square  F Value   
Pr > F
Model                    3     441.81429    147.27143    15.85   
0.0001
Error                   21     195.14571      9.29265
Corrected Total         24     636.96000
                  R-Square          C.V.     Root MSE             Y
Mean
                  0.693630      20.26852       3.0484            
15.040

Source                  DF     Type I SS  Mean Square  F Value   


Pr > F
X                        1      33.62000     33.62000     3.62   
0.0710
X*X                      1     343.21429    343.21429    36.93   
0.0001
X*X*X                    1      64.98000     64.98000     6.99   
0.0152

                                 T for H0:     Pr > |T|    Std


Error of
Parameter          Estimate     Parameter=0                 
Estimate

INTERCEPT       62.61142857            1.57      0.1302    


39.75743623
X               -9.01142857           -1.73      0.0976     
5.19660897
X*X              0.48142857            2.23      0.0369     
0.21604552
X*X*X           -0.00760000           -2.64      0.0152     
0.00287405
En este 2do. paso , se vuelve a usar el Proc. GLM pero esta vez considerando ambas
variables y e x, en que y es la variable respuesta,  siendo  x  el porcentaje del
algodón. En la instrucción Model del Proc GLM, se declara un modelo del tercer
grado y se obtiene la tabla del Andeva  y la estimación de los parámetros.
No se debe tomar en cuenta la significación de los componentes en la tabla de
Andeva 1.2.2, porque este paso ya se hizo en la tabla 1.2.1. El cálculo de
significación en la tabla 1.2.2. usa el error de la tabla 1.1.2 que tiene 20 g.l. En
cambio la tabla 1.2.2 usa error con 21 g.l. Este grado de libertad adicional es por el
componente cuartico que automáticamente el Proc GLM suma  al término del error
en la tabla 1.2.2  ya que al no ser significativo en la tabla 1.2.1, se excluyó este
término en la declaración del modelo del  Proc GLM para generar la tabla 1.2.2 .
 
La información mas
importante que se
consigue en la tabla
1.2.2 es la función
polinómica  estimada de
tercer grado, la cual
es:  
Y(estimada)  = 
62.61142857 
-9.01142857*X +
0.48142857*X*X 
-0.0076*X*X*X  
en que Y es la
resistencia y X es el
porcentaje del
algodón.  
Se puede maximizar
esta función y para
hacer esto se calcula la
derivada de
Y(estimada ) con
respecto X. Luego se
iguala  la expresión de
la derivada  a cero  y se
obtiene una ecuación
cuadrática cuya
solución produce el
valor del X para el cual
se obtiene máximo de
Y(estimada).  
Se podrá verificar
que el máximo de
la resistencia se
produce para X =
28.23 y el valor del
máximo es 20.90
 
Conclusión:
La relación ente la resistencia de la fibra sintética y  el porcentaje del algodón se
puede representar por la siguiente función polinómica estimado de grado tres:
Y(estimada)  =  62.61142857  -9.01142857*X + 0.48142857*X*X 
-0.0076*X*X*X
El valor de la resistencia de la fibra sintética crece a medida que aumenta el valor
del porcentaje del algodón, alcanzando su valor máximo de 20.90 cuando el
porcentaje del algodón asume el valor igual a 28.23
                                                                           
 Diseño Bloques aleatorios:
(2.1): Diseño Bloques aleatorios:    (balanceado con
efectos fijos)
(2.2): Diseño Bloques aleatorios: (no balanceado con
efectos fijos)
 
 
 
 
         (2.1): Diseño Bloques aleatorios:    (balanceado con efectos fijos)
          Fuente de datos: Li, J.C.R. Capítulo 14
         Hay 6 tratamientos de Variedades y 5 bloques.  Este experimento se hizo en el campo
experimental.
         Tabulación de datos: por filas como Variedades  y por columnas como bloques;
         La variable repuesta es el rendimiento.
        Datos:
        32.6    41.0    17.9    23.8    19.6
        38.4    39.4    37.1    42.8    21.8
        65.1    59.9    41.9    36.1    21.1
        54.2    46.4    43.6    35.1    43.4
        83.7    37.9    69.3    63.8    50.7
        77.1    70.8    57.7    51.1    46.5
        Tabla 2.1.1: Análisis de varianza para  Diseño B. A. 

                    General Linear Models Procedure

Dependent Variable: Y   


                                  Sum of         Mean
Source                  DF       Squares       Square  F Value   
Pr > F
Model                    9     6529.2027     725.4670     7.14   
0.0001
Error                   20     2033.4093     101.6705
Corrected Total         29     8562.6120

                  R-Square          C.V.     Root MSE             Y


Mean
                  0.762525      22.08317       10.083            
45.660

Source                  DF     Type I SS  Mean Square  F Value   


Pr > F
VARIEDADES               5     4541.6840     908.3368     8.93   
0.0001
BLOQUES                  4     1987.5187     496.8797     4.89   
0.0065
Comentarios:
El Modelo Lineal del diseño usado en este experimento es:
  Yij = ij + ij ;  i = 1,...,k ;  j = 1,..,n ;   .= 0 ;    . = 0 ;
en que,  iel efecto del tratamiento i - ésimojel efecto del bloque  j - ésimo
ij  = error aleatorio para la observación en el  j - ésimo bloque y el tratamiento i -
ésimo.  ij ~ NID(0, ) 
para i = 1,...,k ;  j = 1,..,n ;)
Hipótesis nula y alternante:
H0:  i; para todo i = 1,...,k;    HA:  i; para algún i ;
H0:  j; para todo j = 1,...,n;   HA:  j; para algún j ;
Nota: Las hipótesis antes especificadas también se pueden enunciar en términos de
promedios de poblaciones de varidades y bloques respectivamente en una forma similar tal
como se hizo en el ejemplo 1.1  .

El valor del  F calculado para variedades  es altamente significativo. Por lo tanto será 
necesario usar un método del análisis   posterior para determinar cual es la mejor variedad.

El valor del  F calculado para bloques  es altamente significativo y esto indica que se
justificó el uso del diseño bloques aleatorios ya que una parte de la variabilidad total que se
particiona en el análisis de varianza como bloques es significativa. (Si F para bloques en un
diseño bloques aleatorios usado en el campo experimental no es significativo, entonces
diríamos que los bloques no fueron  construidos  y  ubicados con  una  orientación 
correcta.  La  orientación  correcta  consiste  en  ubicar los  bloques en forma perpendicular
a la dirección en que varía la fertilidad del suelo. El Contraste de hipótesis acerca de los 
bloques aún cuando no es de interés directo para el Investigador, se considera como un
paso importante para confirmación de criterios usado en el planeamiento del experimento.)

                   Tabla 2.1.2: Análisis posterior por el Método de


Duncan:               
                    General Linear Models Procedure
              Duncan's Multiple Range Test for variable: Y
      NOTE: This test controls the type I comparisonwise error rate, 
            not the experimentwise error rate
                   Alpha= 0.05  df= 20  MSE= 101.6705
             Number of Means     2     3     4     5     6
             Critical Range  13.30 13.96 14.38 14.68 14.89

      Means with the same letter are not significantly different.

           Duncan Grouping              Mean      N  VARIEDAD


                                 
                         A            61.080      5  5
                         A       
                         A            60.640      5  6
                                 
                         B            44.820      5  3
                         B       
                         B            44.540      5  4
                         B       
                 C       B            35.900      5  2
                 C               
                 C                    26.980      5  1
Comentarios:
El uso del Rango múltiple de Duncan produce tres conjunto disjuntos de variedades.
El grupo con el mejor rendimiento consta de dos variedades que son las variedades
números 5 y 6. Cualquiera de estas dos variedades se pueden usar y entre ellas no
existe diferencia significativa.
 
 
 (2.2): Diseño Bloques aleatorios: (no balanceado con efectos
fijos)
Hay 3 tratamientos de Variedades y 5 bloques.
Existe un dato faltante que se encuentra en el primer tratamiento y primer
bloque.
Tabulación de datos:  por filas como Tratamientos y por columnas como
bloques:
        
       .   887 897 850 975
      857 1189 918 968 909
      917 1072 975 930 954
    
     Tabla 2.2.1: Diseño B. A. con un dato faltante  
                           General Linear Models Procedure

Dependent Variable: Y   


                                 Sum of         Mean
Source                  DF       Squares       Square  F Value   
Pr > F
Model                    6     62501.989    10416.998     1.79   
0.2316
Error                    7     40713.725     5816.246
Corrected Total         13    103215.714

                  R-Square          C.V.     Root MSE             Y


Mean
                  0.605547      8.029030       76.264            
949.86

Source                  DF     Type I SS  Mean Square  F Value   


Pr > F
BLOCK                    4     42255.048    10563.762     1.82   
0.2303
TRAT                     2     20246.942    10123.471     1.74   
0.2435

Source                  DF   Type III SS  Mean Square  F Value   


Pr > F
BLOCK                    4     49805.025    12451.256     2.14   
0.1785
TRAT                     2     20246.942    10123.471     1.74   
0.2435
Comentarios:
 Este ejemplo tiene el propósito de ilustrar el procedimiento a usar y los aspectos
computacionales cuando existe(n) dato(s) faltante(s) en un diseño B. A. con efectos
fijos.

Generalmente un diseño B. A. se planifica como un diseño balanceado pero al


perder uno o más datos experimentales, el diseño llega a ser un diseño no
balanceado. Pueden surgir muchas complicaciones en el análisis estadístico y
pérdidas de propiedades óptimas del diseño por el no balanceo, por ejemplo: El
error estándar de promedios de tratamientos ya no es un valor constante sino varia
según si se trata del promedio de un tratamiento que tiene el problema de dato(s)
faltante(s) o no. Se pierde la propiedad de ortogonalidad del diseño ya que no se
cumplirá la propiedad que S.C. Total = S.C. Bloques + S.C. Tratamientos + S.C.
Error experimental.  En general se reduce la potencia de la dócima del estadístico
F ,  lo cual pudiera hacer difícil detectar las diferencias significativas.

En cuanto al procedimiento computacional a usar, se hace necesario usar Sumas de


cuadrados, cuadrados medios y F  del tipo III (Type III ) en la salida del SAS, para
ambas fuentes de variación que serían bloques y tratamientos.  En este ejemplo el
valor de F para bloques es 2,14 y el valor de F para tratamientos es 1,74

 
Diseño Cuadrado Latino
(3.1): Cuadrado Latino:
 
     4 Filas:  4 Columnas: 4 Tratamientos(Variedades de Trigo) ;
     y = Rendimiento por parcela en Kg. ;
     Ejemplo: Steel, R.G.D y Torrie, J.H.: Capitulo 8 ;
    DATOS:
    C  10.5  D   7.7  B  12.0  A  13.2
    B  11.1  A  12.0  C  10.3  D   7.5
    D   5.8  C  12.2  A  11.2  B  13.7
    A  11.6  B  12.3  D   5.9  C  10.2
      General Linear Models Procedure
Dependent Variable: Y   
                                  Sum of         Mean

Source                  DF       Squares       Square  F


Value    Pr > F
Model                    9     87.680000     9.742222   
21.49    0.0007
Error                    6      2.720000     0.453333
Corrected Total         15     90.400000

                  R-Square          C.V.     Root


MSE             Y Mean
                  0.969912      6.443065      
0.6733             10.450

Source                  DF     Type I SS  Mean Square  F


Value    Pr > F
FILAS                    3      1.955000     0.651667    
1.44    0.3219
COLUMNAS                 3      6.800000     2.266667    
5.00    0.0452
TRATAMIENTOS             3     78.925000    26.308333   
58.03    0.0001
Comentarios:
 Considerando el nivel de significación   = 0,05,  observamos que el F calculado
para Filas no es significativo    mientras el valor de F calculado para columnas
es significativo. Esto podría indicar que ha habido una falla en
el planeamiento del diseño y/o la construcción de las columnas. Surgen
dudas sobre  la justificación del diseño utilizado, ya que se pudo utilizar el
diseño bloques aleatorios para controlar la variabilidad por columnas.

F para tratamientos es altamente significativo. Por lo tanto, se debe realizar


Análisis del Rango Múltiple de Duncan para determinar el mejor
tratamiento. . Se omite este cómputo aquí, ya que sería similar como se ha
hecho esto en ejemplos anteriores.
 

  (4):  Experimentos Factoriales


(4.1): Experimento Factorial 2x4 en el Diseño B. A.
 
 (4.1): Experimento Factorial 2x4 en el Diseño B. A.
                          
        * Datos: Li, J C. R., Capitulo 18: Introduction to Statistical
Inference
        * Factores:  Fecha de siembra con 2 niveles: Temprana , Tardía ;
        * Factor: Abono con 4 niveles: Abono estándar, Aéreo, Na, y, K  ;
        * Número de bloques = 4 ;
        * Variable respuesta:  rendimiento por parcela de soya ;
        * Tabulación de datos:
        *                                           
Bloques               ;
        * Fecha de siembra  Abono       1       2       3      
4          ;
        *   Temprana       Abono estándar -       -       -      
-          ;
        *   Temprana       Aéreo        -       -       -      
-          ;
        *   Temprana       Na           -       -       -      
-          ;
        *   Temprana       K            -       -       -      
-          ;
        * .... Después siguen 4 lineas siguientes para fecha de siembra
tardía ....;

        Datos:
        28.6  36.8  32.7  32.6
        29.1  29.2  30.6  29.1
        28.4  27.4  26.0  29.3
        29.2  28.2  27.7  32.0
        30.3  32.3  31.6  30.9
        32.7  30.8  31.0  33.8

        30.3  32.7  33.0  33.9


        32.7  31.7  31.8  29.4
         
                    General Linear Models Procedure

Dependent Variable: Y   


                                  Sum of         Mean
Source                  DF       Squares       Square  F Value   
Pr > F
Model                   10     94.100000     9.410000     2.97   
0.0169
Error                   21     66.438750     3.163750
Corrected Total         31    160.538750

                  R-Square          C.V.     Root MSE             Y


Mean
                  0.586151      5.773807       1.7787            
30.806

Source                  DF     Type I SS  Mean Square  F Value   


Pr > F
BLOQUE                   3      7.306250     2.435417     0.77   
0.5238
FECHA                    1     32.000000    32.000000    10.11   
0.0045
ABONO                    3     16.401250     5.467083     1.73   
0.1919
FECHA*ABONO              3     38.392500    12.797500     4.05   
0.0204
Comentarios:
Usaremos el nivel de significación igual a 0,05   . Observamos que el valor de F
para bloques no es significativo. Esto indica que hubo una falla en el planeamiento
del experimento y/o en la construcción o orientación de los bloques en el campo
experimental.
La interacción Fecha x Abono es significativa y en consecuencia no se puede
realizar el análisis posterior entre los promedios de niveles de ninguno de los dos
factores. El Análisis gráfico de esta interacción revela que las líneas de promedios
correspondientes a las fechas de siembra muestran una intersección indicando que
existe una interacción por el cambio en la dirección de la respuesta. Ya que el factor
Abono no es significativo, no necesitamos hacer ningún análisis posterior entre los
promedios de 4 niveles del factor abono.  La interacción Fecha x Abono
significativa,  implica que  la  que será la mejor fecha dependerá del nivel del factor
Abono con que esta se combina.  Pero si se puede aplicar cualquier  método del
análisis posterior, (por ejemplo Duncan)  sobre los 8  promedios de tratamientos
formados por todas las combinaciones posibles entre los 2 niveles del factor Fecha y
los 4 niveles del Factor abono.
Tomando en cuenta la información que se presenta en el cuadro más arriba,
podemos hacer diferentes tipos de comparaciones:
Comparación entre promedios de diferentes tipos de Abono para la siembra
Temprana.
Comparación entre promedios de diferentes tipos de Abono para la siembra Tardía.
Comparación entre promedios de los dos tipos de fechas de siembra separadamente
para cada tipo de abono.
(No se requiere a volver a hacer otro cómputo del método de Duncan, sino usar los
resultados del Análisis de Duncan ya disponible)
El tratamiento que tiene el rendimiento más alto es cuando se combina  el Abono
estándar  con una siembra temprana.
 

 
  Diseños de Parcelas Divididas:
Los datos utilizados en este ejemplo proviene del libro de Steel, R.G.D. y Torrie,
J.H.  4 lotes de semillas de avena fueron usados como tratamientos principales. Hay
4 sub tratamientos que consisten en un testigo mas tres productos químicos que
sirven para controlar una enfermedad de plantas. Se usaron 4 bloques.
Este diseño asigna la máxima precisión de estimación al factor productos químicos
(Sub Tratamientos) y la mínima precisión a al factor Lotes de semillas(Tratamiento
principal).

Tabulación de datos:
Los datos se muestran en el programa de SAS. Las primeras 4 filas de datos
corresponden a los datos de los bloques 1 - 4, para el primer nivel del Tratamiento
principal. Dentro de cada fila hay 4 datos correspondientes a los 4 niveles de sub
tratamientos.
Las próximas 4 filas de datos corresponden a los datos de los bloques 1 - 4, para el
segundo  nivel del Tratamiento principal. Dentro de cada fila hay 4 datos
correspondientes a los 4 niveles de sub tratamientos.
etc. y así sucesivamente hasta la tabulación de las últimas 4 filas correspondientes al
cuarto y último nivel del Tratamiento principal.
Programa fuente SAS:
data pdivid ;
do tratprin = 1 to 4;
do bloques = 1 to 4;
do subtrat = 1 to 4;
input Y @;
output;
end;
input;
end;
end;
cards;
42.9    53.8    49.5    44.4
41.6    58.5    53.8    41.8
28.9    43.9    40.7    28.3
30.8    46.3    39.4    34.7
53.3    57.6    59.8    64.1
69.6    69.6    65.8    57.4
45.4    42.4    41.4    44.1
35.1    51.9    45.4    51.6
62.3    63.4    64.5    63.6
58.5    50.4    46.1    56.1
44.6    45.0    62.6    52.7
50.3    46.7    50.3    51.8
75.4    70.3    68.8    71.6
65.6    67.3    65.3    69.4
54.0    57.6    45.6    56.6
52.7    58.5    51.0    47.4
;

proc print; run;


proc GLM;
class Bloques Tratprin Subtrat;
model Y = Bloques Tratprin  Bloques*Tratprin  Subtrat  Tratprin*Subtrat /ss1 ;
test h= Bloques Tratprin e=Tratprin*Bloques;
means Tratprin subtrat Tratprin*subtrat;
title 'Diseño Parcela Dividida';
run;
Salida SAS:
Nota: La salida SAS, tal como imprime el computador no se puede usar, sino
será necesario reordenar  la información obtenida en una tabla de Andeva 
definitiva.   Esta tabla que se obtenga, se llamará como tabla de andeva del diseño de
parcelas divididas, sin usar el calificativo "definitiva". Se usa este calificativo "definitiva"
simplemente para indicar que hay un trabajo que hacer y una vez que este trabajo esta
hecho, se obtendrá la tabla de andeva, la que se va a usar.  Esta tabla  se muestra
después de la salida SAS, la cual lleva algunas indicaciones en color rojo para preparar la
tabla de Andeva definitiva:

                           Diseño Parcela Dividida 


                      General Linear Models Procedure

Dependent Variable: Y
                                  Sum of         Mean
Source                  DF       Squares       Square  F Value   
Pr > F
Model                   27     7066.1919     261.7108    12.89   
0.0001
Error                   36      731.2025      20.3112     
Nombrarla como Error(b)
Corrected Total         63     7797.3944

                R-Square          C.V.     Root MSE             Y


Mean
                  0.906225      8.534077       4.5068            
52.809

Source             DF     Type I SS  Mean Square  F Value    Pr > F


BLOQUES            3     2842.8731     947.6244    46.66   
0.0001    No usar esta Fila.
TRATPRIN           3     2848.0219     949.3406    46.74   
0.0001    No usar esta Fila. 
BLOQUES*TRATPRIN   9      618.2944      68.6994     3.38   
0.0042    Nombrarla como Error(a)
SUBTRAT            3      170.5369      56.8456     2.80    0.0539
TRATPRIN*SUBTRAT   9      586.4656      65.1628     3.21    0.0059

Tests of Hypotheses using the Type I MS for


BLOQUES*TRATPRIN as an error term

Source          DF    Type I SS  Mean Square  F Value    Pr > F

BLOQUES         3     2842.8731     947.6244    13.79   


0.0010       Usar esta Fila.
TRATPRIN        3     2848.0219     949.3406    13.82   
0.0010       Usar esta Fila.
          A continuación se muestra la Tabla de Andeva definitiva.
                               Análisis de Varianza
     Fuentes de Variación    G.L.       S.C.        C.M.        F      Pr
> F
     BLOQUES                  3     2842.8731     947.6244    13.79   
0.0010       
     TRATPRIN                 3     2848.0219     949.3406    13.82   
0.0010 
     Error(a)                 9      618.2944      68.6994     
     SUBTRAT                  3      170.5369      56.8456     2.80   
0.0539
     TRATPRIN*SUBTRAT         9      586.4656      65.1628     3.21   
0.0059  
     Error(b)                36      731.2025      20.3112
     Corrected Total         63     7797.3944
Comentarios:
 Consideraremos  el nivel de significación  
= 0,05.
F para bloques es significativo y esto indica que hubo justificación en usar bloques
en el diseño para controlar la variabilidad.
Tratprin es la abreviatura para Tratamientos principales y tiene el valor de F
significativo, lo cual implica que hay diferencias significativas entre los promedios
poblacionales de los 4 lotes de semillas de avena.
La fuente de variación Sub tratamientos no tiene el valor de F significativo y esto
señala que no existen diferencias significativas entre los promedios poblacionales de
los 4 productos químicos.

La interacción tratamientos principal*subtratamientos es significativa lo cual indica


que  el mejor lote de semilla de avena podría ser diferente para los diferentes
productos químicos usados. También observamos que debido a la presencia de la
interacción significativa no podemos aplicar el método del análisis posterior a los
promedios de los 4 lotes de semillas de avena sino que los mismos deben ser
comparados separadamente por cada uno de 4 productos químicos y así también
podemos comparar las 16 combinaciones de tratamientos.
 
 

Análisis Gráfico: 
En la gráfica de la interacción Tratamiento Principal x Sub
tratamiento, se observa la presencia de una interacción
por el cambio en la dirección de la respuesta,  ya que las 
líneas, correspondientes a los tratamientos principales,
muestran puntos de intersección.  
La línea de promedios correspondiente al
Tratamiento principal número 4, siempre se
encuentra arriba de las otras tres líneas restantes.
Por lo tanto, el mejor tratamiento principal,
debería ser el cuarto, sujeto a confirmación del
resultado del Análisis de Duncan 
Análisis de Duncan: 
Ya que la interacción Tratamiento Principal x Sub
Tratamiento es significativa, no podemos  realizar
análisis posterior sobre los promedios de 
Tratamientos principales y asimismo tampoco
sobre los promedios de Sub Tratamientos (además
este último es no significativo). Se puede hacer la
comparación entre los 16 tratamientos
combinaciones por el Análisis de Duncan y el
resultado de este procedimiento podrá ser usado
para responder preguntas inicialmente planteadas
en el objetivo del experimento. 
Para realizar el cómputo del método de Duncan, es
necesario obtener un estimación del error
experimental, la cual se puede hallar por el
promedio ponderado de los cuadrados medios de
los dos errores (a) y (b) en el diseño. En este
ejemplo, esta estimación mancomunada tendrá 45
g.l. 
El Análisis de Duncan revela que el mejor
tratamiento es la combinación 42. También se ha
formado otro grupo que contiene las
combinaciones de tratamientos: 14 y 11, que tiene
los promedios más bajos para la variable respuesta
rendimiento. 
Utilizando los resultados del del Análisis de
Duncan, también se puede determinar: (No se
requiere a volver a hacer otro cómputo del método
de Duncan, sino usar los resultados del Análisis de
Duncan ya disponible.)
(a):  el mejor subtratamiento para cada uno de los
tratamientos principales separadamente. 
(b):  el mejor Tratamiento Principal para cada uno
de los Subtratamientos  separadamente.
 
 
 
 
(6):  Diseño de Parcelas Sub Divididas

Los datos utilizados en este ejemplo proviene del libro de Montgomery, D.  Se trata
de una investigación médica para estudiar el tiempo de absorción de un cierto tipo
de cápsula antibiótica. En esta investigación se utilizaron 3 técnicos como
Tratamientos principales, 3 dosis como Sub Tratamientos y  4 niveles de grosor de
la pared de cápsula como Sub Sub Tratamientos. El experimento se hizo en 4
bloques.
Este diseño asigna la máxima precisión de estimación al factor grosor (Sub Sub
Tratamientos) , la mediana precisión al factor dosis (Sub Tratamientos)  y la mínima
precisión al factor técnico (Tratamiento principal).

Tabulación de datos:
El esquema de la tabulación de datos se presenta a continuación.  Los datos se
muestran en el programa de SAS.

                                                Técnico
-----------------------------------------------------
                                   1                2                3
-----------------------------------------------------
Bloques    Dosis     1    2    3    1    2    3    1    2    3
-----------------------------------------------------
               Grosor    -    -    -      -    -    -     -    -    -
                   1         -    -    -      -    -    -     -    -    -
   1              2         -    -    -      -    -    -     -    -    -
                   3         -    -    -      -    -    -     -    -    -
                   4         -    -    -      -    -    -     -    -    -

    -  indica un dato. Cada fila  tiene 9 datos. Este esquema se repite para los 3
bloques restantes.
   

 Programa fuente SAS: 


title  Parcelas sub divididas;
data psubdiv ;
do Bloques = 1 to 4;
do Grosor = 1 to 4;
do Tecnico = 1 to 3;
do dosis = 1 to 3 ;
input y @@;
output;
end;
end;
input;
end;
end;
cards;
95  71 108  96  70  108  95  70  100
104 82 115  99  84  100 102  81  106
101 85 117  95  83  105 105  84  113
108 85 116  97  85  109 107  87  115
95  78 110 100  72  104  92  69  101
106 84 109 101  79  102 100  76  104
103 86 116  99  80  108 101  80  109
109 84 110 112  86  109 108  86  113
96  70 107  94  66  100  90  73   98
105 81 106 100  84  101  97  75  100
106 88 112 104  87  109 100  82  104
113 90 117 121  90  117 110  91  112
90  68 109  98  68  106  98  72  101
100 84 112 102  81  103 102  78  105
102 85 115 100  85  110 105  80  110
114 88 118 118  85 116  110  95  120
;
proc print; run;
PROC GLM;
class Bloques Tecnico Dosis Grosor ;
model y = bloques tecnico  bloques*tecnico dosis tecnico*dosis 
dosis*bloques(tecnico)
grosor tecnico*grosor dosis*grosor tecnico*dosis*grosor/ss1 ;

test h=bloques tecnico  e=bloques*tecnico;


test h=dosis tecnico*dosis  e=dosis*bloques(tecnico);
Run;
Salida SAS:
                               Parcelas
subdivididas                        
                         General Linear Models Procedure

Dependent Variable: Y
                                  Sum of         Mean
Source                  DF       Squares       Square  F Value    Pr > F
Model                   62     25921.472      418.088    46.83    0.0001
Error                   81       723.188        8.928           Nombrar
esta F.V. como Error(c)
Corrected Total        143     26644.660

                  R-Square          C.V.     Root MSE             Y Mean

                  0.972858      3.074926       2.9880             97.174

Source                  DF     Type I SS  Mean Square  F Value    Pr > F

BLOQUES                  3        48.410       16.137     1.81    0.1524 


No usar esta Fila.
TECNICO                  2       248.347      124.174    13.91    0.0001 
No usar esta Fila. 
BLOQUES*TECNICO          6       161.153       26.859     3.01    0.0105 
Nombrarla como Error(a) 
DOSIS                    2     20570.056    10285.028  1151.97    0.0001 
No usar esta Fila.
TECNICO*DOSIS            4       125.944       31.486     3.53    0.0105 
No usar esta Fila.
BLOQUE*DOSIS(TECNIC)    18       226.000       12.556     1.41    0.1514 
Nombrarla como Error(b)
GROSOR                   3      3806.910     1268.970   142.13    0.0001
TECNICO*GROSOR           6       126.486       21.081     2.36    0.0375
DOSIS*GROSOR             6       402.278       67.046     7.51    0.0001
TECNICO*DOSIS*GROSOR    12       205.889       17.157     1.92    0.0435
Tests of Hypotheses using the Type I MS for
BLOQUES*TECNICO as an error term

Source                  DF     Type I SS  Mean Square  F Value    Pr > F


BLOQUES                  3      48.40972     16.13657     0.60    0.6378
TECNICO                  2     248.34722    124.17361     4.62    0.0609

Tests of Hypotheses using the Type I MS for


BLOQUE*DOSIS(TECNIC) as an error term

Source                  DF     Type I SS  Mean Square  F Value    Pr > F


DOSIS                    2     20570.056    10285.028   819.16    0.0001
TECNICO*DOSIS            4       125.944       31.486     2.51    0.0784
A continuación se muestra la Tabla de Andeva definitiva.
                               Análisis de Varianza
Fuentes de Variación    G.L.       S.C.        C.M.        F      Pr > F
BLOQUES                  3      48.40972     16.13657     0.60    0.6378
TECNICO                  2     248.34722    124.17361     4.62    0.0609
Error(a)                 6       161.153       26.859     
DOSIS                    2     20570.056    10285.028   819.16    0.0001
TECNICO*DOSIS            4       125.944       31.486     2.51    0.0784
Error(b)                18       226.000       12.556    
GROSOR                   3      3806.910     1268.970   142.13    0.0001
TECNICO*GROSOR           6       126.486       21.081     2.36    0.0375
DOSIS*GROSOR             6       402.278       67.046     7.51    0.0001
TECNICO*DOSIS*GROSOR    12       205.889       17.157     1.92    0.0435
Error(c)                81       723.188        8.928           
Corrected Total        143     26644.660
Comentarios:
El valor de F para Técnico no es significativo. Esto indica que los tres Técnicos han tenido
éxito en conducir el experimento de una manera uniforme. Puesto que F para dosis es
significativo, podemos concluir que existen diferencias significativas entre las potencias de
las 3 dosis que se han probado en este experimento. La interacción Técnico*Dosis al no ser
significativa, asegura que las 3 dosis entre ellas mantienen las mismas diferencias relativas
del tiempo de absorción , no importa cual es el Técnico quién lo prepara. Esta información
es importante ya que esto asegura la uniformidad en la calidad del producto elaborado.
Grosor es significativo, lo cual implica que la potencia del antibiótico depende del grosor
de la pared de cápsula. La interacción  DOSIS*GROSOR es significativa. Esto indica que 
el factor dosis y el factor grosor de la cápsula no son independientes. La interacción
TECNICO*GROSOR es significativa indicando que el nivel del factor grosor que tenga el
mejor  tiempo de absorción depende del técnico quién ha elaborado el antibiótico. La
interacción triple Tecnico*Dosis* Grosor, por ser una interacción de tres factores puede ser
causada de una manera compleja por la significación de cualesquiera de las siguientes
interacciones:  Técnico por Dosis*Grosor,  o Dosis por Técnico*Grosor o por Grosor por
Técnico*Dosis. 
A continuación se presenta la información necesaria para hacer el Análisis gráfico de las 3
interacciones dobles:
      Análisis Gráfico:
                Sabemos que una interacción doble es causada por una o ambas de las siguientes
razónes:
               (1): Existe diferencia en  la magnitud de respuesta. (Se identifica esta situación en
la gráfica cuando algunas o todas
                     de las líneas no son  paralelas pero no existe intersección entre ellas.)
     (2): Existe diferencia en la dirección de respuesta.  (Se identifica esta situación
en la gráfica cuando algunas o todas
           de las líneas intersectan entre ellas.)
Cuando todas las líneas en la gráfica son paralelas, entonces no existe
interacción.
              En las  3 gráficas que se presentan arriba, podemos observar que:
              (1): Ninguna de las 3 gráficas muestran líneas paralelas y en consecuencia suma de
cuadrados para interacción para
                    cada una de los 3 interacciones será mayor que cero.
              (2): Ninguna de las 3 gráficas presentan  la diferencia en la dirección de respuesta,
ya que no existe intersección
                     entre las líneas.
              (3): Cada una de las 3 gráficas muestra diferencia en la magnitud de respuesta,
siendo esta de un grado leve para la
                    interaccion  Técnico*Dosis la cual no alcanza significación  para  = 0,05 .
                    En cambio, las interacciones Técnico*grosor  y  Dosis*Grosor muestran las
diferencias en la magnitud de
                    respuesta en un grado más  pronunciado y así alcanzan significación para  =
0,05 en la tabla de ANDEVA.

              Análisis Posterior:


               Ya que la interacción triple Tecnico*Dosis*Grosor y dos interacciones dobles son
significativas, no se puede hacer
               el análisis posterior sobre los promedios de  los  niveles de ninguno de los 3
factores.
               Podemos realizar el análisis de Duncan sobre los promedios tridimensionales de
Técnico, Dosis y Grosor. Este
               cálculo requiere la estimación de la varianza del promedio tridimensional y  se
puede obtener por el promedio
               ponderado de los cuadrados medios de los 3 tipos de errores a, b, y c. Esta
estimación tendrá 105 g.l.. A
               continuación se representa en forma resumida el resultado obtenido por el uso del
análisis de Duncan:

                 Duncan Grouping       Mean      N  TRAT


                           A           115.250      4  413
                           A
                           A           115.000      4  313
                           A
                           A           115.000      4  433
                           A
                   B       A           112.750      4  423
                   B       A
                   B       A           112.000      4  421
                   ........................................
                       Se omiten los valores intermedios  
                   ........................................  
                           N            71.750      4  112
                           N
                           N            71.000      4  132
                           N
                           N            69.000      4  122
                 El grupo de combinaciones de tratamiento con promedios que tengan valores
más altos de la variable respuesta
                 son:    413, 313 y 433 . Asimismo, el grupo formado por las combinaciones de
tratamientos: 112, 132 y 122, tiene
                 promedios con valores más bajos de la respuesta.
 
                 Tomando en cuenta los resultados del del Análisis de Duncan, también se puede
determinar:
                (a):  El mejor Técnico  para cada una de las combinaciones de Dosis por Grosor.
                (b):  La mejor Dosis  para cada una de las combinaciones de Técnico por Grosor.
                (c):  El mejor Grosor   para cada una de las combinaciones de Técnico por Dosis.
                (No se requiere a volver a hacer otro cómputo del método de Duncan, sino usar
los resultados del Análisis de
                Duncan ya disponible.)

 
INDICE

(1): Introducción

(2): Aproximación de una superficie de respuesta por polinomios:

(3-1): Requerimientos y propiedades deseables de los diseños óptimos:


(3-2): Estrategia experimental
(3-3): Método del ascenso más pronunciado:
 (4): Diseños de primer orden: (5-1): Diseños de segundo orden:
(5-2): Construcción de diseños compuestos centrales:
 (6): Diseños Rotables:

(7): Análisis Canónico:

(8): Bibliografía:
 

(1): INTRODUCCION
Regresar al Indice

Supóngase que la dependencia de una variable respuesta Y sobre los


niveles x 1, x 2, ..., x k
de k variable cuantitativas o factores se puede expresar por el siguiente
modelo matemático:
Y =  (x 1, x 2, ..., x k) +  ; ~ N( 0, ).
Esta relación funcional en general se llama una superficie de respuesta.
Uno de los objetivos
más frecuente en una investigación por experimentación consiste en
determinar los valores
de las k variables independientes, x i ; (i = 1,...,k), l as cuales pueden
producir un máximo
( o mínimo) de E(Y).

Se asumirá que en la mayoría de los casos prácticos, la forma de función 


es desconocida
y aún cuando en un caso dado  puede ser muy complejo, siempre será
posible aproximar la
función satisfactoriamente por un polinomio en x i ; (i = 1,...,k); de algún
grado adecuado
dentro de una región experimental previamente planificada.

A fin de estimar los parámetros de una función polinomial , que puede servir
para aproximar
la superficie de respuesta , necesitaremos emplear un diseño de
experimento el cual se
puede denotar por : (x 1u, x 2u, ..., x ku); u = 1,...,N; que constituye una
selección de
N puntos en una región experimental de interés.

Después de realizar el experimento, utilizando el diseño indicado, se


obtendrá la estimación
de la función , que a su vez se puede someter a un análisis para averiguar
acerca de las
condiciones que se deben imponer sobre las variables x 1, x2, ..., xk; para que
E(Y) alcance
un valor óptimo, que podría ser un máximo o un mínimo, según sea el caso
bajo estudio.
 

(2): Aproximación de una superficie de respuesta por polinomios:


Regresar al Indice

La aproximación de una relación funcional desconocida  , se puede hacer


de la manera mas
simple por el modelo lineal de primer orden:
Y = 01x 12x 2 +. . . +kx k; ~ N( 0, ).
el cual representa la ecuación de un plano.

En el caso de que el modelo de primer orden no sea adecuado, el siguiente


modelo de segundo
orden se puede utilizar:

Y = 0ix iiix i2 + ijx ix j; (i,j =1, ..., k ; i < j); ~ N( 0, ).
La superficie de respuesta del segundo orden dado por E(Y) puede ser una
parábola, híperbola,
elipse o sus generalizaciones correspondientes en el caso k-dimensional.
Así también en el
caso de que fuera necesario, superficies polinomiales de orden superior a
dos, se pueden
utilizar. Una superficie polinomial de esta naturaleza, se debe considerar
solo como una
aproximación de la verdadera relación funcional en el interior de una
región considerada en
el experimento. Una extrapolación que intenta hacer predicciones fuera de
la región experimental
puede ser arriesgada y no confiable.
 

(3-1): Requerimientos y propiedades deseables de los diseños óptimos:


Regresar al Indice

Box y Hunter(1951) sugirieron las siguientes propiedades que deberían


poseer los diseños multifactoriales de orden d:

(1): El diseño debe permitir la estimación de parámetros de una superficie


de respuesta
polinomial con una precisión satisfactoria dentro de la región de interés.

(2): El número de puntos experimentales en el diseño no debe ser muy


grande.

(3): El diseño debe posibilitar una verificación con exactitud, que el


polinomio asumido
en el estudio es del grado adecuado.

(4): Debe permitir el uso de bloques cuando así sea conveniente.

(5): Debe formar un núcleo, del cual un diseño satisfactorio del grado d+1
se puede construir
en el caso de que se verifica que el grado d del polinomio no es adecuado.

 
(3-2): Estrategia experimental
Regresar al Indice 
En la selección de los puntos experimentales de un diseño, el investigador debe
tomar en cuenta
las siguientes circunstancias que podrían influir su estrategía:
 Magnitud del error experimental
 Complejidad de la superficie de respuesta
 Si o no es posible ejecutar el experimento en forma secuencial
(3-3): Método del ascenso más pronunciado:
Regresar al Indice

Este método establece una regla que se utiliza en una serie de experimentos
secuenciales para
pasar a una región de respuesta más alta en la búsqueda de una respuesta
máxima.

Sea (0,0, ... ,0) el centro del primer experimento. Entonces esta regla de decisión
determina las coordenadas del punto P = (x'1, x'2, ..., x'k), el cual será el centro del
próximo experimento.

Esta técnica consiste en seleccionar un diseño con pocos puntos experimentales y


luego al
conducir el experimento, se obtienen las estimaciones de los parámetros
correspondiente a un
modelo polinomial de grado uno.
Sea
Y(estimado) = b0 + b1X1 + b2X2 + .... +bkXk

la estimación de ecuación del plano en un experimento. Entonces el camino del


ascenso mas pronunciado se toma al pasar al centro del próximo diseño a lo largo
de los ejes :
X1, X2 ,..., Xk en cantidades proprcionales a : b1 , b2 , .... , bk respectivamente.
 

(4) Diseños de primer orden:


Regresar al Indice

Los diseños de primer orden son aquellos que permiten la estimación de


parámetros de un
modelo polinomial de grado uno.
 
Ejemplos de diseños de primer orden:
 Experimentos factoriales de la serie 2k

 Repitición fraccionada 1/2p del factorial 2k


Estos diseños son muy convenientes en trabajos exploratorios para obtener el
ajuste de una
relación lineal entre la respuesta como variable dependiente y las variables
independientes.
Estos diseños también se pueden utilizar en las etapas iniciales de un programa
de
experimentación secuencial en la búsqueda de la respuesta óptima.

Mas abajo, se presenta una lista de algunos diseños factoriales fraccionados que
son útiles
como diseños de primer orden en las etapas priliminares en la exploración de una
superficie
de respuesta.
 

  Tabla 1: Algunos diseños útiles de primer orden formados por diseños factoriales 2 k-p 
Número de Tamaño del Fracción   G.L. por falta
factores  experimento  de ajuste 


3  8  1/2  4 
4  8  1/4  3 
5  8  1/2  2 
5  16  1/8  10 
6  8  1 
 
Propiedades:
El diseño factorial fraccionado 1/2p tiene las siguientes propiedades:
 Existen 2k-p puntos experimentales.

o de un total de 2k-1 efectos principales e interacciones


correspondientes al experimento

factorial comple to, 2p-1 serán inseparable del parámetro 0 en el modelo y los
restantes
2k - 2p efectos serán mutuamente inseparables en conjuntos de 2p, siendo el
número de
tales conjuntos igual a 2k-p.
  Mayores detalles de la construcción de los experimentos factoriales
fraccionados se pueden
obtener en Raghava Rao (1971).
 
(5-1): Diseños de segundo orden:
Regresar al Indice
Los diseños de segundo orden permiten la estimación de parámetros de un
modelo polinomial
de grado dos. Ejemplos simples de este tipo de diseños son las series de 3k 
factorial. La
desventaja de la serie 3k es que con k >3, el número de puntos
experimentales que se requieren
para conducir el experimento, llega a ser muy alto. Además los parámetros
11, ... , kk ; en
general se estiman con precisión relativamente baja. Box y Wilson (1951)
han desarrollado una
familia de diseños llamados diseños compuestos que son mas
convenientes para este propósito
y se presentan a continuación:
 

(5-2): Construcción de diseños compuestos centrales:


Regresar al Indice

Construcción del diseño:


Los puntos experimentales de este diseño consisten en:
 (i): Puntos del factorial 2k o su fracción, ampliado por :

 (ii): 2k puntos axiales sobre los ejes de las variables independientes,


denotados por:

(-, 0, ... , 0); (, 0, ... , 0); (0, -, ... ,0); (0, , ... ,0); ... ; (0, 0, ... , -,); (0,
0, ... , ,)
 
 (iii): Punto(s) sobre el centro del diseño.

El valor de  se puede elegir para :


 (a): Dar la propiedad de ortogonalidad al diseño o

 (b): Minimizar el sesgo que surge si el modelo planteado en una


investigación es de grado
dos pero el modelo verdadero tiene grado superior a dos o
 
 (c): Dar la propiedad de rotabilidad al diseño.

Uso de un diseño compuesto central en experimentación secuencial:


Los diseños compuestos centrales se pueden incorporar en un programa de
experimentación secuencial. Este programa se puede iniciar con un factorial 2k con
meta exploratoria y hará
posible obtener la estimación de un modelo de primer grado. Si en esta etapa,
mediante el uso
de F.V. de falta de ajuste, se verifica que el modelo cuadrático debería ser el más
apropiado,
entonces se procederá a agregar (2k+1) puntos adicionales, el cual lo convierte en
un diseño
compuesto central. En la segunda etapa se utilizan ( 2k+2k +1) puntos expeimentales
en el análisis estadístico y se estiman los parámetros de grado dos.
 
Construcción de un diseño compuesto central ortogonal:
Box y Wilson(1951) han demostrado que para dar la propiedad de ortogonalidad al
diseño, se
elige el valor de  tal que:

mF/4) 1/4 , donde m = ((F+T) 1/4 - F1/2)2

en que F = número de puntos de 2k completo o su fracción apropiada y T = número


de puntos adicionales para construir un diseño compuesto central.
cuando = 1.215, este diseño se llama un diseño compuesto ortogonal.
 

(6): Diseños Rotables:


Regresar al Indice

En consideración del problema de selección de diseños óptimos, Box y Hunter


(1951),
propusieron el criterio de rotabilidad de un diseño.

Definición del concepto de rotabilidad de un diseño:


Sea (0, 0, ... , 0) el centro de un diseño. Sea:

Y(est.)(u) = b0bix iubiix iu2 + bijx iux ju; (i,j =1, ..., k ; i < j); (u = 1, ... , N);

la respuesta estimada en el punto (x 1u, x 2u, ..., x ku); Sea:


Var.(Y(est.)(u)) = (a'(X' X)-1a)donde
a' = (1, x 1u , ... , x ku ; x 21u , ... , x2 ku ; x 1u x 2u , ... , x k-1 , u x ku ;)

Un diseño se llama rotable si y solo si Var.(Y(est.)(u)) es invariante para todos los


puntos que
sean equidistante desde el centro del diseño.
 
Nota : Si un diseño es rotable, entonces Var.(Y(est.)(u)) será una función solamente
de
x 21u + x 22u + , ... , + x 2ku
 
Construcción de un diseño Compuesto central rotable:
Los puntos experimentales de este diseño consisten en:
 
 (i): nc puntos del factorial 2k o su fracción apropiada , denotados por :
(
 (ii): na puntos axiales sobre los ejes de las variables independientes, denotados
por:
(, 0, ... , 0); (0, , ... ,0); ... ; (0, 0, ... , );  donde  = (F)1/4 , en que F es igual
al
número de puntos experimentales del factorial 2k o su fracción apropiada.
 
 (iii): no punto(s) sobre el centro del diseño. (0, 0, ... , 0); Sea  nc + 4(1 +
(nc) 1/2 )),  el parámetro del diseño rotable. La selección del valor
de fija el número de puntos centrales de un diseño. Los valore de
recomendados por
Box y Wilson se presentan en la tabla a continuación:
 
Tabla 2: Valores de recomendados por Box y Wilson
 
                                                                            k                   
2  0,7844 
3  0,8385 
4  0,8704 
5  0,8918 
6  0,9070 
7  0,9184 
8  0,9274 
 
 
 
 
 
 
 
 
 
 
(7): Análisis Canónico:
(7-1): Ejemplo1:  Khuri y Cornell, Página 170
                                                    1

                   OBS      Y      OTEMP    OTIEMPO      TEMP      


TIEMPO

                     1    93.6    125.90     171.9     -1.00000   


-1.00000
                     2    91.7    125.90     218.1     -1.00000    
1.00000
                     3    92.5    145.90     171.9      1.00000   
-1.00000
                     4    92.9    145.90     218.1      1.00000    
1.00000
                     5    96.2    135.90     195.0      0.00000    
0.00000
                     6    97.0    135.90     195.0      0.00000    
0.00000
                     7    92.7    121.75     195.0     -1.41421    
0.00000
                     8    92.8    150.04     195.0      1.41421    
0.00000
                     9    93.4    135.90     162.3      0.00000   
-1.41421
                    10    92.7    135.90     227.7      0.00000    
1.41421
                                                                          
                    

                       

                         Response Surface for Variable Y: RENDIMIENTO

                               Response Mean           93.550000


                               Root MSE                 0.336892
                               R-Square                   0.9825
                               Coef. of Variation         0.3601

                           Degrees
                              of       Type I Sum
          Regression       Freedom     of Squares     R-Square    F-
Ratio    Prob > F

          Linear                 2        0.782267      0.0302     


3.446     0.1349
          Quadratic              2       23.346250      0.9012     
102.9     0.0004
          Crossproduct           1        1.322500      0.0511    
11.652     0.0269
          Total Regress          5       25.451016      0.9825    
44.849     0.0013

                         Degrees
                            of         Sum of
        Residual         Freedom       Squares       Mean Square    F-
Ratio    Prob > F

        Lack of Fit            3        0.133984        0.044661     


0.140     0.9247
        Pure Error             1        0.320000        0.320000
        Total Error            4        0.453984        0.113496
                                                                          
          
                   
Degrees                                                         
                      of       Parameter     Standard     T for
H0:                
 Parameter          Freedom    Estimate        Error     Parameter=0 
Prob > |T|    

 INTERCEPT             1        96.600000      0.238218      405.5     


0.0000       
 TEMP                  1         0.030178      0.119109      0.253     
0.8125       
 TIEMPO                1        -0.311244      0.119109     -2.613     
0.0592       
 TEMP*TEMP             1        -1.981250      0.157567    -12.574     
0.0002       
 TIEMPO*TEMP           1         0.575000      0.168446      3.414     
0.0269        
 TIEMPO*TIEMPO         1        -1.831250      0.157567    -11.622     
0.0003       

             Degrees
                of       Sum of
  Factor     Freedom     Squares     Mean Square  F-Ratio  Prob > F

  TEMP           3       19.274250      6.424750   56.608   0.0010  


TEMPERATURA (CENTIGRADO)
  TIEMPO         3       17.427660      5.809220   51.184   0.0012  
TIEMPO (SEGUNDOS)
                             Ejemplo: Khuri y Cornell, Página
170                             4

                            Canonical Analysis of Response Surface


                                     (based on coded data)

                                 Critical Value


             Factor           Coded          Uncoded

             TEMP            -0.003412       -0.004826    TEMPERATURA


(CENTIGRADO)
             TIEMPO          -0.060627       -0.085739    TIEMPO
(SEGUNDOS)

                       Predicted value at stationary point     96.613270

                                                 Eigenvectors
                          Eigenvalues        TEMP           TIEMPO
                            -3.218257        0.611383        0.791335
                            -4.406743        0.791335       -0.611383

                                Stationary point is a maximum.

 
  
 

(7-2): Ejemplo 2:   Puntos de Ensilladura


 
 
 
 
 

Bibliografía:
Regresar al Indice 

(1): Box, G.E. P. y J.S. Hunter (1951): Multifactor experimental designs for
exploring response
surfaces. J.R.S.S. ser. B, vol. 13, No. 1, 195-240.

(2): Box, G.E. P. y K.B. Wilson (1951): On experimental attainment of optimum


conditions.
J.R.S.S. ser. B, vol 13, No. 1 -45.

(3): Cornell, John A:(1990.): How to apply response surface methodology.


Milwaukee, WI .
(4): Khuri, André I. y John A. Cornell.(1996): Response surfaces : designs and
analyses .
Marcel Dekker, New York .

(5): Myers, Raymond H. y Douglas C. Montgomery.(1995.): Response surface


methodology :
process and product optimization using designed experiments. Wiley, New York.

(6): Raghava Rao, D. (1971): Construction and combinatorial problems in Design


of Experiments.
Wiley, New York.

(7): S.P.Sinha: Comparación de precisión y sesgo de algunos Diseños


Experimentales de
superficie de respuesta. Publicación 80-01, I.E.A.C., U.L.A. 1980.

Regresar al Menú Principal

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

 
Ayuda para la entrada de datos para el programa:
Análisis del rango múltiple de Duncan.

(A):    Diseños Básicos:


Completamente aleatorio, Bloques aleatorios y Cuadrado Latino:

Consideraremos los 3 diseños básicos pero excluyendo el caso cuando se trata del experimento
factorial. Sí el experimento es factorial, entonces el uso del método de Duncan requiere ciertas
técnicas especiales que se explicarán más adelante.
Todos los datos deben ser escritos en una sola hilera, separados por uno o más espacios en blanco
y consisten en:
Número-de- tratamientos  Promedios-de-tratamientos  Valores-tabulares-para-el-test-de-Duncan 
Cuadrado-medio-error-experimental  Número-efectivo-de-replicaciones
Nota: La enumeración anterior ocupó 2 líneas para escribir, pero como se ha dicho anteriormente,
todos los datos serán entrados en el programa en una sola hilera separados por uno o más espacios
en blanco.

Número-de- tratamientos contiene un solo dato. El número de Promedios-de-tratamientos que se


entrarán al programa  será igual al Número-de- tratamientos. Los Valores-tabulares-para-el-test-de-
Duncan serán obtenidos de una tabla estadística y esto se explicará más abajo. El Cuadrado-medio-
error-experimental   (es un solo valor y ) se obtiene de la tabla de Análisis de varianza.
Número-efectivo-de-replicaciones para todos los diseños básicos y siempre que el experimento no
sea factorial, es igual al número de replicaciones del diseño. Para un diseño en bloques aleatorios,
El número efectivo de replicaciones también será igual al número de bloques. En el caso de un
diseño cuadrado latino, el número efectivo de replicaciones = número de filas = número de columnas
= número de tratamientos.

¿ Cómo buscar los Valores-tabulares-para-el-test-de-Duncan ?


Estos valores tabulares se obtiene de una tabla estadística llamada:  Significant  ranges for Duncan's
Multiple Range test: (En español: Rangos significativos  para el test de Rango mútiple de Duncan).
Esta tabla existe para para los niveles de significación de 1% y 5 % .

Para buscar los valores en la mencionada tabla, Ud. debe de disponer primero de las 3 
informaciones siguientes:
(i) El nivel de significación que será usado, (ii) El número de tratamientos que tiene el diseño, (iii) el
valor numérico de grados de libertad (abreviatura: g.l.) del error del diseño.
Ejemplo:
Deseamos usar el nivel de significación = 0,05 ; El diseño usado fue Bloques aleatorios con 5
bloques y 6 tratamientos. Los promedios de tratamientos fueron los siguientes:
27     35.9    44.82     44.54     61.08     60.64
g.l. del error experimental = 20 ; C.M. Error experimental = 101.67 ;
Busquemos primero los valores tabulares en la tabla que ha sido nombrada anteriormente. Siga los
siguientes pasos:
Ubique la tabla correspondiente al nivel de significación = 0,05 ;
Ubique en la tabla la fila correspondiente al g.l del error = 20 ;
Anote de la tabla,  5 valores tabulares correspondiente a las columnas que indican los valores de
rangos iguales a: 2    3    4    5    6 ;
Estos valores tabulares son los siguientes:
2.95    3.10    3.18    3.25    3.30
[En general sí el número de tratamientos es k,  entonces se obtienen (k-1) valores tabulares.]

Ya que tenemos toda la información que necesitamos, ahora debe escribir la  siguiente  hilera de
datos en la caja del texto en el programa:
6    27    35.9   44.82   44.54     61.08   60.64    2.95   3.1   3.18   3.25   3.30    101.67     5
Luego haga click sobre el botón que se llama:            Ejecutar: Duncan

Nota:  obsérvese que también será correcto entrar la  siguiente  hilera de datos en la caja del texto:
6  ;  27    35.9   44.82   44.54     61.08   60.64  ;   2.95   3.1   3.18   3.25   3.30  ;   101.67     5
Esta entrada tiene la ventaja que ; se usa para indicar el comienzo y el fin de ciertos subgrupos de
datos para una mejor visualización. El programa no tomará en cuenta el separador ; en el
procesamiento de datos.

Nota:   En algunos casos para hallar los valores tabulares,  será  necesario usar la interpolación
lineal, ya que la tabla presenta discontinuidades entre los valores presentados tanto en las filas
como en las columnas. Sucederá esto por ejemplo si un diseño tiene 25 g.l. para el error
experimental   y/o hay 15 tratamientos.

(II): Experimentos Factoriales:

Todo lo explicado en la sección anterior es válido para el caso que se comenta aquí salvo que el
número efectivo de replicación para un experimento factorial asumirá valores diferentes para
diferentes tipos de comparaciones.

(II-1): Experimento factorial de 2 factores y cualquier diseño: C.A., B.A. o C.L.


Sean  a y b los niveles de un experimento factorial con los factores A y B respectivamente. Sea n el
número de replicaciones del experimento. En la siguiente tabla se presenta la información acerca del
cálculo del número efectivo de replicaciones para diferentes tipos de comparaciones:

Tipo de comparaciones:                                                                           Número efectivo de


replicación:
Entre los ab promedios bidimensionales de los factores A y B                                 n
Entre los a promedios marginales del factor A                                                         bn
Entre los b promedios marginales del factor B                                                         an
Entre los a promedios bidimensionales de los factores A y B
para un nivel fijo de B                                                                                             n
Entre los b promedios bidimensionales de los factores A y B
para un nivel fijo de A                                                                                             n                               
.

Ejemplo:
En una investigación se utilizó un experimento factorial de 4x3 en un diseño B.A. con 2 bloques. Los
números de niveles de los factores A y B fueron 4 y 3 respectivamente. Se obtuvieron datos
experimentales sobre 2 variables respuestas que indicamos por y 1 e y2  . Supongamos  las siguientes
situaciones hipotéticas para considerar la manera en que se debe usar el método de Duncan,
sabiendo que se obtuvieron los siguientes resultados en la tabla de Análisis de varianza:

Respuesta                          Efectos con valores de F significativos al nivel de sig. = 0,05


y1                                      A y B significativos. AB no significativa.
y2                                      A, B y AB significativos.
.                                                                                                                                   .
Obsérvese que para ambas variables respuestas hay 12 promedios bidimensionales, 4 promedios
unidimensionales del factor A y  3 promedios unidimensionales del factor B.
Caso (a): Variable respuesta y1:
Ya que AB es no significativa, podemos hacer 2 test de Duncan separadamente.

(1):  Test de Duncan  sobre 4 promedios unidimensionales del factor A con la siguiente entrada de
datos:

4  ;   los 4 promedios del factor A  ;   3 valores tabulares  ;   C.M. error experimental  ;   6  ;

(2):  Test de Duncan  sobre 3 promedios unidimensionales del factor B con la siguiente entrada de
datos:

3  ;   los 3 promedios del factor B  ;   2 valores tabulares  ;   C.M. error experimental  ;   8 ;

Caso (b): Variable respuesta y2:


Ya que AB  es significativa, la situación se complica. Podemos considerar algunas de las siguientes
posibilidades válidas:
(1):  Test de Duncan  sobre 12 promedios bidimensionales con la siguiente entrada de datos:

12  ;   los 12  promedios bidimensionales  ;   11  valores tabulares  ;   C.M. error experimental  ;   2 ;
o
(2): Test de Duncan  sobre 4 promedios bidimensionales del factor A para cada uno de los niveles
fijos del factor B. Habrá que hacer 3 test de Duncan, con la siguiente entrada de datos:

4  ;  4 promedios bidimensionales  del factor A  para el nivel j de B ; 3 valores tabulares  ;  C.M.


error   ;  2 ;
(repetir el test de Duncan  3 veces para j = 1,...,3)

o
(3): Test de Duncan  sobre 3 promedios bidimensionales del factor B para cada uno de los niveles
fijos del factor A. Habrá que hacer 4  test de Duncan, con la siguiente entrada de datos:

3  ;  3 promedios bidimensionales  del factor B  para el nivel i de A ; 2 valores tabulares  ;  C.M.


error   ;  2 ;
(repetir el test de Duncan  4 veces para i = 1,...,4)
 

(II-2): Experimento factorial de 3 factores y cualquier diseño: C.A., B.A. o C.L.


Sean a, b y c los niveles de los factores A, B y C respectivamente en un experimento factorial de 3
factores con n replicaciones. La situación aquí se resume de la siguiente manera:

Tipo de comparaciones:                                                                           Número efectivo de


replicación:
Entre los abc promedios tridimensionales de los factores A , B y C                                 n
Entre los a promedios marginales del factor A                                                                bcn
Entre los b promedios marginales del factor B                                                                acn
Entre los ab promedios marginales bidimensionales de los factores A y B                        cn
Entre los ac promedios marginales bidimensionales de los factores A y C                        bn
Entre los bc promedios marginales bidimensionales de los factores B y C                        an
etc.                                                                                                                                                        .

Nota:  Para otros diseños tales como parcela dividida y parcela subdividida que tienen más de un
tipo del error experimental, será necesario seleccionar el C.M. error experimental que sea apropiado
para una comparacion en el momento de hacer la entrada de datos en el programa.
 
 
 

También podría gustarte