Documentos de Académico
Documentos de Profesional
Documentos de Cultura
SECCIONES
1. Principios Bsicos
Para iniciar en el curso de Diseo de experimentos, es necesario tener algunos conceptos
claros en la parte de probabilidad y estadstica. A continuacin se presentan los conceptos
ms relevantes.
Estadsticas
Pueden ser
Descriptivas:
donde
se
describe el comportamiento de
unos
datos
mediante
estimados y algunos mtodos
grficos.
Inferenciales:
donde
se
modelan patrones a partir de
unos
datos,
haciendo
inferencias a partir de mtodos
como pruebas de hiptesis.
Prom edio ( X )
M ediana (X~ )
M oda
Medidas de dispersin:
Varianza ( )
2
M edida
de
ruido . Cuan
distintas
son
las
ob servac iones, prome dia la
distancia
de
cada
ob servac in de la mue stra a
su prome dio.
D esviacin ( )
estndar
Usada pa ra ver la disp ersin
de los datos a su m edia
Rango (R i)
D iferencia
entre
ob servac in
m xim a
m inim a d e la muestra
la
y
Valor P (P value)
Si
P < Se rechaza Ho
Si
P > No se rechaza Ho
2
Si
Valor P
Valor
+
F calculada
F crtica
La figura muestra que la hiptesis nula Ho no puede ser rechazada debido a que la F
calculada es menor a la F crtica y de igual manera el valor P es menor al nivel de
significancia alfa. El valor P se puede interpretar como la posibilidad de que la hiptesis
nula no sea rechazada; magnitudes altas del mismo se asocian con no poder rechazar la
hiptesis nula. La distribucin F presume que las variables analizadas tienen un
comportamiento Gausiano o normal. La misma se calcula como el promedio de
cuadrados de los tratamientos, entre el promedio de cuadrados del error (el promedio de
cuadrados usa la suma de cuadrados entre los grados de libertad).
Los programas estadsticos como Minitab, dan los valores para P y F en el resumen
mostrado al realizar un anlisis de varianza. El investigador usualmente toma la decisin
basado en el valor P por comodidad, esto porque l mismo decide el nivel de
Las hiptesis estadsticas son supuestos hechos por el investigador acerca de cierto
parmetro como la media o la desviacin estndar, de una o ms poblaciones de inters.
La estructura de las pruebas de hiptesis est dada por la formulacin de dos trminos:
Ho:
= o Hiptesis nula que establece el valor exacto del parmetro que se desea probar
H1: o Hiptesis alterna que establece la posibilidad de que el valor del parmetro se encuentre entre una
serie de valores distintos al establecido en Ho. (formulacin dada para hiptesis alterna de dos colas)
< o
Formulacin para hiptesis alternas de una cola
> o
1. Establecer Ho (ej: que no exista diferencia entre las medias de los niveles de un
factor o variable de entrada)
2. Establecer H1 (ej: que exista diferencia entre las medias de los niveles de un factor
o variable de entrada)
3. Establecer que es el valor que marca el lmite entre aceptacin y rechazo.
4. Seleccionar el estadstico de prueba (ej: la media, es decir, la funcin de la
muestra aleatoria que se utiliza para tomar una decisin)
4
Error tipo I: Rechazar Ho cuando no debi ser rechazada. Para este error se define
la probabilidad , siendo sta, la probabilidad de rechazar algo dado que estaba
bueno o de rechazar dado que deb aceptar. Este error se considera como el error
del productor porque se rechaza algo del lote de produccin que debi ser
aceptado. es seleccionado por el investigador.
Error tipo II: No rechazar Ho cuando debi ser rechazada. Para este error se
define la probabilidad , siendo sta, la probabilidad de aceptar algo dado que
debi ser rechazado. As este error se considera como el riesgo del consumidor,
ya que al cometerse, el productor acepta algo que debi ser rechazado y lo lanza a
la venta estando defectuoso. solo se controla a travs del tamao de muestra. Si
el investigador disminuye entonces aumenta porque estn inversamente
relacionados pero la suma de + 1.
Ho es cierto
Ho es falso
No rechazo Ho
Decisin correcta
Error tipo II
Rechazo Ho
Error tipo I
Decisin correcta
Ejemplo 1
El tiempo promedio que tardan los estudiantes en registrarse para las clases de otoo en una
universidad ha sido de 50 minutos con una desviacin estndar de 10 minutos. Se est probando
un nuevo mtodo de registro con computadoras modernas. Si se toma una muestra aleatoria de 12
estudiantes que tuvieron un tiempo de registro promedio de 42 minutos con una desviacin
estndar de 11.9 minutos quienes se registraron con el nuevo mtodo de registro. Pruebe la
hiptesis de que la media poblacional es ahora menor a 50 minutos usando un nivel de
significancia de 0.05 y de 0.01. Asuma que los datos de tiempo se distribuyen normalmente.
Solucin
En este caso en particular se tiene la desviacin estndar muestral conocida, de manera que se
trabaja entonces con la estadstica t.
La hiptesis del investigador H1 es que la media del tiempo que tardan los estudiantes en
registrarse sea menor a la anterior que era 50 minutos as:
H 0 : = 50 min
H1 : < 50 min
Como no se conoce la desviacin poblacional para el nuevo mtodo entonces se debe usar la
estadstica t ya que los datos que se tienen son de una muestra proveniente de una poblacin
mayor:
t=
X
42 50
=
= 2.33
S / n 11.9 / 12
Se procede entonces a buscar los valores de t crtica en la tabla, se debe tener en cuenta que la
tabla pide el valor correspondiente al nivel de significancia y el valor correspondiente a los
grados de libertad:
A un nivel de significancia del 0.05 se rechaza H0 porque t calculada es menor a t critica, pero a
un nivel de significancia de 0.01 no hay suficiente evidencia para rechazar H0 porque t calculada
es mayor a t critica. Esto indica que hay gran probabilidad de que la media poblacional sea menor
que 50 pero no es mucha la diferencia y quiz no es suficiente garanta para soportar el costo que
requiere la compra del nuevo mtodo de registro.
3. El problema pide que se pruebe que la media del nuevo procedimiento sea menor a la
media del procedimiento anterior, es decir, se hace una prueba de hiptesis de una cola.
Para esto se hace click sobre el botn options donde se despliega una ventana que permite
poner el nivel de confianza que en este caso es de 95 ya que el nivel de significancia
inicial a probar es = 5%. En la casilla de alternative se despliegan las opciones y se
escoge la opcin less than para que se pruebe que la media sea menor a 50.
One-Sample T
Test of mu = 50 vs < 50
N
12
Mean
42.0000
StDev
11.9000
SE Mean
3.4352
95%
Upper
Bound
48.1693
T
-2.33
P
0.020
El resultado despliega un valor de t de -2.33 igual al obtenido con los clculos manuales. En este
caso con un nivel de significancia de 0.05 se obtiene un valor p de 0.02, siendo este menor a 0.05
de manera que se rechaza la hiptesis nula y entonces el tiempo promedio que tardan los
estudiantes en registrarse con el procedimiento nuevo es menor al que se tomaban con el
procedimiento anterior.
Para el caso del nivel de significancia de 0.01 se hace el mismo procedimiento anteriormente
descrito pero cambiando el nivel de confianza a 99.0%.
Ejemplo 2
La especificacin para el grueso de una tableta es de 0.03 mm. Se sabe que el grosor de las
tabletas sigue una distribucin normal con = 0.001 . Se toma una muestra aleatoria de 32
tabletas del proceso y se les mide el grosor. El ingeniero del proceso desea saber si es correcto
decir que el promedio de las tabletas en el lote es de 0.03 mm.
Observacion
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Grosor
Grosor
(mm)
Observacion (mm)
0.031
17
0.0283
0.0285
18
0.0291
0.029
19
0.0287
0.0279
20
0.0291
0.0286
21
0.0309
0.028
22
0.0298
0.0305
23
0.0313
0.0279
24
0.03
0.0286
25
0.0289
0.0299
26
0.0299
0.03
27
0.0279
0.0295
28
0.0311
0.031
29
0.0293
0.0316
30
0.032
0.0283
31
0.0278
0.0294
32
0.0319
En este caso particular, se conoce la desviacin estndar poblacional y los datos tienen una
distribucin normal. Esto indica que se debe utilizar el estadstico de prueba Z.
Se desea entonces probar si la media poblacional es 0.03 mm. Para esto se utiliza una prueba
de hiptesis de dos colas, teniendo en cuenta que la hiptesis del investigador es negar que la
media poblacional sea de 0.03 mm; la prueba de hiptesis se formula entonces as:
Ho : = 0.03mm
H 1 : 0.03mm
Como la prueba es de dos colas, el rango de aceptacin estar dado por dos valores crticos de la
estadstica Z o dos valores crticos de P-value. Ahora el investigador define que su nivel de
significancia es de 0.05 y procede a realizar las pruebas:
10
X=
X Z / 2
X + Z / 2
1. En el men de stat, en basic statistics se hace clik sobre 1-sample Z debido a que se tiene
una muestra:
Variable
Grosor (cm)
N
32
Mean
0.029553
Variable
Grosor (cm)
P
0.011
StDev
0.001276
SE Mean
0.000177
95% CI
(0.029207, 0.029900)
Z
-2.53
Los resultados muestran un valor P de 0.011, este valor es menor a 0.05 que es el
nivel de significancia
0.011 < 0.05 por lo tanto se rechaza la hiptesis nula y
entonces la media o el grueso promedio de las tabletas producidas no es igual a 0.03
mm.
12
2. Definiciones
Diseo de Experimentos: La experimentacin es una tcnica utilizada para encontrar el
comportamiento de una variable a partir de diferentes combinaciones de factores o
variables de entrada de un proceso, que al cambiar afectan la respuesta. Para entrar a
experimentar es necesario pasar primero por el diseo de experimentos, esta tcnica
busca la manipulacin sistemtica de las variables de entrada de un proceso para entender
el efecto que estas pueden causar en la variable respuesta. Es ampliamente utilizado en
las empresas debido a que ste permite visualizar situaciones que pueden suceder a partir
de la realizacin de un proceso. En la industria se utiliza principalmente para buscar el
mejoramiento del rendimiento de un proceso, para reducir la variabilidad y permitir que
haya un mayor acercamiento a los parmetros de la empresa, para reducir tiempos de
procesamiento y reducir costos. Cualquier problema experimental incluye: diseo del
experimento y anlisis de los datos.
Diseo del Experimento: Se refiere al proceso de planear el experimento que se desea.
Es la adquisicin de los datos apropiadamente para analizarlos de manera estadstica.
Cuando se tiene un proceso para anlisis, es importante definirlo correctamente y
proceder a buscar el mejor diseo de experimentos, de manera que se le pueda sacar el
mejor provecho a los datos colectados por medio del anlisis estadstico. Las bases de un
diseo de experimentos son: replicacin, aleatoriedad y bloqueo.
Replicacin o Repeticin: Es el nmero de ocasiones que se efecta una misma
condicin experimental en la prueba o experimento que se est haciendo. Si por ejemplo
se desea probar el efecto que produce el cambio de temperatura (100 oC y 200 oC) y el
cambio de presin (3 PSI y 6 PSI)
13
Factor 2: Presin
temperatura:
temperatura:
100 oC
200 oC
X1
Respuestas bajo la
Y1
3 PSI
X2
Y2
W1
Z1
6 PSI
W2
Z2
Las letras de color rojo, indican las respuestas a la primera rplica bajo las condiciones
all mostradas. Las letras de color negro, indican las respuestas a la segunda replica bajo
las condiciones all mostradas.
Aleatoriedad: Es el orden en que se ejecutan las condiciones experimentales en el
experimento. Bajo la aleatoriedad todos los tratamientos tiene la misma oportunidad de
ser seleccionados. Es usada con el propsito de cancelar efectos de variables que no se
estn controlando
lando (como efectos del ambiente en el que se realiza el experimento
humedad). La aleatoriedad cancela el efecto de factores que quiz no conocemos que
estn all, incluso estos pueden estar cambiando sus niveles a medida que corremos el
experimento. Cuando se conoce la fuente de variabilidad y se puede controlar, se usa una
un
tcnica llamada bloqueo.
14
Cuantitativa
Cualitativa
respuesta(Y)
Cualitativa
Regresin
(ANOVA)
Regresin Logstica
Tablas
de
contingencia
Anova mira los promedios de cada nivel contra el promedio general y lo llama entre
tratamientos. Anova queda con dos estimados de varianza, dentro y entre los niveles; con
17
factor
Y11
Y21
Yn1
Totales
Promedios
Yi.
Yi.
Y11+ Y21+
Y1.
Yn1
2
Y12
Y22
Yn2
Y12+ Y22+
Y2 .
Yn2
.
Y1a
Y2a
Yna
Ya .
Y..
Y..
Totales
A partir de la anterior tabla, se presenta la forma manual de hacer Anova con el fin de
entender el concepto que maneja el anlisis de varianza. Inicialmente se debe calcular la
suma de cuadrados de los tratamientos:
SSTratamientos
1 a 2 Y..2
= ( Yi. )
n i =1
N
Donde:
n = Numero de tratamientos por cada nivel
18
Y..2
= ( Y )
N
i =1 j =1
a
SSTotal
2
ij
Donde:
N = Numero de tratamientos en total
i = 1, 2, 3 a
j = 1, 2, 3n
Para estimar la suma de cuadrados de los errores se hace la diferencia de la suma de
cuadrados total y la suma de cuadrados de los tratamientos:
SS E = SSTotal SSTratamientos
de Suma
variacin
de Grados
cuadrados
libertad
(SS)
de Promedio
de Estadstico de
Tratamientos
SS tratamientos
a-1
SS tratamientos
a 1
Error
SS error
N-a
SS error
N a
Total
SS total
N-1
MS tratamientos
MS error
19
Donde es un parmetro comn para todos los tratamientos llamado la media general,
representa el efecto del tratamiento i y ij corresponde al error que incorpora todas las
fuentes de variabilidad en el experimento.
Las hiptesis evaluadas son:
H 0 : 1 = 2 = ... a
H1 : 1 2 ... a
Lo que se desea investigar es si existe diferencia o no entre los niveles del factor en
consideracin.
Ejemplo 1 (Tomado del libro Design and analysis of Experiments, de Douglas C.
Montgomery, 6ta edicin. Pgina 70)
En muchos procesos de manufactura de circuitos integrados, los wafers son revestidos
con una capa de material como dixido de silicona o un metal. Luego, el material que no
se necesita es removido haciendo los grabados necesarios para crear los patrones de los
circuitos, interconexiones elctricas y reas donde se hacen los depsitos de metal. Un
proceso de grabado tipo plasma es ampliamente usado para esta operacin. La energa
para el proceso es suplida por un generador de radio frecuencia RF que hace que el
plasma sea generado en el intervalo entre electrodos. El ingeniero del proceso est
20
Totales
Promedios
(W)
1
Yi.
160
575
542
530
539
570
2756
551.2
180
565
593
590
579
610
2937
587.4
200
600
651
610
637
629
3127
625.4
220
725
700
715
685
710
3535
707.0
Y.. = 12,355
Y.. = 617.75
Yi.
Y..2
12,355
SSTotal = (Y ) = (5752 + 5422 + ... + 7102 )
= 72,209.75
N
20
i =1 j =1
a
2
ij
SSTrat
1 a 2 Y..2 1
12,355
= ( Yi. )
= [27562 + ... + 35352 ]
= 66,870.55
n i=1
N 5
20
21
de Grados de Promedio
cuadrados
de
los Estadstico
de
libertad
cuadrados (MS)
prueba Fo
22,290.18
= 66.80
333.70
(SS)
Poder RF
66,870.55
66,870.55
= 22,290.18
3
Error
5339.20
16
5339.20
= 333.70
16
Total
72,209.75
19
22
2. Aparece entonces una ventana que permite ingresar las columnas de valores para
el anlisis. En la primera casilla que dice response, se ingresa la columna que
contiene los valores de la respuesta, en la siguiente casilla de factor, se ingresa la
columna que tiene los niveles del factor, se dejo una confianza del 95% que
equivale al nivel de significancia de 0.05 utilizado en los clculos manuales:
23
DF
3
16
19
S = 18.27
SS
66871
5339
72210
MS
22290
334
R-Sq = 92.61%
F
66.80
P
0.000
R-Sq(adj) = 91.22%
Se obtienen los mismos valores que se obtuvieron con los clculos manuales. En este
caso se ve que el P-value es de 0, esto implica un valor menor al del nivel de
significancia (0.005). al ser 0 < 0.005 se rechaza Ho y el investigador puede concluir
entonces que los niveles del poder afectan la tasa de grabado.
4. Al dar clik en OK se obtiene tambin una grafica con 4 mtodos de anlisis
graficos para los residuales, esto con el fin de cotejar la idoneidad del modelo:
Residual Plots for Respuesta
Normal Probability Plot of the Residuals
99
20
Residual
Percent
90
50
10
0
-10
10
-20
1
-50
-25
0
Residual
25
50
550
600
650
Fitted Value
700
Residual
Frequency
20
3
2
10
0
-10
1
-20
0
-30
-20
-10
0
10
Residual
20
30
8
10 12 14
Observation Order
16
18
20
24
Residuals versus the fitted values (trazo de residuales contra los valores
estimados): este grafico muestra que no hay un patrn definido.
Ejemplo 2
La compaa Mush, productora de setas, ha elaborado un proceso de deshidratacin de
las mismas. Para el proceso se estableci una caja de cartn equipada con una entrada de
aire, una chimenea, una parrilla para poner las setas a deshidratar y un foco debajo de la
misma, el cual provee el calor necesario para deshidratar las setas. El ingeniero
encargado del proceso sabe que 150 gramos de setas tardan de 9 a 18 horas en
deshidratarse pero no sabe el tiempo exacto. Se sabe tambin que las setas deben llegar a
reducir su peso en un 87% aproximadamente para considerarse deshidratadas. Debido a
esto se estableci un experimento tomando un solo factor en consideracin (tiempo). El
experimentador determino 4 niveles de tiempo entre 9 y 18 horas con intervalos de 3
horas entre cada nivel.
Lo anterior conlleva entonces a la siguiente configuracin:
Factor: Tiempo
Nivel 1: 9 horas
Nivel 2: 12 horas
Nivel 3: 15 horas
Nivel 4: 18 horas
El experimentador sabe que debe realizar replicas de su experimento; para esto el realiz
una prueba de poder y tamao de muestra (power and sample size) en el programa
Minitab.
El poder es la probabilidad de que la prueba rechace la hiptesis nula (en este caso es que
no exista diferencia entre las medias de los pesos para los niveles de la variable tiempo o
25
Number of Levels = 4
27
SS
Means
8
Sample
Size
11
Power
0.754440
Number of Levels = 4
Maximum
Difference
4
28
2. Al hacer click en sample from column se despliega una ventana donde se ingresa
el numero de filas que contienen los datos a organizar, luego una casilla donde se
ingresa la columna de la cual se hace la aleatoriedad, esto haciendo doble click en
los nombres de las columnas que se despliegan en la casilla de la izquierda,
finalmente en la ltima casilla se ingresa el nombre de la columna donde se desea
que se almacene el resultado (la organizacin aleatoria de la rplica). La siguiente
figura ilustra el procedimiento:
29
Entonces el experimentador debe correr la primera rplica poniendo las setas en la caja
por 9 horas inicialmente, luego debe sacarlas, pesarlas y poner un segundo lote de setas
en la caja por 15 horas y as hasta completar la rplica. Para la aleatoriedad de las dems
replicas, se repite el procedimiento anteriormente mencionado
Los resultados de los pesos en gramos para las 11 replicas son:
30
Nivel 1: 9
Nivel 2:
Nivel 3:
Nivel 4:
horas
12 horas
15 horas
18 horas
21.73
20.80
20.80
21.30
20.10
20.20
18.30
19.50
18.05
18.14
18.40
17.62
20.05
19.30
18.85
19.30
19.01
19.42
20.27
18.75
21.64
21.81
20.06
21.88
23.21
20.22
19.04
22.02
20.34
18.20
18.74
18.85
18.50
18.02
18.30
19.30
10
19.34
20.05
19.53
18.70
11
19.39
18.90
21.43
20.54
31
2. Al dar click en General linear model se obtiene una ventana donde se ingresa en
la primera casilla la columna de respuestas denominada como pesos, en la casilla
de Model se ingresa el modelo, en este caso el factor tiempo y las replicas, siendo
el factor tiempo un factor fijo y las replicas un factor aleatorio. En la ltima
casilla (random factors) se especifica que el factor replica es aleatorio
32
Type
fixed
random
Levels
4
11
Values
9, 12, 15, 18
1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11
DF
3
10
30
43
S = 0.875386
Seq SS
3.1996
47.6228
22.9890
73.8114
Adj SS
3.1996
47.6228
22.9890
R-Sq = 68.85%
Adj MS
1.0665
4.7623
0.7663
F
1.39
6.21
P
0.264
0.000
R-Sq(adj) = 55.36%
El valor P es mayor
al valor de alfa de
0.05 por lo tanto no
se puede rechazar Ho
y se determina que no
hay diferencia entre
los
niveles
del
factor.
33
Pesos
19.0400
23.2100
21.4300
Fit
20.8327
21.5273
19.7752
SE Fit
0.4938
0.4938
0.4938
Residual
-1.7927
1.6827
1.6548
St Resid
-2.48 R
2.33 R
2.29 R
nivel1
20.1
Mean of Pesos
20.0
nivel 4
19.9
19.8
19.7
nivel 2
19.6
19.5
nivel 3
19.4
9
12
15
18
Tiempos
El experimentador deduce que no hay diferencia entre los niveles del factor tiempo
debido a su valor P. Al observar la grafica se encuentra que la diferencia entre las
medias de los niveles no sobrepasan los 4 gramos de diferencia entre las medias que
el experimentador quera detectar, por lo tanto, el tiempo que debe durar el proceso de
deshidratacin es de 9 horas.
34
Descripcin:
Un diseo de experimento es completamente aleatorio cuando hay:
Un factor de inters.
Si hay alguna fuente de variacin que est incidiendo en el experimento y que no est en el modelo,
el efecto de esta fuente de variacin se va a reflejar en el error si la variable que representa dicha
variacin no es bloqueada. La aleatoriedad ocurre dentro del bloque.
35
i = 1,2,..., a
y ij = + i + j + ij
,
j = 1,2,..., b
donde:
y ij observacin j del tratamiento i
promedio general
i efecto del tratamiento i
ij error o residual de la observacin j en el tratamiento i
36
yi = yij
i = 1,2, K , a
j =1
a
y j = y ij
j = 1,2, K , b
i =1
a
b
i =1 j =1
i =1
j =1
y = y ij = yi = y j
De igual forma, y i es el promedio de las observaciones tomadas en el tratamiento i, y j es el
promedio de las observaciones en el bloque j y y es el promedio del gran total de todas las
observaciones. Esto es,
y i = yi b
y j = y j a
y = y N
(y
a
i =1 j =1
) = [(y
2
ij
i =1 j =1
) (
) (
y + y j y + y ij y i y j + y
)]
Expandiendo el lado derecho de la ecuacin y haciendo algebra simple pero tediosa obtenemos la
ecuacin que representa una particin del total de la suma de cuadrados pero que es una de las
ecuaciones fundamentales en ANOVA para el diseo de bloque completamente aleatorio. La
ecuacin es
(y
a
i =1 j =1
ij
= b y i y
i =1
+ a y j y
j =1
) + (y
2
i =1 j =1
ij
y j y i + y
SS T = SS Treatments + SS Blocks + SS E
Otro parmetro a considerar es el grado de libertad de cada una de las partes de la suma de
cuadrados. Los grados de libertad son el nmero de elementos independientes en cada una de las
37
Fo =
Fa 1,(a 1)(b 1)
MS Treatments
MS E
. De
forma alterna podemos utilizar el P-value para la toma de decisiones. El P-value es la probabilidad
de que la prueba estadstica va a tomar un valor que es al menos tan extrema como el valor
observado de la estadstica cuando la hiptesis nula es cierta. El P-value se define como el nivel de
significancia ms pequeo que llevara al rechazo de la hiptesis nula Ho.
El error puede estar inflado por lo que es el error de verdad mas todo aquello que no contabilic,
por lo tanto, debo bloquear las variables que son. Un procedimiento aproximado que resulta
razonable para investigar el efecto de la variable bloqueada es examinar el radio de MSBlocks entre
MSE. Si este radio es grande, implica que el factor bloque tiene un efecto grande y que la reduccin
de ruido obtenida por el bloque probablemente es til en mejorar la precisin en la comparacin de
los promedios de los tratamientos.
El procedimiento para el anlisis de varianza se resume en una tabla de ANOVA como la que se
presenta a continuacin.
38
Suma de
Cuadrados
Grados de
Libertad
Tratamientos
SSTreatments
a-1
Bloques
SSBlocks
b-1
Error
SSE
(a-1)(b-1)
Total
SST
N-1
Promedio
Cuadrado
SSTreatments
a-1
SSBlocks
b-1
SSE
(a-1)(b-1)
F0
MSTreatments
MSE
Estos valores se pueden calcular en una hoja de clculo de Excel pero tambin se pueden obtener
de forma manual calculando las formulas expresadas en trminos de los tratamientos y bloques
totales. Estas formulas son
a
SS T = y ij2
i =1 j =1
SS Treatments =
SS Blocks =
y 2
N
1 a 2 y 2
y i N
b i =1
1 b 2 y 2
y j N
a j =1
Ejemplo 1
Un fabricante de dispositivo mdico produce injertos vasculares (venas artificiales). stos injertos
son producidos insertando a presin resina de politetrafluoetileno combinado con un lubricante
dentro de los tubos. Con frecuencia, algunos de los tubos en un funcionamiento de produccin
contienen salientes pequeas y duras en la superficie externa. Estos defectos se conocen como "
flicks." El defecto es causa para el rechazo de la unidad.
39
A continuacin se presenta la tabla que contiene los datos con respecto a este experimento.
Ejemplo calculando y i :
6
y
Para la presin 8500
i =1
8500
8500
y
i =1
Ejemplo calculando y j :
40
y
Para el Lote de Resina 1 (Bloque 1)
j=1
y
j=1
Ejemplo calculando y :
Se puede calcular sumando cada uno de los tratamientos de los diferentes bloques o simplemente
4
i =1
j=1
y = y i + y j
y = (556.9 + 550.1 + 533.5 + 514.6) + (350.8 + 359.0 + 364.0 + 362.2 + 341.3 + 377.8) = 2155.1
Anlisis de Varianza:
Para realizar el anlisis de varianza hay que calcular las siguientes sumas de cuadrados:
4
SS T = yij2
i =1 j =1
y 2
N
2
(
2155.1)
= 193,999.31
24
SS Treatments =
=
SS Blocks
= 480.31
1 4 2 y 2
y i N
b i =1
1
(556.9 )2 + (550.1)2 + (533.2 )2 + (514.6 )2 (2155.1) = 178.17
6
24
1 6 2 y 2
= y j
a j =1
N
1
(2155.1) = 192.25
2
2
2
= (350.8) + (359.0) + L + (377.8)
4
24
SS E = SS T SS Treatments SS Blocks
= 480.31 178.17 192.25 = 109.89
Llenando la tabla de ANOVA haciendo cada uno de los clculos con las formulas en la tabla
anterior tenemos el siguiente resultado:
41
Suma de
Cuadrado
Grados de
Libertad
Promedio
Cuadrado
178.17
59.39
192.25
38.45
109.89
480.31
15
23
7.33
F0
8.11
P-Value
0.0019
Usando un = 0.05, el valor crtico de F es F0.05 ,9 ,15 = 3.29 . Este valor se obtiene de las tablas para
la distribucin F. Debido a que F0 > F0.05, 9,15 = 8.11 > 3.29 , concluimos que la presin de insercin
afecta el rendimiento promedio. El P-Value de la prueba tambin es bien pequeo lo que significa
que el experimento es aceptable. Tambin, los lotes de resina (bloques) parecen diferir de forma
significativa, debido a que el promedio cuadrado para los bloques es grande en relacin con el
error.
Ejemplo usando MINITAB
En Minitab, en la pantalla de WORKSHEET, ingresamos la data que est en la tabla 2. Se ingresan
tres columnas de datos. Una columna que identifique el tipo de presin de insercin, otra que
identifique los lotes de resina y otra que tenga la variable respuesta, en este caso el rendimiento,
que concuerde con el tipo de presin y lote de resina.
42
Como queremos realizar un ANOVA con un factor y un efecto bloqueado utilizamos la opcin de
General Linear Model y la seleccionamos como se presenta a continuacin.
43
Si comparamos los resultados obtenidos usando Minitab con los resultados calculados con las
ecuaciones podemos notar que son los mismos, lo que demuestra que el software de Minitab es una
herramienta muy eficaz en diseo de experimentos. Otra informacin til provista por el software
de Minitab es el R-Sq que se define como la proporcin de la variabilidad de la data explicada
por el modelo de ANOVA. Esta cantidad de calcula usando la siguiente ecuacin:
R2 =
SS Model
. A mayor porciento ms confiable y deseable es el modelo utilizado. Si este
SSTotal
porciento est por debajo del 60%, entonces el modelo utilizado no es el mejor que describe la data.
Entre las presunciones de ANOVA el anlisis de varianza supone que los errores del modelo, y por
ende las observaciones, tienen una distribucin normal e independiente con la misma varianza en
cada nivel del factor. Estas presunciones se pueden verificar examinando los residuales. Un
residual es la diferencia entre la observacin real yij y el valor ij que se hubiera obtenido de un
45
La grfica de normalidad nos permite visualizar que los datos estn normalmente distribuidos ya
que la dispersin de los residuales esta sobre la lnea de normalidad. La grfica de histograma nos
permite corroborar que los datos estn normalmente distribuidos con media igual a cero ya que el
histograma tiene forma de campana centralizada en el punto cero. La grafica de los residuales
versus los valores ajustados nos permite visualizar y corroborar la presuncin de independencia de
los datos ya que no siguen un patrn sino que estn dispersos de forma aleatoria.
46
Efecto de
la
Columna
Efecto del
tratamiento
Efecto
de la
Fila
y ij = + i + j + k + ik
2 Bloques
Suponga que un experimentador est investigando el efecto de 5 tipos de formulaciones de
combustible (usado en la operacin de una caldera), para observar el efecto en la tasa de
combustin. Cada formula de combustible se tom de un lote que solo da para 5 pruebas. Adems
de esto, las formulas son preparadas por diferentes operadores, que al ser personas, tienen
diferentes habilidades y adquisicin de experiencia. De esta manera, se puede observar dos factores
de ruido o variabilidad que son identificables por el experimentador y que se pueden bloquear: los
lotes de material y los operadores. As, el diseo apropiado seria hacer las pruebas para observar la
tasa de combustin de las formulaciones; teniendo en cuenta que se debe hacer el test probando
cada formulacin exactamente una vez en cada lote de materia prima, y, adems, cada formulacin
debe ser preparada exactamente una vez por cada operador. La siguiente tabla ilustra lo
anteriormente descrito:
Lote de
materia
prima
Lote 1
Lote 2
Lote 3
Lote 4
Lote 5
A=24
B=17
C=18
D=26
E=22
B=20
C=24
D=38
E=31
A=30
Operadores
3
C=19
D=30
E=26
A=26
B=20
D=24
E=27
A=27
B=23
C=29
E=24
A=36
B=21
C=22
D=31
Note que el diseo es un arreglo cuadrado y que las 5 formulaciones (A, B, C, D, E) o tratamientos,
se denotan con letras latinas; de all el nombre de cuadrado latino.
Las columnas y las filas representan 2 RESTRICCIONES EN LA ALEATORIEDAD.
47
F0 =
MStratamientos
MS E
48
Fuente de
Variacin
SS trat =
Tratamientos
1 p 2 y...
yi.. N
p i =1
SS tratamient o
p 1
p-1
2
SS filas
Filas
y
1 p
= y..2k ..
p k =1
N
1 p 2 y...
y. j . N
p j =1
Error
Total
SS Total = y ijk
i
y...
N
MS tratamientos
MS E
p 1
SS col =
F0 =
SS filas
p-1
Columnas
F0
p-1
SS columnas
p 1
(p-2)(p-1)
SS E
( p 2)( p 1)
p2-1
Ejemplo1:
Teniendo en cuenta la situacin anteriormente descrita sobre las pruebas de la tasa de combustin
de 5 formulaciones, se procede a comprobar la igualdad de los efectos de los tratamientos de la
siguiente manera:
Ho : A = B = ... E
H 1 : A B ... E
Teniendo las hiptesis a probar claras, se procede a realizar los clculos que faciliten llegar a las
sumatorias de cuadrados de cada uno de los componentes. A continuacin se presenta la tabla con
los respectivos clculos:
Operadores
Lote de
materia prima
Lote 1
A=24
B=20
C=19
D=24
E=24
111
Lote 2
B=17
C=24
D=30
E=27
A=36
134
Lote 3
C=18
D=38
E=26
A=27
B=21
130
Lote 4
D=26
E=31
A=26
B=23
C=22
128
Lote 5
E=22
A=30
B=20
C=29
D=31
132
107
143
121
130
134
y= 635
y.j.
y..k
49
Tratamiento
y1..
y2..
y3..
y4..
y5..
Total
24+30+36 = 143
101
112
149
130
Ahora se procede a calcular las sumas de cuadrados para los tratamientos, las filas, las columnas,
el error y la suma de cuadrados total:
SS total
635 2
= 24 + 17 + 18 + ... + 31
= 676
25
i
j
k
2
1 5
635 2
2
2
2
[
111
+
134
+
...
+
132
]
= 68
5 K =1
25
1 5
635 2
SS operadores _ columnas = [107 2 + 143 2 + ... + 134 2 ]
= 150
5 j =1
25
SS lotes _ filas =
1 5
635 2
[143 2 + 1012... + 130 2 ]
= 330
5 i =1
25
SS lotes SS operadores SS formulaciones = 676 68 150 330 = 128
SS formulaciones _ tratamientos =
SS Error = SS total
Formulaciones
330
p-1 = 5-1 = 4
Lotes
68
p-1 = 4
Operadores
150
p-1 = 4
Error
128
(p-2)(p-1) =
12
Total
676
p2-1 = 24
SS tratamient o 330
=
= 82.5
p 1
4
SS filas
= 17
p 1
SS columnas
= 37.5
p 1
SS E
= 10.67
( p 2)( p 1)
F0
MS tratamientos
MS E
82.5
=
= 7.73
10.67
F0 =
51
1. Diseo Factorial
En un experimento factorial se analizan todas las posibles combinaciones de los niveles
de los factores en cada rplica del experimento. Por ejemplo, si el factor A tiene a niveles
y el factor B tiene b niveles entonces cada replica tiene ab combinaciones posibles como
muestra la figura 1.
52
B1
70
50
40
30
50
40
30
20
20
10
10
B1
60
B2
Respuesta
Respuesta
60
70
B2
1
El factorial ms pequeo es el que tiene 2 factores con 2 niveles cada uno. Las posibles
combinaciones de este experimento forman los vrtices de un cuadrado como se muestra
en la figura anterior. Si utilizamos el mtodo de variar un factor a la vez para explorar
cada una de las combinaciones nos encontramos que ste mtodo es inefectivo debido a
que (como se muestra en la figura 4) una de las posibles combinaciones queda sin
explorar. Adems, para factoriales con ms de 2 factores resultara ineficiente e
inadecuado.
Figura 4. Grfica que ilustra cuando se vara un factor a la vez en un factorial de 2 factores.
53
Factor C
1
2
Fa
ct
or
B
1
2
Factor A
Figura 5. Factorial de 3 factores ilustrando combinaciones sin explorar al utilizar el mtodo de variar un
factor a la vez.
54
(18)
(17)
(23)
(20)
(21, 18)
(20, 17)
(21)
Repeticiones
eliminando un factor
(20)
B
(19)
(18)
B
(19, 20)
(18, 23)
Figura 6. Ilustracin de cmo se obtienen repeticiones cuando se elimina uno de los factores; en este
ejemplo se elimin el factor C.
y ijk = + i + j + () ij + ijk ,
donde el trmino () ij es el efecto de la interaccin entre el factor A y el factor B, y y ijk
es la respuesta observada cuando el factor A esta en el nivel i y el factor B est en el nivel
j para la rplica k.
SS total = SS A + SS B + SS AB + SS error
La ecuacin fundamental de ANOVA para un solo factor era
55
2
SS T = yijk
i =1 j =1 k =1
i abn
bn i =1
y2
abn
SS B =
y 2
1 b 2
y
j abn
an j =1
y 2
1 a b 2
y
ij abn
n i =1 j =1
SS E = SST SS AB SS A SS B
SS E = SS T SS Subtotals
56
Suma de
Cuadrados
Grados de
Libertad
A tratamientos
SS A
a 1
B tratamientos
SS B
b 1
Interaccin
SS AB
(a 1)(b 1)
Error
SS E
ab(n 1)
Total
SST
abn 1
Cuadrado Promedio
Fo
SS A
a 1
SS B
MS B =
b 1
SS AB
MS AB =
(a 1)(b 1)
SS E
MS E =
ab(n 1)
MS A
MS E
MS B
Fo =
MS E
MS AB
Fo =
MS E
MS A =
Fo =
Ejemplo Numrico:
Tenemos 2 factores (A y B) a dos niveles cada uno (1 y 2) donde cada combinacin tiene
dos rplicas. Se quiere calcular la suma de cuadrados de cada efecto, (tratamientos A y
B, la interaccin, el error y el total). La data se encuentra en la siguiente tabla:
A
1
B
2
1
8
9
10
12
2
4
3
14
16
Realizamos la suma por fila y por columnas para facilidad de los clculos.
A
1
B
2
1
8
9
10
12
2
4
3
14
16
39
37
24
52
76
57
= 0.5
4
8
2
SS A =
24 2 + 52 2 (76 )
= 98
SS B =
4
8
2
SS Total = 8 2 + 9 2 + + 14 2 + 16 2
(76 )2
= 144
21
4
3
12
10
12
22
14
16
17
22
30
76
17 2 + 7 2 + 22 2 + 30 2 (76)
=
= 139
2
8
2
SS Tratamiento
SS AB = SS Tratamientos SS A SS B
58
C
B
B
A
2 = 4 tratamientos
combinaciones
A
2 = 8 tratamientos
C
B
A
24 = 16 tratamientos
59
1. Regresin Lineal
Los factores envueltos en la experimentacin pueden ser de tipo cuantitativos o cualitativos. Un
factor cuantitativo es aquel que sus niveles pueden ser asociados con puntos dentro de una escala
numrica, como la temperatura, el tiempo o la presin. Un factor cualitativo, es aquel que sus
niveles no pueden ser organizados por el orden de su magnitud,
magnitud, en este caso se pueden
mencionar personas u operadores, lotes de produccin, turnos de trabajo etc.
La regresin lineal trabaja con factores de tipo cuantitativos. Este modelo puede ser utilizado
para predecir la respuesta en cualquier punto del espaci
espacio
o contenido dentro de la regin
experimental, es decir, si por ejemplo los niveles de temperatura analizados son 100 y 200, el
modelo de regresin le permite al experimentador hacer inferencias sobre una temperatura que se
encuentre entre 100 y 200.
El modelo
delo de regresin caracteriza la relacin entre una variable respuesta que depende de k
variables independientes o regresoras.
Para ilustrar lo anterior,
erior, suponga que se desea medir la dureza de un elemento bajo dos niveles
distintos de temperatura y dos ni
niveles
veles distintos de presin. Al realizar las medidas se obtiene el
siguiente grafico:
60
y = Bo + B1 X 1 + B2 X 2 +
Donde las Bs representan los coeficientes del modelo de regresin, siendo Bo el intercepto del
plano, B1 el cambio esperado en la variable respuesta por unidad de cambio en la variable X1
(temperatura), B2 el cambio esperado en la variable respuesta por unidad de cambio en la
variable X2 (presin) y representa el error o residuo del modelo.
En forma matricial, el modelo de regresin puede ser expresado as:
y = BX +
Donde:
y1
y
2
.
y=
.
.
y n
1X 11
1X 21
.
X =
.
.
1X n1
X 12
X 22
X n2
... X 1k
... X 2 k
... X nk
Bo
B
1
.
B=
.
.
Bk
1
2
.
=
.
.
n
Lo anterior muestra un vector y (de tamao nx1) de las observaciones del experimento, X es la
matriz de diseo (de tamao nxp) de los niveles de las variables independientes, es decir los
factores del experimento, B es un vector (de tamao px1) de los coeficientes del modelo de
regresin y es un vector (de tamao nx1) de errores o residuales.
61
L = n2 = ' = ( y XB )' ( y XB )
i =1
El trmino BXy es un escalar al igual que su transpuesta, por esta razn se puede agrupar el
segundo trmino de esta manera. Ahora la derivada de L con respecto a B resulta en:
L
= 2 X ' y + 2 X ' Xb = 0 X ' Xb = X ' y
B b
As los estimadores para los coeficientes que minimizan la suma de cuadrados de los errores se
obtienen:
Formula que se utiliza
para encontrar los
coeficientes B
b = ( X ' X ) 1 X ' y
E ( SS ) = 2 ( n p )
Donde el termino n-p se refiere a los grados de libertad del error. De esta manera al despejar se
consigue el estimador no sesgado para 2 :
2 =
SS
(n p)
Ahora para ilustrar lo descrito se toma en cuenta el siguiente ejemplo: suponga que se est
midiendo la dureza como funcin de dos factores, temperatura y presin. El experimentador
tomo una observacin en cada una de las condiciones y obtuvo el siguiente resultado:
Dureza
Presin
Temperatura
25
20
100
35
40
100
20
20
200
22
40
200
Con este resultado, el experimentador utilizo el programa Minitab y realizo el clculo para
encontrar el modelo de regresin que se ajusta a los datos:
1. En el men de stat, en regresin, se da click a la ventana desplegada en la opcin de
regresin como muestra la figura:
63
64
Predictor
Constant
Temperatura
Presion
S = 4
Coef
SE Coef
30.000
8.718
3.44
0.180
-0.09000
0.04000
-2.25
0.266
0.3000
0.2000
1.50
0.374
R-Sq = 88.0%
R-Sq(adj) = 63.9%
La columna catalogada como coef, despliega los coeficientes predictores o betas, de esta manera
la ecuacin de regresin para el ejemplo se resume en:
Dureza = 30.0 0.09Temperatura + 0.30Presion
El termino R-sq representa el R2 que define la variabilidad explicada por el modelo de regresin,
es decir, el 88% de la variabilidad est siendo explicada por el modelo de regresin para el
experimento conducido. De esta manera el modelo explica de forma suficiente los datos y por lo
tanto la regresin se ajusta a ellos.
Observando la ecuacin, no se le puede dar una explicacin al intercepto Bo = 30 porque
ninguno de los rangos de experimentacin para los factores incluyen el cero, que es lo que se usa
de referencia para explicar el intercepto.
Ahora en el caso de los factores, el inters es encontrar cul de ellos afecta ms la respuesta. Al
observar la figura ubicada en la primera pagina de esta seccin, se ve que la temperatura afecta la
respuesta en mayor proporcin que la presin. Sin embargo al observar el modelo de regresin
que se ajusto al experimento, no se puede deducir lo mismo, por el contrario los coeficientes
obtenidos a simple vista hacen pensar que la presin afecta la temperatura en mayor proporcin.
Esto se da porque ambos factores (temperatura y presin) estn en diferentes escalas, es decir las
65
Xi =
( i )
rango
2
(100 150)
= 1
200 100
2
Xi =
(200 150)
=1
200 100
2
Esto describe que el nivel bajo de temperatura (100) ahora se codifico a un nivel -1 y el nivel alto
(200) se codifico a un 1. La siguiente tabla muestra las variables codificadas:
Dureza
Presin
Temperatura
25
-1
-1
35
-1
20
-1
22
Al hacer el mismo procedimiento que se hizo para las variables naturales en Minitab, se obtiene
el siguiente resultado para las variables codificadas:
66
Predictor
Constant
Presion_1
Temperatura_1
S = 4
Coef
SE Coef
25.500
2.000
12.75
0.050
3.000
2.000
1.50
0.374
-4.500
2.000
-2.25
0.266
R-Sq = 88.0%
R-Sq(adj) = 63.9%
Ho : j = 0
H1 : j 0
Si el resultado de la prueba fuera que la hiptesis nula no es rechazada, entonces se puede
concluir que la variable Xj asociada con el coeficiente j no impacta la respuesta
67
bj
C jj (MSE )
Donde:
bj: es el estimador de j
Cjj: elemento de la diagonal de la matriz de varianza-covarianza (XX)-1 correspondiente al
coeficiente bj.
MSE: estimador del error
Cabe aclarar que la covarianza es una medida de la relacin entre dos variables. Si estas son
independientes su covarianza es 0. Sin embargo el hecho de que la covarianza sea 0 no implica
que las variables sean independientes
Para ilustrar la ubicacin de los valores Cjj se muestra la siguiente matriz:
bo
( X ' X ) 1
b1
b2
C 00
C11
C 22
=
.
.
bk
C kk
68
Factor A
Factor B
10
14
12
16
69
b0
8
1
9
1
4
1
1
y=
X
=
10
1
12
1
14
1
1
16
b1
b2
b3
+1
+1
+1
+1
+1
+1
+1
+1
+ 1
+ 1
1
1
1
1
+ 1
+ 1
b3 = b1 x b2
Se puso -1 para el
nivel ms bajo (1) y
+1 para el nivel ms
alto del factor (2)
+ 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1
1 1 + 1 + 1 1 1 + 1 + 1
X '=
1 1 1 1 + 1 + 1 + 1 + 1
+ 1 + 1 1 1 1 1 + 1 + 1
1
1
+ 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 1
1 1 + 1 + 1 1 1 + 1 + 1 1
*
1 1 1 1 + 1 + 1 + 1 + 1 1
+ 1 + 1 1 1 1 1 + 1 + 1 1
1
1
1
1
X =
1
1
1
1
1
1
1
1
+1
+1
+1
+1
+1
+1
+1
+1
+1
+1
+1
+1
+1
+1
+1
+1
+ 1
+ 1
1
1
1
1
+ 1
+ 1
+ 1
+ 1
1
8000
0800
1
= X'X =
0080
1
1
0008
+ 1
+ 1
70
8000
0800
( X ' X ) 1
X'X =
0080
0008
1 000
8
0 1 00
8
=
00 1 0
8
000 1
8
Los
ceros representan la
covarianza.
Como
puede
caso
no
tendrn
en
estimado
del
independiente
el
mismo
coeficiente
del
modelo
lineal.
8
9
+ 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 4 76
1 1 + 1 + 1 1 1 + 1 + 1 3 2
* =
X'y =
1 1 1 1 + 1 + 1 + 1 + 1 10 28
+ 1 + 1 1 1 1 1 + 1 + 1 12 18
14
16
6. Por ltimo, multiplicando la matriz (XX)-1 y el vector Xy se obtiene el vector de
coeficientes Bj.
(XX)-1 * Xy =
bj
76
1 000
8
76 8
0 1 00 2
8 * 2 = 8
00 1 0 28 28
8 8
18
1 18
000 8
8
b0
b1
b2
b3
76 2
28
18
+
XA +
XB + X AXB
8
8
8
8
71
Effect
-0.5000
7.0000
4.5000
S = 1.11803
Coef
9.5000
-0.2500
3.5000
2.2500
R-Sq = 96.53%
SE Coef
0.3953
0.3953
0.3953
0.3953
T
24.03
-0.63
8.85
5.69
P
0.000
0.561
0.001
0.005
R-Sq(adj) = 93.92%
En la respuesta se puede observar los mismos valores para los coeficientes que se obtuvieron
mediante la regresin lineal. Al observar los valores de P para los factores, se encuentra que
el factor A es no significativo debido a que 0.561 > 0.05, siendo 0.05 el nivel de
significancia utilizado para la prueba. Por lo anterior se dice entonces que el factor A no es
significativo, es decir, al variar sus niveles la respuesta no se impacta significativamente.
72
1. Diseo Factorial 2k
El ms importante de los casos especiales de los diseos factoriales es el que tiene k
factores cada uno a dos niveles. Estos niveles pueden ser cuantitativos, valores de
temperatura o presin, o pueden ser cualitativos, tales como 2 mquinas o dos
operadores, o tal vez pueda ser la presencia o ausencia de un factor. Una rplica completa
de tal diseo requiere 2 2 2 2 = 2k observaciones y se conoce como un diseo
factorial 2k.
Como cada factor en el experimento tiene 2 niveles, los llamaremos nivel bajo (-) y nivel
alto (+). El diseo ms pequeo en este tipo de experimento es el que tiene k = 2 factores.
Es importante realizar rplicas de cada tratamiento o combinacin en el experimento ya
que esto me permite comparar entre valores (datos obtenidos en los diferentes niveles de
un factor fijando los dems factores) y dentro de valores (datos obtenidos de una misma
combinacin), para entender mejor lo antes establecido vea el ejemplo en l siguiente
figura:
dentro
2
Presin
Rplica:
I
II
B
1
(32.5)
(25.98)
(32)
(29)
entre
Temperatura
+
+
+
+
Combinacin de
Tratamientos
A low, B low
A high, B low
A low, B high
A high, B high
Nomenclatura de
Tratamientos
a0b0 = (1)
a1b0 = a
a0b1 = b
a1b1 = ab
b
(-,+)
B
(-,-)
(1)
(+,-)
a
Ejemplo:
74
5
No tiene una explicacin, por lo tanto, no
se puede decir que significa este intercepto.
y = 50 + 0.1X A + 1X B
3
100
200
Para determinar cual de los dos factores tiene mas peso en el
experimento no puedo fijarme en sus coeficientes, tambin debo ver su
tabulacin ya que el rango de valores de ambos factores es diferente.
Temperatura
De esta forma resulta muy difcil poder llegar a conclusiones asertivas, es por esto que
para este tipo de experimento es necesario codificar las variables. La ecuacin para
codificar las variables (factores) es como sigue:
i
Xi = i
,
rango i
2
Variable Temperatura:
X100 =
100 150
= 1
100
2
X 200 =
200 150
= +1
100
2
Variable Presin:
X3 =
3 4
= 1
2
2
X5 =
54
= +1
2
2
Supongamos que ahora con las variables codificadas la ecuacin resultante del modelo de
regresin es la siguiente:
y = 30 + 0.2X A + 1.3X B
El valor de la constante, 30, es el valor de mi respuesta cuando Xi est en cero (cero es el
centro de mi regin experimental). Ahora tiene una explicacin fsica porque los ceros
estn contenidos.
75
A
1
B
2
8
9
4
3
y=
10
12
14
11
1
8
9
10
12
2
4
3
14
11
b 0
1
1
X=1
1
1
1
1
b1
1
1
+1
+1
b2
1
1
1
1
1
1
+1
+1
+1
+1
+1
+1
b3
+ 1
+ 1
1
1
1
1
+ 1
+ 1
X debe tener una columna por cada coeficiente a estimar y una fila por cada dato en el
experimento.
y = b 0 + b1 X A + b 2 X B + b 3 X A X B +
1
b = (X X ) X Y
76
+ 1 1 1 0
=
1 + 1 1 0
1 + 1 1 0
+ 1 + 1 + 1
+ 1 + 1 + 1
1
1
1
1
1
1
1
1
1 1
1
1 1 + 1 + 1 1 1 + 1 + 1 1
X X =
1 1 1 1 + 1 + 1 + 1 + 1 1
+ 1 + 1 1 1 1 1 + 1 + 1 1
1
0 0 0
8 0 0
0 8 0
0 0 8
(X X )1
1
8
0
=
0
0
0
1
8
0
0
0
1
8
0
0
1
8
8
9
1
1
1
1
1
1
1 4
76
1
1 1 + 1 + 1 1 1 + 1 + 1 3 37 39 = 2
=
(X Y ) =
1 1 1 1 + 1 + 1 + 1 + 1 10 52 24 = 28
+ 1 + 1 1 1 1 1 +! + 1 12 47 29 = 18
14
11
1
8
0
1
b = (X X ) (X Y ) =
0
0
0
1
8
0
0
0
0
1
8
0
0 76 76
8
0 2 2
= 8
0 28 28
8
1 18 18
8
8
76 2
28
18
XA +
XB + XAXB
8 8
8
8
77
Ahora, si A = 1 y B = 1, tenemos:
y=
76 2
28
18
120
(1) + (1) + (1)(1) =
= 15
8 8
8
8
8
78
= corridas
= corridas
ABC
AB BC CD DE
Interaccion _ 2 =
AC BD CE
AD BE
AE
ABCD BCDE
Interaccion _ 4 =
ABCE
ABDE
ACDE
Interaccio n _ 5 = ABCDE
79
bce
abce
bcde
ce
abcde
ace
cde
be
abde
bde
ae
ade
de
E
bc
abc
abcd
bcd
ac
cd
ab
__
acde
abe
acd
abd
bd
B
(1)
A
__
ad
D
+
Algo muy importante que hay que tener en cuenta es que cuando no hay replicas no
tenemos estimado de error. Para esta situacin, Daniels sugiere trazar los estimados de
los efectos en una grafica de probabilidad normal. De esta forma los efectos no
significativos estarn normalmente distribuidos, con promedio cero (0) y varianza 2 y
adems van a estar alineados formando una lnea recta en la grfica. Los factores que
sean significativos van a tener una distribucin con promedio distinto de cero y se
80
d=8
ad = 10
bd = 32
abd = 50
cd = 18
acd = 21
bcd = 44
abcd =61
e=8
ae =12
be = 35
abe =52
ce = 15
ace = 22
bce = 45
abce = 65
de = 6
ade = 10
bde = 30
abde = 53
cde =15
acde = 20
bcde = 41
abcde = 63
81
A
C
90
F actor
A
B
C
D
E
AB
80
Percent
Effect Type
Not Significant
Significant
70
60
50
40
30
N ame
A
B
C
D
E
20
10
5
10
15
20
Effect
25
30
35
En esta grfica podemos notar que los factores significativos para este experimento son
A, B, C y la interaccin AB.
(b) Realice un anlisis de varianza para confirmar sus descubrimientos en la parte (a).
Analysis of Variance for Results (coded units)
Source
Main Effects
2-Way Interactions
3-Way Interactions
4-Way Interactions
5-Way Interactions
Residual Error
Total
DF
5
10
10
5
1
0
31
Seq SS
11087.9
536.3
24.3
15.2
0.3
*
11664.0
Adj SS
11087.9
536.3
24.3
15.2
0.3
*
Adj MS
2217.58
53.63
2.43
3.03
0.28
*
F
*
*
*
*
*
P
*
*
*
*
*
Como podemos apreciar los residuales del error aparecen con un asterisco, esto se debe a
que en un experimento sin rplicas no se puede estimar el error. Tambin podemos notar
que los valores de la distribucin F y el P-value de los efectos y las interacciones, todas
tiene asterisco y es debido a que no se pueden estimar cuando el error es igual a cero (0)
o no se ha podido estimar.
(c) Escriba el modelo de regresin relacionando el rendimiento con las variables
significativas del proceso.
= 30.5313 + 5.9063XA + 16.9687XB + 4.8438XC + 3.9688XAB
82
99
3.0
90
1.5
Residual
Percent
50
-1.5
10
-3.0
1
-4
-2
0
Residual
3.0
4.5
1.5
3.0
15
30
45
Fitted Value
60
6.0
Residual
Frequency
0.0
0.0
-1.5
1.5
-3.0
0.0
-2.4
-1.2
0.0
Residual
1.2
2.4
8 10 12 14 16 18 20 22 24 26 28 30 32
Observation Order
Como podemos ver los residuales estn distribuidos a travs de la lnea de normalidad y
el histograma tiene una forma de campana mostrando que los promedios son iguales a
cero (0)
(e) Grafique los residuales versus el rendimiento predicho y versus cada uno de los
factores. Comente sobre las graficas resultantes.
83
Residuals Versus A
(response is Results)
3
2
Residual
1
0
-1
-2
-3
-1.0
-0.5
0.0
A
0.5
1.0
0.5
1.0
0.5
1.0
Residuals Versus B
(response is Results)
3
2
Residual
1
0
-1
-2
-3
-1.0
-0.5
0.0
B
Residuals Versus C
(response is Results)
3
2
Residual
1
0
-1
-2
-3
-1.0
-0.5
0.0
C
84
Residuals Versus D
(response is Results)
3
2
Residual
1
0
-1
-2
-3
-1.0
-0.5
0.0
D
0.5
1.0
0.5
1.0
Residuals Versus E
(response is Results)
3
2
Residual
1
0
-1
-2
-3
-1.0
-0.5
0.0
E
Como podemos ver en cada una de las graficas resultantes los residuales estn entre los
valores de -1 y +1 indicndonos que nuestro modelo es razonable.
85
-1
-1
-1
1
60
40
A
-1
1
20
60
40
B
20
B
-1
1
60
40
C
20
C
-1
1
60
40
D
20
D
-1
1
(g) Cules son sus recomendaciones con respecto a las condiciones en que opera el
proceso?
Eliminar los factores D y E y realizar ms replicas con los factores que resultaron
significativos para poder tener un anlisis comparativo. Entiendo que si no son
significativos pueden ser eliminados del experimento. Esto se puede probar con la grfica
del main effect.
50
40
Mean of Results
30
20
10
-1
-1
50
-1
40
30
20
10
-1
-1
86
S = 1.70884
Coef
30.531
5.906
16.969
4.844
3.969
SE Coef
0.3021
0.3021
0.3021
0.3021
0.3021
R-Sq = 99.32%
T
101.07
19.55
56.17
16.03
13.14
P
0.000
0.000
0.000
0.000
0.000
R-Sq(adj) = 99.22%
62.25
32.75
52.50
16.00
20.75
1
C
7.25
10.25
-1
-1
-1
A
87
Supongamos que se va a realizar un experimento con dos factores cada uno a dos niveles.
En el siguiente ejemplo vamos a mostrar dos escenarios con dos distintas notaciones
para identificar los tratamientos de este experimento. Si suponemos que un tratamiento
toma cierto nmero de horas lo que resulta en obtener solo dos observaciones cada da,
entonces tenemos que preguntarnos que tratamientos ejecutaremos cada da. Una vez
contestada esta pregunta, dicha contestacin va a determinar la fuente o las fuentes de
variacin que se van a fundir con el efecto bloque.
Ejemplo de Experimento ms pequeo 22:
88
ab
(-,+)
(+,+)
Tenemos 2 Lotes:
Lote 1
Lote 2
(-,-)
(1)
(+,-)
ab
(-,+)
(+,+)
(-,-)
(1)
(+,-)
Escenario 2
Escenario 1
Lote 1
Lote 2
Lote 1
Lote 2
(1)
(1)
ab
ab
Tratamiento
(1)
a
b
ab
Contrastes Ortogonales
A
B
AB
+
+
+
+
+
+
Establecemos un dogma en el que si voy a fundir (o tengo que fundir) algo, o sea, perder
informacin, entonces seleccionamos aquella interaccin que tenga el mayor nmero de
factores contenidos.
En un diseo 23 en bloque, tenemos un experimento con 8 tratamientos y un bloque. En
este experimento, seleccionar los tratamientos que componen las caras del cubo para
fundir un bloque, no son una buena selecciona ya que estara fundiendo los efectos
principales y no cumpliramos con el dogma. Ahora, vamos a ver que sucede al hacer las
siguientes selecciones:
1)
ab
c
c
Tratamientos
AB
(1)
Ab
Abc
ab
(1)
Al seleccionar estos tratamientos para el bloque podemos ve que se construye una cara
que me divide la cara de A con B. Tambin cmo podemos apreciar los signos de ambos
factores son exactamente igual indicando que hay una relacin y que el lote esta fundido
con AB. Por lo tanto, esta no es una buena seleccin.
90
2)
a
b
ac
Tratamiento
AC
(1)
Ac
Abc
(1)
En este caso podemos apreciar que la seleccin de estos tratamientos me forman una cara
que me divide las caras de A y de C, por lo tanto el lote esta fundido con AC. Nos
podemos dar cuenta de esto por los signos de los factores indicando que entre ellos hay
relacin.
3)
a
Tratamiento A
b
a
ABC
Abc
Para este caso podemos notar que se forman dos lneas que cruzan la cara de A y B pero
en diferentes direcciones de C. De esta forma no se generan nuevas caras y tampoco se
funden los efectos principales, lo que lo hace factibles. Adems, podemos ver que se
91
bc
abcd
ac
cd
ab
bd
B
(1)
ad
D
Como podemos apreciar, los tratamientos del primer cuadrado son la interaccin ABC y
el segundo cuadrado son la interaccin ABC rotando en el factor D. Si nos fijamos en la
tabla podemos notar que los signos de D y de la interaccin ABC son iguales indicando
que hay una relacin entre ellos.
92
ABC
bd
ad
cd
abcd
(1)
ab
bc
ac
Lote 1
Lote 2
En experimentos 2k todas las fuentes, tanto efectos principales como las interacciones,
tienen un (1) grado de libertad, excepto el error. Si una fuente a bloquearse tiene 2
niveles, fundimos una fuente para contabilizar por ese grado de libertad.
Generalizando Factorial 2k en 2p bloques donde 2p bloques es el nmero de niveles. En un
factorial 24 en bloque tengo 4 niveles, el nmero de niveles podra ser, por ejemplo, el
nmero de lotes. En este experimento tengo 16 tratamientos y 3 grados de libertad, lo que
implica que de todas las fuentes que me pueden interesar, 3 de ellas se van a fundir.
Ahora, Cules tres? Aqu es donde est el reto.
Veamos un ejemplo de un factorial 24 con 16 tratamientos y 4 niveles. Se seleccionan 4
tratamientos de los cuales se deben encontrar los 3 efectos a ser fundidos.
93
abc
bcd
B
A
(1)
ad
D
Los efectos de este experimento por nmero de factores contenidos son:
A
B
C
D
4
AB
ABC
ABD
ACD
BCD
4
BC
AC BD
AD CD
6
ABCD
1
De estos 15 efectos, 3 deben tener el mismo signo en cada tratamiento, ya sea positivo (+)
o negativo (-). Tabulando tenemos los siguientes resultados:
Tratamientos
BC
ACD
ABD
(1)
Abc
Bcd
Ad
Las preguntas claves son: 1) Cmo conseguimos los efectos a ser fundidos?, 2) Qu
pas con el dogma?
94
Ilustrando como conseguimos los efectos en este ejemplo, para el primer efecto
proyectamos el factor de A de su nivel alto a su nivel bajo quedndonos los 4
tratamientos fundidos en la interaccin BC como se muestra a continuacin.
abc
bcd
B
(1)
ad
D
abc
bcd
B
(1)
ad
95
abc
B
A
(1)
ad
D
abc
bcd
B
(1)
ad
D
Por ltimo, vamos a buscar la interaccin ABD proyectando los puntos seleccionados
originalmente sobre el factor C. Esto se obtiene como sigue:
96
bcd
B
A
(1)
ad
D
abc
abc
bcd
B
(1)
ad
D
Como ya sabemos este es un experimento 24 en bloques de 2p donde 2p es igual a 4, lo
que implica que p=2. La variable p es el nmero de efectos fundidos o generadores
independientes, o sea, en este experimento tenemos 2 generadores independientes.
Sabemos que este experimento al ser de 4 niveles tiene 3 grados de libertad lo que
implica que se tienen que fundir 3 efectos. Como podemos encontrar dos generadores
independientes, el tercer factor se puede determinar en base de los dos generadores
97
g 3 = g 1g 2 = ( ABCD)( ABC) = A 0 B 0 C 0 D = D
Como podemos ver no es una buena seleccin ya que funde uno de los efectos
principales. Ahora si en vez de tomar un efecto que contiene 3 factores, tomamos uno que
contenga solo dos factores y mantenemos el efecto ABCD, el tercer generador sera:
g 3 = g 1g 2 = (ABCD)(AB) = A 2 B 2 CD = A 0 B 0 CD = CD
Podemos notar que se funden dos efectos que contienen solo 2 factores, a diferencia de
los efectos encontrados originalmente que dos de ellos contenan 3 factores y uno dos
factores. Es por esto que fundir el efecto que ms factores tiene a veces puede ser
inapropiado ya que funde ms efectos con menos factores contenidos.
Otro mtodo de construir los bloques es el mtodo de combinacin lineal que utiliza la
ecuacin:
L = 1 x 1 + 2 x 2 + + k x k
98
L1 = 1X 1 + 0X 2 + 1X 3 + 1X 4 = X 1 + X 3 + X 4
Hay que ir sobre los 16 tratamientos determinando que tratamientos van en que bloque.
Hay que recordar que los nmeros pares resultantes equivalen a 0 y los nmeros impares
equivalen a 1. Examinando los tratamientos tenemos:
(1) = 0 + 0 + 0 = 0
a = 1+ 0 + 0 = 1
b = 0+0+0 = 0
c = 0 +1+ 0 = 1
d = 0 + 0 +1 = 1
ab = 1 + 0 + 0 = 1
ac = 1 + 1 + 0 = 2 = 0
bc = 0 + 1 + 0 = 1
ad = 1 + 0 + 1 = 2 = 0
bd = 0 + 0 + 1 = 1
cd = 0 + 1 + 1 = 2 = 0
abc = 1 + 0 + 1 = 2 = 0
acd = 1 + 1 + 1 = 3 = 1
bcd = 0 + 1 + 1 = 2 = 0
abd = 1 + 0 + 1 = 2 = 0
abcd = 1 + 1 + 1 = 3 = 1
Me dividi los 16 tratamientos en 2 partes, los que son 0 y los que son 1. Ahora
evaluamos para el generador 2, BC, y tenemos:
L = X 2 + X3
Los tratamientos quedaran como sigue:
(1) = 0
a=0
b =1
c =1
d=0
ab = 1
ac = 1
ad = 0
bc = 2 = 0
bd = 1
cd = 1
abc = 2 = 0
abd = 1
acd = 1
bcd = 2 = 0
abcd = 2 = 0
Ahora para determinar cmo formar los bloques consideramos la siguiente figura:
99
g1
g2
1 0
Ahora podemos agrupar los tratamientos en los diferentes bloques usando estas
combinaciones lineales para estos dos generadores utilizados, por lo tanto, los bloques
resultaran de la siguiente manera:
L1 = 0
L2 = 0
(1)
ad
bcd
abc
L1 = 0
L2 = 1
b
ac
cd
abd
L1 = 1
L2 = 0
D
A
Bc
Abcd
L1 = 1
L2 = 0
c
adc
bd
ab
100
bc
ac
abd
B
d
D
Determinamos los generadores proyectando. Si proyectamos en D tenemos lo siguiente:
ac
abd
B
d
101
ac
abd
B
d
D
El generador resultante es el siguiente:
Tratamiento
ABC
Bc
Ac
Abd
102
ac
abd
B
d
ac
abd
B
d
103
ABD
Bc
Ac
Abd
(1)
ab
bcd
acd
(1)
*c
(1)
*b
ab
*c
ab
*b
bcd
*c
Cd
bcd
*b
cd
acd
*c
abcd
acd
*b
abcd
Una sugerencia, para concluir con los diseos de experimentos factoriales 2k en bloques
cuando se realizan rplicas, es que podemos fundir cada rplica con una fuente distinta.
Esta tcnica se le conoce como la Fundicin Parcial de Rplicas y se vera representado
como se muestra a continuacin:
104
Rplica I
Rplica II
(1)
(1)
ab
Ab
ac
Ac
bc
abc
Bc
abc
Bloque y/o AB
d=8
ad=10
bd=32
abd=50
cd=18
acd=21
bcd=44
abcd=61
e=8
ae=12
be=35
abe=52
ce=15
ace=22
bce=45
abce=65
de=6
ade=10
bde=30
abde=53
cde=15
acde=20
bcde=41
abcde=63
5
32
4
Base Design:
Replicates:
Center pts (total):
5, 32
1
0
IV
105
Effect
11.8125
33.9375
9.6875
-0.8125
0.4375
7.9375
0.4375
-0.0625
0.9375
0.0625
-0.6875
0.5625
0.8125
0.3125
-1.1875
-0.4375
0.3125
-0.4375
0.3125
0.8125
0.9375
0.1875
-0.8125
-0.0625
0.1875
0.9375
-0.9375
-0.1875
Coef
30.5313
-0.1562
-0.2813
0.4687
5.9062
16.9687
4.8438
-0.4062
0.2188
3.9688
0.2187
-0.0313
0.4688
0.0312
-0.3438
0.2813
0.4063
0.1563
-0.5938
-0.2188
0.1563
-0.2188
0.1562
0.4062
0.4688
0.0938
-0.4062
-0.0312
0.0937
0.4687
-0.4687
-0.0937
S = *
Analysis of Variance for Results (coded units)
Source
Blocks
Main Effects
2-Way Interactions
3-Way Interactions
4-Way Interactions
5-Way Interactions
Residual Error
Total
DF
3
5
10
8
4
1
0
31
Seq SS
2.6
11087.9
536.3
22.5
14.4
0.3
*
11664.0
Adj SS
2.6
11087.9
536.3
22.5
14.4
0.3
*
Adj MS
0.86
2217.58
53.63
2.81
3.59
0.28
*
F
*
*
*
*
*
*
P
*
*
*
*
*
*
Del Anova se puede observar que los efectos ms relevantes son para los factores A, B, C
y la interaccin AB. Con el fin de comprobar, se realiza entonces el siguiente grafico que
nos muestra los efectos principales en el experimento:
106
A
C
90
F actor
A
B
C
D
E
AB
80
Percent
Effect Type
Not Significant
Significant
70
60
50
40
N ame
A
B
C
D
E
30
20
10
5
10
15
20
Effect
25
30
35
Effect
11.8125
33.9375
9.6875
7.9375
S = 1.78244
Coef
30.5313
-0.1562
-0.2813
0.4687
5.9062
16.9687
4.8438
3.9688
R-Sq = 99.35%
SE Coef
0.3151
0.5458
0.5458
0.5458
0.3151
0.3151
0.3151
0.3151
T
96.90
-0.29
-0.52
0.86
18.74
53.85
15.37
12.60
P
0.000
0.777
0.611
0.399
0.000
0.000
0.000
0.000
R-Sq(adj) = 99.16%
DF
3
3
1
24
31
Seq SS
2.6
11081.1
504.0
76.3
11664.0
Adj SS
2.6
11081.1
504.0
76.3
Adj MS
0.86
3693.70
504.03
3.18
F
0.27
1162.61
158.65
P
0.845
0.000
0.000
107
90
Percent
99
50
10
1
-2
-1
0
1
Standardized Residual
2
1
0
-1
-2
Frequency
30
45
Fitted Value
60
8
6
4
2
0
-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5
Standardized Residual
15
2.0
2
1
0
-1
-2
2
8 10 12 14 16 18 20 22 24 26 28 30 32
Observation Order
62.25
32.75
52.50
16.00
20.75
1
C
7.25
10.25
-1
-1
-1
A
108
50
40
Mean of Results
30
20
10
-1
-1
50
40
30
20
10
-1
109
1. Experimentos Fraccionarios 2k
A medida que el nmero de factores en un diseo 2k se incrementa, el nmero de
tratamientos que se deben realizar aumenta rpidamente. Si se tiene un experimento con 5
factores sera un diseo 25 con un total de 32 tratamientos requeridos. Este diseo tiene 5
grados de libertad de los efectos principales y 10 grados de libertad debido a las
interacciones. Debido a que a veces es difcil llevar a cabo todos los tratamientos se
puede presumir que no todas las interacciones son significativas, por lo tanto, se puede
realizar una fraccin de los tratamientos. A esto se le conoce como Experimentos
Fraccionarios 2k, donde fraccionarios viene de la porcin que representa el nmero de
tratamientos que se van a llevar a cabo de todos los tratamientos posibles.
Los Experimentos Fraccionarios 2k estn basados en un dogma estadstico que se
desglosa en los siguientes preceptos:
110
Tratamientos seleccionados:
(a)
(b)
(c)
(abc)
B
A
Realizando la tabla de signos tenemos:
Tratamientos
a
b
c
abc
A
+
+
B
+
+
C
+
+
AB
+
+
AC
+
+
BC
+
+
ABC
+
+
+
+
B = AC
C = AB
Del ejemplo anterior tenemos que el generador es ABC, tambin conocido como
generador identidad. Si multiplicamos el generador por los efectos principales obtenemos
los aliases de los mismos:
A( ABC ) = A 2 BC = BC
A = BC
B( ABC ) = AB 2 C = AC
B = AC
C ( ABC ) = ABC 2 = AB
C = AB
La fraccin que contiene el lado positivo es conocida como la fraccin principal.
Aunque hubisemos seleccionado los otro cuatro tratamientos que componen un
experimento 23, o sea, el otro lado de la fraccin, la estructura de aliases hubiese sido la
misma ya que ambas fracciones pertenecen a la misma familia. Este experimento es
pobre ya que los aliases son los efectos que contienen pocos factores no cumpliendo as
con el dogma de fundir aquellos tratamientos que ms efectos contenga.
113
1
tambin conocido como un diseo factorial fraccionado 2 k p . Por
p
2
1
1
1
se conoce como 2k-2, para se conoce como 2 k 3 , para
se
4
8
16
conoce como 2k-4, y as sucesivamente. Mientras mas pequea es la fraccin mas aliases
va a tener el factor principal.
Si realizamos un experimento de 25 en 2p bloques donde p = 2, entonces tenemos un
experimento con fraccin
1
32
de un 2 5 =
= 8 tratamientos. Tambin se conoce como un
4
4
114
B
A
Para obtener los generadores vamos a aplicar las tcnicas utilizadas en la seccin de
Diseo Factorial 2k con bloques. Para este ejemplo, comenzamos proyectando el factor C
de su nivel bajo a su nivel alto fundiendo los tratamientos en la interaccin ABDE como
se muestra en la siguiente figura:
115
B
A
Una vez hallamos realizado las proyecciones podemos determinar el generador viendo
cuales factores varan en el sistema.
B
116
A
D
B
A
Una vez se haya proyectado, determinamos la interaccin que viene a ser el generador.
117
B
A
Para determinar el tercer generador podemos aplicar la tcnica de multiplicar los dos
generadores ya encontrados y as obtenemos el tercer generador. Haciendo esto tenernos:
G1 G2 = G3
ABDE * BCE = AB 2 CDE 2 = ACD
El tercer generador encontrado es ACD. Para comprobar que los generadores obtenidos
son correctos y vlidos procedemos a realizar la tabulacin de los tratamientos y los
factores usando los signos para definir que factores estn contenidos en el tratamiento
seleccionado.
118
Tratamientos
ABDE
BCE
ACD
(1)
abc
bcd
ad
be
ace
abde
cde
+
+
+
+
-
+
+
+
+
-
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
Las tres fuentes sacrificados son los tres generadores encontrados: ABDE, BCE y ACD.
Para determinar los alias de los factores principales en este experimento, los obtenemos
multiplicando los factores principales por cada uno de los generadores. Tomando como
ejemplo el factor A realizamos las diferentes multiplicaciones y obtenemos lo siguiente:
A(BCE ) = ABCE
A( ABDE ) = BDE
A( ACD ) = CD
A = ABCE = BDE = CD
Si hacemos eso mismo para cada uno de los factores, los diferentes aliases obtenidos para
cada factor son los siguientes:
B = CE = ADE = ABCD
C = BE = ABCDE = AD
D = BCDE = ABE = AC
E = BC = ABD = ACDE
BC
BE
CD
CE
119
AB(ABDE ) = A 2 B 2 DE = DE
AB = ACE = DE = BCD
Ahora tenemos 27 fuentes de las 31 fuentes que componen este experimento. Aadimos
las interacciones de dos factores que se encontraron y procedemos a buscar aquellas
interacciones de dos factores que an no se han contemplado. Por lo tanto, las nuevas
interacciones de dos factores son: AB y DE. Podemos notar que la interaccin AE no est
contemplada an, por lo tanto, procedemos a buscar sus aliases como los hicimos
anteriormente.
AE(BCE ) = ABCE 2 = ABC
AE(ABDE) = A 2 BDE 2 = BD
AE(ACD) = A 2 CDE = CDE
AE = ABC = BD = CDE
Como podemos notar ya encontramos las 31 fuentes que componen este experimento,
determinando as todos los aliases que se muestran a continuacin en resumen:
120
d=6.79
ade= 5.47
bde= 3.45
abd=5.68
cde= 5.22
acd=4.38
bcd=4.30
abcde= 4.05
Para generar la fraccin de los efectos que componen este experimento en Minitab
seleccionamos la opcin de STAT, de forma subsiguiente seleccione DOE luego
121
122
123
Como parte de la informacin que podemos obtener al generar este diseo es la estructura
de aliases que es la siguiente:
Alias Structure
I + ABCDE
A + BCDE
B + ACDE
C + ABDE
D + ABCE
E + ABCD
AB + CDE
AC + BDE
AD + BCE
AE + BCD
BC + ADE
BD + ACE
BE + ACD
CD + ABE
CE + ABD
DE + ABC
124
125
95
90
F actor
A
B
C
D
E
Percent
80
70
60
50
40
30
N ame
A
B
C
D
E
20
10
5
-2
-1
Effect
Lenth's PSE = 0.76125
126
Effect
1.3100
-1.3400
-0.1475
4.4200
-0.8275
1.2750
-0.7875
-1.3550
0.3025
0.1675
0.2450
0.2875
-0.7125
-0.2400
0.0875
Coef
2.7075
0.6550
-0.6700
-0.0738
2.2100
-0.4138
0.6375
-0.3937
-0.6775
0.1513
0.0838
0.1225
0.1437
-0.3562
-0.1200
0.0437
S = *
DF
5
10
0
15
Seq SS
95.02
19.67
*
114.69
Adj SS
95.02
19.67
*
Adj MS
19.004
1.967
*
F
*
*
P
*
*
127
Seleccionamos solo los factores principales y las interacciones que contienen al factor
D y seleccionamos OK. Los resultados obtenidos son los siguientes:
Factorial Fit: Resultados versus A, B, C, D, E
Estimated Effects and Coefficients for Resultados (coded units)
Term
Constant
A
B
C
D
E
A*B
A*D
B*D
C*D
D*E
Effect
1.3100
-1.3400
-0.1475
4.4200
-0.8275
1.2750
-1.3550
0.2450
-0.7125
0.0875
S = 0.839035
Coef
2.7075
0.6550
-0.6700
-0.0738
2.2100
-0.4138
0.6375
-0.6775
0.1225
-0.3563
0.0438
SE Coef
0.2098
0.2098
0.2098
0.2098
0.2098
0.2098
0.2098
0.2098
0.2098
0.2098
0.2098
R-Sq = 96.93%
T
12.91
3.12
-3.19
-0.35
10.54
-1.97
3.04
-3.23
0.58
-1.70
0.21
P
0.000
0.026
0.024
0.739
0.000
0.106
0.029
0.023
0.585
0.150
0.843
R-Sq(adj) = 90.79%
128
Source
Main Effects
2-Way Interactions
Residual Error
Total
DF
5
5
5
15
Seq SS
95.018
16.148
3.520
114.686
Adj SS
95.018
16.148
3.520
Adj MS
19.0037
3.2296
0.7040
F
26.99
4.59
P
0.001
0.060
95
F actor
A
B
C
D
E
90
A
Percent
80
AB
70
Effect Ty pe
Not Significant
Significant
60
50
40
N ame
A
B
C
D
E
30
20
10
AD
-5.0
-2.5
0.0
2.5
5.0
Standardized Effect
7.5
10.0
129
99
0.6
Residual
Percent
90
50
0.3
0.0
-0.3
10
-0.6
1
-1.0
-0.5
0.0
Residual
0.5
1.0
-2
2
4
Fitted Value
Residual
Frequency
0.6
3
2
0.3
0.0
-0.3
-0.6
0
-0.6 -0.4 -0.2
0.0 0.2
Residual
0.4
0.6
0.8
3 4
5 6
9 10 11 12 13 14 15 16
Observation Order
130
131
Como podemos notar el software genera 3 factores A, B, C, pero debemos tener cuidado
ya que el factor C generado corresponde al factor D en el experimento que fue uno de los
factores significativos. Se hace el cambio en el nombre para evitar confusiones al entrar
la data. El total de tratamientos generados son 8 pero duplicados ya que tenemos dos
rplicas. Para determinar que tratamientos son replicas de otros tratamientos procedemos
a eliminar aquellos factores que no salieron significativos de utilizando el mtodo de
cubos. Primero procedemos a identificar todos los tratamientos del experimento original
2^(5-1) de la siguiente manera:
132
bce
abcde
ace
cde
abe
bde
e
ade
E
abc
bcd
acd
__
abd
A
__
D
+
133
E
C
ab
__
abd
bd
B
(1)
A
__
ad
D
+
Para obtener las replicas lo que se hace es eliminar factores uniendo caras, para poder
identificar como se van obteniendo las replicas del problema usando los datos obtenidos
de los tratamientos del experimento original vamos a unir los dos bloques en donde los
tratamientos color azul son los tratamientos actuales y los rojos van a ser las replicas de
los mismos. Los datos obtenidos son para los tratamientos de rojo. Uniendo ambos
bloques tenemos:
134
bce
abcde
ace
cde
abe
bde
e
ade
E
abc
acd
ab
__
bcd
abd
bd
B
(1)
ad
__
ace
cde
abe
bde
e
ade
E
abc
acd
ab
__
bcd
abd
bd
B
(1)
A
__
ad
D
+
135
abc
c
abcde
bcd
ace
cde
ab = abe
acd
abd
bd=bde
B
(1)=e
a
ad=ade
__
Nos resta eliminar el otro factor no significativo que fue el factor C y esto lo hacemos de
la siguiente manera:
bce
abc
c
abcde
bcd
ace
cde
ab = abe
acd
abd
bd=bde
B
(1)=e
__
ad=ade
D
+
Resultando en:
b=bce
ab = abe=abc
bd=bde=bcd
a=ace
d=cde
abd=abcde
B
(1)=e=c
__
ad=ade=acd
D
+
136
Replica 1
ADE
D
A
ABC
BCD
B
ABD
E
Replica 2
ACD
CDE
ACE
ABE
BDE
BCE
ABCDE
C
Effect
1.3437
-1.3063
4.3863
1.3087
-1.3888
0.2112
-0.2737
S = 1.00873
Coef
2.7244
0.6719
-0.6531
2.1931
0.6544
-0.6944
0.1056
-0.1369
R-Sq = 92.87%
SE Coef
0.2522
0.2522
0.2522
0.2522
0.2522
0.2522
0.2522
0.2522
T
10.80
2.66
-2.59
8.70
2.59
-2.75
0.42
-0.54
P
0.000
0.029
0.032
0.000
0.032
0.025
0.686
0.602
R-Sq(adj) = 86.63%
DF
3
3
1
8
8
15
Seq SS
91.005
14.744
0.300
8.140
8.140
114.189
Adj SS
91.0046
14.7443
0.2998
8.1403
8.1404
Adj MS
30.3349
4.9148
0.2998
1.0175
1.0175
F
29.81
4.83
0.29
P
0.000
0.033
0.602
137
95
80
Percent
F actor
A
B
C
90
A
70
N ame
A
B
D
AB
60
50
40
30
B
20
10
AC
-4
-2
2
4
Standardized Effect
10
**Recuerde que aqu el efecto C corresponde al factor significativo D, por lo tanto, C=D
y AC=AD.
138
99
1
Residual
Percent
90
50
10
-1
1
-2
-1
0
Residual
-2
2
Fitted Value
4
Residual
Frequency
1
3
2
1
-1
0
-1.5
-1.0
-0.5 0.0
0.5
Residual
1.0
1.5
9 10 11 12 13 14 15 16
Observation Order
ad=16.9
cd=23.8
bde=16.8
ab=15.5
bc=16.2
ace=23.4
abcde=18.1
(a) Verifique que los generadores del diseo utilizados son I=ACE and I=BDE.
Este ejercicio se corre casi exactamente igual al anterior utilizando Stat, selecciona DOE,
Factorial y luego Create a Factorial Design. La diferencia es que en vez de dejar que el
software genere los generadores del experimento, los mismos se van a ingresar ya que
son conocidos. Los pasos seran:
139
Una vez en esta opcin seleccionamos la opcin de Generators, para ingresar los
generadores dados.
140
5
8
1
Base Design:
Replicates:
Center pts (total):
5, 8
1
0
Resolution:
Fraction:
III
1/4
Por lo tanto, debo rehacer mi diseo para incluir los generadores deseados.
Fractional Factorial Design
Factors:
Runs:
Blocks:
5
8
1
Base Design:
Replicates:
Center pts (total):
3, 8
1
0
Resolution:
Fraction:
III
1/4
141
Effect
-1.525
-5.175
2.275
-0.675
2.275
1.825
-1.275
Coef
19.238
-0.763
-2.588
1.138
-0.337
1.138
0.913
-0.637
Effect
-1.525
-5.175
2.275
-0.675
2.275
S = 2.22626
Coef
19.238
-0.763
-2.588
1.138
-0.337
1.137
SE Coef
0.7871
0.7871
0.7871
0.7871
0.7871
0.7871
R-Sq = 88.95%
T
24.44
-0.97
-3.29
1.45
-0.43
1.45
P
0.002
0.435
0.081
0.285
0.710
0.285
R-Sq(adj) = 61.34%
DF
5
2
7
Seq SS
79.826
9.913
89.739
Adj SS
79.826
9.913
Adj MS
15.965
4.956
F
3.22
P
0.254
142
90
Residual
Percent
50
0
-1
10
-2
1
-3.0
-1.5
0.0
Residual
1.5
3.0
15.0
22.5
25.0
2.0
1.5
Residual
Frequency
17.5
20.0
Fitted Value
1.0
0
-1
0.5
-2
0.0
-1.5
-1.0
-0.5
0.0
0.5
Residual
1.0
1.5
3
4
5
6
Observation Order
143
Donde:
y 2 = 2 + 2 + 2 + 2
II
Donde:
H1 : 2 0
H0 : 2 = 0
H1 : 2 0
H 0 : 2 = 0
H1 : 2 0
La aspiracin mxima del experimento es que toda la variabilidad se deba a las piezas de manera
que se pueda concluir que el instrumento es capaz de distinguir entre diferentes niveles de
productos.
La calibracin de un instrumento est asociada a la exactitud, la precisin est asociada al
experimento Gauge R & R. A continuacin se ilustran los conceptos de precisin y exactitud:
145
146
147
RunOrder
PtType
Blocks
74
Piezas
50
Personas
2
22
100
31
100
40
71
100
55
20
69
50
11
100
28
10
10
98
11
10
95
12
20
21
13
100
20
14
57
15
10
66
16
20
17
10
18
100
32
19
100
61
20
100
44
21
50
63
22
50
16
23
20
18
24
10
12
25
100
81
26
100
86
27
20
91
28
100
51
29
100
70
30
87
31
10
Medidas de la Balanza
50.01
99.99
99.99
5.00
99.99
19.99
5.00
5.00
99.99
10.00
10.00
20.00
99.99
5.00
9.99
20.00
10.00
99.99
99.99
99.99
50.01
50.01
20.00
10.00
99.99
99.99
20.00
99.99
99.99
5.00
10.00
148
32
82
33
100
43
34
50
60
35
97
36
10
37
50
52
38
100
76
39
20
56
40
20
30
41
42
80
43
100
44
73
45
50
37
46
10
23
47
50
64
48
50
19
49
68
50
10
90
51
94
52
50
25
53
20
26
54
20
83
55
50
29
56
48
57
10
58
10
15
59
20
72
60
100
27
61
10
47
62
10
63
50
17
64
10
67
65
10
39
66
45
67
20
68
20
93
69
50
10
70
33
71
50
14
72
50
5.00
99.99
50.01
5.00
10.00
50.01
100.00
20.00
20.01
5.00
5.00
5.00
5.00
50.00
10.00
50.01
50.01
5.00
10.00
5.00
50.01
20.00
20.00
50.01
5.00
10.00
10.00
20.01
99.99
10.00
10.00
50.01
9.99
10.00
5.00
20.01
20.01
50.01
5.01
50.01
50.00
149
73
20
89
74
75
100
79
76
42
77
100
41
78
100
24
79
50
53
80
50
77
81
10
84
82
50
99
83
46
84
20
85
20
36
86
20
88
87
10
34
88
50
13
89
50
38
90
10
35
91
20
54
92
50
92
93
100
78
94
10
85
95
20
75
96
20
65
97
20
62
98
100
59
99
58
100
10
20.00
5.00
99.99
5.00
99.99
99.99
50.01
50.01
10.00
50.01
5.00
20.00
20.01
20.01
10.00
50.01
50.01
10.00
20.01
50.01
99.99
10.00
20.01
20.01
20.01
99.99
5.00
10.00
4. Luego para realizar el anlisis de los datos se ingresa al men de stat, quality tools, gauge
study y luego se hace click en Gauge R & R study (crossed) como muestra la figura:
150
5. Al hacer click se despliega una pantalla donde en la primera casilla se ingresa la columna
correspondiente a las piezas, en la segunda (operators) se ingresa la columna
correspondiente a las personas que van a realizar el experimento, finalmente en la casilla
de measurement data se ingresa la columna correspondiente a las respuestas (medidas de
la balanza). Se hace click en la opcin de anova para hacer el anlisis de varianza.
151
DF
4
1
4
90
99
SS
123578
0
0
0
123578
MS
30894.5
0.0
0.0
0.0
F
1669974646
0
1
P
0.000
0.828
0.233
Gage R&R
Source
Total Gage R&R
Repeatability
Reproducibility
Personas
Personas*Piezas
Part-To-Part
Total Variation
VarComp
0.00
0.00
0.00
0.00
0.00
1544.73
1544.73
%Contribution
(of VarComp)
0.00
0.00
0.00
0.00
0.00
100.00
100.00
Se observa un valor P de 0 para las piezas, 0.828 para los operarios y de 0.233 para la interaccin
pesos-operarios. Estos valores permiten concluir que la hiptesis nula para las piezas se rechaza,
es decir, la variabilidad del experimento se debe a la diferencia entre las piezas y la balanza
entonces, tiene la capacidad de diferenciar entre varios tipos de piezas, alcanzando as el
propsito del experimento, es decir que la balanza puede ser utilizada para medir objetos en un
rango de 5 a 100 gramos con precisin. Los valores de P para los operarios y la interaccin entre
pesos y operarios muestran que estos no aportan una variacin significativa al experimento.
En la figura se observa tambin la contribucin de variacin de cada uno de los componentes y
se ratifica que la variacin total se debe a las piezas.
Lo anterior muestra que la balanza es precisa. El experimentador observ que la calibracin de la
misma se hace manualmente, la balanza tiene en una esquina un dispositivo con una burbuja de
aire que debe ser puesta en la mitad del crculo para asegurar la calibracin.
152
153
154
155
156
157
Ejemplo 1 (Tomado del libro Design and analysis of Experiments, de Douglas C. Montgomery, 6
edicin, pgina 523)
Considere un experimento factorial con cuatro factores, donde el factor A tiene a niveles, el
factor B tiene b niveles, el factor C tiene c niveles, el factor D tiene d niveles y hay n replicas.
Escriba las sumas de cuadrados, los grados de libertad y las medias cuadradas esperadas para los
siguientes casos:
a) A, B, C, y D son factores fijos.
b) A, B, C, y D son factores aleatorios.
c) A es fijo y B, C, y D son aleatorios.
La suma de cuadrados y los grados de libertad son iguales para las partes a, b y c
158
Suma de cuadrados
SSA
SSB
SSC
SSD
SSAB
SSAC
SSAD
SSBC
SSBD
SSCD
SSABC
SSABD
SSACD
SSBCD
SSABCD
Factores
i
j
k
l
()ij
()ik
()il
()jk
()jl
()kl
()ijk
()ijl
()ikl
()jkl
()ijkl
(ijkl)m
F
a
i
0
a
a
a
0
0
0
a
a
a
0
0
0
a
0
1
F
b
j
B
0
B
B
0
B
B
0
0
B
0
0
B
0
0
1
F
c
k
c
c
0
c
c
0
c
0
c
0
0
c
0
0
0
1
F
d
l
d
d
d
0
d
d
0
d
0
0
d
0
0
0
0
1
Grados de libertad
a-1
b-1
c-1
d-1
(a-1)(b-1)
(a-1)(c-1)
(a-1)(d-1)
(b-1)(c-1)
(b-1)(d-1)
(c-1)(d-1)
(a-1)(b-1)(c-1)
(a-1)(b-1)(d-1)
(a-1)(c-1)(d-1)
(b-1)(c-1)(d-1)
(a-1)(b-1)(c-1)(d-1)
Componente de
varianza para el
factor fijo i
R
EMS
e
m
n
2 + [bcdn 2i] / (a-1)
n
2 + [acdn 2j] / (b-1)
n
2 + [abdn 2k] / (c-1)
n
2 + [abcn 2l] / (d-1)
2
n
+ [cdn ()2ij] / (a-1) (b-1)
n
2 + [bdn ()2ik] / (a-1) (c-1)
n
2 + [bcn ()2il] / (a-1) (d-1)
n
2 + [adn ()2jk] / (b-1) (c-1)
n
2 + [acn ()2jl] / (b-1) (d-1)
n
2 + [abn ()2jl] / (c-1) (d-1)
2
n
+ [dn ()2 ijl] / (a-1) (b-1) (c-1)
n
2 + [dn ()2 ijl] / (a-1) (b-1) (d-1)
n
2 + [dn ()2 ikl] / (a-1) (c-1) (d-1)
n
2 + [dn ()2 jkl] / (b-1) (c-1) (d-1)
n 2 + [dn ()2 ijkl] / (a-1) (b-1) (c-1) (d-1)
1
2
159
R
a
i
1
R
b
j
b
R
c
k
c
R R
d e
l m
D n
()ij
()ik
()il
()jk
()jl
()kl
()ijk
()ijl
()ikl
()jkl
()ijkl
(ijkl)m
EMS
F
a
i
0
R
b
j
b
j
k
l
()ij
()ik
()il
()jk
()jl
()kl
()ijk
()ijl
()ikl
()jkl
a
a
a
0
0
0
a
a
a
0
0
0
a
1
b
b
1
b
b
1
1
b
1
1
b
1
EMS
R R R
c d e
k l m
c d n 2+n2 +bn2 +cn2 +dn2 +bcn2 +bdn2 +cdn2
+(bcdn2i)/(a-1)
c d n 2 + an2 + acn2 + adn2 + abdn2
1 d n 2 + an2 + abn2 + adn2 + abdn2
c 1 n 2 + an2 + abn2 + acn2 + abcn2
c d n 2 + n2 + cn2 + dn2 + cdn2
1 d n 2 + n2 + bn2 + dn2 + bdn2
c 1 n 2 + n2 + bn2 + cn2 + bcn2
1 d n 2 + an2 + adn2
c 1 n 2 + an2 + acn2
1 1 n 2 + an2 + abn2
1 d n 2 + n2 + dn2
c 1 n 2 + n2 + cn2
1 1 n 2 + n2 + bn2
1 1 n 2 + an2
160
0
0
1
1
1
1
1
1
n 2 + n2
1 2
161
En la figura se observa entonces un experimento anidado de dos niveles, esto porque los
dispensadores componen un nivel del nested que estn anidados en las bombas (que componen
un segundo nivel) y ellas a su vez anidadas en la mquina.. All se observa la teora descrita ya
que las bombas son componentes similares pero no iguales porque cada una de ellas tiene un
funcionamiento independiente,
independiente y, de la misma manera, los dispensadores son un factor con
componentes similares pero no idnticos; por este motivo si lo que se desea es analizar una
respuesta con respecto a los factores bomba y dispensador, se debe hacer entonces un
experimento anidado o jerrquico.
El modelo que describe estos experimentos es:
161
= media _ general
M i = Maquina
B j ( i ) = Bomba
Dk ( ij ) = Dispensador
( ijk ) l = error
i: corresponde al suscrito para la mquina que en el ejemplo corresponde a 1, si tuviera mas
maquinas correspondera a 1a
j(i): corresponde al suscrito de las bombas que en el ejemplo corresponde a j = 1, 2, 3 anidadas
en i = 1 mquina. Si tuviera ms bombas el suscrito seria j = 1b
k(ij): corresponde al suscrito de los dispensadores k = 1,2 anidados en las bombas j y las
mquinas i. Si tuviera ms dispensadores k = 1c
(ijk)l: corresponde al termino del error
Para realizar el experimento descrito anteriormente como uno tipo factorial, tendran que
cambiarse los dispensadores para las bombas cada vez que se haga una corrida, de manera que
los dispensadores fueran los mismos dos para las 3 bombas. Esto resulta intil ya que este tipo de
maquinas requieren un arreglo como el que se describi anteriormente. De esta manera por ser
ste un experimento anidado, no hay interacciones presentes entre los factores.
Suponiendo que adicional a la mquina presentada en la figura, se tiene otra ms, la tabla de
anlisis de varianza para las dos maquinas, con 3 bombas cada una y cada bomba con dos
dispensadores es:
162
Suma de cuadrados
A (mquinas)
bcn
(y
i ...
y.... ) 2
2 + n c 2 +
B (bombas dentro de cn
A)
C
(dispensadores n
dentro de B)
Error
(y
ij ..
y.... )
+ n c +
(y
ijk .
y.... )
i
2
ab(c-1)
+ n c
2
a 1
cn
2
j (i )
a (b 1)
( y
i
Total
a(b-1)
y ijk . ) 2
abc(n-1)
ijkl
y.... ) 2
abcn-1
( y
i
ijkl
Ejemplo
Suponga que se est estudiando la dureza de la superficie de un material de acuerdo a 3
mquinas que se encuentran en 3 plantas de produccin diferentes. Estas mquinas son operadas
por 3 personas diferentes cada una que se escogieron de manera aleatoria. Cada persona que
opera la mquina toma 3 medidas para la dureza del material. Se obtuvieron las siguientes
respuestas:
Personas
1
78
61
75
Mquina 1
2
96
76
65
3
47
58
55
1
93
100
90
Mquina 2
2
86
80
90
3
74
66
80
1
88
75
67
Mquina 3
2
52
55
50
3
43
54
63
163
2. En el men stat se hace click sobre la opcin ANOVA y all se hace click sobre la opcin
Balanced Anova como muestra la figura:
4. Al hacer click en el botn de graphs se despliega un men de graficas, se hace click sobre
la opcin four in one de manera que se muestren las 4 graficas de los residuales en una.
Se da ok a todas las pantallas y se obtienen los resultados.
165
Type
fixed
random
Levels
3
3
Values
1, 2, 3
1, 2, 3
S = 8.70292
DF
2
6
18
26
SS
2627.56
2845.11
1363.33
6836.00
R-Sq = 80.06%
MS
1313.78
474.19
75.74
F
2.77
6.26
P
0.141
0.001
R-Sq(adj) = 71.19%
Se observa que no existe diferencia significativa en el factor mquinas a pesar de que las mismas
se encuentran en diferentes plantas, sin embargo, se observa diferencia en las personas ya que su
valor p es menor al nivel de significancia utilizado para la prueba (0.05). Debido a que hay
diferencia entre las personas que operan las maquinas, el inters mayor es saber en qu mquina
estn difiriendo estas personas pero el anlisis hecho con anterioridad no permite obtener esta
informacin, ya que el mismo se realiz de manera global.
Para obtener un anlisis por cada mquina se realiza entonces un anlisis para un solo factor
aleatorio para cada una de las maquinas. El factor en consideracin para cada anlisis es las
personas con 3 niveles. En la seccin correspondiente a un solo factor aleatorio de este material
se muestra el procedimiento para la realizacin del mismo en Minitab, de manera que se procede
a mostrar aqu los resultados.
1. Anlisis de un solo factor aleatorio para la mquina 1:
One-way ANOVA: respuesta versus personas
Source
personas
Error
Total
S = 10.98
DF
2
6
8
SS
1042
723
1765
MS
521
121
F
4.32
R-Sq = 59.02%
P
0.069
R-Sq(adj) = 45.35%
166
Level
1
2
3
N
3
3
3
Mean
71.33
79.00
53.33
StDev
9.07
15.72
5.69
Pooled StDev
-----+---------+---------+---------+---(----------*---------)
(----------*---------)
(----------*---------)
-----+---------+---------+---------+---45
60
75
90
Level
1
2
3
N
3
3
3
DF
2
6
8
SS
666.0
202.0
868.0
MS
333.0
33.7
R-Sq = 76.73%
Mean
94.33
85.33
73.33
StDev
5.13
5.03
7.02
F
9.89
P
0.013
R-Sq(adj) = 68.97%
Level
1
2
3
N
3
3
3
DF
2
6
8
SS
1137.6
438.0
1575.6
MS
568.8
73.0
R-Sq = 72.20%
Mean
76.667
52.333
53.333
StDev
10.599
2.517
10.017
F
7.79
P
0.021
R-Sq(adj) = 62.93%
167
Con los anlisis realizados para un solo factor aleatorio se puede observar que hay diferencia
significativa entre las personas de las mquinas 2 y 3. Sin embargo se podra decir que en la
mquina uno tambin puede haber una diferencia entre las personas ya que el valor p no est
muy lejano del nivel de significancia de la prueba (0.05).
Donde:
168
Alumno
Ensamble
1
Ensamble
2
Ensamble
3
1
22
24
30
27
25
21
Estacin de trabajo 1
2
3
23
28
24
29
29
30
28
32
24
27
22
25
4
25
23
27
25
26
23
1
26
28
29
28
27
25
Estacin de trabajo 2
2
3
27
28
25
25
30
24
27
23
26
24
24
27
4
24
23
28
30
28
27
Una vez se tienen las respuestas al experimento se procede a realizar el anlisis mediante el
programa Minitab:
1. En el men stat, se hace click sobre la opcin ANOVA, all se puede escoger para este
caso, la opcin Balanced Anova o General linear model, cualquiera de los dos funciona
porque se tiene un diseo balanceado. En este caso haga click sobre la opcin Balanced
Anova como muestra la figura:
169
170
3. Al hacer click en el botn de graphs, se obtiene una pantalla donde se escoge la opcin de
four in one para que el programa muestre las 4 graficas para los residuales en una misma
como muestra la figura. Una vez escogida la opcin se da ok:
4. Al regresar a la pantalla principal, se hace click sobre el botn de options con el fin de
que el programa despliegue la pantalla mostrada en la figura. En esta pantalla se de click
sobre la casilla que dice Use the restricted form of the model para que entonces Minitab
entienda que debe hacer el anlisis considerando el modelo restringido. Esto quiere decir
171
Type
fixed
random
fixed
Levels
2
4
3
Values
1, 2
1, 2, 3, 4
1, 2, 3
S = 1.52753
R-Sq = 81.31%
Source
Estacion de trabajo
DF
1
6
2
2
12
SS
4.083
71.917
82.792
19.042
65.833
MS
4.083
11.986
41.396
9.521
5.486
24
47
56.000
299.667
2.333
F
0.34
5.14
7.55
1.74
2.35
P
0.581
0.002
0.008
0.218
0.036
R-Sq(adj) = 63.40%
Variance
component
Error
term
2
172
1
2
3
4
5
6
Alumno(Estacion de trabajo)
Tipo de ensamble
Estacion de trabajo*Tipo de ensamble
Tipo de ensamble*Alumno(
Estacion de trabajo)
Error
Source
Estacion de trabajo
Alumno(Estacion de trabajo)
Tipo de ensamble
Estacion de trabajo*Tipo de ensamble
Tipo de ensamble*Alumno(
Estacion de trabajo)
Error
1.609
1.576
6
5
5
6
2.333
Expected Mean Square
for Each Term (using
restricted model)
(6) + 6 (2) + 24 Q[1]
(6) + 6 (2)
(6) + 2 (5) + 16 Q[3]
(6) + 2 (5) + 8 Q[4]
(6) + 2 (5)
(6)
Tipo de ensamble
28.0
Mean of Respuesta
27.5
27.0
26.5
26.0
25.5
25.0
1
174
i = 1, 2,..., r
j = 1, 2,..., a
k = 1, 2,..., b
Donde:
i = Bloques o replicas
j = Factor involucrado en el plot principal (A)
ij = Error del plot principal
Ho : 1 = 2 = ... a
Equivalente a
H1 : 1 2 ... a
H 1 : 1 2 ... a
175
Tiempo
580
600
620
640
217
158
229
223
10
233
138
186
227
15
175
152
155
156
188
126
160
201
10
201
130
170
181
15
195
147
161
172
162
122
167
182
10
170
185
181
201
15
213
180
182
199
(minutos)
I
II
III
Anlisis:
Este experimento podra conducirse como un factorial. Si se hiciera de esa manera,
entonces el experimentador tendra que haber seleccionado una combinacin de las
cuatro temperaturas y los 3 tiempos de manera aleatoria, colocar un componente en el
horno por el tiempo seleccionado y proseguir de esta manera hasta que todos los
tratamientos fueran realizados. Se piensa entonces que al establecer una temperatura y
tomar por ejemplo el tiempo de 15, se hubiera podido aprovechar y sacar el componente
en un tiempo de 5 y uno de 10, de manera que se obtengan 3 respuestas en 15 minutos.
Hacer esto es algo que un experimento de tipo factorial no permite. Si se realizara el
experimento como uno factorial, se estara desperdiciando tiempo y saldra ms costoso.
176
Una forma lgica de conducir este experimento, seria seleccionar una de las cuatro
temperaturas de forma aleatoria y colocar tres componentes (diferentes unidades
experimentales) para entonces analizarlos de acuerdo al tiempo asignado para cada
componente; en otras palabras, a una temperatura dada (teniendo en cuenta que debe ser
escogida de manera aleatoria) los 3 componentes son puestos en el horno por tres
perodos de tiempo distintos. En este caso la temperatura acta como cuadrante o parcela
(Plot) y el tiempo es quien parte la parcela (Split). Luego la temperatura se ajusta a otro
nivel y se repite ste procedimiento hasta que las cuatro temperaturas sean tomadas en
consideracin, a esto se le llama una replica del experimento (el ejemplo muestra 3).
Parcela partida
Para realizar el anlisis de los datos, se procede entonces a realizar un anlisis de varianza
en el programa Minitab:
177
178
Type
random
fixed
fixed
Levels
3
3
4
Values
1, 2, 3
5, 10, 15
580, 600, 620, 640
DF
2
2
3
4
6
6
12
0
35
Seq SS
1962.72
566.22
12494.31
7021.28
1773.94
2600.44
2912.06
*
29330.97
Adj SS
1962.72
566.22
12494.31
7021.28
1773.94
2600.44
2912.06
*
Adj MS
981.36
283.11
4164.77
1755.32
295.66
433.41
242.67
*
F
0.54
0.16
14.09
7.23
1.22
1.79
**
P
0.618 x
0.856
0.004
0.003
0.362
0.185
Ejemplo 2
Se desea saber como cambia el peso de las setas teniendo en cuenta tiempos de intervalos
de 5 horas, comenzando en 5 y terminando en 30. Para el mismo se estableci la
realizacin de 2 replicas.
Con ventilacin
Split
Sin ventilacin
Con diedrita
Sin diedrita
Con diedrita
Sin diedrita
Tiempo
40
60
40
60
40
60
40
60
en
voltios
voltios
voltios
voltios
voltios
voltios
voltios
voltios
horas
5
Replica 1
10
15
20
25
30
5
Replica 2
10
15
20
25
30
181
StdOrder
14
14
14
14
14
14
2
2
2
2
2
2
12
12
12
12
12
12
8
8
8
8
8
8
10
10
10
10
10
10
9
9
9
9
9
9
4
4
4
4
4
4
1
1
1
1
RunOrder
1
1
1
1
1
1
2
2
2
2
2
2
3
3
3
3
3
3
4
4
4
4
4
4
5
5
5
5
5
5
6
6
6
6
6
6
7
7
7
7
7
7
8
8
8
8
Diedrita
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
1
1
1
1
1
1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
-1
-1
-1
-1
Focos
1
1
1
1
1
1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
Peso
6.07
3.55
3.97
3.88
3.65
3.71
16.14
7.43
4.32
4.46
3.97
4.62
15.53
4.33
4.75
4.36
4.26
4.26
12.31
6.5
5.38
5.16
4.45
5.08
11.61
4.14
3.5
3.11
2.98
3.09
11.74
3.76
4.4
4.09
4.23
4.52
12.5
4.88
4.93
4.21
5.2
4.67
13.19
5.73
5.73
5.64
182
8
8
9
9
9
9
9
9
10
10
10
10
10
10
11
11
11
11
11
11
12
12
12
12
12
12
13
13
13
13
13
13
14
14
14
14
14
14
15
15
15
15
15
15
16
16
16
16
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
25
30
5
10
15
20
25
30
5
10
15
20
25
30
5
10
15
20
25
30
5
10
15
20
25
30
5
10
15
20
25
30
5
10
15
20
25
30
5
10
15
20
25
30
5
10
15
20
-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
5.29
4.66
14.59
5.5
4.68
4.4
4.07
4.51
6.09
3.95
3.73
3.8
3.69
3.71
14.56
4.38
3.89
3.77
3.65
3.9
9.53
4.52
4.54
4.08
4.19
4.21
11.09
5.13
5.49
5.05
5.05
4.38
10.47
4.44
4.59
4.77
4.64
4.38
12.65
4.82
4.83
4.83
5.01
4.89
9.37
4.43
4.68
4.64
183
16
16
1
1
2
2
25
30
-1
-1
-1
-1
1
1
4.73
4.66
Los valores de -1 y 1 indican los niveles del factor, donde: la ventilacin es -1 cuando no
se induce y 1 cuando se usa un abanico; la diedrita es -1 cuando no se usa y 1 cuando se
pone en la entrada de aire y los focos son -1 cuando es de 40 vatios y 1 cuando es de 60.
El tiempo se considera de acuerdo a las horas en que se saco cada muestra. En la misma
caja fueron puestas 6 muestras de setas y se saco 1 muestra cada 5 horas para tomar su
peso (en gramos), siendo el peso la variable respuesta.
184
3. Se hace clic sobre el botn de Factor Plots para ingresar los factores principales y
observar el cambio de la respuesta en promedio con respecto al cambio de nivel
de cada factor. Esta opcin permite ver grficamente el cambio en la respuesta, en
la casilla de factors se ingresan los factores principales, finalmente se oprime ok
para esta ventana y la ventana subsiguiente con el fin de obtener resultados.
185
Type
random
fixed
fixed
fixed
fixed
Levels
2
6
2
2
2
Values
1, 2
5, 10, 15, 20, 25, 30
-1, 1
-1, 1
-1, 1
DF
1
5
1
1
1
5
1
1
1
5
Seq SS
1.7281
698.5910
0.8400
13.0833
8.9793
2.3578
3.2856
0.3775
0.4455
0.8865
Adj SS
1.7281
698.5910
0.8400
13.0833
8.9793
2.3578
3.2856
0.3775
0.4455
0.8865
Adj MS
1.7281
139.7182
0.8400
13.0833
8.9793
0.4716
3.2856
0.3775
0.4455
0.1773
F
**
296.29
0.26
34.66
20.15
1.32
0.62
0.13
**
0.37
186
5
5
1
1
1
5
5
5
1
1
1
5
5
5
1
5
5
5
1
5
5
14.8796
57.2298
6.9338
0.3408
8.5085
2.4045
0.5242
1.9604
6.4377
3.1032
0.4593
1.3299
1.4671
3.6857
2.2265
0.2461
4.2483
0.5394
4.2336
13.2619
1.9372
14.8796
57.2298
6.9338
0.3408
8.5085
2.4045
0.5242
1.9604
6.4377
3.1032
0.4593
1.3299
1.4671
3.6857
2.2265
0.2461
4.2483
0.5394
4.2336
13.2619
1.9372
2.9759
11.4460
6.9338
0.3408
8.5085
0.4809
0.1048
0.3921
6.4377
3.1032
0.4593
0.2660
0.2934
0.7371
2.2265
0.0492
0.8497
0.1079
4.2336
2.6524
0.3874
0
95
*
866.5321
28.38
29.19
1.08
0.11
18.53
0.94
**
0.69
1.65
0.66
0.12
5.40
0.35
6.83
0.53
0.13
2.19
0.28
10.93
6.85
**
P
0.000
0.702
0.107
0.140
0.673 x
0.686 x
0.890 x
0.851
0.001
0.001
0.488
0.796
0.145
0.612 x
0.686
0.449
0.545
0.797
0.044
0.866
0.027
0.601
0.980
0.205
0.907
0.021
0.027
x
x
x
x
187
188
1. Metodologa de respuesta
En las secciones anteriores se ha estudiado el comportamiento de la variable respuesta cuando se
ve afectada por diferentes factores, sin embargo no se ha tocado el tema a cerca de llegar a la
combinacin optima de factores y sus niveles de manera que se logre optimizar la respuesta. Las
metodologas de superficie de respuesta son usadas para analizar una respuesta de inters que se
ve afectada por unas variables y para la cual se necesita llegar a un ptimo.
Suponga que un ingeniero quiere encontrar los niveles de ventilacin (a) y humedad (b) que
maximizan la respuesta (y) de un proceso. De esta manera la respuesta se ve como una funcin
de las variables a y b:
y = f (a,b) + e
Donde a y b son las variables independientes o factores y e se refiere al error o ruido observado
en la respuesta. La figura muestra la superficie de respuesta para la variable y en diferentes
niveles de las variables independientes a y b. La metodologa de respuesta busca llegar al punto
ptimo, representado por el punto azul, donde se encuentra la mejor combinacin de los factores
a y b para la respuesta optima de y.
Yo = Valor optimo
para la respuesta
En ocasiones con un modelo de primer orden se llega a un lugar donde se puede encontrar una
respuesta factible, mas no optima. Las respuestas optima generalmente se encuentran en un lugar
189
190
Niveles
Bajo
Alto
Puntos centrales
191
Variables codificadas
X1
X2
-1
-1
-1
1
1
-1
1
1
0
0
0
0
0
0
0
0
0
0
Respuesta
Y
34.3
35
35.9
36.4
35.6
35.3
35.2
35.7
35.5
Effect
1.5000
0.6000
-0.1000
S = 0.207364
Coef
35.4000
0.7500
0.3000
-0.0500
0.0600
SE Coef
0.1037
0.1037
0.1037
0.1037
0.1391
R-Sq = 93.86%
T
341.43
7.23
2.89
-0.48
0.43
P
0.000
0.002
0.044
0.655
0.688
R-Sq(adj) = 87.71%
DF
2
1
1
4
4
8
Seq SS
2.61000
0.01000
0.00800
0.17200
0.17200
2.80000
Adj SS
2.61000
0.01000
0.00800
0.17200
0.17200
Adj MS
1.30500
0.01000
0.00800
0.04300
0.04300
F
30.35
0.23
0.19
P
0.004
0.655
0.688
Se observa que los factores principales A y B (Tiempo y temperatura de vapor) resultan ser
significativos, sin embargo la interaccin y la curvatura no. Debido a que no hay significancia en
la curvatura se concluye que un modelo de primer orden es suficiente para encontrar el paso de
ascenso con el cual se espera llegar a la respuesta ptima. La tabla muestra los coeficientes
regresores para cada factor, de esta manera la ecuacin que describe el modelo es:
192
X i =
bi
bj
0.30
= 0.4
0.75
4. Sabiendo entonces el procedimiento para calcular los incrementos en los niveles de las
variables o factores, tiempo y temperatura de vapor, se procede a realizar incrementos
hasta encontrar que la variable respuesta deje de mostrar mejoras. Esto quiere decir
entonces que se deben hacer experimentos en diferentes niveles de las variables de
entrada y tomar datos de la respuesta hasta encontrar que la misma deje de incrementar.
La siguiente tabla muestra un resumen para las respuestas obtenidas en diferentes niveles
de los factores A y B.
193
Pasos de ascenso
Origen
Magnitud de
incremento
Variables naturales
A
B
35
100
Paso 1
Paso 2
Paso 3
Paso 4
Paso 5
Paso 6
Paso 7
Paso 8
Paso 9
Paso 10
Paso 11
Paso 12
Variables codificadas
X1
X2
0
0
0.4
40
45
50
55
60
65
70
75
80
85
90
95
104
108
112
116
120
124
128
132
136
140
144
148
2
3
4
5
6
7
8
9
10
11
12
13
0.8
1.2
1.6
2.0
2.4
2.8
3.2
3.6
4.0
4.4
4.8
5.2
Respuesta
Y
35.46
36.5
38.4
42.6
45.2
49.3
55.4
60.3
65.7
72.9
75.1
71.3
70.4
Porcentaje
La siguiente figura muestra grficamente la reduccin en la respuesta despus del paso 10:
80
70
60
50
40
30
20
10
0
Porcentaje de
produccion (Y)
10
12
Variables codificadas
X1
X2
-1
-1
-1
1
1
-1
1
1
0
0
0
0
0
0
0
0
0
0
Respuesta
Y
71.3
73.2
74.1
74.5
75.1
75.8
74.9
75.2
75.6
Effect
2.0500
1.1500
-0.7500
S = 0.370135
Coef
73.2750
1.0250
0.5750
-0.3750
2.0450
SE Coef
0.1851
0.1851
0.1851
0.1851
0.2483
R-Sq = 96.56%
T
395.94
5.54
3.11
-2.03
8.24
P
0.000
0.005
0.036
0.113
0.001
R-Sq(adj) = 93.12%
DF
2
1
1
4
4
8
Seq SS
5.5250
0.5625
9.2934
0.5480
0.5480
15.9289
Adj SS
5.52500
0.56250
9.29339
0.54800
0.54800
Adj MS
2.7625
0.5625
9.2934
0.1370
0.1370
F
20.16
4.11
67.83
P
0.008
0.113
0.001
195
= ( 2 k )1 / 4
Donde k corresponde al nmero de factores. Por lo tanto para este ejemplo particular, la distancia
a la que deben estar los puntos axiales es:
(0, 1.41)
(1, 1)
(-1, 1)
(-1.41, 0)
(1.41, 0)
(-1, - 1)
(1,- 1)
(0, -1.41)
Todos
los
puntos
marcados con la raya
verde son los puntos
axiales, note que estn
fuera de los niveles a los
196
Respuesta
Y
-1
-1
71.3
-1
73.2
-1
74.1
74.5
75.1
75.8
74.9
75.2
75.6
-1.41
72.3
1.41
74.8
-1.41
73.5
1.41
75.1
En el men de stat, se hace clik sobre el men de DOE, luego se hace click sobre
la opcin de Response Surface, all se hace click sobre la opcin de create a
response surface design. La siguiente figura ilustra lo anterior:
197
La siguiente figura, muestra las opciones para realizar el anlisis. Para este caso
se toma la opcin de central composite y se definen los dos factores que se
involucraron en el ejemplo:
Luego se hace click sobre la opcin Designs, para definir el tipo de diseo que se
desea. La siguiente figura ilustra lo descrito:
198
Al dar click sobre el botn de ok se obtienen los siguientes resultados (se anadio
la columna correspondiente a las respuestas):
199
200
Coef
75.3215
0.9560
0.5712
-1.0524
-0.6752
-0.3750
S = 0.4480
SE Coef
0.2003
0.1586
0.1586
0.1706
0.1706
0.2240
R-Sq = 93.5%
T
375.959
6.027
3.601
-6.170
-3.958
-1.674
P
0.000
0.001
0.009
0.000
0.005
0.138
R-Sq(adj) = 88.8%
DF
5
2
2
1
7
3
4
12
Seq SS
20.1459
9.8916
9.6918
0.5625
1.4049
0.8569
0.5480
21.5508
Adj SS
20.1459
9.8916
9.6918
0.5625
1.4049
0.8569
0.5480
Adj MS
4.0292
4.9458
4.8459
0.5625
0.2007
0.2856
0.1370
F
20.08
24.64
24.15
2.80
P
0.001
0.001
0.001
0.138
2.08
0.245
201
Para observar lo que sucede a la respuesta cuando se varan los niveles de los
factores se realiza entonces el grafico de superficie. En Minitab en el men de
graph se escoge la opcin 3D surface plot como muestra la siguiente figura:
202
76
Respuesta_1
74
72
1
0
-1
0
B
-1
1
Se observa entonces que la respuesta aumenta cuando A esta en su nivel alto y B esta
en niveles entre 0 y 1. De manera que el ingeniero debe usar una combinacin de
estos dos niveles para lograr un incremento en el porcentaje de produccin.
203