Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Disenio Experimentos
Disenio Experimentos
1. Introducción.(2 hrs).
2. Diseño completamente al azar. (6)
3. Diseño en bloques completos al azar.(4)
4. Diseño en cuadro latino.(4)
5. Arreglo de tratamientos en dos factores.(10)
6. Arreglos de tratamientos multifactorial.(4)
7. Arreglos factoriales dos a la k.(6)
8. Confusión en los arreglos factoriales dos a la k.(6)
9. Bloques incompletos.(4)
10. Factoriales fraccionados.(4)
11. Arreglos Ortogonales de Taguchi.(6)
12. Metodología de superficie de respuesta.(8).
INTRODUCCION
i=1,2,…,t; j=1,2,…,r
Lo cual indica que en el experimento hay t tratamientos, y en cada tratamiento r
es el numero de repeticiones, cuando el numero de repeticiones es el mismo
en cada tratamiento; entonces el experimento esta balanceado. Cuando el
numero de repeticiones varia de tratamiento a tratamiento, el diseño
experimental será desbalanceado y el subíndice j llegara a un numero diferente
para cada tratamiento, lo cual puede ser indicado con j=1,2,…,r i .
Hipótesis que se desea probar: La hipótesis que se desea probar es la
referente al efecto de los tratamientos. La hipótesis estadística es:
Ho: Todos los efectos de tratamientos son iguales a cero.
Ho: 1=2=…=t=0
Ha: Al menos uno de los efectos de tratamiento es diferente de cero.
Para expresarla en términos de los parámetros del modelo tendría que ser una
hipótesis múltiple, que por el momento no es de interés llegar a detallar.
Lo importante en este punto es recordar que la hipótesis nula es de
consecuencias estadísticas definidas. En este caso la consecuencia de la
hipótesis nula, es que el modelo estadístico se reduce a:
Yij = μ + ij
Al que se le llama el modelo reducido. Para probar esta hipótesis el
razonamiento que se sigue es evaluar la magnitud de los errores en ambos
modelos y determinar que tanto impacto tienen los efectos de tratamiento. Si la
reducción en los errores es importante, entonces el efecto de los tratamientos
se declara significativo. Por el contrario, si la magnitud de los errores
prácticamente es la misma en ambos modelos, esto significa que los efectos de
tratamiento no contribuyen a explicar la respuesta, y por lo tanto son
declarados no significativos.
Análisis de los datos: El análisis de los datos de un diseño experimental
siempre se lleva a cabo mediante la técnica del análisis de varianza. Para
aplicar esta técnica se requiere del ajuste de los dos modelos al mismo
conjunto de observaciones, el completo y el reducido bajo la hipótesis nula,
para después comparar la magnitud de los errores obtenida en ambos
modelos.
El ajuste de un modelo consiste en estimar sus parámetros, es decir todos
aquellos componentes del modelo que no incluyan la secuencia completa de
subíndices usada en la variable de respuesta. En otras palabras, el único
componente que no se estima en el ajuste del modelo es el que corresponde al
error experimental.
En el ajuste del modelo se deben tener en cuenta las siguientes características
tanto del conjunto de observaciones como del modelo que se desea ajustar:
1. Numero total de observaciones: Corresponde al numero total de
valores en el diseño experimental. Vamos a denotar este numero con
la letra n.
2. Numero de parámetros independientes en el modelo que se ajusta:
Parámetros independientes son aquellos que no están sujetos a las
restricciones impuestas por la definición de los parámetros. Por
ejemplo el modelo reducido solo tiene un parámetro, que es
independiente; en el modelo completo del diseño completamente al
azar se impone la restricción de i=1i = 0, por lo que el numero de
parámetros independientes seria t-1. A estos faltaría sumar el
parámetro μ, por lo que entonces serian t parámetros independientes.
3. Grados de libertad para el modelo ajustado: Se refiere al numero de
componentes independientes en el conjunto de datos después de
haber ajustado un modelo. Los grados de libertad se van reduciendo
a medida que se introducen mas componentes en un modelo. Estos
grados de libertad son los que permiten estimar la varianza del error,
por lo que se recomienda en general que no deben ser inferiores de
10 a 12 en el modelo completo. Se estiman como:
G.L. = n – parámetros independientes en el modelo.
Para el modelo completo de un diseño completamente al azar se tiene:
G.L. = n – t
Para el modelo reducido se tienen:
G.L.= n – 1
Al revisar la estructura del modelo reducido y el modelo completo se puede
deducir que los resultados de las diferencias entre el modelo reducido
menos el modelo completo se pueden atribuir al termino que corresponde al
efecto de los tratamientos. Entonces:
G.L.Trat = t – 1
Estos grados de libertad son de particular importancia, ya que indican el
numero de parámetros independientes en un modelo ajustado al conjunto
de datos, tomando como variables independientes los tratamientos. Si el
factor es cuantitativo, entonces los grados de libertad indican el grado
máximo de polinomio en el modelo de regresión; si se trata de un factor
cualitativo, entonces los grados de libertad en los tratamientos indica el
numero máximo de comparaciones independientes entre los niveles del
factor.
Total 513.116667 11
Ejemplo numérico 2: Los datos siguientes se refieren a las perdidas de peso de ciertas
piezas mecánicas (en miligramos) debidas a la fricción cuando tres diferentes
lubricantes se utilizaron en condiciones controladas. El lubricante C es el que se ha
estado usando en el proceso, y ahora se desea evaluar dos nuevas posibilidades, el
lubricante A y el lubricante B.
Lubricante Desgaste
A 12.2
A 11.8
A 13.1
A 11
A 3.9
A 4.1
A 10.3
A 8.4
B 10.9
B 5.7
B 13.5
B 9.4
B 11.4
B 15.7
B 10.8
B 14
C 12.7
C 19.9
C 13.6
C 11.7
C 18.3
C 14.3
C 22.8
C 20.4
Análisis exploratorio:
Mediante una grafica de barras con su error estándar, podemos determinar el
comportamiento de desgaste y la variabilidad en el conjunto de observaciones.
Como puede observarse en la grafica, los patrones de dispersión dentro de
cada lubricante son muy parecidos (por la similitud en las barras de error
estándar). Puede observarse también que el lubricante de mayor valor en la
respuesta es el C, seguido en orden decreciente por el lubricante B y el de mas
baja respuesta en promedio el lubricante A.
Planteamiento de la hipótesis:
Ho: Las medias de desgaste por fricción bajo los tres lubricantes empleados
son iguales.
Ha: Al menos una media de desgaste asociada a un lubricante es diferente.
Modelo estadístico para este conjunto de datos:
Bajo la Ha el modelo es el correspondiente a un diseño completamente al azar:
Yij = μ + i + ij
Yij corresponde al valor del desgaste en la repetición j del tratamiento i.
μ es la media general del desgaste.
i es el efecto del lubricante i.
ij es el error experimental en la repetición j del lubricante i.
i=1,2,3 j=1,2,…,8
Total 507.389583 23
R-Cuadrado = 0.4544
Lo que significa que los lubricantes explican el 45 % de la variación en el
conjunto de datos. El 55 % se debe a factares no considerados en la
investigación.
Desviación estándar = 3.6306 que es el promedio del error en nuestro conjunto
de datos bajo el modelo completo.
Error estándar del la media = 1.2836
Lo que viene a confirmar el patrón de similitud en la variación de desgaste
dentro de cada lubricante, al obtener un error estándar muy similar a partir del
análisis de varianza, con los ya obtenidos para cada lubricante por separado.
Valor de P = 0.0017
Que por ser menor al nivel de significancia de la prueba (0.05) se toma la
decisión de rechazar Ho y concluir que las medias de desgaste en los tres
lubricantes no son iguales. Esto implica que el lubricante entonces si tiene un
impacto en el nivel de desgaste, por lo cual debemos investigar el patrón de
variación entre lubricantes y poder llegar a tomar una decisión acerca de cual
lubricante es el mas conveniente para conservar las piezas de la maquinaria.
Dentro de los
grupos 2.66 8 0.3325
Total 513.116667 11
Contrastes ortogonales:
Un contraste en estadística es una combinación lineal de las medias de los
tratamientos definida por la suma de productos de las medias de
tratamiento por un coeficiente. Estos coeficientes deben cumplir con la
característica de que su suma es igual a cero, de tal manera que para
algunas medias sus coeficientes asociados son positivos y para otras son
negativos. Las reglas de asignación de los coeficientes va a depender de la
tendencia que se desee encontrar o de la comparación de medias que se
desee hacer. Cada contraste tendrá asociado un grado de libertad, debido
a que la comparación que se lleva a cabo es entre dos grupos de
tratamientos, lo que llevan el signo positivo contra los que llevan el signo
negativo. De esta manera el numero de posibles contrastes ortogonales en
un conjunto de datos corresponde exactamente a los grados de libertad
para los tratamientos.
Dos contrastes serán ortogonales si la suma de los productos de sus
correspondientes coeficientes es igual a cero. Esto implica que la
covarianza entre los dos contrastes es igual a cero, y por lo tanto los
contrastes van a ser independientes. En este sentido la ortogonalidad
implica independencia. Si todos los contrastes formulados son ortogonales
entre si, entonces esto llevara a que la suma de cuadrados acumulada en
todos los contrastes ortogonales corresponda exactamente a la suma de
cuadrados de los tratamientos. La suma de cuadrados asociada a un
contraste se calcula por el cuadrado de la combinación lineal de las medias
multiplicada por el numero de repeticiones y dividida por la suma de los
cuadrados de los coeficientes de la combinación lineal. Esta suma de
cuadraos siempre lleva asociada un solo grado de libertad.
Si se aplican contrastes no ortogonales, entonces existirá covarianza entre
ellos y esto implica que la información contenida en ellos esta relacionada
en un cierto grado, con lo cual se considera que la información contenida en
los datos esta siendo sobreutilizada. Esto se va a reflejar en el hecho de
que el acumulado de la suma de cuadrados de los contrastes no
ortogonales no cerrara a la suma de cuadrados de los tratamientos.
Total 507.389583 23
Aleatorizacion: Una vez que los bloques han sido formados, con unidades
experimentales lo mas parecido posible en cuanto a la variable de bloqueo,
cada bloque se considera como un grupo muy homogéneo de unidades
experimentales, pero con un alto grado de variación entre bloques. La forma de
asignar tratamientos a las unidades experimentales es al azar e
independientemente dentro de cada bloque.
Modelo estadístico: El modelo completo de un diseño en bloques al azar
contiene los efectos de tratamiento (como en el completamente al azar) y el de
los bloques, dado por
Yij = μ + i + βj + ij
I=1,2,…,t; j=1,2,…,b
Yij Es la variable de repuesta en el bloque j y el tratamiento i.
μ Es la media general del experimento.
i Es el efecto del tratamiento i.
βj Es el efecto del bloque j.
ij es el error experimental en el bloque j y el tratamiento i.
Hipótesis del investigador: La hipótesis que se desea probar bajo este arreglo
experimental es:
Ho: No hay efecto de tratamientos (i = 0 para toda i).
Ha: al menos un efecto de tratamiento es diferente de cero.
En relación al efecto de los bloques, debemos ser claros de que no se deseaba
investigar su efecto, solo se empleo como una forma de controlar la variabilidad
en las unidades experimentales, con la finalidad de hacer mas sensible el
experimento, es decir, poder detectar efecto de tratamientos cuando
verdaderamente existan. De esta manera, no se plantea una hipótesis asociada
el efecto de los bloques. Tampoco es posible probarla, ya que prácticamente no
se tienen repeticiones de bloques. Cabe hacer mención que si se tuvieran
repeticiones de bloques, entonces el experimento dejaría de ser bloques para
convertirse en un arreglo de tratamientos factorial, y en este caso la variable de
bloqueo ya pasaría a ser un factor.
ANOVA en el diseño en bloques al azar: El análisis de varianza en un diseño en
bloques al azar debe incluir las fuentes de variación de tratamientos y la fuente
de variación de bloques, además del error y total. Debe considerarse las
restricciones en los parámetros, dadas por:
1. Para los efectos de tratamientos: i = 0
2. Para los efectos de los bloques: βj = 0
El arreglo en un diseño en bloques completos al azar y que no tenga datos
perdidos, siempre tendrá un numero de observaciones igual al producto del
numero de bloques por el numero de tratamientos (n = t × b). Entonces el
anova se construye como
Ejemplos Numéricos.
1. Una compañía constructora desea probar la eficiencia de 3 tipos de aislantes
diferentes. Ya que el área sobre la que la compañía construye se caracteriza
por diferencias importantes en el clima, la compañía ha dividido, en base a
esta característica, el área en 4 regiones geográficas. Dentro de cada región
geográfica usa aleatoriamente cada uno de los tres aislantes y registra la
perdida de energía como un índice. Valores mas pequeños del índice
corresponden a perdidas mas bajas de energía.
Aislante R.G. 1 R.G. 2 R.G. 3 R.G. 4
1 19.2 12.8 16.3 12.5
2 11.7 6.4 7.3 6.2
3 6.7 2.9 4.1 2.8
Origen de Promedio
las Suma de Grados de de los Probabilida
variaciones cuadrados libertad cuadrados F d
Aislantes 253.595 2 126.7975 170.898914 5.1342E-06
Regiones 55.6358333 3 18.5452778 24.9955073 0.00086444
Error 4.45166667 6 0.74194444
Total 313.6825 11
Total 89.8344 24
Origen de Promedio
las Suma de Grados de de los Probabilida
variaciones cuadrados libertad cuadrados F d
Tratamientos 80.0384 4 20.0096 66.1255783 9.5744E-10
Testigo vs.
tratados 3.1329 (1) 3.1329 10.3532 0.00431
50 n vs. 100
n 11.7045 (1) 11.7045 38.6797 4.4895E-06
0 p vs 75 p 64.4405 (1) 64.4405 212.9560 3.9922E-12
Efecto
cruzado 0.7605 (1) 0.7605 2.5132 0.12858022
Bloques 4.9544 4 1.2386 4.09319233 0.01796691
Error 4.8416 16 0.3026
Total 89.8344 24
Total 945.599496 23
b). Tabla de valores de la variable (q) y sus promedios:
Media de
bloque 1 bloque 2 bloque 3 bloque 4 bloque 5 bloque 6 trat
paja picada 1240.88869 1361.33327 1378.17282 1259.98377 1219.31911 1255.19633 1285.81566
paja molida 1281.61017 1403.96968 1421.0701 1301.01485 1259.68798 1296.15001 1327.25046
tratada
amonio 2401.28585 2567.74449 2590.85242 2427.82032 2371.24361 2421.17304 2463.35329
tratada urea 1985.70501 2137.32848 2158.41546 2009.84098 1958.39439 2003.79332 2042.24627
Media de blo 1727.37243 1867.59398 1887.1277 1749.66498 1702.16127 1744.07817 1779.66642
Total 945.599496 23
Medias de
18 24 30 36 42 bloques Efs. De bloq
1 33.6 31.1 33 28.4 31.4 31.5 0.27666667
2 37.1 34.5 29.5 29.9 28.3 31.86 0.63666667
3 34.1 30.5 29.2 31.6 28.9 30.86 -0.36333333
4 34.6 32.7 30.7 32.3 28.6 31.78 0.55666667
5 35.4 30.7 30.7 28.1 29.6 30.9 -0.32333333
6 36.1 27.9 27.9 26.9 33.4 30.44 -0.78333333
Medias de
tratamiento 35.15 31.2333333 30.1666667 29.5333333 30.0333333 31.2233333
-
Efs. De trat 3.92666667 0.01 1.05666667 -1.69 -1.19
Total 215.373667 29
Las tendencias que resultan ser significativas son la lineal y la cuadrática, por
lo que se puede concluir que un modelo polinomial de segundo orden se ajusta
adecuadamente a este conjunto de observaciones.
Los coeficientes de la ecuación ajustada son:
Coeficientes Error típico
Intercepción 52.4138 4.82431978
Variable X -1.30206 0.34008611
Variable X^2 0.01838 0.00562884
2. Aleatorizar hileras: Para este fin se pueden obtener cuatro números aleatorios
que se asignan en secuencia de generacion a las hileras ordenadas en el cuadro
latino estándar. En seguida los números aleatorios se ordenan en magnitud,
indicando así el orden aleatorio en que deben estar las hileras. Usando el
generador de números aleatorios disponible en Excel, los números aleatorios
generados son:
Orden Orden
Numero Actual de Aleatorio
Aleatorio Hileras de Hileras
0.08060046 1 1
0.09297599 2 2
0.61098286 3 4
0.47095288 4 3
Este seria el cuadro latino que debe usarse como arreglo geométrico del
diseño experimental. Las letras pueden también ser asignadas al azar a los
tratamientos.
γ j Es el efecto de la columna j.
La hipótesis que se desea probar es solo acerca del efecto de los tratamientos,
es decir:
Ho: Todos los efectos de tratamiento son iguales a cero.
Contra la Ha: al menos uno de los efectos de tratamiento es diferente de cero.
Las variables de bloqueo incluidas en este arreglo son estrictamente, como en
el arreglo en bloques, para el control de la variación en las unidades
experimentales o de las condiciones en que se lleva a cabo el experimento,
pero no son de interés como factores de investigación. El objetivo entonces de
las variables de bloqueo sigue siendo eliminar posibles fuentes de variación en
el experimento que pudieran impactar sobre la variable de respuesta y
enmascarar el efecto de los tratamientos.
Como Lo establece el modelo del diseño en cuadro latino, se supone que los
efectos son aditivos e independientes, por lo que para el análisis establecemos
las siguientes restricciones acerca de los parámetros del modelo:
k(ij) = 0
β i = 0
γj= 0
Ya que el numero de niveles en cada fuente de variación es t, entonces el
numero de parámetros independientes que deben ser estimados por cada
fuente de variación es (t - 1), y así los grados de libertad son:
Para el modelo reducido: t2 – 1 = (t + 1)(t - 1)
Para el modelo completo: t2 – 1 - 3(t - 1)= t2 - 3(t )+2 = (t – 1) (t – 2)
La estimación de los parámetros del modelo es la que se ha venido
identificando en los otros dos arreglos geométricos:
k(ij) = Media del tratamiento k – Media General
β i = Media de la hilera i – Media General.
Modelo 12 84904.2222
S U B P R O D U C T O S
ANIMAL 1 2 3 4
1 C = 0.2 A = 0.24 D = 0.2 B = 0.27
2 B = 0.28 C = 0.19 A = 0.22 D = 0.28
3 D = 0.34 B = 0.23 C = 0.21 A = 0.28
4 A = 0.32 D = 0.22 B = 0.16 C = 0.27
5 6 7 8
5 B = 0.29 A = 0.25 C = 0.18 D = 0.28
6 D = 0.28 B = 0.18 A = 0.21 C = 0.25
7 C = 0.28 D = 0.23 B = 0.2 A = 0.28
8 A = 0.3 C = 0.19 D = 0.24 B = 0.25
Modelo 16 0.0536625
ARREGLOS DE TRATAMIENTOS:
ALTA BAJA
PROTEÍNA PROTEÍNA
Res Soya Puerco Res Soya Puerco
73 98 94 90 107 49
102 74 79 76 95 82
118 56 96 90 97 73
104 111 98 64 80 86
81 95 102 86 98 81
107 88 102 51 74 97
100 82 108 72 74 106
87 77 91 90 67 70
117 86 120 95 89 61
111 92 105 78 58 82
Efecto de interacción:
Siempre que se lleva a cabo un experimento multifactorial el objetivo
fundamental es investigar el efecto conjunto de los factores. Esto implica
investigar como los niveles de un factor pueden modificar el efecto de otro
factor sobre una respuesta.
En nuestro ejemplo de las mascotas esto llevaría a determinar como el
efecto de la cantidad de proteína se ve modificado al cambiar las fuentes de
proteína. En otras palabras, indagar si el efecto de la cantidad de proteína
es el mismo para cada una de las fuentes investigadas.
Si el efecto de la cantidad de proteína resulta ser el mismo para cada
fuente, es decir, el cambio en respuesta promedio por efecto de la cantidad
de proteína para cada fuente resulta muy homogéneo, esto refleja que la
fuente de proteína no modifica el efecto de la cantidad, por lo tanto, bajo
esta situación se considera que el efecto de los factores sobre la variable de
respuesta son independientes, esto es, cada uno de los factores tiene su
efecto sobre la respuesta indistintamente del nivel en el que se encuentra el
otro factor.
Sobre otro punto de vista, si el efecto de la cantidad de proteína se modifica
para cada una de las fuentes, entonces existe una dependencia entre los
dos factores. La magnitud de cambio en la variable de respuesta debido a la
cantidad de proteína va a depender de la fuente de proteína que se este
considerando, situación que caracteriza un efecto de interacción de
cantidad por fuente. Esto equivale a observar diferentes pendientes o tasas
de cambio de un factor para diferentes niveles de un segundo factor. El
efecto de un factor bajo una situación de interacción se potencializa o inhibe
de acuerdo al nivel del segundo factor. Los efectos de los factores no son
independientes, sino todo lo contrario, existe un efecto cruzado de los
factores.
Bajo una situación de interacción de factores no tiene sentido entonces
concluir acerca de cada uno de los factores por separado, por la
dependencia que existe del efecto de un factor y los niveles de un segundo
factor.
Y la subparcela seria método de aplicación, mezcla y día, cada una de las piezas
de información.
Como puede ser visualizado a partir de estos ejemplos tipicos de cada arreglo
de tratamientos, la selección esta basada en un criterio netamente practicote
llevar a cabo la aplicación de los niveles de los factores a las unidades
experimentales; cada una de las diferentes situaciones debe reflejarse en el
modelo estadístico y consecuentemente en el análisis de resultados.
a0 a1 a2
b0 b1 b0 b1 b0 b1
c0 a 0 b 0 c0 a 0 b 1 c0 a 1 b 0 c0 a 1 b 1 c0 a 2 b 0 c0 a 2 b 1 c0
c1 a 0 b 0 c1 a 0 b 1 c1 a 1 b 0 c1 a 1 b 1 c1 a 2 b 0 c1 a 2 b 1 c1
c2 a 0 b 0 c2 a 0 b 1 c2 a 1 b 0 c2 a 1 b 1 c2 a 2 b 0 c2 a 2 b 1 c2
c3 a 0 b 0 c3 a 0 b 1 c3 a 1 b 0 c3 a 1 b 1 c3 a 2 b 0 c3 a 2 b 1 c3
Si esta tabla la desdoblamos para que nos quede en forma vertical, solo
debemos considerar los siguientes valores:
1. El numero total de combinaciones: 24
2. Numero de veces que se va a repetir cada nivel del factor A: 24/3=8
3. Numero de veces que se va a repetir cada nivel del factor B en cada
nivel del factor A: 8/2 = 4
4. Numero de veces que se va a repetir cada nivel del factor C en cada
nivel del factor B: 4/4=1.
a0 b0 c0
a0 b0 c1
a0 b0 c2
a0 b0 c3
a0 b1 c0
a0 b1 c1
a0 b1 c2
a0 b1 c3
a1 b0 c0
a1 b0 c1
a1 b0 c2
a1 b0 c3
a1 b1 c0
a1 b1 c1
a1 b1 c2
a1 b1 c3
a2 b0 c0
a2 b0 c1
a2 b0 c2
a2 b0 c3
a2 b1 c0
a2 b1 c1
a2 b1 c2
a2 b1 c3
Fuente de
variación G.L. S.C. C.M Fc Ft Pr > Fc
i αi = 0
Restricción para la estimación de los efectos del factor cantidad de proteína
j βj = 0
Restricciones para la estimación de los efectos de interacción entre los factores
cantidad y fuente de proteínas.
Con estos promedios y los calculados anteriormente para cada nivel en cada uno de los
factores y la media general podemos estimar los efectos de interacción:
Res Soya Puerco
Alto 3.13333333 -6.26666667 3.13333333
Bajo -3.13333333 6.26666667 -3.13333333
Estos arreglos se caracterizan por tener incluidos K factores cada uno en dos
niveles. Estos arreglos son de gran interés en los diversos campos de la
ciencia y la ingeniería, donde la experimentación es la principal herramienta de
investigación. Esto se debe a que constituye una gran diversidad de arreglos
de tratamientos que permiten investigar una gran cantidad de factores con
pocas corridas experimentales, principalmente en la fase de exploración de
impactos de las diferentes variables independientes sobre las variables de
respuesta. También son de interés porque constituyen la base para construir
diseños experimentales en la fase de optimización de procesos, como son los
diseños de metodología de superficie de respuesta y los arreglos ortogonales
de Taguchi.
Nomenclatura:
La nomenclatura particular para estos arreglos permite el manejo mas eficiente
de las combinaciones de tratamiento. Con la nomenclatura simplificada también
se logra un procedimiento para construir estos arreglos.
A cada uno de los factores se les asocia una letra mayúscula latina,
empezando con la letra A y continuando así hasta los K factores que se
incluyen en el arreglo. Entonces tenemos los factores A, B, C,…,K.
Cada uno de los factores solo tiene dos niveles, a los que se les
denomina el nivel bajo y el nivel alto. Esta nomenclatura es arbitraria para
factores cualitativos no ordinales, pero para factores cuantitativos o cualitativos
ordinales estos se asocian de acuerdo a la magnitud del nivel en el factor. Los
niveles se representan con la letra minúscula correspondiente al factor,
denotando el nivel bajo con un subíndice cero y el nivel alto con un subíndice
uno. De esta manera los nieles del factor A son a 0 y a1, a los cuales
genéricamente se les denomina el nivel bajo del factor A y el nivel alto del factor
A. De manera equivalente se sigue esta notación para los niveles de los K
factores.
Combinacion 1 2 3
(1) 22 31 25
a 32 43 29
b 35 34 50
ab 55 47 46
c 44 45 38
ac 40 37 36
bc 60 50 54
abc 39 41 47
Antes de finalizar esta sección solo resta recalcar que la confusión para
bloques incompletos se emplea para confundir algunos efectos con el efecto de
los bloques, pero el arreglo factorial se correría de manera completa.
Factoriales fraccionados:
Ejemplo: Suponga que se desea llevar a cabo una fracción mitad de un arreglo
factorial 25, seleccionando como el generador la interacción de mas alto orden.
Defina para tal mitad la estructura de alias.
Yijk = μ+αi+ρj(i)+βk+(αβ)ik+ijk
El subíndice i esta asociado a los niveles del factor de parcela grande, por lo
que i=1,2,…,a,
El subíndice j esta asociado a las repeticiones de parcela grande, por lo que
j=1,2,…,r.
El subíndice k esta asociado a los niveles del factor de subparcela, por lo que
k=1,2,…,b.
El modelo indica entonces que se tienen a niveles del factor de parcela
principal con r repeticiones en cada nivel. El error de parcela grande esta
Factor A a–1
Error (a) a*(r - 1)
Subparcelas: ar*( b - 1 )
Factor B b–1
Interacción A*B ( a - 1 ) *( b - 1 )
Error (b) a*( b - 1)*( r - 1 )
Total (abr) - 1
Este modelo de parcelas divididas es muy frecuentemente empleado para
analizar datos que provienen de experimentos con mediciones repetidas al
considerar el factor tiempo como el factor de subparcela.
En algunas situaciones se sugiere emplear este arreglo experimental cuando la
precisión con que se desean llevar a cabo la comparación de las medias no es
la misma para amos factores; se seleccionaría como factor de subparcela aquel
en el que se quieren comparaciones mas precisas.
Factor A a-1
Factor de bloqueo r-1
Error (a) ( a - 1 )*( r - 1 )
Subparcelas: ar*( b - 1 )
Factor B b-1
Interacción
B*bloqueo ( r - 1 )*( b - 1 )
Interacción A*B ( a - 1 ) *( b - 1 )
Error (b) ( a - 1 )*( b - 1 )*( r - 1 )
Total (abr) - 1
PARCELAS DIVIDIDAS EN UN DISEÑO EN CUADRO LATINO:
Si las parcelas principales muestran variación en dos gradientes de bloqueo,
por hileras y columnas, entonces debe adoptarse un arreglo geométrico de las
parcelas principales en cuadro latino. Este arreglo debe ser representado en el
modelo como:
Factor A a-1
Factor de hileras a-1
Factor de columnas a-1
Error (a) ( a - 1 )*( a - 2 )
Subparcelas: a^2*( b - 1 )
Factor B b-1
Interacción A*B ( a - 1 ) *( b - 1 )
Error (b) a * ( a - 1 )*( b - 1 )
Total (a^2)*b - 1
Ejemplos:
2. Se llevo a cabo un experimento bajo un arreglo en parcelas divididas para probar
el efecto de 3 hibridos (utilizado como factor de parcela principal) acomodados
en un diseño en bloques completos al azar. Dentro de cada parcela grande se
acomodaron bajo un diseño completamente al azar las 4 densidades (10,15,20 y
25 plantas por hilera). Los datos se muestran a continuación:
BLOQUE HIBRIDO DENSIDAD RESPUESTA
1 1 10 40.7
1 1 15 24.2
1 1 20 16.1
1 1 25 11.2
1 2 10 39.4
1 2 15 31.3
1 2 20 17.9
1 2 25 14.8
1 3 10 68.7
1 3 15 26.2
1 3 20 20.5
1 3 25 18.9
2 1 10 37.8
2 1 15 44.4
2 1 20 17.6
2 1 25 12.7
2 2 10 47.8
2 2 15 34.5
2 2 20 30.5
2 2 25 17.3
2 3 10 56.2
2 3 15 48.1
2 3 20 28.2
2 3 25 26.2
3 1 10 32.9
3 1 15 27.8
3 1 20 19.9
3 1 25 14.5
3 2 10 44.4
3 2 15 25.6
3 2 20 22.5
3 2 25 17.7
3 3 10 44.8
3 3 15 41.1
3 3 20 30
3 3 25 19.2
4 1 10 43.1
4 1 15 34.1
4 1 20 20.1
4 1 25 15.4
4 2 10 49
4 2 15 50.4
4 2 20 25.2
4 2 25 18.7
4 3 10 59.3
4 3 15 46
4 3 20 24.7
4 3 25 22
El análisis de varianza de este experimento se muestra en la siguiente
tabla:
Total 47 8989.53
Por otro lado el efecto de la densidad puede ser evaluado mediante una
regresión:
Respuesta = 66.61 – 2.045*Densidad
Con un coeficiente de determinación de 0.835 y un error estándar de 7.68.
De estos resultados se desprende entonces que el mejor hibrido es el 3 que
debe cultivarse bajo la densidad mas baja evaluada.
METODOLOGIA DE TAGUCHI:
La metodología de Taguchi es sinonimo de ingeniería de calidad y tiene por
objetivo diseñar calidad en todo producto y su correspondiente proceso.
Taguchi introduce una filosofía en la que la calidad es medida por la desviación
del valor de una característica con respecto a su valor óptimo. Factores no
controlables (ruido) ocasionan tales desviaciones. La eliminación de los
factores de ruido es impractico y muy a menudo imposible, de aquí que el
método de Taguchi procura minimizar los efectos de ruido. A través de esta
metodología se determina el nivel óptimo de los factores controlables
importantes basados en el concepto de robustez. El objetivo es crear un diseño
de producto / proceso que sea lo menos sensible posible a las fluctuaciones de
los factores de ruido (robusto) al establecer los factores controlables de
impacto en los niveles óptimos.
El diseño de parámetros usa la idea fundamental del procedimiento en dos
pasos para lograr la calidad:
1. Los niveles de los parámetros que minimizan la variabilidad de la
característica de calidad son seleccionados. En esta etapa se genera
un diseño que es robusto con respecto a las fuentes incontrolables
de variación.
2. Los parámetros que tienen un efecto en el valor promedio de la
característica de calidad, pero ningún impacto en la variabilidad, son
identificados. Estos parámetros conocidos como factores de ajuste,
son usados para mover la característica de calidad al valor otimo sin
incrementar varianza.
FUNCIÓN DE PERDIDA:
Para evaluar la calidad en términos monetarios, Taguchi crea la función de
perdida, la cual estima el costo que la sociedad tiene que pagar por una
desviación de la característica de calidad en un producto con respecto a su
valor blanco. En esta función se supone que la perdida es proporcional al
cuadrado de la desviación de la característica de calidad con respecto a su
valor blanco. Esta función se define de acuerdo al tipo de característica de
calidad:
Características de calidad del tipo Nominal es mejor:
L(y) = K ( y – m )2
L(y) es la función de perdida evaluada en el valor y de la característica de
calidad.
K es una constante de proporcionalidad.
m es el valor optimo de la característica de calidad.
El valor esperado de la función de perdida para este tipo de características de
calidad esta dado por:
K*(Varianza(y) + (media(y)-m) 2)
Ejemplos:
1. Una firma de ingeniería de construcción esta llevando a cabo
estudios de la firmeza de tensión de varias formulaciones de
concreto. Seis variables de interés han sido identificadas y los niveles
a los que han sido probados son mostrados en la siguiente tabla:
Variable Nivel 1 Nivel 2
Tamaño de espécimen (A) 2 4
Cantidad de Agua (B) Baja Alta
Tiempo de curado (C) 24 48
Técnica de mezclado (D) Manual Maquina
Agregado (E) Fino Grueso
Concentración de cemento (F) Baja Alta
Un arreglo ortogonal L8 fue usado para estudiar los efectos de los 6
factores sobre la firmeza. Los resultados del experimento son mostrados en
la siguiente tabla:
Num C B A D E e F R1 R2
1 1 1 1 2 2 2 1 2.3 2.2
2 1 1 2 1 1 2 2 3.5 3.3
3 1 2 1 1 2 1 2 3-0 2.9
4 1 2 2 2 1 1 1 2.1 1.9
5 2 1 1 2 1 1 2 3.5 3.6
6 2 1 2 1 2 1 1 2.6 2.7
7 2 2 1 1 1 2 1 2.9 2.8
8 2 2 2 2 2 2 2 3.9 4.1
Construya una tabla de anova para identificar las variables que tienen un
efecto significativo sobre la media de la firmeza.
A B C D 1 2 3 4 5 6 7 8
1 1 1 1 15.6 9.5 16.9 19.9 19.6 19.6 20.0 19.1
1 2 2 2 15.0 16.2 19.4 19.2 19.7 19.8 24.2 21.9
1 3 3 3 16.3 16.7 19.1 15.6 22.6 18.2 23.3 20.4
2 1 2 3 18.3 17.4 18.9 18.6 21.0 18.9 23.2 24.7
2 2 3 1 19.7 18.6 19.4 25.1 25.6 21.4 27.5 25.3
2 3 1 2 16.2 16.3 20.0 19.8 14.7 19.6 22.5 24.7
3 1 3 2 16.4 19.1 18.4 23.6 16.8 18.6 24.3 21.6
3 2 1 3 14.2 15.6 15.1 16.8 17.8 19.6 23.2 24.2
3 3 2 1 16.1 19.9 19.3 17.3 23.1 22.7 22.6 28.6
Ensayo AO E 1 2 3 4
Ensayo AO I
1 18.5 21.2 20.5 19.3
2 16.8 17.3 20.9 18.5
3 21.1 21.8 20.8 19.4
4 20.2 17.7 19.8 20.8
5 16.2 21.5 21.2 21.4
6 18.3 18.5 17.8 17.2
7 20.6 21.4 16.9 19.5
8 17.5 20.0 21.0 20.4
9 20.4 18.8 19.6 18.3
1 2 3 4 5 6 7 8
1 19.3 20.2 19.1 18.4 21.1 20.6 19.5 18.7
2 20.6 18.5 20.2 19.4 20.1 16.3 17.2 19.4
3 18.3 20.7 19.4 17.6 20.4 17.3 18.2 19.2
4 20.8 21.2 20.2 19.9 21.7 22.2 20.4 20.6
5 18.7 19.8 19.4 17.2 18.5 19.7 18.8 18.4
6 21.1 20.2 22.4 20.5 18.7 21.4 21.8 20.6
7 17.5 18.3 20.0 18.8 20.2 17.7 17.9 18.2
8 20.4 21.2 22.4 21.9 21.5 20.8 22.5 21.7
9 18.0 20.2 17.6 22.4 17.2 21.6 18.5 19.2
X1 X2 Y
-1 1 54
-1 -1 45
1 1 32
1 -1 47
-1.414 0 50
1.414 0 53
0 -1.414 47
0 1.414 51
0 0 41
0 0 39
0 0 44
0 0 42
0 0 40
Variable Variable
Nat Nat. Var. Codif Var Codif Resp
1 2 x1 x2 Y
80 170 -1 -1 76.5
80 180 -1 1 77
90 170 1 -1 78
90 180 1 1 79.5
85 175 0 0 79.9
85 175 0 0 80.3
85 175 0 0 80
85 175 0 0 79.7
85 175 0 0 79.8
92.07 175 1.414 0 78.4
77.93 175 -1.414 0 75.6
85 182.07 0 1.414 78.5
85 167.93 0 -1.414 77
En primer lugar se muestra la tabla de análisis de varianza donde se observa
que el modelo es significativo.
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 5 28.2467034 5.64934069 79.668607 5.147E-06
Residuos 7 0.49637349 0.0709105
Total 12 28.7430769
De aquí se procede a revisar los estimadores de los parámetros para investigar si todos
tienen significancia.
Probabilida
Coeficientes Error típico Estadístico t d
Intercepción 79.9399546 0.11908862 671.264433 4.3003E-18
x1 0.99505025 0.09415493 10.5682224 1.4845E-05
x2 0.5152028 0.09415493 5.47186207 0.00093401
x1^2 -1.37644928 0.10098417 -13.6303472 2.693E-06
x2^2 -1.001336 0.10098417 -9.91577205 2.262E-05
x1*x2 0.25 0.13314513 1.8776504 0.10251919
Al llevar a cabo el ajuste del modelo de segundo orden se obtiene la siguiente tabla de
análisis de varianza:
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 5 10955.1767 2191.03534 48.3870007 9.1102E-06
Falta de ajuste 3 102.251895 34.083965 0.65546086 0.61339158
Error puro 5 260 52
Residuos 8 362.251895 45.2814869
Total 13 11317.4286
Probabilida
Coeficientes Error típico Estadístico t d
Intercepción 169.016235 2.7471226 61.5248242 5.4139E-12
x1 6.74374879 2.3784531 2.83535076 0.02196856
x2 26.5151515 2.39110005 11.0891016 3.9035E-06
x1^2 -10.756724 2.47325855 -4.3492113 0.00244787
x2^2 -21.9855591 2.5138815 -8.74566247 2.2867E-05
x1*x2 -15.25 3.36457601 -4.53251761 0.001918