Está en la página 1de 36

CURSO DE UTILIZACIÓN DE LA

MODELACION MATEMÁTICA Y
EL DISEÑO DE EXPERIMENTOS
EN EL PROCESO DE ESCALADO
Parte 2. Diseño Estadístico de Experimentos

Descripción breve
El proceso completo de Escalado, desde el laboratorio hasta la industria, resulta
generalmente largo y costoso, por lo cual resulta conveniente optimizar dicho proceso
para llevarlo a su mínima duración y costo. Para realizar esa optimización resulta muy
valioso aplicar las técnicas del Diseño Estadístico de Experimentos (DEE) y la Modelación
Matemática. En esta segunda parte del curso se presentan las técnicas del Diseño
Estadístico de Experimentos que se utilizarán de conjunto con la Simulación y
Modelación Matemática, para llevar a cabo el proceso de escalado de los procesos.

Dr. Roberto A. Gonzalez-Castellanos


robertoglezc@gmail.com
Contenido
Introducción. ....................................................................................................................................... 4

1. Conceptos básicos del Diseño Estadístico de Experimentos....................................................... 7

1.1. El Diseño Experimental en Biología y Agronomía. .............................................................. 9

Diseños completamente al azar, bloques al azar y cuadrados latinos. ....................................... 9

1.2. El Diseño Experimental Estadístico en las Ciencias Técnicas, Químicas, Físicas,


Farmacéuticas y la Biotecnología .................................................................................................. 12

2. Utilización del paquete de software estadístico Design-Expert para el Diseño Estadístico de


Experimentos. ................................................................................................................................... 34

Bibliografía ........................................................................................................................................ 34
Figuras
Figura 1. Proceso de Modelado. ......................................................................................................... 5

Figura 2 . Proceso Iterativo de la Investigación Científica................................................................... 6

Figura 3.Proceso Iterativo de la Investigación Científica. ................................................................. 13

Figura 4. Modelo lineal...................................................................................................................... 14

Figura 5. Modelo de segundo orden. ................................................................................................ 15

Figura 6. Modelo aditivo de primer orden. ....................................................................................... 16

Figura 7. Modelo segundo orden interactivo.................................................................................... 16

Figura 8. Modelo completo de segundo orden (izquierda): Modelo Gráfico de contornos de Y vs. X1
y X2. ................................................................................................................................................... 17

Figura 9. Estimado del efecto principal del factor. ........................................................................... 18

Figura 10. Estimado del efecto de curvatura. ................................................................................... 18

Figura 11. Combinación de niveles en el Diseño Factorial 2 a la 2. .................................................. 19

Figura 12. Combinación de niveles en el Diseño Factorial 2 a la 3. .................................................. 19

Figura 13. Ubicación de puntos de réplica en el centro del diseño. ................................................. 19

Figura 14. Diseño Compuesto Central............................................................................................... 20

Figura 15. Diseño Saturado Plackett-Burman. .................................................................................. 21

Figura 16. Ejemplo de curva característica para el análisis de varianza del modelo con efectos
aleatorios........................................................................................................................................... 22

Figura 17. Primera pantalla de selección de diseños factoriales de dos niveles del CX-11. ............. 24

Figura 18. Segunda Pantalla del proceso de selección del diseño factorial. ..................................... 25

Figura 19. Pantalla del Asistente Opcional para determinar la potencia del diseño. ....................... 25

Figura 20. Resultado del análisis de la Potencia del Diseño.............................................................. 26

Figura 21. Primera pantalla del segundo tanteo del número correcto de réplicas. ......................... 26

Figura 22. Resultado final de la evaluación de la potencia del diseño. ............................................ 27

Figura 23 Ejemplo de Gráfico de Contornos. .................................................................................... 32

Figura 24. Ejemplo de Superficie Respuesta. .................................................................................... 32

Figura 25. Búsqueda del óptimo por el Método del Ascenso más Pronunciado .............................. 33

Figura 26. Superficie Respuesta optimizada. .................................................................................... 33


Tablas
Tabla 1. Ejemplo de Diseño al Azar. .................................................................................................... 9

Tabla 2. Ejemplo de Diseño de Bloques al Azar. ............................................................................... 10

Tabla 3. Ejemplo de cuadrado Latino 5 x 5. ...................................................................................... 11

Tabla 4. Análisis multivariados (de Badii et al., 2004). ...................................................................... 12

Tabla 5. Elementos del Diseño Estadístico de Experimentos. ........................................................... 13

Tabla 6. Las dos fracciones del Factorial 23-1. .................................................................................. 20

Tabla 7. Parámetros de la curva de operación característica del Apéndice V del Montgomery, para
diseño de dos factores. ..................................................................................................................... 22

Tabla 8. Experimento de la vida en horas de una batería. ................................................................ 23

Tabla 9. Determinación de número de réplicas en función de los parámetros del diseño. ............. 24

Tabla 10. Niveles seleccionados para el Diseño de Experimento de referencia. .............................. 30


I t odu ió .
El proceso completo de Escalado, desde el laboratorio hasta la industria, resulta generalmente largo
y costoso, por lo cual resulta conveniente optimizar dicho proceso para llevarlo a su mínima
duración y costo. Para realizar esa optimización resulta muy valioso aplicar las técnicas del Diseño
Estadístico de Experimentos (DEE) y la Modelación Matemática.

El aplicar el DEE a escala industrial resulta difícil por las afectaciones que puede hacerle a la
producción. No obstante, el Diseño Estadístico de Experimentos es una de las principales
herramientas de que dispone el investigador para aumentar la eficacia de la investigación, y hoy en
día se aplica ampliamente a escala de laboratorio, banco y piloto. No es necesario ser un estadístico
o un matemático; la experiencia ha demostrado que los químicos e ingenieros pueden fácilmente
aprender los principios fundamentales de este tipo de diseños (Roberto A. Gonzalez-Castellanos,
Mario Yll Lavín, & Lilian D. Curiel Lorenzo, 2013b).

Una simple observación experimental en un laboratorio, en una instalación a escala piloto o a nivel
industrial puede costar cientos o miles de dólares, luego siendo el objetivo de la investigación
obtener información, puede definirse la eficiencia de la investigación como la cantidad de
información útil obtenida por unidad de costo. Por consiguiente, es extremadamente importante
para una investigación, utilizar métodos experimentales que le brinden la máxima cantidad de
información con el menor costo y esfuerzo. El uso del Diseño Estadístico de Experimentos facilita un
incremento apreciable en la productividad de los investigadores, así como en la confiabilidad de los
resultados obtenidos, siendo estos métodos, por su naturaleza universal, adaptables a la mayoría
de los campos actuales de investigación (Roberto A. Gonzalez-Castellanos, Mario Yll Lavin, & Lilian
D. Curiel Lorenzo, 2013a).

Con el Diseño Estadístico de Experimentos se pueden reducir al mínimo imprescindible las


experiencias que se deben realizar a Escala de Laboratorio y planificar adecuadamente las corridas
en las escalas de banco y piloto, de forma tal de obtener la mayor cantidad posible de información
en el menor intervalo de tiempo. Con la Modelación Matemática se pueden reducir las corridas
necesarias en las instalaciones de banco y piloto ya que se pueden realizar sólo las corridas
necesarias para obtener la información que se requiere para poner a punto los modelos
matemáticos del proceso y el resto de las investigaciones se pueden realizar mediante simulaciones
en computadora, con la excepción de un mínimo de corridas experimentales que se realicen al final
para corroborar los resultados de los modelos (Roberto A. Gonzalez-Castellanos, 2013).

Aquí hay que señalar también que resulta evidente que el tipo de diseño a utilizar en cada caso,
depende del objetivo del experimento y del tipo de modelo que se desea obtener. Sobre la base de
estas consideraciones, se puede establecer una clasificación de las investigaciones experimentales
según Box, (Roberto A. González, 2000):

1. Experimentos de tamizado: Cuando a partir de un gran número de variables hay que identificar
cuáles son las que más afectan el rendimiento.

2. Construcción de modelos empíricos: Para obtener una descripción aproximada de la relación


entre X e Y, en función de parámetros B.
3. Construcción de modelos determinísticos: Para determinar la verdadera relación funcional que
existe entre X e Y.

4. Ajuste del modelo determinístico: Para encontrar los mejores estimados de los parámetros
desconocidos en el modelo propuesto.

Los experimentos de tamizado deben hacerse al comienzo de un estudio experimental, cuando hay
numerosas variables que potencialmente pueden incluir en la respuesta. Es necesario discriminar
entre ellas la (las) verdaderamente importante (s). Esta es la esencia de este tipo de experimentos
los que deben ser bien diseñados estadísticamente para poder determinar también las interacciones
entre las variables.

La construcción de modelos empíricos se hace necesario en aquellas situaciones en que no es


factible la obtención de un modelo determinístico. En esas situaciones resulta útil, un modelo
aproximado que representa adecuadamente el comportamiento del proceso bajo estudio en la
región de interés. Los modelos determinísticos, por otra parte, casi siempre son no lineales y la
estimación de los parámetros de los mismos puede resultar difícil.

Por lo tanto, el objetivo de las investigaciones generalmente es establecer un modelo matemático


del proceso (María Lucía Brito‐Vallina, Isidro Alemán‐Romero, Elena Fraga‐Guerra, José Luís Para‐
García, & Ruth Irene Arias‐de Tapia, 2011) (Figura 1) y puede haber dos casos:

Figura 1. Proceso de Modelado.

1. El modelo se puede desarrollar teóricamente y por ello en el trabajo experimental sólo se


necesita comprobar el modelo y determinar los coeficientes desconocidos del mismo.

2. Con el nivel de conocimientos presentes no se puede deducir un modelo justificado en forma


teórica y por ella la dependencia entre las variables tiene que determinarse experimentalmente,
escogiendo previamente las variables significativas del proceso.

Generalmente no se conoce la forma del modelo a ajustar; en ese caso es recomendable comenzar
con un modelo lo más simple posible. La información acerca del modelo del proceso debe ser, por
supuesto, muy precisa, pero esto puede lograrse haciendo un número de corridas experimentales
lo suficientemente grande. Sin embargo, esta solución, por supuesto, es cara, y una forma de lograr
los mismos objetivos con menos recursos es localizando los valores de las variables independientes
estratégicamente para cada corrida experimental. Por tanto, si los experimentos se planifican
adecuadamente, se obtiene la información deseada en una forma eficiente.

Un plan experimental bien diseñado y su posterior ejecución ayuda en la selección de un mejor


modelo, dentro de un conjunto de modelos posibles y la estimación eficiente de los parámetros en
el modelo seleccionado. Ambos objetivos se investigan simultáneamente y casi siempre en forma
secuencial, porque el experimentador generalmente no conoce qué variables deben medirse, cuál
es el rango en que las variables se deben medir ni qué series de experimentos deben hacerse hasta
que el programa experimental esté al menos parcialmente ejecutado. Generalmente un plan
experimental comienza con una hipótesis expresada en forma de un modelo matemático.

Para probar la hipótesis se lleva a cabo un experimento, el cual, para obtener la información, se
debe diseñar adecuadamente. Los datos obtenidos del experimento tienen que analizarse para
evaluar la hipótesis original. Los resultados experimentales pueden conducir a modificar la hipótesis,
en cuyo caso una nueva hipótesis se formula o se confirma. En el primer caso, la nueva hipótesis
debe ser probada, para lo cual debe efectuarse otro plan experimental, y así se continúa hasta
obtener resultados satisfactorios. Un experimento es, por tanto, sólo una etapa que ayuda a la
comprensión del proceso bajo estudio. El investigador debe analizar cuidadosamente los resultados
de sus experimentos, para determinar las direcciones en que los cambios son realmente sustanciales
(Hrayr Der Hagopian Tlapancoa, 2016).

Este proceso iterativo que caracteriza la investigación científica se muestra de forma esquemática
más abajo (Figura 2). En esa figura se muestran los dos papeles distintos que la Estadística puede
desempeñar: diseño y análisis. De ellas, el más importante es el primero, el diseño: poca información
útil puede sacarse de los datos obtenidos en un experimento que no se ha planificado
cuidadosamente. Sin embargo, con un diseño adecuado, se puede obtener una clara visión de la
situación con métodos de análisis simples.

Figura 2 . Proceso Iterativo de la Investigación Científica.

La Modelación Matemática se trató ampliamente en otro Módulo de esta Maestría, por lo cual en
el presente capítulo se estudiarán las técnicas y procedimientos del Diseño Estadístico de
Experimentos (DOE por sus siglas en inglés). Para la resolución de los problemas se utilizará el
software estadístico StatEase Design Expert en su versión 11 (DX-11) (StatEasy Co., 2018), ya que
es un software diseñado específicamente con este fin, mientras que otros muchos de los utilizados
son parte de paquetes estadísticos más complejos (Douglas C. Montgomery, 2004). Los ejemplos a
analizar se tomarán de distintos Bioprocesos y en lugar de realizar los experimentos en el
laboratorio, los mismos se realizarán mediante simulaciones, utilizando el Simulador Numérico
Berkeley Madonna (Diane Hoffoss, 2013) o el Simulador de Procesos Biotecnológicos SuperPro
Designer (Intelligen Inc., 2013).

. Co eptos ási os del Diseño Estadísi o de Expe i e tos


El Diseño de un Experimento consiste en planificar los experimentos de la forma más racional
posible, de manera que los datos obtenidos puedan ser procesados adecuadamente y que mediante
un análisis objetivo conduzcan a deducciones aceptables del problema planteado, para lo cual se
sobreentiende que la persona que formula el diseño conozca los objetivos de la investigación
propuesta.

Antes de comenzar el trabajo experimental se debe, por lo tanto, tener la información requerida del
sistema que permita contestar a las interrogantes siguientes:

1. ¿Cuáles son las propiedades de sistema que se van a estudiar?, o sea los llamados rendimientos
o variables dependientes.
2. ¿Qué factores afectan a estos rendimientos?, es decir qué parámetros o variables
independientes que determinarán los rendimientos y si se podrán controlar o medir
adecuadamente.
3. ¿Qué factores se estudiarán y cuáles permanecerán constantes?
4. ¿Cuántas veces se deben repetir los experimentos?
5. ¿Qué cantidad de experiencias se deben efectuar?
6. ¿Cómo se deben realizar las experiencias?

Algunas de estas preguntas sólo se pueden responder por el conocimiento científico-técnico del
sistema, como por ejemplo las tres primeras, mientras que las restantes requieren del conocimiento
científico-técnico, del diseño estadístico de experimentos y de la lógica para su contestación.

El proceso de investigación en general, independientemente de le escala en que se halle


(laboratorio, banco o piloto), se desarrolla a través de una serie de etapas bien definidas:
familiarización, tamizado de variables y optimización.

En la etapa de familiarización, el investigador se familiariza con el nuevo sistema estudiar. Por


ejemplo, en la etapa de laboratorio (Roberto A. Gonzalez-Castellanos et al., 2013a), esto puede ser
el tratar de reproducir resultados descritos en las patentes o en experimentos de estudios
anteriores, o aprender a trabajar con un equipamiento nuevo. En una planta piloto (Roberto A.
González, 2000), esta etapa se refiere a la serie de corridas preliminares que deben realizarse para
poder probar todos los componentes de la planta, incluyendo los equipos de medición y control.
Además, es necesario determinar el tiempo de transición entre dos estados estacionarios del
proceso, o sea el tiempo que se requiere para que se alcance el estado estacionario, después de una
variación en las condiciones del proceso.

En esa etapa inicial de familiarización no resulta de utilidad el Diseño Estadístico de Experimentos,


ya que la mayoría de las experiencias se realiza de una forma intuitiva. Sin embargo, en todo el
proceso posterior, comenzando con el Tamizado de Variables, resulta imprescindible la utilización
del Diseño Estadístico de Experimentos y por ello no se debe comenzar ningún trabajo experimental
sin hacer previamente algún tipo de diseño pues puede ocurrir, si esto no se hace, que al final los
datos obtenidos no sean capaces de permitir el análisis de los efectos buscados.

Desafortunadamente muchas veces se trata de llevar el enfoque de la etapa inicial de


familiarización al resto de los trabajos y todavía persisten en muchos investigadores la costumbre
de iniciar sus trabajos sobre un sistema nuevo y, por lo tanto, poco conocido, mediante métodos de
tanteo intuitivos con el pretexto de no poder aplicar las herramientas estadísticas hasta que no se
tenga un conocimiento más amplio del sistema.

Este proceder erróneo provoca la realización de un gran número de experiencias preliminares antes
de que se logre obtener de verdad información orientadora. En realidad, es precisamente al
comenzar el estudio de un sistema nuevo, cuando es más recomendable iniciar la investigación
aplicando técnicas de Diseño Estadístico de Experimentos, especialmente de aquellas con las cuales
se puede estudiar el efecto de algunas variables en conjunto y definir sobre una base sólida, cuáles
de éstas son significativas (Tamizado de Variables).

En general se puede decir que hay tres principios básicos del Diseño Experimental:

 Reproducción: Es la repetición del experimento básico para estimar el error puro o aleatorio,
que permitirá determinar si las diferencias observadas son significativas o no.
 Aleatorización: En la mayoría de las pruebas estadísticas se supone que las muestras son
independientes unas de otras y que sólo están afectadas por los parámetros que se controlan.
Para garantizar esto se requiere tomar las muestras al azar o aleatoriamente de la población
investigada.
 Control local: Se refiere implícitamente, en primer lugar, al tipo de diseño experimental que se
haya realizado y en segundo lugar a las medidas que se tomar para controlar el proceso
experimental como, por ejemplo:

1- Utilizar material o bloqueo experimental homogéneo para la estratificación cuidadosa del


material disponible.
2- Dirigir el experimento cuidadosamente.
3- Considerar las posibles variantes aleatorias
4- Emplear las técnicas analíticas y los equipos de control más adecuados.

Por último se debe señalar que es conveniente discernir dos grandes campos del Diseño Estadístico
Experimental, por una parte las Ciencias Biológicas y Agrícolas, en las que se utilizan principalmente
los diseños completamente al azar, bloques al azar y los cuadrados latinos y por otra parte las
Ciencias Técnicas, Química, Física y Farmacéuticas y algunos campos de las Ciencias Biológicas como
la Microbiología y la Genética Microbiana, en las cuales existe la posibilidad de controlar un número
finito de variables, en cuyo caso se emplean principalmente los Diseños Factoriales.
En este Capítulo se dará sólo una visión breve y general del Diseño Experimental en Biología y
Agronomía y se estudiará con más detalles el Diseño Experimental aplicable a las Ciencias Técnicas,
Física, Química y Farmacéutica y la Microbiología, haciendo énfasis en su aplicación práctica
mediante la utilización del software estadístico Design-Expert . Para un análisis más detallado del
Diseño Experimental en el campo de la Biología y la Agronomía se deben consultar textos
especializados como "Diseños Experimentales con aplicación a la agricultura y a la ganadería",
(Emilio Padrón Corral, 2013) Experimental Design and Data Analysis for Biologists (Gerry P.
Quinn & Michael J. Keough, 2002).

1.1. El Diseño Experimental en Biología y Agronomía.

Diseños completamente al azar, bloques al azar y cuadrados latinos.


Como este texto está dirigido fundamentalmente a los procesos de las Ciencias Técnicas, Químicas,
Físicas, Farmacéuticas y la Biotecnología, a continuación, solo se mencionarán brevemente los tipos
de diseño más utilizados en la investigación biológica y agronómica:

1. El Diseño Completamente al Azar, es un diseño en el cual los tratamientos a las unidades


experimentales se realizan aleatoriamente, o sea que no se imponen restricciones en la
distribución de los experimentos a estas unidades. Por ser tan simple, es un diseño muy
utilizado, sin embargo, hay que tener en cuenta que sólo deben ser aplicados a unidades
experimentales homogéneas.

Ejemplo de Diseño Completamente al Azar (clasificación simple): Se desea estudiar el efecto de


distintos tipos de alimentación en 30 cerditos seleccionados para los cuales se asume que sean
similares en su comportamiento. No obstante, siempre existe la posibilidad de que existan
diferencias entre ellos, por lo que resulta conveniente realizar las experiencias aleatoriamente,
o sea, asignarle al azar un orden de ejecución a la aplicación de los alimentos a los cerditos. Esto
se puede efectuar numerando simbólicamente los cerditos del 1 al 30, colocar 30 papeles
numerados en una bolsa y sacar los números al azar. El primer número que salga recibirá el
tratamiento F-1, el segundo el tratamiento F-2 y así sucesivamente.

Tabla 1. Ejemplo de Diseño al Azar.

Franja Parcela

1 C A E B D

2 B E D A C

3 D C B E A

4 E D A C B

5 A B C D E
2. El Diseño en Bloques al Azar es, sin lugar a dudas, el diseño más utilizado en la investigación
agrícola y biológica y en el mismo las unidades experimentales se distribuyen en grupos o
bloques, de manera que las unidades experimentales dentro de un bloque sean realmente
homogéneas, y el número de unidades experimentales dentro de él, sea igual al número de
tratamientos por investigar. En este caso se asignan al azar los tratamientos a las unidades
experimentales dentro de cada bloque y la formación de bloques refleja el criterio del
investigador respecto a las respuestas diferenciales potenciales de las diversas unidades
experimentales, mientras que el proceso de aleatorización actúa como una justificación de la
suposición de independencia.

Ejemplo:

Se desea probar el efecto de 10 tipos de alimentación en 40 cerditos, que se distribuyen en 4


bloques de acuerdo con sus pesos iniciales. Los cerditos más pesados se agrupan en el primer
bloque (10 cerditos) y así sucesivamente. Los 10 tratamientos (desde A hasta J) se asignan al
azar (Tabla 1).

Tabla 2. Ejemplo de Diseño de Bloques al Azar.

Bloque Tratamiento

1 H B F A C I E J D G

2 A I G H J D F E C B

3 E A C I B H D G J F

4 J F D B H I A C G E

3. En el Diseño en Cuadrados Latinos (Douglas C. Montgomery, 2004), el diseño es un arreglo


cuadrado y que las cinco formulaciones (o tratamientos) se denotan por las letras latinas A, B,
C, D, E, de ahí su nombre de cuadrado latino. Se observa que a los lotes de materia prima
(renglones), como los operadores (columnas) son ortogonales a los tratamientos. El diseño de
cuadrado latino se usa para eliminar dos factores de variabilidad perturbadora, es decir, permite
hacer la formación de en realidad dos restricciones sobre la aleatorización. En general, un
cuadrado latino para p factores, o cuadrado latino p x p es un cuadrado con p renglones y p
columnas. Cada una de las p2 celdas resultantes contiene una de las p letras que corresponde a
los tratamientos y cada letra ocurre una y sólo una vez en cada renglón y columna. el número
de réplicas debe ser igual al número de variantes o tratamientos, los cuales se distribuyen al
azar. Como ejemplo, considere el problema de una formulación de fertilizantes, donde tanto los
lotes de materia prima como los operadores representan restricciones sobre la aleatorización.
El diseño para este experimento se muestra más abajo (Tabla 3) y es un cuadrado latino de 5x5.

Tabla 3. Ejemplo de cuadrado Latino 5 x 5.

Análisis de Varianza y Prueba de Duncan.


Frecuentemente se presenta en la investigación agrícola y biológica el estudio de múltiples
variantes, donde se deben tener en cuenta los efectos producidos por varios factores. En estos casos
resulta conveniente planificar las experiencias de acuerdo con las diversas posibilidades, por
ejemplo, mediante diseños completamente aleatorizados, bloques aleatorizados, cuadrados latinos
o rectángulos latinos y procesar los resultados por medio del análisis de Varianza para determinar
si existe variabilidad significativa entre los tratamientos. Si se desean comparar las medias se podría
usar la prueba t de Student, realizada una tras otra (cada vez con dos medias) con todas las parejas
de valores posibles, pero además de perderse mucho tiempo no es del todo correcto, pues esta
prueba se ha desarrollado para comparar sólo dos muestras (de distribución normal); así, en este
caso se prefiere la prueba de Duncan.

Para definir el tipo de Análisis de Varianza a aplicar se parte del número de factores (variables
independientes) que se han investigado en un experimento dado.

Siempre que sea posible es preferible considerar muestras de igual tamaño para simplificar los
resultados y aumentar la precisión de las conclusiones. Las variaciones experimentales son el
resultado del cambio de un solo factor; por ejemplo: distintas concentraciones de un nutriente en
una dieta, distintas formas de realizar una experiencia, etc. En esos casos resulta muy común
emplear los diseños completamente al azar y se pueden emplear entonces los Análisis de Varianza
de clasificación simple, la prueba múltiple de t o la mínima diferencia significativa, aunque se
prefiere en la actualidad el uso de la prueba de Duncan o de rango múltiple.

Cuando se estudia el efecto combinado de dos factores, como por ejemplo el tipo de alimentación
y peso inicial de los animales de experimentación; variedad de una planta y tipo de suelos, etc., es
necesario utilizar entonces el método de Análisis de Varianza de clasificación doble, complementado
con la prueba de Duncan. En este tipo de experimentos el número total de variantes a estudiar es
igual al producto de los niveles del primer factor por los niveles del segundo factor y se organizan
ya sea por el método de los bloques al azar o por los cuadrados latinos.

En la actualidad existen otros diversos tipos de diseños en los experimentos biológicos y


agronómicos que se han adecuado para situaciones particulares, como, por ejemplo, los métodos
con Análisis de Discriminante, Análisis de Componentes Principales, de Clasificación Triple, etc., que
pueden ser consultados en textos especializados (Tabla 4), como los mencionados más arriba.
Tabla 4. Análisis multivariados (de Badii et al., 2004).

1.2. El Diseño Experimental Estadístico en las Ciencias


Técnicas, Químicas, Físicas, Farmacéuticas y la Biotecnología
Introducción.
En este campo de trabajo es usual trabajar con pocas variables, conocidas y casi siempre
controlables, por lo que se planifican los experimentos con vistas a obtener modelos matemáticos,
empíricos, o mecanísticos, que describan el sistema estudiado. Aquí es importante destacar que este
tipo de situaciones no se observa sólo en las Ciencias Técnicas, sino que se observa también en
algunos campos de las Ciencias Biológicas, como por ejemplo en la Microbiología y en el Crecimiento
y Genética Microbiana.

En este punto resulta conveniente definir la palabra experimento, puesto que puede resultar
ambigua, al igual que otros términos utilizados en un diseño estadístico. En este tipo de problemas,
una corrida experimental (o simplemente una corrida como se nombra usualmente), es
simplemente un experimento único, mientras que un grupo de corridas, dirigidas hacia la obtención
de algún objetivo, se denomina Diseño Experimental o simplemente diseño.

La anatomía de una corrida se representa más abajo (Figura 3) (Douglas C. Montgomery, 2004). El
resultado de la corrida es una respuesta obtenida u observación hecha en una unidad experimental.
El valor de la respuesta para cualquier corrida, dependerá de los ajustes de una o más variables
experimentales o factores, los cuales están bajo el control directo del investigador.

Desafortunadamente para los experimentadores, este cuadro de una corrida experimental incluye
además muchas variables no controladas y a veces incluso desconocidas, que también influyen en
la respuesta y que tienden a provocar variaciones tanto sistemáticas como aleatorias que tienden a
enmascarar los efectos verdaderos de los factores en la respuesta. Como ejemplo de dichas variables
están el efecto sistemático de las condiciones ambientes y las diferencias en el equipamiento,
material de arrancada y técnicas empleadas en los experimentos. Variaciones aleatorias se pueden
producir también por errores en las pesadas, en la transferencia de materiales y en la lectura de
instrumentos. Por todo esto, un buen Diseño Experimental debe considerar las posibilidades de
impacto de ese tipo de variables, en la posibilidad de sacar conclusiones adecuadas de los
experimentos y poder alcanzar los objetivos experimentales.

Figura 3.Proceso Iterativo de la Investigación Científica.

Los principales elementos en general, que se deben considerar en un Diseño Estadístico de


Experimentos, se presentan en la Tabla 5 (Douglas C. Montgomery, 2004). El primero resulta obvio,
no obstante, es sorprendente como en muchos casos no se llegan a resultados adecuados por
defectos en el planteamiento inicial del problema.

Tabla 5. Elementos del Diseño Estadístico de


Experimentos.
La relación de variables de respuesta también resulta de vital importancia y ya no resulta obvia. Las
respuestas pueden ser cuantitativas (continuas), cualitativas (discontinuas) y binarias. De ellas las
de más fácil manejo son las continuas y para las discontinuas una buena solución es evaluarlas en
una escala numérica, por ejemplo, de 5 a 10, convirtiendo así la respuesta a una variable semi
cuantitativa. En el caso de las binarias, puede tratarse también de llevar a formas discontinuas, pero
muy frecuentemente se necesitan emplear técnicas especiales para su manejo.

Los factores o variables independientes experimentales, son controlados por el experimentador y el


nivel de un factor es el valor fijado para el factor durante una corrida experimental. Al igual que las
respuestas, los factores pueden ser clasificados de acuerdo con la escala de medición, como
continuos o cuantitativos como el tiempo y la temperatura y cualitativos, discontinuos o categóricos
como el tipo de catalizador o solvente empleado. También en este caso son más difíciles de manejar
los discontinuos y la solución común es emplear dos niveles en el experimento, definiendo con (+1)
o simplemente con el signo (+) la presencia o el carácter positivo del factor y con (-1) o con el signo
(-), lo contrario.

Selección de los modelos a emplear en un Diseño Experimental.


Cuando la respuesta y los factores son continuos, se debe considerar la relación factor/respuesta en
términos de una función matemática o modelo. En las primeras etapas de la investigación, cuando
se conoce poco sobre la verdadera relación factor/respuesta, resulta suficiente considerar un
modelo empírico sencillo tal como un polinomio de primero o segundo orden. Ya en etapas más
avanzadas de la investigación puede considerarse un modelo determinístico, derivado de los
principios fundamentales, ya que con ese tipo de modelos puede obtenerse la requerida precisión
en la predicción en un amplio rango de condiciones.

En el caso de un factor único, el modelo empírico más simple es la función de primer orden (modelo
lineal), cuya gráfica se muestra más abajo (Figura 4).

Figura 4. Modelo lineal.

Y  B0  B1 X (1)

En la ecuación matemática (1), los parámetros del modelo, B0 y B1, se denominan intercepto y
pendiente respectivamente. Ese modelo se muestra resulta útil para predecir la respuesta Y en un
rango limitado del factor X. También resulta útil en la etapa de Tamizado de Variables, cuando el
interés debe centrarse en los factores que tienen un mayor efecto en la respuesta Y. En ese caso, si
b1 tiene un valor cercano a cero, se dice que el factor no tiene un efecto significativo en la respuesta.

En general se tiene la tendencia a considerar que la relación factor/respuesta tiene una forma curva
y en ese caso se obtiene una mejor representación con la función de segundo orden (Figura 5):

Figura 5. Modelo de segundo orden.

Y  B0  B1 X  B11 X 2 (2)

En la ecuación matemática (2), se muestra la determinación de un óptimo muy aproximado,


localizado en un nivel del factor igual a -B1/2B11. Por su parte, al coeficiente B11 se le denomina
coeficiente de curvatura. Si B11 es cercano a cero, se dice entonces que la respuesta no tiene
curvatura y por ello es aproximadamente de primer orden, es decir lineal, con respecto al factor X.

Para el caso de la existencia de dos o más factores, puede existir una situación más complicada
conocida como interacción, lo que significa que los factores no operan independientemente sobre
la respuesta. En el caso de que exista independencia en lugar de interacción, se dice entonces que
los factores son aditivos. Cuando no hay o es muy poca la curvatura con respecto a cualquiera de
los factores, el modelo más simple para dos factores se muestra en la ecuación más abajo (3:

Y  B0  B1 X1  B2 X 2  B12 X1 X 2 (3)

en el cual B1 y B2 son las pendientes correspondientes a los factores X1 y X2, respectivamente,


mientras que B12 es el parámetro de interacción y cuando el mismo se hace cero, se está en
presencia de un modelo aditivo de primer orden. En ese caso cuando se grafica Y vs. X1 para dos
valores constantes de X2 cualesquiera, se obtienen dos líneas rectas paralelas, como en la figura que
se muestra más abajo (Figura 6).
Figura 6. Modelo aditivo de primer orden.

Cuando el término B12 tiene un valor distinto de cero el modelo es interactivo. En ese caso un gráfico
de Y vs. X1 para dos valores constantes de X2 produce dos líneas rectas no paralelas, como se
muestra en la figura más abajo (Figura 7).

Figura 7. Modelo segundo orden interactivo.

Cuando la relación existente entre la respuesta y un factor es de forma curva, entonces debe
añadirse un término cuadrático o de curvatura. En ese caso el modelo completo de segundo orden
se muestra en la ecuación siguiente (4):

Y  B0  B1 X1  B2 X 2  B11 X1  B12 X1 X 2  B22 X 2 (4)


2 2

Este tipo de modelos puede brindar una excelente descripción de la respuesta dentro de la región
de experimentación y puede usar para propósitos de interpolación o para encontrar un óptimo
interno grosero, si éste existe. En la figura 8, izquierda, se presenta un gráfico de Y vs. X1 para valores
constantes de X2. Otra forma útil de presentar esta relación es mediante un mapeo de los contornos
de la superficie respuesta Y sobre el espacio factorial definido por los valores de X1 y de X2 (Figura 8,
derecha). Este gráfico indica una respuesta máxima cerca del centro del espacio factorial. Sin
embargo, es importante enfatizar que este tipo de modelos empíricos de segundo orden, son muy
poco confiables para predicciones fuera del rango de experimentación en que han sido ajustados.
Figura 8. Modelo completo de segundo orden (izquierda): Modelo Gráfico de contornos de Y vs.
X1 y X2.

Para el caso general de n factores, la ecuación del modelo empírico general de segundo orden se
muestra a continuación:

 B0   Bi X i    Bij X i X j
n n n
Y
i 1 i 1 j 1

n  1n  2 / 2
(5)

Este modelo tiene parámetros a ser estimado. Puesto que este número de
parámetros puede llegar a ser muy grande rápidamente cuando se incrementa n, generalmente se
asume un modelo más sencillo (por ejemplo, un modelo de primer orden) al inicio de la
investigación, cuando el número de factores considerados es muy elevado y cuando el número de
factores se va reduciendo, el modelo se puede ampliar a uno de segundo orden, parcial o total o
incluso a un modelo teórico (determinístico).

Selección del nivel de los factores.


Otro elemento importante a considerar es la selección del nivel de los factores, ya que un Diseño
Experimental consiste precisamente en un conjunto de corridas experimentales, cada una de ellas
definidas como una combinación de los niveles de los factores. La elección de estos niveles es
influenciada considerablemente por el tipo de modelo matemático en consideración. Por
consiguiente, un Diseño Experimental se determina por el número y tipo de los factores en unión
con el tipo de modelo a emplear.

Para el caso más simple, de un factor único y un modelo de primer orden, sólo son necesarios dos
niveles del factor para estimar los parámetros B1 y B0. En esta discusión esos dos valores se pueden
codificar como alto y bajo o (+1) y (-1) o simplemente (+) y (-). El cambio en la respuesta entre esos
dos niveles se denomina el efecto principal del factor (Figura 9). Como el error aleatorio puede
fácilmente oscurecer el efecto principal si los niveles se toman muy cercanos, el efecto principal
puede ser estimado de manera más precisa si los factores se ajustan a niveles suficientemente
separados.
Figura 9. Estimado del efecto principal del
factor.

Si se considera un modelo de segundo orden, se necesita un tercer nivel del factor para estimar el
parámetro de curvatura B11. Ese tercer nivel normalmente se sitúa a medio camino entre los niveles
extremos del factor y se denomina como punto central y se codifica como medio o (0). El efecto de
curvatura se define entonces como la diferencia entre la respuesta experimental del punto central
y la respuesta esperada de un modelo de primer orden que se ajuste a los puntos extremos (Figura
10).

Figura 10. Estimado del efecto de curvatura.

En la práctica es difícil que se necesiten más de tres o cuatro niveles para un factor, excepto en los
casos en que se trata de seleccionar el mejor modelo teórico a emplear y pueden ser necesarios
entonces más niveles de los factores para poder seleccionar entre muchos modelos candidatos
(Douglas C. Montgomery, 2004).

Para más de un factor, cada corrida experimental se define como una combinación de niveles de
factores. Por ejemplo, en el caso de dos factores, el efecto de interacción debe ser estimado de
forma adicional a los dos efectos principales y para ello el mínimo número de corridas debe ser
cuatro, puesto que se deben estimar las dos pendientes de la relación Y vs. X1 y comparar esas
pendientes a dos valores de X2 para chequear si hay o no interacción. Si el efecto de interacción es
cero, las líneas son paralelas, como ocurre en la Figura 6.
Las cuatro corridas mencionadas anteriormente se conocen como un Diseño Factorial 22 y es un
miembro de la clase de diseños conocida como Factoriales 2n, o sea n factores por corrida, cada uno
de los cuales se evalúa a dos niveles y se tienen en cuenta todas las combinaciones posibles entre
dichos niveles y factores. Las combinaciones de niveles factoriales en los diseños 22 y 23 (Figuras 11
y 12), se representan como las esquinas de un cuadrado y un cubo respectivamente.

Figura 11. Combinación de niveles en el Diseño Factorial 2 a la 2.

Figura 12. Combinación de niveles en el Diseño Factorial 2 a la 3.

El efecto de curvatura se puede estimar en este tipo de diseño, añadiendo un tercer nivel de cada
factor en diversas combinaciones de los factores restantes. Sin embargo, en las etapas iniciales de
investigación es más económico analizar la curvatura global del sistema y eso puede ser hecho

Figura 13. Ubicación de puntos de réplica en el centro del diseño.


mediante la adición de una combinación de todos los factores en el punto central, localizado en el
centroide del diseño y en el caso de los diseños 22 y 23, la corrida en el punto central se localiza en
los centros del cuadrado y del cubo respectivamente, como se muestra más abajo (Figura 13).

Si la corrida en el punto central detecta un efecto de curvatura global apreciable, se deberán realizar
entonces corridas adicionales para obtener estimados separados del efecto de curvatura para cada
factor. Esas corridas adicionales se conocen como puntos axiales o de estrella y cuando se combinan
con los diseños 2n más el punto central, constituyen los denominados Diseños Compuestos Centrales
(Figura 14). En esos casos los puntos de estrella o axiales están localizados a una distancia  del
punto central, la cual varía desde 1 hasta 2n/4, donde n es el número de factores.

Figura 14. Diseño Compuesto Central.

Una de las mayores desventajas de los Diseños Factoriales 2n es el gran número de corridas que se
necesita cuando n se incrementa. Para resolver este problema, se utilizan determinadas fracciones
o subconjuntos de los Diseños Factoriales Completos. Esos Diseños Factoriales Fraccionarios, se
utilizan principalmente durante la etapa de Tamizado de las Variables, y pueden ser posteriormente

Tabla 6. Las dos fracciones del Factorial 23-1.


expandidos a fracciones mayores o incluso al diseño completo, cuando el número de variables se ha
reducido convenientemente. Más arriba (Tabla 6), se presenta un ejemplo de una Fracción 1/2 del
Factorial 23, conocida también como factorial 23-1, en la cual cualquiera de los dos conjuntos de 4
corridas puede dar un estimado de los efectos principales de un modelo de primer orden en tres
factores.

Concepto de Resolución.

Cuando se emplean los Factoriales Fraccionados para reducir el número de experimentos


necesarios, se pierde información sobre los efectos de las interacciones y para medir la magnitud
de ese efecto, se aplica el concepto de resolución. En líneas generales y de forma muy simplificada,
se puede decir que, a mayor resolución, menos efectos de interacción se pierden o confunden.

En la práctica la resolución se expresa en números romanos y su número coincide con el número


del Factorial Completo equivalente. O sea, la resolución V, corresponde al Diseño Fraccionado 25-1.
Como no tiene sentido aplicar el concepto de Factorial Fraccionado al Factorial 2 2, el Factorial
Fraccionado menor es el 23-1, y por lo tanto la resolución menor es la III. En la práctica es poco usual
trabajar con Factoriales Fraccionados mayores de 25-1, por lo tanto, se puede considerar que la
resolución mayor es la que corresponde a ese Factorial Fraccionado, o sea la V.

El mayor número de resolución de un diseño indica que se pierden o confunden menos


interacciones, por lo cual los diseños que tienen resolución V, brindan más información que los que
tienen resolución III, pero a costa de utilizar más corridas experimentales.

Diseños Saturados.

También se emplea una variante de los Diseños Factoriales Fraccionarios conocida como Diseños
Saturados, con los cuales se pueden tratar (n-1) factores con n experimentos, o una variante de los
mismos conocida como Diseños Plackett-Burman (Figura 15), en los cuales se tratan un número algo
menor, o sea (n-2) o (n-4) factores, para dejar de 2 a 4 columnas no asignadas para evaluar grupos
de interacciones (Gary W. Oehlert, 2010) (Douglas C. Montgomery, 2004). Este tipo de diseño es
muy útil y muy empleado en la etapa del Tamizado de Variables. Algo más recientemente se han
comenzado a aplicar las Técnicas de Diseño Robusto de Taguchi, también para un gran número de
variables, las cuales a su vez toman como punto de partida diversos tipos de Diseños Ortogonales.

Figura 15. Diseño Saturado Plackett-Burman.


Tamaño del Diseño Experimental.
Para determinar el tamaño de la muestra (el número de réplicas, n) apropiado en un diseño factorial
de dos factores es necesario determinar la potencia del experimento: Para esto podemos utilizar
varios procedimientos.

1. Un procedimiento teórico , apoyado en las curvas de operación características, que se presentan


en las páginas 647 a 654 del Apéndice V del libro de Montgomery, (Douglas C. Montgomery,
2004), un ejemplo de las cuales se muestra más abajo (Figura 16).

Figura 16. Ejemplo de curva característica para el análisis de varianza del


modelo con efectos aleatorios.
Los valores apropiados de Φ2 y los grados de libertad del numerador y del denominador, para
utilizar en esas figuras, para el caso del diseño factorial de dos factores se muestran más abajo
(Tabla 7). Una forma muy eficaz de emplear estas curvas consiste en encontrar el valor menor
de Φ2 que corresponde a una diferencia especificada entre las medias de dos tratamientos
cualesquiera.

Tabla 7. Parámetros de la curva de operación característica del Apéndice V del Montgomery,


para diseño de dos factores.
Por ejemplo, si la diferencia en las medias de dos renglones cualesquiera es D, entonces el valor
mínimo de Φ2 es:

Si la diferencia en las medias de dos colu as cuales uie a es D, e to ces el alo í i o de Φ2 es:

II
Po últi o, el alo í i o de Φ2 que corresponde a una diferencia D entre dos efectos de
interacción cualesquiera es:

III
Para aplicar este método se utilizará el ejemplo de experimento que se muestra a continuación
(Tabla 7), en el cual se prueban dos tipos de materiales para el ánodo de una batería, se chequea su
comportamiento en dos temperaturas diferentes y se mide la vida útil de la batería en horas.

Tabla 8. Experimento de la vida en horas de una batería.

Suponga que antes del experimento se decide que la hipótesis nula deberá rechazarse con una alta
probabilidad si la diferencia en la vida media de la batería entre dos temperaturas cualesquiera es
de 40 horas. Por lo tanto, D = 40 y, si se supone que la desviación estándar de la vida de la batería
es de aproximadamente 25, entonces se aplica la ecuación II y se obtiene:
como el valor mínimo. Suponiendo que α= . , aho a se puede usa estos datos y los de la Tabla
6, en las ecuaciones del Anexo V (Figura 17) (Douglas C. Montgomery, 2004), para construir una
tabla con los valores siguientes (Tabla 9):

Tabla 9. Determinación de número de réplicas en función de los parámetros del diseño.

Observe que con n=4 réplicas se obtiene un iesgo β de ce ca de . , o una probabilidad


aproximada de 94%, de rechazar la hipótesis nula si la diferencia en la vida media de la batería con
dos niveles de temperatura cualesquiera es hasta de 40 horas. Por lo tanto, se concluye que cuatro
réplicas bastan para proporcionar la sensitividad deseada siempre y cuando la estimación usada
para la desviación estándar de la vida de la batería no tenga un error grave. En caso de duda, el
e pe i e tado pod ía epeti el p ocedi ie to a te io co ot os alo es de Ơ pa a dete i a el
efecto que tendría una estimación equivocada de este parámetro sobre la sensitividad del diseño.

2. Utilizando el Design-Expert 11 (DE11). Esta variante se basa también en la potencia del diseño
y se ejemplificará mediante un ejemplo de diseño general de dos factores, seleccionado a partir
de la pantalla de selección del DE11 para los Diseños Regulares Factoriales de 2 Niveles (Figura
17).

Figura 17. Primera pantalla de selección de diseños factoriales de dos niveles del CX-11.
En la pantalla de selección inicial aparece una sola réplica. Consideremos primero una réplica
menos que el resultado del ejemplo anterior y después se hará el mismo análisis con el número
de réplicas que se obtuvo en el ejemplo anterior Replicates = , se obtiene la siguiente
pantalla:

Figura 18. Segunda Pantalla del proceso de selección del diseño factorial.

La siguiente pantalla es el asistente opcional para determinar la potencia del diseño y, de esa
forma, definir si el número de réplicas seleccionado es el adecuado. Si no es así, se repite el
proceso con otro número de réplicas. En la pantalla que se muestra a continuación (Figura 19),
se aprecia que es necesario definir dos valores fundamentales: la diferencia mínima a detectar
delta (Δ), a la ue se le de o i a “eñal . Basado e los datos del p i e eje plo, se to a á el
valor de 40. El otro valor a definir es el de la Desviación Estadística Estándar (Ơ), o Ruido, para
el cual se tomará el valor de 25, como en el ejemplo. De ambos valores se obtiene la Relación
Δ/Ơ), o sea (Señal/Ruido), que en este caso es de 1.6.

Figura 19. Pantalla del Asistente Opcional para determinar la potencia del diseño.

A partir de esos datos se procede a evaluar la potencia del diseño, teniendo en cuenta que la
recomendación del DX-11 es que el número de réplicas (potencia) es adecuado cuando es igual o
mayor al 80%. En la siguiente pantalla (Figura 20) se muestra el resultado de la evaluación y se aprecia
que .la potencia para ambos factores es 69.4%<80%, lo que significa que el número de réplicas
seleccionado (n=3) resulta insuficiente.

Figura 20. Resultado del análisis de la Potencia del Diseño.

Para repetir el proceso, se parte de la pantalla inicial de selección de DX-11 para el Diseño Factorial
Regular de Dos Niveles, definiendo el número de réplicas como 4 (Figura 21). Se mantienen los
mismos valores para la relación Señal/Ruido, por lo que las dos pantallas siguientes son iguales y la
diferencia está en la pantalla de evaluación (Figura 22).

Figura 21. Primera pantalla del segundo tanteo del número correcto de réplicas.
Figura 22. Resultado final de la evaluación de la potencia del diseño.

Como se aprecia en la figura, con cuatro réplicas la potencia es mayor de 84.1 > 80%, con lo que se
cumple el requisito del DX-11 para una significación (α) de 95% y coincide con el resultado obtenido
con el método anterior, basado en las ecuaciones del Montgomery.

Orden de la experimentación.
Para prevenir las tendencias sistemáticas de variables no controladas o desconocidas, durante la
ejecución del diseño, es prudente realizar de forma aleatoria las distintas corridas. Esto se puede
hacer utilizando cualquier proceso de generación de números aleatorios o mediante el empleo de
boletas numeradas en una caja, las que se van extrayendo al azar y definen el orden del
experimento.

También hay que considerar que las unidades experimentales no siempre son homogéneas y que
pueden diferir producto de alguna variable no controlada conocida. Esta situación requiere que las
unidades experimentales sean segregadas en bloques de unidades experimentales homogéneas.
Cada bloque puede ser considerado como un nivel de una variable extraña o de bloque. Ejemplos
de variables de bloque son las templas de materiales, el tipo de equipamiento, la estacionalidad,
etc.

El tamaño del bloque es el mínimo número de experimentos disponible en un bloque. Si el


tamaño del bloque es igual o mayor que la mitad de las corridas en un Diseño Factorial,
Completo o Fraccionario, el factor de bloqueo puede incluirse simplemente como otro
factor en el diseño.
Registro de los datos.

Un elemento importante a considerar es el proceso de codificación y descodificación del nivel de


los factores. Para el desarrollo del Diseño es conveniente, con vistas a asegurar la ortogonalidad del
mismo, utilizar los niveles codificados de los factores (-1, 0, +1 y , según el caso) y posteriormente
se necesita transformar esos niveles en los valores reales. Para ello se emplean las siguientes
ecuaciones:

Vi  Vn
Xi 
M (6)

Donde Xi es el valor codificado de la variable i, Vi es el valor real de la variable. A su vez Vn es el valor


promedio de la variable en el intervalo, o sea:

Vmax  Vmin
Vn 
2 (7)

y M es el módulo o recorrido de la variable que se calcula por:

Vmax  Vmin
M 
2 (8)

Selección del Diseño Estadístico de Experimentos a aplicar.

Para llegar a este punto es necesario tener en cuenta los elementos estadísticos del Diseño de
Experimentos que se han señalado anteriormente. Además, se deben tener disponibles las
siguientes informaciones:

1. Relación de las respuestas a ser estudiadas, junto con el estimado de cada error de
respuesta .
2. Relación de los n factores a ser estudiados, junto con los rangos (niveles alto y bajo) de cada
factor cuantitativo y lista de los niveles para cada factor cualitativo.
3. Planteamiento del problema a ser investigado junto con la selección del modelo matemático
adecuado.
4. Mínimo número de corridas necesario para obtener la precisión requerida en los estimados
del efecto de los factores.
5. Chequeo de la homogeneidad de las unidades experimentales y selección del esquema de
bloques en el caso de que fuese necesario.

Todos esos aspectos tienen que ser definidos en la etapa inicial de familiarización, con lo cual se
está en condiciones de pasar a las etapas siguientes o sea al tamizado de variables y la optimización.
En el caso de la optimización resulta conveniente analizar una primera etapa de optimización gruesa
y una etapa final de optimización.
Tamizado Inicial de Variables.
El método a aplicar depende del número inicial de variables a considerar y del número mínimo de
experimentos requeridos para obtener la precisión requerida. Los Planes Factoriales Completos se
emplean hasta un máximo de 4 variables; para 3 o más variables y hasta aproximadamente 15 se
pueden emplear los Planes Factoriales Fraccionarios y desde 5, hasta un número que puede llegar
a 100, se tienen disponibles los Diseños Saturados y los diseños de Plackett - Burman. En la figura
17, se presenta el rango de aplicabilidad de los tres primeros (Factoriales Completos, Factoriales
Fraccionarios y Diseños Saturados). En amarillo se recomiendan los Diseños adecuados para el
Tamizado, en función del número de variables y de la resolución que se desee.

Con ese tipo de diseños se pueden estimar los efectos principales y el efecto global de curvatura y,
en ciertos casos, grupos de interacciones. Después, en dependencia de los resultados
experimentales, estos diseños se pueden aumentar para expandir el rango de los factores existentes
y para estimar parámetros de modelos de orden mayor al segundo, en la etapa de optimización. De
esa forma, las investigaciones pueden desarrollarse en etapas, y los objetivos experimentales
pueden cambiar de acuerdo con los resultados de las etapas anteriores.

Durante esta etapa de tamizado de variables, el énfasis primario se hace en la identificación de los
factores más importantes y como tarea secundaria se tiene la detección grosera de los efectos de
segundo orden (curvatura e interacción), así como obtener mejores estimados del error de la
respuesta para su uso en las etapas posteriores de la experimentación y estos objetivos se reflejan
en el tipo de modelo seleccionado, el cual es siempre de primer orden, con la adición de los efectos
de interacción y curvatura, los cuales se miden de forma indirecta, ya que no son considerados en
el modelo.

Resulta evidente que la determinación de la manera de combinar los factores y niveles y la selección
entre ellas de la variante más adecuada para cumplir con los objetivos de una investigación, no
resulta fácil de determinar cuando el número de factores es mayor de tres, pero para facilitar esa
tarea, así como la posterior evaluación de los resultados obtenidos, se cuenta con paquetes de
programas especializados como el Design-Expert, que determinan de forma automática un grupo
de combinaciones de factores y niveles necesarios, entre las cuales puede el investigador
seleccionar la que mejor se adapta a sus necesidades. Por ejemplo, la Figura 17 se tomó de la
pantalla de selección que ofrece el Design Expert para comenzar a trabajar con los Diseños
Factoriales.

Después de escogido el diseño por este método se comienza el proceso de tamizado de las variables.
La operación de selección de las variables simplemente significa realizar pruebas de significación de
cada coeficiente estimado en el modelo ajustado. Si un parámetro estimado no es
significativamente diferente de cero, esto significa que las variaciones asociadas al factor, en el
intervalo seleccionado para el experimento en cuestión, produce un cambio despreciable en la
respuesta y por tanto ese factor no necesita ser considerado en la optimización posterior y puede
por lo tanto ser eliminado.

Ahora bien, en este punto hay que tener en cuenta que un valor muy bajo de un coeficiente dado
puede obtenerse también por las siguientes causas:

1. El nivel escogido para cada factor está cercano a un máximo condicional de la respuesta.
2. La magnitud del cambio para ese factor ha sido escogido desproporcionalmente pequeño.

La primera de esas causas será precisamente el criterio a utilizar en la búsqueda del óptimo en los
pasos de aproximación iniciales, como se verá más adelante y la segunda muestra una vez más la
importancia decisiva que tiene realizar desde el inicio una adecuada selección de la magnitud del
cambio a efectuar en cada factor, o sea sus niveles.

Como ejemplo de esta etapa del Diseño de los Experimentos se tiene un trabajo experimental para
la selección de los factores más importantes en el proceso de obtención de un producto bioquímico
a partir de la fermentación del jugo de un agave. En ese trabajo se partió de siete factores, y se
decidió estudiarlos en los niveles que se muestran en la Tabla 10.

Se aplicó un Diseño Saturado, con dos réplicas en el centro, con la ayuda del Design-Expert y se
obtuvo que las variables significativas son la temperatura y la agitación, por lo cual se pudo pasar a
la etapa posterior de optimización inicial y final. En ese caso particular, no fue necesario realizar la
etapa de Optimización inicial debido a que los niveles escogidos para el tamizado estaban
precisamente en la zona del óptimo, por lo cual se pudo pasar directamente a un Diseño Compuesto
Central, para la realización del cual se conservaron los resultados obtenidos en el Diseño Saturado
utilizado en el Tamizado.

Tabla 10. Niveles seleccionados para el Diseño


de Experimento de referencia.

Fase de optimización inicial.

Antes de llegar a esta etapa, el número de factores debe de haberse reducido a un máximo de tres
o cuatro y preferentemente no más de tres. En ésta los Diseños Experimentales se construyen
alrededor de los Diseños Factoriales Completos o Fraccionarios con un punto central único, aunque
en muchos casos los propios diseños empleados en el Tamizado de Variables pueden ser también
empleados para la etapa de optimización gruesa y pueden ser reanalizados en términos de los
factores sobrevivientes al tamizado.

En esta etapa se utiliza el método del camino del ascenso más rápido, para lograr un acercamiento
hacia el óptimo, mediante un modelo de primer orden, hasta alcanzar las cercanías de dicho óptimo
y pasar entonces a la etapa de Optimización Final .

Como ejemplo se tiene la investigación realizada a nivel de laboratorio de una hidrólisis enzimática,
en la cual se parte de un tamizado inicial de variables que arroja tres factores fundamentales, con
los cuales se pasa a la escala de banco para realizar la Optimización Inicial aplicando los Diseños
Factoriales Completos 2n. En este caso se aplicaron tres diseños 23, hasta que el último se amplió a
un Diseño Compuesto Central, por presentar curvatura. No obstante, en esa región no se
encontraba tampoco el óptimo, por lo cual debían continuarse los experimentos. (Los resultados
obtenidos se verán en la clase práctica).

Fase de Optimización final.


Esta fase requiere un modelo cuadrático completo para predecir con precisión el punto de óptima
respuesta:

 B0  B1 X 1 ...  Bn X n  B11 X 1 ... 


2
Y
Bnn X n  B12 X 1 X 2 ...  Bmn X m X n (9)
2

donde m = n-1 y todos los términos del modelo deben ser estimados.

El tipo de diseño empleado en esta etapa es el Diseño Compuesto Central, el cual es básicamente
un Factorial 2n aumentado con los puntos centrales y los puntos estrella, se pueden emplear
también los diseños 3n y el diseño tipo Box y Behnken, estando estas tres opciones disponibles en
el software utilizado.

Para el análisis final del óptimo, resulta útil obtener el gráfico de la Superficie Respuesta, así como
el Gráfico de los Contornos, los cuáles se obtienen también disponibles en el Design-Expert. Como
ejemplo se tiene el proceso de optimización final. En el Multifactor RSM Tutorial del software
DesignExpert V.11 se desarrolla por completo un ejemplo, el cual se resolverá en la Clase Práctica,
después de resolver un problema de Tamizado de Variables.

En el ejemplo del Tutorial, se obtiene primero un Gráfico de Contorno (Figura 23) y un Gráfico de
Superficie de Respuesta (Figura 24). Finalmente, con el proceso de optimización final, aplicando el
Método del Ascenso Acelerado (Figura 25) se obtiene la Superficie Respuesta con el valor óptimo,
en este caso el mínimo de la función objetivo (Figura 26).
Figura 23 Ejemplo de Gráfico de Contornos.

Figura 24. Ejemplo de Superficie Respuesta.


Figura 25. Búsqueda del óptimo por el Método del Ascenso más Pronunciado

Figura 26. Superficie Respuesta optimizada.


. Uiliza ió del pa uete de sotwa e estadísi o Design-Expert
pa a el Diseño Estadísi o de Expe i e tos.
En la Clase práctica, tomando como base los Tutoriales del Design Expert, se resolverá un problema
de Tamizado de Variables y una Optimización, llegando hasta la Optimización Final, utilizando el
software estadístico Design-Expert.

Bi liog aía
1. Diane Hoffoss. (2013). How to Get Berkeley Madonna Working (Parte de una asignatura). San
Diego: University of San Diego. Recuperado a partir de
http://home.sandiego.edu/~dhoffoss/teaching/math330/berkeley.pdf

2. Douglas C. Montgomery. (2004). Diseño y Análisis Estadístico de Experimentos (2.a ed.).


México: Limusa Wiley.

3. Emilio Padrón Corral. (2013). Diseños experimentales con aplicación a la agricultura y la


ganadería (2.a ed., Vols. 1–1). México: Editorial Trillas.

4. Gary W. Oehlert. (2010). A First Course in Design and Analysis of Experiments. W. H. Freeman
& Co. Recuperado a partir de http://users.stat.umn.edu/~gary/book/fcdae.pdf

5. Gerry P. Quinn & Michael J. Keough. (2002). Experimental Design and Data Analysis for
Biologists. Cambridge University Press.

6. Hrayr Der Hagopian Tlapancoa. (2016). Experimentos en una ciencia no experimental.


Investigación Económica, LXXV (295), 31-91.

7. Intelligen Inc. (2013). SuperPro Designer (SPD) Manual. Intelligen Inc. Recuperado a partir de
http://www.intelligen.com/demo.html

8. María Lucía B ito‐Valli a, Isid o Ale á ‐Ro e o, Ele a F aga‐Gue a, José Luís Pa a‐Ga cía, &
Ruth I e e A ias‐de Tapia. . Papel de la odelació ate ática e la fo ació de los
ingenieros. Ingeniería Mecánica, 14(2), 129-139.

9. Roberto A. González. (2000). Principios básicos de escalado. La Habana: Editorial Universitaria.

10. Roberto A. Gonzalez-Castellanos. (2013, noviembre 22). Simulación de Procesos


Biotecnológicos. Universidad Politécnica de Nicaragua. Recuperado a partir de
https://www.academia.edu/36812995/Modelaci%C3%B3n_y_Simulaci%C3%B3n_Biotecnol%C
3%B3gica_actualizada_09_06_2018_
11. Roberto A. Gonzalez-Castellanos, Mario Yll Lavín, & Lilian D. Curiel Lorenzo. (2013a).
Metodología de la Investigación Científica para las Ciencias Técnica (1.a ed., Vol. 2 daParte.
Organización y Ejecución de la Investigación). Matanzas: Camilo Cienfuegos. Recuperado a
partir de
http://monografias.umcc.cu/monos/2003/Monografia%20Met.%20Inv.%20Cientifica%20CT%2
0Segunda%20parte.pdf

12. Roberto A. Gonzalez-Castellanos, Mario Yll Lavín, & Lilian D. Curiel Lorenzo. (2013b).
Metodología de la Investigación Científica para las Ciencias Técnicas (1.a ed., Vol. 1era. Parte.
Diseño teórico y formulación del proyecto de investigación). Matanzas: Camilo Cienfuegos.
Recuperado a partir de
http://www.sld.cu/galerias/pdf/sitios/bmn/metodologia_de_la_investigacion.diseno_teorico_
y_formulacion_proyecto_investigacion.pdf

13. StatEasy Co. (2018). V- of Desig ‐E pe t® “oft a e: The What’s i It fo Me fo Doi g DOE.
StatEase. Recuperado a partir de http://datanalysis.cl/web2/wp-
content/uploads/2017/09/DX11-WIIFM.pdf

También podría gustarte