Está en la página 1de 14

INTRODUCCIÓN AL DISEÑO Y ANÁLISIS DE EXPERIMENTOS (ADE)

1. OBJETIVOS

Al final de este laboratorio, el estudiantes será capaz de analizar un experimento con un diseño factorial
para dos factores a dos niveles cada uno utilizando EXCEL. La meta es proveer al estudiante con la
habilidad de planear, diseñar, analizar y concluir válidamente con bases estadísticas de este tipo particular
de experimentos.

2. MATERIALES

• Excel versión 98 o más nuevo


• Notas de clase provistas en la sesión impartida por el instructor

3. ANTECEDENTES

El Diseño y Análisis de Experimentos (ADE) es el área de la estadística que tiene como objeto estudiar los
efectos de variables de interés dispuestas en varios niveles en una o varias respuestas o medidas de
desempeño. Sir Ronald A. Fisher introdujo ADE por primera vez en la primera mitad de los años 1930s en
el área de la agricultura. La mayoría de los campos de ingeniería y ciencias ahora practican las ideas de
Fisher junto con las cuantiosas contribuciones de muchos otros investigadores en el área.

Los ingenieros usan experimentos en su práctica diaria para alcanzar diversos objetivos. Algunos ejemplos
incluyen: encontrar condiciones factibles de operación paa un proceso o una máquina, optimizar una
medida de desempeño, investigar las causas de defectos de calidad, diseñar un sistema nuevo o hacer un
proceso insensible a la variación externa (robustez).

En general, se considera que la experimentación es una disciplina iterativa, donde se debe prestar debida
atención a la planeación, el diseño, y el análisis del o de los experimentos.

Los métodos estadísticos en ADE pueden hacer más eficiente la ejecución de experimentos y a menudo
fortalecen las conclusiones obtenidas de esta manera (Montgomery, 1997). Sin embargo, es siempre
recomendable usar el conocimiento no-estadístico de un proceso o sistema para complementar el proceso
de experimentación, así como para mantener el tamaño y la concentración del experimento dentro de
límites adecuados.

4. PROCEDIMIENTO

Este laboratorio se divide en dos partes:

La primer parte consiste en reproducir el análisis mostrado por el instructor en la primera sesión con ayuda
de EXCEL.
En la segunda parte se proveerá un conjunto de datos nuevo para que los estudiantes puedan llevar a cabo
un análisis similar a aquél de la primera parte.

1
Primera parte

Se recomienda mantener copias del material de la sesión impartida por el instructor para el material,
dado que este manual lo referenciará con frecuencia bajo el nombre de NOTAS.

En la sesión de clase, se explicó que el objetivo de este experimento es especificar el contenido de la carga y
la temperatura del molde en un proceso de moldeo de SMC para mejorar la calidad de la superficie descrita
por un índice de calidad. Supongamos que ya hemos planeado el experimento, y que decidimos usar un
diseño factorial para dos factores a dos niveles cada uno, ésto es un experimento factorial 22. (Ver páginas 10
y 11 de las NOTAS). Supongamos también que el experimento ya se llevó a cabo. Ahora lo que necesitamos
hacer es el análisis estadístico

1. Abrir Excel.

2. Introducir los datos experimentales.

Aquí están los datos del experimento (Página 12 de las NOTAS), cada número representa una
medición del índice de calidad bajo las condiciones especificadas por el renglón y la columna
correspondiente:

Temperatura del Molde (oF)


Carga (%) 302 327
40 90 86 98 87 89 107 102 105 94 91
44 85 104 82 79 84 72 77 78 82 67

Esta manera de representar los resultados de un experimento es muy conveniente dado que permite
visualizar la variación a través de columnas y renglones. Comencemos por introducir esta tabla en Excel
respetando el formato señalado arriba, y respetando las filas y columnas que se muestran en la ilustración.

3. Crear una tabla de operaciones preliminares

Una vez que se han introducido los datos, podemos calcular la tabla de análisis de varianza usando las
fórmulas que se detallan en las páginas 12-15 de las NOTAS. Esencialmente, queremos ver al final la tabla
que sigue (de la página 16 de las NOTAS).

2
Sin embargo, para llegar a esta tabla final, es necesario hacer algunos cálculos preliminares. Para ello, y
siempre siguiendo las fórmulas todavía de la página 12 de las NOTAS, podemos generar la siguiente tabla de
cálculos preliminares.

Primero introduzca las etiquetas “carga”, “temperatura”, “sumas de columna”, “sumas de renglón”,
“cuadrados de suma de renglón” y “suma de cuadrados” así como las etiquetas “40”, “44”, “302” y “327”.

En la celda D11, se introducirán la suma de las réplicas de los datos tomados bajo un determinado nivel de
carga y de temperatura. En este caso en D11 se introduce la fórmula =SUMA(C4:G4), donde el rango C4:G4
contiene los cinco datos tomados con una carga de 40% y una temperatura de 302 oF. Introducir fórmulas
similares para las celdas D12, E11, y E12.

Las sumas de columna y de renglón contienen las sumas correspondientes de datos. En este caso, la celda para
la columna 1, D13, contiene la fórmula =SUMA(D11:D12), donde el rango D11:D12 contiene las sumas de
datos a través de cada condición experimental específica (Nivel de carga, Temperatura). Introducir una
fórmula similar para la celda E13.

De manera similar, las sumas de renglón contienen las sumas a través de las columnas para cada renglón. Para
el primer renglón, la celda F11 contiene la suma de D11+E11. Introducir una fórmula similar para el segundo
renglón.

El gran total, en celda D13 contiene la suma de las celdas F11 y F12, que a su vez contienen sumas de
renglón.

Una columna más de cálculos (columna G) se necesita para obtener valores que necesitaremos después. Éstos
son los cuadrados de las sumas de renglón. Para el primer renglón, por ejemplo, se introduce la fórmula:
“F11^2”. Introduzca fórmulas similares para el renglón 2, y para cuadrar el gran total.

3
La suma de cuadrados en la celda D15 eleva al cuadrado cada medición experimental y suma estas cantidades.
Para lograrlo se introduce la fórmula = SUMA.CUADRADOS (C4:L5), donde el rango C4:L5 contiene todos
los datos experimentales.

Una vez terminado estos pasos, la tabla de cálculos preliminares se deberá ver como la tabla siguiente.

4. Crear la tabla de análisis de varianza

Con las fórmulas de la página 14 y 15 de las NOTAS, procederemos a crear la tabla de análisis de varianza.

Hay que recordar que el primer factor se encuentra variado a 2 niveles, asignamos a =2. De la misma manera,
el segundo factor se encuentra variado a b = 2 niveles. Y en total tenemos n = 5 réplicas por combinación de
condiciones experimentales.

Procederemos entonces a introducir las siguientes fórmulas (páginas 14 y 15 de las NOTAS detallan las
fórmulas):

Una vez que se hayan introducido estas fórmulas, se deberán observar los números siguientes:

4
Las sumas de cuadrados nos dan una idea un tanto burda de cuánta variación generó cada una de las fuentes
en nuestra medida de desempeño.

Los grados de libertad esencialmente nos indican el número de términos independientes en nuestras
sumatorias.

El cuadrado medio, que es la suma de cuadrados dividida entre los grados de libertad, puede entenderse como
la variación ajustada proveniente de cada fuente. El cuadrado medio del error es precisamente nuestro
estimador de la varianza en nuestros datos.

Los cocientes F0 comparan la variación generada por cada una de las fuentes (en el numerador), contra
aquella que tenemos como variación aleatoria, expresada por el cuadrado medio del error o varianza. Por
supuesto, cocientes mayores a 1 indican una variación producida mayor a la variación considerada aleatoria, y
aquellos menores a 1, una variación menor a aquella considerada aleatoria. Sin embargo, estos cocientes
deben aún compararse contra un valor de tablas para establecer bases estadísticas. Éste es el valor F alpha,
grados de libertad del numerador, grados de libertad del denominador. Alpha (α) es la probabilidad de un
error tipo I, que en este contexto se refiere a concluir que hay un efecto significativo de alguna fuente cuando
en realidad no lo hay.

Con la salvedad de checar algunos supuestos acerca de los residuos (que explicamos más adelante), para
obtener conclusiones de la tabla de análisis de varianza se utilizan generalmente los siguientes criterios:

1) Si F0 ≥ Fα, GL num, GL denom para determinada fuente de variación, entonces concluiremos que esta fuente de
variación afecta significativamente a la medida de desempeño al nivel especificadoα.

2) Si valor-p ≤ α para determinada fuente de variación, entonces concluiremos que esta fuente de variación
afecta significativamente a la medida de desempeño al nivel especificadoα.

Es conveniente notar en este punto que el nivel α escogido para estos ejemplos es de 5% (α = 0.05), y que ese
valor se introdujo en EXCEL junto con los grados de libertad para el numerador y el denominador para
obtener la Fα, GL num, GL denom. Alternativamente se pudo haber encontrado este valor de las tablas de la
distribución F. También es necesario hacer hincapié que se utilizaron las funciones de EXCEL para
determinar convenientemente el valor-p, lo cual puede ser un poco trabajoso si se utilizan las tablas. Una
interpretación general del valor-p es decir que es el mínimo valor de α bajo el que aún concluiríamos que
determinada fuente de variación tiene un efecto significativo. Con esta interpretación no debe sorprender que

5
un valor-p muy bajo (digamos < 0.005) indica una fuerte evidencia en favor de que una fuente de variación
sea significativa.

Entonces, salvo un análisis de residuos, hasta este punto los resultados apuntan a que, al nivel α especificado
1) La carga tiene un efecto estadísticamente significativo en el índice de calidad. Ésto quiere decir que
podríamos ajustar independientemente el contenido de carga en nuestra formulación para manipular este
índice).
2) La temperatura del molde no tiene un efecto estadísticamente significativo por sí solo si se varía
independientemente.
3) Sin embargo, la interacción entre ambos factores (nivel de carga y temperatura de molde) es
significativa. Ésto quiere decir que cuando se varían juntos, el índice de calidad muestra un
comportamiento completamente distinto que cuando uno de los factores se varía por sí sólo.

5. Hacer un análisis de residuos

Cuando se hace un análisis de varianza, en realidad lo que se está haciendo es tratar de aproximar los datos
con un modelo estadístico. En este caso, el modelo es el llamado modelo lineal general de efectos fijos y tiene
la forma:
yijk=µ+τi+βj+(τβ)ij+εijk

donde i=1,2,…,a; j=1,2,…,b; y k=1,2,…,n


µ es el efecto promedio general, τI es el efecto del factor A en su i-ésimo nivel , βj es el efecto del factor B en
j-ésimo nivel, (τβ )ij es el efecto de la interacción del factor A con el factor B cuando A está en su i-ésimo
nivel y B en su j-ésimo nivel; y por último, εijk es un componente de error aleatorio denominado residuo que
se supone que sigue una distribución normal con media igual a 0 y con un valor de desviación estándar σ.

Podemos obtener las cantidades µ, τ1, τ2, β1, β2, (τβ )11, (τβ )12, (τβ )21, (τβ )22 para nuestro ejemplo, dado que
son los efectos fijos. Los podemos calcular de la siguiente manera: primero definamos una tabla para calcular
promedios como se muestra a continuación tanto en las fórmulas como en la salida numérica:

6
Ahora utilizaremos estos números para encontrar los parámetros de nuestro modelo estadístico usando las
fórmulas siguientes (verificar que se obtengan los valores mostrados):

Usaremos estos términos para predecir nuestros datos experimentales. Nótese, sin embargo, que solamente
tenemos cuatro combinaciones experimentales (ver página 11 de NOTAS), así que solamente podremos hacer
estas cuatro predicciones. Sin embargo, sabemos que tenemos 5 réplicas por cada combinación experimental
(20 datos experimentales en total), por lo tanto, para cada una de las cinco réplicas nuestra predicción será la
misma y tendremos una discrepancia. Esta discrepancia es un residuo. Evidentemente en nuestro experimento
tenemos 20 residuos.

Introduzcamos primero las fórmulas para nuestras predicciones:

Para corroborar los valores que se deben mostrar en la pantalla son los siguientes:

7
Obtengamos ahora los residuos o errores de nuestro experimento.

Para corroborar, los valores que se deben tener en los residuos después de estas fórmulas son:

Estos residuos, tal como lo señalamos anteriormente, deben cumplir con tres supuestos: (1) deben ser
normalmente distribuídos, (2) deben ser independientes, y (3) deben mantener una desviación estándar
constante σ.

Aunque existen técnicas estadísticas formales para probar estos tres supuestos, nuestro interés aquí es mostrar
la intuición de un método gráfico.

8
Antes de comenzar a graficar, será necesario crear la siguiente tabla para contar la frecuencia de los datos en
intervalos dados (el tamaño de los intervalos lo decide uno):

Por otro lado, necesitaremos la siguiente tabla (esencialmente con cálculos anteriores):

9
10
SUPUESTO 1: Los residuos deben ser distribuidos normalmente.

Para verificar este supuesto utilizaremos (un tanto liberalmente) un histograma de frecuencia.

El histograma de los residuos debe asemejar una distribución normal centrada en 0. Al examinar el histograma
que obtuvimos, se puede ver que aproximadamente sigue una forma de campana similar a la de una
distribución formal, aunque un poco sesgada a la izquierda. Se considera que desviaciones de normalidad
como las que se muestran en este histograma no son de mucha importancia. Se debería revisar la corrida que
tiene el residual con magnitud cercana al 20 para cerciorarse que no es un error de dedo, de organización, o
incluso de la ejecución del experimento (como la falta de calibración, cambio accidental de condiciones, etc.).

SUPUESTO 2: Los residuos deben ser independientes.

Para verificar este supuesto utilizaremos un par de diagramas de dispersión.

SUPUESTO 3: Los residuos deben tener una desviación estándar constante.

Para verificar este supuesto utilizaremos un par de diagramas de dispersión también.

11
El primero de los gráficos, residuos vs. Orden de experimentación, se realiza para observar que no haya un
patrón reconocible i.e. que los residuos efectivamente se comportan de una manera aleatoria alrededor de 0. Si
este no es el caso, puede estarse violando el supuesto de independencia. En este caso la gráfica no muestra un
patrón determinado, aunque nuevamente hay un residuo que sobresale, el cual es el mismo que se detectó en
el histograma. Decidimos dejar este punto porque no se encontró nada que nos indicara que estuviera
equivocado en nuestro experimento, de tal manera que creemos que es variación que se puede encontrar en
nuestro proceso.

Los siguientes dos gráficos, residuos vs. Carga y residuos vs. Temperatura, proveen una buena manera de
checar que se tenga aproximadamente la misma dispersión alrededor de 0, i.e. que los residuos tengan un
desviación estándar aproximadamente constante. Dejando de lado el residuo grande que decidimos dejar, los
gráficos de este caso no acusan algo extremadamente problemático.

El último gráfico, residuos vs. Predicciones, nos sirve para checar que los residuos no se encuentren
correlacionados con la magnitud de las predicciones (pues eso violaría el supuesto de independencia), así
como checar que la dispersión sea aproximadamente la misma.

En resumen, hemos verificado que los supuestos de normalidad, independencia y homogeneidad de varianza
no se hayan violado en los experimentos a través del análisis de residuos. Checar que efectivamente no haya
una violación a estos supuestos, transfiere un buen apoyo estadístico y fortaleza a las conclusiones de nuestro
experimento.

12
6. Crear gráficas de efectos principales y de interacción.

Por último, se pueden crear las gráficas de efectos principales y de interacción a manera de ilustrar nuestras
conclusiones, aunque se debe evitar hacer conclusiones basados en el sólo uso de estos gráficos.

Segunda Parte

En la segunda parte de este laboratorio, se pide al estudiante repetir el procedimiento anterior con un Nuevo
conjunto de datos. Aunque los pasos son los mismos, el análisis del experimento y las conclusiones se deberán
basar en el nuevo conjunto de datos.

Temperatura de Molde (oF)


Carga (%) 275 302
40 77 72 75 77 80 90 86 98 87 89
44 76 75 75 69 62 85 104 82 79 84

13
EJERCICIO ADICIONAL

El director de operaciones de ComPósitos S.A., compañía que produce partes de resina poliéster reforzada
con fibra de vidrio (SMC), sabe que el tiempo de curado (tc) de las partes que producen en sus prensas
podría ser reducido ya sea incrementando la temperatura del molde (Tw) o precalentando el preformado de
SMC, esto es incrementando la temperatura inicial del material (To). Un tiempo menor de curado
implicaría un potencial aumento de su producción.

El director no sabe, sin embargo, si ambas acciones son importantes o no, o si es en realidad necesario
ejecutar ambas para mejorar más. Está dispuesto a asignar parte de su presupuesto para comprar una
unidad de precalentamiento para el material pero solamente si se puede justificar la adquisición.

Se ha pedido tu ayuda a tomar esta decisión. Tú (inteligentemente) sugieres que se lleve a cabo un
experimento factorial 22 para investigar los efectos que ambos, Tw y To, tienen en el tiempo de curado (tc).
Aquí están los resultados (el tiempo de curado se reporta en segundos y la temperatura en grados kelvin.

Temperatura del Molde (K)


Temperatura inicial
del material (K) 413 423
298 74.9 73.4 68.5 76.1 81.3 41.1 39.1 42.3 37.7 35.9
323 66.9 74.0 75.6 75.0 76.5 40.3 32.4 41.2 45.5 43.3

• ¿Se deberá comprar una unidad de precalentamiento de material?

En su respuesta, provea toda la evidencia estadística necesaria (tabla de análisis de varianza, análisis de
residuos, gráficos de efectos principales y de interacción, etc.) así como una discusión de qué indica el
análisis.

14

También podría gustarte