Está en la página 1de 100

Unidad 5 :Diseño de experimentos

En el campo de la industria es
frecuente hacer experimentos o
pruebas con la intención de resolver
un problema o comprobar una idea
(hipótesis).
Ejemplos

• hacer algunos cambios en los


materiales, métodos o condiciones
de operación de un proceso
• probar varias temperaturas en un
reactor químico hasta encontrar la
que dé mejor resultado
Ejemplos

•crear un nuevo material con la


intención de lograr mejorar o
eliminar algún problema.
Prueba y error
Sin embargo, es común que estas
pruebas o experimentos se hagan
sobre la marcha, con base en el
ensayo y error, apelando a la
experiencia y a la intuición, en lugar
de seguir un plan experimental
adecuado que garantice una buena
respuesta a los interrogantes
planteados.
El diseño estadístico de experimentos
es precisamente la forma más eficaz de
hacer pruebas.

El diseño de experimento consiste en


determinar cuales pruebas se deben
realizar y de que manera, para obtener
datos que sean analizados
estadísticamente.
Con el objetivo de que proporcionen
evidencias objetivas que permitan
responder los interrogantes
planteados, y de esa manera clarificar
los aspectos inciertos de un proceso,
resolver un problema o lograr mejoras.
Algunos problemas típicos que
pueden resolverse con el diseño y el
análisis de experimentos son los
siguientes:
• Comparar a dos o más materiales con
el fin de elegir el que mejor cumple con
los requerimientos.

• Comparar varios instrumentos de


medición para verificar si trabajan con la
misma precisión y exactitud.
Para que sirven los E.D.
Determinar las variables de un proceso
que tienen impacto sobre una o más
características del producto final.

Encontrar las condiciones de operación


(temperatura, velocidad, humedad,
presión) donde se reduzcan los
defectos o se logre un mejor
desempeño del proceso.
Para que sirven los E.D.

• Reducir el tiempo de ciclo del proceso.


• Hacer el proceso insensible o robusto a
oscilaciones de variables ambientales.
• Apoyar el diseño o rediseño de nuevos
productos o procesos.
• Ayudar a conocer y caracterizar nuevos
materiales.
Definiciones básicas en el diseño de experimentos

Experimento:
Es un cambio en las condiciones de
operación de un sistema o proceso,
que se hace con el objetivo de medir el
efecto del cambio sobre una o varias
propiedades del producto, proceso o
resultado.
Definiciones básicas en el diseño de experimentos

Por ejemplo, en un proceso químico se


pueden probar diferentes temperaturas
y presiones y medir el cambio
observado en el rendimiento del
proceso.
Unidad experimental

La unidad experimental es la pieza(s) o


muestra(s) que se utiliza(n) para
generar un valor que sea representativo
del resultado del experimento o prueba.
Unidad experimental

En cada diseño de experimentos es


importante definir de manera cuidadosa
la unidad experimental, ya que ésta
puede ser una pieza o muestra de una
sustancia o un conjunto de piezas
producidas, dependiendo del proceso
que se estudia.
Definiciones básicas en el diseño de
experimentos

Variables, factores y niveles


En todo proceso intervienen
distintos tipos de variables o
factores.
Definiciones básicas en el diseño de
experimentos

Variables de respuesta: a través de estas


variables se conoce el efecto o los
resultados de cada prueba experimental,
por lo que pueden ser características de
la calidad de un producto y/o variables
que miden el desempeño de un proceso.
Ejemplo de variable de respuesta
Por ejemplo: el rendimiento de un
proceso químico

El objetivo de muchos estudios


experimentales es encontrar la forma
de mejorar las variables de respuesta.

Por lo general, estas variables se


denotan con la letra y
Factores controlables:
Son variables de proceso o
características de los materiales
experimentales que se pueden fijar
en un nivel dado.
Factores controlables:

Son variables de entrada que usualmente


se controlan durante la operación normal
del proceso y se distinguen porque
existe la manera o el mecanismo para
cambiar o manipular su
nivel de operación.
Ejemplos de Factores controlables

Si en un proceso se usa agua a 60 °C,


entonces debe existir algún
mecanismo que permita fijar la
temperatura del agua dentro de algún
rango de operación.
Ejemplos de Factores controlables
Algunos factores que generalmente se
controlan son:

temperatura, tiempo de residencia,


cantidad de cierto reactivo, tipo de
reactivo, método de operación,
velocidad, presión etc.
A los factores controlables también se
los llama variables de entrada,
condiciones del proceso, variables de
diseño, parámetros del proceso, las x
de un proceso o simplemente factores.
Factores no controlables o de ruido

Son variables y características de


materiales y métodos que no se pueden
controlar durante el experimento o la
operación normal del proceso.

Por ejemplo, algunos factores que suelen


ser no controlables son:
Factores no controlables o de ruido

- las variables ambientales (luz, humedad,


temperatura, partículas, ruido, etc).
- el ánimo de los operadores.
- la calidad del material que se recibe del
proveedor.
Factores estudiados
Son las variables que se investigan en el
experimento, respecto de cómo influyen o
afectan a las variables de respuesta.

Para que un factor pueda ser estudiado


es necesario que durante el experimento,
se haya probado en al menos, dos
niveles o condiciones.
Niveles y tratamientos

Los diferentes valores que se asignan a


cada factor estudiado en un diseño
experimental se llaman niveles.

Una combinación de niveles de todos


los factores estudiados se llama
tratamiento o punto de diseño.
Tratamiento
Por ejemplo, si en un experimento se
estudia la influencia de la concentración y
la temperatura, y se decide probar cada
una en dos niveles, entonces cada
combinación de niveles (concentración,
temperatura) es un tratamiento.

En este caso habría cuatro tratamientos.


Niveles y tratamientos
Tabla de tratamientos
Nivel de Nivel de Tratamiento Y
concentración temperatur
a
1 1 1

2 1 2

1 2 3

2 2 4
Error aleatorio y error experimental:

Siempre que se realiza un estudio


experimental, parte de la variabilidad
observada en la respuesta no se podrá
explicar por los factores estudiados.
Error aleatorio y error experimental:

Esto es, siempre habrá un remanente de


variabilidad que se debe a causas
comunes o aleatorias, que generan la
variabilidad natural del proceso.
Error aleatorio y error experimental

Esta variabilidad constituye el


llamado error aleatorio
(incertidumbre estadística).
Error aleatorio y error experimental

Por ejemplo, será parte de este error


aleatorio, el pequeño efecto que tienen
los factores que no se estudiaron,
siempre y cuando se mantenga
pequeño o despreciable, así como la
variabilidad de las mediciones hechas
bajo las mismas condiciones.
Error aleatorio y error experimental

El error aleatorio también comprende


todos los errores que el
experimentador comete durante los
experimentos, y si éstos son graves,
mas que error aleatorio hablaremos
de error experimental
Principios básicos del diseño de
experimento
El diseño de experimento trata de
fenómenos que son observables y
repetibles.

Cualquier cosa observada se aprecia con


variabilidad, nada ocurre exactamente de
la misma forma dos veces
De acuerdo a lo anterior, el punto de
partida para una correcta planeación es
aplicar los principios básicos del diseño
de experimentos: aleatorización,
repetición y bloqueo.
Aleatorización
Consiste en hacer las corridas experimentales
en orden aleatorio (al azar) y con el material
también seleccionado aleatoriamente.

Este principio aumenta la probabilidad de que


el supuesto de independencia de los errores
se cumpla, lo cual es un requisito para la
validez de las pruebas de estadística que se
realizan.
También es una manera de asegurar
que las pequeñas diferencias
provocadas por materiales, equipos y
todos los factores no controlados, se
repartan de manera homogénea en
todos los tratamientos.
Repetición
Es correr más de una vez un tratamiento
o una combinación de factores.

Es preciso no confundir este principio con


medir varias veces el mismo resultado
experimental.
Repetir es volver a realizar un tratamiento,
pero no inmediatamente después de haber
corrido el mismo tratamiento, sino cuando
corresponda de cuerdo con la aleatorización.

Las repeticiones permiten distinguir mejor


que parte de la variabilidad total de los datos
se debe al error aleatorio y cual a los
factores.
Bloqueo
Consiste en tomar en cuenta todos los
factores que pueden afectar a la respuesta
observada.
Por ejemplo, si se quiere comparar cuatro
maquinas, es importante tomar en cuenta el
operador de las máquinas, en especial si se
cree que la habilidad y los conocimientos del
operador pueden influir en el resultado.
Experimentos con un solo factor

En Probabilidad y Estadística de segundo


año vimos los métodos para comparar dos
tratamientos o condiciones (poblaciones o
procesos), con la llamada prueba de
hipótesis.
Ahora vamos a comparar más de dos
poblaciones o procesos, o grupos de
personas, o reactores químicos
Ejemplo
En una industria química se desea
investigar la influencia de la
temperatura en el rendimiento de un
proceso químico.
Las corridas se realizarán en cuatro
temperaturas distintas.
Ejemplo

Esto se hace con el fin de estudiar si


alguna de las temperaturas elegida es
mejor que la que se estaba usando
hasta el momento.
Modelo estadístico
Por lo general el interés del
investigador está centrado en
comparar los tratamientos en cuanto
a sus medias poblacionales, sin olvidar
que también es importante
compararlos con respecto a sus
varianza.
Modelo estadístico
Así desde el punto de vista estadístico,
la hipótesis fundamental a probar
cuando se comparan varios
tratamientos es:

H o : 1   2  ...   k  

H1 : 1   j
Ejemplo
Un fabricante de butilglicol desea
disminuir el tiempo de una reacción
de síntesis.
Para este fin, prueba cuatro
catalizadores para investigar cual
le ofrece el mejor desempeño.
Ejemplo
Se prueban en orden aleatorio 24
lotes, seis de cada tipo de
catalizador. Los datos, en minutos,
sobre el tiempo de reacción de
cada tipo de catalizador se
muestran en la tabla
Tabla de valores

Tipo de Observaciones Promedio


catalizad

A 264 260 258 241 262 255 256,7

B 208 220 216 200 213 206 209,8

C 220 263 219 225 230 228 230,8

D 217 226 215 227 220 222 220,7


Teoría general

Supongamos que se tienen k


poblaciones, Independientes con
medias y varianzas desconocidas.

Las poblaciones pueden ser k métodos


de producción, k reactores, k grupos,
etc
Teoría general
En el caso de que los tratamientos
tengan efecto, las observaciones de la
tabla se podrán describir con el modelo
estadístico lineal dado por:

Yij     i   ij
Modelo estadístico
Donde  es un parámetro de
escala común a todos los tratamientos,
llamada media global,  i es un
parámetro que mide el efecto del
tratamiento i y  ij
es el error atribuible a la medición
(incertidumbre estadística) .
Modelo estadístico
Este modelo implica que en el diseño
completamente al azar actuarían a lo
sumo dos fuentes de variabilidad: los
tratamientos y el error aleatorio.

La media global no se la considera


una fuente de variabilidad
Diferencias entre la media global y la
media de los tratamientos
Si la respuesta media de un
tratamiento particular i es muy
diferente a la respuesta media global,
es un síntoma de que existe
un efecto de dicho tratamiento.
Diferencias entre la media global y la
media de los tratamientos

La diferencia que existen entre la


media global y las medias particulares
deben ser expuestas a un análisis
ANOVA para saber si son
estadísticamente significativas.
ANOVA para el diseño
completamente al azar
El análisis de la varianza (ANOVA) es la
técnica central en el análisis de datos
experimentales.
La idea general es separar la variación
total en las partes con las que contribuye
cada fuente de variación en el
experimento.
ANOVA para el diseño
completamente al azar

En nuestro caso, se separa la


variabilidad debida a los
tratamientos y la debida al error.
ANOVA para el diseño
completamente al azar
Cuando la primera predomina
claramente sobre segunda, es cuando
se concluye que los tratamientos tienen
efecto, dicho de otra manera las
medias son diferentes.
ANOVA para el diseño completamente al azar

Cuando los tratamientos no


predominan, significa que
contribuyen igual que el error y se
concluye que no hay diferencia
estadísticamente significativa entre
las medias.
Notación de puntos
Sirve para representar de manera
abreviada cantidades numéricas que
se pueden calcular a partir de los datos
experimentales, donde Yij
representa la j-esima observación en el
tratamiento i.
Notación de puntos
Las cantidades de interés son:
Suma de las observaciones del
Tratamiento i= Yi.

Media de las observaciones del i-esimo


tratamiento= Y i.
Notación de puntos
Suma total de las N mediciones = Y ..

Media global o promedio de todas las


observaciones= Y ..
Descomposición de la variabilidad total

Para probar la hipótesis nula, donde


todas las medias son iguales mediante la
técnica de ANOVA, lo primero es
descomponer la variabilidad total de los
datos en sus dos componentes: la
variabilidad debida al tratamiento y la que
corresponde al error aleatorio.
Descomposición de la variabilidad total
Una medida de la variabilidad total
presente en las observaciones de la tabla
es la suma total de cuadrados dada por,

 
k n k n 2
2 2 Y..
SCT    Yij  Y ..    Yij 
i 1 j 1 i 1 j 1 N
Descomposición de la variabilidad total
Se suma y resta dentro del paréntesis la
media del tratamiento i ( Y i. )

   Y i.  Y ..
k n 2
 Y Y
SCT     ij i.
i 1 j 1 
Descomposición de la variabilidad total

Desarrollando el cuadrado

k ni
 
k

SCT   ni Y i.  Y .. 
2
   Yij  Y i.
2
i 1 i 1 j 1
Sumas de cuadrados
Donde el primer componente es la
suma de los cuadrados de los
tratamientos ( SCTRAT ) y el
segundo es la suma de cuadrados del
error ( SCE ).
Sumas de cuadrados

Al observar con detalle estas sumas de


cuadrado se aprecia que la SCTRAT mide
la variación o diferencias entre
tratamientos, ya que si estos son muy
diferentes entre si, entonces la diferencia
Y i.  Y .. tenderá a ser grande en valor
absoluto.
Suma del cuadrado del error
Mientras que el segundo término
( SCE ) mide la variación dentro de
tratamientos, ya que si hay mucha
diferencia entre las observaciones de
cada tratamiento, entonces Yij  Y i.
tenderá a ser grande en valor absoluto.
Forma abreviada
En forma abreviada, esta
descomposición de la suma total
de cuadrados se puede escribir como:

SCT  SCTRAT  SCE


Forma abreviada

Nótese que SCTRAT también puede


escribirse como:

2
k Yi. Y..2
SCTRAT   
ni N
i 1
Grados de libertad
Como hay en total N observaciones,
SCT
tiene N -1 grados de libertad.
Grados de libertad
Como hay k tratamientos o niveles del
factor de interés (A, B, C, D), SCTRAT
tiene k -1 grados de libertad.

Mientras que la SCE tiene N – k


grados de libertad.
Cuadrados medios
Las sumas de los cuadrados divididas
entre sus respectivos grados de libertad
se llaman cuadrados medios. Los dos
que más interesan son el cuadrado
medio de tratamientos y el cuadrado
medio del error, que se denotan por
Cuadrados medios
Cuadrados medios

SCTRAT
CM TRAT 
k 1

SC E
CM E 
N k
Estadístico de prueba
Cuando la hipótesis nula es verdadera,
ambos cuadrados medios estiman la
varianza  2 .
Estadístico de prueba
Con base en este hecho se construye el
estadístico de prueba como sigue: se
sabe que SCE y SCTRAT son
independientes, por lo que SCE /  2 y
SCTRAT /  2

son dos variables aleatorias


independientes con distribución
ji-cuadrada con N – k y k– 1 grados de
libertad, respectivamente.
Estadístico de prueba

Entonces bajo el supuesto de que la


hipótesis nula es verdadera, el
estadístico

CM TRAT
F o
CM E
Estadístico de prueba
Sigue una distribución F con k – 1
grados de libertad en el numerador y
N– k grados de libertad en el
denominador.

Si Fo es grande, se debe rechazar la


hipótesis nula, es decir que se rechaza
que los tratamientos sean todos iguales.
Estadístico de prueba

En cambio si Fo es pequeño se
confirma la validez de la hipótesis nula.

Es decir que elegido un determinado


 , si el valor p es mas pequeño
que él, se rechaza la hipótesis nula.
Tabla ANOVA
F.V S.C G.L. C.M. Va
Fo
lor
P

Trata CM TRAT
k Y2 Y2 
SCTRAT
mien SC i.  .. k  1 CM TRAT
TRAT 
 k 1 CM E
tos i 1 ni N

N-k
Error SC E
SCE  SCT  SCTRAT CM E 
N k

Total k ni 2 N -1
Y
SCT    Yij2  ..
i 1 j 1 N
Cálculos
• a

Y1. 264  260  258....1540


Y2.  1263
Y3.  1385

Y4.1327

Y.. 5515

ni  6
Cálculos
k Y 2 Y 2 (1540) 2  (1263) 2  (1385) 2  (1327) 2 (5515) 2
SCTRAT   i.  .. 
• a
  7019
i 1 ni N 6 24

SCTRAT 7019
CMTRAT    2339
k 1 3

k niY 2 (5515) 2
2
SCT    Y  .. 2 2 2
ij N  (264)  (260)  ...  (222)  24  9076
i 1 j 1
Cálculos
• a

SCE  SCT  SCTRAT  9076  7019  2057

SCE 2057
CM E    102,85
N k 20

CM TRAT 2339
F o   22,74
CM E 102,85
Conclusiones
Con   0,05 obtenemos el valor de f de
tabla con 3 grados de libertad en el
numerador y 20 grados de libertad en el
numerador.

f 0,05;3;20  3,1
Conclusiones
Como f 0,05;3;20 es mucho mayor que Fo
se rechaza H o y se concluye que hay
diferencia estadísticamente significativa
entre los distintos tipos de catalizadores.
.
Conclusiones
También calculamos el valor p que es la
probabilidad de que 𝑓 > 22,74
Esto es igual a cero, lo que indica que
rechazar H o ha sido una idea fuerte.
Comparaciones o pruebas de
rangos múltiples

Después de que se rechazó la hipótesis


nula en un análisis de varianza, es
necesario ir a detalle y ver cuales
tratamientos son diferentes.
Comparaciones o pruebas de rangos múltiples

Comparación de parejas de medias


de tratamientos
Cuando no se rechaza la hipótesis nula,
el objetivo del experimento está cubierto
y la conclusión es que los tratamientos
no son diferentes.
Comparaciones o pruebas de rangos múltiples

Comparación de parejas de medias de


tratamientos
Si por el contrario se rechaza la
hipótesis nula , es necesario investigar
cuales tratamientos resultaron diferentes
o cuales provocaron la diferencia. Estos
interrogantes se responden probando la
igualdad de todos los posibles pares
de medias.
Método LSD (diferencia mínima
significativa)

Este método se basa en probar la


igualdad de todos los posibles pares de
medias con la hipótesis

H o : i   j

H1 : i   j
Método LSD (diferencia mínima
significativa)

Para toda i  j .
Para k tratamientos se tienen k (k  1) / 2
pares de medias.
Si k=4 existen 6 pares de medias que
hay que comparar
Estadístico de prueba
El estadístico de prueba para cada una
de las 6 hipótesis posibles es la
correspondiente diferencia en valor
absoluto entren sus medias muestrales.
Estadístico de prueba
Se rechaza la hipótesis nula

H o : i   j

Si ocurre que

1 1
𝑌𝑖. − 𝑌𝑗. > 𝑡𝛼/2, 𝑁 − 𝑘 𝐶𝑀𝑒 + = 𝐿𝑆𝐷
𝑛𝑖 𝑛𝑗
Diferencia mínima significativa

La cantidad LSD se llama diferencia


minima significativa, ya que es la
diferencia mínima que debe existir
entre dos medias muestrales para
considerar que los tratamientos
correspondientes son
significativamente diferentes.
Diferencia mínima significativa
Así cada diferencia de medias
muestrales en valor absoluto que sea
mayor que el numero LSD se declara
significativa. Si todos los tratamientos
tienen el mismo número de réplicas, la
cantidad LSD se reduce a:

LSD  t / 2, N  k 2CM e / n
Pares de hipótesis
Se prueban las seis posibles pares de hipótesis

Ho :  A  B H1 :  A   B

H o :  A  c H1 :  A   c

Ho :  A  D H1 :  A   D

H o :  B  C H1 :  B  C

Ho : B  D H1 :  B   D

H o : C   D H1 : C   D
Valor t y LSD
Buscamos el valor t 0,025 con 20 grados
de libertad = 2,085

2.102,85
LSD  t / 2, N  k 2CM e / n  2,085  12,20
6
Tabla
Diferencia Diferencia muestral Decisión
poblacional
256,7 – 209,8 = 46,9 Significativa
 A  B
256,7 - 230,8 = 25,9 Significativa
 A  c

 A  D
256,7 - 220,7 = 36 Significativa

 B  C 209,8 - 230,8 = 21 Significativa


B  D 209,8 - 220,7 = 10,9 No Significativa

C   D No Significativa
230,8 - 220,7 = 10,1
Conclusiones

El catalizador B es mejor que el A y el C


pero no existe diferencia
estadísticamente significativa con el
catalizador D.
Por esto deberían analizarse otras
cuestiones( precio, disponibilidad, etc)
para elegir uno u otro.
Verificación de los supuestos del modelo
La validez de los resultados obtenidos
en cualquier análisis de varianza queda
supeditado a que los supuestos del
modelo se cumplan. Eso supuestos
son: que las respuestas Y se
distribuyan normalmente, varianza
constante (igual varianza de los
tratamientos) e independencia de las
mediciones.

También podría gustarte