Diseño Experimental DCA y ANDEVA Clase 12082022

Área de Ciencias Básicas y Ambientales
Experimentación en
Ingeniería
DCA Y ANOVA
MSc.Lic. Gabriel Alvarez

Etapas en el diseño de experimentos
Un aspecto fundamental del diseño de experimentos es decidir cuáles pruebas o
tratamientos se van a realizar y cuántas repeticiones de cada uno se requieren, de manera
que se obtenga la máxima información al mínimo costo posible. El arreglo formado por
los diferentes tratamientos que serán corridos, incluyendo las repeticiones, recibe el
nombre de matriz de diseño o sólo diseño. Para que un estudio experimental sea exitoso
es necesario realizar, por etapas, diferentes actividades. En este sentido, la etapa más
importante y a la que se le debe dedicar mayor tiempo es la planeación.
A continuación se describen de manera breve las etapas del diseño de experimentos con
objeto de dar una visión global de lo que implica su correcta aplicación.
Entender y delimitar el problema u
objeto de estudio.
Análisis
Interpretación
Control y Conclusiones finales
Elegir la(s) variable(s) de respuesta que
será medida en cada punto del diseño y
verificar que se mide de manera
confiable.
Determinar cuáles factores deben

estudiarse o investigarse, de acuerdo a la Realizar el experimento.
supuesta influencia que tienen sobre la
respuesta.
Seleccionar los niveles de cada factor,

así como el diseño experimental Planear y organizar el
adecuado a los factores que se tienen y
al objetivo del experimento.
trabajo experimental.
DISEÑO COMPLETO AL AZAR Y ANALISIS DE VARIANZA
Se presentan los diseños experimentales que se utilizan cuando el objetivo es comparar más de dos
tratamientos. Puede ser de interés comparar tres o más máquinas, varios proveedores, cuatro procesos, tres
materiales, cinco dosis de un fármaco, etcétera. Por lo general, el interés del experimentador está centrado
en comparar los tratamientos en cuanto a sus medias poblacionales, sin olvidar que también es importante
compararlos con respecto a sus varianzas. Así, desde el punto de vista estadístico, la hipótesis fundamental a
probar cuando se comparan varios tratamientos es:
𝐻𝑜: 𝜇1 = 𝜇2 = 𝜇3 … 𝜇𝑘 = 𝜇
𝐻𝑎: 𝜇𝑖 ≠ 𝜇𝑗 para algún 𝑖 ≠ 𝑗
con la cual se quiere decidir si los tratamientos son iguales estadísticamente en cuanto a sus medias, frente
a la alternativa de que al menos dos de ellos son diferentes. La estrategia natural para resolver este
problema es obtener una muestra representativa de mediciones en cada uno de los tratamientos, y
construir un estadístico de prueba para decidir el resultado de dicha comparación.
El diseño completamente al azar

(DCA), que es el más simple de todos los
diseños que se utilizan para comparar dos o
más tratamientos, dado que sólo consideran
dos fuentes de variabilidad: los tratamientos y
el error aleatorio; se llama completamente al
azar porque todas las corridas o realizaciones
experimentales se realizan en orden aleatorio
completo. De esta manera, si durante el
estudio se hacen en total N pruebas, éstas se
efectúan al azar, de manera que los posibles
efectos ambientales y temporales se vayan
repartiendo equitativamente entre los
tratamientos.
Ejemplo 1
Comparación de cuatro métodos de
ensamble. Un equipo de mejora
investiga el efecto de cuatro métodos
de ensamble A, B, C y D, sobre el Tabla 1
tiempo de ensamble en minutos. En
primera instancia, la estrategia
experimental es aplicar cuatro veces los
cuatro métodos de ensamble en orden
completamente aleatorio (las 16
pruebas en orden aleatorio). Los
tiempos de ensamble obtenidos se
muestran en la tabla 1. Si se usa el
diseño completamente al azar (DCA), se
supone que, además del método de
ensamble, no existe ningún otro factor
que influya de manera significativa
sobre la variable de respuesta (tiempo
de ensamble).
Ejemplo 2
Comparación de cuatro tipos de cuero.
Un fabricante de calzado desea mejorar la
calidad de las suelas, las cuales se pueden
hacer con uno de los cuatro tipos de
cuero A, B, C y D disponibles en el
mercado. Para ello, prueba los cueros con Tabla 2
unamáquina que hace pasar los zapatos
por una superficie abrasiva; la suela de
éstos se desgasta al pasarla por dicha
superficie. Como criterio de desgaste se
usa la pérdida de peso después de un
número fijo de ciclos. Se prueban en
orden aleatorio 24 zapatos, seis de cada
tipo de cuero. Al hacer las pruebas en
orden completamente al azar se evitan
sesgos y las mediciones en un tipo de La primera interrogante a despejar es si existen diferencias
cuero resultan independientes de las entre el desgaste promedio de los diferentes tipos de cuero.
demás. Los datos (en miligramos) sobre el
desgaste de cada tipo de cuero se
muestran en la tabla 2
Supongamos que se tienen k poblaciones o tratamientos, independientes con medias desconocidas

𝝁𝟏 , 𝝁𝟐 , 𝝁𝟑 … 𝝁𝒌 y varianzas también desconocidas pero que se suponen iguales 𝝈𝟐𝟏 = 𝝈𝟐𝟐 = 𝝈𝟐𝟑 … 𝝈𝟐𝒌 = 𝝈𝟐 .
Las poblaciones pueden ser k métodos de producción, k tratamientos, k grupos, etc., y sus medias se refieren o
son medidas en términos de la variable de respuesta. Se aplica un DCA , los datos generados se muestran en la
tabla siguiente
En caso de que los

𝑌𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖𝑗
tratamientos tengan efecto,
las observaciones 𝒀𝒊𝒋 de la
tabla se podrán describir con
el modelo estadístico lineal
dado por
𝑌𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖𝑗 Modelo de efectos fijos
𝜇 = Media global de la variable de respuesta. Si la respuesta

media de un tratamiento particular 𝜇𝑖 es “muy diferente” de
la respuesta media global 𝜇, es un síntoma de que existe un
efecto de dicho tratamiento
𝜏𝑖 = La diferencia que deben tener las medias entre sí para

concluir que hay un efecto 𝜏𝑖 = 𝜇𝑖 - 𝜇
𝜀𝑖𝑗 = Error atribuible a la medición

Situaciones que se definen respecto de los efectos de los tratamientos: si los

tratamientos pudieron ser elegidos expresamente por el investigador y quieren probarse
hipótesis acerca de las medias de los tratamientos y las conclusiones se aplicaran
únicamente a los niveles del factor considerado en el análisis y estas no pueden
extenderse a tratamientos similares que no fueron considerados explícitamente,… a este
modelo se le llama Modelo de Efectos Fijo , de manera alternativa los tratamientos
podrían provenir de una muestra aleatoria de una población, sea que se hayan
considerado explícitamente en el análisis o no, aquí los tratamientos son variables
aleatorias y el conocimientos de las 𝜏𝑖 particulares que se investigaron es irrelevante,
mas bien se prueban hipótesis acerca de la variabilidad de 𝜏𝑖 y se intenta estimar su
variabilidad; a este modelo se le llama de Efectos Aleatorios o Modelo de Componentes
de Varianza
El análisis de varianza (ANOVA o ANDEVA) es la técnica central en el análisis de datos

experimentales. La idea general de esta técnica es separar la variación total en las
partes con las que contribuye cada fuente de variación en el experimento. En el caso
del DCA se separan la variabilidad debida a los tratamientos y la debida al error
Variabilidad Total Variabilidad Total
Variabilidad Variabilidad Variabilidad Variabilidad

debida a los debida al debida a los debida al
tratamientos Error tratamientos Error
No hay Efecto Hay Efecto

El objetivo del análisis de varianza en el DCA es probar la hipótesis de igualdad de los

tratamientos con respecto a la media de la correspondiente variable de respuesta:
𝐻𝑜: 𝜇1 = 𝜇2 = 𝜇3 … 𝜇𝑘 = 𝜇
𝐻𝑎: 𝜇𝑖 ≠ 𝜇𝑗 para algún 𝑖 ≠ 𝑗
o
𝐻𝑜: 𝜏1 = 𝜏2 = 𝜏3 … 𝜏𝑘 = 0
𝐻𝑎: 𝜏𝑖 ≠ 0 para algún 𝑖
Notación de Punto.
𝑖 = 1,2,3, … , 𝑘
𝒀𝒊𝒋 j-ésima observación en el tratamientos 𝑖 con
𝑗 = 1,2,3, … , 𝑛𝑖
𝒀𝒊. Suma de las observaciones en el tratamiento 𝑖
ഥ 𝒊. Media de las observaciones del 𝑖-ésimo tratamiento.

𝒀
𝒀. . Suma total de las 𝑁 = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 mediciones
ഥ . . Media global de todas observaciones.

𝒀
Note que el punto indica la suma sobre el correspondiente subíndice.

Una medida de la variabilidad total presente en la tabla es la suma total de cuadrados
𝒌 𝒏𝒊 𝒌 𝒏𝒊
𝒀. .𝟐
𝟐
ഥ. .
𝑺𝑪𝑻 = ෍ ෍ 𝒀𝒊𝒋 − 𝒀 = ෍ ෍ 𝒀𝒊𝒋 𝟐 −
𝑵
𝒊=𝟏 𝒋=𝟏 𝒊=𝟏 𝒋=𝟏
donde 𝒀. . es la suma de los 𝑁 = σ𝒏𝑖=1

𝑖 𝑛𝑖 datos
en experimento.
ഥ 𝒊. se obtiene
Al sumar y restar dentro del paréntesis la media del tratamiento 𝑖, 𝒀
𝒌 𝒏𝒊
𝟐
ഥ 𝒊. + 𝒀
𝑺𝑪𝑻 = ෍ ෍ 𝒀𝒊𝒋 − 𝒀 ഥ 𝒊. −𝒀
ഥ. . desarrollando el cuadrado :
𝒊=𝟏 𝒋=𝟏 𝒌 𝒌 𝒏𝒊
𝟐 𝟐
ഥ. .
𝑺𝑪𝑻 = ෍ 𝒏𝒊 𝒀𝒊𝒋 − 𝒀 ഥ 𝒊.
+ ෍ ෍ 𝒀𝒊𝒋 − 𝒀
𝒊=𝟏 𝒊=𝟏 𝒋=𝟏
𝒌 𝒌 𝒏𝒊
𝟐 𝟐
ഥ. .
𝑺𝑪𝑻 = ෍ 𝒏𝒊 𝒀𝒊𝒋 − 𝒀 ഥ 𝒊.
+ ෍ ෍ 𝒀𝒊𝒋 − 𝒀
𝒊=𝟏 𝒊=𝟏 𝒋=𝟏
𝑺𝑪𝑻𝑹𝑨𝑻 𝑺𝑪𝑬
𝑺𝑪𝑻 = 𝑺𝑪𝑻𝒓𝒂𝒕 + 𝑺𝑪𝑬
donde el primer componente es la suma de cuadrados de tratamientos (𝑆𝐶𝑇𝑅𝐴𝑇) y el segundo es

la suma de cuadrados del error (𝑆𝐶𝐸). Al observar con detalle estas sumas de cuadrados se aprecia
que la 𝑆𝐶𝑇𝑅𝐴𝑇 mide la variación o diferencias entre tratamientos, ya que si éstos son muy diferentes
ഥ 𝒊. − 𝒀
entre sí, entonces la diferencia 𝒀 ഥ . . sera grande en valor absoluto, y con ello también será
grande la 𝑆𝐶𝑇𝑅𝐴𝑇
Mientras que la 𝑆𝐶𝐸 mide la variación dentro de tratamientos, ya que si hay mucha variación entre
ഥ 𝒊. tenderá a ser grande en valor absoluto.
las observaciones de cada tratamiento entonces 𝒀𝒊𝒋 − 𝒀
Los grados de libertad
𝒏𝑖
Como hay en total 𝑁 = ෍ 𝑛𝑖 observaciones, la 𝑆𝐶𝑇 tiene 𝑁 − 1 grados de libertad
𝑖=1
Hay k tratamientos o niveles del factor de interés, así que 𝑆𝐶𝑇𝑅𝐴𝑇 tiene 𝑘 – 1 grados de libertad
𝑆𝐶𝐸 tiene 𝑁 – 𝑘 grados de libertad
Se cumple entonces que 𝑁 − 1 = (𝑘 − 1) + (𝑁 − 𝑘)

Cuadrados medios
𝑆𝐶𝑇𝑟𝑎𝑡 𝑆𝐶𝐸
𝐶𝑀𝑇𝑟𝑎𝑡 = 𝐶𝑀𝐸 =
𝑘−1 𝑁−𝑘
Estadístico de prueba
𝐶𝑀𝑇𝑟𝑎𝑡 sigue una distribución 𝐹 con (𝑘 – 1) grados de libertad en el numerador y
𝐹𝑜 = (𝑁 – 𝑘) grados de libertad en el denominador.
𝐶𝑀𝐸
Si 𝐹𝑜 es grande, se contradice la hipótesis de que no hay efectos de tratamientos; en cambio, si 𝐹𝑜 es

pequeño se confirma la validez de 𝐻𝑜. Así, para un nivel de significancia 𝛼 prefijado, se rechaza 𝐻𝑜 si 𝐹𝑜 >
𝐹𝛼,𝑘−1,𝑁−𝑘 , donde 𝐹𝛼,𝑘−1,𝑁−𝑘 es el percentil (1 – 𝛼) × 100 de la distribución 𝐹. También se rechaza 𝐻𝑜 si
el p − 𝑣𝑎𝑙𝑜𝑟 < 𝛼, donde el 𝑣𝑎𝑙𝑜𝑟 − 𝑝 es el área bajo la distribución𝐹𝑘−1,𝑁−𝑘 a la derecha del estadístico
𝐹𝑜, es decir, el 𝑣𝑎𝑙𝑜𝑟 − 𝑝 = 𝑃(𝐹 > 𝐹0)
Toda la información necesaria para calcular el estadístico 𝐹𝑜 hasta llegar al 𝑣𝑎𝑙𝑜𝑟 − 𝑝 se escribe en la
llamada tabla de análisis de varianza
Se rechaza la Ho si el 𝑝 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼

Ejemplo 1
Comparación de cuatro métodos de
ensamble. Un equipo de mejora
investiga el efecto de cuatro métodos
de ensamble A, B, C y D, sobre el Tabla 1
tiempo de ensamble en minutos. En
primera instancia, la estrategia
experimental es aplicar cuatro veces los
cuatro métodos de ensamble en orden
completamente aleatorio (las 16
pruebas en orden aleatorio). Los
tiempos de ensamble obtenidos se
muestran en la tabla 1. Si se usa el
diseño completamente al azar (DCA), se
supone que, además del método de
ensamble, no existe ningún otro factor
que influya de manera significativa
sobre la variable de respuesta (tiempo
de ensamble).
Una manera de comparar los métodos de ensamble (tratamientos) es probar la hipótesis:
𝐻𝑜: 𝜏𝐴 = 𝜏𝐵 = 𝜏𝐶 = 𝜏𝐷 = 0
𝐻𝑎: 𝜏𝑖 ≠ 0 para algún 𝑖 = 𝐴, 𝐵, 𝐶, 𝐷
El valor del 𝑣𝑎𝑙𝑜𝑟 − 𝑝 = 0.0018 es menor que 𝛼 = 0.05, por lo que se rechaza 𝐻𝑜
además 𝐹𝑜 = 9.42 caería en la región de rechazo.
Observe los cálculos de forma manual

Observaciones de 4 procesos distintos

Diseño Experimental DCA y ANDEVA Clase 12082022

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Diseño Experimental DCA y ANDEVA Clase 12082022

Cargado por

Copyright:

Formatos disponibles

Área de Ciencias Básicas y Ambientales

MSc.Lic. Gabriel Alvarez

Determinar cuáles factores deben

Seleccionar los niveles de cada factor,

El diseño completamente al azar

Supongamos que se tienen k poblaciones o tratamientos, independientes con medias desconocidas

En caso de que los

𝑌𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜀𝑖𝑗 Modelo de efectos fijos

𝜇 = Media global de la variable de respuesta. Si la respuesta

𝜏𝑖 = La diferencia que deben tener las medias entre sí para

𝜀𝑖𝑗 = Error atribuible a la medición

Situaciones que se definen respecto de los efectos de los tratamientos: si los

El análisis de varianza (ANOVA o ANDEVA) es la técnica central en el análisis de datos

Variabilidad Total Variabilidad Total

Variabilidad Variabilidad Variabilidad Variabilidad

No hay Efecto Hay Efecto

El objetivo del análisis de varianza en el DCA es probar la hipótesis de igualdad de los

𝒀𝒊. Suma de las observaciones en el tratamiento 𝑖

ഥ 𝒊. Media de las observaciones del 𝑖-ésimo tratamiento.

𝒀. . Suma total de las 𝑁 = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 mediciones

ഥ . . Media global de todas observaciones.

Note que el punto indica la suma sobre el correspondiente subíndice.

Una medida de la variabilidad total presente en la tabla es la suma total de cuadrados

donde 𝒀. . es la suma de los 𝑁 = σ𝒏𝑖=1

𝑺𝑪𝑻 = 𝑺𝑪𝑻𝒓𝒂𝒕 + 𝑺𝑪𝑬

donde el primer componente es la suma de cuadrados de tratamientos (𝑆𝐶𝑇𝑅𝐴𝑇) y el segundo es

𝑆𝐶𝐸 tiene 𝑁 – 𝑘 grados de libertad

Se cumple entonces que 𝑁 − 1 = (𝑘 − 1) + (𝑁 − 𝑘)

Si 𝐹𝑜 es grande, se contradice la hipótesis de que no hay efectos de tratamientos; en cambio, si 𝐹𝑜 es

Se rechaza la Ho si el 𝑝 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼

Observe los cálculos de forma manual

También podría gustarte