Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Análisis estadístico de
un diseño experimental
TEMAS
Semana 11
Diseño de experimentos
Etapas en el diseño de Análisis
experimentos Utilizando métodos estadísticos inferenciales se evaluará si las
Entender y delimitar el problema u objeto de diferencias o efectos muestrales (experimentales) son lo
estudio
suficientemente grandes para que garanticen diferencias
poblacionales (o a nivel proceso). La técnica estadística central en
Elegir la(s) variable(s) de respuesta que será el análisis de los experimentos es el llamado análisis de
medida en cada punto del diseño y verificar
que se mide de manera confiable varianza (ANOVA)
Por experiencia, en la mayoría de las situaciones experimentales con un solo factor, la cantidad de réplicas varía
entre cinco y diez; incluso, podría llegar hasta 30. La tendencia podría inclinarse por un extremo de este rango e
incluso salirse de éste, de acuerdo con las siguientes consideraciones:
1. A menor diferencia que se espera en los tratamientos, mayor será la cantidad de réplicas si se quieren detectar
diferencias significativas, y viceversa, es decir, si se esperan grandes diferencias quizá con pocas réplicas sea
suficiente.
2. Si se espera mucha variación dentro de cada tratamiento, debido a la variación de fuentes no controladas como
métodos de medición, medio ambiente, materia prima, etc., entonces se necesitarán más réplicas.
3. Si son varios tratamientos (cuatro o más), entonces éste es un punto favorable para reducir el número de
réplicas.
Además de lo anterior, es preciso considerar los costos y el tiempo global del experimento. De aquí que si se
toman en cuenta las consideraciones antes expuestas se podrá establecer el tamaño de muestra que permita
responder en una primera fase las preguntas más importantes que se plantearon con el experimento
TAMAÑO DE MUESTRA por intervalo de confianza
Gutiérrez, H. y De la Vara, R. (2012) deducen la fórmula del tamaño de muestra a partir de
la diferencia máxima en las comparaciones o pruebas de rango múltiple LSD:
intervalo explican sobre el tamaño de muestra:
𝐿𝑆𝐷=𝑡 𝛼
2
,𝑁−𝑘
2 𝐶𝑀𝐸
𝑛 √
… … …(𝑎 )
donde:
N=kn0
( )
2 2
2 𝑡𝛼 𝜎 n0: propuesta inicial para el número de réplicas
,𝑁−𝑘
2
𝑛= : Nivel de significación
𝑑 𝑇2
=CME
dT= diferencia máxima entre las medias (LSD)
TAMAÑO DE MUESTRA por intervalo de confianza
Ejemplo:
Un ingeniero desea verificar si cierto tipo de fertilizante impacta en el crecimiento de una
planta. Para esto, diseña un experimento con 5 tipos de fertilizantes. ¿Cuántos ejemplares de
cada nivel deberá probar considerando un nivel de significación de 5%. Asimismo, una
propuesta inicial para el número de réplicas es 6, además sabe que una estimación de la
dispersión es 2,5 cm y la diferencia máxima entre las medias 3,8 cm
K=5
n0=6
N= kn0= (5)(6)=30
N-k=30-5=25
= = 3,67
t(0,975,25)=2,060
Se necesitará n=4 réplicas
Otra forma
Ejemplo
Un ingeniero de desarrollo de productos desea
investigar la resistencia a la tensión de una fibra
sintética nueva que se utilizará para hacer tela de
camisas. El ingeniero sabe por experiencia que la
resistencia a la tensión se afecta por el peso
porcentual del algodón utilizado en la mezcla de
materiales de fibra. Además, sospecha que al
aumentar el contenido de algodón se incrementará
la resistencia, al menos al principio. El ingeniero
decide probar ejemplares en cinco niveles del peso
porcentual del algodón: 15, 20, 25, 30 y 35 por
ciento. ¿Cuántos ejemplares de cada nivel deberá
probar considerando un nivel de significación de 5%,
potencia de prueba de 0,8 y si sabe que una
estimación de la dispersión es 2,5 lb/pulgadas2 y la
diferencia máxima entre las medias 6,5 lb/pulgadas2
Potencia y tamaño de la muestra
ANOVA de un solo factor
α = 0.05 Desviación estándar asumida = 2.5
Factores: 1 Número de niveles: 5
Número de
réplicas por
tratamientos
Ejemplo de aleatorización
Nro. Peso
Secuencia
Un ingeniero de desarrollo de productos de la prueba Corrida
porcentual
desea investigar la resistencia a la algodón
tensión de una fibra sintética nueva que 1 8 20 Utilizando una hoja de
2 18 30
se utilizará para hacer tela de camisas. cálculo se puede generar las
3 10 20
El ingeniero sabe por experiencia que la
resistencia a la tensión se afecta por el
4 23 35 coridas aleatorias
5 17 30 =ALEATORIO.ENTRE(1;25)
peso porcentual del algodón utilizado en 6 5 15
la mezcla de materiales de fibra. 7 14 25
Además, sospecha que al aumentar el 8 6 20
contenido de algodón se incrementará la 9 15 25
resistencia, al menos al principio. El 10 20 30
ingeniero decide probar ejemplares en 11 9 20
cinco niveles del peso porcentual del 12 4 15
algodón: 15, 20, 25, 30 y 35 por ciento. 13 12 25 Datos de resistencia a la
También decide probar cinco ejemplares 14 7 20 tensión (en lb/pulgadas2)
15 1 15
en cada nivel del contenido de algodón. Peso
16 24 35 Observaciones
Las 25 corridas serán: porcentual
Peso 17 21 35 del algodón
porcentual del Número de corrida experimental 18 11 25
algodón
15 7 7 15 11 9
19 2 15 20 12 17 12 18 18
15 1 2 3 4 5
20 13 25
20 6 7 8 9 10 25 14 18 18 19 19
21 22 35
25 11 12 13 14 15 30 19 25 22 19 23
22 16 30
30 16 17 18 19 20 23 25 35 35 7 10 11 15 11
35 21 22 23 24 25 24 19 30
25 3 15
ANOVA PARA EL DISEÑO COMPLETAMENTE AL
AZAR (DCA)
El ANOVA es la técnica utilizada en el análisis de datos experimentales que consiste
en separar la variación total en las partes con las que contribuye cada fuente de
variación en el experimento. En DCA la variabilidad total se separa en la variabilidad
debida a los tratamientos y la debida al error.
Yij = m + ti + eij
Donde:
m :Media global
ti : Efecto del tratamiento i
eij : Es el error atribuible a la medición Yij
ANOVA DE UN FACTOR
Triola (2018)
Aplicación
Un ingeniero de desarrollo de productos desea investigar la resistencia a la tensión de una fibra
sintética nueva que se utilizará para hacer tela de camisas. El ingeniero sabe por experiencia
que la resistencia a la tensión se afecta por el peso porcentual del algodón utilizado en la
mezcla de materiales de fibra. Además, sospecha que al aumentar el contenido de algodón se
incrementará la resistencia, al menos al principio. El ingeniero decide probar ejemplares en
cinco niveles del peso porcentual del algodón: 15, 20, 25, 30 y 35 por ciento. También decide
probar cinco ejemplares en cada nivel del contenido de algodón. Los datos de resistencia a la
tensión se muestran a continuación:
Peso porcentual del Analice los datos y concluya al nivel de significación
Observaciones
algodón de 5%:
15 7 7 15 11 9 1. ¿El peso porcentual de algodón influye en la
20 12 17 12 18 18 resistencia a la tensión?
25 14 18 18 19 19 2. ¿Qué peso o (pesos porcentuales) recomendaría
30 19 25 22 19 23 utilizar para incrementar la resistencia a la
35 7 10 11 15 11 tensión?
Yij = m + ti + eij
Supuestos del modelo:
donde:
Yij : Es la j-ésima medición de la resistencia a la tensión en 1. Los errores provienen de una
la fibra que contiene el i-ésimo peso porcentual de población normal
algodón 2. Las varianzas poblacionales son
m :Media global iguales
ti : Efecto del porcentaje de algodón i 3. Los errores son independientes
eij : Es el error aleatorio atribuible a la medición Y ij
Paso1. Estimación de los errores
Minitab: Estadísticos/ANOVA/Modelo lineal general/Ajustar modelo lineal general
Paso2. Analizando el cumplimiento de los supuestos
Normalidad
H0:Los errores sí provienen de una población normal
H1:Los errores no provienen de una población normal
a=0.05
Criterio de rechazo y no rechazo de Ho
Si valor p ≤ α Se rechaza Ho
Si valor p > α No se rechaza Ho
Homocedasticidad
a=0.05
Criterio de rechazo y no rechazo de Ho
Si valor p ≤ α Se rechaza Ho
Si valor p > α No se rechaza Ho
Independencia de errores
Al analizar la gráfica de los residuales
vs tiempo no se aprecia correlación
entre los residuales (es decir no se
observa tendencia a tener corridas de
residuales positivos y negativos)
Paso3. Análisis de la varianza
a=0.05
a=0.05
25 5 17.6 A B
20 5 15.4 B C
35 5 10.8 C D
15 5 9.8 D
A un nivel de significación de 5%, con 30 como peso porcentual de algodón, se obtiene una
mayor resistencia a la tensión, comparado con el resto de tratamientos.
Aplicaciones
Aplicaciones
En un centro de investigación se realiza un estudio para comparar varios tratamientos que, al aplicarse previamente
a los frijoles crudos, reducen su tiempo de cocción. Estos tratamientos son a base de bicarbonato de sodio (NaHCO3)
y cloruro de sodio o sal común (NaCl). El primer tratamiento es el de control, que consiste en no aplicar ningún
tratamiento. El tratamiento T2 es el remojo en agua con bicarbonato de sodio, el T3 es remojar en agua con sal
común y el T4 es remojar en agua con una combinación de ambos ingredientes en proporciones iguales. La variable
de respuesta es el tiempo de cocción en minutos. Los datos se muestran en la siguiente tabla:
a) ¿De qué manera el experimentador debe aleatorizar los experimentos y el material experimental?
b) Dé ejemplos de factores que deben estar fijos durante las pruebas experimentales, para que no afecten los resultados y
las conclusiones.
c) Formule y pruebe la hipótesis de que las medias de los tratamientos son iguales.
d) Obtenga el diagrama de caja y el gráfico de medias, después interprételos.
e) ¿Hay algún tratamiento mejor? ¿Cuál es el tiempo de cocción esperado para el mejor tratamiento?
f) Algo importante a cuidar en un experimento es que no haya efectos colaterales no deseados, causados por el tratamiento
ganador; en este caso, piense en los posibles efectos colaterales que podría causar el mejor tratamiento.
g) ¿Se cumplen los supuestos del modelo? Verifique gráficamente.
h) Pruebe la hipótesis de igualdad de varianzas entre tratamientos (que corresponde a un supuesto)
Gutierrez y De La vara (2008). Análisis y diseño de experimentos. Segunda
edición, McGraw-hill/INTERAMERICANA