Tema3 PDF

Tema 3: Introducción al Análisis y Diseño de Experimentos
3.1 Introducción
La metodología del Diseño de Experimentos se basa en analizar los cambios en la

operación de un proceso o sistema para medir el efecto de ese cambio sobre las propiedades
del producto elaborado. En este sentido, el experimento posee como objetivo primordial,
determinar los cambios en los materiales, métodos o condiciones del proceso y por el otro
los cuales permitan detectar, minimizar o eliminar posibles problemas de calidad.
En concordancia con lo anterior, el Diseño Estadístico de Experimentos (DEX) proporciona

la técnica y la estrategia necesarias para conducir eficazmente los procesos a mejores
condiciones de operación, organizando los experimentos para que éstos generen datos que
al analizarlos estadísticamente, produzcan conclusiones y decisiones que deriven en
mejoras del desempeño del proceso. Para tal fin, se hace uso de determinadas técnicas
estadísticas las cuales manipulan el proceso induciéndolo a generar la información
necesaria para mejorarlo y así lograr la máxima eficacia productiva al menor costo posible.
3.2. Objetivos del Diseño y Análisis de Experimentos
. Determinar las principales causas de variación en la respuesta del proceso.

. Encontrar las condiciones experimentales bajo las que se obtienen valores extremos en la
variable respuesta.
. Comparar las respuestas para diferentes niveles de observación de variables controladas.
. Obtener modelos estadístico-matemáticos que permitan hacer predicciones de la variable
respuesta.
3.3. Etapas en un Diseño Experimental
1. Planeación del DEX
1.1. Etapas pre-experimentales:

1.1.1. Identificación del problema a ser resuelto y definición de los objetivos del
experimento.
Pedro Harmath Introducción al Análisis y Diseño de Experimentos 1

Estadística II
1.1.2. Identificación de las posibles fuentes de variación: factores, niveles unidades
experimentales
1.1.3. Elección de la variable respuesta, especificando las medidas a ser utilizadas.
1.2. Etapas experimentales:

1.2.1. Selección del diseño experimental. Reglas de asignación de las unidades
experimentales a las condiciones de estudio. Determinar tamaño de muestra.
1.2.2. Ejecución del experimento. Planear y organizar el trabajo experimental, realizando
un experimento piloto.
2. Análisis estadístico de los datos. Especificar modelo del DEX.
3. Interpretación de los resultados.
4. Conclusiones y recomendaciones.
3.4. Análisis de Varianza
En el contexto de los contrastes de hipótesis, el Análisis de Varianza (ANOVA) es un

método estadístico el cual juega un papel fundamental, en cuanto a discernir si un
parámetro estimado para un modelo es estadísticamente significativo, las varianzas de dos
poblaciones son estadísticamente diferentes u otros casos. En este contexto, la técnica
similarmente puede ser utilizada para realizar contrastes de medias; así, el procedimiento
asume que cualquier variación existente entre los promedios de las poblaciones es atribuida
a 1) una variación dentro de las observaciones de las poblaciones y 2) una variación entre
las observaciones de las poblaciones. En cualquier caso, se considerará la variación dentro
de las observaciones (muestra) de una población como una variación al azar o aleatoria; y
la variación entre las observaciones de las poblaciones como una variación sistemática y
aleatoria, ambas considerándolas como las fuentes de variación fundamentales para la
técnica.
Supóngase que se desea comparar k tratamientos o niveles de un factor único. La respuesta

que se observa en cada uno de los k tratamientos es una variable aleatoria. Teniendo un

Estadística II
conjunto de datos presentados bajo el esquema de la tabla 3.1., yij representa la j-ésima
observación del i-ésimo tratamiento. En general, habrá n observaciones del tratamiento i.

Describiendo las observaciones mediante un modelo estadístico lineal se tiene:
y ij = µ + τ i + ε ij ; i = 1,2,..., k y j = 1,2,..., n (3.1)
en donde yij es la (ij ) − ésima observación, µ es un parámetro común a todos los
tratamientos denominado media global o la gran media, τ i es un parámetro único para el i-
ésimo tratamiento llamado efecto del tratamiento i-ésimo y ε ij es el componente de error
aleatorio. El objetivo se concentra en probar hipótesis apropiadas con respecto a los efectos
de los tratamientos y hacer una estimación de los mismos. Para probar las hipótesis, se
supone que los errores del modelo son variables aleatorias independientes normalmente
distribuidas, con media cero y varianza σ 2 . Se supone que esta última es constante para
todos los niveles del factor.
Tabla 3.1. Datos típicos para un experimento unifactorial

____________________________________
Tratamiento
1 2 …i…k
_____________________________________
y11 y 21 ... y i1 ... y k 1
y12 y 22 ... y i 2 ... y k 2
. . . .
. . . .
. . . .
y1n y 2 n ... y in ... y kn
_____________________________________
Total T1. T2. ... Ti. ... Tk . T..
− − − − −
Media y 1. y 2. ... y i. ... y k . y ..
Este modelo se denomina análisis de varianza clasificación en un sentido o en una sola

dirección, porque sólo investiga un factor. Adicionalmente, se requiere que el experimento
se realice en orden aleatorio, de manera que el medio ambiente en el que se usan los

Estadística II
tratamientos (llamados a menudo unidades experimentales) sea lo más uniforme posible.
Por tanto, este diseño experimental es un diseño completamente aleatorizado.
El modelo estadístico presentado a través de la ecuación (3.1), describe dos situaciones con
respecto al efecto de los tratamientos. En primer lugar, los tratamientos podrían haber sido
seleccionados específicamente por el experimentador. En esta situación se desea probar
hipótesis sobre las medias de los tratamientos y las conclusiones se aplican sólo a los
niveles del factor considerados en el análisis. Las conclusiones no pueden hacerse
extensivas a tratamientos similares que no hayan sido considerados específicamente.
También sería deseable estimar los parámetros del modelo ( µ ,τ i , σ 2 ) . Este modelo se
denomina modelo de efectos fijos.
Alternativamente, los k tratamientos pueden ser una muestra aleatoria de una población
mayor de tratamientos. En esta situación, sería interesante generalizar las conclusiones
(basadas en la muestra de tratamientos) a todos los tratamientos de la población, ya sea que
hayan sido explícitamente considerados en el análisis o no. En este caso, las τ i son
variables aleatorias y resulta relativamente útil conocer sus valores particulares para los
tratamientos investigados. En su lugar, se prueban hipótesis con referencia a la variabilidad
de las τ i y se intenta dicha variabilidad. Esto se conoce como modelo de efectos
aleatorios o de componentes de varianza.
3.5. Modelo de Efectos Fijos
En este modelo los efectos de tratamiento τ i se definen usualmente como desviaciones con
respecto a la media general, por esta razón
k
∑τ
i =1
i = 0 (3.2)
Si se seleccionan muestras aleatorias de tamaño n de diferentes poblaciones asumidas

independientes y normalmente distribuidas con medias µ1 , µ 2 , µ 3 ,..., µ k y varianza común
σ 2 , es posible establecer el siguiente contraste:

Estadística II
H 0 : µ1 = µ 2 = ... = µ k
(3.3)
H 1 : µ i ≠ µ j para al menos un par (i, j )
si no se rechaza la hipótesis nula, todos los tratamientos tienen la media común µ . Una
forma equivalente de expresar las hipótesis anteriores en términos de los efectos del
tratamiento es la siguiente:
H 0 : τ 1 = τ 2 = ... = τ k = 0 (3.4)
H 1 : τ i ≠ 0 para al menos un i
Fórmulas para calcular la suma de cuadrados, muestras de igual tamaño:
k n
T 2 ..
SCT = ∑∑ y ij2 − (3.5)
i =1 j =1 nk
k
∑T
i =1
2
i.
T 2 ..
SCTR = − (3.6)
n nk
SCE = SCT − SCTR (3.7)
Tabla 3.2. ANOVA para el modelo de efectos fijos unifactorial
Fuente de Suma de Grados de Cuadrado medio F calculado

variación cuadrados libertad
Tratamiento SCTR k-1 SCTR CMTR
CMTR = Fc =
Error k −1 CME
SCE k(n-1) SCE

CME =
k (n − 1)
Total SCT nk-1
Respecto al contraste, se rechaza la hipótesis nula H 0 si y solamente si Fc > Fk −1,k ( n −1);α .

Estadística II
Fórmulas para calcular la suma de cuadrados; muestras de diferentes tamaños:
k ni
T 2 ..
SCT = ∑∑ y ij2 − (3.8)
i =1 j =1 N
k
∑T i =1
2
i.
T 2 ..
SCTR = − (3.9)
ni N
SCE = SCT − SCTR (3.10)
k
con N = ∑ ni . Los grados de libertad para SCTR siguen siendo k-1; mientras que para
i =1
SCE es N-k y para SCT es N-1. Se rechaza la H 0 si y solo si Fc > Fk −1, N − k ;α .
Ejemplo 3.1. Supóngase que, en un experimento industrial, un ingeniero se encuentra

interesado en averiguar cómo varía la absorción media de humedad del concreto en cinco
diferentes agregados de concreto. Las muestras se expusieron a la humedad por 48 horas.
Se decidió probar seis muestras para cada agregado, requiriéndose probar un total de 30
muestras. Los datos se muestran a continuación:
Tabla 3.3. Absorción de la humedad en los agregados del concreto
Agregado (peso %)
1 2 3 4 5
551 595 639 417 563
457 580 615 449 631
450 508 511 517 522
731 583 573 438 613
499 633 648 415 656
632 517 677 555 679
Total 3.320 3.416 3.663 2.791 3.664 16.854
Media 553,33 569,33 610,50 465,17 610,67 561,80

Estadística II
Realizar un contraste de hipótesis para testificar la igualdad promedio de absorción de los
agregados de concreto. Use un nivel de confianza del 95%.
1. En primer lugar, se formulan las siguientes hipótesis:
H 0 : µ1 = µ 2 = µ 3 = µ 4 = µ 5
H 1 : Al menos dos de las medias son diferentes.
2. Debe fijarse el nivel de significación, para este caso α = 0,05 .
3. Se halla la región crítica o región de rechazo. En el ejercicio se tiene que

Ft = F4, 25;0, 05 = 2,76.
4. Realizar los cálculos respectivos para posteriormente, construir la tabla de ANOVA:
16.854 2
SCT = 5512 + 457 2 + ... + 679 2 − = 9.677.954 − 9.468.577 = 209.377
30
3.320 2 + 3.416 2 + ... + 3.664 2
SCTR = − 9.468.577 = 85.356
6
SCE = 209.377 − 85.356 = 124.021
Tabla 3.4. ANOVA para los datos de la tabla 3.3
Fuente de Suma de Grados de Cuadrado F calculado

variación cuadrados libertad medio
Agregados 85.356 4 21.339 4,30
Error 124.021 25 4.961
Total 209.377 29
5. Finalmente, debe realizarse la comparación respectiva y por ende concluir en función de

la hipótesis nula. Dado que se cumple la relación Fc > Ft (4,30>2,76) se rechaza la

Estadística II
hipótesis nula H 0 ; por lo que se puede decir que con un nivel de confianza del 95% (o
significación del 5%) hay evidencias suficientes de que los compuestos no tienen el mismo
nivel promedio de absorción.
Ejemplo 3.2. Parte del estudio “Serum Inorganic Phosporus Levels in Children with
Seizure Disorders Taking Anticonvulsant Drugs”, llevado a cabo en Virginia Polytechnic
Institute and State University en 1982, fue diseñado para medir los niveles de actividad de
la fosfatasa alcalina de suero (Unidades Bessey-Lowry) en niños con problemas de
crecimiento que recibieron terapia anticonvulsiva bajo el cuidado de un especialista
privado. Se encontraron 45 personas para el estudio y se clasificaron en cuatro grupos
según su medicamento:
G-1: control (sin recibir anticonvulsivos y sin tener un historial de problemas de

crecimiento),
G-2: fenorbital,
G-3: carbamazepina,
G-4: otros anticonvulsivos.
De las muestras de sangre extraídas a cada sujeto, se determinó y registró el nivel de

actividad de la fosfatasa alcalina de suero, los resultados registrados fueron los siguientes:
Tabla 3.5. Nivel de actividad de la fosfatasa alcalina del suero

Grupo de medicamentos
G-1 G-2 G-3 G-4
49, 20 97,50 97,07 62,10 110,60
44,54 105,00 73,40 94,95 57,10
45,80 58,05 68,50 142,50 117,60
95,84 86,60 91,85 53,00 77,71
30,10 58,35 106,60 175,00 150,00
36,50 72,80 0,57 79,50 82,90
82,30 116,70 0,79 29,50 111,50
87,85 45,15 0,77 78,40
105,00 70,35 0,81 127,50
95,22 77,40

Estadística II
Pruebe la hipótesis con un nivel de significación de 0,05, de que el nivel promedio de la
actividad de la fosfatasa alcalina del suero es el mismo para los cuatro grupos.
1. Planteamiento de hipótesis:
H 0 : µ1 = µ 2 = µ 3 = µ 4
H 1 : Al menos dos de las medias son diferentes.
2. Fijación del nivel de significación: α = 0,05.

3. Establecimiento de la región crítica o región de rechazo: Ft = F3, 41;0,05 = 2,836.
4: Cálculos: T1. = 1.460,25; T2. = 440,36; T3. = 842,45; T4. = 707,41; T.. = 3.450,47
3.450,47 2
SCT = 49,20 2 + 44,54 2 + ... + 111.50 2 −
45
= 331.886,9701-264.572,0716 = 67.314,8985
1.460,25 2 440,36 2 842,45 2 707,412 3.450,47 2
SCTR = + + + −
20 9 9 7 45
= 278.510,6729 − 264.572,0716 = 13.938,6013
SCE = 67.314,8985 − 13.938,6013 = 53.376,2972

Grupo de
medicamentos 13.938,6013 3 4.646,2004 3,57
Error 53.376,2972 41 1.301,8609
Total 67.314,8985 44
5. Decisión y conclusión: como se cumple que Fc > Ft se rechaza la H 0 . Con un nivel de

confianza del 95%, se tiene que los niveles promedio de actividad de la fosfatasa alcalina
del suero para los cuatro grupos no son todos iguales.

Estadística II
3.6. Modelo de Efectos Aleatorios
Frecuentemente al experimentador le interesa un factor que tiene un gran número de

posibles niveles. Se dice que el factor es aleatorio si el experimentador selecciona
aleatoriamente k de estos niveles de la población de niveles del factor. En este sentido, se
obtienen conclusiones de toda la población de niveles del factor porque los niveles usados
en el experimento fueron seleccionados al azar. Se supone que la población de niveles del
factor es infinita o lo suficientemente grande para ser considerada infinita. Los casos en que
la población de niveles del factor es suficientemente pequeña, para emplear un enfoque de
población finita no se encuentran muy seguido.
En el caso del modelo de efectos aleatorios τ i es una variable aleatoria con varianza σ τ2 y
es independiente de ε ij . La varianza de cualquier observación es
V ( y ij ) = σ τ2 + σ 2 (3.11)
Las varianzas σ τ2 y σ 2 se conocen como componentes de varianza y el modelo presentado

en (3.1) se denomina modelo de componentes de varianza o de efectos aleatorios. Para
probar las hipótesis se requiere que los ε ij sean NID(0, σ 2 ) , que los τ i sean NID(0, σ τ2 ) y
que τ i y ε ij sean independientes.
Al igual que en el modelo de efectos fijos, la variabilidad total en las observaciones se

descompone en un componente que mide la variación entre los tratamientos (SCTR) y otra
que mide la variación dentro de los tratamientos (SCE). En este caso, carece de sentido
probar hipótesis que se refieren a los efectos de tratamiento individuales y en su lugar
deben probarse las hipótesis:
H 0 : σ τ2 = 0
(3.12)
H 1 : σ τ2 > 0
Todos los tratamientos son idénticos si σ τ2 = 0 ; por otra parte, si σ τ2 > 0 existe
variabilidad entre los tratamientos. El procedimiento de análisis de varianza para el modelo

Estadística II
de efectos aleatorios es idéntico al de efectos fijos. Sin embargo, las conclusiones son un
tanto diferentes ya que se aplican a toda la población de tratamientos. En el modelo de
efectos aleatorios, los componentes de varianza son
∧ 2
σ = CME (3.13)
y
∧ 2 CMTR − CME
στ = (3.14)
n
Para tamaños de muestra desiguales, n se debe reemplazar por
 k

1  k ∑ ni2 
n0 = ∑ ni − i =k1  (3.15)
k − 1  i =1
 ∑ ni 
i =1 
Ejemplo 3.3. Una compañía textil utiliza un gran número de telares. Se desea que los
telares sean homogéneos con el objeto de producir tela de resistencia uniforme. El
ingeniero de procesos supone que, aparte de la variación usual en la resistencia de tela en
muestras del mismo telar, puede existir una variación significativa de la resistencia entre los
distintos telares. Para investigar esto, selecciona cuatro telares al azar y realiza cuatro
determinaciones de la resistencia de la tela manufacturada por cada uno. Este experimento
es realizado en orden aleatorio y los datos se muestran a continuación:
Tabla 3.7. Datos de resistencia de los telares

Observaciones
Telares 1 2 3 4 Totales
1 98 97 99 96 390
2 91 90 93 92 366
3 96 95 97 95 383
4 95 96 99 98 388

Estadística II
Para los datos en cuestión, se lleva a cabo un análisis de varianza similar al presentado en el
ejemplo 3.2.

Telares 89,19 3 29,73 15,68

Error 22,75 12 1,90
Total 111,94 15
De este análisis se concluye que existen diferencias significativas entre los telares de la
∧ 2
planta. Las estimaciones para los componentes de varianza son σ = 1,90 y
∧ 2 29,73 − 1,90
στ = = 6,96
4
Por tanto, la estimación de la varianza de cualquier observación de la muestra es:

∧ 2 ∧ 2
σ + σ τ = 1,90 + 6,96 = 8,86
Así, los resultados indican que la mayor variabilidad se atribuye a diferencias entre los
telares. Este ejemplo ilustra un uso importante de los componentes de varianza, a saber, al
aislar las diferentes fuentes de variabilidad que afectan a un producto o sistema. El
problema de la variabilidad de un producto surge, frecuentemente, en el aseguramiento de
la calidad, siendo frecuentemente difícil aislar las fuentes que producen la variabilidad. El
ingeniero debería intentar aislar las causas específicas de la diferencia de desempeño de los
telares. Si puede identificar y aislar estas fuentes de variabilidad, la varianza de la
producción del proceso puede ser reducida considerablemente y hacer que el proceso sea
más homogéneo en términos del desempeño de los telares.

Estadística II
3.7. Análisis de Varianza en la Regresión Lineal Simple
Existe una forma equivalente de probar la hipótesis de no existencia de una relación lineal
entre X e Y ( H 0 : β 1 = 0) utilizando el método del ANOVA. En estos términos, es
importante recordar la siguiente descomposición:
SCT = SCR + SCE, (3.16)
donde:
_ _ 2
SCT = ∑ (Yi − Y ) 2 = ∑ Yi 2 − n Y (3.17)
∧ _ ∧ 2 _ 2
SCR = ∑ (Y i − Y) 2 = β 1 (∑ X i2 − n X ) (3.18)
∧
SCE = ∑ (Yi − Y i ) 2 = SCT - SCR (3.19)
Tabla 3.9. ANOVA en Regresión Lineal Simple

Regresión SCTR 1 SCTR CMTR
CMTR = Fc =
1 CME
Error SCE n-2 SCE

CME =
(n − 2)
Total SCT n-1
En el caso que el contraste sea por la derecha ( H 1 : β1 > 0) se rechaza la hipótesis nula si
y solo si Fc > F1,n −2;α . Si es por la izquierda ( H 1 : β1 < 0) se rechaza la H 0 si
Fc < 1 / Fn− 2,1;α .

Estadística II
Ejemplo 3.4. Retomando el ejemplo 2.1 del tema anterior se tiene:
1. H 0 : β1 = 0
H 1 : β1 >0.
2. α = 0,05 .
3. Ft = F1,5;0, 01 = 6.61 .
4. SCT = 710; SCR = 474,4480; SCE = 235,5520.
Tabla 3.10. ANOVA para los datos del ejemplo 2.1

Regresión 474,4480 1 474,4480 10,07
Error 235,5520 5 47,1104
Total 710 6
5. Como Fc > Ft se rechaza la hipótesis nula. A un nivel de significación del 5% se puede

concluir que los datos presentan evidencias suficientes que existe una relación lineal directa
entre las variables producción mensual de artículos y maquinaria utilizada en los procesos
industriales.
3.8. Experimentos factoriales
Considere una situación en la cual es de interés estudiar el efecto de dos factores, A y B,

sobre alguna respuesta. Por ejemplo, en un experimento químico podría desearse variar de
manera simultánea la presión y el tiempo de la reacción y estudiar el efecto de cada uno
sobre el comportamiento del experimento. En un experimento biológico, es de interés

Estadística II
estudiar el efecto del tiempo de secado y de la temperatura de la cantidad de sólidos
(porcentaje por unidad) remanente en muestras de fermentadores. El término factor es
utilizado en sentido general para denotar cualquier característica del experimento, como la
temperatura, el tiempo o la presión, que pueden variarse de ensayo a ensayo. Se definen los
niveles de un factor como los valores reales utilizados en el experimento. Así, en cada uno
de estos casos, resulta de suma importancia, no sólo determinar si los dos factores tienen
una influencia sobre la respuesta, adicionalmente, es de interés determinar si hay una
interacción significativa entre los dos factores.
3.9. Interacción en los experimentos de dos factores
Desde el punto de vista de un experimentador, podría parecer necesario llegar a una prueba
de significancia acerca de interacción separando la variación del error verdadero de la
variación debida a la interacción. Los efectos de los factores A y B, a menudo denominados
efectos principales, adquieren diferentes significados en presencia de la interacción. Si ésta
última no es significativa, entonces los resultados de las pruebas acerca de los efectos
principales tienen sentido; sin embargo, si la interacción es significativa entonces sólo
aquellas pruebas acerca de los efectos principales que resulten ser significativas tienen
sentido. Efectos principales no significativos en presencia de la interacción podrían muy
bien ser un resultado del encubrimiento y plantear la necesidad de observar la influencia de
cada factor para niveles fijos del otro. Ampliando la expresión (3.1) se tiene:
yij = µ + α i + β j + (αβ ) ij + ε ij (3.20)
En este caso, se considera el caso de n réplicas de las combinaciones de tratamientos

determinadas por a niveles del factor A y b niveles del factor B. Cada combinación de
tratamientos define una celda en el arreglo matricial conformado por ambos factores. Cada
combinación de tratamientos define una celda en el arreglo. De esta forma, se tienen ab
celdas, conteniendo cada celda n observaciones. Así, yijk representa la k-ésima observación
tomada para el i-ésimo nivel del factor A y para el j-ésimo nivel del factor B de las abn
observaciones.

Estadística II
Las observaciones en la (ij)-ésima celda constituyen una muestra aleatoria de tamaño n de
una población que se asume está distribuida en forma normal con media µ ij y varianza σ 2 .
Los siguientes símbolos son importantes para la comprensión de este apartado:
Tij . = suma de las observaciones en la (ij)-ésima celda
Ti.. = suma de las observaciones para el i-ésimo nivel del factor A
T. j. = suma de las observaciones para el j-ésimo nivel del factor B
T... = suma de todas las observaciones abn.

Cada observación puede ser escrita de la forma:
y ijk = µ ij + ε ijk , (3.21)
donde ε ijk mide las desviaciones de los valores observados yijk en la (ij)-ésima celda de la
media poblacional µ ij . Si (αβ ) ij denota el efecto de interacción del i -ésimo nivel del
factor A y el j-ésimo nivel del factor B, α i el efecto del i-ésimo nivel del factor A y el j-
ésimo nivel del factor B; y µ la media total, se puede escribir:
µ ij = µ + α i + β j + (αβ ) ij , (3.22)
y entonces
yijk = µ + α i + β j + (αβ ) ij + ε ijk , (3.23)
a b b
sobre lo cual se imponen las restricciones (i) ∑α
i =1
i = 0, (ii) ∑β
j =1
j = 0 , (iii) ∑ (αβ )
j =1
ij =0 y
b
(iv) ∑ (αβ )
j =1
ij =0.

Estadística II
Las tres hipótesis a ser probadas son las siguientes:
H 0 : α 1 = α 2 = ... = α a = 0, (3.24)
H 1 : Al menos una de las α i' s no es igual a cero.
H 0 : β 1 = β 2 = ... = β b = 0, (3.25)
H 1 : Al menos una de las β 'j s no es igual a cero.
H 0 : (αβ )11 = (αβ )12 = ... = (αβ ) ab = 0, (3.26)
H 1 : Al menos una de las (αβ ) ij' s no es igual a cero.
Cada una de estas pruebas se encuentra basada en una comparación de estimaciones

independientes de σ 2 suministrada por la división de la suma total de cuadrados de los
datos en cuatro componentes. Las fórmulas de cálculo son:
a b n
T...2
SCT = ∑∑∑ y ijk
2
− (3.27)
i =1 j =1 k =1 abn
a
∑T T...2
i =1
2
i ..
SCA = − (3.28)
bn abn
b
∑T
j =1
2
. j.
T...2
SCB = − (3.29)
an abn
a b a b
∑∑ T
i =1 j =1
2
ij . ∑ Ti..2 ∑T
j =1
2
. j.
T 2 ...
i =1
SC ( AB ) = − − + (3.30)
n bn an abn
SCE = SCT − SCA − SCB − SC ( AB ) (3.31)

Estadística II
Tabla 3.11. ANOVA para el experimento de dos factores con n réplicas

Efecto SCA CMA
CMA = Fc =
principal SCA a-1 a −1 CME
A SCB b-1 SCB CMB

CMB = Fc =
b −1 CME
B
SC ( AB) CM ( AB )
Interacción de CM ( AB) = Fc =
(a − 1)(b − 1) CME
dos factores SC(AB) (a-1)(b-1)
AB
SCE
Error SCE ab(n-1) CME =
ab(n − 1)
Total SCT abn-1
En el primer contraste, se rechaza la H 0 si y solo si Fc > Fa −1,ab ( n −1);α . Para el segundo se
rechaza la hipótesis nula si Fc > Fb−1, ab ( n −1);α ; mientras que en el último se rechaza si y solo
si Fc > F( a −1)( b−1),ab ( n −1);α . Es conveniente realizar el test para la interacción antes de intentar
obtener inferencias acerca de los efectos principales. Si la interacción no es significativa, el

experimentador puede proceder a probar los efectos principales. Sin embargo, una
interacción significativa podría implicar que los datos deben ser analizados de algún modo
diferente, como observando el efecto del factor A a niveles fijos del factor B; por ejemplo.
Ejemplo 3.5. En un experimento realizado para determinar cuál de tres diferentes sistemas
de misiles es preferible, se midió el promedio de combustión del impulsor para 24
encendidos estáticos. Fueron utilizados cuatro diferentes tipos de impulsor. El experimento
produjo observaciones duplicadas de los promedios de ignición a cada combinación de los
tratamientos. Los datos se muestran tal y como sigue:

Estadística II
Tabla 3.12. Promedios de combustión del impulsor
Sistema de Tipo de impulsor

misiles b1 b2 b3 b4
a1 34,0 30,1 29,8 29,0

32,7 32,8 26,7 28,9
a2 32,0 30,2 28,7 27,6
33,2 29,8 28,1 27,8
a3 28,4 27,3 29,7 28,8
29,3 28,9 27,3 29,1
Utilice un nivel de significación del 5% para probar las siguientes hipótesis: a) H 0 : No

hay diferencia en la media de los promedios de combustión del impulsor cuando se utilizan
diferentes sistemas de misiles. b) H 0 : No hay diferencia en la media de los promedios de
combustión del impulsor para los cuatro tipos de impulsor y c) H 0 : No hay interacción
entre los diferentes sistemas de misiles y los diferentes tipos de impulsor.
1. a) H 0 : α 1 = α 2 = α 3 = 0,
H 1 : Al menos una de las α i' s no es igual a cero
b) H 0 : β 1 = β 2 = β 3 = β 4 = 0,
H 1 : Al menos una de las β 'j s no es igual a cero.
c) H 0 : (αβ )11 = (αβ )12 = ... = (αβ ) 34 = 0,
H 1 : Al menos una de las (αβ ) ij' s no es igual a cero.
2. α = 0,05.
3. Regiones críticas: Ft = F2,12;0, 05 = 3,89. Ft = F3,12;0, 05 = 3,49. Ft = F6,12;0, 05 = 3,00.
4. De la tabla 3.12, en primer lugar se construye la de totales:

Estadística II
b1 b2 b3 b4 Total
a1 66,7 62,9 56,5 57,9 244,0
a2 65,2 60,0 56,8 55,4 237,4

57,7 56,2 57,0 57,9 228,8
a3
Total 189,6 179,1 170,3 171,2 710,2
Posteriormente se realizan los cálculos:
710,2 2
SCT = 34,0 2 + 32,7 2 + ... + 29,12 − = 21.107,68 − 21.016,00 = 91,68
24
244,0 2 + 237,4 2 + 228,8 2 710,2 2
SCA = − = 21.030,52 − 21.016,00 = 14,52
8 24
189,6 2 + 179,12 + 170,3 2 + 171,2 2 710,2 2
SCB = − = 21.056,08 − 21.016,00 = 40,08
6 24
66,7 2 + 65,2 2 + ... + 57,9 2
SC ( AB) = − 21.030,52 − 21.056,08 + 21.016,00 = 22,17
2
SCE = 91,68 − 14,52 − 40,08 − 22,17 = 14,91.

Sistema de misiles 14,52 2 7,26 5,85
Tipo de impulsor 40,08 3 13,36 10,77
Interacción 22,17 6 3,70 2,98
Error 14,91 12 1,24
Total
5. Para el tercer contraste, se tiene que Fc < Ft por lo que no se rechaza la hipótesis nula de
no interacción entre los diferentes sistemas de misiles y los diferentes tipos de impulsor a
un nivel de confianza del 95%. Ya que no hay interacción significativa, las pruebas de los

Estadística II
sistemas de misiles y de los tipos de impulsor tienen sentido. Para ambas, se rechaza la H 0
y con un nivel de significación del 5% por un lado se tiene que: a) diferentes sistemas de
misiles proporcionan como resultado diferentes medias de los promedios de combustión de
los impulsores y b) las medias de los promedios de combustión de los impulsores no son las
mismas para los cuatro tipos de impulsores.
3.10. Diseños factoriales 2k
Los diseños factoriales son ampliamente utilizados en experimentos en los que intervienen
varios factores para estudiar el efecto conjunto de éstos sobre una respuesta. Existen varios
casos especiales del diseño factorial general que resultan importantes porque se usan
ampliamente en el campo de investigación, y porque constituyen la base para otros diseños
de gran valor práctico. El más importante de estos casos especiales ocurre cuando se tienen
k factores, cada uno con dos niveles. Estos niveles pueden ser cuantitativos como en el caso
de dos valores de temperatura, presión o tiempo. También pueden ser cualitativos como
sería el caso de dos máquinas, dos operadores, los niveles “superior” e “inferior” de un
factor o, quizás la ausencia o presencia de un factor. Una réplica completa de tal diseño
requiere que se recopilen 2 × 2 × 2 × ...2 = 2 k observaciones y se conoce como diseño
factorial 2 k .
Este diseño es particularmente útil en las primeras fases del trabajo experimental, cuando es
probable que haya muchos factores por investigar. Conlleva el menor número de corridas
con los cuales pueden estudiarse k factores en un diseño factorial completo. Debido a que
sólo hay dos niveles para cada factor, debe suponerse que la respuesta es aproximadamente
lineal en el intervalo de los niveles elegidos de los factores.
3.11. El diseño factorial 22
El primero diseño de la serie 2 k es aquel que tiene sólo dos factores, llamados A y B, cada
uno con dos niveles. Este diseño se conoce como diseño factorial 2 2 . Arbitrariamente, los
niveles del factor pueden llamarse “inferior” y “superior” o “bajo y alto”. Para las n
observaciones experimentales por cada combinación de tratamientos, se designan los
niveles superiores de los factores A, B, C… por las letras a, b, c,… y los niveles inferiores

Estadística II
de cada factor con la notación (1). En un diseño de este tipo, se pueden interpretar entonces
los símbolos (1), a, b, y ab como los resultados totales para cada una de las combinaciones
de tratamientos. La tabla presentada a continuación, proporciona una tabla con dos
direcciones acerca de estos comportamientos totales:
Tabla 3.14. Experimentos factoriales
B Media
(1) (b) b + (1)
A 2n
a ab ab + a
2n
Media a + (1) ab + b
2n 2n
Las fórmulas de las sumas de cuadrados son las siguientes:
[ab + a - b - (1)]2
SCA = (3.32)
n.4
[ab + b - a - (1)] 2
SCB = (3.33)
n.4
[ab + (1) - a - b] 2
SCAB = (3.34)
n.4
2 2 n
Y...2
SCT = ∑∑∑ y ijk2 − (3.35)
i =1 j =1 k =1 4n
SCE = SCT − SCA − SCB − SCAB (3.36)

Estadística II
Tabla 3.15. ANOVA para el diseño 22

A SCA 1 SCA CMA
CMA = Fc =
1 CME
B SCB 1 SCB CMB

CMB = Fc =
1 CME
SCAB CMAB
AB SCAB 1 CMAB = Fc =
1 CME
SCE
Error SCE 4(n-1) CME =
4(n − 1)
Total SCT 4n-1
Ejemplo 3.6. Supóngase que una investigación llevada a cabo para estudiar el efecto que
tienen la concentración de un reactivo y la presencia de un catalizador sobre el tiempo de
reacción de un proceso químico. Sea la concentración del reactivo el factor A con dos
niveles de interés, 15% y 20%. El catalizador constituye el factor B; el nivel alto (o
superior) denota el uso de dos sacos de catalizador y el nivel bajo (o inferior) denota el uso
de sólo un saco. El experimento se realiza (“replica” o “repite” tres veces y los datos son
como sigue:
Tabla 3.16. Datos para la concentración del reactivo y uso del catalizador
Réplica
Combinación de tratamientos I II III Total
A baja, B baja 28 25 27 80
A alta, B baja 36 32 32 100
A baja, B alta 18 19 23 60
A baja, B alta 31 30 29 90
Los cálculos se presentan a continuación:

Estadística II
(50) 2 (−30) 2
SCA = = 208,33 SCB = = 75,00
4(3) 4(3)
(10) 2 (10) 2
SCAB = = 8,33 SCAB = = 8,33
4(3) 4(3)
SCT = 9.398,0 − 9.075,00 = 323,00 SCE = 323,00 − 208,33 − 75,00 − 8,33 = 31,34

Concentración del 208,33 1 208,33 53,15
reactivo
Uso del catalizador 75,00 1 75,00 19,13
Interacción 8,33 1 8,33 2,13
Error 31,34 8 3,92
Total 323,00 11
A un nivel de significación del 5% Ft = F1,8;0, 05 = 5,32 ; por lo que ambos efectos
principales son significativos; mas no el de interacción.

Estadística II

Tema3 PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Tema3 PDF

Cargado por

Copyright:

Formatos disponibles

Tema 3: Introducción al Análisis y Diseño de Experimentos

La metodología del Diseño de Experimentos se basa en analizar los cambios en la

En concordancia con lo anterior, el Diseño Estadístico de Experimentos (DEX) proporciona

3.2. Objetivos del Diseño y Análisis de Experimentos

. Determinar las principales causas de variación en la respuesta del proceso.

3.3. Etapas en un Diseño Experimental

1. Planeación del DEX

1.1. Etapas pre-experimentales:

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 1

1.2. Etapas experimentales:

2. Análisis estadístico de los datos. Especificar modelo del DEX.

3. Interpretación de los resultados.

3.4. Análisis de Varianza

En el contexto de los contrastes de hipótesis, el Análisis de Varianza (ANOVA) es un

Supóngase que se desea comparar k tratamientos o niveles de un factor único. La respuesta

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 2

observación del i-ésimo tratamiento. En general, habrá n observaciones del tratamiento i.

y ij = µ + τ i + ε ij ; i = 1,2,..., k y j = 1,2,..., n (3.1)

en donde yij es la (ij ) − ésima observación, µ es un parámetro común a todos los

tratamientos denominado media global o la gran media, τ i es un parámetro único para el i-

ésimo tratamiento llamado efecto del tratamiento i-ésimo y ε ij es el componente de error

Tabla 3.1. Datos típicos para un experimento unifactorial

Este modelo se denomina análisis de varianza clasificación en un sentido o en una sola

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 3

aleatorios o de componentes de varianza.

3.5. Modelo de Efectos Fijos

Si se seleccionan muestras aleatorias de tamaño n de diferentes poblaciones asumidas

σ 2 , es posible establecer el siguiente contraste:

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 4

Fórmulas para calcular la suma de cuadrados, muestras de igual tamaño:

Tabla 3.2. ANOVA para el modelo de efectos fijos unifactorial

Fuente de Suma de Grados de Cuadrado medio F calculado

SCE k(n-1) SCE

Total SCT nk-1

Respecto al contraste, se rechaza la hipótesis nula H 0 si y solamente si Fc > Fk −1,k ( n −1);α .

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 5

SCE es N-k y para SCT es N-1. Se rechaza la H 0 si y solo si Fc > Fk −1, N − k ;α .

Ejemplo 3.1. Supóngase que, en un experimento industrial, un ingeniero se encuentra

Tabla 3.3. Absorción de la humedad en los agregados del concreto

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 6

1. En primer lugar, se formulan las siguientes hipótesis:

2. Debe fijarse el nivel de significación, para este caso α = 0,05 .

3. Se halla la región crítica o región de rechazo. En el ejercicio se tiene que

4. Realizar los cálculos respectivos para posteriormente, construir la tabla de ANOVA:

Tabla 3.4. ANOVA para los datos de la tabla 3.3

Fuente de Suma de Grados de Cuadrado F calculado

5. Finalmente, debe realizarse la comparación respectiva y por ende concluir en función de

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 7

G-1: control (sin recibir anticonvulsivos y sin tener un historial de problemas de

De las muestras de sangre extraídas a cada sujeto, se determinó y registró el nivel de

Tabla 3.5. Nivel de actividad de la fosfatasa alcalina del suero

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 8

2. Fijación del nivel de significación: α = 0,05.

Tabla 3.6. ANOVA para los datos de la tabla 3.5

Fuente de Suma de Grados de Cuadrado F calculado

5. Decisión y conclusión: como se cumple que Fc > Ft se rechaza la H 0 . Con un nivel de

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 9

Frecuentemente al experimentador le interesa un factor que tiene un gran número de

es independiente de ε ij . La varianza de cualquier observación es

Las varianzas σ τ2 y σ 2 se conocen como componentes de varianza y el modelo presentado

que τ i y ε ij sean independientes.

Al igual que en el modelo de efectos fijos, la variabilidad total en las observaciones se

Pedro Harmath Introducción al Análisis y Diseño de Experimentos 10