Está en la página 1de 59

1.

INTRODUCCIN

AL

DISEO

DE

EXPERIMENTOS

El diseo de experimentos es una tcnica estadstica que nos ayuda a


identificar qu factores o variables afectan El comportamiento de un
proceso productivo y de esta manera poder mejorarlo.
O bien: es una prueba o una serie de pruebas en las cuales se
inducen cambios deliberados en las variables de entrada de un
proceso o sistema, de manera que sea posible observar e identificar
las causas de los cambios en la respuesta de salida.
Experimento: es una prueba o ensayo.
Algunas de las variables del proceso x 1, x2,..., xk son controlables,
mientras que otras z1, z2,...,zk son incontrolables (aunque pueden ser
controlables para los fines de prueba). Entre los objetivos del
experimento pueden incluirse:
1. Determinar cules variables tiene mayor influencia en la
respuesta, y.
2. Determinar el mejor valor de las x que influyen en y, de modo
que y tenga casi siempre un valor cercano a valor nominal
deseado.
3. Determinar el mejor valor de las x que influyen en y, de modo
que la variabilidad de y sea pequea.
4. Determinar el mejor valor de las x que influyen en y, de modo
que se minimicen los efectos de las variables no controlables z 1,
z2,...zq.

Lo mtodos de diseo experimental tiene un propsito que puede ser


desarrollar un proceso consistente o robusto; esto es, un proceso que
no sea afectado por fuentes de variabilidad externas o ruido (las zi).
En

el

diseo

de

experimentos

se

plantean

varias

preguntas

importantes:
1. Son estas dos soluciones los nicos medios para lograr la
respuesta de inters?
2. Existen otros factores que pueden afectar la respuesta de las
muestras y que deban ser investigados o controlados?
3. Cuntas muestras deben ser sometidas a cada solucin de
templado?
4. En qu forma debe asignarse cada muestra a los tratamientos,
y en qu orden deben realizarse las mediciones?
5. Qu mtodo de anlisis debe utilizarse?
6. Qu diferencia en los niveles promedio de respuesta entre los
dos tratamientos debe considerarse como significativa?
Estas, y quiz muchas otras preguntas, debern ser contestadas
satisfactoriamente antes de llevar a cabo el experimento.

1.1 Aplicaciones del diseo de experimentos


El diseo de experimentos puede servir para mejorar el rendimiento
de un proceso de manufactura, desarrollo de nuevos procesos con lo
que se logra:
1. Mejorar el rendimiento del proceso.
2. Menor variabilidad y mayor apego a los requerimientos
nominales y objetivos.
3. Menor tiempo de desarrollo.
4. Menores costos totales.

Los mtodos de diseo de experimentos tambin se aplican al diseo


de productos como sigue:
1. Evaluacin y comparacin de conceptos de diseo bsicos.
2. Evaluacin de materiales alternativos.
3. Seleccin de parmetros de diseo de modo que el producto
funcione bien desde una amplia variedad de condiciones de uso
real; Esto es, de modo que el producto sea consistente (robusto).
El uso del diseo de experimentos en estas reas puede dar por
resultado productos con mayor confiabilidad y mejor funcionamiento
en el campo, menores costos, y menor tiempo de diseo y desarrollo
del producto.
El diseo estadstico de experimentos es el proceso de planear un
experimento

para

obtener

datos

apropiados,

que

pueden

ser

analizados mediante mtodos estadsticos, con objeto de producir


conclusiones validas y objetivas.
Cuando se

identifican los factores y su influencia en un sistema

productivo, se pueden tomar decisiones que efectivamente mejoren


la calidad del producto o servicio. Se pueden identificar las fuentes
de variacin reales para su reduccin en la bsqueda de la mejora
continua.
Cuando se usan experimentos pretendemos analizar el efecto de
cambios que nosotros inducimos ms que analizar variaciones al azar.
Por ejemplo, mediante un diagrama causa-efecto podemos identificar
las posibles causas o factores que inciden en un efecto o respuesta
(Diagrama causa y efecto).

Mediante un experimento podemos inducir cambios en uno varios


factores (F2l. F33 y F11 por ejemplo) y analizar estadsticamente si el
cambio en los factores afecta o no el resultado o efecto del proceso.
Experimento: Es un conjunto de pruebas estructurado y coherente
que son analizadas a fin de comprender la operacin del
proceso.
Diseo de experimentos: Es el proceso de planear, ejecutar y
analizar

el

experimento

de

manera

que

los

datos

apropiados sean recolectados, y que estos tengan validez


estadstica para obtener conclusiones validas y tiles. Se
entiende por validez estadstica, el que los resultados se
puedan

repetir

consistentemente

sobre

todo

en

la

operacin a gran escala o masiva.


Eficiencia de un experimento: Un experimento es eficiente
cuando:
1. Se obtiene la informacin requerida.
2. Con el mnimo consumo de recursos.
Esto es, un experimento eficiente debe ser lo ms simple y
econmico posible

pero

efectivo. Las tcnicas del diseo de

experimentos pretenden que los experimentos sean eficientes.

1. 2 Principios bsicos del diseo de experimentos


Para que un experimento pueda tener validez estadstica se deben de
observar al menos tres principios:
Reproduccin: Esto significa que el experimento se pueda
llevar a cabo o repetir bajo las mismas condiciones en ms de
una ocasin.

La diferencia observada como resultado de un experimento es real, o


se debe a simple error aleatorio, o aun ms a otro factor como por
ejemplo diferente tipo del material. Para aclarar esto, es necesario
repetir el experimento y cuantificar si se presenta consistentemente o
no la variacin detectada.
La reproduccin por lo tanto es importante por al menos dos razones:
i) Permite cuantificar el error aleatorio inherente al proceso y
ii) Permite una mejor estimacin de los parmetros.
Aleatoriedad: Esto significa que tanto el material asignado a
un experimento en particular, como el orden en que se efectan
las pruebas se efectu de una manera aleatoria.
La aleatoriedad por lo tanto es importante por al menos dos razones
i)

Confunde el efecto de factores no controlables y

ii)

Valida las pruebas estadsticas al hacer que los errores


experimentales sean estadsticamente independientes.
Anlisis por bloques: Es una tcnica

que se usa para

incrementar la precisin del experimento. Un bloque es una


porcin del material experimental que sea ms homognea que
el total del material o cuando las condiciones son ms
homogneas. Al realizar un experimento por bloques se hacen
las

comparaciones

entre

las

condiciones

de

inters

del

experimento dentro de cada bloque.

1.3.

Metodologa

experimento

general

para

realizar

un

Se sugieren varias metodologas en la literatura, la siguiente es una


de ellas:
1) Identifique

claramente

el

problema

situacin

resolver. Antes de poder planear un experimento necesitamos


definir claramente que es la que estamos buscando, aun
cuando esto puede parecer trivial en ocasiones es tanta la
presin para tomar decisiones que corremos a experimentar sin
por lo menos definir claramente nuestros objetivos.
En este paso es necesario definir qu tipo de informacin es
exactamente la que nos interesa, ya que no podemos medir o variar
todos y cada uno de los componentes de un experimento.
En ocasiones escuchamos que el experimento fue un xito pero la
calidad no mejor. Antes de planear un experimento se debe de
investigar y. analizar el conocimiento y datos que ya se tengan sobre
este problema. La participacin activa del personal involucrado en el
problema es de vital importancia en este paso.
En conclusin como resultado de este paso, la hiptesis a probar debe
quedar bien definida. Un diagrama causa-efecto es una buena ayuda
en este paso.
2) Identificar variables. En este paso dos tipos de variables se
deben de identificar, variables dependientes y factores o
variables independientes.
La variable dependiente o variable de respuesta es la caracterstica
de calidad que queremos mejorar y cuyo comportamiento deseamos
conocer, ejemplos de esta son: porcentaje de contaminacin,
satisfaccin de un cliente, desgaste de una herramienta, tiempo, de
falla, etc.

Es deseable que una variable dependiente rena las caractersticas


siguientes:
Cuantitativa
Precisa.
Que tenga algn significado fsico.
Las variables independientes o factores representan aquellas causas
o factores cuyo efecto sobre la variable dependiente se quiere
analizar. Cada uno de estos factores se deber probar al menos a dos
valores diferentes para evaluar su efecto, a cada uno de estos valores
o niveles se les llama tratamientos.
Cmo seleccionar los diferentes niveles de un factor?, En general un
factor puede ser cualitativo (proveedor, turno, operario, etc), o
cuantitativo (temperatura, presin, altura, tiempo, etc.). Los niveles
especficos

en

cualquier

caso

se

pueden

seleccionar

ya

sea

aleatoriamente dentro de un cierto rango o a un nivel fijo definido por


el experimentador previamente, esto nos lleva a cuatro situaciones
generales:
A. Factor fijo, cualitativo.
En este caso, de entre los diferentes niveles o tratamientos posibles
para el factor, el experimentador

est interesado en el efecto que

ciertos niveles seleccionados por l previamente tienen sobre la


variable de respuesta. Adems, el factor es del tipo cualitativo. Por
ejemplo tres proveedores, tres turnos, dos procesos diferentes, etc.

B. Factor fijo, cuantitativo.


Este caso es similar al anterior excepto que el factor es cuantitativo,
por ejemplo: temperatura, presin, tiempo, concentracin de un

componente, etc. Para este caso es recomendable que los diferentes


niveles o tratamientos se tomen equiespaciados, esto es, por ejemplo
10, 20, 30 y 40 C: 5, 10, 15, 20 y 25 psi; 8, 12, 16 y 20 minutos, etc.
La conclusin a que se puede llegar con este caso es si la variable de
respuesta es diferente para cada uno de los tratamientos que se
seleccionaron y de ser as el tipo de relacin que existe entre el factor
y la variable de respuesta (lineal, cuadrtica, etc.).
C. Factor aleatorio, cualitativo.
En este caso los niveles o tratamientos se seleccionan al azar de
entre varios posibles. Por ejemplo: se tienen varios lotes de un mismo
proveedor, se selecciona al azar cules de ellos analizar, en este caso
la conclusin del experimento se extiende para cubrir todos los
posibles niveles..
D. Factor aleatorio, cuantitativo.
Igual que en el caso anterior los diferentes niveles o tratamientos son
seleccionados al azar.
En este material, a menos que se especifique lo contrario, los factores
se consideran fijos.
3) Definir el diseo del experimento. Esto imp1ica definir de
qu

manera

se

efectuaran

las

pruebas

qu

modelo

matemtico describe mejor el experimento. En el resto de este


material se describen varios tipos de experimentos de los
cuales se tomar el que mejor se ajuste a la situacin
particular.
4) Efectuar el experimento. Esto de acuerdo a lo que se defina
en el paso 3.

5) Anlisis de los datos. Estos son bsicamente anlisis


estadsticos.
6) Conclusiones y toma de decisiones.
Una

metodologa

(alterna)

desarrollada

por

Douglas

C.

Montgomery es la siguiente:
Para usar un enfoque estadstico al disear y analizar un experimento
se requiere que todos los participantes en l tengan de antemano una
idea clara de qu es exactamente lo que se va a estudiar, cmo se
van a recopilar los datos y, al menos, una idea cualitativa de cmo se
van a analizar. A continuacin, se ofrece una gua del procedimiento
recomendado:
1) Comprensin y planteamiento del problema.
Este punto pudiera parecer obvio; sin embargo, en la prctica no es
sencillo darse cuenta de que existe un problema que requiere
experimentacin, ni disear un planteamiento claro y aceptable del
mismo. Es necesario desarrollar todas las ideas sobre los objetivos del
experimento. Suele ser importante solicitar la opinin de todas las
partes implicadas. Un planteamiento claro del problema contribuye a
menudo en forma sustancial a un mejor conocimiento del fenmeno y
de la solucin final del problema.
2) Eleccin de factores y niveles.
El experimentador debe elegir los factores que variarn en el
experimento,

los

intervalos

de

dicha

variacin

los

niveles

especficos de inters a los cuales se har el experimento. Tambin


debe considerarse la forma en que se controlarn estos factores para
mantenerlos en los valores deseados, y cmo se les medir. Para ello
es necesario conocer el proceso de manera prctica y terica.

3) Seleccin de la variable de respuesta.


Al seleccionar la respuesta o variable dependiente, el experimentador
debe estar seguro de que la respuesta que se va a medir realmente
provea informacin til acerca del proceso de estudio. Con mayor
frecuencia, el promedio o la desviacin estndar (o ambos) de la
caracterstica medida sern la variable de respuesta. No son raras las
respuestas mltiples. La capacidad de medicin (o el error de
medicin) tambin es un factor importante. Si la capacidad de
medicin es deficiente, slo puede esperarse que el experimento
detecte efectos relativamente grandes de los factores; en caso
contrario deben hacerse repeticiones.
4) Eleccin del diseo experimental.
Para elegir el diseo es necesario considerar el tamao muestral
(nmero de repeticiones), seleccionar un orden adecuado para los
ensayos experimentales, y determinar si hay implicado bloqueo u
otras restricciones de aleatorizacin.
Es

importante

tener

presente

los

objetivos

experimentales

al

seleccionar el diseo, se tiene inters en identificar qu factores


causan diferencias en estimar la magnitud del cambio de la
respuesta. En otras situaciones habr ms inters en verificar la
uniformidad. Por ejemplo, pueden compararse dos condiciones de
produccin A y 8, siendo A la estndar y B una alternativa de menor
costo. El investigador estar interesado en demostrar que no hay
diferencia en cuanto a la productividad (por ejemplo), entre las dos
condiciones.
5) Realizacin del experimento.
Cuando se realiza el experimento, es vital vigilar el proceso
cuidadosamente para asegurar que todo se haga conforme a lo
planeado. En esta fase, los errores en el procedimiento suelen anular
la validez experimental. La planeacin integral es decisiva para el

proceso. En un complejo entorno de manufactura o investigacin y


desarrollo, es fcil subestimar los aspectos logsticos y de planeacin
de la realizacin de un experimento diseado.
6) Anlisis de datos.
Deben emplearse mtodos estadsticos para analizar los datos, de
modo que los resultados y conclusiones sean objetivos ms que
apreciativos. Existen muchos excelentes paquetes de software para el
anlisis de datos, y varios mtodos grficos sencillos son importantes
en la interpretacin de tales datos. El anlisis de residuos y la
verificacin de la idoneidad del modelo son tambin tcnicas de
anlisis de gran utilidad.
Hay que recordar que los mtodos estadsticos slo proporcionan
directrices para la veracidad y validez de los resultados. Los mtodos
estadsticos, aplicados adecuadamente, no permiten probar algo
experimentalmente, slo hacen posible obtener el probable error de
una conclusin, o asignar un nivel de confiabilidad a los resultados. La
principal ventaja de los mtodos estadsticos es que agregan
objetividad

al

proceso

de

toma

de

decisiones.

Las

tcnicas

estadsticas, aunadas a un buen conocimiento tcnico o del proceso y


al sentido comn, suelen llevar a conclusiones razonables.
7) Conclusiones y recomendaciones.
Una vez que se han analizado los datos, l experimentador debe
extraer conclusiones prcticas de los resultados y recomendar un
curso de accin. En esta fase a menudo son tiles los mtodos
grficos, en especial al presentar los resultados a otras personas.
Tambin deben realizarse corridas de seguimiento y pruebas de
confirmacin para validar las conclusiones del experimento.

1.4. Aplicaciones del diseo de experimentos.


En muchas ocasiones l termino experimento se considera asociado
exclusivamente para cuestiones cientficas y tericas; sin embargo
tienen varias aplicaciones prcticas.
Algunos ejemplos son:
Si la materia prima que es entregada por tres diferentes
proveedores producen caractersticas diferentes en el producto
Si diferentes marcas de herramienta tienen o no vida diferente.
Si la temperatura de recocido afecta o no alguna propiedad
mecnica del producto.
Si

diferentes

cabezales

de

una

misma

mquina

producen

productos similares.
Si un nuevo mtodo de ensamble incrementa o no la productividad
en una lnea de produccin.
Cul es el factor que ms influye en la variabilidad de alguna
caracterstica de calidad.
Es necesario tener claros y en todo caso revisar los siguientes
conceptos estadsticos antes de seguir:
Qu es una prueba de hiptesis?
Qu e s un error tipo I y Qu es un error tipo II?
Qu es una prueba t para comparar dos medias?
Qu es la potencia de una prueba de hiptesis?
Qu es control estadstico?
Qu es nivel de significancia?

2. ANALISIS DE VARIANZA DE UN FACTOR


(ANOVA 1 VIA)
El anlisis de la varianza de un factor (ANOVA) es una metodologa
para analizar la variacin entre muestras y la variacin al interior de
las mismas mediante la determinacin de varianzas. Es llamado de
una va porque analiza un variable independiente o Factor ejemplo:
Velocidad. Como tal, es un mtodo estadstico til para comparar dos
o ms medias poblacionales. El ANOVA de un criterio nos permite
poner a prueba hiptesis tales como:
H 0 1 2 3 .... k

H 1 : Al menos dos medias poblacionales son diferentes.

Los supuestos en que se basa

la prueba

t de dos muestras que

utiliza muestras independientes son:


1. Ambas poblaciones son normales.
2. Las varianzas poblacionales son iguales, esto es, 12 22 .
El estadstico tiene una distribucin muestral resultando:

sb2
Fc 2
sw
El valor crtico para la prueba F es:
F , ( k 1), k ( n 1))

Donde el nmero de grados de libertad para el numerador (Sb^2 >


Sw^2) es k-1 y para el denominador es k(n-1), siendo
significancia.
k = nmero de muestras.
Por ejemplo:

el nivel de

Ejemplo: Se tienen 14 empleados seleccionados al azar que se


someten a
3 diferentes cursos de entrenamiento: Programa 1, Programa 2
y Programa 3.
Como los empleados se seleccionan aleatoriamente para cada
programa
el

diseo

se

denomina

DISEO

COMPLETAMENTE

ALEATORIZADO
Se observa el aprovechamiento de los empleados en los
programas:
TRATAMIENTOS
c=3
c=1
c=2
J
Programa Program Programa

1
85
72
83
80
**

r=1
r=2
r=3
r=4
r=5
Media
s

a2
80
84
81
78
82

3
82
80
85
90
88

80.00
81.00
85.00
Media de medias o
media total

Xj

82.14

2.2 Tipos de variacin y sumas de cuadrados


1. Variacin total entre los 14 empleados, su puntuacin no fue
igual con todos
VARIACIN TOTAL RESPECTO A LA MEDIA GENERAL
r

SCT
i 1

( Xij X )
j 1

SCT = (85-82.14)2 + (72-82.14)2+(83-82.14)2+.....+(88-82.14)2


SCT = 251.7
2. Variacin entre los diferentes tratamientos o Variacin entre
muestras

o variacin entre programa 1, programa 2 y programa 3

EFECTO DE LA MEDIA DE CADA TRATAMIENTO RESPECTO A LA MEDIA


GENERAL

SCTR rj ( X j X ) 2
j 1

SCTR = 4(79.5 - 81.3333)2 + 5(81 - 81.3333)2 + 5(85 - 81.333)2


SCTR = 65.71
3. Variacin dentro de un tratamiento o muestra o programa
dado que no todos los empleados dentro de un mismo programa
obtuvieron los mismos puntajes. Se denomina Variacin dentro de los
tratamientos.
Variacin dentro del tratamiento o variacin del error
Cada valor respecto a la media de su tratamiento
r

SCE
i 1

(X
j 1

ij

X j )2

SCE = SCT - SCTR = 186


4. Grados de libertad
Grados de libertad totales = n - 1 = 14-1 = 13
Grados de libertad de los tratamientos = c - 1 = 3 - 1 = 2

Grados de libertad del error = gl. Totales - gl. Tratamientos = 13 - 2 =


11
gl SCT = gl SCTR + gl SCE
gl SCE = gl SCT - gl SCTR = (n -1) - (c - 1) = n -c

5. Cuadrados medios (Suma Cuadrados/ Grados libertad)


CMT =

Cuadrado medio total = SCT / (n-1) =

19.4

CMTR = Cuadrado medio del tratamiento = SCTR / (c -1) =

32.9

CME =

16.9

Cuadrado medio del error = SCE/ gle.=

6. Estadstico de prueba Fc y estadstico F crtico de alfa


Fc = CMTR / CME=

1.946745562

Falfa , gl .numerador , gl .deno min ador F ,c 1, n c

Clculo de F con Excel


=DISTR.F.INV(ALFA, GL. TR, GL. ERR)

=DISTR.F.INV(0.05, 2, 11) =

3.982297957

ZONA
NO DE
RECHAZAR

RECHAZO
Distr. F

Como Fc es menor a Falfa no se rechaza Ho y las medias son iguales.


7. Valor de P Fc
P = distr.f(Fc, gl. SCTr, gl. SCE) = distr.f(1.946, 2, 11) = 0.18898099
Como P es mayor a alfa no se rechaza Ho
CONCLUSION: NO HAY SUFICIENTE EVIDENCIA PARA RECHAZAR HO,
LAS MEDIAS DE LOS TRATAMIENTOS SON IGUALES

TABLA DE ANOVA
FUENTE DE VARIACIN SUMA DE

GRADOS DE

CUADRADOS

CUADRADO

LIBERTAD

MEDIO

VALOR F
Entre muestras (tratam.)

SCTR

c-1

CMTR

SCE

n-c

CME

CMTR/CME
Dentro de muestras (err.)
Variacin total

SCT

n-1

CMT

Regla: No rechazar si la F de la muestra es menor que la F de Excel


para una cierta alfa

2.5 Grafica de residuos contra el valor ajustado de

y
ij

i el modelo es correcto y las suposiciones se satisfacen, los


residuos

no

deben

tener

algn

patrn,

ni

deben

estar

relacionados con alguna variable, incluyendo la respuesta Y ij. Una


comprobacin sencilla consiste en graficar los residuos contra los
ij (debe recordarse que para el modelo en un
valores ajustados y

sentido

y
ij

yi.

, el promedio del tratamiento i-simo). En esta grafica

no debe revelarse ningn patrn obvio en la siguiente figura se


grafican los residuos contra los valores ajustados de los datos de la
resistencia a la tensin del ejemplo 2.3 Ningn patrn inusual es
evidente.

Grafica de residuos contra valores ajustados


Un efecto que en ocasiones revela la grafica es el de una varianza
variable. Algunas veces la varianza de las observaciones lo hace. Esto
resulta cuando el error es proporcional a la magnitud de la
observacin (comnmente esto sucede en instrumentos de medicin
el error es proporcional a la escala de la lectura). Si este es el caso,
los residuos aumenta a medida que Yij lo hace, y la grafica de los
residuos contra

Yij

parecer un embudo que se ensancha o un

altavoz. La varianza variable tambin ocurre en casos cuyos datos no


tienen

distribucin

normal

estn

sesgados,

porque

en

las

distribuciones sesgadas la varianza tiende a ser funcin de la media.

3. ANALISIS DE VARIANZA DE DOS VAS o


DIRECCIONES (ANOVA 2 VIAS)
3.1 Introduccin
En este caso las frmulas son parecidas a la del ANOVA de una va
pero ahora agregando el clculo por renglones adicional al de
columnas donde se incluye la variable de bloqueo. El bloqueo es
completamente al azar.
Se trata de bloquear un factor externo que probablemente tenga
efecto en la respuesta pero que no hay inters en probar su
influencia, slo se bloquea para minimizar la variabilidad de este
factor externo, evitando que contamine la prueba de igualdad entre
los tratamientos.
Los tratamientos se asignan a las columnas y los bloques a los
renglones. Un bloque indica condiciones similares de los sujetos al
experimentar con diferentes tratamientos.

Las hiptesis son:


Ho: No hay diferencia en las medias del factor de columna
Ha: Al menos una media del factor de columna es diferente
Ho: No hay diferencia en las medias de la variable de rengln
Ha: Al menos una media de la variable de rengln es diferente

3.2 Ejemplos con clculo manual


Ejemplo 1.
Suponiendo que se quiere investigar si la produccin de tres
diferentes mquinas es igual, tomando en cuenta la experiencia de
los operadores a un nivel de significancia del 5%.
Experiencia
de ops. En Maq

Mquinas

aos
1
2
3
4
5
Promedios

Maq 2
21
33
39
41
46
36

1
27
31
42
38
45
36.6

Maq 3
25
35
39
37
45
36.2

Promedios
24.33333
33
40
38.66667
45.33333
36.26667

TABLA ANOVA
SCTR

SS
GL
0.93333

CMTR

CM
Fc
0.46666 Ftr

=
SCBL

3
2
764.933

=
CMBL

7
0.09
191.233 Fbl

3
4
41.0666

3
37.25
5.13333

SCE = 7
8
806.933

CME=

SCT = 3

CMT=

57.6381

14

Falfa
=
4.46
=
3.84

Conclusin: No hay diferencia entre mquinas a pesar de la diferencia


en experiencia de los operadores.
Ejemplo 2 (Problema 4.1 del Texto de Montgomery, Anlisis y
diseo de experimentos)
Un qumico quiere probar el efecto de 4 agentes qumicos sobre la
resistencia de un tipo particular de tela. Debido a que podra haber
variabilidad de un rollo de tela a otro, el qumico decide usar un
diseo de bloques aleatorizados, con los rollos de tela considerados
como bloques. Selecciona 5 rollos y aplica los 4 agentes qumicos de
manera aleatoria a cada rollo. A continuacin se presentan las
resistencias a la tencin resultantes. Analizar los datos de este
experimento (utilizar =0.05) y sacar las conclusiones apropiadas.
Agente Qumico
1
2
3
4

Rollo
1
2
73 68
73 67
75 68
73 71

3
74
75
78
75

4
71
72
73
75

5
67
70
68
69

4. DISEOS FACTORIALES
4.1 Principios y definiciones bsicas
Muchos experimentos se llevan a cabo para estudiar los efectos
producidos por dos o ms factores. Puede mostrarse que en general
los diseos factoriales son los ms eficientes para este tipo de

experimentos. Por diseo factorial se entiende aquel en el que se


investigan todas las posibles combinaciones de los niveles de los
factores en cada ensayo completo o rplica del experimento. Por
ejemplo, si existen a niveles del factor A y b niveles del factor B,
entonces cada rplica del experimento contiene todas las ab
combinaciones de los tratamientos. A menudo, se dice que los
factores estn cruzados cuando stos se arreglan en un diseo
factorial.
El efecto de un factor se define como el cambio en la respuesta
producida por un cambio en el nivel del factor. Con frecuencia, ste se
conoce como efecto principal porque se refiere a los factores de
inters primordial del experimento. Por ejemplo, consideremos los
datos de la tabla 1. El efecto principal del factor A podra interpretarse
como la diferencia entre la respuesta

promedio en el primer

segundo nivel de ese factor. Numricamente:

Factor B
B1

B2

A1

20

30

A2

40

52

Factor A

Tabla 1 Un experimento factorial

40 52
2

20 30
2

21

En otras palabras incrementar el factor A del nivel 1 al 2 produce un


cambio en la respuesta promedio de 21 unidades. Similarmente, el
efecto principal de B es:

30 52
2

20 40
2

11

Si los factores tienen ms de dos niveles, el procedimiento anterior


debe ser modificado ya que las diferencias entre las respuestas
promedio pueden expresarse de muchas formas.
En algunos experimentos puede encontrarse que la diferencia en la
respuesta entre los niveles de un factor no es la misma en todos los
niveles de los otros factores. Cuando esto ocurre existe una
interaccin entre los factores. Por ejemplo, considrense los datos de
la Tabla 2.
Factor B

En el primer nivel

B1

B2

A1

20

40

A2

50

12

Factor A

de A es:

del factor B, el efecto

A = 50 - 20 = 30
Mientras que en el segundo nivel de B, el efecto de A es:
A = 12 - 40 = 28
Puede observarse que existe una interaccin entre los factores A y B
porque el efecto de A depende del nivel elegido de B.
Estas ideas pueden ilustrarse grficamente. En la Fig. 1 se muestra
una grfica de la respuesta de los datos de la Tabla 1 contra los
niveles del factor A para ambos niveles del factor B. Se observa que
las rectas B1 y B2 son, aproximadamente, paralelas. Esto indica que no
hay interaccin entre los factores. De manera similar, en la Fig. 2 se
presenta una grfica de la respuesta de los datos de la Tabla 2.

60

B2

50

B1

40
30
20
10

B2
B1
A1

Factor A

A2

Figura 1 Un experimento factorial sin interacciones


En este caso se ve que las rectas B1 y B2 no son paralelas. Esto
muestra que existe una interaccin entre A y B. Sin embargo, no debe
ser la nica tcnica para analizar los datos, porque su interpretacin
es subjetiva y su apariencia, a menudo, es engaosa.

60

B1

50

B2

40
30
20

B1

10

B2

A1

Factor A

A2

Figura 2 Un experimento factorial con interacciones


Hay

que

notar

que

cuando

una

interaccin

es

grande

los

correspondientes efectos principales tienen poco significado prctico.


Una estimacin del efecto principal de A de los datos de la Tabla 2 es:

50 12
2

20 40
2

El cual resulta ser muy pequeo corrindose el riesgo de concluir que


no existe un efecto debido a A. Sin embargo, cuando se examin el
efecto de A en niveles diferentes de B se concluy que ste no era el
caso. El factor A tiene un efecto, pero depende del nivel del factor B.
En otras palabras, es ms til conocer la interaccin AB que el efecto
principal. Una interaccin significativa oculta a menudo el significado
de los efectos principales.

Ventajas de los diseos factoriales

as

ventajas

de

los

diseos

factoriales

pueden

ilustrarse

fcilmente. Supongamos que se tienen dos factores, A y B, cada

uno con dos niveles. Estos niveles se representan mediante A 1, A2, B1


y B1. La informacin acerca de ambos factores puede obtenerse
variando un factor a la vez como aparece en la tabla 3. El efecto de
variar el factor A est dada por A 2B1 -A1B2. A causa de que existe error
experimental,

es

conveniente

realizar,

por

ejemplo,

dos

observaciones de cada combinacin de tratamientos y hacer una


estimacin de los efectos de los factores usando las respuestas
promedio. Por lo tanto, se requiere un total de seis observaciones.
Factor B
B1

B2

A1

A1B1

A1B2

A2

A2B1

12

Factor A

Tabla 3 El mtodo de un factor a la vez


Los diseos factoriales poseen algunas ventajas.

Son ms eficientes que los experimentos de un factor a la vez.

Los

diseos

interaccin

factoriales
puede

estar

son

necesarios

presente,

para

cuando
evitar

alguna
hacer

conclusiones engaosas.

Los diseos factoriales permiten estimar los efectos de un


factor en diversos niveles de los otros factores, produciendo
conclusiones que son vlidas sobre toda la extensin de las
condiciones experimentales.

4.2 Diseo factorial de dos niveles (2^K)

l primer diseo de la serie 2 2 es aquel en el que solo dos factores,


A y B, cada uno con dos niveles. Este diseo se conoce como

diseo factorial 22. Arbitrariamente, los niveles del factor pueden


llamarse bajo y alto.
Ejemplo 1 Considrese una investigacin llevada a cabo para
estudiar el efecto que tiene la concentracin de un reactivo y la
presencia de un catalizador sobre el tiempo de reaccin de un
proceso qumico. Sea la concentracin del reactivo el factor A con dos
niveles de inters, 15% y 20%. El catalizador constituye el factor B; el
nivel alto o superior denota el uso de dos sacos de catalizador y el
nivel bajo o inferior denota el uso de un solo saco. El experimento se
realiza (replica o repite) tres veces, y los datos son como sigue:
Combinacin de
Fig. 3

tratamientos
A baja, B baja

Replica
I
II
28 25

III
27

Total
80

A alta, B baja

36

32

32

100

A baja, B alta

18

19

23

60

A alta, B alta

31

30

29

90

En la figura 3 siguiente se presentan grficamente las combinaciones


de tratamiento para este diseo, el efecto de un factor se denota por
la letra latina minscula. De este modo, A se refiere al efecto del
factor A, y B se refiere al efecto del factor B, y AB se refiere a
la interaccin entre AB. En el diseo 2 2 los niveles bajo y alto de A y B
se denotan por - y + respectivamente,
en
ejes A y B. As en
b = 60(18+19+23)
ab = los
90(31+30+19)
Alto (2 sacos) +

el eje B representa el nivel bajo de catalizador mientras que + denota


el nivel alto.
bajo (1 saco) -

(1) = 80(28+25+27)

bajo (15%)

a = 100(36+32+32)

+
alto (20%)

Concentracion de reactivo A
Figura 1: Combinaciones de tratamiento en el diseo factoriall

Las cuatro combinaciones de tratamientos en el diseo pueden


representarse por letras minsculas, cono se muestra en la figura 3.
En esta figura se aprecia que el nivel superior de cualquier factor de
una combinacin de tratamientos est representado por la presencia
de la letra minscula correspondiente, mientras que la ausencia de
esta ultima representa el nivel inferior del factor.
As:
a representa la combinacin de tratamientos, en la que A se
encuentra en el nivel superior y B en el nivel inferior;
b representa aquella en la que A se halla en el nivel inferior y
B en el superior, y
ab representa a ambos factores en el nivel superior.
Por convencin (1) se usa para representar a ambos factores en
el nivel inferior.
El efecto promedio de un factor se define como el cambio en la
respuesta producida por un cambio en el nivel de ese factor,
promediado sobre los niveles del otro factor.
Como se ilustra en la figura 3, las letras minsculas (1), a, b y ab
tambin se usan para representar los totales de las n replicas de las
combinaciones de tratamientos correspondientes. Ahora bien,

el

efecto de A en el nivel B es {a-(1)}/n. Mientras que el nivel superior B


es {ab-b}/n. Tomando el promedio de estas dos cantidades se
obtiene:
A

1
2n

ab b a (1)

1
2n

ab a b (1)

El efecto promedio de B se determina a partir de su efecto en el nivel


inferior de A (esto es, {b-(1)}/n, y de su efecto en el nivel superior de
A (que es igual a [ab-a]/n obtenindose:

1
2n

ab a b (1)

1
2n

ab b - a (1)

El efecto de la interaccin AB se define como la diferencia promedio


entre el efecto de A en el nivel superior de B y su efecto en el nivel
inferior de B, as:

AB

1
2n

ab b a (1)

1
2n

ab (1) a (b)

Por otro lado se puede definir AB como la diferencia promedio entre el


efecto de B en el nivel superior de A y el efecto de B en el nivel
inferior de A.
Las formulas para los efectos de A, B y AB pueden deducirse por
otro mtodo. El efecto de A puede hallarse como la diferencia en la
respuesta promedio de las dos combinaciones de tratamiento en la
mitad derecha (que llamaremos Y A+, puesto que es la respuesta
promedio para las combinaciones de tratamientos a las que A que se
encuentra en el nivel alto) y las dos combinaciones de tratamientos
en la mitad izquierda (o Y A). Esto es,

A YA YA

ab a
2n
1
2n

b (1)
2n

ab a b (1)

Este es exactamente el mismo resultado, el efecto de B se encuentra


como la diferencia entre el promedio de las dos combinaciones de
tratamientos en la parte superior del cuadrado ( Y B+) y el promedio
de las dos combinaciones de tratamientos en la parte inferior ( Y B-), o

B YB YB

ab b
2n
1
2n

a (1)
2n

ab b a (1)

Finalmente el efecto de interaccin AB es el promedio de las


combinaciones de tratamientos en la diagonal de derecha a izquierda
del cuadrado ab y (1) menos el promedio de las combinaciones de
tratamientos en la diagonal de izquierda a derecha (a y b), o

AB

1
2n

ab (1)
2n

ab
2n

ab (1) a b

Con los datos que aparecen en la figura 1, las estimaciones de los


efectos promedio son:
A

1
2(3)
1
2(3)

AB

90 100 60 80

8.33

90 60 100 80

5.00

1
2(3)

90 80 100 60

1.67

El efecto de A (concentracin de reactivo) es positivo; esto sugiere


que al elevar A del nivel bajo (15%) al nivel alto (25%) incrementar
el rendimiento. El efecto de B (catalizador) es negativo; esto sugiere
que elevar la cantidad del catalizador agregada al proceso reducir el
rendimiento. Al parecer, el efecto de interacciones es pequeo
comparado con los dos efectos principales.
En muchos experimentos que implican diseos 2 K se examina la
magnitud y la direccin de los efectos de los factores para determinar
cuales variables es probable que sean importantes. Por lo general
puede emplearse el anlisis de varianza para confirmar esta
interpretacin. En el diseo 2k existen algunos mtodos rpidos
especiales para realizar los clculos del anlisis de varianza.

Consideremos la suma de cuadrados para A, B y AB. Obsrvese la


primera ecuacin que se utiliza un contraste para estimar A; esto es,
ContrasteA ab a b (1)

Este contraste

suele llamarse efecto total de A. A partir de la

segunda y tercera ecuacin, puede apreciarse que tambin se utilizan


contraste para estimar B y AB. Adems, estos tres contrastes son
ortogonales. La suma de cuadrados de cualquiera de ellos

puede

calcularse usando la siguiente ecuacin:

2
n a
a ci .

aciyi.
SSc 1

Esta ecuacin establece que la suma de cuadrados de contraste es


igual al contraste elevado al cuadrado entre el producto del nmero
de las observaciones de cada

total del contraste

por la suma de

cuadrados de los coeficientes del mismo. En consecuencia, se obtiene


que las sumas de cuadrados de A, B y AB sean:

SSA

SSB

ab a b (1) 2
n* 4

ab b a (1) 2

SSAB

n* 4

ab (1) a b 2
n* 4

Con los datos de la figura 3, las sumas de cuadrados se pueden


calcular aplicando las ecuaciones anteriores, obtenindose:

SSA

SSB

50

2
208.33

4(3)
30

SSAB

4(3)
10

75.00

4(3)

8.33

La suma total de cuadrados se determina de la manera usual


mediante:
2
Y ...
2
2
n
SST i2
1 j1 k 1 Y ijk
4n

En general SST tiene 4n 1 grados de libertad. La suma de cuadrados


del error, con 4(n-1) G.L. se puede calcular en la forma usual, por
diferencia, mediante.
2
2 2 3
Y
2
SS E Yijk
9398.00 9075.00 323.00
i1j1k 1
4(3)

SS E SS T SS A SS B SS AB

323.00 208.33 75.00 8.33 31.34

El anlisis de varianza completo se presenta en la tabla siguiente.


Ambos efectos principales son significativos al 1%.

menudo

se

es

conveniente

escribir

las

combinaciones

de

tratamientos en el orden (1), a, b, y ab. Este orden se conoce como


orden estndar. Cuando se utiliza es posible apreciar que los
coeficientes de los contrastes usados para estimar los efectos son
Efect

(1 a

b A

os
A:

)
b
-1 + -1 +

B:

-1 1

AB:

-1 1

-1 -1 1

+ 1
+
+
1

Tabla ANOVA para los datos del ejemplo 1 es la siguiente:


Fuente
de
variaci

G.

n
A

SS
L.
208.3 1

MS
Fo
208.3 53.15

AB

75.00 1

75.00 19.13

Error

8.33

8.33

Total

31.34 11

3.92

2.13

323.0

1
8

significativo al 1%

Signos algebraicos para calcular los efectos en un diseo 22


Combinaci

Efecto

Factorial

De

I A B AB

Tratamient
os
(1)

+ - - +

+ + - -

+ - + -

ab

+ + + +

Observe que los coeficientes de los contrastes usados para estimar la


interaccin

son

iguales

al

producto

de

los

coeficientes

correspondientes a los dos efectos principales. Los coeficientes de los


contrastes siempre son +1 o 1 y se puede usar una tabla de signos
positivos y negativos como la mostrada en la de signos algebraicos
para determinar el signo apropiado de cada combinacin de
tratamientos. En el encabezado de las columnas de tabla y se
encuentran los efectos principales (A y B), la interaccin AB, e I, que
representa el total el total o el promedio de todo el experimento. Se
observa que la columna encabezada por I se compone de solo de
signos positivos. Los renglones corresponden a las combinaciones de
tratamientos.

Para encontrar un contraste con el fin de estimar cualquier efecto,


simplemente se multiplican los signos de la columna apropiada de la
tabla por la correspondiente combinacin de tratamientos, y se suma.

Por ejemplo, el contraste para estimar A es (1) + a b + ab, lo cual


concuerda con la ecuacin.
A

1
2n

ab b a (1)

1
2n

ab a b (1)

Los tipos ms sencillos de diseos factoriales implican slo dos


factores o conjuntos de tratamientos. Haya a niveles del factor A y
b niveles del factor B, dispuestos en un diseo factorial; esto es,
cada A repeticin o rplica del experimento contiene todas las
combinaciones de tratamiento ab. En general, hay n repeticiones.

5. DISEOS DE EXPERIMENTOS FRACCIONALES


DE DOS NIVELES
5.1 Concepto de replicacin fraccionada
Conforme el nmero de factores del experimento crece, el nmero de
casillas o condiciones experimentales (y por lo tanto el nmero de
lecturas o pruebas necesarias), crece exponencialmente en un
experimento factorial. El nmero de efectos a evaluar (interacciones
principalmente) crece exponencialmente tambin.

El nmero de

efectos y casillas vara con el nmero de factores en una relacin


como se muestra en la tabla siguiente para un experimento factorial
2k.

As por ejemplo cuando se tienen siete factores, existen 128 posibles


condiciones experimentales, lo que implica que al hacer una

replicacin por celda de todo el experimento requiere un total de 128


observaciones. Si se decide tomar dos replicas por celda, entonces
serian necesarias 256 observaciones, lo cual es una cantidad excesiva
de pruebas para fines prcticos.
Por otro lado, se necesitan 128 observaciones para un experimento
con 7 factores por que se deben evaluar 127 posibles efectos (que
son los grados de libertad totales en 128 observaciones) de estos
efectos 7 son los factores principales, 21 interacciones de 2 factores,
35 de tres, 35 de cuatro, 27 de cinco en cinco, 7 de seis en seis y una
interaccin de 7 factores. En general el nmero de interacciones de k
factores tomados r en r es:

K!

r! (k r)!
El concepto de replicacin fraccionada parte de las siguientes
hiptesis:
1) Las interacciones de tres o ms factores son sumamente raras
en la prctica, por lo que en general se pueden suponer como
no existentes.
2) En un experimento de varios factores lo ms probable es que
solo algunos de ellos sean relevantes para la variable de
respuesta.
3) La mayor parte del efecto se debe a los factores principales y
algunas interacciones de dos factores.
Lo anterior implica que por ejemplo para siete factores son necesarios
probablemente solo 28 grados de libertad (7 factores principales y 21
interacciones de dos factores), y esto equivale a solo 29 unidades de
informacin y no 128 como en el experimento original. Esto quiere
decir que no es necesario el correr una replicacin completa de todo

el experimento cuando el nmero de factores crece, sino solamente


algunas casillas o condiciones experimentales.
Cuando solamente una parte de las posibles casillas se prueban, se
dice que se tiene una replicacin fraccionada del experimento.
Las preguntas que surgen son:
1. Cuntas y cuales casillas probar?
2. Cmo analizar los resultados?
3. Qu informacin se pierde?
El responder a estas preguntas es uno de los objetivos de la
replicacin fraccionaria.

5.2 Fraccin un medio del diseo 2k

onsidrese el caso en el que se estudian tres factores de dos


niveles cada uno, pero en el que los experimentadores no

pueden costear las 23 = 8 combinaciones de tratamientos, sin


embargo, si se puede costear 4 observaciones. Esto sugiere una
fraccin un medio, de un diseo 2 3. la fraccin un medio del diseo 2 3
se conoce tambin como un diseo 2 3-1 porque tiene 23-1 = 4
combinaciones de tratamiento.
En la tabla 1 aparecen signos positivos y negativos del diseo 2 3.
Supngase que para componer la fraccin un medio, se seleccionan
las combinaciones de tratamientos se usa indistintamente la notacin
convencional (a,b,c,...) y la de signos positivos y negativos. La
equivalencia

Combinacin

notaciones se de
continuacin.

de

Efecto factorial

Notacin
Tratamientos
I A
1
A
a
++
B
b
+C
c
Abc + abc
++
ab
++
ac
++
bc
+(1)
+-

Notacin
B C A A
2
+ - B- C
-- +
- -- +
- -- -+ +
-+ ++++ +++ +
+- + - +- +
++- - - + +

AB

C
+
+
+
+

C
+
+
+
+
-

las

dos

muestra

Tabla 1 Signos positivos para el diseo 23


Ntese

que

el

diseo

23-1

se

forma

al

seleccionar

solo

las

combinaciones de tratamientos que producen un signo positivo sobre


la columna ABC. Por esto ABC se denomina generador de una fraccin
particular. Adems, la columna identidad I siempre es positiva, por lo
cual:
I = ABC
Se denominara relacin definitoria de nuestro diseo, en general, la
relacin definitoria de un factorial fraccionario siempre es el conjunto
de todas las columnas que
son iguales a la columna
identidad I.
abc
bc
c

ac

ab

B
A

(a) Fraccin principal I = ABC

(1 )

(b) Fraccin alterna I = -ABC

Las combinaciones de tratamientos del diseo 2 3-1 producen 3 G.L.


que pueden usase para estimar los efectos principales. En la tabla 1
se muestra que las combinaciones lineales de las observaciones que
se utilizan para estimar los efectos principales A, B, y C son:
LA 1/2(a b c abc)
LB 1/2( a b c abc)
LC 1/2( a b c abc)
LBC 1/2(a b c abc)
LAC 1/2( a b c abc)
LAB 1/2( a b c abc)

Por lo tanto LA = LBC, LB = LAC y LC = LAB. En consecuencia, es


imposible distinguir entre A y BC, entre B y AC y entre C y AB. De
hecho, es posible mostrar que cuando se estima A, B y C, en realidad,
lo que s esta haciendo es estimar A + BC, CB + AC y C + AB,
respectivamente. Dos o ms efectos que tienen esta propiedad se
conoce como alias. En este ejemplo, A y BC, B y AC y C y AB son alias.
Esto se indica empleando la notacin:
LA A BC,
LB B AC
LC C AB

La estructura de los alias de este diseo pueden determinarse


fcilmente con la relacin I = ABC, multiplicando cualquier efecto por
la relacin que define al diseo, modulo 2, da como resultado los alias
de dicho efecto. En el ejemplo anterior, los alias son:
A*I = A*ABC = A2BC

O dado que el cuadrado de cualquier columna es simplemente la


identidad I.
A = BC
De modo similar, se encuentra que los alias de B y C son:
B*I = B*ABC = AB2C = AC
C*I = C*ABC = ABC2 = AB
Esta fraccin un medio o semifraccin, con I = +ABC, suele llamarse
fraccin principal.
Ahora supngase que se eligi la otra mitad de la rplica. Esta se
compone de las combinaciones de tratamientos de la tabla 1 que
tiene signo negativo asociado con ABC. Esta fraccin un medio o
alterna que consta de las siguientes corridas:
Notacin Notacin
1
(1)
ab
ac
abc

2
--+++-+
-++

La relacin definitoria de este diseo es:


I = -ABC
Usando la fraccin alterna, las combinaciones lineales de las
observaciones, LA, LB y LC, son:
L' A A BC
L' B B AC
L' C C AB

Por lo tanto, en realidad se est estimando A BC, B AC y C AB al


estimar A, B y C con esta fraccin. En la prctica, no importa cual de
las dos fracciones se utilice. Generalmente la fraccin asociada con I

= +ABC se denomina fraccin principal. Ambas fracciones pertenecen


a la misma familia; en otras palabras, estas dos fracciones forman el
diseo 23 completo.

5.3 Resolucin del diseo

l diseo anterior 23-1 se conoce como diseo de resolucin III. En


tal diseo los alias de los efectos principales son interacciones de

dos factores. Un diseo es resolucin R si ningn efecto de p factores


es alias de otro efecto que tenga menos R p factores. Usualmente,
se emplea el numeral romano como subndice para indicar la
resolucin del diseo. As, la fraccin un medio del diseo 2 3 definido
3 1
por la relacin I = ABC (o bien I = - ABC) constituye un diseo 2III
.

Los diseos de resolucin III, IV y V son de importancia primordial. A


continuacin, se presenta la definicin de estos diseos junto con un
ejemplo.

1) Diseo con resolucin III: stos son diseos en los que ningn
efecto principal es alias de otro, pero si lo son de las
interacciones de dos factores; a su vez, estas ltimas son alias
entre s. El diseo 23-1 de la tabla 4.1 es de resolucin III.
2) Diseo con

resolucin IV: En estos diseo ningn efecto

principal es alias de otro efecto principal, o bien, de alguna


interaccin de dos factores. Las interacciones de dos factores
son alias entre s. Un diseo 2 4-1 con I = ABCD es de
4 1
resolucin IV ( 2IV
).

3) Diseos resolucin V: Estos son diseos en los que ningn


efecto principal o interaccin de dos factores es alias de ningn
efecto principal o interacciones entre dos factores, un diseo 2 51

con I = ABCDE es de resolucin V ( 2 5V1 ).

En general, la resolucin de un diseo factorial fraccionario de dos


niveles es igual al mnimo nmero de letras de cualquier palabra de la
relacin que define al diseo. En consecuencia, los diseos anteriores,
a

menudo,

se

conocen

como

diseos

de

3,

letras,

respectivamente. Por lo general se deben usar diseos fraccionarios


con la mayor resolucin posible congruentes con el fraccionamiento
requerido. A mayor resolucin, las suposiciones relativas a las
interacciones que deben despreciarse con el propsito de hacer una
interpretacin nica de los datos son menos restrictivas.

6. DISEOS DE EXPERIMENTOS FACTORIALES


COMPLETOS
6.1 Diseo factorial completo de 2 factores
Un ingeniero decide probar los tres materiales de la cubierta, nico
factor controlable a tres niveles de temperatura (15, 70 y 125 F)
consistentes en el entorno de uso final del producto. Se prueban
cuatro bateras a cada combinacin de material de la cubierta y
temperatura, y las 36 pruebas se ejecutan al azar.

En la tabla 1 se presentan el experimento y los datos resultantes de


duracin observada de las bateras.
En este problema, el ingeniero desea contestar las siguientes
preguntas:
1. Qu efecto tienen el tipo de material y la temperatura sobre la
duracin de la batera?
2. Existe una eleccin del material que d por resultado una
duracin uniformemente larga sin importar la temperatura?
Temperatura F

Tipo

de

material
1

15
70
125
13 15 34 40 2 70

0
5
0
74 18 80 75 8

58

0
2
15 18 12 12 2

70

0
8
6
2
5
15 12 10 11 5

45

9
6
6
5
8
13 11 17 12 9

10

8
0
4
0
6
16 16 15 13 8

4
60

Tabla 1. Duracin en horas para el ejemplo del diseo de una batera


Esta

ltima

pregunta

reviste

particular

importancia.

Existe

la

posibilidad de hallar un material que no sea muy afectado por la


temperatura. De ser as, el ingeniero puede hacer que la batera sea
robusta a la variacin de temperatura en el campo. ste es un
ejemplo del uso del diseo experimental estadstico para el diseo de
un producto robusto (o consistente), un importante problema de
ingeniera.
Este diseo es un ejemplo especfico del caso general de un diseo
con dos factores (bifactorial). Para pasar al caso general, sea Yijk la
respuesta observada cuando el factor A se encuentra en el i-simo
nivel (i -1, 2,..., n). En general, los datos observados se vern como en
la tabla 2. El orden en el cual se toman las abn observaciones es
aleatorio,

de

aleatorizado.

modo

que

ste

es

un

diseo

completamente

Tabla 2. Disposicin general para un diseo bifactorial


Las observaciones pueden describirse mediante el modelo estadstico
lineal:

i 1,2,..., a

Yijk i j ij ijk j 1,2,..., b

k 1,2,..., n

En donde es el efecto medio general, i es el efecto del i-simo nivel


del factor rengln A, j es el efecto del j-simo nivel del factor
columna B, ()ij es el efecto de la interaccin entre i y j, ijk es el
componente del error aleatorio. Inicialmente se supone que ambos
factores son fijos y que los efectos de tratamiento se definen como
desviaciones de la media general, por lo tanto.

ia1 i 0; bj1j 0

Se

supone que los efectos de interaccin son fijos y que se definen d


manera que: ia1 ij 0 . Hay un total de abn observaciones porque
se realizan n rplicas.
En un diseo factorial de dos factores, tanto los factores (o
tratamientos) de rengln como de columna tienen la misma

importancia, especficamente el inters consiste en probar hiptesis


acerca de la igualdad de los efectos de tratamiento de rengln, es
decir:
Ho :

1 2

...a 0

H1 : al menos una i 0

Y de la igualdad de los efectos de tratamiento de columna:

Ho :

1 2

...b 0

H1 : al menos una j 0

Tambin es interesante determinar s los tratamientos de rengln y


columna

interaccionan. En otras palabras, resulta conveniente

probar:
Ho : ()i 0 para toda i, j
H1 : al menos una ()i 0

A continuacin, se muestra cmo pueden probarse estas hiptesis


usando un anlisis de variancia

bifactorial o bidireccional (de dos

factores o en dos sentidos).

6.2 Anlisis Estadstico del Modelo de Efectos Fijos

ea Yi..; el total de las observaciones bajo el i-simo nivel del


factor A; Y.j. El total de las observaciones bajo el j-simo nivel del

factor B, Yij. El total de las observaciones de la ij-sima celda, e Y... el


total

general

Yi..; Y .j. y Yij.

de

y Y...

todas

las

observaciones.

Se

definen

como los promedios de rengln, columna, celda y

general, respectivamente, matemticamente:

b n
Yi.. Yijk
j1k 1

Yi..

a n
Y.j. Yijk
i1k 1

Y.j.

n
Yij. Yijk
k 1

Yij.

Yi..

; i 1,2,..., a

bn
Y.j.

; j 1,2,..., b

an

Y...
n

i 1,2,..., a

j 1,2,..., b

a b n
Y...
Y... Yijk Y...
i1j1k 1
abn

La suma total de cuadrados corregida puede expresarse mediante:

i1

j1

k 1

a
b

i1 j1

a
b

i1 j1
bn

i1

Yij k

k 1

k 1
Y
i..

Y . ..

Yij k

Yij k

Y . ..

Y
i. .

Y
ij .

Y . ..

Y .. .

a n

Y. j .

Y .. .

Y
ij .

Y . ..

Y. j

Y . ..

j1

Y .j .

a
b

i1 j1

Y . ..

k 1

Y
ij k

a
b

i1 j1

Y
ij .

Y
ij
.

Y
i..

Dado que los seis productos cruzados del segundo miembro de la


ecuacin anterior son iguales a cero. Se observa que la suma total de
cuadrados se ha descompuesto en una suma de cuadrados debida a
los renglones o al factor A (SSA) en una suma de cuadrados
debida a las "columnas" o al

factor B (SSB), en una suma de

cuadrados debida a la interaccin entre A y B (SSAB), y en una suma


de cuadrados debida al error (SS E): Analizando el ltimo trmino del
miembro derecho de la Ecuacin anterior es posible observar que es
necesario tener al menos dos rplicas (n 2) para poder obtenerla
suma de cuadrados del error.
Simblicamente, la Ecuacin anterior puede expresarse mediante:

S T S A S B S AB S E
Los grados de libertad asociados a cada suma de cuadrados son:

Y. j
.

Efecto

Grados

de
libert
ad

A
B
Interaccin

a-1
b-1
(a-1)(b-1)

AB
Error
Total

ab(n-1)
abn-1

Esta descomposicin del total de abn -1 grados de libertad para las


sumas de cuadrados se puede justificar como sigue: Los efectos
principales de A y B tienen a y b niveles, respectivamente, por lo
tanto, tienen a -1 y b -1 grados de libertad como se muestra.
Los grados de libertad de la interaccin simplemente corresponden a
los grados de libertad de cada celda (los cuales son iguales a ab -1)
menos los grados de libertad de los dos efectos principales A y B en
otras palabras, ab -1 -(a -1) -(b -1) -(a- 1)(b -1). Dentro de cada una de
las ab celdas hay n -1 grados de libertad entre las n rplicas, por lo
tanto, hay ab(n -1) grados de libertad del error.
Se observa que la suma de los grados de libertad de los trminos del
miembro derecho de la ecuacin anterior es igual al total de los
grados de libertad.
Cada suma de cuadrados dividida entre sus grados de libertad
produce una media de cuadrados.
Por lo tanto, para probar el significado de ambos efectos principales,
as como de su interaccin, simplemente deben dividirse las medias
de cuadrados correspondientes entre la media de cuadrados del error.
Valores grandes de estas razones implican que los datos no
concuerdan con las hiptesis nulas.

Si se considera que el modelo estadstico es adecuado y que los


trminos del error ijk son independientes con distribuciones normales
con variancia constante 2, entonces las razones de las medias de
cuadrados MSA/MSE, MSB/MSE y MSAB/MSE tienen distribucin F con a
-1, b- 1 y (a -1)(b -1) grados de libertad en el numerador,
respectivamente, y ab(n -1) grados de libertad en el denominador. Las
regiones crticas corresponden al extremo superior de la distribucin
F. Usualmente la prueba se presenta en una tabla de anlisis de
variancia como la que aparece en la tabla 2.
Fuente de
Variacin
SS G.L.
Tratamientos SSA a - 1
A
Tratamientos SSB b - 1
B
Interaccin

Fo

MSA

MSA

SSA

MSE

a 1
MSB

MSB

SSB

SSA (a - 1)(b B

Error

MS

1)

SSE ab(n-1)

b 1
MSAB
SSAB

MSE
MSAB
MSE

(a 1)(b 1)
MSB
SSE
ab(n 1)

Total
SST abn - 1
Tabla 2 ANOVA para el modelo bifactorial de efectos fijos
Es posible obtener las frmulas para calcular las sumas de cuadrados
de la ecuacin anterior. La suma total de cuadrados se calcula en
forma usual mediante:
SST

2
a b n
Y ...
2
Y ijk
i1j1k 1
abn

Las sumas de cuadrados para los efectos principales son:


2
2
a Y i..
Y ...

i1 bn
abn
2
2
b Y .j.
Y ...
SSB

j1 an
abn

SSA

Es conveniente obtener SSAB en dos etapas. Primero se calcula la


suma de cuadrados entre los totales de las ab celdas, conocida como
la suma de cuadrados debido a los "subtotales":
2
2
a b Y ij.
Y ...
SSsubtotales

i1j1 n
abn

Esta suma de cuadrados contiene a la SS A y SSB. Por lo tanto, la


segunda etapa consiste en calcular SSAB mediante:

SSAB SSsubtotales SSA SSB


La SSE se calcula por diferencia:

SSE SST SSAB SSA SSB


o bien :

SSE SST SSSubtotales


Ejemplo: Ms sobre el experimento de diseo de una batera. En la
tabla 3 se presenta la duracin efectiva (en horas) observada en el
ejemplo de diseo de una batera descrito en la anterior Los totales
de rengln y de columna se indican en los mrgenes de la tabla; los
nmeros subrayados son los totales de celda.

Tip

Temperatura (F)

o
de

15

70

125

Yi..

Mat
.
1

13 15
0

539 4
134.75

34 40 22 2
9

70 23 998
0

74 18

80 75

0
2

15 18
0

15 12
9
3

13 12
623

13 11
8

16 16
8
Y.j.

58

2
47 5

10 11 9

17 12
576

1738

9
58 6

15 13 3

1291

70
19 130
45 8

10
4

34 150

60 2

770

1
Y...=
379
9

Tabla 3. Duracin (en horas) para el experimento de diseo de una


batera

Las sumas de cuadrados se calculan a continuacin:


2
a b n
Y ...
2
SST Y ijk

i1j1 k 1
abn
130

155

74

... 60

3799
36

2
77,646.97

2
2
a Y i..
Y ...
SSmaterial

i1 bn
abn
2
2
2
2
998
1300
1501
3799

10,683.72
(3)(4)
36
2
2
b Y .j.
Y ...
SStemperat ura

j1 an
abn
2
2
2
2
1738
1291 770
3799

39,118.72
(3)(49
36
2
2
a b Y ij.
Y ...
SSinteracc ion

i1j1 n
abn
2
2
2
2
539
229
... 342
3799

10,683.72
4
36
39,118.72 9,613.78

SSE SST SSmaterial SStemperatura SSinteraccion


SSE 77,646.97 10,638.72 39,118.72 9,613.78
18,230.75

El anlisis de variancia aparece en la tabla 4. Se concluye que existe


una interaccin significativa entre el tipo de material y la temperatura
porque F0.05,4.27 = 2.73. Adems, tambin son significativos los efectos

principales del tipo de material y de la temperatura, porque F O.O5.2.27 =


3.35.

Fuente

de

G.

variacin
SS
Tipo de material 10,683.
ANOVA
datos

de

duracin
batera

Como
en

L.
2

MS
5,341.8

6
19,558.
36
2,403.4

Temperatura

72
39,118.

Interaccin

72
9,613.7

Error

8
18,230.

4
27 675.21

Total

75
77,646.

35

Fo
7.91
Tabla

4.

28.9

para

los

7
3.56

la
de

la

auxiliar

97

la

interpretacin de los resultados de este experimento resulta til la


construccin de una grfica de las respuestas promedio de cada
combinacin de tratamiento. Esta grfica se muestra en la figura 1.

175
150
125

Yij. 100

Material tipo 3

75

Material tipo 1
Material tipo 2

50
25
15

70
Temperatura

125

Figura 1. Grfica de respuesta vs temperatura

El hecho de que las rectas no sean paralelas indica una interaccin


significativa. En general, a menor temperatura mayor duracin,
independientemente del tipo de material.

Al variar la temperatura de baja a intermedia, la duracin aumenta


con el material tipo 3, mientras que disminuye con los materiales tipo
1 y 2,

Cuando la temperatura vara de intermedia a alta, la duracin


disminuye con los materiales tipo 2 y 3, mientras que con el tipo 1
esencialmente permanece sin cambio. Al parecer, el material tipo 3
da los mejores resultados si lo que se desea es menor perdida de
duracin efectiva al cambiar la temperatura.

Para comprobar si el modelo es adecuado, se analizan los residuos


que tengan un comportamiento aleatorio y normal.

7. DISEO DE EXPERIMENTOS TAGUCHI


7.1 Introduccin
La parte fundamental de la metodologa ideada por el matemtico
japons G. Taguchi es la optimizacin de productos y procesos, a fin
de asegurar productos robustos, de alta calidad y bajo costo.
La metodologa Taguchi consta de tres etapas:

a) Diseo del sistema


b) Diseo de parmetros
c) Diseo de tolerancias

De estas tres etapas, la ms importante es el diseo de parmetros


cuyos objetivos son:
a) Identificar qu factores afectan la caracterstica de calidad en
cuanto a su magnitud y en cuanto a su variabilidad.
b) Definir los niveles ptimos en que debe fijarse cada parmetro o
factor, a fin de optimizar la operacin del producto y hacerlo lo
ms robusto posible.
c)

Identificar

factores

que

no

afectan

substancialmente

la

caracterstica de calidad a fin de liberar el control de estos factores y


ahorrar costos de pruebas.
Para lograr lo anterior se ha manejado una serie de herramientas
estadsticas

conocida

como

diseo

de

experimentos,

tratadas

anteriormente.
Taguchi ha propuesto una alternativa no del todo diferente que se que
conoce como: Arreglos Ortogonales y las Grficas Lineales.
La herramienta utilizada normalmente son
fraccionados, sin embargo cuando el
incrementado,

diseos Factoriales

nmero de factores se ve

las posibles interacciones aumentan, as como la

complicaciones para identificar cules son las condiciones especficas


a experimentar.

Un arreglo ortogonal se puede comparar con una replicacin


factorial fraccionada, de manera que conserva el concepto de
ortogonalidad y contrastes. Un experimento factorial fraccionado es
tambin un arreglo ortogonal.
Taguchi desarroll una serie de arreglos particulares que denomin:
La (b)C

Donde:
a = Representa el nmero de pruebas o condiciones experimentales
que se tomarn.

Esto es el nmero de renglones o lneas en el

arreglo.
b =

Representa los diferentes niveles a los que se tomar cada

factor.
c = Es el nmero de efectos independientes que se pueden analizar,
esto es el nmero de columnas.

7.2 Arreglos ortogonales para experimentos a dos


niveles
En esta seccin, se analiza qu son, cmo se usan y cules son los
arreglos ortogonales ms importantes para experimentos en los que
cada factor toma dos niveles.
Un arreglo ortogonal es una tabla de nmeros. Como ejemplo de un

No. (a)
1
2
3
4
1 ,

A
1
1
2
2
2

F A C T O R E S (c)
B
C
1
1
2
2
1
1
2
1

Resultado
Y1
Y2
Y3
Y4

Niveles de los Factores (b)

arreglo ortogonal tenemos el siguiente:


De acuerdo con la notacin empleada por Taguchi al arreglo
mostrado como ejemplo, se le llama un arreglo L4, por tener cuatro
renglones.
En general, para un arreglo a dos niveles, el nmero de columnas
(efectos o factores) que se pueden analizar, es igual al nmero de
renglones menos 1.

Taguchi ha desarrollado una serie de arreglos para experimentos


con factores a dos niveles, los ms utilizados y difundidos segn el
nmero de factores a analizar son:
No. de factores a Arreglo
analizar
Entre 1 y 3
Entre 4 y 7
Entre 8 y 11
Entre 12 y 15
Entre 16 y 31
Entre 32 y 63

a No.

utilizar
L4
L8
L12
L16
L32
L64

de

condiciones

probar
4
8
12
16
32
64

El arreglo ortogonal ms popular es el arreglo L8, que se muestra a


continuacin junto con sus grficas lineales:

L8

Col.

Col.

Col.

Col.

Col.

Col.

Col.

1
1
1
1
2
2
2
2

1
1
2
2
1
1
2
2

1
1
2
2
2
2
1
1

1
2
1
2
1
2
1
2

1
2
1
2
2
1
2
1

1
2
2
1
1
2
2
1

1
2
2
1
2
1
1
2

Matriz

Exp.
No.
1
2
3
4
5
6
7
8

tabla

de

interaccio
nes
Column
as
1
2
3
4

1
(1)

2
3
(2)

3
2
1
(3)

4
5
6
7
(4)

5
4
7
6
1

6
7
4
5
2

7
6
5
4
3

5
6
7

(5)

1
(1)

1
3

2
6
(7)

5
1
.7

6
2

(a)
(b)

Grficas lineales
Los pasos para un diseo de experimentos de parmetros en el
caso de menor es mejor son:

7.3 Caso menor es mejor


1) Seleccionar una caracterstica

de calidad de salida

a ser

optimizada.
2) Seleccionar factores de control y sus niveles, identificando

sus

posibles interacciones.
3) Seleccionar los factores de ruido y sus niveles; si son demasiados
combinarlos en dos o tres factores combinados.
4) Seleccionar los arreglos interno y externo adecuados; asignar los
factores de control al arreglo interno y los factores de ruido al
arreglo externo.
5) Realizar los experimentos.

6) Realizar anlisis estadstico con base en S/N para identificar los


niveles de los factores de control ptimos Algunas veces ayuda
realizar un estudio de la interaccin entre factores de control y de
ruido.
7) Realizar anlisis estadstico con base en las medias para
identificar los niveles de los factores de control ptimos que
ajustan a la respuesta promedio en el nivel deseado. Si hay
conflicto entre los niveles de los factores para maximizar la
relacin S/N y ajustar la media, dar prioridad a los que sirven para
maximizar la relacin S/N.
8) Predecir el desempeo de salida ptimo con base en una
combinacin ptima de niveles de factores de control y realiza un
experimento confirmatorio.

8. REGRESIN Y CORRELACIN LINEAL


8.1 Introduccin
Son dos herramientas para investigar la dependencia de una variable
dependiente Y en funcin de una variable independiente X. Y = f(X)
Y = Variable dependiente que se desea explicar o predecir, tambin
se llama regresor o respuesta
X = Variable independiente, tambin se llama variable explicativa,
regresor o predictor
Regresin lineal - La relacin entre X y Y se representa por medio de
una lnea recta
Regresin curvilnea - La relacin entre X y Y se representa por medio
de una curva.

*
**

*
*

*
*

b1

* *

*
*

*
* *

b0
Correlacin positiva

Correlacin negativa

X
correlacin

La ecuacin de la recta es la siguiente:

El trmino de error es la diferencia entre los valores reales observados


Yi y los valores estimados por la ecuacin de la recta. Se trata de que
estos sean mnimos, para lo cual se utiliza el mtodo de mnimos
cuadrados.

Error Re siduo (Yi Yi )

Y
*

X
Se trata de minimizar la suma de todos los errores o residuos:
Las frmulas resultado de la minimizacin de lo cuadrados del error
se aplicarn en el siguiente ejemplo por claridad. Se tienen los
siguientes supuestos:

Sin

1. Los errores o residuos se distribuyen normalmente alrededor de la


recta de regresin poblacional
2. Las varianzas de los errores son las mismas en todos los valores de
X

(Homoscedasticidad)

en

caso

contrario

se

tiene

(Heteroscedasticidad)
3. Los errores o residuos son independientes: No se muestra algn
patrn definido.
El coeficiente de Correlacin r desarrollado por Carl Pearson es un
indicador de la fuerza de la relacin entre las variables X y Y, puede
asumir valores entre -1 y 1 para correlacin negativa y positiva
perfecta respectivamente. Por ejemplo si se encuentra que la variable
presin tiene una correlacin positiva con el rendimiento de una
caldera, se deben buscar soluciones al problema mediante acciones
asociadas con la variable presin; de lo contrario, sera necesario
buscar la solucin por otro lado.
Se identifican tres medidas de desviacin como sigue:

Yest = 4.4 + 1.08


X
Yi =
23

Desviacin
*

no

explicada
Error = (Yi - Yest)
= 1.32

Variacin
total
(Yimedia)=5.1

Desviacin

explicada
(Yest-Ymedia)

3.81

Ymedia =17.87
X = 16

8.2 Ejemplo manual


Se sospecha que el tiempo requerido para hacer un mantenimiento
preventivo est relacionado con su nmero. Calcular el coeficiente de

correlacin y graficar.

Los datos de tiempo tomados para n = 25

servicios se muestran a continuacin:


X Servicios Y Tiempo

(Xi-X)*(Yi-Y)

9.95

(Xi-X)^2

(Yi-Y)^2

Yest
Error
10.919

119.076672 38.9376

364.1533

9
0.9408
28.336 15.102

24.45

1.099872

0.0576

21.0021

2
2
37.044 28.029

11

31.75

7.499472

7.6176

7.3832

3
2
34.141

10

35.00

10.502272

3.0976

35.6075

6
0.7369
28.336 10.996

25.02

0.963072

0.0576

16.1026

2
9
16.725

16.86

51.612672

17.9776

148.1771

3
0.0181
10.919 11.972

14.38

91.433472

38.9376

214.7045

9
1
10.919

9.60

121.260672 38.9376

377.6337

9
1.7422
31.238 47.456

24.35

-3.558928

0.5776

21.9286

9
3
28.336

27.50

0.367872

0.0576

2.3495

2
0.6991
16.725

17.08

50.679872

17.9776

142.8694

3
0.1258
37.044

11

37.00

21.989472

7.6176

63.4763

3
0.0020
39.947

12

41.95

48.568672

14.1376

166.8541

0
4.0121
10.919

11.66

108.406272 38.9376

301.8142

9
0.5477
16.725 24.252

21.65

31.303072

17.9776

54.5057

3
3
16.725

17.89

47.245472

17.9776

124.1620

3
1.3564
63.168 34.005

20
1

69.00
10.30

470.014272 138.2976
135.625472 52.4176

1,597.3771 6
2
350.9178
8.0172 5.2111
34.141

10

34.93

10.379072

34.7770

6
0.6216
48.655

15
15

46.59
44.88

118.686672 45.6976
107.127072 45.6976

308.2553
251.1337

1
4.2646
48.655 14.251

3.0976

1
2
51.557
16

54.12

194.676672 60.2176

629.3676

8
6.5649
54.460

17

56.63

241.751472 76.7376

761.6054

5
4.7068
22.530

22.13

15.462272

5.0176

47.6486

7
0.1606
19.628

21.15

25.540272

10.4976

62.1385

206

725.82

2,027.7132

698.5600

6,105.9447

26

Sxy

Sxx

Syy = SST

SSE

Sxy

Sxx

Syy

2.3164
220.09

X
promedio

Y Promedio

Si todos los puntos estuvieran completamente sobre la recta la


ecuacin lineal sera y = a + bx. Como la correlacin no siempre es
perfecta, se calculan a y b de tal forma que se minimice la distancia
total entre puntos y la recta. Los clculos tomando las sumas de
cuadrados siguientes se muestran a continuacin:
Sxy = 2027.71
Sxx

= 698.56

Syy

= 6105.94

Las ecuaciones para el clculo manual son las siguientes:

b1 1

b0 0

( Xi X )(Yi Y ) S
S
( Xi X )

XY

1 X i
n

= 2.902704421

XX

Y X = 5.114515575

Las sumas de cuadrados son:

SST (Yi Y ) 2 6,105.9447

SSE (Yi Yi ) 2 (Yi (bo b1 * X i )) 2 220.0926

SSR SST SSE 5,885.8521

El coeficiente de determinacin r2 y el coeficiente de correlacin r se


calculan a continuacin:

r2 1

SSE ( SST SSE ) SSR

= 0.9639
SST
SST
SST

El coeficiente de determinacin indica el porcentaje de la variacin


total que es explicada por la regresin.
r r 2 = 0.9816

El coeficiente de correlacin proporciona el nivel de ajuste que tienen


los puntos a la lnea recta indicando el nivel de influencia de una
variable en la otra. El factor de correlacin r es un nmero entre 1
(correlacin negativa evidente) y +1 (correlacin positiva evidente), y
r = 0 indicara correlacin nula.
El coeficiente de correlacin r = 0.98 por lo cual tenemos suficiente
evidencia estadstica para afirmar que el tiempo de atencin esta
relacionado con el nmero de servicios atendidos.