Está en la página 1de 82

DR.

PRIMITIVO REYES AGUILAR

DISEO DE EXPERIMENTOS

Teora
Dr. Primitivo Reyes Aguilar

Mail: primitivo_reyes@yahoo.com
Cel. 04455 5217 4912

Diseo de experimentos factorials de dos niveles, factoriales completos,


factorials fraccionales y diseos especiales: Taguchi, Mezclas. Se tomo
como referencia el texto de Douglas Montgomery, Diseo y anlisis de
experimentos, 2. edicin
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

OBJETIVO

Objetivo general del mdulo. Que los asistentes actualicen los


conocimientos necesarios para disear, analizar y obtener inferencias
sobre experimentos conducentes a la mejora de productos y procesos
en la industria y que sean capaces de aplicar la mejor estrategia
experimental para resolver un problema de desarrollo de productos, o
de calidad en los productos.

Contenido
1. INTRODUCCIN AL DISEO DE EXPERIMENTOS...............................4
1.1 Aplicaciones del diseo de experimentos...................................5
Definicin de experimento, diseo de experimentos y eficiencia
de un experimento.........................................................................7
1. 2 Principios bsicos del diseo de experimentos..........................7
1.3. Metodologa general para realizar un experimento..................9
1.4. Aplicaciones del diseo de experimentos................................13
2. ANALISIS DE VARIANZA DE UN FACTOR (ANOVA 1 VIA)..................15
2.1 Introduccin..............................................................................15
2.2 Tipos de variacin y sumas de cuadrados.................................16
2.3 Uso de Excel:.............................................................................18
2.4 Uso de Minitab...........................................................................19
2.5 Grafica de residuos contra el valor ajustado de y ij ....................20
2.6 Ejercicios...................................................................................21
3. ANALISIS DE VARIANZA DE DOS VAS o DIRECCIONES (ANOVA 2
VIAS)...................................................................................................23
3.1 Introduccin..............................................................................23
3.2 Ejemplos con clculo manual....................................................23
3.3 Procedimiento en Excel.............................................................24
3.4 ANOVA en Minitab.....................................................................25
4. DISEOS FACTORIALES...................................................................29
4.1 Principios y definiciones bsicas...............................................29
Ventajas de los diseos factoriales..............................................31
4.2 Diseo factorial de dos niveles (2^K).......................................32
5. DISEOS DE EXPERIMENTOS FRACCIONALES DE DOS NIVELES.....40
5.1 Concepto de replicacin fraccionada........................................40

Pgina 2 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

5.2 Fraccin un medio del diseo 2k................................................41


5.3 Resolucin del diseo................................................................44
6. DISEOS DE EXPERIMENTOS FACTORIALES COMPLETOS...............46
6.1 Diseo factorial completo de 2 factores....................................46
6.2 Anlisis Estadstico del Modelo de Efectos Fijos........................48
7. DISEO DE EXPERIMENTOS TAGUCHI.............................................56
7.1 Introduccin..............................................................................56
7.2 Arreglos ortogonales para experimentos a dos niveles.............57
7.3 Caso menor es mejor................................................................59
8. REGRESIN Y CORRELACIN LINEAL..............................................64
8.1 Introduccin..............................................................................64
8.2 Ejemplo manual.........................................................................66
8.3 Uso de Excel..............................................................................68
8.4 Uso de Minitab...........................................................................69
8.5 Ejercicios:..................................................................................71

Pgina 3 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

1. INTRODUCCIN AL DISEO DE EXPERIMENTOS

E
l diseo de experimentos es una tcnica estadstica que nos
ayuda a identificar qu factores o variables afectan El
comportamiento de un proceso productivo y de esta manera
poder mejorarlo.

O bien: es una prueba o una serie de pruebas en las cuales se


inducen cambios deliberados en las variables de entrada de un
proceso o sistema, de manera que sea posible observar e identificar
las causas de los cambios en la respuesta de salida.

Experimento: es una prueba o ensayo.

El proceso o sistema bajo estudio puede representarse por medio del


modelo de la figura 1.1.
Factores controlables
x1 x2 x3 x4 ... xp

Entradas Salida
Proceso
y

z1 z2 z3 z4 ... zq
Factores incontrolables
Figura 1. Modelo general de un proceso o sistema

Pgina 4 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Algunas de las variables del proceso x 1, x2,..., xk son controlables,


mientras que otras z1, z2,...,zk son incontrolables (aunque pueden ser
controlables para los fines de prueba). Entre los objetivos del
experimento pueden incluirse:

1. Determinar cules variables tiene mayor influencia en la


respuesta, y.
2. Determinar el mejor valor de las x que influyen en y, de modo
que y tenga casi siempre un valor cercano a valor nominal
deseado.
3. Determinar el mejor valor de las x que influyen en y, de modo
que la variabilidad de y sea pequea.
4. Determinar el mejor valor de las x que influyen en y, de modo
que se minimicen los efectos de las variables no controlables z 1,
z2,...zq.

Lo mtodos de diseo experimental tiene un propsito que puede ser


desarrollar un proceso consistente o robusto; esto es, un
proceso que no sea afectado por fuentes de variabilidad
externas o ruido (las zi).

En el diseo de experimentos se plantean varias preguntas


importantes:

1. Son estas dos soluciones los nicos medios para lograr la


respuesta de inters?
2. Existen otros factores que pueden afectar la respuesta de las
muestras y que deban ser investigados o controlados?
3. Cuntas muestras deben ser sometidas a cada solucin de
templado?
4. En que forma debe asignarse cada muestra a los tratamientos,
y en qu orden deben realizarse las mediciones?
5. Qu mtodo de anlisis debe utilizarse?
6. Qu diferencia en los niveles promedio de respuesta entre los
dos tratamientos debe considerarse como significativa?

Estas, y quiz muchas otras preguntas, debern ser contestadas


satisfactoriamente antes de llevar a cabo el experimento.

Pgina 5 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

1.1 Aplicaciones del diseo de experimentos

E
l diseo de experimentos puede servir para mejorar el
rendimiento de un proceso de manufactura, desarrollo de
nuevos procesos con lo que se logra:

1. Mejorar el rendimiento del proceso.


2. Menor variabilidad y mayor apego a los requerimientos
nominales y objetivos.
3. Menor tiempo de desarrollo.
4. Menores costos totales.

Los mtodos de diseo de experimentos tambin se aplican al diseo


de productos como sigue:

1. Evaluacin y comparacin de conceptos de diseo bsicos.


2. Evaluacin de materiales alternativos.
3. Seleccin de parmetros de diseo de modo que el producto
funcione bien desde una amplia variedad de condiciones de uso
real; Esto es, de modo que el producto sea consistente (robusto).

El uso del diseo de experimentos en estas reas puede dar por


resultado productos con mayor confiabilidad y mejor funcionamiento
en el campo, menores costos, y menor tiempo de diseo y desarrollo
del producto.

El diseo estadstico de experimentos es el proceso de planear un


experimento para obtener datos apropiados, que pueden ser
analizados mediante mtodos estadsticos, con objeto de producir
conclusiones validas y objetivas.

Cuando se identifican los factores y su influencia en un sistema


productivo, se pueden tomar decisiones que efectivamente mejoren
la calidad del producto o servicio. Se pueden identificar las fuentes
de variacin reales para su reduccin en la bsqueda de la mejora
continua.

Cuando se usan experimentos pretendemos analizar el efecto de


cambios que nosotros inducimos ms que analizar variaciones al azar.
Por ejemplo, mediante un diagrama causa-efecto podemos identificar
las posibles causas o factores que inciden en un efecto o respuesta
especifica tal y como s muestra en la figura 2

Pgina 6 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

F2 F1
F11
F21

F22 F12

CARACTERISTICA
DE C ALIDAD

F41
F31
F32
F42

F4 F3

Figura 1.2 Diagrama de Causa Efecto

Mediante un experimento podemos inducir cambios en uno varios


factores (F2l. F33 y F11 por ejemplo) y analizar estadsticamente si el
cambio en los factores afecta o no el resultado o efecto del proceso.

Pgina 7 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Definicin de experimento, diseo de experimentos y


eficiencia de un experimento

Experimento

E s un conjunto de pruebas estructurado y coherente que son


analizadas a fin de comprender la operacin del proceso.

Diseo de experimentos

E
s el proceso de planear, ejecutar y analizar el experimento de
manera que los datos apropiados sean recolectados, y que
estos tengan validez estadstica para obtener conclusiones
validas y tiles. Se entiende por validez estadstica, el que los
resultados se puedan repetir consistentemente sobre todo en la
operacin a gran escala o masiva.

Eficiencia de un experimento

Un experimento es eficiente cuando:

1. Se obtiene la informacin requerida.


2. Con el mnimo consumo de recursos.

Esto es, un experimento eficiente debe ser lo ms simple y


econmico posible pero efectivo. Las tcnicas del diseo de
experimentos pretenden que los experimentos sean eficientes.

1. 2 Principios bsicos del diseo de experimentos

P ara que un experimento pueda tener validez estadstica se deben


de observar al menos tres principios:

Reproduccin. Esto significa que el experimento se pueda llevar


a cabo o repetir bajo las mismas condiciones en ms de una
ocasin.

La diferencia observada como resultado de un experimento es real, o


se debe a simple error aleatorio, o aun ms a otro factor como por
ejemplo diferente tipo del material. Para aclarar esto, es necesario
repetir el experimento y cuantificar si se presenta consistentemente o
no la variacin detectada.

Pgina 8 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

La reproduccin por lo tanto es importante por al menos dos razones:

i) Permite cuantificar el error aleatorio inherente al proceso y


ii) Permite una mejor estimacin de los parmetros.

Aleatoriedad. Esto significa que tanto el material asignado a un


experimento en particular, como el orden en que se efectan
las pruebas se efectu de una manera aleatoria.

Suponga por ejemplo, que se desea saber si la temperatura influye en


el nivel de contaminacin de un producto, medida en mgms/lt, para
esto primero efecta cuatro pruebas a una temperatura de 80C y
enseguida cuatro pruebas a 90C, los Resultados son:

80C 2.2 2.8 3.2 3.6 2.95


90C 3.4 3.9 4.3 4.7 4.07

A primera vista con la temperatura de 80C se ve que tiene menor


nivel de contaminacin, sin embargo, algo raro se observa, el nivel
de contaminacin siempre aumenta, esto se debe a que los residuos
que quedan en el equipo aumentan constantemente la
contaminacin del producto. Esto se puede evitar lavando
perfectamente el material, lo cual puede no ser fsicamente posible.
"En lugar de esto podemos confundir, anular o igualar este efecto,
realizando las pruebas en orden aleatorio bajo las dos temperaturas.

En una diagrama causa-efecto con un gran nmero de factores


afectando la caracterstica de calidad, si se desea analizar el efecto
de uno o varios factores, se debera controlar y medir todos los otros
factores y aun as no eliminara el error aleatorio, en lugar de esto se
puede "confundir" o anular el efecto de estos factores no controlables
al efectuar las pruebas siguiendo un orden aleatorio o al azar.

La aleatoriedad por lo tanto es importante por al menos dos razones

i) Confunde el efecto de factores no controlables y


ii) Valida las pruebas estadsticas al hacer que los errores
experimentales sean estadsticamente independientes.

Anlisis por bloques. Es una tcnica que se usa para


incrementar la precisin del experimento. Un bloque es una
porcin del material experimental que sea ms homognea que

Pgina 9 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

el total del material o cuando las condiciones son ms


homogneas. Al realizar un experimento por bloques se hacen
las comparaciones entre las condiciones de inters del
experimento dentro de cada bloque.

1.3. Metodologa general para realizar un


experimento

S e sugieren varias metodologas en la literatura, la siguiente es una


de ellas:

1. Identifique claramente el problema o situacin a resolver. Antes de


poder planear un experimento necesitamos definir claramente que es
la que estamos buscando, aun cuando esto puede parecer trivial en
ocasiones es tanta la presin para tomar decisiones que corremos a
experimentar sin por lo menos definir claramente nuestros objetivos.

En este paso es necesario definir que tipo de informacin es


exactamente la que nos interesa, ya que no podemos medir o variar
todos y cada uno de los componentes de un experimento.

En ocasiones escuchamos que el experimento fue un xito pero la


calidad no mejor. Antes de planear un experimento se debe de
investigar y. analizar el conocimiento y datos que ya se tengan sobre
este problema. La participacin activa del personal involucrado en el
problema es de vital importancia en este paso.

En conclusin como resultado de este paso, la hiptesis a probar debe


quedar bien definida. Un diagrama causa-efecto es una buena ayuda
en este paso.

2. Identificar variables. En este paso dos tipos de variables se deben


de identificar, variables dependientes y factores o variables
independientes.

La variable dependiente o variable de respuesta es la caracterstica


de calidad que queremos mejorar y cuyo comportamiento deseamos
conocer, ejemplos de esta son: porcentaje de contaminacin,
satisfaccin de un cliente, desgaste de una herramienta, tiempo, de
falla, etc.

Pgina 10 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Es deseable que una variable dependiente rena las caractersticas


siguientes:

Cuantitativa
Precisa.
Que tenga algn significado fsico.

Las variables independientes o factores representan aquellas causas


o factores cuyo efecto sobre la variable dependiente se quiere
analizar. Cada uno de estos factores se deber probar al menos a dos
valores diferentes para evaluar su efecto, a cada uno de estos valores
o niveles se les llama tratamientos. Por ejemplo, si queremos
conocer el efecto de la temperatura sobre la dureza de un material y
para ello se realizan pruebas a 70, 80 y 90C se dice que tenemos un
experimento de un solo factor con tres tratamientos. Otra vez es de
vital importancia la participacin del personal involucrado en el
problema a fin de seleccionar apropiadamente los factores o variables
independientes y los niveles de cada factor o tratamiento de inters.

Cmo seleccionar los diferentes niveles de un factor?, En general un


factor puede ser cualitativo (proveedor, turno, operario, etc), o
cuantitativo (temperatura, presin, altura, tiempo, etc.). Los niveles
especficos en cualquier caso se pueden seleccionar ya sea
aleatoriamente dentro de un cierto rango o a un nivel fijo definido por
el experimentador previamente, esto nos lleva a cuatro situaciones
generales:

A. Factor fijo, cualitativo.


En este caso, de entre los diferentes niveles o tratamientos posibles
para el factor, el experimentador esta interesado en el efecto que
ciertos niveles seleccionados por l previamente tienen sobre la
variable de respuesta. Adems, el factor es del tipo cualitativo. Por
ejemplo tres proveedores, tres turnos, dos procesos diferentes, etc.

B. Factor fijo, cuantitativo.

Este caso es similar al anterior excepto que el factor es cuantitativo,


por ejemplo: temperatura, presin, tiempo, concentracin de un
componente, etc. Para este caso es recomendable que los diferentes
niveles o tratamientos se tomen equiespaciados, esto es, por ejemplo
10, 20, 30 y 40 C: 5, 10, 15, 20 y 25 psi; 8, 12, 16 y 20 minutos, etc.

Pgina 11 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

La conclusin a que se puede llegar con este caso es si la variable de


respuesta es diferente para cada uno de los tratamientos que se
seleccionaron y de ser as el tipo de relacin que existe entre el factor
y la variable de respuesta (lineal, cuadrtica, etc.).

C. Factor aleatorio, cualitativo.

En este caso los niveles o tratamientos se seleccionan al azar de


entre varios posibles. Por ejemplo: se tienen varios lotes de un mismo
proveedor, se selecciona al azar cules de ellos analizar, en este caso
la conclusin del experimento se extiende para cubrir todos los
posibles niveles..

D. Factor aleatorio, cuantitativo.

Igual que en el caso anterior los diferentes niveles o tratamientos son


seleccionados al azar.

Por ejemplo para la temperatura si el rango de inters es de 0 a 100.


Se puede al azar seleccionar 5 niveles 7, 36, 46, 80 y 8 C. La
conclusin que se puede obtener en este caso es similar al caso c.

En este material, a menos que se especifique lo contrario, los factores


se consideran fijos.

3. Definir el diseo del experimento. Esto imp1ica definir de qu


manera se efectuaran las pruebas y qu modelo matemtico describe
mejor el experimento. En el resto de este material se describen varios
tipos de experimentos de los cuales se tomar el que mejor se ajuste
a la situacin particular.

4. Efectuar el experimento. Esto de acuerdo a lo que se defina en el


paso 3.

5. Anlisis de los datos. Estos son bsicamente anlisis estadsticos.

6. Conclusiones y toma de decisiones.

Una metodologa (alterna) desarrollada por Douglas C.


Montgomery es la siguiente:

Pgina 12 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

P
ara usar un enfoque estadstico al disear y analizar un
experimento se requiere que todos los participantes en l
tengan de antemano una idea clara de qu es exactamente lo
que se va a estudiar, cmo se van a recopilar los datos y, al menos,
una idea cualitativa de cmo se van a analizar. A continuacin, se
ofrece una gua del procedimiento recomendado:

1. Comprensin y planteamiento del problema.

Este punto pudiera parecer obvio; sin embargo, en la prctica no es


sencillo darse cuenta de que existe un problema que requiere
experimentacin, ni disear un planteamiento claro y aceptable del
mismo. Es necesario desarrollar todas las ideas sobre los objetivos del
experimento. Suele ser importante solicitar la opinin de todas las
partes implicadas. Un planteamiento claro del problema contribuye a
menudo en forma sustancial a un mejor conocimiento del fenmeno y
de la solucin final del problema.

2. Eleccin de factores y niveles.

El experimentador debe elegir los factores que variarn en el


experimento, los intervalos de dicha variacin y los niveles
especficos de inters a los cuales se har el experimento. Tambin
debe considerarse la forma en que se controlarn estos factores para
mantenerlos en los valores deseados, y cmo se les medir. Para ello
es necesario conocer el proceso de manera prctica y terica.

3. Seleccin de la variable de respuesta.

Al seleccionar la respuesta o variable dependiente, el experimentador


debe estar seguro de que la respuesta que se va a medir realmente
provea informacin til acerca del proceso de estudio. Con mayor
frecuencia, el promedio o la desviacin estndar (o ambos) de la
caracterstica medida sern la variable de respuesta. No son raras las
respuestas mltiples. La capacidad de medicin (o el error de
medicin) tambin es un factor importante. Si la capacidad de
medicin es deficiente, slo puede esperarse que el experimento
detecte efectos relativamente grandes de los factores; en caso
contrario deben hacerse repeticiones.

4. Eleccin del diseo experimental.

Pgina 13 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Para elegir el diseo es necesario considerar el tamao muestral


(nmero de repeticiones), seleccionar un orden adecuado para los
ensayos experimentales, y determinar si hay implicado bloqueo u
otras restricciones de aleatorizacin.

Es importante tener presente los objetivos experimentales al


seleccionar el diseo, se tiene inters en identificar qu factores
causan diferencias en estimar la magnitud del cambio de la
respuesta. En otras situaciones habr ms inters en verificar la
uniformidad. Por ejemplo, pueden compararse dos condiciones de
produccin A y 8, siendo A la estndar y B una alternativa de menor
costo. El investigador estar interesado en demostrar que no hay
diferencia en cuanto a la productividad (por ejemplo), entre las dos
condiciones.

5. Realizacin del experimento.

Cuando se realiza el experimento, es vital vigilar el proceso


cuidadosamente para asegurar que todo se haga conforme a lo
planeado. En esta fase, los errores en el procedimiento suelen anular
la validez experimental. La planeacin integral es decisiva para el
proceso. En un complejo entorno de manufactura o investigacin y
desarrollo, es fcil subestimar los aspectos logsticos y de planeacin
de la realizacin de un experimento diseado.

6. Anlisis de datos.

Deben emplearse mtodos estadsticos para analizar los datos, de


modo que los resultados y conclusiones sean objetivos ms que
apreciativos. Existen muchos excelentes paquetes de software para el
anlisis de datos, y varios mtodos grficos sencillos son importantes
en la interpretacin de tales datos. El anlisis de residuos y la
verificacin de la idoneidad del modelo son tambin tcnicas de
anlisis de gran utilidad.

Hay que recordar que los mtodos estadsticos slo proporcionan


directrices para la veracidad y validez de los resultados. Los mtodos
estadsticos, aplicados adecuadamente, no permiten probar algo
experimentalmente, slo hacen posible obtener el probable error de
una conclusin, o asignar un nivel de confiabilidad a los resultados. La
principal ventaja de los mtodos estadsticos es que agregan
objetividad al proceso de toma de decisiones. Las tcnicas

Pgina 14 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

estadsticas, aunadas aun buen conocimiento tcnico o del proceso y


al sentido comn, suelen llevar a conclusiones razonables.

7. Conclusiones y recomendaciones.

Una vez que se han analizado los datos, l experimentador debe


extraer conclusiones prcticas de los resultados y recomendar un
curso de accin. En esta fase a menudo son tiles los mtodos
grficos, en especial al presentar los resultados a otras personas.
Tambin deben realizarse corridas de seguimiento y pruebas de
confirmacin para validar las conclusiones del experimento.

1.4. Aplicaciones del diseo de experimentos.

E
n muchas ocasiones l termino experimento se considera
asociado exclusivamente para cuestiones cientficas y tericas;
sin embargo tienen varias aplicaciones prcticas.

Algunos ejemplos son:

Si la materia prima que es entregada por tres diferentes


proveedores producen caractersticas diferentes en el producto
Si diferentes marcas de herramienta tienen o no vida diferente.
Si la temperatura de recocido afecta o no alguna propiedad
mecnica del producto.
Si diferentes cabezales de una misma mquina producen
productos similares.
Si un nuevo mtodo de ensamble incrementa o no la productividad
en una lnea de produccin.
Cul es el factor que ms influye en la variabilidad de alguna
caracterstica de calidad.

Es necesario tener claros y en todo caso revisar los siguientes


conceptos estadsticos antes de seguir:

Qu es una prueba de hiptesis?


Qu e s un error tipo I y Qu es un error tipo II?
Qu es una prueba t para comparar dos medias?
Qu es la potencia de una prueba de hiptesis?
Qu es control estadstico?.
Qu es nivel de significancia?.

Pgina 15 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Pgina 16 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

2. ANALISIS DE VARIANZA DE UN FACTOR (ANOVA 1


VIA)

2.1 Introduccin
El anlisis de la varianza de un factor (ANOVA) es una metodologa
para analizar la variacin entre muestras y la variacin al interior de
las mismas mediante la determinacin de varianzas. Es llamado de
una va porque analiza un variable independiente o Factor ejemplo:
Velocidad. Como tal, es un mtodo estadstico til para comparar dos
o ms medias poblacionales. El ANOVA de un criterio nos permite
poner a prueba hiptesis tales como:

H 0 1 2 3 .... k
H 1 : Al menos dos medias poblaciona les son diferentes.

Los supuestos en que se basa la prueba t de dos muestras que


utiliza muestras independientes son:

1. Ambas poblaciones son normales.


2. Las varianzas poblacionales son iguales, esto es, 1 2 .
2 2

El estadstico tiene una distribucin muestral resultando:

sb2
Fc 2
sw

El valor crtico para la prueba F es:

F , ( k 1), k ( n 1))

Donde el nmero de grados de libertad para el numerador (Sb^2 >


Sw^2) es k-1 y para el denominador es k(n-1), siendo el nivel de
significancia.

k = nmero de muestras.

Por ejemplo:

Pgina 17 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Ejemplo: Se tienen 14 empleados seleccionados al azar que se


someten a
3 diferentes cursos de entrenamiento: Programa 1, Programa 2
y Programa 3.

Como los empleados se seleccionan aleatoriamente para cada


programa
el diseo se denomina DISEO COMPLETAMENTE
ALEATORIZADO
Se observa el aprovechamiento de los empleados en los
programas:

TRATAMIENTOS

I c=1 c=2 c=3 J


Programa Programa
Programa 1 2 3
r=1 85 80 82
r=2 72 84 80
r=3 83 81 85
r=4 80 78 90
r=5 ** 82 88
Medias 80.00 81.00 85.00 Xj
Media de medias o
media total 82.14

2.2 Tipos de variacin y sumas de cuadrados

1. Variacin total entre los 14 empleados, su puntuacin no fue


igual con todos
VARIACIN TOTAL RESPECTO A LA MEDIA GENERAL
r c 2

SCT ( Xij X )
i 1 j 1

SCT = (85-82.14)2 + (72-82.14)2+(83-82.14)2+.....+(88-82.14)2

SCT = 251.7

2. Variacin entre los diferentes tratamientos o Variacin entre


muestras o variacin entre programa 1, programa 2 y programa 3

Pgina 18 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

EFECTO DE LA MEDIA DE CADA TRATAMIENTO RESPECTO A LA MEDIA


GENERAL

r
SCTR rj ( X j X ) 2
j 1

SCTR = 4(79.5 - 81.3333)2 + 5(81 - 81.3333)2 + 5(85 - 81.333)2

SCTR = 65.71

3. Variacin dentro de un tratamiento o muestra o programa


dado que no todos los empleados dentro de un mismo programa
obtuvieron los mismos puntajes. Se denomina Variacin dentro de los
tratamientos.

VARIACIN DENTRO DEL TRATAMIENTO O VARIACIN DEL ERROR


CADA VALOR RESPECTO A LA MEDIA DE SU TRATAMIENTO
r c
SCE (X ij X j )2
i 1 j 1

SCE = SCT - SCTR = 186

4. Grados de libertad

Grados de libertad totales = n - 1 = 14-1 = 13


Grados de libertad de los tratamientos = c - 1 = 3 - 1 = 2

Grados de libertad del error = gl. Totales - gl. Tratamientos = 13 - 2 =


11
gl SCT = gl SCTR + gl SCE
gl SCE = gl SCT - gl SCTR = (n -1) - (c - 1) = n -c

5. Cuadrados medios (Suma Cuadrados/ Grados libertad)


CMT = Cuadrado medio total = SCT / (n-1) = 19.4
CMTR = Cuadrado medio del tratamiento = SCTR / (c -1) = 32.9
CME = Cuadrado medio del error = SCE/ gle.= 16.9

Pgina 19 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

6. Estadstico de prueba Fc y estadstico F crtico de alfa

Fc = CMTR / CME= 1.946745562

Falfa, gl.numerador, gl.deno min ador F ,c 1,n c

Clculo de F con Excel


=DISTR.F.INV(ALFA, GL. TR, GL. ERR) =DISTR.F.INV(0.05, 2, 11) =
3.982297957

Pgina 20 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

ZONA
NO DE
RECHAZAR RECHAZO

Distr. F

Como Fc es menor a Falfa no se rechaza Ho y las medias son iguales.

7. Valor de P Fc

P = distr.f(Fc, gl. SCTr, gl. SCE) = distr.f(1.946, 2, 11) = 0.18898099


Como P es mayor a alfa no se rechaza Ho
CONCLUSION: NO HAY SUFICIENTE EVIDENCIA PARA RECHAZAR HO,
LAS MEDIAS DE LOS TRATAMIENTOS SON IGUALES

TABLA DE ANOVA

FUENTE DE VARIACIN SUMA DE GRADOS DE CUADRADO


CUADRADOS LIBERTAD MEDIO
VALOR F
Entre muestras (tratam.) SCTR c-1 CMTR
CMTR/CME
Dentro de muestras (err.) SCE n-c CME
Variacin total SCT n-1 CMT

Regla: No rechazar si la F de la muestra es menor que la F de Excel


para una cierta alfa

2.3 Uso de Excel:


En el men herramientas seleccione la opcin Anlisis de
datos, en funciones para anlisis seleccione Anlisis de
varianza de un factor.
En Rango de entrada seleccionar la matriz de datos (todas las
columnas a la vez).
Alfa = 0.05
En Rango de salida indicar la celda donde se iniciar la
presentacin de resultados.

Pgina 21 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Anlisis de varianza de un
RESUMEN factor
Varianz
Grupos Cuenta Suma Promedio a
Programa 32.666
1 4 320 80 667
Programa
2 5 405 81 5
Programa
3 5 425 85 17

Grado Promedio
ANLISIS DE VARIANZA s de de
Variacione Suma liberta Cuadrado Probabili
s cuadrados d s Fc dad F crtica
Entre 65.714285 32.85714 1.9431 0.189377 3.98229
grupos 71 2 286 644 31 796
Dentro de 16.90909
grupos 186 11 091
251.71428
Total 57 13

2.4 Uso de Minitab


Stat > ANOVA > One Way (Unstacked)
en Responses in separate columns Indicar las columnas de datos
En Confidence Level 95%
Seleccionar Comparisons Tukey 5%
OK

One-way ANOVA: Programa 1, Programa 2, Programa 3

Source DF SS MS F P
Factor 2 65.7 32.9 1.94 0.189
Error 11 186.0 16.9
Total 13 251.7

S = 4.112 R-Sq = 26.11% R-Sq(adj) = 12.67%

Individual 95% CIs For Mean Based on


Pooled StDev

Level N Mean StDev ----+---------+---------+---------+-----


Programa 1 4 80.000 5.715 (------------*------------)
Programa 2 5 81.000 2.236 (----------*-----------)

Pgina 22 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009
Programa 3 5 85.000 4.123 (-----------*----------)
----+---------+---------+---------+-----
77.0 80.5 84.0 87.5
Pooled StDev = 4.112

NOTA: Si los Intervalos de confianza se traslapan, las


medias son iguales estadsticamente

Tukey 95% Simultaneous Confidence Intervals


All Pairwise Comparisons

Individual confidence level = 97.94%

Programa 1 subtracted from:

Lower Center Upper --------+---------+---------+---------+-


Programa 2 -6.451 1.000 8.451 (------------*-----------)
Programa 3 -2.451 5.000 12.451 (-----------*------------)
--------+---------+---------+---------+-
-6.0 0.0 6.0 12.0

Programa 2 subtracted from:

Lower Center Upper --------+---------+---------+---------+-


Programa 3 -3.025 4.000 11.025 (-----------*----------)
--------+---------+---------+---------+-
-6.0 0.0 6.0 12.0

NOTA: Si el cero se encuentra en el intervalo de confianza de la


diferencia entre medias, este par de medias no son diferentes.

2.5 Grafica de residuos contra el valor ajustado de y ij

S
i el modelo es correcto y las suposiciones se satisfacen, los
residuos no deben tener algn patrn, ni deben estar
relacionados con alguna variable, incluyendo la respuesta Y ij.
Una comprobacin sencilla consiste en graficar los residuos contra los
valores ajustados y ij (debe recordarse que para el modelo en un

sentido y ij - yi. , el promedio del tratamiento i-simo). En esta grafica no


debe revelarse ningn patrn obvio en la siguiente figura se grafican
los residuos contra los valores ajustados de los datos de la resistencia
a la tensin del ejemplo 2.3 Ningn patrn inusual es evidente.

Pgina 23 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Grafica de residuos contra valores ajustados

Un efecto que en ocasiones revela la grafica es el de una varianza


variable. Algunas veces la varianza de las observaciones lo hace. Esto
resulta cuando el error es proporcional a la magnitud de la
observacin (comnmente esto sucede en instrumentos de medicin
el error es proporcional a la escala de la lectura). Si este es el caso,
los residuos aumenta a medida que Yij lo hace, y la grafica de los

residuos contra Yij parecer un embudo que se ensancha o un


altavoz. La varianza variable tambin ocurre en casos cuyos datos no
tienen distribucin normal y estn sesgados, porque en las
distribuciones sesgadas la varianza tiende a ser funcin de la media.

2.6 Ejercicios

1. Cuatro catalizadores que pueden afectar la concentracin de un


componente en una mezcla lquida de tres componentes estn siendo
investigado.
Se obtienen las siguientes concentraciones:

Cataliza
dor
A B C D
58.2 56.3 50.1 52.9
57.2 54.5 54.2 49.9
58.4 57 55.4 50
55.8 55.3 51.7
54.9

Pgina 24 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

2. Para determinar si existe diferencia significativa en el nivel de


Matemticas de 4 grupos de estudiantes de Ingeniera se realiz un
examen aleatorio a 6 individuos por grupo. Determine cuales son los
grupos en los cuales existen diferencias a un 95% de nivel de
confianza.

A B C D
75 78 55 64
93 91 66 72
78 97 49 68
71 82 64 77
63 85 70 56
76 77 68 95

3. Las calificaciones en el examen a 18 empleados de tres unidades


de negocio
Se muestran a continuacin:
Probar si no hay diferencia entre las unidades a un 5% de nivel de
significancia.

A B C
85 71 59
75 75 64
82 73 62
76 74 69
71 69 75
85 82 67

4. Probar si hay diferencia en los tiempos de servicio de 4 unidades


de negocio para el mismo servicio a un nivel de significancia del 5%.
A B C D
11.
5.4 8.7 1 9.9
10.
7.8 7.4 3 12.8
5.3 9.4 9.7 12.1
10.
7.4 10.1 3 10.8
8.4 9.2 9.2 11.3
7.3 9.8 8.8 11.5

Pgina 25 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

3. ANALISIS DE VARIANZA DE DOS VAS o


DIRECCIONES (ANOVA 2 VIAS)

3.1 Introduccin

En este caso las frmulas son parecidas a la del ANOVA de una va


pero ahora agregando el clculo por renglones adicional al de
columnas donde se incluye la variable de bloqueo. El bloqueo es
completamente al azar.

Se trata de bloquear un factor externo que probablemente tenga


efecto en la respuesta pero que no hay inters en probar su
influencia, slo se bloquea para minimizar la variabilidad de este
factor externo, evitando que contamine la prueba de igualdad entre
los tratamientos.

Los tratamientos se asignan a las columnas y los bloques a los


renglones. Un bloque indica condiciones similares de los sujetos al
experimentar con diferentes tratamientos.

Las hiptesis son:

Ho: No hay diferencia en las medias del factor de columna


Ha: Al menos una media del factor de columna es diferente

Ho: No hay diferencia en las medias de la variable de rengln


Ha: Al menos una media de la variable de rengln es diferente

3.2 Ejemplos con clculo manual

Ejemplo 1.
Suponiendo que se quiere investigar si la produccin de tres
diferentes mquinas es igual, tomando en cuenta la experiencia de
los operadores a un nivel de significancia del 5%.

Experiencia Mquinas
de ops. En Maq
aos 1 Maq 2 Maq 3 Promedios
1 27 21 25 24.33333
2 31 33 35 33
3 42 39 39 40

Pgina 26 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

4 38 41 37 38.66667
5 45 46 45 45.33333
Promedios 36.6 36 36.2 36.26667

TABLA ANOVA
SS GL CM Fc Falfa
SCTR 0.93333 CMTR 0.46666 Ftr =
= 3 2 = 7 0.09 4.46
SCBL 764.933 CMBL 191.233 Fbl =
= 3 4 = 3 37.25 3.84
41.0666 5.13333
SCE = 7 8 CME= 3
806.933
SCT = 3 14 CMT= 57.6381

Conclusin: No hay diferencia entre mquinas a pesar de la diferencia


en experiencia de los operadores.

Ejemplo 2 (Problema 4.1 del Texto de Montgomery, Anlisis y


diseo de experimentos)

Un qumico quiere probar el efecto de 4 agentes qumicos sobre la


resistencia de un tipo particular de tela. Debido a que podra haber
variabilidad de un rollo de tela a otro, el qumico decide usar un
diseo de bloques aleatorizados, con los rollos de tela considerados
como bloques. Selecciona 5 rollos y aplica los 4 agentes qumicos de
manera aleatoria a cada rollo. A continuacin se presentan las
resistencias a la tencin resultantes. Analizar los datos de este
experimento (utilizar =0.05) y sacar las conclusiones apropiadas.
Rollo
Agente Qumico 1 2 3 4 5
1 73 68 74 71 67
2 73 67 75 72 70
3 75 68 78 73 68
4 73 71 75 75 69

3.3 Procedimiento en Excel


En el men herramientas seleccione la opcin Anlisis de datos,
en funciones para anlisis seleccione Anlisis de varianza de
dos factores con una sola muestra por grupo.
En Rango de entrada seleccionar la matriz de datos.
Alfa = 0.05

Pgina 27 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

En Rango de salida indicar la celda donde se iniciar la


presentacin de resultados.

Anlisis de varianza de dos factores con una sola


muestra por grupo
Cuent Promedi Varian
RESUMEN a Suma o za
Fila 1 5 353 70.6 9.3
Fila 2 5 357 71.4 9.3
Fila 3 5 362 72.4 19.3
Fila 4 5 363 72.6 6.8

Columna
1 4 294 73.5 1
Columna
2 4 274 68.5 3
Columna
3 4 302 75.5 3
Columna
4 4 291 72.75 2.92
Columna
5 4 274 68.5 1.67

ANLISIS DE VARIANZA
F
Fuente Suma Grados Cuadrad Probabilid tabla
de de de os Fc ad s
variaci Cuadrad liberta
n os d medios Valor P
Filas 12.95 3 4.32 2.38 0.12 3.49
Column
as 157 4 39.25 21.61 2.06E-05 3.26
Error 21.8 12 1.82
Total 191.75 19
Total 231 24

En la tabla observamos que el estadstico de prueba Fc es menor al


valor crtico para F 2.38<3.49, por lo cual no rechazamos al Hiptesis
nula H0. No tenemos evidencia estadstica para afirmar que el agente
qumico tenga influencia en la respuesta.

Sin embargo observamos que el rollo si tiene influenza significativa en


la respuesta (P<0.05).

Pgina 28 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

3.4 ANOVA en Minitab

Utilice 0.05 para calcular si hay diferencias entre los efectos de las
columnas y los renglones.
Introducir los datos arreglados con las respuestas en una sola
columna e indicando a que rengln y columna pertenece cada uno de
estos, como sigue:

Colum
Resp na Fila
73 1 1
73 1 2
75 1 3
73 1 4
68 2 1
67 2 2
68 2 3
71 2 4
74 3 1
75 3 2
78 3 3
75 3 4
71 4 1
72 4 2
73 4 3
75 4 4
67 5 1
70 5 2
68 5 3
69 5 4

Instrucciones:

Stat > ANOVA > One two Way


Response Respuesta, indicar Row factor y Column Factor,
Seleccionar ! Display Means
Seleccionar ! Store Residuals ! Store Fits Confidence
level 95%

Graphs
Seleccionar Normal plot of residuals
OK
Resultados:

Pgina 29 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

La grfica normal de residuos debe mostrar los residuos aproximados


por una recta para validar el modelo:

Los residuos se aproximan a la distribucin normal por lo cual se


concluye que se est utilizando un modelo vlido.

Normal Probability Plot of the Residuals


(response is Resp)
99

95

90

80
70
Percent

60
50
40
30
20

10

1
-3 -2 -1 0 1 2 3
Residual

Two-way ANOVA: Resistencia versus Agente Qumico, Rollo

Source DF SS MS F P
Agente Qumico 3 12.95 4.3167 2.38 0.121
Rollo 4 157.00 39.2500 21.61 0.000
Error 12 21.80 1.8167
Total 19 191.75

S = 1.348 R-Sq = 88.63% R-Sq(adj) = 82.00%

Como el valor de P es menor a 0.05 el Rollo tiene


influencia significativa en la resistencia.

Individual 95% CIs For Mean Based on


Agente Pooled StDev
Qumico Mean ---+---------+---------+---------+------
1 70.6 (----------*----------)
2 71.4 (----------*----------)
3 72.4 (----------*----------)
4 72.6 (----------*----------)
---+---------+---------+---------+------
69.6 70.8 72.0 73.2

Pgina 30 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Individual 95% CIs For Mean Based on


Pooled StDev
Rollo Mean --+---------+---------+---------+-------
1 73.50 (-----*-----)
2 68.50 (-----*-----)
3 75.50 (-----*-----)
4 72.75 (-----*-----)
5 68.50 (-----*-----)
--+---------+---------+---------+-------
67.5 70.0 72.5 75.0

Se seleccionaran en 2 y 5 rollo ya que tienen los valores ms


pequeos.

Pgina 31 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

4. DISEOS FACTORIALES

4.1 Principios y definiciones bsicas

M
uchos experimentos se llevan a cabo para estudiar los
efectos producidos por dos o ms factores. Puede
mostrarse que en general los diseos factoriales son los
ms eficientes para este tipo de experimentos. Por diseo factorial se
entiende aquel en el que se investigan todas las posibles
combinaciones de los niveles de los factores en cada ensayo
completo o rplica del experimento. Por ejemplo, si existen a
niveles del factor A y b niveles del factor B, entonces cada rplica
del experimento contiene todas las ab combinaciones de los
tratamientos. A menudo, se dice que los factores estn cruzados
cuando stos se arreglan en un diseo factorial.

El efecto de un factor se define como el cambio en la respuesta


producida por un cambio en el nivel del factor. Con frecuencia, ste se
conoce como efecto principal porque se refiere a los factores de
inters primordial del experimento. Por ejemplo, consideremos los
datos de la tabla 1. El efecto principal del factor A podra interpretarse
como la diferencia entre la respuesta promedio en el primer y
segundo nivel de ese factor. Numricamente:

Factor B
B1 B2

A1 20 30

Factor A

A2 40 52

Tabla 1 Un experimento factorial

40 52 20 30
A 21
2 2

En otras palabras incrementar el factor A del nivel 1 al 2 produce un


cambio en la respuesta promedio de 21 unidades. Similarmente, el
efecto principal de B es:

Pgina 32 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

30 52 20 40
B 11
2 2
Si los factores tienen ms de dos niveles, el procedimiento anterior
debe ser modificado ya que las diferencias entre las respuestas
promedio pueden expresarse de muchas formas.

En algunos experimentos puede encontrarse que la diferencia en la


respuesta entre los niveles de un factor no es la misma en todos los
niveles de los otros factores. Cuando esto ocurre existe una
interaccin entre los factores. Por ejemplo, considrense los datos de
la Tabla 2.

Factor B
B1 B2

A1 20 40

Factor A

A2 50 12

Tabla 2. Un experimento factorial con interaccin

En el primer nivel del factor B, el efecto de A es:


A = 50 - 20 = 30
Mientras que en el segundo nivel de B, el efecto de A es:
A = 12 - 40 = 28

Puede observarse que existe una interaccin entre los factores A y B


porque el efecto de A depende del nivel elegido de B.

Estas ideas pueden ilustrarse grficamente. En la Fig. 1 se muestra


una grfica de la respuesta de los datos de la Tabla 1 contra los
niveles del factor A para ambos niveles del factor B. Se observa que
las rectas B1 y B2 son, aproximadamente, paralelas. Esto indica que no
hay interaccin entre los factores. De manera similar, en la Fig. 2 se
presenta una grfica de la respuesta de los datos de la Tabla 2.

60
B2
50
B1
40
30 B2
20
B1
10

A1 A2
Factor A

Pgina 33 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Figura 1 Un experimento factorial sin interacciones

En este caso se ve que las rectas B1 y B2 no son paralelas. Esto


muestra que existe una interaccin entre A y B. Sin embargo, no debe
ser la nica tcnica para analizar los datos, porque su interpretacin
es subjetiva y su apariencia, a menudo, es engaosa.

60 B1
50
B2
40
30
20
B1
10 B2

A1 A2
Factor A
Figura 2 Un experimento factorial con interacciones

Hay que notar que cuando una interaccin es grande los


correspondientes efectos principales tienen poco significado prctico.
Una estimacin del efecto principal de A de los datos de la Tabla 2 es:

50 12 20 40
A 1
2 2
El cual resulta ser muy pequeo corrindose el riesgo de concluir que
no existe un efecto debido a A. Sin embargo, cuando se examin el
efecto de A en niveles diferentes de B se concluy que ste no era el
caso. El factor A tiene un efecto, pero depende del nivel del factor B.
En otras palabras, es ms til conocer la interaccin AB que el efecto
principal. Una interaccin significativa oculta a menudo el significado
de los efectos principales.

Ventajas de los diseos factoriales

L
as ventajas de los diseos factoriales pueden ilustrarse
fcilmente. Supongamos que se tienen dos factores, A y B, cada
uno con dos niveles. Estos niveles se representan mediante A 1,
A2, B1 y B1. La informacin acerca de ambos factores puede obtenerse
variando un factor a la vez como aparece en la tabla 3. El efecto de
variar el factor A est dada por A 2B1 -A1B2. A causa de que existe error
experimental, es conveniente realizar, por ejemplo, dos

Pgina 34 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

observaciones de cada combinacin de tratamientos y hacer una


estimacin de los efectos de los factores usando las respuestas
promedio. Por lo tanto, se requiere un total de seis observaciones.

Pgina 35 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Factor B
B1 B2

A1 A1B1 A1B2

Factor A

A2 A2B1 12

Tabla 3 El mtodo de un factor a la vez

Los diseos factoriales poseen algunas ventajas.

Son ms eficientes que los experimentos de un factor a la vez.

Los diseos factoriales son necesarios cuando alguna


interaccin puede estar presente, para evitar hacer
conclusiones engaosas.

Los diseos factoriales permiten estimar los efectos de un


factor en diversos niveles de los otros factores, produciendo
conclusiones que son vlidas sobre toda la extensin de las
condiciones experimentales.

4.2 Diseo factorial de dos niveles (2^K)

E
l primer diseo de la serie 2 2 es aquel en el que solo dos
factores, A y B, cada uno con dos niveles. Este diseo se
conoce como diseo factorial 22. Arbitrariamente, los niveles
del factor pueden llamarse bajo y alto.

Ejemplo 1 Considrese una investigacin llevada a cabo para


estudiar el efecto que tiene la concentracin de un reactivo y la
presencia de un catalizador sobre el tiempo de reaccin de un
proceso qumico. Sea la concentracin del reactivo el factor A con dos
niveles de inters, 15% y 20%. El catalizador constituye el factor B; el
nivel alto o superior denota el uso de dos sacos de catalizador y el
nivel bajo o inferior denota el uso de un solo saco. El experimento se
realiza (replica o repite) tres veces, y los datos son como sigue:

Combinacin de Replica
tratamientos I II III Total
A baja, B baja 28 25 27 80
A alta, B baja 36 32 32 100
A baja, B alta 18 19 23 60
A alta, B alta 31 30 29 90
Pgina 36 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

En la figura 3 siguiente se presentan grficamente las combinaciones


de tratamiento para este diseo, el efecto de un factor se denota por
la letra latina minscula. De este modo, A se refiere al efecto del
factor A, y B se refiere al efecto del factor B, y AB se refiere a
la interaccin entre AB. En el diseo 2 2 los niveles bajo y alto de A y B
se denotan por - y + respectivamente, en los ejes A y B. As en
el eje B representa el nivel bajo de catalizador mientras que + denota
el nivel alto.

b = 60(18+19+23) ab = 90(31+30+19)
Alto (2 sacos) +

bajo (1 saco) -
(1) = 80(28+25+27) a = 100(36+32+32)

- +
bajo (15%) alto (20%)
Concentracion de reactivo A
Fig.
Figura 1: Combinaciones de tratamiento en el diseo factoriall
3

Las cuatro combinaciones de tratamientos en el diseo pueden


representarse por letras minsculas, cono se muestra en la figura 3.
En esta figura se aprecia que el nivel superior de cualquier factor de
una combinacin de tratamientos est representado por la presencia
de la letra minscula correspondiente, mientras que la ausencia de
esta ultima representa el nivel inferior del factor.

As

a representa la combinacin de tratamientos, en la que A se


encuentra en el nivel superior y B en el nivel inferior;

b representa aquella en la que A se halla en el nivel inferior y


B en el superior, y

ab representa a ambos factores en el nivel superior.

Por convencin (1) se usa para representar a ambos factores en


el nivel inferior.

Pgina 37 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

El efecto promedio de un factor se define como el cambio en la


respuesta producida por un cambio en el nivel de ese factor,
promediado sobre los niveles del otro factor.

Como se ilustra en la figura 3, las letras minsculas (1), a, b y ab


tambin se usan para representar los totales de las n replicas de las
combinaciones de tratamientos correspondientes. Ahora bien, el
efecto de A en el nivel B es {a-(1)}/n. Mientras que el nivel superior B
es {ab-b}/n. Tomando el promedio de estas dos cantidades se
obtiene:

1
A ab b a (1) 1 ab a b (1)
2n 2n

El efecto promedio de B se determina a partir de su efecto en el nivel


inferior de A (esto es, {b-(1)}/n, y de su efecto en el nivel superior de
A (que es igual a [ab-a]/n obtenindose:

B
1
ab a b (1) 1
ab b - a (1)
2n 2n

El efecto de la interaccin AB se define como la diferencia promedio


entre el efecto de A en el nivel superior de B y su efecto en el nivel
inferior de B, as:

AB
1
ab b a (1) 1
ab (1) a (b)
2n 2n

Por otro lado se puede definir AB como la diferencia promedio entre el


efecto de B en el nivel superior de A y el efecto de B en el nivel
inferior de A.

Las formulas para los efectos de A, B y AB pueden deducirse por otro


mtodo. El efecto de A puede hallarse como la diferencia en la
respuesta promedio de las dos combinaciones de tratamiento en la
mitad derecha (que llamaremos Y A+, puesto que es la respuesta
promedio para las combinaciones de tratamientos a las que A que se
encuentra en el nivel alto) y las dos combinaciones de tratamientos
en la mitad izquierda (o Y A). Esto es,

Pgina 38 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

A YA YA
ab a b (1)

2n 2n


1
ab a b (1)
2n

Este es exactamente el mismo resultado, el efecto de B se encuentra


como la diferencia entre el promedio de las dos combinaciones de
tratamientos en la parte superior del cuadrado ( Y B+) y el promedio de
las dos combinaciones de tratamientos en la parte inferior ( Y B-), o

B YB YB
ab b a (1)

2n 2n


1
ab b a (1)
2n

Finalmente el efecto de interaccin AB es el promedio de las


combinaciones de tratamientos en la diagonal de derecha a izquierda
del cuadrado ab y (1) menos el promedio de las combinaciones de
tratamientos en la diagonal de izquierda a derecha (a y b), o

ab (1) ab
AB
2n 2n


1
ab (1) a b
2n

Pgina 39 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Con los datos que aparecen en la figura 1, las estimaciones de los


efectos promedio son:

A
1
90 100 60 80 8.33
2(3)

B
1
90 60 100 80 5.00
2(3)

90 80 100 60 1.67
1
AB
2(3)

El efecto de A (concentracin de reactivo) es positivo; esto sugiere


que al elevar A del nivel bajo (15%) al nivel alto (25%) incrementar
el rendimiento. El efecto de B (catalizador) es negativo; esto sugiere
que elevar la cantidad del catalizador agregada al proceso reducir el
rendimiento. Al parecer, el efecto de interacciones es pequeo
comparado con los dos efectos principales.

En muchos experimentos que implican diseos 2 K se examina la


magnitud y la direccin de los efectos de los factores para determinar
cuales variables es probable que sean importantes. Por lo general
puede emplearse el anlisis de varianza para confirmar esta
interpretacin. En el diseo 2k existen algunos mtodos rpidos
especiales para realizar los clculos del anlisis de varianza.

Consideremos la suma de cuadrados para A, B y AB. Obsrvese la


primera ecuacin que se utiliza un contraste para estimar A; esto es,

ContrasteA ab a b (1)

Este contraste suele llamarse efecto total de A. A partir de la


segunda y tercera ecuacin, puede apreciarse que tambin se utilizan
contraste para estimar B y AB. Adems, estos tres contrastes son
ortogonales. La suma de cuadrados de cualquiera de ellos puede
calcularse usando la siguiente ecuacin:

SSc 1
aciyi. 2 n a
a ci
2
.

Pgina 40 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Esta ecuacin establece que la suma de cuadrados de contraste es


igual al contraste elevado al cuadrado entre el producto del nmero
de las observaciones de cada total del contraste por la suma de
cuadrados de los coeficientes del mismo. En consecuencia, se obtiene
que las sumas de cuadrados de A, B y AB sean:

SSA
ab a b (1)
2

n*4

SSB
ab b a (1)
2

n*4

SSAB
ab (1) a b
2

n*4

Con los datos de la figura 3, las sumas de cuadrados se pueden


calcular aplicando las ecuaciones anteriores, obtenindose:

2
50
SSA 208.33
4(3)
2
30
SSB 75.00
4(3)
2
10
SSAB 8.33
4(3)

La suma total de cuadrados se determina de la manera usual


mediante:

2
2 Y ...
SST i21 2j1 n
k 1 Y ijk
4n

En general SST tiene 4n 1 grados de libertad. La suma de cuadrados


del error, con 4(n-1) G.L. se puede calcular en la forma usual, por
diferencia, mediante.

Pgina 41 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

2
2 2 3 2 Y
SS E Yijk 9398.00 9075.00 323.00
i1j1k 1 4(3)

SS E SS T SS A SS B SS AB

323.00 208.33 75.00 8.33 31.34

El anlisis de varianza completo se presenta en la tabla siguiente.


Ambos efectos principales son significativos al 1%.

A menudo se es conveniente escribir las combinaciones de


tratamientos en el orden (1), a, b, y ab. Este orden se conoce como
orden estndar. Cuando se utiliza es posible apreciar que los
coeficientes de los contrastes usados para estimar los efectos son

Efectos (1) a b Ab
A: -1 +1 -1 +1
B: -1 -1 +1 +1
AB: +1 -1 -1 +1

Tabla ANOVA para los datos del ejemplo 1 es la siguiente:

Fuente de
variacin SS G.L. MS Fo
A 208.33 1 208.33 53.15a
B 75.00 1 75.00 19.13a
AB 8.33 1 8.33 2.13
Error 31.34 8 3.92
Total 323.00 11
a
significativo al 1%

Signos algebraicos para calcular los efectos en un diseo 22

Combinacin Efecto Factorial


De
Tratamientos I A B AB

(1) + - - +
a + + - -
b + - + -
ab + + + +

Pgina 42 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Observe que los coeficientes de los contrastes usados para estimar la


interaccin son iguales al producto de los coeficientes
correspondientes a los dos efectos principales. Los coeficientes de los
contrastes siempre son +1 o 1 y se puede usar una tabla de signos
positivos y negativos como la mostrada en la de signos algebraicos
para determinar el signo apropiado de cada combinacin de
tratamientos. En el encabezado de las columnas de tabla y se
encuentran los efectos principales (A y B), la interaccin AB, e I, que
representa el total el total o el promedio de todo el experimento. Se
observa que la columna encabezada por I se compone de solo de
signos positivos. Los renglones corresponden a las combinaciones de
tratamientos.

Para encontrar un contraste con el fin de estimar cualquier efecto,


simplemente se multiplican los signos de la columna apropiada de la
tabla por la correspondiente combinacin de tratamientos, y se suma.
Por ejemplo, el contraste para estimar A es (1) + a b + ab, lo cual
concuerda con la ecuacin.

A
1
ab b a (1) 1
ab a b (1)
2n 2n

Los tipos ms sencillos de diseos factoriales implican slo dos


factores o conjuntos de tratamientos. Haya a niveles del factor A y
b niveles del factor B, dispuestos en un diseo factorial; esto es,
cada A repeticin o rplica del experimento contiene todas las
combinaciones de tratamiento ab. En general, hay n repeticiones.

Pgina 43 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

5. DISEOS DE EXPERIMENTOS FRACCIONALES DE


DOS NIVELES

5.1 Concepto de replicacin fraccionada

Conforme el nmero de factores del experimento crece, el nmero de


casillas o condiciones experimentales (y por lo tanto el nmero de
lecturas o pruebas necesarias), crece exponencialmente en un
experimento factorial. El nmero de efectos a evaluar (interacciones
principalmente) crece exponencialmente tambin. El nmero de
efectos y casillas vara con el nmero de factores en una relacin
como se muestra en la tabla siguiente para un experimento factorial
2k.

As por ejemplo cuando se tienen siete factores, existen 128 posibles


condiciones experimentales, lo que implica que al hacer una
replicacin por celda de todo el experimento requiere un total de 128
observaciones. Si se decide tomar dos replicas por celda, entonces
serian necesarias 256 observaciones, lo cual es una cantidad excesiva
de pruebas para fines prcticos.

Por otro lado, se necesitan 128 observaciones para un experimento


con 7 factores por que se deben evaluar 127 posibles efectos (que
son los grados de libertad totales en 128 observaciones) de estos
efectos 7 son los factores principales, 21 interacciones de 2 factores,
35 de tres, 35 de cuatro, 27 de cinco en cinco, 7 de seis en seis y una
interaccin de 7 factores. En general el nmero de interacciones de k
factores tomados r en r es:

K!
r! (k r)!
Pgina 44 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

El concepto de replicacin fraccionada parte de las siguientes


hiptesis:

1. Las interacciones de tres o ms factores son sumamente raras


en la prctica, por lo que en general se pueden suponer como
no existentes.

2. En un experimento de varios factores lo ms probable es que


solo algunos de ellos sean relevantes para la variable de
respuesta.

3. La mayor parte del efecto se debe a los factores principales y


algunas interacciones de dos factores.

Lo anterior implica que por ejemplo para siete factores son necesarios
probablemente solo 28 grados de libertad (7 factores principales y 21
interacciones de dos factores), y esto equivale a solo 29 unidades de
informacin y no 128 como en el experimento original. Esto quiere
decir que no es necesario el correr una replicacin completa de todo
el experimento cuando el nmero de factores crece, sino solamente
algunas casillas o condiciones experimentales.

Cuando solamente una parte de las posibles casillas se prueban, se


dice que se tiene una replicacin fraccionada del experimento.
Las preguntas que surgen son:

1. Cuntas y cuales casillas probar?


2. Cmo analizar los resultados?
3. Qu informacin se pierde?

El responder a estas preguntas es uno de los objetivos de la


replicacin fraccionaria.

5.2 Fraccin un medio del diseo 2k

C
onsidrese el caso en el que se estudian tres factores de dos
niveles cada uno, pero en el que los experimentadores no
pueden costear las 23 = 8 combinaciones de tratamientos, sin
embargo, si se puede costear 4 observaciones. Esto sugiere una
fraccin un medio, de un diseo 2 3. la fraccin un medio del diseo 2 3
se conoce tambin como un diseo 2 3-1 porque tiene 23-1 = 4
combinaciones de tratamiento.

Pgina 45 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

En la tabla 1 aparecen signos positivos y negativos del diseo 2 3.


Supngase que para componer la fraccin un medio, se seleccionan
las combinaciones de tratamientos se usa indistintamente la notacin
convencional (a,b,c,...) y la de signos positivos y negativos. La
equivalencia de las dos notaciones se muestra a continuacin.

Pgina 46 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Notacin 1 Notacin 2
a + - -
b - + -
c - - +
abc + + +

Combinacin de Efecto factorial


Tratamientos
I A B C AB AC BC ABC
a + + - - - - + +
b + - + - - + - +
c + - - + + - - +
abc + + + + + + + +
ab + + + - + - - -
ac + + - + - + - -
bc + - + + - - + -
(1) + - - - + + + -

Tabla 1 Signos positivos para el diseo 23

Ntese que el diseo 23-1 se forma al seleccionar solo las


combinaciones de tratamientos que producen un signo positivo sobre
la columna ABC. Por esto ABC se denomina generador de una fraccin
particular. Adems, la columna identidad I siempre es positiva, por lo
cual:
I = ABC

Se denominara relacin definitoria de nuestro diseo, en general, la


relacin definitoria de un factorial fraccionario siempre es el conjunto
de todas las columnas que son iguales a la columna identidad I.
abc bc

c ac

b ab
C
B
A
a (1 )

(a) Fraccin principal I = ABC (b) Fraccin alterna I = -ABC

Las combinaciones de tratamientos del diseo 2 3-1 producen 3 G.L.


que pueden usase para estimar los efectos principales. En la tabla 1

Pgina 47 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

se muestra que las combinaciones lineales de las observaciones que


se utilizan para estimar los efectos principales A, B, y C son:

LA 1/2(a b c abc)
LB 1/2( a b c abc)
LC 1/2( a b c abc)
LBC 1/2(a b c abc)
LAC 1/2( a b c abc)
LAB 1/2( a b c abc)

Por lo tanto LA = LBC, LB = LAC y LC = LAB. En consecuencia, es


imposible distinguir entre A y BC, entre B y AC y entre C y AB. De
hecho, es posible mostrar que cuando se estima A, B y C, en realidad,
lo que s esta haciendo es estimar A + BC, CB + AC y C + AB,
respectivamente. Dos o ms efectos que tienen esta propiedad se
conoce como alias. En este ejemplo, A y BC, B y AC y C y AB son
alias. Esto se indica empleando la notacin:

LA A BC,
LB B AC
LC C AB

La estructura de los alias de este diseo pueden determinarse


fcilmente con la relacin I = ABC, multiplicando cualquier efecto por
la relacin que define al diseo, modulo 2, da como resultado los alias
de dicho efecto. En el ejemplo anterior, los alias son:

A*I = A*ABC = A2BC

O dado que el cuadrado de cualquier columna es simplemente la


identidad I.

A = BC

De modo similar, se encuentra que los alias de B y C son:

B*I = B*ABC = AB2C = AC


C*I = C*ABC = ABC2 = AB

Pgina 48 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Esta fraccin un medio o semifraccin, con I = +ABC, suele llamarse


fraccin principal.

Ahora supngase que se eligi la otra mitad de la rplica. Esta se


compone de las combinaciones de tratamientos de la tabla 1 que
tiene signo negativo asociado con ABC. Esta fraccin un medio o
alterna que consta de las siguientes corridas:

Notacin 1 Notacin 2
(1) ---
ab ++-
ac +-+
abc -++

La relacin definitoria de este diseo es:


I = -ABC

Usando la fraccin alterna, las combinaciones lineales de las


observaciones, LA, LB y LC, son:

L' A A BC
L' B B AC
L' C C AB

Por lo tanto, en realidad se est estimando A BC, B AC y C AB al


estimar A, B y C con esta fraccin. En la prctica, no importa cual de
las dos fracciones se utilice. Generalmente la fraccin asociada con I
= +ABC se denomina fraccin principal. Ambas fracciones pertenecen
a la misma familia; en otras palabras, estas dos fracciones forman el
diseo 23 completo.

5.3 Resolucin del diseo

E
l diseo anterior 23-1 se conoce como diseo de resolucin III. En
tal diseo los alias de los efectos principales son interacciones
de dos factores. Un diseo es resolucin R si ningn efecto de p
factores es alias de otro efecto que tenga menos R p factores.
Usualmente, se emplea el numeral romano como subndice para
indicar la resolucin del diseo. As, la fraccin un medio del diseo 2 3

Pgina 49 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

definido por la relacin I = ABC (o bien I = - ABC) constituye un diseo


3 1
2III
.

Los diseos de resolucin III, IV y V son de importancia primordial. A


continuacin, se presenta la definicin de estos diseos junto con un
ejemplo.

1. Diseo con resolucin III: stos son diseos en los que ningn
efecto principal es alias de otro, pero si lo son de las
interacciones de dos factores; a su vez, estas ltimas son alias
entre s. El diseo 23-1 de la tabla 4.1 es de resolucin III.

2. Diseo con resolucin IV: En estos diseo ningn efecto principal


es alias de otro efecto principal, o bien, de alguna interaccin de
dos factores. Las interacciones de dos factores son alias entre
4 1
s. Un diseo 24-1 con I = ABCD es de resolucin IV ( 2IV ).

3. Diseos resolucin V: Estos son diseos en los que ningn efecto


principal o interaccin de dos factores es alias de ningn efecto
principal o interacciones entre dos factores, un diseo 2 5-1 con I =
5 1
ABCDE es de resolucin V ( 2 V ).

En general, la resolucin de un diseo factorial fraccionario de dos


niveles es igual al mnimo nmero de letras de cualquier palabra de la
relacin que define al diseo. En consecuencia, los diseos anteriores,
a menudo, se conocen como diseos de 3, 4 y 5 letras,
respectivamente. Por lo general se deben usar diseos fraccionarios
con la mayor resolucin posible congruentes con el fraccionamiento
requerido. A mayor resolucin, las suposiciones relativas a las
interacciones que deben despreciarse con el propsito de hacer una
interpretacin nica de los datos son menos restrictivas.

Pgina 50 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

6. DISEOS DE EXPERIMENTOS FACTORIALES


COMPLETOS

6.1 Diseo factorial completo de 2 factores

Un ingeniero decide probar los tres materiales de la cubierta, nico


factor controlable a tres niveles de temperatura (15, 70 y 125 F)
consistentes en el entorno de uso final del producto. Se prueban
cuatro bateras a cada combinacin de material de la cubierta y
temperatura, y las 36 pruebas se ejecutan al azar.

En la tabla 1 se presentan el experimento y los datos resultantes de


duracin observada de las bateras.

En este problema, el ingeniero desea contestar las siguientes


preguntas:

1. Qu efecto tienen el tipo de material y la temperatura sobre la


duracin de la batera?
2. Existe una eleccin del material que d por resultado una
duracin uniformemente larga sin importar la temperatura?

Temperatura F
Tipo de material 15 70 125
1 130 155 34 40 20 70
74 180 80 75 82 58
3 150 188 126 122 25 70
159 126 106 115 58 45
3 138 110 174 120 96 104
168 160 150 139 82 60

Tabla 1. Duracin en horas para el ejemplo del diseo de una batera

Esta ltima pregunta reviste particular importancia. Existe la


posibilidad de hallar un material que no sea muy afectado por la
temperatura. De ser as, el ingeniero puede hacer que la batera sea
robusta a la variacin de temperatura en el campo. ste es un
ejemplo del uso del diseo experimental estadstico para el diseo de
un producto robusto (o consistente), un importante problema de
ingeniera.

Pgina 51 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Este diseo es un ejemplo especfico del caso general de un diseo


con dos factores (bifactorial). Para pasar al caso general, sea Yijk la
respuesta observada cuando el factor A se encuentra en el i-simo
nivel (i -1, 2,..., n). En general, los datos observados se vern como en
la tabla 2. El orden en el cual se toman las abn observaciones es
aleatorio, de modo que ste es un diseo completamente
aleatorizado.

Tabla 2. Disposicin general para un diseo bifactorial

Las observaciones pueden describirse mediante el modelo estadstico


lineal:

i 1,2,..., a


Yijk i j ij ijk j 1,2,..., b

k 1,2,..., n

En donde es el efecto medio general, i es el efecto del i-simo nivel


del factor rengln A, j es el efecto del j-simo nivel del factor
columna B, ()ij es el efecto de la interaccin entre i y j, ijk es el
componente del error aleatorio. Inicialmente se supone que ambos
factores son fijos y que los efectos de tratamiento se definen como
ia1 i 0; bj1j 0
desviaciones de la media general, por lo tanto. Se
supone que los efectos de interaccin son fijos y que se definen d

manera que: i1
a ij 0 . Hay un total de abn observaciones porque
se realizan n rplicas.

Pgina 52 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

En un diseo factorial de dos factores, tanto los factores (o


tratamientos) de rengln como de columna tienen la misma
importancia, especficamente el inters consiste en probar hiptesis
acerca de la igualdad de los efectos de tratamiento de rengln, es
decir:

Ho : 1 2 ...a 0

H1 : al menos una i 0

Y de la igualdad de los efectos de tratamiento de columna:

Ho : 1 2 ...b 0
H1 : al menos una j 0

Tambin es interesante determinar s los tratamientos de rengln y


columna interaccionan. En otras palabras, resulta conveniente
probar:

Ho : ()i 0 para toda i, j

H1 : al menos una ()i 0


A continuacin, se muestra cmo pueden probarse estas hiptesis
usando un anlisis de variancia bifactorial o bidireccional (de dos
factores o en dos sentidos).

6.2 Anlisis Estadstico del Modelo de Efectos Fijos

S
ea Yi..; el total de las observaciones bajo el i-simo nivel del
factor A; Y.j. El total de las observaciones bajo el j-simo nivel
del factor B, Yij. El total de las observaciones de la ij-sima
celda, e Y... el total general de todas las observaciones. Se definen

Yi..; Y.j. y Yij. y Y... como los promedios de rengln, columna, celda y
general, respectivamente, matemticamente:

Pgina 53 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

b n Yi..
Yi.. Yijk Yi.. ; i 1,2,..., a
j1k 1 bn
a n Y.j.
Y.j. Yijk Y.j. ; j 1,2,..., b
i1k 1 an

n Y... i 1,2,..., a
Yij. Yijk Yij. ;
k 1 n j 1,2,...,b

a b n Y...
Y... Yijk Y...
i1j1k 1 abn

La suma total de cuadrados corregida puede expresarse mediante:

n

b Yijk Y...
k 1
2

j1
a

i1
a b n


Yi.. Y... Y.j. Y... Yij. Y... Y.j Y...

2

i1j1 k 1

Yijk Yij.
a b n

Yijk Y...
i1j1 k 1
2


a 2 b 2 a b 2
bn Yi.. Y... an Y.j. Y... n Yij. Yi.. Y.j. Y...
i1 j1 i1j1
a b n

Yijk - Yij.
i1j1 k 1
2

Dado que los seis productos cruzados del segundo miembro de la
ecuacin anterior son iguales a cero. Se observa que la suma total de
cuadrados se ha descompuesto en una suma de cuadrados debida a
los renglones o al factor A (SSA) en una suma de cuadrados
debida a las "columnas" o al factor B (SSB), en una suma de
cuadrados debida a la interaccin entre A y B (SSAB), y en una suma
de cuadrados debida al error (SS E): Analizando el ltimo trmino del
miembro derecho de la Ecuacin anterior es posible observar que es

Pgina 54 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

necesario tener al menos dos rplicas (n 2) para poder obtenerla


suma de cuadrados del error.

Simblicamente, la Ecuacin anterior puede expresarse mediante:

SST SSA SSB SSAB SSE

Los grados de libertad asociados a cada suma de cuadrados son:

Efecto Grados de libertad


A a-1
B b-1
Interaccin AB (a-1)(b-1)
Error ab(n-1)
Total abn-1

Esta descomposicin del total de abn -1 grados de libertad para las


sumas de cuadrados se puede justificar como sigue: Los efectos
principales de A y B tienen a y b niveles, respectivamente, por lo
tanto, tienen a -1 y b -1 grados de libertad como se muestra.

Los grados de libertad de la interaccin simplemente corresponden a


los grados de libertad de cada celda (los cuales son iguales a ab -1)
menos los grados de libertad de los dos efectos principales A y B en
otras palabras, ab -1 -(a -1) -(b -1) -(a- 1)(b -1). Dentro de cada una de
las ab celdas hay n -1 grados de libertad entre las n rplicas, por lo
tanto, hay ab(n -1) grados de libertad del error.

Se observa que la suma de los grados de libertad de los trminos del


miembro derecho de la ecuacin anterior es igual al total de los
grados de libertad.

Cada suma de cuadrados dividida entre sus grados de libertad


produce una media de cuadrados.

Por lo tanto, para probar el significado de ambos efectos principales,


as como de su interaccin, simplemente deben dividirse las medias
de cuadrados correspondientes entre la media de cuadrados del error.
Valores grandes de estas razones implican que los datos no
concuerdan con las hiptesis nulas.

Si se considera que el modelo estadstico es adecuado y que los


trminos del error ijk son independientes con distribuciones normales

Pgina 55 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

con variancia constante 2, entonces las razones de las medias de


cuadrados MSA/MSE, MSB/MSE y MSAB/MSE tienen distribucin F con a
-1, b- 1 y (a -1)(b -1) grados de libertad en el numerador,
respectivamente, y ab(n -1) grados de libertad en el denominador. Las
regiones crticas corresponden al extremo superior de la distribucin
F. Usualmente la prueba se presenta en una tabla de anlisis de
variancia como la que aparece en la tabla 2.

Fuente de
Variacin SS G.L. MS Fo
Tratamientos A SSA a-1 MSA MSA
SSA MSE
a 1
Tratamientos B SSB b-1 MSB MSB
SSB MSE
b 1
Interaccin SSAB (a - 1)(b - MSAB MSAB
1)
SSAB MSE

(a 1)(b 1)
Error SSE ab(n-1) MSB
SSE
ab(n 1)
Total SST abn - 1

Tabla 2 ANOVA para el modelo bifactorial de efectos fijos

Es posible obtener las frmulas para calcular las sumas de cuadrados


de la ecuacin anterior. La suma total de cuadrados se calcula en
forma usual mediante:
2
a b n 2 Y ...
SST Y ijk
i1j1k 1 abn

Las sumas de cuadrados para los efectos principales son:

Pgina 56 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

2 2
a Y i.. Y ...
SSA
i1 bn abn
2 2
b Y .j. Y ...
SSB
j1 an abn

Es conveniente obtener SSAB en dos etapas. Primero se calcula la


suma de cuadrados entre los totales de las ab celdas, conocida como
la suma de cuadrados debido a los "subtotales":

2 2
a b Y ij. Y ...
SSsubtotales
i1j1 n abn

Esta suma de cuadrados contiene a la SS A y SSB. Por lo tanto, la


segunda etapa consiste en calcular SSAB mediante:

SSAB SSsubtotales SSA SSB

La SSE se calcula por diferencia:

SSE SST SSAB SSA SSB


o bien :

SSE SST SSSubtotales

Ejemplo: Ms sobre el experimento de diseo de una batera. En la


tabla 3 se presenta la duracin efectiva (en horas) observada en el
ejemplo de diseo de una batera descrito en la anterior Los totales
de rengln y de columna se indican en los mrgenes de la tabla; los
nmeros subrayados son los totales de celda.

Temperatura (F)

Pgina 57 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Ti
p 15 70 125 Yi.
o .
d
e
M
at
.
1 1 1 3 4 2 7
3 5 4 0 0 0
0 5 539 4 2 2
99
2 3
7 1 134.75 8 7 9 8 5 0 8
4 8 0 5 2 8
0
2 1 1 1 1 2 7
5 8 3 2 5 0
0 8 6 2 4 1
13
623 7 9
1 1 1 1 9 5 4 8 00
5 2 0 1 8 5
9 6 6 5
3 1 1 1 1 9 1
3 1 7 2 6 0
8 0 4 0 5 4 3 15
576 8 4
1 1 1 1 3 8 6 2 01
6 6 5 3 2 0
8 0 0 9
Y.j 1738 1291 770 Y..
.= .=
37
99

Tabla 3. Duracin (en horas) para el experimento de diseo de una


batera

Las sumas de cuadrados se calculan a continuacin:

Pgina 58 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

2
a b n 2 Y ...
SST Y ijk
i1j1 k 1 abn
2
2 2 2 2 3799
130 155 74 ... 60 77,646.97
36
2 2
a Y i.. Y ...
SSmaterial
i1 bn abn
2 2 2 2
998 1300 1501 3799
10,683.72
(3)(4) 36
2 2
b Y .j. Y ...
SStemperat ura
j1 an abn
2 2 2 2
1738 1291 770 3799
39,118.72
(3)(49 36
2 2
a b Y ij. Y ...
SSinteraccion
i1j1 n abn
2 2 2 2
539 229 ... 342 3799
10,683.72
4 36
39,118.72 9,613.78

SSE SST SSmaterial SStemperatur a SSinteraccion

SSE 77,646.97 10,638.72 39,118.72 9,613.78

18,230.75

El anlisis de variancia aparece en la tabla 4. Se concluye que existe


una interaccin significativa entre el tipo de material y la temperatura
porque F0.05,4.27 = 2.73. Adems, tambin son significativos los efectos
principales del tipo de material y de la temperatura, porque F O.O5.2.27 =
3.35.

Pgina 59 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Fuente de variacin SS G.L. MS Fo


Tipo de material 10,683.72 2 5,341.86 7.91
Temperatura 39,118.72 2 19,558.36 28.97
Interaccin 9,613.78 4 2,403.44 3.56
Error 18,230.75 27 675.21
Total 77,646.97 35

Tabla 4. ANOVA para los datos de la duracin de la batera

Como auxiliar en la interpretacin de los resultados de este


experimento resulta til la construccin de una grfica de las
respuestas promedio de cada combinacin de tratamiento. Esta
grfica se muestra en la figura 1.

175
150
125
Yij. 100
Material tipo 3
75
50 Material tipo 1
Material tipo 2
25

15 70 125
Tempera tura

Figura 1. Grfica de respuesta vs temperatura

El hecho de que las rectas no sean paralelas indica una interaccin


significativa. En general, a menor temperatura mayor duracin,
independientemente del tipo de material.

Al variar la temperatura de baja a intermedia, la duracin aumenta


con el material tipo 3, mientras que disminuye con los materiales tipo
1 y 2,

Pgina 60 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Cuando la temperatura vara de intermedia a alta, la duracin


disminuye con los materiales tipo 2 y 3, mientras que con el tipo 1
esencialmente permanece sin cambio. Al parecer, el material tipo 3
da los mejores resultados si lo que se desea es menor perdida de
duracin efectiva al cambiar la temperatura.

Para comprobar si el modelo es adecuado, se analizan los residuos


que tengan un comportamiento aleatorio y normal.

Pgina 61 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

7. DISEO DE EXPERIMENTOS TAGUCHI

7.1 Introduccin

La parte fundamental de la metodologa ideada por el matemtico


japons G. Taguchi es la optimizacin de productos y procesos, a fin
de asegurar productos robustos, de alta calidad y bajo costo.

La metodologa Taguchi consta de tres etapas:

a) Diseo del sistema


b) Diseo de parmetros
c) Diseo de tolerancias

De estas tres etapas, la ms importante es el diseo de parmetros


cuyos objetivos son:
a) Identificar qu factores afectan la caracterstica de calidad en
cuanto a su magnitud y en cuanto a su variabilidad.
b) Definir los niveles ptimos en que debe fijarse cada parmetro o
factor, a fin de optimizar la operacin del producto y hacerlo lo
ms robusto posible.
c) Identificar factores que no afectan substancialmente la
caracterstica de calidad a fin de liberar el control de estos factores y
ahorrar costos de pruebas.

Para lograr lo anterior se ha manejado una serie de herramientas


estadsticas conocida como diseo de experimentos, tratadas
anteriormente.

Taguchi ha propuesto una alternativa no del todo diferente que se que


conoce como: Arreglos Ortogonales y las Grficas Lineales.

La herramienta utilizada normalmente son diseos Factoriales


fraccionados, sin embargo cuando el nmero de factores se ve
incrementado, las posibles interacciones aumentan, as como la
complicaciones para identificar cules son las condiciones especficas
a experimentar.

Pgina 62 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Un arreglo ortogonal se puede comparar con una replicacin


factorial fraccionada, de manera que conserva el concepto de
ortogonalidad y contrastes. Un experimento factorial fraccionado es
tambin un arreglo ortogonal .

Taguchi desarroll una serie de arreglos particulares que denomin:

La (b)C

Donde:
a = Representa el nmero de pruebas o condiciones experimentales
que se tomarn. Esto es el nmero de renglones o lneas en el
arreglo.
b = Representa los diferentes niveles a los que se tomar cada
factor.
c = Es el nmero de efectos independientes que se pueden analizar,
esto es el nmero de columnas.

7.2 Arreglos ortogonales para experimentos a dos


niveles
En esta seccin, se analiza qu son, cmo se usan y cules son los
arreglos ortogonales ms importantes para experimentos en los que
cada factor toma dos niveles.

F A C T O R E S (c)
No. (a) A B C Resultado
1 1 1 1 Y1
2 1 2 2 Y2
3 2 1 1 Y3
4 2 2 1 Y4

1 , 2 = Niveles de los Factores (b)

Un arreglo ortogonal es una tabla de nmeros. Como ejemplo de un


arreglo ortogonal tenemos el siguiente:
De acuerdo con la notacin empleada por Taguchi al arreglo
mostrado como ejemplo, se le llama un arreglo L4, por tener cuatro
renglones.
En general, para un arreglo a dos niveles, el nmero de columnas
(efectos o factores) que se pueden analizar, es igual al nmero de
renglones menos 1.

Pgina 63 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Taguchi ha desarrollado una serie de arreglos para experimentos


con factores a dos niveles, los ms utilizados y difundidos segn el
nmero de factores a analizar son:

No. de factores a Arreglo a No. de condiciones a


analizar utilizar probar
Entre 1 y 3 L4 4
Entre 4 y 7 L8 8
Entre 8 y 11 L12 12
Entre 12 y 15 L16 16
Entre 16 y 31 L32 32
Entre 32 y 63 L64 64

El arreglo ortogonal ms popular es el arreglo L8, que se muestra a


continuacin junto con sus grficas lineales:

L8 Col. Col. Col. Col. Col. Col. Col.


1 2 3 4 5 6 7
Exp.
No.
1 1 1 1 1 1 1 1
2 1 1 1 2 2 2 2
3 1 2 2 1 1 2 2
4 1 2 2 2 2 1 1
5 2 1 2 1 2 1 2
6 2 1 2 2 1 2 1
7 2 2 1 1 2 2 1
8 2 2 1 2 1 1 2

Matriz o
tabla de
interacci
ones
Column
as 1 2 3 4 5 6 7
1 (1) 3 2 5 4 7 6
2 (2) 1 6 7 4 5
3 (3) 7 6 5 4
4 (4) 1 2 3
5 (5) 1 2
6 (1) 6
7 (7)

Pgina 64 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

1 3 2
3 5
1
.7 5 4
6
2 6 4
(a)
(b) 7

Grficas lineales

Los pasos para un diseo de experimentos de parmetros en el


caso de menor es mejor son:

7.3 Caso menor es mejor


1. Seleccionar una caracterstica de calidad de salida a ser optimizada.
2. Seleccionar factores de control y sus niveles, identificando sus
posibles interacciones.
3. Seleccionar los factores de ruido y sus niveles; si son demasiados
combinarlos en dos o tres factores combinados.
4. Seleccionar los arreglos interno y externo adecuados; asignar los
factores de control al arreglo interno y los factores de ruido al arreglo
externo.
5. Realizar los experimentos.
6. Realizar anlisis estadstico con base en S/N para identificar los
niveles de los factores de control ptimos Algunas veces ayuda
realizar un estudio de la interaccin entre factores de control y de
ruido.
7. Realizar anlisis estadstico con base en las medias para identificar
los niveles de los factores de control ptimos que ajustan a la
respuesta promedio en el nivel deseado. Si hay conflicto entre los
niveles de los factores para maximizar la relacin S/N y ajustar la
media, dar prioridad a los que sirven para maximizar la relacin S/N.
8. Predecir el desempeo de salida ptimo con base en una
combinacin ptima de niveles de factores de control y realiza un
experimento confirmatorio.

Ejemplo: Disminucin de la contaminacin


Optimizacin de un mtodo de purificacin para drenajes
contaminados con metales.

Pgina 65 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Las aguas residuales que contienen iones metlicos es muy riesgoso


por su toxicidad y no biodegradable. Se propone utilizar xidos de
hierro hidratados con un pH adecuado para remover los metales
dainos. La caracterstica de salida es la concentracin remanente de
metales en mg/L, con una respuesta menor es mejor.

Los factores de control son los siguientes:


Factores de control Nivel 1 Nivel 2 Nivel 3
A Contaminacin de FeII 2 7 15
B Temperatura C 25 50 75
Tiempo de
C aejamiento h 1 2 3
D pH 8 10 12

Pgina 66 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

El factor de ruido introducido artificialmente es permanganato de


potasio.
Factores de ruido Nivel 1 Nivel 2 Nivel 3
N Conc. De KMnO4 0.00375 0.0375 0.075

Se asume que no hay interacciones por lo que se puede utilizar un


arreglo L9, realizando los experimentos se obtienen los datos
siguientes con dos rplicas en cada nivel del factor de ruido:

L9 Col.1 Col. Col. Col.


2 3 4 N1 N1 N2 N2 N3 N3
Exp. A B C D Rep. Rep. Rep. Rep. Rep. Rep. Y
No. 1 2 1 2 1 2 promedio S/N
1 1 1 1 1 155. 166.
2.24 0.59 5.29 1.75 04 27 55.20 -39.36
2 1 2 2 2 1.75 5.07 1.05 0.41 0.38 0.48 1.52 -7.05
3 1 3 3 3 5.32 0.65 0.4 1.07 0.51 0.36 1.39 -7.05
4 2 1 2 3 0.37 0.32 0.34 0.68 4.31 0.65 1.11 -5.19
5 2 2 3 1 7.2 0.49 0.48 0.44 0.8 0.88 1.72 -9.54
6 2 3 1 2 39.1 27.0 46.5 25.7 138. 165.
7 5 4 7 08 61 73.70 -39.34
7 3 1 3 2 0.57 1.26 0.61 0.7 0.91 1.42 0.91 0.28
8 3 2 1 3 22.7 36.3 120.
3.88 7.85 4 3 92.8 33 47.32 -36.20
9 3 3 2 1 15.4 25.5 35.2 48.6 67.5 72.7
2 2 7 1 6 3 44.19 -33.79

1 n 2
S / N 10 log yi
n i 1

Las sumas de cuadrados son las siguientes:


Para el arreglo L9 con nueve respuestas Y1 a Y9 se tiene:
La suma de cuadrados del factor A es:

A1 = Y1 + Y2 + Y3
A2 = Y4 + Y5 + Y6
A3 = Y7 + Y8 + Y9

Pgina 67 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

A12 A22 A33


SSA CF
3
(Y Y .... Y9 ) 2
CF 1 2
9
La suma de cuadrados del factor B es:
B1 = Y1 + Y4 + Y7
B2 = Y4 + Y5 + Y8
B3 = Y3 + Y6 + Y9
B12 B22 B33
SSB CF
3
(Y Y .... Y9 ) 2
CF 1 2
9

De la misma forma se calculan las sumas de cuadrados para los


factores C y D:
La suma de cuadrados total es:

SST = SSA + SSB + SSC + SSD

Haciendo los clculos en Minitab se obtiene:

Taguchi Analysis: Rep. 1, Rep. 2, Rep. 1_1, Rep. 2_1, ...


versus A, B, C, D
Linear Model Analysis: SN ratios versus A, B, C, D

Estimated Model Coefficients for SN ratios


Term Coef
Constant -19.6915
A 1 1.8735
A 2 1.6687
B 1 4.9386
B 2 2.0970
C 1 -18.6078
C 2 4.3499
D 1 -7.8678
D 2 4.3221

Pgina 68 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

S = *

Analysis of Variance for SN ratios


Source DF Seq SS Adj SS Adj MS F P Porcentaje de
contribucin
A 2 56.52 56.52 28.261 * * 2.49%
B 2 234.86 234.86 117.428 * * 10.32%
C 2 1705.37 1705.37 852.685 * * 74.91%
D 2 279.46 279.46 139.732 * * 12.28%
Residual Error 0 * * *
Total 8 2276.21

Linear Model Analysis: Means versus A, B, C, D


Estimated Model Coefficients for Means
Term Coef
Constant 25.2281
A 1 -5.8598
A 2 0.2819
B 1 -6.1548
B 2 -8.3748
C 1 33.5124
C 2 -9.6215
D 1 8.4707
D 2 0.1513

S = *

Analysis of Variance for Means


Source DF Seq SS Adj SS Adj MS F P
A 2 196.59 196.59 98.30 * *
B 2 957.39 957.39 478.69 * *
C 2 5359.29 5359.29 2679.65 * *
D 2 438.35 438.35 219.17 * *
Residual Error 0 * * *
Total 8 6951.62

Response Table for Signal to Noise Ratios


Smaller is better
Level A B C D
1 -17.818 -14.753 -38.299 -27.559
2 -18.023 -17.595 -15.342 -15.369
3 -23.234 -26.727 -5.434 -16.146
Delta 5.416 11.974 32.866 12.190
Rank 4 3 1 2

Response Table for Means

Pgina 69 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009
Level A B C D
1 19.368 19.073 58.741 33.699
2 25.510 16.853 15.607 25.379
3 30.806 39.758 1.337 16.606
Delta 11.438 22.904 57.403 17.093
Rank 4 2 1 3

Las grficas factoriales son las siguientes:

Main Effects Plot (data means) for SN ratios


A B

-10

-20
Mean of SN ratios

-30

-40
1 2 3 1 2 3
C D

-10

-20

-30

-40
1 2 3 1 2 3
Signal-to-noise: Smaller is better

Los niveles seleccionados son A en 1, B en 1, C en 3 y D en 2

Main Effects Plot (data means) for Means


A B
60

45

30

15
Mean of Means

0
1 2 3 1 2 3
C D
60

45

30

15

0
1 2 3 1 2 3

La respuesta estimada es:


Predicted values
S/N Ratio Mean

Pgina 70 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

5.70044 -10.5261
Factor levels for predictions
A B C D
1 1 3 2

Pgina 71 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

8. REGRESIN Y CORRELACIN LINEAL

8.1 Introduccin
Son dos herramientas para investigar la dependencia de una variable
dependiente Y en funcin de una variable independiente X. Y = f(X)

Y = Variable dependiente que se desea explicar o predecir, tambin


se llama regresor o respuesta

X = Variable independiente, tambin se llama variable explicativa,


regresor o predictor

Regresin lineal - La relacin entre X y Y se representa por medio de


una lnea recta
Regresin curvilinea - La relacin entre X y Y se representa por medio
de una curva.

Y * *
** * * * *

* * * *
* b1 * * * *
* * * *
* *
* * * *
b0

Correlacin positiva Correlacin negativa X


Sin
correlacin

La ecuacin de la recta es la siguiente:

El trmino de error es la diferencia entre los valores reales observados


Yi y los valores estimados por la ecuacin de la recta. Se trata de que
estos sean mnimos, para lo cual se utiliza el mtodo de mnimos
cuadrados.

Pgina 72 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Pgina 73 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

*
Error Re siduo (Yi Yi )

Y
*

X
Se trata de minimizar la suma de todos los errores o residuos:

Las frmulas resultado de la minimizacin de lo cuadrados del error


se aplicarn en el siguiente ejemplo por claridad. Se tienen los
siguientes supuestos:

1. Los errores o residuos se distribuyen normalmente alrededor de la


recta de regresin poblacional
2. Las varianzas de los errores son las mismas en todos los valores de
X (Homoscedasticidad) en caso contrario se tiene
(Heteroscedasticidad)
3. Los errores o residuos son independientes: No se muestra algn
patrn definido.

El coeficiente de Correlacin r desarrollado por Carl Pearson es un


indicador de la fuerza de la relacin entre las variables X y Y, puede
asumir valores entre -1 y 1 para correlacin negativa y positiva
perfecta respectivamente. Por ejemplo si se encuentra que la variable
presin tiene una correlacin positiva con el rendimiento de una
caldera, se deben buscar soluciones al problema mediante acciones
asociadas con la variable presin; de lo contrario, sera necesario
buscar la solucin por otro lado.

Se identifican tres medidas de desviacin como sigue:

Pgina 74 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Y
Yest = 4.4 + 1.08 X

Yi = Desviacin no
23 * explicada
Error = (Yi - Yest) =
1.32
Variacin
total
(Yi- Desviacin
media)=5.13 explicada
(Yest-Ymedia) =
3.81
Ymedia =17.87

X = 16 X

8.2 Ejemplo manual

Se sospecha que el tiempo requerido para hacer un mantenimiento


preventivo est relacionado con su nmero. Calcular el coeficiente de
correlacin y graficar. Los datos de tiempo tomados para n = 25
servicios se muestran a continuacin:

X Servicios Y Tiempo (Xi-X)*(Yi-Y) (Xi-X)^2 (Yi-Y)^2 Yest Error


2 9.95 119.076672 38.9376 364.1533 10.9199 0.9408
8 24.45 1.099872 0.0576 21.0021 28.3362 15.1022
11 31.75 7.499472 7.6176 7.3832 37.0443 28.0292
10 35.00 10.502272 3.0976 35.6075 34.1416 0.7369
8 25.02 0.963072 0.0576 16.1026 28.3362 10.9969
4 16.86 51.612672 17.9776 148.1771 16.7253 0.0181
2 14.38 91.433472 38.9376 214.7045 10.9199 11.9721
2 9.60 121.260672 38.9376 377.6337 10.9199 1.7422
9 24.35 -3.558928 0.5776 21.9286 31.2389 47.4563
8 27.50 0.367872 0.0576 2.3495 28.3362 0.6991
4 17.08 50.679872 17.9776 142.8694 16.7253 0.1258
11 37.00 21.989472 7.6176 63.4763 37.0443 0.0020
12 41.95 48.568672 14.1376 166.8541 39.9470 4.0121
2 11.66 108.406272 38.9376 301.8142 10.9199 0.5477
4 21.65 31.303072 17.9776 54.5057 16.7253 24.2523
4 17.89 47.245472 17.9776 124.1620 16.7253 1.3564
20 69.00 470.014272 138.2976 1,597.3771 63.1686 34.0052
1 10.30 135.625472 52.4176 350.9178 8.0172 5.2111

Pgina 75 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

10 34.93 10.379072 3.0976 34.7770 34.1416 0.6216


15 46.59 118.686672 45.6976 308.2553 48.6551 4.2646
15 44.88 107.127072 45.6976 251.1337 48.6551 14.2512
16 54.12 194.676672 60.2176 629.3676 51.5578 6.5649
17 56.63 241.751472 76.7376 761.6054 54.4605 4.7068
6 22.13 15.462272 5.0176 47.6486 22.5307 0.1606
5 21.15 25.540272 10.4976 62.1385 19.6280 2.3164
220.092
206 725.82 2,027.7132 698.5600 6,105.9447 6
Sxy Sxx Syy = SST SSE
X
promedio Y Promedio

Sxy Sxx Syy

Si todos los puntos estuvieran completamente sobre la recta la


ecuacin lineal sera y = a + bx. Como la correlacin no siempre es
perfecta, se calculan a y b de tal forma que se minimice la distancia
total entre puntos y la recta. Los clculos tomando las sumas de
cuadrados siguientes se muestran a continuacin:

Sxy = 2027.71
Sxx = 698.56
Syy = 6105.94

Las ecuaciones para el clculo manual son las siguientes:

b1 1
( Xi X )(Yi Y ) S XY

( Xi X ) 2
S XX
= 2.902704421

b0 0
Y i 1 X i
Y X
n = 5.114515575

Las sumas de cuadrados son:

SST (Yi Y ) 2
6,105.9447

SSE (Yi Yi ) 2 (Yi (bo b1 * X i )) 2


220.0926

SSR SST SSE 5,885.8521

El coeficiente de determinacin r2 y el coeficiente de correlacin r se


calculan a continuacin:

Pgina 76 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

SSE ( SST SSE ) SSR


r2 1
SST SST SST = 0.9639

El coeficiente de determinacin indica el porcentaje de la variacin


total que es explicada por la regresin.

r r 2 = 0.9816

El coeficiente de correlacin proporciona el nivel de ajuste que tienen


los puntos a la lnea recta indicando el nivel de influencia de una
variable en la otra. El factor de correlacin r es un nmero entre 1
(correlacin negativa evidente) y +1 (correlacin positiva evidente), y
r = 0 indicara correlacin nula.

El coeficiente de correlacin r = 0.98 por lo cual tenemos suficiente


evidencia estadstica para afirmar que el tiempo de atencin esta
relacionado con el nmero de servicios atendidos.

8.3 Uso de Excel

1. En el men Herramientas seleccione la opcin Anlisis de


datos. Datos de ejemplo 6.
2. Seleccione la opcin Regresin.
3. Seleccione el rango de entrada, estos corresponden a los datos
numricos de la tabla.
4. Seleccione Resumen de estadsticas.
5. En opciones de salida seleccione en Rango de salida, una celda
de la hoja de clculo que este en blanco (a partir de esta celda
sern insertados los resultados).

Resumen

Estadsticas de la regresin
Coeficiente de
correlacin 0.981811
mltiple 778
Coeficiente de
determinacin 0.963954
R^2 368
0.962387
R^2 ajustado 167
Error tpico 3.093419

Pgina 77 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

627
Observaciones 25

Promedio
ANLISIS DE VARIANZA Suma de de
Grados Valor
de Cuadrad cuadra crtico de
libertad os dos F F
5885.852 5885.852 615.0800 4.24118E
Regresin 1 069 069 898 -18
220.0926 9.569244
Residuos 23 348 992
6105.944
Total 24 704

Coeficien Error Estadsti Probabili Inferior


tes tpico co t dad 95%
5.114515 1.145804 4.463691 0.000177 2.744239
Intercepcin 575 127 004 215 161
2.902704 0.117040 24.80080 4.24118E 2.660587
XServicios 421 719 825 -18 249

En la grfica observamos que al aumentar el nmero de servicios el


tiempo de atencin aumenta.

8.4 Uso de Minitab

Para determinar la funcin de regresin y correlacin en Minitab se


siguen los pasos siguientes (despus de cargar los datos
correspondientes a X y a Y en las columnas C1 y C2):

Pgina 78 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

Stat >Regresin ... Indicar la columna de Respuestas Y y la de


predictores X y aceptar con OK. Observar el valor del
coeficiente de correlacin y de determinacin.

Para obtener la lnea de mejor ajuste de la regresin, se procede


como sigue en Minitab:
Stat >Fitted Line Plot ... Indicar la columna de Respuestas Y
y la de predictores X, seleccionar si se quiere ajustar con los
datos con una lnea, una funcin cuadrtica o cbica y aceptar
con OK. Observar el mayor valor del coeficiente de correlacin
que indica el mejor ajuste.
En Options: seleccionar Display Confidence (para media en X) y
Prediction Intervals para X.
En Graphs: Seleccionar Residual for plots Standardized y Normal
Plot of residuals
La grfica de residuos debe apegarse a la recta y tener siempre un
valor P value >0.05.

Fitted Line Plot


Y Tiempo = 5.115 + 2.903 X Servicios
Regression
70
95% CI
95% PI
60
S 3.09342
R-Sq 96.4%
50 R-Sq(adj) 96.2%
Y Tiempo

40

30

20

10

0
0 5 10 15 20
X Servicios

Regression Analysis: Y Tiempo versus X Servicios

The regression equation is


Y Tiempo = 5.115 + 2.903 X Servicios
S = 3.09342 R-Sq = 96.4% R-Sq(adj) = 96.2%
Analysis of Variance
Source DF SS MS F P
Regression 1 5885.85 5885.85 615.08 0.000
Error 23 220.09 9.57
Total 24 6105.94

Pgina 79 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

La regresin tiene una r^2 de 96.4% y la influencia de una variable X


en Y es significativo.

Los intervalos de confianza para la media y el intervalo de


prediccin para un punto especfico X son los siguientes:

Pgina 80 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

8.5 Ejercicios:

1. La energa consumida en un proceso depende del ajuste de


mquinas, realizar una regresin cuadrtica con los datos siguientes y
responder las preguntas.
Cons_energ Ajuste
a Mq.
Y X
21.6 11.15
4 15.7
1.8 18.9
1 19.4
1 21.4
0.8 21.7
3.8 25.3
7.4 26.4
4.3 26.7
36.2 29.1

a) Trazar un diagrama de dispersin


b) Obtener la ecuacin de regresin lineal y cuadrtica y comparar
c) Estimar el consumo de energa para un ajuste de mquina de 20
con regresin cuadrtica
d) Obtener los intervalos de prediccin y de confianza para un ajuste
de mquina de 20
e) Obtener el coeficiente de correlacin y de determinacin

2. En base al porcentaje de puntualidad se trata de ver si hay


correlacin con las quejas en una lnea area. Las quejas son por cada
100000 pasajeros.
%punto Queja
s s
Aeroline
a X Y
A 81.8 0.21
B 76.6 0.58
C 76.6 0.85
D 75.7 0.68
E 73.8 0.74
F 72.2 0.93
G 70.8 0.72
H 68.5 1.22

a) Trazar un diagrama de dispersin


b) Obtener la ecuacin de regresin lineal
c) Estimar las quejas para un porcentaje de puntualidad de 80%

Pgina 81 de 82
CURSO DE DISEO DE EXPERIMENTOS P.
Reyes / enero 2009

d) Obtener los intervalos de prediccin y de confianza para una altura


de 63"
e) Obtener el coeficiente de correlacin y de determinacin

Pgina 82 de 82

También podría gustarte