Está en la página 1de 73

DR.

PRIMITIVO REYES AGUILAR

DISEÑO DE EXPERIMENTOS

Teoría
Dr. Primitivo Reyes Aguilar

Mail: primitivo_reyes@yahoo.com
Cel. 04455 5217 4912
Diseño de experimentos factorials de dos niveles, factoriales completos, factorials
fraccionales y diseños especiales: Taguchi, Mezclas. Se tomo como referencia el texto de
Douglas Montgomery, Diseño y análisis de experimentos, 2ª. edición
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

OBJETIVO

Objetivo general del módulo. Que los asistentes actualicen los conocimientos
necesarios para diseñar, analizar y obtener inferencias sobre experimentos
conducentes a la mejora de productos y procesos en la industria y que sean capaces de
aplicar la mejor estrategia experimental para resolver un problema de desarrollo de
productos, o de calidad en los productos.

Contenido
1. INTRODUCCIÓN AL DISEÑO DE EXPERIMENTOS...........................................................4
1.1 Aplicaciones del diseño de experimentos...............................................................5
Definición de experimento, diseño de experimentos y eficiencia de un
experimento..............................................................................................................7
1. 2 Principios básicos del diseño de experimentos......................................................7
1.3. Metodología general para realizar un experimento............................................9
1.4. Aplicaciones del diseño de experimentos............................................................13
2. ANALISIS DE VARIANZA DE UN FACTOR (ANOVA 1 VIA).............................................15
2.1 Introducción..........................................................................................................15
2.2 Tipos de variación y sumas de cuadrados.............................................................16
2.3 Uso de Excel:..........................................................................................................18
2.4 Uso de Minitab......................................................................................................19
2.5 Grafica de residuos contra el valor ajustado de ^y ij ...........................................20
2.6 Ejercicios................................................................................................................21
3. ANALISIS DE VARIANZA DE DOS VÍAS o DIRECCIONES (ANOVA 2 VIAS).....................23
3.1 Introducción..........................................................................................................23
3.2 Ejemplos con cálculo manual................................................................................23
3.3 Procedimiento en Excel.........................................................................................24
3.4 ANOVA en Minitab................................................................................................25
4. DISEÑOS FACTORIALES................................................................................................29
4.1 Principios y definiciones básicas...........................................................................29
Ventajas de los diseños factoriales.........................................................................31
4.2 Diseño factorial de dos niveles (2^K)....................................................................32
5. DISEÑOS DE EXPERIMENTOS FRACCIONALES DE DOS NIVELES..................................40
5.1 Concepto de replicación fraccionada....................................................................40

Página 2 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

5.2 Fracción un medio del diseño 2k...........................................................................41


5.3 Resolución del diseño............................................................................................44
6. DISEÑOS DE EXPERIMENTOS FACTORIALES COMPLETOS...........................................46
6.1 Diseño factorial completo de 2 factores...............................................................46
6.2 Análisis Estadístico del Modelo de Efectos Fijos...................................................48
7. DISEÑO DE EXPERIMENTOS TAGUCHI.........................................................................56
7.1 Introducción..........................................................................................................56
7.2 Arreglos ortogonales para experimentos a dos niveles........................................57
7.3 Caso menor es mejor.............................................................................................59
8. REGRESIÓN Y CORRELACIÓN LINEAL...........................................................................64
8.1 Introducción..........................................................................................................64
8.2 Ejemplo manual.....................................................................................................66
8.3 Uso de Excel...........................................................................................................68
8.4 Uso de Minitab......................................................................................................69
8.5 Ejercicios:...............................................................................................................71

Página 3 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

1. INTRODUCCIÓN AL DISEÑO DE EXPERIMENTOS

E l diseño de experimentos es una técnica estadística que nos ayuda a identificar


qué factores o variables afectan El comportamiento de un proceso productivo y de
esta manera poder mejorarlo.

O bien: es una prueba o una serie de pruebas en las cuales se inducen cambios
deliberados en las variables de entrada de un proceso o sistema, de manera que sea
posible observar e identificar las causas de los cambios en la respuesta de salida.

Experimento: es una prueba o ensayo.

El proceso o sistema bajo estudio puede representarse por medio del modelo de la
figura 1.1.

Factores controlables
x1 x2 x3 x4 ... xp

Entradas Salida
Proceso
y

z1 z2 z3 z4 ... zq
Factores incontrolables
Figura 1. Modelo general de un proceso o sistema

Algunas de las variables del proceso x 1, x2,..., xk son controlables, mientras que otras z 1,
z2,...,zk son incontrolables (aunque pueden ser controlables para los fines de prueba).
Entre los objetivos del experimento pueden incluirse:

1. Determinar cuáles variables tiene mayor influencia en la respuesta, y.


2. Determinar el mejor valor de las x que influyen en y, de modo que y tenga casi
siempre un valor cercano a valor nominal deseado.
3. Determinar el mejor valor de las x que influyen en y, de modo que la
variabilidad de y sea pequeña.
4. Determinar el mejor valor de las x que influyen en y, de modo que se
minimicen los efectos de las variables no controlables z1, z2,...zq.

Página 4 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Lo métodos de diseño experimental tiene un propósito que puede ser desarrollar un


proceso consistente o robusto; esto es, un proceso que no sea afectado por fuentes
de variabilidad externas o ruido (las zi).

En el diseño de experimentos se plantean varias preguntas importantes:

1. ¿Son estas dos soluciones los únicos medios para lograr la respuesta de
interés?
2. ¿Existen otros factores que pueden afectar la respuesta de las muestras y que
deban ser investigados o controlados?
3. ¿Cuántas muestras deben ser sometidas a cada solución de templado?
4. ¿En que forma debe asignarse cada muestra a los tratamientos, y en qué orden
deben realizarse las mediciones?
5. ¿Qué método de análisis debe utilizarse?
6. ¿Qué diferencia en los niveles promedio de respuesta entre los dos
tratamientos debe considerarse como significativa?

Estas, y quizá muchas otras preguntas, deberán ser contestadas satisfactoriamente


antes de llevar a cabo el experimento.

1.1 Aplicaciones del diseño de experimentos

E l diseño de experimentos puede servir para mejorar el rendimiento de un proceso


de manufactura, desarrollo de nuevos procesos con lo que se logra:

1. Mejorar el rendimiento del proceso.


2. Menor variabilidad y mayor apego a los requerimientos nominales y objetivos.
3. Menor tiempo de desarrollo.
4. Menores costos totales.

Los métodos de diseño de experimentos también se aplican al diseño de productos


como sigue:

1. Evaluación y comparación de conceptos de diseño básicos.


2. Evaluación de materiales alternativos.
3. Selección de parámetros de diseño de modo que el producto funcione bien desde
una amplia variedad de condiciones de uso real; Esto es, de modo que el producto
sea consistente (robusto).

Página 5 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

El uso del diseño de experimentos en estas áreas puede dar por resultado productos
con mayor confiabilidad y mejor funcionamiento en el campo, menores costos, y
menor tiempo de diseño y desarrollo del producto.

El diseño estadístico de experimentos es el proceso de planear un experimento para


obtener datos apropiados, que pueden ser analizados mediante métodos estadísticos,
con objeto de producir conclusiones validas y objetivas.

Cuando se identifican los factores y su influencia en un sistema productivo, se pueden


tomar decisiones que efectivamente mejoren la calidad del producto o servicio. Se
pueden identificar las fuentes de variación reales para su reducción en la búsqueda de
la mejora continua.

Cuando se usan experimentos pretendemos analizar el efecto de cambios que


nosotros inducimos más que analizar variaciones al azar. Por ejemplo, mediante un
diagrama causa-efecto podemos identificar las posibles causas o factores que inciden
en un efecto o respuesta especifica tal y como sé muestra en la figura 2

F2 F1
F11
F21

F22 F12

CARACTERISTICA
DE CALIDAD

F41
F31
F32
F42

F4 F3

Figura 1.2 Diagrama de Causa Efecto

Mediante un experimento podemos inducir cambios en uno varios factores (F 2l. F33 y
F11 por ejemplo) y analizar estadísticamente si el cambio en los factores afecta o no el
resultado o efecto del proceso.

Página 6 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Definición de experimento, diseño de experimentos y eficiencia de un


experimento

Experimento

E s un conjunto de pruebas estructurado y coherente que son analizadas a fin de


comprender la operación del proceso.

Diseño de experimentos

E s el proceso de planear, ejecutar y analizar el experimento de manera que los


datos apropiados sean recolectados, y que estos tengan validez estadística para
obtener conclusiones validas y útiles. Se entiende por validez estadística, el que los
resultados se puedan repetir consistentemente sobre todo en la operación a gran
escala o masiva.

Eficiencia de un experimento

Un experimento es eficiente cuando:

1. Se obtiene la información requerida.


2. Con el mínimo consumo de recursos.

Esto es, un experimento eficiente debe ser lo más simple y económico posible pero
efectivo. Las técnicas del diseño de experimentos pretenden que los experimentos
sean eficientes.

1. 2 Principios básicos del diseño de experimentos

P ara que un experimento pueda tener validez estadística se deben de observar al


menos tres principios:

 Reproducción. Esto significa que el experimento se pueda llevar a cabo o repetir


bajo las mismas condiciones en más de una ocasión.

La diferencia observada como resultado de un experimento es real, o se debe a simple


error aleatorio, o aun más a otro factor como por ejemplo diferente tipo del material.
Para aclarar esto, es necesario repetir el experimento y cuantificar si se presenta
consistentemente o no la variación detectada.

Página 7 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

La reproducción por lo tanto es importante por al menos dos razones:

i) Permite cuantificar el error aleatorio inherente al proceso y


ii) Permite una mejor estimación de los parámetros.

 Aleatoriedad. Esto significa que tanto el material asignado a un experimento en


particular, como el orden en que se efectúan las pruebas se efectué de una
manera aleatoria.

Suponga por ejemplo, que se desea saber si la temperatura influye en el nivel de


contaminación de un producto, medida en mgms/lt, para esto primero efectúa cuatro
pruebas a una temperatura de 80°C y enseguida cuatro pruebas a 90°C, los Resultados
son:

80º 3.
2.2 2.8 3.6 2.95
C 2
90º 4.
3.4 3.9 4.7 4.07
C 3

A primera vista con la temperatura de 80°C se ve que tiene menor nivel de


contaminación, sin embargo, algo raro se observa, el nivel de contaminación siempre
aumenta, esto se debe a que los residuos que quedan en el equipo aumentan
constantemente la contaminación del producto. Esto se puede evitar lavando
perfectamente el material, lo cual puede no ser físicamente posible. "En lugar de esto
podemos confundir, anular o igualar este efecto, realizando las pruebas en orden
aleatorio” bajo las dos temperaturas.

En una diagrama causa-efecto con un gran número de factores afectando la


característica de calidad, si se desea analizar el efecto de uno o varios factores, se
debería controlar y medir todos los otros factores y aun así no eliminaría el error
aleatorio, en lugar de esto se puede "confundir" o anular el efecto de estos factores no
controlables al efectuar las pruebas siguiendo un orden aleatorio o al azar.

La aleatoriedad por lo tanto es importante por al menos dos razones

i) Confunde el efecto de factores no controlables y


ii) Valida las pruebas estadísticas al hacer que los errores experimentales sean
estadísticamente independientes.

 Análisis por bloques. Es una técnica que se usa para incrementar la


precisión del experimento. Un bloque es una porción del material experimental

Página 8 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

que sea más homogénea que el total del material o cuando las condiciones son
más homogéneas. Al realizar un experimento por bloques se hacen las
comparaciones entre las condiciones de interés del experimento dentro de cada
bloque.

1.3. Metodología general para realizar un experimento

Se sugieren varias metodologías en la literatura, la siguiente es una de ellas:

1. Identifique claramente el problema o situación a resolver. Antes de poder planear


un experimento necesitamos definir claramente que es la que estamos buscando, aun
cuando esto puede parecer trivial en ocasiones es tanta la presión para tomar
decisiones que corremos a experimentar sin por lo menos definir claramente nuestros
objetivos.

En este paso es necesario definir que tipo de información es exactamente la que nos
interesa, ya que no podemos medir o variar todos y cada uno de los componentes de
un experimento.

En ocasiones escuchamos que el experimento fue un éxito pero la calidad no mejoró.


Antes de planear un experimento se debe de investigar y. analizar el conocimiento y
datos que ya se tengan sobre este problema. La participación activa del personal
involucrado en el problema es de vital importancia en este paso.

En conclusión como resultado de este paso, la hipótesis a probar debe quedar bien
definida. Un diagrama causa-efecto es una buena ayuda en este paso.

2. Identificar variables. En este paso dos tipos de variables se deben de identificar,


variables dependientes y factores o variables independientes.

La variable dependiente o variable de respuesta es la característica de calidad que


queremos mejorar y cuyo comportamiento deseamos conocer, ejemplos de esta son:
porcentaje de contaminación, satisfacción de un cliente, desgaste de una herramienta,
tiempo, de falla, etc.

Es deseable que una variable dependiente reúna las características siguientes:

 Cuantitativa
 Precisa.

Página 9 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

 Que tenga algún significado físico.

Las variables independientes o factores representan aquellas causas o factores cuyo


efecto sobre la variable dependiente se quiere analizar. Cada uno de estos factores se
deberá probar al menos a dos valores diferentes para evaluar su efecto, a cada uno de
estos valores o niveles se les llama tratamientos. Por ejemplo, si queremos conocer el
efecto de la temperatura sobre la dureza de un material y para ello se realizan pruebas
a 70, 80 y 90ºC se dice que tenemos un experimento de un solo factor con tres
tratamientos. Otra vez es de vital importancia la participación del personal involucrado
en el problema a fin de seleccionar apropiadamente los factores o variables
independientes y los niveles de cada factor o tratamiento de interés.

¿Cómo seleccionar los diferentes niveles de un factor?, En general un factor puede ser
cualitativo (proveedor, turno, operario, etc), o cuantitativo (temperatura, presión,
altura, tiempo, etc.). Los niveles específicos en cualquier caso se pueden seleccionar ya
sea aleatoriamente dentro de un cierto rango o a un nivel fijo definido por el
experimentador previamente, esto nos lleva a cuatro situaciones generales:

A. Factor fijo, cualitativo.


En este caso, de entre los diferentes niveles o tratamientos posibles para el factor, el
experimentador esta interesado en el efecto que ciertos niveles seleccionados por él
previamente tienen sobre la variable de respuesta. Además, el factor es del tipo
cualitativo. Por ejemplo tres proveedores, tres turnos, dos procesos diferentes, etc.

B. Factor fijo, cuantitativo.

Este caso es similar al anterior excepto que el factor es cuantitativo, por ejemplo:
temperatura, presión, tiempo, concentración de un componente, etc. Para este caso es
recomendable que los diferentes niveles o tratamientos se tomen equiespaciados, esto
es, por ejemplo 10, 20, 30 y 40 °C: 5, 10, 15, 20 y 25 psi; 8, 12, 16 y 20 minutos, etc.

La conclusión a que se puede llegar con este caso es si la variable de respuesta es


diferente para cada uno de los tratamientos que se seleccionaron y de ser así el tipo de
relación que existe entre el factor y la variable de respuesta (lineal, cuadrática, etc.).

C. Factor aleatorio, cualitativo.

En este caso los niveles o tratamientos se seleccionan al azar de entre varios posibles.
Por ejemplo: se tienen varios lotes de un mismo proveedor, se selecciona al azar cuáles

Página 10 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

de ellos analizar, en este caso la conclusión del experimento se extiende para cubrir
todos los posibles niveles..

D. Factor aleatorio, cuantitativo.

Igual que en el caso anterior los diferentes niveles o tratamientos son seleccionados al
azar.

Por ejemplo para la temperatura si el rango de interés es de 0 a 100. Se puede al azar


seleccionar 5 niveles 7, 36, 46, 80 y 8 °C. La conclusión que se puede obtener en este
caso es similar al caso c.

En este material, a menos que se especifique lo contrario, los factores se consideran


fijos.

3. Definir el diseño del experimento. Esto imp1ica definir de qué manera se efectuaran
las pruebas y qué modelo matemático describe mejor el experimento. En el resto de
este material se describen varios tipos de experimentos de los cuales se tomará el que
mejor se ajuste a la situación particular.

4. Efectuar el experimento. Esto de acuerdo a lo que se defina en el paso 3.

5. Análisis de los datos. Estos son básicamente análisis estadísticos.

6. Conclusiones y toma de decisiones.

Una metodología (alterna) desarrollada por Douglas C. Montgomery es la siguiente:

P ara usar un enfoque estadístico al diseñar y analizar un experimento se requiere


que todos los participantes en él tengan de antemano una idea clara de qué es
exactamente lo que se va a estudiar, cómo se van a recopilar los datos y, al menos, una
idea cualitativa de cómo se van a analizar. A continuación, se ofrece una guía del
procedimiento recomendado:

1. Comprensión y planteamiento del problema.

Este punto pudiera parecer obvio; sin embargo, en la práctica no es sencillo darse
cuenta de que existe un problema que requiere experimentación, ni diseñar un
planteamiento claro y aceptable del mismo. Es necesario desarrollar todas las ideas
sobre los objetivos del experimento. Suele ser importante solicitar la opinión de todas
las partes implicadas. Un planteamiento claro del problema contribuye a menudo en

Página 11 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

forma sustancial a un mejor conocimiento del fenómeno y de la solución final del


problema.

2. Elección de factores y niveles.

El experimentador debe elegir los factores que variarán en el experimento, los


intervalos de dicha variación y los niveles específicos de interés a los cuales se hará el
experimento. También debe considerarse la forma en que se controlarán estos
factores para mantenerlos en los valores deseados, y cómo se les medirá. Para ello es
necesario conocer el proceso de manera práctica y teórica.

3. Selección de la variable de respuesta.

Al seleccionar la respuesta o variable dependiente, el experimentador debe estar


seguro de que la respuesta que se va a medir realmente provea información útil acerca
del proceso de estudio. Con mayor frecuencia, el promedio o la desviación estándar (o
ambos) de la característica medida serán la variable de respuesta. No son raras las
respuestas múltiples. La capacidad de medición (o el error de medición) también es un
factor importante. Si la capacidad de medición es deficiente, sólo puede esperarse que
el experimento detecte efectos relativamente grandes de los factores; en caso
contrario deben hacerse repeticiones.

4. Elección del diseño experimental.

Para elegir el diseño es necesario considerar el tamaño muestral (número de


repeticiones), seleccionar un orden adecuado para los ensayos experimentales, y
determinar si hay implicado bloqueo u otras restricciones de aleatorización.

Es importante tener presente los objetivos experimentales al seleccionar el diseño, se


tiene interés en identificar qué factores causan diferencias en estimar la magnitud del
cambio de la respuesta. En otras situaciones habrá más interés en verificar la
uniformidad. Por ejemplo, pueden compararse dos condiciones de producción A y 8,
siendo A la estándar y B una alternativa de menor costo. El investigador estará
interesado en demostrar que no hay diferencia en cuanto a la productividad (por
ejemplo), entre las dos condiciones.

5. Realización del experimento.

Cuando se realiza el experimento, es vital vigilar el proceso cuidadosamente para


asegurar que todo se haga conforme a lo planeado. En esta fase, los errores en el
procedimiento suelen anular la validez experimental. La planeación integral es decisiva

Página 12 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

para el proceso. En un complejo entorno de manufactura o investigación y desarrollo,


es fácil subestimar los aspectos logísticos y de planeación de la realización de un
experimento diseñado.

6. Análisis de datos.

Deben emplearse métodos estadísticos para analizar los datos, de modo que los
resultados y conclusiones sean objetivos más que apreciativos. Existen muchos
excelentes paquetes de software para el análisis de datos, y varios métodos gráficos
sencillos son importantes en la interpretación de tales datos. El análisis de residuos y la
verificación de la idoneidad del modelo son también técnicas de análisis de gran
utilidad.

Hay que recordar que los métodos estadísticos sólo proporcionan directrices para la
veracidad y validez de los resultados. Los métodos estadísticos, aplicados
adecuadamente, no permiten probar algo experimentalmente, sólo hacen posible
obtener el probable error de una conclusión, o asignar un nivel de confiabilidad a los
resultados. La principal ventaja de los métodos estadísticos es que agregan objetividad
al proceso de toma de decisiones. Las técnicas estadísticas, aunadas aun buen
conocimiento técnico o del proceso y al sentido común, suelen llevar a conclusiones
razonables.

7. Conclusiones y recomendaciones.

Una vez que se han analizado los datos, él experimentador debe extraer conclusiones
prácticas de los resultados y recomendar un curso de acción. En esta fase a menudo
son útiles los métodos gráficos, en especial al presentar los resultados a otras
personas. También deben realizarse corridas de seguimiento y pruebas de
confirmación para validar las conclusiones del experimento.

1.4. Aplicaciones del diseño de experimentos.

E n muchas ocasiones él termino experimento se considera asociado


exclusivamente para cuestiones científicas y teóricas; sin embargo tienen varias
aplicaciones prácticas.

Algunos ejemplos son:

 Si la materia prima que es entregada por tres diferentes proveedores producen


características diferentes en el producto

Página 13 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

 Si diferentes marcas de herramienta tienen o no vida diferente.


 Si la temperatura de recocido afecta o no alguna propiedad mecánica del producto.
 Si diferentes cabezales de una misma máquina producen productos similares.
 Si un nuevo método de ensamble incrementa o no la productividad en una línea de
producción.
 Cuál es el factor que más influye en la variabilidad de alguna característica de
calidad.

Es necesario tener claros y en todo caso revisar los siguientes conceptos estadísticos
antes de seguir:

 ¿Qué es una prueba de hipótesis?


 ¿Qué e s un error tipo I y Qué es un error tipo II?
 ¿Qué es una prueba t para comparar dos medias?
 ¿Qué es la potencia de una prueba de hipótesis?
 ¿Qué es control estadístico?.
 ¿Qué es nivel de significancia?.

Página 14 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

2. ANALISIS DE VARIANZA DE UN FACTOR (ANOVA 1


VIA)

2.1 Introducción
El análisis de la varianza de un factor (ANOVA) es una metodología para analizar la
variación entre muestras y la variación al interior de las mismas mediante la
determinación de varianzas. Es llamado de una vía porque analiza un variable
independiente o Factor ejemplo: Velocidad. Como tal, es un método estadístico útil
para comparar dos o más medias poblacionales. El ANOVA de un criterio nos permite
poner a prueba hipótesis tales como:

H 0 =μ1 =μ 2 =μ 3 =.. ..=μk


H 1 : Al menos dos medias poblacionales son diferentes .

Los supuestos en que se basa la prueba t de dos muestras que utiliza muestras
independientes son:

1. Ambas poblaciones son normales.


2 2
2. Las varianzas poblacionales son iguales, esto es, σ 1 =σ 2 .
El estadístico tiene una distribución muestral resultando:

2
sb
Fc= 2
sw

El valor crítico para la prueba F es:

F α,(k−1),k(n−1))
Donde el número de grados de libertad para el numerador (Sb^2 > Sw^2) es k-1 y para
el denominador es k(n-1), siendo α el nivel de significancia.

k = número de muestras.

Por ejemplo:

Ejemplo: Se tienen 14 empleados seleccionados al azar que se someten a


3 diferentes cursos de entrenamiento: Programa 1, Programa 2 y Programa 3.

Página 15 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Como los empleados se seleccionan aleatoriamente para cada programa


el diseño se denomina DISEÑO COMPLETAMENTE ALEATORIZADO
Se observa el aprovechamiento de los empleados en los programas:

TRATAMIENTOS

I c=1 c=2 c=3 J

  Programa 1 Programa 2 Programa 3


r=1 85 80 82
r=2 72 84 80
r=3 83 81 85
r=4 80 78 90
r=5 ** 82 88
Medias 80.00 81.00 85.00 Xj
Media de medias o media
total 82.14

2.2 Tipos de variación y sumas de cuadrados

1. Variación total entre los 14 empleados, su puntuación no fue igual con todos
VARIACIÓN TOTAL RESPECTO A LA MEDIA GENERAL
r c
SCT =∑ ∑ ( Xij−X )2
i=1 j=1

SCT = (85-82.14)2 + (72-82.14)2+(83-82.14)2+.....+(88-82.14)2


SCT = 251.7

2. Variación entre los diferentes tratamientos o Variación entre muestras o


variación entre programa 1, programa 2 y programa 3

EFECTO DE LA MEDIA DE CADA TRATAMIENTO RESPECTO A LA MEDIA GENERAL

r
SCTR =∑ r j ( X j −X )2
j=1

SCTR = 4(79.5 - 81.3333)2 + 5(81 - 81.3333)2 + 5(85 - 81.333)2


SCTR = 65.71

Página 16 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

3. Variación dentro de un tratamiento o muestra o programa dado que no todos los


empleados dentro de un mismo programa obtuvieron los mismos puntajes. Se
denomina Variación dentro de los tratamientos.

VARIACIÓN DENTRO DEL TRATAMIENTO O VARIACIÓN DEL ERROR


CADA VALOR RESPECTO A LA MEDIA DE SU TRATAMIENTO

r c
SCE =∑ ∑ ( X ij−X j )2
i=1 j=1

SCE = SCT - SCTR = 186

4. Grados de libertad

Grados de libertad totales = n - 1 = 14-1 = 13


Grados de libertad de los tratamientos = c - 1 = 3 - 1 = 2
Grados de libertad del error = gl. Totales - gl. Tratamientos = 13 - 2 = 11
gl SCT = gl SCTR + gl SCE
gl SCE = gl SCT - gl SCTR = (n -1) - (c - 1) = n -c

5. Cuadrados medios (Suma Cuadrados/ Grados libertad)


CMT = Cuadrado medio total = SCT / (n-1) = 19.4
CMTR = Cuadrado medio del tratamiento = SCTR / (c -1) = 32.9
CME = Cuadrado medio del error = SCE/ gle.= 16.9

6. Estadístico de prueba Fc y estadístico F crítico de alfa

Fc = CMTR / CME= 1.946745562

F alfa,gl.numerador , gl.denomin ador =Fα ,c−1 ,n−c

Cálculo de F con Excel


=DISTR.F.INV(ALFA, GL. TR, GL. ERR) =DISTR.F.INV(0.05, 2, 11) = 3.982297957

Página 17 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

ZONA DE
NO RECHAZAR RECHAZO

Distr. F

Como Fc es menor a Falfa no se rechaza Ho y las medias son iguales.

7. Valor de P Fc

P = distr.f(Fc, gl. SCTr, gl. SCE) = distr.f(1.946, 2, 11) = 0.18898099


Como P es mayor a alfa no se rechaza Ho
CONCLUSION: NO HAY SUFICIENTE EVIDENCIA PARA RECHAZAR HO, LAS MEDIAS DE
LOS TRATAMIENTOS SON IGUALES

TABLA DE ANOVA

FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO


CUADRADOS LIBERTAD MEDIO VALOR F
Entre muestras (tratam.) SCTR c-1 CMTR CMTR/CME
Dentro de muestras (err.) SCE n-c CME
Variación total SCT n-1 CMT

Regla: No rechazar si la F de la muestra es menor que la F de Excel para una cierta alfa

2.3 Uso de Excel:


 En el menú herramientas seleccione la opción Análisis de datos, en funciones
para análisis seleccione Análisis de varianza de un factor.
 En Rango de entrada seleccionar la matriz de datos (todas las columnas a la
vez).
 Alfa = 0.05
 En Rango de salida indicar la celda donde se iniciará la presentación de
resultados.

Página 18 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

RESUMEN Análisis de varianza de un factor


Grupos Cuenta Suma Promedio Varianza
32.66666
Programa 1 4 320 80 7
Programa 2 5 405 81 5
Programa 3 5 425 85 17

Grados Promedio
ANÁLISIS DE VARIANZA de de
Suma Probabilida
Variaciones cuadrados libertad Cuadrados Fc d F crítica
32.8571428 1.943164 3.9822979
Entre grupos 65.71428571 2 6 4 0.18937731 6
Dentro de 16.9090909
grupos 186 11 1      
Total 251.7142857 13        

2.4 Uso de Minitab


Stat > ANOVA > One Way (Unstacked)
en Responses in separate columns Indicar las columnas de datos
En Confidence Level 95%
Seleccionar Comparisons Tukey 5%
OK

One-way ANOVA: Programa 1, Programa 2, Programa 3

Source DF SS MS F P
Factor 2 65.7 32.9 1.94 0.189
Error 11 186.0 16.9
Total 13 251.7

S = 4.112 R-Sq = 26.11% R-Sq(adj) = 12.67%

Individual 95% CIs For Mean Based on


Pooled StDev

Level N Mean StDev ----+---------+---------+---------+-----


Programa 1 4 80.000 5.715 (------------*------------)
Programa 2 5 81.000 2.236 (----------*-----------)
Programa 3 5 85.000 4.123 (-----------*----------)
----+---------+---------+---------+-----
77.0 80.5 84.0 87.5
Pooled StDev = 4.112

Página 19 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

NOTA: Si los Intervalos de confianza se traslapan, las


medias son iguales estadísticamente

Tukey 95% Simultaneous Confidence Intervals


All Pairwise Comparisons

Individual confidence level = 97.94%

Programa 1 subtracted from:

Lower Center Upper --------+---------+---------+---------+-


Programa 2 -6.451 1.000 8.451 (------------*-----------)
Programa 3 -2.451 5.000 12.451 (-----------*------------)
--------+---------+---------+---------+-
-6.0 0.0 6.0 12.0

Programa 2 subtracted from:

Lower Center Upper --------+---------+---------+---------+-


Programa 3 -3.025 4.000 11.025 (-----------*----------)
--------+---------+---------+---------+-
-6.0 0.0 6.0 12.0

NOTA: Si el cero se encuentra en el intervalo de confianza de la diferencia entre


medias, este par de medias no son diferentes.

2.5 Grafica de residuos contra el valor ajustado de ^y ij

S i el modelo es correcto y las suposiciones se satisfacen, los residuos no deben


tener algún patrón, ni deben estar relacionados con alguna variable, incluyendo la
respuesta Yij. Una comprobación sencilla consiste en graficar los residuos contra los

valores ajustados ^y ij (debe recordarse que para el modelo en un sentido ^y ij- y i. , el


promedio del tratamiento i-ésimo). En esta grafica no debe revelarse ningún patrón
obvio en la siguiente figura se grafican los residuos contra los valores ajustados de los
datos de la resistencia a la tensión del ejemplo 2.3 Ningún patrón inusual es evidente.

Página 20 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Grafica de residuos contra valores ajustados

Un efecto que en ocasiones revela la grafica es el de una varianza variable. Algunas


veces la varianza de las observaciones lo hace. Esto resulta cuando el error es
proporcional a la magnitud de la observación (comúnmente esto sucede en
instrumentos de medición – el error es proporcional a la escala de la lectura). Si este es
el caso, los residuos aumenta a medida que Yij lo hace, y la grafica de los residuos

contra Y ij parecerá un embudo que se ensancha o un altavoz. La varianza variable


también ocurre en casos cuyos datos no tienen distribución normal y están sesgados,
porque en las distribuciones sesgadas la varianza tiende a ser función de la media.

2.6 Ejercicios

1. Cuatro catalizadores que pueden afectar la concentración de un componente en


una mezcla líquida de tres componentes están siendo investigado.

Se obtienen las siguientes concentraciones:


Catalizado
r
A B C D
58.2 56.3 50.1 52.9
57.2 54.5 54.2 49.9
58.4 57 55.4 50
55.8 55.3   51.7
54.9      

Página 21 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

2. Para determinar si existe diferencia significativa en el nivel de Matemáticas de 4


grupos de estudiantes de Ingeniería se realizó un examen aleatorio a 6 individuos por
grupo. Determine cuales son los grupos en los cuales existen diferencias a un 95% de
nivel de confianza.

A B C D
75 78 55 64
93 91 66 72
78 97 49 68
71 82 64 77
63 85 70 56
76 77 68 95

3. Las calificaciones en el examen a 18 empleados de tres unidades de negocio


Se muestran a continuación:
Probar si no hay diferencia entre las unidades a un 5% de nivel de significancia.

A B C
85 71 59
75 75 64
82 73 62
76 74 69
71 69 75
85 82 67

4. Probar si hay diferencia en los tiempos de servicio de 4 unidades de negocio para el


mismo servicio a un nivel de significancia del 5%.
A B C D
5.4 8.7 11.1 9.9
7.8 7.4 10.3 12.8
5.3 9.4 9.7 12.1
7.4 10.1 10.3 10.8
8.4 9.2 9.2 11.3
7.3 9.8 8.8 11.5

Página 22 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

3. ANALISIS DE VARIANZA DE DOS VÍAS o


DIRECCIONES (ANOVA 2 VIAS)

3.1 Introducción

En este caso las fórmulas son parecidas a la del ANOVA de una vía pero ahora
agregando el cálculo por renglones adicional al de columnas donde se incluye la
variable de bloqueo. El bloqueo es completamente al azar.

Se trata de bloquear un factor externo que probablemente tenga efecto en la


respuesta pero que no hay interés en probar su influencia, sólo se bloquea para
minimizar la variabilidad de este factor externo, evitando que contamine la prueba de
igualdad entre los tratamientos.

Los tratamientos se asignan a las columnas y los bloques a los renglones. Un bloque
indica condiciones similares de los sujetos al experimentar con diferentes
tratamientos.

Las hipótesis son:

Ho: No hay diferencia en las medias del factor de columna


Ha: Al menos una media del factor de columna es diferente

Ho: No hay diferencia en las medias de la variable de renglón


Ha: Al menos una media de la variable de renglón es diferente

3.2 Ejemplos con cálculo manual

Ejemplo 1.
Suponiendo que se quiere investigar si la producción de tres diferentes máquinas es
igual, tomando en cuenta la experiencia de los operadores a un nivel de significancia
del 5%.

Experiencia   Máquinas  
de ops. En años Maq 1 Maq 2 Maq 3 Promedios
1 27 21 25 24.33333
2 31 33 35 33
3 42 39 39 40
4 38 41 37 38.66667

Página 23 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

5 45 46 45 45.33333
Promedios 36.6 36 36.2 36.26667

TABLA ANOVA
  SS GL   CM Fc Falfa
SCTR= 0.933333 2 CMTR= 0.466667 Ftr = 0.09 4.46
Fbl =
SCBL= 764.9333 4 CMBL= 191.2333 37.25 3.84
SCE = 41.06667 8 CME= 5.133333    
SCT = 806.9333 14 CMT= 57.6381    

Conclusión: No hay diferencia entre máquinas a pesar de la diferencia en experiencia


de los operadores.

Ejemplo 2 (Problema 4.1 del Texto de Montgomery, Análisis y diseño de


experimentos)

Un químico quiere probar el efecto de 4 agentes químicos sobre la resistencia de un


tipo particular de tela. Debido a que podría haber variabilidad de un rollo de tela a
otro, el químico decide usar un diseño de bloques aleatorizados, con los rollos de tela
considerados como bloques. Selecciona 5 rollos y aplica los 4 agentes químicos de
manera aleatoria a cada rollo. A continuación se presentan las resistencias a la tención
resultantes. Analizar los datos de este experimento (utilizar α=0.05) y sacar las
conclusiones apropiadas.
  Rollo
Agente Químico 1 2 3 4 5
1 73 68 74 71 67
2 73 67 75 72 70
3 75 68 78 73 68
4 73 71 75 75 69

3.3 Procedimiento en Excel


 En el menú herramientas seleccione la opción Análisis de datos, en funciones
para análisis seleccione Análisis de varianza de dos factores con una sola
muestra por grupo.
 En Rango de entrada seleccionar la matriz de datos.
 Alfa = 0.05
 En Rango de salida indicar la celda donde se iniciará la presentación de
resultados.

Página 24 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Análisis de varianza de dos factores con una sola muestra por grupo
Varianz
RESUMEN Cuenta Suma Promedio a
Fila 1 5 353 70.6 9.3
Fila 2 5 357 71.4 9.3
Fila 3 5 362 72.4 19.3
Fila 4 5 363 72.6 6.8

Columna 1 4 294 73.5 1


Columna 2 4 274 68.5 3
Columna 3 4 302 75.5 3
Columna 4 4 291 72.75 2.92
Columna 5 4 274 68.5 1.67

ANÁLISIS DE VARIANZA
Grados Cuadrado Probabilida F
Fuente de Suma de de s Fc d tablas
Cuadrado
variación s libertad medios Valor P
Filas 12.95 3 4.32 2.38 0.12 3.49
Columnas 157 4 39.25 21.61 2.06E-05 3.26
Error 21.8 12 1.82

Página 25 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Total 191.75 19        
Total 231 24        

En la tabla observamos que el estadístico de prueba Fc es menor al valor crítico para F


2.38<3.49, por lo cual no rechazamos al Hipótesis nula H 0. No tenemos evidencia
estadística para afirmar que el agente químico tenga influencia en la respuesta.

Sin embargo observamos que el rollo si tiene influenza significativa en la respuesta


(P<0.05).

3.4 ANOVA en Minitab

Utilice α=0 . 05 para calcular si hay diferencias entre los efectos de las columnas y
los renglones.
Introducir los datos arreglados con las respuestas en una sola columna e indicando a
que renglón y columna pertenece cada uno de estos, como sigue:

Column
Resp a Fila
73 1 1
73 1 2
75 1 3
73 1 4
68 2 1
67 2 2
68 2 3
71 2 4
74 3 1
75 3 2
78 3 3
75 3 4
71 4 1
72 4 2
73 4 3
75 4 4
67 5 1
70 5 2
68 5 3
69 5 4

Instrucciones:

Página 26 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Stat > ANOVA > One two Way


Response Respuesta, indicar Row factor y Column Factor, Seleccionar º! Display
Means
Seleccionar º! Store Residuals º! Store Fits Confidence level 95%

Graphs
Seleccionar Normal plot of residuals
OK
Resultados:

La gráfica normal de residuos debe mostrar los residuos aproximados por una recta
para validar el modelo:

Los residuos se aproximan a la distribución normal por lo cual se concluye que se está
utilizando un modelo válido.

Normal Probability Plot of the Residuals


(response is Resp)
99

95

90

80
70
Percent

60
50
40
30
20

10

1
-3 -2 -1 0 1 2 3
Residual

Two-way ANOVA: Resistencia versus Agente Químico, Rollo

Source DF SS MS F P
Agente Químico 3 12.95 4.3167 2.38 0.121
Rollo 4 157.00 39.2500 21.61 0.000
Error 12 21.80 1.8167
Total 19 191.75

S = 1.348 R-Sq = 88.63% R-Sq(adj) = 82.00%

Página 27 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Como el valor de P es menor a 0.05 el Rollo tiene


influencia significativa en la resistencia.

Individual 95% CIs For Mean Based on


Agente Pooled StDev
Químico Mean ---+---------+---------+---------+------
1 70.6 (----------*----------)
2 71.4 (----------*----------)
3 72.4 (----------*----------)
4 72.6 (----------*----------)
---+---------+---------+---------+------
69.6 70.8 72.0 73.2

Individual 95% CIs For Mean Based on


Pooled StDev
Rollo Mean --+---------+---------+---------+-------
1 73.50 (-----*-----)
2 68.50 (-----*-----)
3 75.50 (-----*-----)
4 72.75 (-----*-----)
5 68.50 (-----*-----)
--+---------+---------+---------+-------
67.5 70.0 72.5 75.0

Se seleccionarían en 2º y 5º rollo ya que tienen los valores más pequeños.

Página 28 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

4. DISEÑOS FACTORIALES

4.1 Principios y definiciones básicas

M uchos experimentos se llevan a cabo para estudiar los efectos producidos


por dos o más factores. Puede mostrarse que en general los diseños
factoriales son los más eficientes para este tipo de experimentos. Por diseño factorial
se entiende aquel en el que se investigan todas las posibles combinaciones de los
niveles de los factores en cada ensayo completo o réplica del experimento. Por
ejemplo, si existen “a” niveles del factor A y “b” niveles del factor B, entonces cada
réplica del experimento contiene todas las “ab” combinaciones de los tratamientos. A
menudo, se dice que los factores están cruzados cuando éstos se arreglan en un diseño
factorial.

El efecto de un factor se define como el cambio en la respuesta producida por un


cambio en el nivel del factor. Con frecuencia, éste se conoce como efecto principal
porque se refiere a los factores de interés primordial del experimento. Por ejemplo,
consideremos los datos de la tabla 1. El efecto principal del factor A podría
interpretarse como la diferencia entre la respuesta promedio en el primer y segundo
nivel de ese factor. Numéricamente:

Factor B
B1 B2

A1 20 30

Factor A

A2 40 52

Tabla 1 Un experimento factorial

40+52 20+30
A= − =21
2 2

En otras palabras incrementar el factor A del nivel 1 al 2 produce un cambio en la


respuesta promedio de 21 unidades. Similarmente, el efecto principal de B es:

30+52 20+40
B= − =11
2 2

Página 29 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Si los factores tienen más de dos niveles, el procedimiento anterior debe ser
modificado ya que las diferencias entre las respuestas promedio pueden expresarse de
muchas formas.

En algunos experimentos puede encontrarse que la diferencia en la respuesta entre los


niveles de un factor no es la misma en todos los niveles de los otros factores. Cuando
esto ocurre existe una interacción entre los factores. Por ejemplo, considérense los
datos de la Tabla 2.

Factor B
B1 B2

A1 20 40

Factor A

A2 50 12

Tabla 2. Un experimento factorial con interacción

En el primer nivel del factor B, el efecto de A es:


A = 50 - 20 = 30
Mientras que en el segundo nivel de B, el efecto de A es:
A = 12 - 40 = 28

Puede observarse que existe una interacción entre los factores A y B porque el efecto
de A depende del nivel elegido de B.

Estas ideas pueden ilustrarse gráficamente. En la Fig. 1 se muestra una gráfica de la


respuesta de los datos de la Tabla 1 contra los niveles del factor A para ambos niveles
del factor B. Se observa que las rectas B 1 y B2 son, aproximadamente, paralelas. Esto
indica que no hay interacción entre los factores. De manera similar, en la Fig. 2 se
presenta una gráfica de la respuesta de los datos de la Tabla 2.

60
B2
50
Respu es ta

B1
40
30 B2
20
B1
10

A1 A2
Factor A
Figura 1 Un experimento factorial sin interacciones

Página 30 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

En este caso se ve que las rectas B 1 y B2 no son paralelas. Esto muestra que existe una
interacción entre A y B. Sin embargo, no debe ser la única técnica para analizar los
datos, porque su interpretación es subjetiva y su apariencia, a menudo, es engañosa.

60 B1
R e s p u e s ta

50
B2
40
30
20
B1
10 B2

A1 A2
Factor A

Figura 2 Un experimento factorial con interacciones

Hay que notar que cuando una interacción es grande los correspondientes efectos
principales tienen poco significado práctico. Una estimación del efecto principal de A
de los datos de la Tabla 2 es:

50+12 20+40
A= − =1
2 2
El cual resulta ser muy pequeño corriéndose el riesgo de concluir que no existe un
efecto debido a A. Sin embargo, cuando se examinó el efecto de A en niveles
diferentes de B se concluyó que éste no era el caso. El factor A tiene un efecto, pero
depende del nivel del factor B. En otras palabras, es más útil conocer la interacción AB
que el efecto principal. Una interacción significativa oculta a menudo el significado de
los efectos principales.

Ventajas de los diseños factoriales

L as ventajas de los diseños factoriales pueden ilustrarse fácilmente. Supongamos


que se tienen dos factores, A y B, cada uno con dos niveles. Estos niveles se
representan mediante A1, A2, B1 y B1. La información acerca de ambos factores puede
obtenerse variando un factor a la vez como aparece en la tabla 3. El efecto de variar el
factor A está dada por A 2B1 -A1B2. A causa de que existe error experimental, es
conveniente realizar, por ejemplo, dos observaciones de cada combinación de
tratamientos y hacer una estimación de los efectos de los factores usando las
respuestas promedio. Por lo tanto, se requiere un total de seis observaciones.

Página 31 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Factor B
B1 B2

A1 A1B1 A1B2

Factor A

A2 A2B1 12

Tabla 3 El método de un factor a la vez

Los diseños factoriales poseen algunas ventajas.

 Son más eficientes que los experimentos de un factor a la vez.

 Los diseños factoriales son necesarios cuando alguna interacción puede estar
presente, para evitar hacer conclusiones engañosas.

 Los diseños factoriales permiten estimar los efectos de un factor en diversos


niveles de los otros factores, produciendo conclusiones que son válidas sobre
toda la extensión de las condiciones experimentales.

4.2 Diseño factorial de dos niveles (2^K)

E l primer diseño de la serie 22 es aquel en el que solo dos factores, A y B, cada uno
con dos niveles. Este diseño se conoce como diseño factorial 2 2. Arbitrariamente,
los niveles del factor pueden llamarse “bajo” y “alto”.

Ejemplo 1 Considérese una investigación llevada a cabo para estudiar el efecto que
tiene la concentración de un reactivo y la presencia de un catalizador sobre el tiempo
de reacción de un proceso químico. Sea la concentración del reactivo el factor A con
dos niveles de interés, 15% y 20%. El catalizador constituye el factor B; el nivel alto o
superior denota el uso de dos sacos de catalizador y el nivel bajo o inferior denota el
uso de un solo saco. El experimento se realiza (“replica o repite”) tres veces, y los
datos son como sigue:

Combinación Replica
de
En la figura 3 siguiente tratamientos I II III Total se presentan
gráficamente las A baja, B baja 28 2 27 80 combinaciones de
tratamiento para este 5 diseño, el efecto de un
factor se denota por la A alta, B baja 36 3 32 100 letra latina minúscula.
2
A baja, B alta 18 1 23 60
Página 32 de973
A alta, B alta 31 3 29 90
0
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

De este modo, “A” se refiere al efecto del factor “A”, y “B” se refiere al efecto del
factor “B”, y “AB” se refiere a la interacción entre AB. En el diseño 2 2 los niveles bajo y
alto de A y B se denotan por “-“ y “+” respectivamente, en los ejes A y B. Así – en el eje
B representa el nivel bajo de catalizador mientras que + denota el nivel alto.

b = 60(18+19+23) ab = 90(31+30+19)
Cantidad de catalizador B

Alto (2 sacos) +

bajo (1 saco) -
(1) = 80(28+25+27) a = 100(36+32+32)

- +
bajo (15%) alto (20%)
Concentracion de reactivo A

Figura
Fig. 3 1: Combinaciones de tratamiento en el diseño factoriall

Las cuatro combinaciones de tratamientos en el diseño pueden representarse por


letras minúsculas, cono se muestra en la figura 3. En esta figura se aprecia que el nivel
superior de cualquier factor de una combinación de tratamientos está representado
por la presencia de la letra minúscula correspondiente, mientras que la ausencia de
esta ultima representa el nivel inferior del factor.

Así

 “a” representa la combinación de tratamientos, en la que A se encuentra en el


nivel superior y B en el nivel inferior;

 “b” representa aquella en la que A se halla en el nivel inferior y B en el superior,


y

 “ab” representa a ambos factores en el nivel superior.

 Por convención (1) se usa para representar a ambos factores en el nivel inferior.
 El efecto promedio de un factor se define como el cambio en la respuesta
producida por un cambio en el nivel de ese factor, promediado sobre los niveles
del otro factor.

Como se ilustra en la figura 3, las letras minúsculas (1), a, b y ab también se usan para
representar los totales de las n replicas de las combinaciones de tratamientos

Página 33 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

correspondientes. Ahora bien, el efecto de A en el nivel B es {a-(1)}/n. Mientras que el


nivel superior B es {ab-b}/n. Tomando el promedio de estas dos cantidades se obtiene:

1 1
A= {[ ab−b ] + [a−(1)] }= [ ab−a−b−(1 )]
2n 2n
El efecto promedio de B se determina a partir de su efecto en el nivel inferior de A (esto
es, {b-(1)}/n, y de su efecto en el nivel superior de A (que es igual a [ab-a]/n
obteniéndose:

1
B= {[ ab−a ] + [b−( 1)] }= 1 [ ab+b-a−( 1)]
2n 2n
El efecto de la interacción AB se define como la diferencia promedio entre el efecto de
A en el nivel superior de B y su efecto en el nivel inferior de B, así:

1
AB= { [ ab−b ]− [ a−(1 )]}= 1 [ab+(1)−a−(b)]
2n 2n
Por otro lado se puede definir AB como la diferencia promedio entre el efecto de B en
el nivel superior de A y el efecto de B en el nivel inferior de A.

Las formulas para los efectos de A, B y AB pueden deducirse por otro método. El efecto
de A puede hallarse como la diferencia en la respuesta promedio de las dos
combinaciones de tratamiento en la mitad derecha (que llamaremos Y A+, puesto
que es la respuesta promedio para las combinaciones de tratamientos a las que A que
se encuentra en el nivel alto) y las dos combinaciones de tratamientos en la mitad
izquierda (o Y A ). Esto es,

A=Y A+−Y A−
ab+a b+(1 )
= −
2n 2n

Página 34 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

1
= [ ab+a−b−(1)]
2n

Este es exactamente el mismo resultado, el efecto de B se encuentra como la


diferencia entre el promedio de las dos combinaciones de tratamientos en la parte
superior del cuadrado ( Y B+) y el promedio de las dos combinaciones de tratamientos
en la parte inferior ( Y ), o
B-

B=Y B+−Y B−
ab+b a+(1 )
= −
2n 2n
1
= [ ab+b−a−(1)]
2n
Finalmente el efecto de interacción AB es el promedio de las combinaciones de
tratamientos en la diagonal de derecha a izquierda del cuadrado ab y (1) menos el
promedio de las combinaciones de tratamientos en la diagonal de izquierda a derecha
(a y b), o

ab+(1) a+b
AB= −
2n 2n
1
= [ ab+(1 )−a−b ]
2n
Con los datos que aparecen en la figura 1, las estimaciones de los efectos promedio
son:

1
A= (90+100−60−80 )=8.33
2(3)

Página 35 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

1
B= (90+60−100−80 )=−5.00
2(3)
1
AB= (90+80−100−60 )=1.67
2(3)
El efecto de A (concentración de reactivo) es positivo; esto sugiere que al elevar A del
nivel bajo (15%) al nivel alto (25%) incrementará el rendimiento. El efecto de B
(catalizador) es negativo; esto sugiere que elevar la cantidad del catalizador agregada
al proceso reducirá el rendimiento. Al parecer, el efecto de interacciones es pequeño
comparado con los dos efectos principales.

En muchos experimentos que implican diseños 2 K se examina la magnitud y la


dirección de los efectos de los factores para determinar cuales variables es probable
que sean importantes. Por lo general puede emplearse el análisis de varianza para
confirmar esta interpretación. En el diseño 2 k existen algunos métodos rápidos
especiales para realizar los cálculos del análisis de varianza.

Consideremos la suma de cuadrados para A, B y AB. Obsérvese la primera ecuación


que se utiliza un contraste para estimar A; esto es,

ContrasteA=ab +a−b−( 1)

Este contraste suele llamarse efecto total de A. A partir de la segunda y tercera


ecuación, puede apreciarse que también se utilizan contraste para estimar B y AB.
Además, estos tres contrastes son ortogonales. La suma de cuadrados de cualquiera de
ellos puede calcularse usando la siguiente ecuación:

a 2 a
SSc= ( ∑ ciyi .) /n ∑
1 a
ci
2
.

Esta ecuación establece que la suma de cuadrados de contraste es igual al contraste


elevado al cuadrado entre el producto del número de las observaciones de cada total
del contraste por la suma de cuadrados de los coeficientes del mismo. En
consecuencia, se obtiene que las sumas de cuadrados de A, B y AB sean:

Página 36 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

2
[ ab+a−b−(1 )]
SS A=
n*4
2
[ ab+b−a−(1) ]
SSB=
n*4
2
[ ab+(1 )−a−b ]
SSAB=
n*4
Con los datos de la figura 3, las sumas de cuadrados se pueden calcular aplicando las
ecuaciones anteriores, obteniéndose:

502
SS A= =208.33
4(3)
−302
SSB= =75.00
4 (3 )
102
SSAB= =8.33
4 (3 )
La suma total de cuadrados se determina de la manera usual mediante:

2 2 nY 2 ...
2
SST= ∑i=1 ∑ j=1 ∑ k=1 Y ijk−
4n
En general SST tiene 4n –1 grados de libertad. La suma de cuadrados del error, con 4(n-
1) G.L. se puede calcular en la forma usual, por diferencia, mediante.

2 2 3
Y2 2
SSE= ∑ ∑ ∑ Y − =9398.00−9075 .00=323.00
ijk
i=1 j= 1 k =1 4 (3 )
SSE=SST −SSA −SSB−SSAB
=323 . 00−208 .33−75 . 00−8 . 33=31 . 34

Página 37 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

El análisis de varianza completo se presenta en la tabla siguiente. Ambos efectos


principales son significativos al 1%.

A menudo se es conveniente escribir las combinaciones de tratamientos en el orden


(1), a, b, y ab. Este orden se conoce como orden estándar. Cuando se utiliza es posible
apreciar que los coeficientes de los contrastes usados para estimar los efectos son

Efecto (1) a b Ab
s
A: -1 +1 -1 +1
B: -1 -1 +1 +1
AB: +1 -1 -1 +1

Tabla ANOVA para los datos del ejemplo 1 es la siguiente:

Fuente de
variación SS G.L. MS Fo
A 208.33 1 208.33 53.15a
B 75.00 1 75.00 19.13a
AB 8.33 1 8.33 2.13
Error 31.34 8 3.92
Total 323.00 11
a
significativo al 1%

Signos algebraicos para calcular los efectos en un diseño 22

Combinación Efecto Factorial


De
Tratamientos I A B AB

(1) + - - +
a + + - -
b + - + -
ab + + + +

Observe que los coeficientes de los contrastes usados para estimar la interacción son
iguales al producto de los coeficientes correspondientes a los dos efectos principales.
Los coeficientes de los contrastes siempre son +1 o –1 y se puede usar una tabla de
signos positivos y negativos como la mostrada en la de signos algebraicos para
determinar el signo apropiado de cada combinación de tratamientos. En el encabezado
de las columnas de tabla y se encuentran los efectos principales (A y B), la interacción

Página 38 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

AB, e I, que representa el total el total o el promedio de todo el experimento. Se


observa que la columna encabezada por I se compone de solo de signos positivos. Los
renglones corresponden a las combinaciones de tratamientos.

Para encontrar un contraste con el fin de estimar cualquier efecto, simplemente se


multiplican los signos de la columna apropiada de la tabla por la correspondiente
combinación de tratamientos, y se suma. Por ejemplo, el contraste para estimar A es –
(1) + a – b + ab, lo cual concuerda con la ecuación.

1 1
A= { [ ab−b ] + [a−( 1) ] }= [ ab−a−b−(1 ) ]
2n 2n
Los tipos más sencillos de diseños factoriales implican sólo dos factores o conjuntos de
tratamientos. Haya “a” niveles del factor A y “b” niveles del factor B, dispuestos en un
diseño factorial; esto es, cada A repetición o réplica del experimento contiene todas las
combinaciones de tratamiento ab. En general, hay n repeticiones.

Página 39 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

5. DISEÑOS DE EXPERIMENTOS FRACCIONALES DE


DOS NIVELES

5.1 Concepto de replicación fraccionada

Conforme el número de factores del experimento crece, el número de casillas o


condiciones experimentales (y por lo tanto el número de lecturas o pruebas
necesarias), crece exponencialmente en un experimento factorial. El número de
efectos a evaluar (interacciones principalmente) crece exponencialmente también. El
número de efectos y casillas varía con el número de factores en una relación como se
muestra en la tabla siguiente para un experimento factorial 2 k.

No. De No. De Efectos Interacciones entre factores de


factores casillas principales 1 3 4 5 6 7 8
4 16 4 6 4 1
5 32 5 10 10 5 1
6 64 6 15 20 15 6 1
7 128 7 21 35 35 27 7 1
8 256 8 28 58 70 56 28 8 1

Así por ejemplo cuando se tienen siete factores, existen 128 posibles condiciones
experimentales, lo que implica que al hacer una replicación por celda de todo el
experimento requiere un total de 128 observaciones. Si se decide tomar dos replicas
por celda, entonces serian necesarias 256 observaciones, lo cual es una cantidad
excesiva de pruebas para fines prácticos.

Por otro lado, se necesitan 128 observaciones para un experimento con 7 factores por
que se deben evaluar 127 posibles efectos (que son los grados de libertad totales en
128 observaciones) de estos efectos 7 son los factores principales, 21 interacciones de
2 factores, 35 de tres, 35 de cuatro, 27 de cinco en cinco, 7 de seis en seis y una
interacción de 7 factores. En general el número de interacciones de k factores tomados
r en r es:

K!
[ r!(k−r)! ]
El concepto de replicación fraccionada parte de las siguientes hipótesis:

Página 40 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

1. Las interacciones de tres o más factores son sumamente raras en la práctica,


por lo que en general se pueden suponer como no existentes.

2. En un experimento de varios factores lo más probable es que solo algunos de


ellos sean relevantes para la variable de respuesta.

3. La mayor parte del efecto se debe a los factores principales y algunas


interacciones de dos factores.

Lo anterior implica que por ejemplo para siete factores son necesarios probablemente
solo 28 grados de libertad (7 factores principales y 21 interacciones de dos factores), y
esto equivale a solo 29 unidades de información y no 128 como en el experimento
original. Esto quiere decir que no es necesario el correr una replicación completa de
todo el experimento cuando el número de factores crece, sino solamente algunas
casillas o condiciones experimentales.

Cuando solamente una parte de las posibles casillas se prueban, se dice que se tiene
una replicación fraccionada del experimento.
Las preguntas que surgen son:

1. ¿Cuántas y cuales casillas probar?


2. ¿Cómo analizar los resultados?
3. ¿Qué información se pierde?

El responder a estas preguntas es uno de los objetivos de la replicación fraccionaria.

5.2 Fracción un medio del diseño 2k

C onsidérese el caso en el que se estudian tres factores de dos niveles cada uno,
pero en el que los experimentadores no pueden costear las 2 3 = 8 combinaciones
de tratamientos, sin embargo, si se puede costear 4 observaciones. Esto sugiere una
fracción un medio, de un diseño 2 3. la fracción un medio del diseño 2 3 se conoce
también como un diseño 23-1 porque tiene 23-1 = 4 combinaciones de tratamiento.

En la tabla 1 aparecen signos positivos y negativos del diseño 2 3. Supóngase que para
componer la fracción un medio, se seleccionan las combinaciones de tratamientos se
usa indistintamente la notación convencional (a,b,c,...) y la de signos positivos y
negativos. La equivalencia de las dos notaciones se muestra a continuación.

Página 41 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Notación Notación 2
1
a + - -
b - + -
c - - +
abc + + +

Combinación Efecto factorial


de
Tratamientos I A B C A AC BC ABC
B
a + + - - - - + +
b + - + - - + - +
c + - - + + - - +
abc + + + + + + + +
ab + + + - + - - -
ac + + - + - + - -
bc + - + + - - + -
(1) + - - - + + + -

Tabla 1 Signos positivos para el diseño 23

Nótese que el diseño 23-1 se forma al seleccionar solo las combinaciones de


tratamientos que producen un signo positivo sobre la columna ABC. Por esto ABC se
denomina generador de una fracción particular. Además, la columna identidad I
siempre es positiva, por lo cual:
I = ABC

Se denominara relación definitoria de nuestro diseño, en general, la relación definitoria


de un factorial fraccionario siempre es el conjunto de todas las columnas que son
iguales a la columna identidad I.
abc bc

c ac

b ab
C
B
A
a (1 )

(a) Fracción principal I = ABC (b) Fracción alterna I = -ABC

Página 42 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Las combinaciones de tratamientos del diseño 23-1 producen 3 G.L. que pueden usase
para estimar los efectos principales. En la tabla 1 se muestra que las combinaciones
lineales de las observaciones que se utilizan para estimar los efectos principales A, B, y
C son:

L A =1/2(a−b−c+abc)
L B =1/2(−a+b−c+abc)
L C =1/2(−a−b+c+abc)
L BC=1/2(a−b−c+abc)
L AC=1/2(−a+b−c+abc)
L AB=1/2(−a−b+c+abc)

Por lo tanto LA = LBC, LB = LAC y LC = LAB. En consecuencia, es imposible distinguir


entre A y BC, entre B y AC y entre C y AB. De hecho, es posible mostrar que cuando se
estima A, B y C, en realidad, lo que sé esta haciendo es estimar A + BC, CB + AC y C +
AB, respectivamente. Dos o más efectos que tienen esta propiedad se conoce como
alias. En este ejemplo, A y BC, B y AC y C y AB son alias. Esto se indica empleando la
notación:

L A → A +BC,
L B →B+AC
L C →C+AB
La estructura de los alias de este diseño pueden determinarse fácilmente con la
relación I = ABC, multiplicando cualquier efecto por la relación que define al diseño,
modulo 2, da como resultado los alias de dicho efecto. En el ejemplo anterior, los alias
son:

A*I = A*ABC = A2BC

O dado que el cuadrado de cualquier columna es simplemente la identidad I.

A = BC

De modo similar, se encuentra que los alias de B y C son:

Página 43 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

B*I = B*ABC = AB2C = AC


C*I = C*ABC = ABC2 = AB

Esta fracción un medio o semifracción, con I = +ABC, suele llamarse fracción principal.

Ahora supóngase que se eligió la otra mitad de la réplica. Esta se compone de las
combinaciones de tratamientos de la tabla 1 que tiene signo negativo asociado con
ABC. Esta fracción un medio o alterna que consta de las siguientes corridas:

Notación Notación 2
1
(1) ---
ab ++-
ac +-+
abc -++

La relación definitoria de este diseño es:


I = -ABC

Usando la fracción alterna, las combinaciones lineales de las observaciones, L’A, L’B y
L’C, son:

L' A → A−BC
L' B →B−AC
L' C →C−AB

Por lo tanto, en realidad se está estimando A – BC, B – AC y C – AB al estimar A, B y C


con esta fracción. En la práctica, no importa cual de las dos fracciones se utilice.
Generalmente la fracción asociada con I = +ABC se denomina fracción principal. Ambas
fracciones pertenecen a la misma familia; en otras palabras, estas dos fracciones
forman el diseño 23 completo.

5.3 Resolución del diseño

E l diseño anterior 23-1 se conoce como diseño de resolución III. En tal diseño los
alias de los efectos principales son interacciones de dos factores. Un diseño es
resolución R si ningún efecto de p factores es alias de otro efecto que tenga menos R –
p factores. Usualmente, se emplea el numeral romano como subíndice para indicar la

Página 44 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

resolución del diseño. Así, la fracción un medio del diseño 2 3 definido por la relación I =
3−1
2III
ABC (o bien I = - ABC) constituye un diseño .

Los diseños de resolución III, IV y V son de importancia primordial. A continuación, se


presenta la definición de estos diseños junto con un ejemplo.

1. Diseño con resolución III: éstos son diseños en los que ningún efecto principal es
alias de otro, pero si lo son de las interacciones de dos factores; a su vez, estas
últimas son alias entre sí. El diseño 23-1 de la tabla 4.1 es de resolución III.

2. Diseño con resolución IV: En estos diseño ningún efecto principal es alias de otro
efecto principal, o bien, de alguna interacción de dos factores. Las interacciones
de dos factores son “alias” entre sí. Un diseño 2 4-1 con I = ABCD es de resolución
4−1
IV ( 2IV ).

3. Diseños resolución V: Estos son diseños en los que ningún efecto principal o
interacción de dos factores es alias de ningún efecto principal o interacciones
5−1
entre dos factores, un diseño 25-1 con I = ABCDE es de resolución V ( 2V ).

En general, la resolución de un diseño factorial fraccionario de dos niveles es igual al


mínimo número de letras de cualquier palabra de la relación que define al diseño. En
consecuencia, los diseños anteriores, a menudo, se conocen como diseños de 3, 4 y 5
letras, respectivamente. Por lo general se deben usar diseños fraccionarios con la
mayor resolución posible congruentes con el fraccionamiento requerido. A mayor
resolución, las suposiciones relativas a las interacciones que deben despreciarse con el
propósito de hacer una interpretación única de los datos son menos restrictivas.

Página 45 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

6. DISEÑOS DE EXPERIMENTOS FACTORIALES


COMPLETOS

6.1 Diseño factorial completo de 2 factores

Un ingeniero decide probar los tres materiales de la cubierta, único factor controlable
a tres niveles de temperatura (15, 70 y 125 °F) consistentes en el entorno de uso final
del producto. Se prueban cuatro baterías a cada combinación de material de la
cubierta y temperatura, y las 36 pruebas se ejecutan al azar.

En la tabla 1 se presentan el experimento y los datos resultantes de duración


observada de las baterías.

En este problema, el ingeniero desea contestar las siguientes preguntas:

1. ¿Qué efecto tienen el tipo de material y la temperatura sobre la duración de la


batería?
2. ¿Existe una elección del material que dé por resultado una duración uniformemente
larga sin importar la temperatura?

Temperatura F
Tipo de material 15 70 125
1 13 155 34 40 2 70
0 0
74 180 80 75 8 58
2
3 15 188 126 122 2 70
0 5
15 126 106 115 5 45
9 8
3 13 110 174 120 9 104
8 6
16 160 150 139 8 60
8 2

Tabla 1. Duración en horas para el ejemplo del diseño de una batería

Esta última pregunta reviste particular importancia. Existe la posibilidad de hallar un


material que no sea muy afectado por la temperatura. De ser así, el ingeniero puede
hacer que la batería sea robusta a la variación de temperatura en el campo. Éste es un

Página 46 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

ejemplo del uso del diseño experimental estadístico para el diseño de un producto
robusto (o consistente), un importante problema de ingeniería.

Este diseño es un ejemplo específico del caso general de un diseño con dos factores
(bifactorial). Para pasar al caso general, sea Yijk la respuesta observada cuando el
factor A se encuentra en el i-ésimo nivel (i -1, 2,..., n). En general, los datos observados
se verán como en la tabla 2. El orden en el cual se toman las abn observaciones es
aleatorio, de modo que éste es un diseño completamente aleatorizado.

Tabla 2. Disposición general para un diseño bifactorial

Las observaciones pueden describirse mediante el modelo estadístico lineal:

{ {
Yijk=μ+τi+βj+(τβ)ij+εijk ¿ i=1,2,. .,a ¿ j=1,2,. .,b ¿¿¿¿
En donde  es el efecto medio general, i es el efecto del i-ésimo nivel del factor
renglón A, j es el efecto del j-ésimo nivel del factor columna B, ()ij es el efecto de la
interacción entre i y j, ijk es el componente del error aleatorio. Inicialmente se
supone que ambos factores son fijos y que los efectos de tratamiento se definen como
a b

desviaciones de la media general, por lo tanto. ∑i=1 τi=0; ∑ j=1


βj=0
Se supone que los
a

efectos de interacción son fijos y que se definen dé manera que: ∑i=1 ( τβ ) ij=0 . Hay
un total de abn observaciones porque se realizan n réplicas.

Página 47 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

En un diseño factorial de dos factores, tanto los factores (o tratamientos) de renglón


como de columna tienen la misma importancia, específicamente el interés consiste en
probar hipótesis acerca de la igualdad de los efectos de tratamiento de renglón, es
decir:

Ho: τ 1=¿ τ2=.. τ a=0 ¿ H1: al menos una τ i≠0


Y de la igualdad de los efectos de tratamiento de columna:

Ho: β 1=¿ β2=.. β b=0 ¿ H1: al menos una β j≠0


También es interesante determinar sí los tratamientos de renglón y columna
interaccionan. En otras palabras, resulta conveniente probar:

Ho:( τβ) ij=0 para toda i,j


H1: al menos una ( τβ )ij≠0
A continuación, se muestra cómo pueden probarse estas hipótesis usando un análisis
de variancia bifactorial o bidireccional (de dos factores o en dos sentidos).

6.2 Análisis Estadístico del Modelo de Efectos Fijos

S ea Yi..; el total de las observaciones bajo el i-ésimo nivel del factor A; Y.j. El total
de las observaciones bajo el j-ésimo nivel del factor B, Yij. El total de las
observaciones de la ij-ésima celda, e Y... el total general de todas las observaciones. Se

definen Y Y i..; . j. y ij. y ...


Y Y como los promedios de renglón, columna, celda y
general, respectivamente, matemáticamente:

Página 48 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

b n
Yi..
Yi..=∑ ∑ Yijk Y i..= ;i=1,2,...,a
j=1 k=1 bn
a n
Y. j.
Y . j.=∑ ∑ Yijk Y . j.= ;j=1,2,...,b
i=1 k=1 an ¿
n
Y ... {
Yij.=∑ Yijk Y ij.= ; ¿ i=1,2,...,a ¿¿¿
k=1 n
¿
La suma total de cuadrados corregida puede expresarse mediante:

abn a b ab abn
2 2
¿a ¿∑ ∑(Yijk−Y. ) =¿bn∑(Yi.−Y. )+an∑(Y.j−Y. )+n∑ (Yij.−Yi.−Y.j+Y. ) ¿ +∑ ∑(Yijk-Yij.) ¿
2 2 2

i=1 j=1 i=1 j=1 i=1 j=1k=1


i=1 j=1 k=1
Dado que los seis productos cruzados del segundo miembro de la ecuación anterior
son iguales a cero. Se observa que la suma total de cuadrados se ha descompuesto en
una suma de cuadrados debida a los “renglones” o al “factor” A (SS A) en una suma de
cuadrados debida a las "columnas" o al factor B (SSB), en una suma de cuadrados
debida a la interacción entre A y B (SSAB), y en una suma de cuadrados debida al error
(SSE): Analizando el último término del miembro derecho de la Ecuación anterior es

Página 49 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

posible observar que es necesario tener al menos dos réplicas (n  2) para poder
obtenerla suma de cuadrados del error.

Simbólicamente, la Ecuación anterior puede expresarse mediante:

SS T=¿ SS A+ ¿ SS B+ ¿ SSAB+ ¿ SS E ¿¿¿¿


Los grados de libertad asociados a cada suma de cuadrados son:

Efecto Grados de libertad


A a-1
B b-1
Interacción AB (a-1)(b-1)
Error ab(n-1)
Total abn-1

Esta descomposición del total de abn -1 grados de libertad para las sumas de
cuadrados se puede justificar como sigue: Los efectos principales de A y B tienen a y b
niveles, respectivamente, por lo tanto, tienen a -1 y b -1 grados de libertad como se
muestra.

Los grados de libertad de la interacción simplemente corresponden a los grados de


libertad de cada celda (los cuales son iguales a ab -1) menos los grados de libertad de
los dos efectos principales A y B en otras palabras, ab -1 -(a -1) -(b -1) -(a- 1)(b -1).
Dentro de cada una de las ab celdas hay n -1 grados de libertad entre las n réplicas, por
lo tanto, hay ab(n -1) grados de libertad del error.

Se observa que la suma de los grados de libertad de los términos del miembro derecho
de la ecuación anterior es igual al total de los grados de libertad.

Cada suma de cuadrados dividida entre sus grados de libertad produce una media de
cuadrados.

Por lo tanto, para probar el significado de ambos efectos principales, así como de su
interacción, simplemente deben dividirse las medias de cuadrados correspondientes
entre la media de cuadrados del error. Valores grandes de estas razones implican que
los datos no concuerdan con las hipótesis nulas.

Si se considera que el modelo estadístico es adecuado y que los términos del error ijk
son independientes con distribuciones normales con variancia constante 2, entonces
las razones de las medias de cuadrados MS A/MSE, MSB/MSE y MSAB/MSE tienen

Página 50 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

distribución F con a -1, b- 1 y (a -1)(b -1) grados de libertad en el numerador,


respectivamente, y ab(n -1) grados de libertad en el denominador. Las regiones críticas
corresponden al extremo superior de la distribución F. Usualmente la prueba se
presenta en una tabla de análisis de variancia como la que aparece en la tabla 2.

Fuente de
Variación SS G.L. MS Fo
Tratamientos A SSA a - 1 MS A = MS A
SS A MS E
a−1
Tratamientos B SSB b-1
MS B = MS B
SS B MS E
b−1
Interacción SSAB (a - 1)(b -
MS AB= MS AB
1)
SS AB MS E

(a−1)(b−1)
Error SSE ab(n-1)
MS B=
SS E
ab(n−1)
Total SST abn - 1

Tabla 2 ANOVA para el modelo bifactorial de efectos fijos

Es posible obtener las fórmulas para calcular las sumas de cuadrados de la ecuación
anterior. La suma total de cuadrados se calcula en forma usual mediante:
b n 2
a
Y .. .2
SS T= ∑ ∑ ∑ Y ijk−
i=1
j=1 k=1 abn

Las sumas de cuadrados para los efectos principales son:

Página 51 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Y 2 i.. Y 2 .. .
a

SS A =∑ −
bni=1 abn
Y 2 . j. Y 2 .. .
b

SS B=∑ −
anj=1 abn
Es conveniente obtener SSAB en dos etapas. Primero se calcula la suma de cuadrados
entre los totales de las ab celdas, conocida como la suma de cuadrados debido a los
"subtotales":

a b
Y 2 ij. Y 2 ...
SSsubtotales=∑ ∑ −
i=1 j=1 n abn
Esta suma de cuadrados contiene a la SS A y SSB. Por lo tanto, la segunda etapa consiste
en calcular SSAB mediante:

SS AB=¿ SSsubtotales−¿ SS A− ¿ SSB ¿¿¿


La SSE se calcula por diferencia:

SS E=¿SST−¿SSAB−¿SSA−¿SSB ¿o bien:¿ SSE=¿SST−¿SSSubtotales ¿¿¿


¿
Ejemplo: Más sobre el experimento de diseño de una batería. En la tabla 3 se presenta
la duración efectiva (en horas) observada en el ejemplo de diseño de una batería
descrito en la anterior Los totales de renglón y de columna se indican en los márgenes
de la tabla; los números subrayados son los totales de celda.

Ti Temperatura (F)
po
de
15 70 125 Yi..
M
at.

Página 52 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

1 1 1 3 4 2 7
3 5 4 0 0 0
2 2
0 5 539 / 4= 99
2 3
7 1 8
134. 758 7 9
8 5
0
4 8 0 5 2 8
0
2 1 1 1 1 2 7
5 8 3 2 5 0
4 1
0 8 6 2 13
623 7 9
1 1 1 1 5 4 00
9 8
5 2 0 1 8 5
9 6 6 5
3 1 1 1 1 9 1
3 1 7 2 6 0
5 3
8 0 4 0 4 15
576 8 4
1 1 1 1 8 6 01
3 2
6 6 5 3 2 0
8 0 0 9
Y.j 1738 1291 770 Y...
.= =
37
99

Tabla 3. Duración (en horas) para el experimento de diseño de una batería

Las sumas de cuadrados se calculan a continuación:

a b n
Y 2. . . 2
SST= ∑ ∑ ∑ Y ijk− =
i= 1 j=1 k= 1 abn
2
2 2 2 2 3799
130 +155 +74 +.. .+60 − =77,646. 97
36

Página 53 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

a
Y 2 i.. Y 2 ...
SSmaterial=∑ − =
i=1 bn abn
998 +1300 +15012 3799 2
2 2

(3)(4 )
−36 =10,683.72
b 2
Y . j . Y 2 ...
SStemperatura=∑ − =
j=1 an abn
1738 2 +1291 2+7702 37992
(3)(49
−36 =39,118.72
a b
Y 2 ij. Y 2 ...
SSinteraccion= ∑ ∑ − =
i =1 j=1 n abn
2 2 2 2
539 +229 +...+342 3799
4
−36 −10,683.72−
−39,118 .72=9,613.78

SSE=SS T−SSmaterial −SS temperatura−SS interaccion


SSE=77,646 . 97−10,638 . 72−39,118. 72−9,613.78=
18,230. 75

El análisis de variancia aparece en la tabla 4. Se concluye que existe una interacción


significativa entre el tipo de material y la temperatura porque F 0.05,4.27 = 2.73. Además,
también son significativos los efectos principales del tipo de material y de la
temperatura, porque FO.O5.2.27 = 3.35.

Página 54 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Fuente de G.L
variación SS . MS Fo
Tipo de material 10,683.7 2 5,341.86 7.91
2
Temperatura 39,118.7 2 19,558.3 28.97
2 6
Interacción 9,613.78 4 2,403.44 3.56
Error 18,230.7 27 675.21
5
Total 77,646.9 35
7

Tabla 4. ANOVA para los datos de la duración de la batería

Como auxiliar en la interpretación de los resultados de este experimento resulta útil la


construcción de una gráfica de las respuestas promedio de cada combinación de
tratamiento. Esta gráfica se muestra en la figura 1.

175

150
Duracion promedio

125
Yij. 100
Material tipo 3
75
50 Material tipo 1
Material tipo 2
25

15 70 125
Temperatura

Figura 1. Gráfica de respuesta vs temperatura

Página 55 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

El hecho de que las rectas no sean paralelas indica una interacción significativa. En
general, a menor temperatura mayor duración, independientemente del tipo de
material.

Al variar la temperatura de baja a intermedia, la duración aumenta con el material tipo


3, mientras que disminuye con los materiales tipo 1 y 2,

Cuando la temperatura varía de intermedia a alta, la duración disminuye con los


materiales tipo 2 y 3, mientras que con el tipo 1 esencialmente permanece sin cambio.
Al parecer, el material tipo 3 da los mejores resultados si lo que se desea es menor
perdida de duración efectiva al cambiar la temperatura.

Para comprobar si el modelo es adecuado, se analizan los residuos que tengan un


comportamiento aleatorio y normal.

Página 56 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

7. DISEÑO DE EXPERIMENTOS TAGUCHI

7.1 Introducción

La parte fundamental de la metodología ideada por el matemático japonés G. Taguchi


es la optimización de productos y procesos, a fin de asegurar productos robustos, de
alta calidad y bajo costo.

La metodología Taguchi consta de tres etapas:

a) Diseño del sistema


b) Diseño de parámetros
c) Diseño de tolerancias

De estas tres etapas, la más importante es el diseño de parámetros cuyos objetivos


son:
a) Identificar qué factores afectan la característica de calidad en cuanto a su magnitud
y en cuanto a su variabilidad.
b) Definir los niveles “óptimos” en que debe fijarse cada parámetro o factor, a fin de
optimizar la operación del producto y hacerlo lo más robusto posible.
c) Identificar factores que no afectan substancialmente la característica de calidad a
fin de liberar el control de estos factores y ahorrar costos de pruebas.

Para lograr lo anterior se ha manejado una serie de herramientas estadísticas conocida


como diseño de experimentos, tratadas anteriormente.

Taguchi ha propuesto una alternativa no del todo diferente que se que conoce como:
Arreglos Ortogonales y las Gráficas Lineales.

La herramienta utilizada normalmente son diseños Factoriales fraccionados, sin


embargo cuando el número de factores se ve incrementado, las posibles
interacciones aumentan, así como la complicaciones para identificar cuáles son las
condiciones específicas a experimentar.

Un arreglo ortogonal se puede comparar con una replicación factorial fraccionada, de


manera que conserva el concepto de ortogonalidad y contrastes. Un experimento
factorial fraccionado es también un arreglo ortogonal .

Página 57 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Taguchi desarrolló una serie de arreglos particulares que denominó:

La (b)C

Donde:
a = Representa el número de pruebas o condiciones experimentales que se tomarán.
Esto es el número de renglones o líneas en el arreglo.
b = Representa los diferentes niveles a los que se tomará cada factor.
c = Es el número de efectos independientes que se pueden analizar, esto es el
número de columnas.

7.2 Arreglos ortogonales para experimentos a dos niveles


En esta sección, se analiza qué son, cómo se usan y cuáles son los arreglos ortogonales
más importantes para experimentos en los que cada factor toma dos niveles.
Un arreglo ortogonal es una tabla de números. Como ejemplo de un arreglo ortogonal

F A C T O R E S (c)
No. (a) A B C Resultado
1 1 1 1 Y1
2 1 2 2 Y2
3 2 1 1 Y3
4 2 2 1 Y4

1 , 2 = Niveles de los Factores (b)

tenemos el siguiente:
De acuerdo con la notación empleada por Taguchi al arreglo mostrado como
ejemplo, se le llama un arreglo L4, por tener cuatro renglones.
En general, para un arreglo a dos niveles, el número de columnas (efectos o factores)
que se pueden analizar, es igual al número de renglones menos 1.

Taguchi ha desarrollado una serie de arreglos para experimentos con factores a dos
niveles, los más utilizados y difundidos según el número de factores a analizar son:

No. de factores a Arreglo a No. de condiciones a probar


analizar utilizar
Entre 1 y 3 L4 4
Entre 4 y 7 L8 8
Entre 8 y 11 L12 12
Entre 12 y 15 L16 16

Página 58 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Entre 16 y 31 L32 32
Entre 32 y 63 L64 64

El arreglo ortogonal más popular es el arreglo L8, que se muestra a continuación


junto con sus gráficas lineales:

L8 Col.1 Col. 2 Col. 3 Col. 4 Col. 5 Col. 6 Col. 7


Exp. No.              
1 1 1 1 1 1 1 1
2 1 1 1 2 2 2 2
3 1 2 2 1 1 2 2
4 1 2 2 2 2 1 1
5 2 1 2 1 2 1 2
6 2 1 2 2 1 2 1
7 2 2 1 1 2 2 1
8 2 2 1 2 1 1 2

Matriz o
tabla de
interaccione
s
Columnas 1 2 3 4 5 6 7
1 (1) 3 2 5 4 7 6
2   (2) 1 6 7 4 5
3     (3) 7 6 5 4
4       (4) 1 2 3
5         (5) 1 2
6           ¡(1) 6
7             (7)

1 3 2
3 5
1
.7 5 4
6
2 6 4
(a)
(b) 7

Página 59 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Gráficas lineales

Los pasos para un diseño de experimentos de parámetros en el caso de menor es


mejor son:

7.3 Caso menor es mejor


1. Seleccionar una característica de calidad de salida a ser optimizada.
2. Seleccionar factores de control y sus niveles, identificando sus posibles interacciones.
3. Seleccionar los factores de ruido y sus niveles; si son demasiados combinarlos en dos o
tres factores combinados.
4. Seleccionar los arreglos interno y externo adecuados; asignar los factores de control al
arreglo interno y los factores de ruido al arreglo externo.
5. Realizar los experimentos.
6. Realizar análisis estadístico con base en S/N para identificar los niveles de los factores
de control óptimos Algunas veces ayuda realizar un estudio de la interacción entre
factores de control y de ruido.
7. Realizar análisis estadístico con base en las medias para identificar los niveles de los
factores de control óptimos que ajustan a la respuesta promedio en el nivel deseado.
Si hay conflicto entre los niveles de los factores para maximizar la relación S/N y
ajustar la media, dar prioridad a los que sirven para maximizar la relación S/N.
8. Predecir el desempeño de salida óptimo con base en una combinación óptima de
niveles de factores de control y realiza un experimento confirmatorio.

Ejemplo: Disminución de la contaminación


Optimización de un método de purificación para drenajes contaminados con metales.
Las aguas residuales que contienen iones metálicos es muy riesgoso por su toxicidad y
no biodegradable. Se propone utilizar óxidos de hierro hidratados con un pH adecuado
para remover los metales dañinos. La característica de salida es la concentración
remanente de metales en mg/L, con una respuesta menor es mejor.

Los factores de control son los siguientes:


  Factores de control Nivel 1 Nivel 2 Nivel 3
A Contaminación de FeII 2 7 15
B Temperatura ºC 25 50 75
C Tiempo de añejamiento h 1 2 3
D pH 8 10 12

Página 60 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

El factor de ruido introducido artificialmente es permanganato de potasio.


  Factores de ruido Nivel 1 Nivel 2 Nivel 3
N Conc. De KMnO4 0.00375 0.0375 0.075

Se asume que no hay interacciones por lo que se puede utilizar un arreglo L9,
realizando los experimentos se obtienen los datos siguientes con dos réplicas en cada
nivel del factor de ruido:

L9 Col.1 Col. 2 Col. 3 Col. 4 N1 N1 N2 N2 N3 N3


Exp. A B C D
No. Rep. 1 Rep. 2 Rep. 1 Rep. 2 Rep. 1 Rep. 2 Y promedio S/N
1 1 1 1 1 2.24 0.59 5.29 1.75 155.04 166.27 55.20 -39.36
2 1 2 2 2 1.75 5.07 1.05 0.41 0.38 0.48 1.52 -7.05
3 1 3 3 3 5.32 0.65 0.4 1.07 0.51 0.36 1.39 -7.05
4 2 1 2 3 0.37 0.32 0.34 0.68 4.31 0.65 1.11 -5.19
5 2 2 3 1 7.2 0.49 0.48 0.44 0.8 0.88 1.72 -9.54
6 2 3 1 2 39.17 27.05 46.54 25.77 138.08 165.61 73.70 -39.34
7 3 1 3 2 0.57 1.26 0.61 0.7 0.91 1.42 0.91 0.28
8 3 2 1 3 3.88 7.85 22.74 36.33 92.8 120.33 47.32 -36.20
9 3 3 2 1 15.42 25.52 35.27 48.61 67.56 72.73 44.19 -33.79

n
1
(
S / N=−10 log ∑ y 2i
n i =1 )
Las sumas de cuadrados son las siguientes:
Para el arreglo L9 con nueve respuestas Y1 a Y9 se tiene:
La suma de cuadrados del factor A es:

A1 = Y1 + Y2 + Y3
A2 = Y4 + Y5 + Y6
A3 = Y7 + Y8 + Y9

A 21 + A22 + A 33
SSA= −CF
3
(Y 1 +Y 2 +.. ..+Y 9 ) 2
CF=
9
La suma de cuadrados del factor B es:

Página 61 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

B1 = Y1 + Y4 + Y7
B2 = Y4 + Y5 + Y8
B3 = Y3 + Y6 + Y9
B21 + B22 + B33
SSB= −CF
3
(Y 1 +Y 2 +.. ..+Y 9 ) 2
CF=
9

De la misma forma se calculan las sumas de cuadrados para los factores C y D:


La suma de cuadrados total es:

SST = SSA + SSB + SSC + SSD

Haciendo los cálculos en Minitab se obtiene:

Taguchi Analysis: Rep. 1, Rep. 2, Rep. 1_1, Rep. 2_1, ...


versus A, B, C, D
Linear Model Analysis: SN ratios versus A, B, C, D

Estimated Model Coefficients for SN ratios


Term Coef
Constant -19.6915
A 1 1.8735
A 2 1.6687
B 1 4.9386
B 2 2.0970
C 1 -18.6078
C 2 4.3499
D 1 -7.8678
D 2 4.3221

S = *

Analysis of Variance for SN ratios


Source DF Seq SS Adj SS Adj MS F P Porcentaje de
contribución
A 2 56.52 56.52 28.261 * * 2.49%
B 2 234.86 234.86 117.428 * * 10.32%
C 2 1705.37 1705.37 852.685 * * 74.91%
D 2 279.46 279.46 139.732 * * 12.28%
Residual Error 0 * * *

Página 62 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Total 8 2276.21

Linear Model Analysis: Means versus A, B, C, D


Estimated Model Coefficients for Means
Term Coef
Constant 25.2281
A 1 -5.8598
A 2 0.2819
B 1 -6.1548
B 2 -8.3748
C 1 33.5124
C 2 -9.6215
D 1 8.4707
D 2 0.1513

S = *

Analysis of Variance for Means


Source DF Seq SS Adj SS Adj MS F P
A 2 196.59 196.59 98.30 * *
B 2 957.39 957.39 478.69 * *
C 2 5359.29 5359.29 2679.65 * *
D 2 438.35 438.35 219.17 * *
Residual Error 0 * * *
Total 8 6951.62

Response Table for Signal to Noise Ratios


Smaller is better
Level A B C D
1 -17.818 -14.753 -38.299 -27.559
2 -18.023 -17.595 -15.342 -15.369
3 -23.234 -26.727 -5.434 -16.146
Delta 5.416 11.974 32.866 12.190
Rank 4 3 1 2

Response Table for Means


Level A B C D
1 19.368 19.073 58.741 33.699
2 25.510 16.853 15.607 25.379
3 30.806 39.758 1.337 16.606
Delta 11.438 22.904 57.403 17.093
Rank 4 2 1 3

Las gráficas factoriales son las siguientes:

Página 63 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Main Effects Plot (data means) for SN ratios


A B

-10

-20
Mean of SN ratios

-30

-40
1 2 3 1 2 3
C D

-10

-20

-30

-40
1 2 3 1 2 3
Signal-to-noise: Smaller is better

Los niveles seleccionados son A en 1, B en 1, C en 3 y D en 2

Main Effects Plot (data means) for Means


A B
60

45

30

15
Mean of Means

0
1 2 3 1 2 3
C D
60

45

30

15

0
1 2 3 1 2 3

La respuesta estimada es:


Predicted values
S/N Ratio Mean

5.70044 -10.5261
Factor levels for predictions
A B C D
1 1 3 2

Página 64 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

8. REGRESIÓN Y CORRELACIÓN LINEAL

8.1 Introducción
Son dos herramientas para investigar la dependencia de una variable dependiente Y en
función de una variable independiente X. Y = f(X)

Y = Variable dependiente que se desea explicar o predecir, también se llama regresor o


respuesta

X = Variable independiente, también se llama variable explicativa, regresor o predictor

Regresión lineal - La relación entre X y Y se representa por medio de una línea recta
Regresión curvilinea - La relación entre X y Y se representa por medio de una curva.

Y * *
** * * * *
* * * *
* b1 * * * *
* * * *
* * * * * *
b0
Correlación positiva Correlación negativa X
Sin correlación

La ecuación de la recta es la siguiente:

Y   0   1 X   .........Con.base.en.la. población
Y  b0  b1 X  e...........Con.base.en.datos.de.la.muestra
´*
Y  b0  b1 X ................Modelo.de.regresión .estimada

El término de error es la diferencia entre los valores reales observados Yi y los valores
estimados por la ecuación de la recta. Se trata de que estos sean mínimos, para lo cual
se utiliza el método de mínimos cuadrados.

Página 65 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

¿
Y
*
Error=Re siduo=(Yi−Yi)

X
Se trata de minimizar la suma de todos los errores o residuos:

Las fórmulas resultado de la minimización de lo cuadrados del error se aplicarán en el


siguiente ejemplo por claridad. Se tienen los siguientes supuestos:

1. Los errores o residuos se distribuyen normalmente alrededor de la recta de


regresión poblacional
2. Las varianzas de los errores son las mismas en todos los valores de X
(Homoscedasticidad) en caso contrario se tiene (Heteroscedasticidad)
3. Los errores o residuos son independientes: No se muestra algún patrón definido.

El coeficiente de Correlación r desarrollado por Carl Pearson es un indicador de la


fuerza de la relación entre las variables X y Y, puede asumir valores entre -1 y 1 para
correlación negativa y positiva perfecta respectivamente. Por ejemplo si se encuentra
que la variable presión tiene una correlación positiva con el rendimiento de una
caldera, se deben buscar soluciones al problema mediante acciones asociadas con la
variable presión; de lo contrario, sería necesario buscar la solución por otro lado.

Se identifican tres medidas de desviación como sigue:

Página 66 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Y
Yest = 4.4 + 1.08 X

Yi = 23 * Desviación no explicada
Error = (Yi - Yest) = 1.32
Variación total
(Yi-media)=5.13 Desviación explicada
(Yest-Ymedia) = 3.81
Ymedia =17.87

X = 16 X

8.2 Ejemplo manual

Se sospecha que el tiempo requerido para hacer un mantenimiento preventivo está


relacionado con su número. Calcular el coeficiente de correlación y graficar. Los datos
de tiempo tomados para n = 25 servicios se muestran a continuación:

X Servicios Y Tiempo (Xi-X)*(Yi-Y) (Xi-X)^2 (Yi-Y)^2 Yest Error


2 9.95 119.076672 38.9376 364.1533 10.9199 0.9408
8 24.45 1.099872 0.0576 21.0021 28.3362 15.1022
11 31.75 7.499472 7.6176 7.3832 37.0443 28.0292
10 35.00 10.502272 3.0976 35.6075 34.1416 0.7369
8 25.02 0.963072 0.0576 16.1026 28.3362 10.9969
4 16.86 51.612672 17.9776 148.1771 16.7253 0.0181
2 14.38 91.433472 38.9376 214.7045 10.9199 11.9721
2 9.60 121.260672 38.9376 377.6337 10.9199 1.7422
9 24.35 -3.558928 0.5776 21.9286 31.2389 47.4563
8 27.50 0.367872 0.0576 2.3495 28.3362 0.6991
4 17.08 50.679872 17.9776 142.8694 16.7253 0.1258
11 37.00 21.989472 7.6176 63.4763 37.0443 0.0020
12 41.95 48.568672 14.1376 166.8541 39.9470 4.0121
2 11.66 108.406272 38.9376 301.8142 10.9199 0.5477
4 21.65 31.303072 17.9776 54.5057 16.7253 24.2523
4 17.89 47.245472 17.9776 124.1620 16.7253 1.3564
20 69.00 470.014272 138.2976 1,597.3771 63.1686 34.0052
1 10.30 135.625472 52.4176 350.9178 8.0172 5.2111
10 34.93 10.379072 3.0976 34.7770 34.1416 0.6216
15 46.59 118.686672 45.6976 308.2553 48.6551 4.2646
15 44.88 107.127072 45.6976 251.1337 48.6551 14.2512
16 54.12 194.676672 60.2176 629.3676 51.5578 6.5649

Página 67 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

17 56.63 241.751472 76.7376 761.6054 54.4605 4.7068


6 22.13 15.462272 5.0176 47.6486 22.5307 0.1606
5 21.15 25.540272 10.4976 62.1385 19.6280 2.3164
206 725.82 2,027.7132 698.5600 6,105.9447   220.0926
SX SY Sxy Sxx Syy = SST SSE
X promedio Y Promedio S (Xi-X)*(Yi-Y) S(Xi-X)^2 S(Yi-Y)^2
  Sxy Sxx Syy

Si todos los puntos estuvieran completamente sobre la recta la ecuación lineal sería y =
a + bx. Como la correlación no siempre es perfecta, se calculan a y b de tal forma que
se minimice la distancia total entre puntos y la recta. Los cálculos tomando las sumas
de cuadrados siguientes se muestran a continuación:

Sxy = 2027.71
Sxx = 698.56
Syy = 6105.94

Las ecuaciones para el cálculo manual son las siguientes:

b1 = β^ 1=
∑ ( Xi− X̄ )(Yi−Ȳ ) = S XY
∑ ( Xi− X̄ )2 S XX = 2.902704421

b0 = β^ 0 =
∑ Y i− β^ 1 ∑ X i =Ȳ − β^ X̄
n = 5.114515575

Las sumas de cuadrados son:

SST =∑ (Y i−Ȳ )2 = 6,105.9447

2 2
SSE=∑ (Y i−Y^ i ) = ∑ (Y i−(bo+b 1∗X i )) = 220.0926

SSR=SST −SSE= 5,885.8521

El coeficiente de determinación r2 y el coeficiente de correlación r se calculan a


continuación:

SSE (SST −SSE ) SSR


r 2 =1− = =
SST SST SST = 0.9639

Página 68 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

El coeficiente de determinación indica el porcentaje de la variación total que es


explicada por la regresión.

r= √ r 2 = 0.9816

El coeficiente de correlación proporciona el nivel de ajuste que tienen los puntos a la


línea recta indicando el nivel de influencia de una variable en la otra. El factor de
correlación r es un número entre –1 (correlación negativa evidente) y +1 (correlación
positiva evidente), y r = 0 indicaría correlación nula.

El coeficiente de correlación r = 0.98 por lo cual tenemos suficiente evidencia


estadística para afirmar que el tiempo de atención esta relacionado con el número de
servicios atendidos.

8.3 Uso de Excel

1. En el menú Herramientas seleccione la opción Análisis de datos. Datos de


ejemplo 6.
2. Seleccione la opción Regresión.
3. Seleccione el rango de entrada, estos corresponden a los datos numéricos de la
tabla.
4. Seleccione Resumen de estadísticas.
5. En opciones de salida seleccione en Rango de salida, una celda de la hoja de
cálculo que este en blanco (a partir de esta celda serán insertados los
resultados).

Resumen

Estadísticas de la regresión
Coeficiente de 0.98181177
correlación múltiple 8
Coeficiente de 0.96395436
determinación R^2 8
0.96238716
R^2 ajustado 7
3.09341962
Error típico 7
Observaciones 25

Promedio
ANÁLISIS DE VARIANZA Suma de de
  Grados de Cuadrados cuadrados F Valor

Página 69 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

libertad crítico de F
5885.8520 5885.8520 615.08008 4.24118E-
Regresión 1 69 69 98 18
220.09263 9.5692449
Residuos 23 48 92
6105.9447
Total 24 04      

Coeficiente Estadístico Probabilida Inferior


  s Error típico t d 95%
5.11451557 1.1458041 4.4636910 0.0001772 2.7442391
Intercepción 5 27 04 15 61
2.90270442 0.1170407 24.800808 4.24118E- 2.6605872
XServicios 1 19 25 18 49

X Servicios Curva de regresión ajustada

80.00
70.00
60.00 Y Tiempo
50.00
Y Tiempo

Pronóstico Y Tiempo
40.00
30.00 Lineal (Pronóstico Y
20.00 Tiempo)
10.00
0.00
0 5 10 15 20 25
X Servicios

En la gráfica observamos que al aumentar el número de servicios el tiempo de


atención aumenta.

8.4 Uso de Minitab

Para determinar la función de regresión y correlación en Minitab se siguen los pasos


siguientes (después de cargar los datos correspondientes a X y a Y en las columnas C1 y
C2):
Stat >Regresión ... Indicar la columna de Respuestas Y y la de predictores X y
aceptar con OK. Observar el valor del coeficiente de correlación y de
determinación.

Para obtener la línea de mejor ajuste de la regresión, se procede como sigue en


Minitab:

Página 70 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Stat >Fitted Line Plot ... Indicar la columna de Respuestas Y y la de predictores


X, seleccionar si se quiere ajustar con los datos con una línea, una función
cuadrática o cúbica y aceptar con OK. Observar el mayor valor del coeficiente
de correlación que indica el mejor ajuste.
En Options: seleccionar Display Confidence (para media en X) y Prediction Intervals
para X.
En Graphs: Seleccionar Residual for plots Standardized y Normal Plot of residuals
La gráfica de residuos debe apegarse a la recta y tener siempre un valor P value
>0.05.

Fitted Line Plot


Y Tiempo = 5.115 + 2.903 X Servicios
Regression
70
95% CI
95% PI
60
S 3.09342
R-Sq 96.4%
50 R-Sq(adj) 96.2%
Y Tiempo

40

30

20

10

0
0 5 10 15 20
X Servicios

Regression Analysis: Y Tiempo versus X Servicios

The regression equation is


Y Tiempo = 5.115 + 2.903 X Servicios
S = 3.09342 R-Sq = 96.4% R-Sq(adj) = 96.2%
Analysis of Variance
Source DF SS MS F P
Regression 1 5885.85 5885.85 615.08 0.000
Error 23 220.09 9.57
Total 24 6105.94

La regresión tiene una r^2 de 96.4% y la influencia de una variable X en Y es


significativo.

Los intervalos de confianza para la media y el intervalo de predicción para un punto


específico X son los siguientes:

1 ( Xi  X ) 2
Sy  Se  1 ( Xi  X ) 2
n SCx Syi  Se 1  
*
n SCx
IC . para. y!x  Y est  tSy *
IP de73Y est  tSyi
. para71.Yx
Página
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

Página 72 de 73
CURSO DE DISEÑO DE EXPERIMENTOS P. Reyes / enero 2009

8.5 Ejercicios:

1. La energía consumida en un proceso depende del ajuste de máquinas, realizar una


regresión cuadrática con los datos siguientes y responder las preguntas.
Ajuste
Cons_energía Máq.
Y X
21.6 11.15
4 15.7
1.8 18.9
1 19.4
1 21.4
0.8 21.7
3.8 25.3
7.4 26.4
4.3 26.7
36.2 29.1

a) Trazar un diagrama de dispersión


b) Obtener la ecuación de regresión lineal y cuadrática y comparar
c) Estimar el consumo de energía para un ajuste de máquina de 20 con regresión
cuadrática
d) Obtener los intervalos de predicción y de confianza para un ajuste de máquina de 20
e) Obtener el coeficiente de correlación y de determinación

2. En base al porcentaje de puntualidad se trata de ver si hay correlación con las quejas
en una línea aérea. Las quejas son por cada 100000 pasajeros.
%puntos Quejas
Aerolinea X Y
A 81.8 0.21
B 76.6 0.58
C 76.6 0.85
D 75.7 0.68
E 73.8 0.74
F 72.2 0.93
G 70.8 0.72
H 68.5 1.22

a) Trazar un diagrama de dispersión


b) Obtener la ecuación de regresión lineal
c) Estimar las quejas para un porcentaje de puntualidad de 80%
d) Obtener los intervalos de predicción y de confianza para una altura de 63"
e) Obtener el coeficiente de correlación y de determinación

Página 73 de 73

También podría gustarte