Está en la página 1de 25

Unidad 4

Diseo experimental para un factor.




Hoy en da contamos con una diversidad de productos en el mercado, diferentes marcas y
submarcas, estilos diversos, gama de colores, basta con decidirse que producto satisface nuestras
necesidades para comprarlo, sin prestar atencin al detrs de la elaboracin del producto: su
proceso de elaboracin y la bsqueda de mejora del producto por parte del fabricante, pensemos,
en la variedad de productos de higiene bucal, pastas dentales, el fabricante no solo busca nuevos
productos sino adems de los existentes mejorarlos en sus caractersticas de calidad (sabor,
consistencia, aspecto, sanidad) y mejorar sus procesos, optimizando los recursos.

Ahora veamos nuestro entorno, en la organizacin que laboramos existe algn proceso que se
pueda optimizar? La respuesta seguramente es s, en la bsqueda de esta mejora se pueden
realizar pruebas de forma emprica, por ensayo y error, sin embargo, la experiencia nos dice que
planear es mejor que improvisar, adems, el proceso tiene un costo, jugar con los recursos de la
empresa no es viable, sin embargo, si es viable y bien visto invertir los recursos de la empresa en
la bsqueda de maximizar utilidades y ganancias, realizar pruebas bien planeadas es una buena
manera de lograrlo, estas pruebas son experimentos. Experimentamos todos los das, ahora se
busca experimentar en la empresa para optimizar los recursos con los que se cuenta.
Experimentar no es barato, requiere de inversin y de que los participantes incluyendo los niveles
directivos estn plenamente convencidos de los beneficios obtenidos a corto, largo y mediano
plazo, incluso, se logra ahorrar, la experiencia de diversas empresas es que los costos por
mantener la calidad de la forma tradicional disminuyen (menos inspeccin), planear ayuda a
disminuir el error.

Ejemplo introductorio 1

Para el proceso de extraccin de grasa de residuos crnicos de curtidura, se realiza una etapa de
coccin de los residuos en cido, dicho proceso degrada la protena y tiene un rendimiento bajo, un
proceso alterno busca extraer la grasa mediante solventes orgnicos (percolacin), con el objetivo
de aumentar el rendimiento en la extraccin de grasa y disminuir la degradacin de la protena
para que sea un producto adicional del proceso, se prueban varios solventes (hexano, ter de
petrleo, acetona) Existe diferencia significativa en el rendimiento de extraccin? Adems de
optimizar la cantidad de grasa extraa, recuperar la protena, se busca disminuir costos y que
seguridad en el proceso. Los solventes tienen diferentes precios de mercado y riesgos de manejo.

Ejemplo introductorio 2

En una planta industrial, uno de los procesos realizados es la coccin de frijol, se sospecha que la
cantidad de sal comn (cloruro de sodio, NaCl) en la que se remoja previamente el frijol antes de
ser cocido, influye en el tiempo de coccin, se realizan diversas pruebas con cuatro
concentraciones de sal, Existe diferencia en el tiempo de coccin dependiendo de la
concentracin de sal en remojo? El estudio busca disminuir el tiempo de coccin para optimizar el
consumo de gas.

Ejemplo introductorio 3
En una industria curtidora, se desea obtener un producto que cumpla con caractersticas
establecidas por el cliente respecto a la suavidad de la piel, resistencia a la abrasin, resistencia al
esfuerzo, calibre de la hoja de piel, para ello, el ingeniero qumico responsable establece un plan
de trabajo, tratar diferentes lotes de materia prima con diversas formulaciones de los qumicos
respectivos y condiciones diferentes a fin de lograr lo solicitado por el cliente.


Para responder a las preguntas de los prrafos anteriores y las que surjan al productor, proveedor
y todo aquel interesado, se sugiere llevar a cabo un experimento, ms bien dicho, desarrollar un
plan experimental e implementarlo.

En esta unidad, Diseo Experimental para un factor, se consideran dos variables, una de respuesta
o salida y una de entrada, pero a diferencia de la unidad de regresin lineal simple no es el objetivo
la prediccin de valores de la variable de respuesta, ahora se pretende determinar que ocurre con
la variable de salida si los valores de la variable de entrada son manipulados a criterio del analista,
dicho de otra manera, se busca responder a una pregunta existe una diferencia significativa en la
variable de respuesta para los diversos valores de la variable de entrada?

Veamos el siguiente esquema general de todo proceso





En la entrada del proceso se cuenta con variables de entrada (factores), de estas variables algunas
son controlables, como ejemplo la cantidad de materia prima o la temperatura del horno de
coccin, sin embargo no todas son controlables (por su naturaleza o su costo), por ejemplo, la
humedad ambiental o las impurezas en la materia prima.
En la salida se tiene el producto elaborado, dicho producto ha de cumplir con caractersticas de
calidad entre otras ms, a dichas caractersticas les llamaremos variables de salida, el objetivo del
diseo experimental es el optimizar (mejorar, maximizar, minimizar) una o ms variables de salida.

Definiciones

Antes de continuar enlistaremos algunos de los conceptos bsicos

Experimento: Es un cambio en las condiciones de operacin de un sistema o proceso, que se hace
con el objetivo de medir el efecto del cambio en una o varias propiedades del producto. (Gutirrez,
Pulido & De la Vara Salzar, 2004).

Diseo de experimentos (DOE, DDE): Es un conjunto de tcnicas activas que manipulan el proceso
para inducirlo a proporcionar la informacin que se requiere para mejorarlo. Consiste en planear un
conjunto de pruebas experimentales, de tal manera que los datos generados puedan analizarse
estadsticamente para obtener conclusiones vlidas y objetivas acerca del sistema o proceso.
(Gutirrez Pulido & De la Vara Salzar, 2004)

Variable de respuesta: es la caracterstica del producto o proceso que se desea optimizar mediante
el DOE.

Factor: variables de entrada del proceso.

Factor controlable: son las variables de entrada controlada por el experimentador, se les fija en un
cierto valor o nivel de operacin, por ejemplo, la temperatura del proceso de coccin, la velocidad
de operacin de un motor, la concentracin de sal.

Nivel: Modalidad especifica dentro de un factor, el valor de la variable de entrada, por ejemplo, si la
temperatura es un factor del proceso sus niveles podran ser 60, 85, 90 grados Celsius; en el caso
del motor, las diferentes velocidades de operacin 500 1000 rpm; la concentracin de sal al 10,
15 o 20%.

Factores no controlables: Tambin se les llama factores de ruido, el experimentador no tiene
control sobre ellos, por ejemplo: la humedad ambiente; la calidad de la materia prima; el tamao
Proceso
Entrada Salida
del grano de sal. Nota: un factor no controlable puede en ocasiones ser controlable bajo
condiciones especficas.

Tratamiento: se refiere a los distintos niveles de un factor o a la combinacin de los niveles de
varios factores. Por ejemplo se efecta la coccin a 85 C con una concentracin de sal al 15%.

Efecto principal: indica la contribucin que cada factor tiene sobre la variable de respuesta, se mide
evaluando el cambio que se produce en la respuesta en cada nivel del factor.

Interaccin. Relacin o dependencia entre dos o ms factores.

Unidad experimental (UE): es el individuo u objeto a la que se le aplica un tratamiento, en ella se
miden las variables de respuesta bajo estudio.

Aleatorizacin: es fundamental para aplicar tcnicas estadsticas en DOE, se garantiza un orden en
la aplicacin de tratamientos a las UE:
Cada UE tiene la misma oportunidad de ser asignada a cualquier tratamiento
Controla la confusin posible a reflejarse en la variable de respuesta entre lo que la UE
aporta por s misma y lo que se debe al tratamiento.

Error aleatorio: es el error no explicado, este error se debe a causas comunes o fortuitas.

Error experimental: parte del error aleatorio, refleja los errores cometidos por el experimentador en
la planeacin, diseo y ejecucin del experimento.

Replica o repeticin: es volver a correr el proceso, aplicar nuevamente el tratamiento a otra unidad
experimental. No se debe confundir con mediciones repetidas de la misma unidad experimental.
Aumenta la confiabilidad de las mediciones.

Bloques: las unidades experimentales se agrupan de manera que su variabilidad dentro de los
grupos sea menor que entre las unidades antes de agruparlas, va de la mano con la seleccin de
unidades experimentales para la uniformidad. Por ejemplo, considere que se comparan cuatro
mquinas, se cuenta cuatro operadores, si a cada operador se le asigna una maquina se puede
presentar un sesgo al informacin colectada, en cambio si cada operador prueba cada mquina, se
obtendr informacin sobre la variabilidad entre las mquinas y entre los operadores.

Matriz de diseo: es el arreglo formado por las diferentes condiciones de proceso que sern
efectuadas, se han de incluir las repeticiones.


Clasificacin de los diseos experimentales

Dadas las mltiples necesidades de las empresas, las caractersticas de cada proceso, se ha
desarrollado una gran diversidad de diseos experimentales, en la clasificacin siguiente se citan
solo algunos de ellos:

1. Diseos de un factor (comparativa entre dos o ms niveles de un factor)
a. Completamente al azar
b. Bloques completamente al azar
c. Cuadrados latinos y grecolatinos

2. Diseos para estudiar dos o ms factores en una o varias variables de respuesta
a. Diseos factoriales 2
k

b. Diseos factoriales 3
k

c. Diseos factoriales fraccionados 2
k-p


3. Optimizacin de procesos
a. De primer orden (factoriales de 2 niveles, simplex, Plankett-Burman)
b. De segundo orden (factoriales de 3 niveles, central compuesto, Box- Behnken)

4. Diseos robustos
a. Ortogonales (Taguchi)
b. Arreglos internos y externos

5. Diseos de mezclas
a. Simplex con centroide
b. Con restricciones
c. Axial
d. Latice-simplex

Nota: los mtodos de Taguchi permiten trabajar, de manera confiable, en situaciones con factores
de ruido.



Diseo de experimentos. Etapas y principios bsicos

Se resumen los pasos generales en el diseo de experimentos

1. Identificacin y exposicin del problema.
En la etapa de identificacin de problema es esencia un trabajo de equipo, reunir a todos
departamentos los involucrados, detectar los problemas presentados, colectar las
opiniones y sugerencias, depurar, identificar el objetivo global y definir claramente los
objetivos del experimento.

2. Eleccin de la variable de respuesta.
Respecto a la eleccin de la variable de respuesta, se debe tener la certeza que la variable
seleccionada arroja la informacin til acerca del proceso en estudio, es comn, considerar
el valor de la media y/o desviacin estndar.

3. Eleccin de los factores y niveles
Es importante distinguir de los factores que afectan al proceso cuales son de inters para
el analista (factores de diseo), aquellos factores que no son objeto de estudio pero que si
afectan el proceso es conveniente mantenerlos fijos, es decir, no deben variar, evitando as
se vea afectado el estudio, para los factores de ruido (no controlables) se pueden
establecer alternativas como la covarianza, para ello es requisito tomar medidas de dichos
factores de ruido

4. Eleccin del diseo experimental.
Respecto a la eleccin del diseo experimental, se implica el tamao de la muestra
considerando en nmero de rplicas, el orden de las corridas experimentales, determinar si
se formarn bloques o no, determinar restricciones sobre la aleatorizacin. No se debe
perder de vista el objetivo experimental y el objetivo global.

5. Realizacin del experimento.
En la etapa de Realizacin del experimento, ponemos en marcha lo planeado, sin embargo
algunos autores recomiendan, realizar pruebas piloto a fin de determinar la confiabilidad
del sistema de medicin, consistencia de la materia prima, detectar errores en el diseo y
ser as replantear antes de ejecutar finalmente.

6. Anlisis estadstico de los datos.
Anlisis estadstico, se aclara que los mtodos estadsticos no demuestran que un factor
posee un efecto en particular, ms bien proporcionan pautas generales en cuanto a la
confiabilidad y la validez de los resultados obtenidos, miden el error posible en una
conclusin, asignan un nivel de confianza a un enunciado. Su ventaja es que agregan
objetividad al proceso de toma de decisiones.

7. Conclusiones y recomendaciones.
Conclusiones y recomendaciones, el fin del experimento es obtener conclusiones, estas
conclusiones deben ser practicas sobre los resultados y recomendar cursos de accin, es
recomendable realizar pruebas experimentales de seguimiento y confirmacin a fin de
validar los resultados del estudio.
En esta etapa se recomienda distinguir entre significancia estadstica e importancia
prctica, es decir, como resultado del experimento se pude concluir que existe diferencia
significativa estadsticamente entre los tratamientos pero tales diferencias no representan
una diferencia que en la prctica sea digna de consideracin.

Principios bsicos
Aleatorizacin
Realizacin de rplicas
Formacin de bloques


Hiptesis de investigacin
Parte de la planeacin consiste en el establecimiento de la hiptesis de investigacin, con ella se
logra establecer circunstancias y sus consecuencias, entre ellas el establecimiento de los
tratamientos, es importante identificar los tratamientos con el papel que cada uno tiene en la
evaluacin de la hiptesis de investigacin, los tratamientos deben concordar con la hiptesis de
investigacin, por ejemplo, se desea probar que el tiempo de coccin es independiente de la
concentracin de sal en el agua de remojo de frijol, para ello los tratamientos deben considerar
diferentes concentraciones de sal en agua de remojo. En ocasiones se recomienda establecer un
tratamiento de control, un control ser aquel que no ha recibido tratamiento alguno o es un
tratamiento placebo, esto con la finalidad de revelar las condiciones en las que se efecta el
experimento.


Aleatorizacin y su importancia

S define la aleatorizacin como la asignacin aleatoria de tratamientos a unidades experimentales
que se han obtenido de manera aleatoria.
Recordamos la mencin que hace Kuehl (), de Fisher sobre la importancia de la aleatorizacin ya
que esta proporciona estimaciones vlidas de la varianza del error para los mtodos de inferencia
estadstica justificados para la estimacin y pruebas de hiptesis en el experimento.

No debemos olvidar que uno de los principios de la inferencia estadstica es que los elementos de
la muestra son representativos de la poblacin, de igual manera, los datos colectados de un
experimento deben ser representativos de lo que ha ocurrido, sin embargo, si sobre las unidades
experimentales se ha hecho una seleccin controlada, cuidadosa y supervisada al efectuar el
experimento es dudoso, que la muestra sea aleatoria, ms an suponga, que las unidades
experimentales a las que se les aplicara uno de tres tratamientos provienen de lotes de produccin
elaborados por 3 mquinas diferentes, es de esperarse que las unidades elaboradas de la maquina
1 posean caractersticas similares, que pasara si solo en los lotes provenientes de la maquina 1 se
aplica el segundo tratamiento, la respuesta ser confiable?, sinceramente es de dudar.

En pocas palabras, la aleatorizacin, aumenta la probabilidad que el supuesto de independencia
entre las observaciones, que recordemos es bsico para la validez de las pruebas estadsticas.

La repeticin o replicas son ayuda para estimar la variabilidad natural (error aleatorio), permite
distinguir de mejor manera que parte de la variabilidad se debe a los factores y cual al error
aleatorio.


Supuestos estadsticos en las pruebas

Las distribuciones de probabilidad ms usadas para intervalos de confianza y prueba de hiptesis
son: distribucin normal, distribucin T de Student, ji-cuadrada y F. la distribucin normal y T de
Student sirven para hacer inferencias sobre las medias; la distribucin ji-cuadrada es de utilidad
para hacer inferencias sobre las varianzas y la distribucin F se utilizar para comparar varianzas.
La distribucin F es de gran relevancia en el diseo de experimentos pues permite analizar la
variabilidad.
Una de las pruebas comnmente realizadas en la comparacin de tratamientos de un factor es el
anlisis de varianza (ANOVA), esta prueba nos permite comparar tres o ms medias muestrales, a
partir de la varianza, para determinar si provienen de poblaciones iguales.

En ANOVA se establecen los siguientes supuestos:

Las poblaciones siguen una distribucin normal.
Las poblaciones tienen desviaciones estndar iguales.
Las muestras se seleccionan de modo independiente (principio de independencia).

Como se mencion, previo al desarrollo del experimento se ha planteado una hiptesis de trabajo,
dicha hiptesis o afirmacin debe estar bien especificada, el sentido de la afirmacin debe quedar
claro a las personas interesadas e involucradas. La hiptesis planteada es una hiptesis
estadstica, se trata de una afirmacin sobre los valores de los parmetros de una poblacin o
proceso y que se puede probar a partir de la informacin presente en una muestra representativa
obtenida de la poblacin.

Recordemos que se plantea la hiptesis nula y la hiptesis alternativa, que la hiptesis nula
generalmente se plantea como una igualdad, para probar una hiptesis, se supone que la hiptesis
nula es verdadera y as ser mientras no se compruebe lo contrario, adems que la hiptesis
alternativa puede ser unilateral o bilateral. El estadstico de prueba es obtenido a partir de los datos
muestrales y de la hiptesis nula, si su valor cae en la regin (valores) de rechazo, entonces se
rechaza la hiptesis nula.

Adicional a lo anterior, se toma una decisin en base a probabilidades, por lo que existe el riesgo
de equivocarse, riesgo de cometer el error tipo I o error tipo II
Error tipo I, se comete al rechazar la hiptesis nula siendo que es verdadera.
Error tipo II, se comete al aceptar la hiptesis nula siendo que es falsa.

Al error tipo I se le asocia el valor de significancia de la prueba, donde alfa es la probabilidad del
intervalo de rechazo, a menor valor de alfa se requiere ms evidencia en los datos para rechazar
la hiptesis nula.




Ejemplo

Diseo de un factor con dos niveles.

Debido a la importancia que tienen las propiedades de un plstico para conservar alimentos, una
compaa alimentaria tiene inters en disminuir la trasferencia de humedad entre el alimento y el
ambiente en funcin del plstico. Se propone a nivel de laboratorio estudiar un nuevo plstico
elaborado con zenas. Se plantea la siguiente hiptesis: el nuevo plstico disminuir la
transferencia de humedad comparado con el plstico actualmente utilizado. La variable de
respuesta que se mide es la permeancia de vapor de agua (vpa), cuyo valor debe ser los ms bajo
posible. La hiptesis de trabajo se plantea de la siguiente manera:

o 1 2
H : = el valor promedio vpa es igual en ambos plsticos

1 1 2
H : el valor promedio vpa es diferente entre los plsticos

De no rechazarse la hiptesis nula las medias son iguales y nuestra hiptesis de trabajo es errada,
no hay diferencia entre los plsticos en la transferencia de humedad. De recharzarse la hiptesis
nula, se acepta el hecho que existe diferencia entre los valores promedios en vpa, y se toma como
cierto que el plstico nuevo disminuir la transferencia de humedad.

La estrategia experimental consiste en realizar diferentes pelculas de plstico considerando los
dos tratamientos (actual y propuesto) en forma independiente. En cada uno de ellos se realizan en
forma aleatoria 14 muestras de pelculas, se mide le pva y se elabora la tabla de resumen siguiente

Tratamiento actual Tratamiento nuevo
Unidad
experimental
vpa Unidad
experimental
vpa
Y1,1 32 Y2,1 22
Y1,2 31 Y2,2 21
Y1,3 31 Y2,3 25
Y1,4 38 Y2,4 36
Y1,4 43 Y2,4 34
Y1,6 41 Y2,6 30
Y1,7 28 Y2,7 15
Y1,8 31 Y2,8 30
Y1,9 39 Y2,9 24
Y1,10 43 Y2,10 29
Y1,11 37 Y2,11 34
Y1,12 34 Y2,12 25
Y1,13 34 Y2,13 36
Y1,14 32 Y2,14 31


Contrastar la hiptesis nula mediante un comparativo de medias.

Se establecen los supuestos siguientes:
El error tiene media cero, su varianza es constante y tiene una distribucin normal adems de ser
mutuamente independientes. Se evala la diferencia entre tratamientos, para ello se recurre a la
distribucin t de Student, con:

1 2
1 2
1 1
c
p
y y
t
s
n n

=
+
valor de prueba para t de Student

Donde
1
2
es la media del tratamiento 1
es la media del tratamiento 2
y
y




( ) ( )
2 2
1 1 2 2 2
1 2
1 1
2
p
n s n s
s
n n
+
=
+
estimador de la varianza


Si los datos cumplen con los supuestos establecidos anteriormente, t
c
se distribuye como una
variable aleatoria con distribucin t de Student y n
1
+n
2
-2 grados de libertad.

Criterio de rechazo
Si se cumple que
1 2
2,
2
c
n n
t t

+
> se rechaza la hiptesis nula.

Muestra
Plstico
actual
plstico
nuevo
1 32 22
2 31 21
3 31 25
4 38 36
5 43 34
6 41 30
7 28 15
8 31 30
9 39 24
10 43 29
11 37 34
12 34 25
13 34 36
14 32 31

datos 14 14
media 3529 2800
desv std 487 624
varian!a 2376 3892




Sustituyendo se tiene

( ) ( )
2
14 1 23.76 13 1 38.92 814.86
31.34
14 14 2 26
p
s
+
= = =
+



35.29 28 7.29
3.44
2.12 1 1
5.60
14 14
c
t

= = =
+


El valor crtico para comparar es
26,0.025
2.056 t =

Criterio de rechazo
Si se cumple que
1 2
2,
2
c
n n
t t

+
> se rechaza la hiptesis nula.
Se cumple que 3.44 2.056 > por lo que se rechaza la hiptesis nula, existe evidencia para
considerar que las medias son diferentes, que el plstico elaborado con zenas permite una menor
transferencia de humedad.


Se puede realizar un anlisis alterno mediante el Anlisis de varianza (anlisis de las diferencias
entre tratamientos), para probar la hiptesis planteada en un diseo de un factor con dos o ms
niveles.

Recordemos los datos del ejemplo anterior

Tratamiento actual Tratamiento nuevo
Unidad
experimental
vpa Unidad
experimental
vpa
Y1,1 32 Y2,1 22
Y1,2 31 Y2,2 21
Y1,3 31 Y2,3 25
Y1,4 38 Y2,4 36
Y1,4 43 Y2,4 34
Y1,6 41 Y2,6 30
Y1,7 28 Y2,7 15
Y1,8 31 Y2,8 30
Y1,9 39 Y2,9 24
Y1,10 43 Y2,10 29
Y1,11 37 Y2,11 34
Y1,12 34 Y2,12 25
Y1,13 34 Y2,13 36
Y1,14 32 Y2,14 31




Para esta prueba se hace referencia a la distribucin f (Fisher), donde se tiene

o 1 2
H : = el valor promedio es igual para los tratamientos

1 1 2
H : el valor promedio es diferente para los tratamientos


tratamientos
c
error
CM
F
CM
=

Con el criterio de rechazo siguiente


Si se cumple que
1, , c k N k
F F

> se rechaza la hiptesis nula.

2
error p
CM S =

( )
2
1
2 2
1
k
i
i
i
trat
i
i
n d
CM
k
d y y
=

=




datos 14 14

media 3529 2800

3164
desv std 487 624

varian!a 2376 3892

Para el ejercicio en particular se tiene

o 1 2
H : = el valor promedio vpa es igual en ambos plsticos

1 1 2
H : el valor promedio vpa es diferente entre los plsticos


Al sustituir valores se tiene

( )

( ) ( )
2
2
2
1
2
2 2
2
35.29 31.64 3.65 13.32
28 31.64 3.64 13.25
d
d
= = =
= = =

( ) ( )
2
1
14*13.32 14*13.25
371.98
1 2 1
k
i
i
i
trat
n d
CM
k
=
+
= = =


( ) ( )
2
14 1 23.76 13 1 39.92
814.86
31.34
14 14 2 26
p
s
+
= = =
+


371.98
11.87
31.37
c
F = =

Valor crtico (valor de tablas)

1,26,0.05
4.23 F =

Si se cumple que
1, , c k N k
F F

> se rechaza la hiptesis nula.
Se cumple que 11.87 4.23 > se rechaza la hiptesis nula, existe diferencia significativa entre las
medias de los tratamientos, el valor medio del vpa es diferente.
Anlisis de residuales

Dado que se trata de una aproximacin a lo real y como tal siempre debe diagnosticarse el ajuste
de los datos al modelo; ara el diagnostico de manera esencial se determinan los residuales

ij ij i
e y y =
i


Con ellos se elabora un grfico de probabilidad normal de los residuales, para ello se siguen los
siguientes pasos:

1. Determinar los residuales
2. Ordenar de menor a mayor los residuales
3. Calcular para el l-simo residual ordenado su

0.5
i
l
p
N

=

Muestra
Plstico
actual
plstico
nuevo residual trat 1 residual trat 2
1 32 22 "329 "600
2 31 21 "429 "700
3 31 25 "429 "300
4 38 36 271 800
5 43 34 771 600
6 41 30 571 200
7 28 15 "729 "1300
8 31 30 "429 200
9 39 24 371 "400
10 43 29 771 100
11 37 34 171 600
12 34 25 "129 "300
13 34 36 "129 800
14 32 31 "329 300

datos 14 14

media 3529 2800

desv std 487 624

varian!a 2376 3892



orden residual valor de p orden residual valor de p
1 "1300 0018 15 100 0518
2 "729 0054 16 171 0554
3 "700 0089 17 200 0589
4 "600 0125 18 200 0625
5 "429 0161 19 271 0661
6 "429 0196 20 300 0696
7 "429 0232 21 371 0732
8 "400 0268 22 571 0768
9 "329 0304 23 600 0804
10 "329 0339 24 600 0839
11 "300 0375 25 771 0875
12 "300 0411 26 771 0911
13 "129 0446 27 800 0946
14 "129 0482 28 800 0982


#r$ico de pro%a%ilidad normal para los residuales

Al observar el grfico no se aprecia una desviacin marcada de la lnea recta, adems los
residuales se ubican tanto sobre y debajo de la lnea.

&tra $orma de anali!ar los residuales es ela%orar un 'r$ico donde se con$ronten con el valor
esperad( en este caso( el valor esperado es el promedio del tratamiento

valor
esperado residual
valor
esperado residual
3529 "3286 2800 "6000
3529 "4286 2800 "7000
3529 "4286 2800 "3000
3529 2714 2800 8000
3529 7714 2800 6000
3529 5714 2800 2000
3529 "7286 2800 "13000
3529 "4286 2800 2000
3529 3714 2800 "4000
3529 7714 2800 1000
3529 1714 2800 6000
3529 "1286 2800 "3000
3529 "1286 2800 8000
3529 "3286 2800 3000



)el 'r$ico no se o%servan anomalias 'raves especto a los suspuestos( los residuales se distri%u*en
de $orma aleatoria respecto al valor central +cero,

-ota. recordemos los supuestos
Las poblaciones siguen una distribucin normal.
Las poblaciones tienen desviaciones estndar iguales.
Las muestras se seleccionan de modo independiente (principio de independencia).
Ejemplo 2

Una compaa desea estudiar la potencia de un colector solar, y por ello prueban dos
configuraciones diferentes del colector de energa solar; se prueba en seis ocasiones cada
configuracin. Los resultados se presentan a continuacin. La cantidad fue la energa en Watts.

Configuracin A 13.7 14.1 13.4 14.2 15.6 14.4
Configuracin B 13.5 14.0 13.2 13.7 13.3 13.1


Determine si existe una diferencia entre las configuraciones para generar energa. Realice una
comparacin de medias y un anlisis de varianza para su conclusin.
Es necesario el supuesto de normalidad para hacer la prueba?

Comparativo de medias
















Configuracin
A
Configuracin B

13.7 13.5

14.1 14

13.4 13.2

14.2 13.7

15.6 13.3

14.4 13.1

datos 6 6
promedio 1423 1347
desv std 076 034
varian!a 058 011


valor Sp 059



valor tc 22553


valor t +ta%las, 22281


22553/22281 Se rec0a!a la 0ip1tesis nula
entonces( las medias de los tratamientos son
di$erentes
Anlisis de varianza

2nlisis de varian!a de un $actor


3ES4ME-

Grupos Cuenta Suma Promedio Varianza

5on$i'uraci1n 2 6 854 1423 058

5on$i'uraci1n 6 6 808 1347 011



2-789S9S )E :2392-;2

Origen de las
variaciones
Suma de
cuadrados Grados de libertad
Promedio
de los
cuadrados F Probabilidad
Valor
crtico para
F
Entre 'rupos 176 1 1763 5087 0048 4965
)entro de los
'rupos 347 10 0347


<otal 523 11

De la tabla se observa que

Si 5.087 4.965 > se rechaza la hiptesis nula. Existe diferencia significativa entre los
tratamientos. La cantidad de energa colectada depende de la configuracin del colector solar.

Anlisis de residuales


trat 1 trat 2
residual
trat 1
residual
trat 2

13.7 13.5 "053 003

14.1 14 "013 053

13.4 13.2 "083 "027

14.2 13.7 "003 023

15.6 13.3 137 "017

14.4 13.1 017 "037

media 1423 1347


orden residual valor de p
1 "08333 00417
2 "05333 01250
3 "03667 02083
4 "02667 02917
5 "01667 03750
6 "01333 04583
7 "00333 05417
8 00333 06250
9 01667 07083
10 02333 07917
11 05333 08750
12 13667 09583




Los datos, no tienen un comportamiento plenamente lneal, se recomienda hacer ms
observaciones para descartar cualquier violacin a los supuestos.

Residuales versus valor esperado

valor
esperado residual
14.23 "053
14.23 "013
14.23 "083
14.23 "003
14.23 137
14.23 017
13.47 003
13.47 053
13.47 "027
13.47 023
13.47 "017
13.47 "037



Se o%serva un dato en el tratamiento 1 +con$i'uarci1n 1, =ue presenta una desviaci1n
considera%le respecto a las dems o%servaciones

Se recomienda reali!ar un ma*or n>ero de corridas e?perimentales para descartar cual=uier
violaci1n en los supuestos

Ejemplo 3

Un ingeniero industrial realiz un estudio para determinar el tiempo de coccin de una variedad de
frijol. El procedimiento consisti en poner a remojar siete lotes de frijol durante diez horas, donde el
agua de remojo contena cuatro diferentes cantidades de NaCl (%PV). As se tenan 7
repeticiones(lotes) por cada cuatro tratamientos (cantidades de sal). Despus de diez horas se
enjuag a los frijoles y con agua libre de sal, se pusieron a cocer, el tiempo de cocimiento que
tardaron se registr como se muestra en la tabla. El objetivo del experimentador es lograr un menor
tiempo de coccin para reducir el consumo de gas.

Mediante un anlisis de varianza muestre si la hiptesis de que el tiempo de coccin depende de la
concentracin de sal en el agua de remojo.

Muestra Tratamiento
1 (0%) 2 (1%) 3 (2%) 4 (3%)
1 108 84 76 57
2 109 82 85 67
3 99 85 74 64
4 103 92 78 61
5 107 87 82 63
6 95 78 75 55
7 102 90 82 63

La hiptesis nula es

1 2 3 4
:
o
H = = = las medias de los tratamientos son iguales, el tiempo de coccin es igual
en los tratamientos.

La hiptesis alternativa es

1
: para alguna
i j
H i j , al menos uno de los tratamientos es diferente

Criterio de rechazo
Si se cumple que
1, , c k N k
F F

> se rechaza la hiptesis nula.


2nlisis de varian!a de un $actor


3ES4ME-

Grupos Cuenta Suma Promedio Varianza

tratamiento 1 7 723 10329 2624

tratamiento 2 7 598 8543 2262

tratamiento 3 7 552 7886 1748

tratamiento 4 7 430 6143 1729


media 8225





2-789S9S )E :2392-;2
Origen de las
variaciones
Suma de
cuadrados
Grados de
libertad
Promedio de
los cuadrados F Probabilidad
Valor crtico
para F
Entre 'rupos 628354 3 209451 10019 10389E"13 300878657
)entro de los 'rupos 50171 24 2090

<otal 678525 27

Comparativo

Si se cumple que 100 3.009 > se rechaza la hiptesis nula.

De la tabla resumen obtenida en Excel, se observa que la hiptesis nula se rechaza, alguno de los
tratamientos difiere en su media respecto a los otros. Hay evidencia que la cantidad de sal en el
agua de remojo afecta el tiempo de coccin de frijol.

Anlisis de residuales



No se observa una marcada desviacin de la recta, se considera que se cumplen lo supuestos.




No se observa una marcada desviacin de los supuestos, esto se deduce pues los residuales
estn distribuidos en forma aleatoria, no se observa patrn, no se observan datos desviados en
mayor grado a los dems.

Mtodo de Duncan

Se ha presentado el procedimiento de Anlisis de Varianza para un factor, para confrontar la
prueba de hiptesis sobre las medias de los diversos tratamientos, una vez que se ha rechazado la
hiptesis que las medias son iguales, la pregunta es qu tratamientos son diferentes?

Para determinar que tratamientos son diferentes existen diversas tcnicas comparativas llamadas
comparaciones o pruebas de rango mltiples, citamos entre ellas:

Mtodo LSD (diferencia mnima significativa)
Mtodo de Tukey
Mtodo de Duncan

De los anteriores solo nos enfocaremos en el Mtodo de Duncan, se ocupa es ampliamente usado,
su potencia de deteccin es similar al mtodo LSD.

Si las k muestras son de igual tamao se ordenan los k promedios (medias de cada tratamiento),
de menor al mayor, se estima el error estndar de cada promedio mediante

i
error
Y
CM
S
n
=
i


En caso que existan diferente nmero en las observaciones en cada tratamiento (muestras de
diferente tamao), el valor de n se determine mediante

1
1
AR k
i i
k
n
n
=
=


Valor que es media armnica de los valores de n.


De valor de tablas de rangos significantes de Duncan, se obtienen los valores crticos ( ) , r p l

,
2, 3, 4,..., p k = , donde es el nivel de significancia prefijado, l son los grados de libertad del
error (tomado de la tabla ANOVA). Con estos 1 k valores se obtienen los rangos de significancia
mnima dados por:

( ) , ; 2, 3, 4,...,
i
p
Y
R r p l S p k

= =
i


Las diferencias observadas entre las medias muestrales se comparan con los rangos R
P
de la
siguiente manera: primero se compara la diferencia entre la media ms grande con la media ms
pequea con el rango R
k
, despus se compara la media ms grande con la media segunda ms
pequea con el rango R
k-1
, se continua hasta que la media mayor se haya comparado con todas
las dems. En seguida se compara la diferencia entre la segunda media ms grande y la media
ms pequea se compara con el valor R
k-1
, se compara la diferencia entre la segunda ms grande
y la segunda ms pequea se compara con el valor R
k-2
, y as sucesivamente hasta que se
comparen todos los pares de medias posibles con el rango que le corresponda.
Ya que se han hecho las comparaciones se concluye de la siguiente manera, s la diferencia
observada es mayor que el rango respectivo, se concluye que esas medias son significativamente
diferentes, si por el contrario, la diferencia es menor que el rango respectivo, se dice no hay
diferencia significativa entre los tratamientos comparados.
Ejemplo 3 (continuacin)

Un ingeniero industrial realiz un estudio para determinar el tiempo de coccin de una variedad de
frijol. El procedimiento consisti en poner a remojar siete lotes de frijol durante diez horas, donde el
agua de remojo



tratamiento 1
tratamiento
2
tratamiento
3
tratamiento
4

108 84 76 57

109 82 85 67

99 85 74 64

103 92 78 61

107 87 82 63

95 78 75 55

102 90 82 63

media 10329 8543 7886 6143

Ordenando las medias, mayor a menor

<ratamiento 1 10329
<ratamiento 2 8543
<ratamiento 3 7886
<ratamiento 4 6143


Tabla de valor de Rp al 5%
20.90
1.73
7
i Y
S =
i


P L Valor de
tablas
i Y
S
i

Rp
2 24 2.919 1.73 5.05
3 24 3.066 1.73 5.30
4 24 3.160 1.73 5.47

Diferencia poblacional Diferencia Comparativo Decisin
1 4

41.86
41.86 5.47 >
Significativa
1 3

24.43 24.43>5.30 Significativa
1 2

17.86 17.86>5.05 Significativa
2 4

24.00 24>5.30 Significativa
2 3

6.57 6.57>5.05 Significativa
3 4

17.43 17.43>5.05 Significativa

En la comparativa de rangos mltiples todas las diferencias se consideran significativas. No hay
traslapes, dado que se busca el menor tiempo de coccin de frijol y que el tratamiento 4 tiene la
menor media (menor tiempo de coccin) se considera que este ltimo tratamiento es el
seleccionado.

Ejemplo 4

Un fabricante de calzado desea mejorar la calidad de las suelas, las cuales se pueden hacer con
uno de los cuatro tipos de cuero A, B, C y D disponibles en el mercado. Para ello, prueba los
cueros con una mquina que hace pasar los zapatos por una superficie abrasiva; la suela de los
zapatos se desgasta al pasarla por dicha superficie. Como criterio de desgaste se usa la prdida
de peso despus de un nmero fijo de ciclos. Se prueban en orden aleatorio 24 zapatos, seis de
cada tipo de cuero. Al hacer las pruebas completamente al azar se evitan sesgos y las mediciones
en un tipo de cuero resultan independientes de las dems. Los datos (en miligramos) sobre el
desgaste de cada tipo de cuero se muestran en la tabla.

tratamiento cuero 1 cuero 2 cuero 3 cuero 4

264 208 220 217

260 220 263 226

258 216 219 215

241 200 225 224

262 213 230 220

255 206 228 222



Mediante una prueba de anlisis de varianza se realiza el comparativo

La hiptesis nula es
1 2 3 4
:
o
H = = = las medias de los tratamientos son iguales, el desgaste (prdida de peso)
es igual en los 4 diferentes cueros.

La hiptesis alternativa es
1
: para alguna
i j
H i j , al menos uno de los tratamientos es diferente

Criterio de rechazo
Si se cumple que
1, , c k N k
F F

> se rechaza la hiptesis nula.


tratamiento cuero 2 cuero 6 cuero 5 cuero )

264 208 220 217

260 220 263 226

258 216 219 215

241 200 225 224

262 213 230 220

255 206 228 222

media 25667 21050 23083 22067
desv std 829 726 1634 418
varian!a 6867 5270 26697 1747
media de
medias 22967


2-789S9S )E :2392-;2

Origen de las
variaciones
Suma de
cuadrados
Grados de
libertad
Promedio de los
cuadrados F
Probabilida
d
Valor
crtico para
F
Entre 'rupos 707233 3 235744 2324 100E"06 310
)entro de los
'rupos 2029 20 10145


<otal 910133 23

Se rechaza la hiptesis nula. Al menos uno de los cueros tiene un desgaste diferente a los otros
cueros.


Anlisis de Duncan
101.45
4.11
6
i Y
S = =
i


Tabla de valor de Rp al 5%

P L Valor de
tablas
i Y
S
i

Rp
2 20 2.95 4.11 12.12
3 20 3.10 4.11 12.74
4 20 3.18 4.11 13.07

Diferencia poblacional Diferencia Comparativo Decisin
1 2

46.17 46.17>13.07 Significativa
1 4

36.50 36.50>12.74 Significativa
1 3

25.83 25.83>12.12 Significativa
3 2

20.33 20.33>12.74 Significativa
3 4

10.67 10.67<12.12 No Significativa
4 2

9.67 9.67<12.12 No Significativa


De la tabla se observa que los tratamientos 3 (cuero C) y 4 (cuero D) ofrecen un desgaste similar,
la diferencia entre sus promedios no es significativa. De igual manera el desgaste en los cueros D y
B es similar. Dado que se busca el menor desgaste del cuero, se pretende que el promedio del
peso perdido por el cuero en la prueba de desgaste sea el menor, en este caso el cuero B ofrece la
menor pedida de peso, sin embargo se mencion que el cuero D y cuero B ofrecen respuesta
similar, para romper esta incertidumbre se recomienda hacer ms pruebas solo incluyendo a estos
dos cueros.

5uero des'aste 5uero des'aste
2 25667 ) 22017
5 23083 6 21050
Si l =ue se %usca el cuero de menor des'aste( e cuero 6 es me@or opci1n