Está en la página 1de 119

DISEO DE EXPERIMENTOS.

1. Introduccin.(2 hrs).
2. Diseo completamente al azar. (6)
3. Diseo en bloques completos al azar.(4)
4. Diseo en cuadro latino.(4)
5. Arreglo de tratamientos en dos factores.(10)
6. Arreglos de tratamientos multifactorial.(4)
7. Arreglos factoriales dos a la k.(6)
8. Confusin en los arreglos factoriales dos a la k.(6)
9. Bloques incompletos.(4)
10. Factoriales fraccionados.(4)
11. Arreglos Ortogonales de Taguchi.(6)
12. Metodologa de superficie de respuesta.(8).

INTRODUCCION

1. Relacin entre investigacin y estadstica.


2. Objetivo general de la experimentacin.
3. Objetivo de un diseo experimental.
4. Ingredientes de un diseo experimental.
5. Variables y sus relaciones en un diseo experimental.
6. Modelos estadsticos para establecer las relaciones entre
variables en un diseo experimental.

Relacin entre investigacin y estadstica:


La investigacin es una actividad inherente a todo ser humano. En
mayor o menor grado desde pequeos se nota la inquietud por investigar
ciertos aspectos de inters. Por ejemplo, una de las formas de
aprendizaje ms rudimentarias es la prueba y error, en donde la prueba
realmente consiste en un experimento para investigar un cierto
resultado. Las herramientas de investigacin en algunos casos se van
mejorando e incrementando, en otros no evolucionan y permanecen con
las mismas tcnicas rudimentarias de investigacin.
A nivel de actividad profesional, en todos los campos, debe ser una
actividad de primordial importancia. Por ejemplo, para los mdicos, cada
paciente es un sujeto de investigacin, cuyo objetivo es llegar a resolver
un problema. Por otro lado, a nivel del campo de la medicina se lleva a
cabo una labor muy intensa de investigacin para el desarrollo de
nuevos frmacos, nuevas tcnicas quirrgicas, nuevos equipos en el
diagnostico y tratamiento de enfermedades, etc. El desarrollo en todos
los campos de actividad profesional se atribuyen en gran medida a la
aplicacin de los resultados obtenidos a travs de la investigacin.
La gran mayora de las investigaciones se llevan a cabo a travs de la
aplicacin del mtodo cientfico que incluye los siguientes pasos:
1. Establecer el problema.
2. Formular la hiptesis.
3. Disear el experimento o muestreo.
4. Tomar las observaciones.
5. Interpretar los datos.
6. Concluir.

Este proceso lleva implcitos algunos pasos que son de naturaleza


estadstica.

Empezando por la formulacin de la hiptesis, punto de primordial


importancia para el desarrollo de la investigacin. Una hiptesis
estadstica debe incluir el juego de hiptesis que incluye:
La hiptesis nula (Ho).
La hiptesis alternativa (Ha).
La hiptesis alternativa es la correspondiente a la hiptesis de trabajo
del investigador, aplicada a una variable de inters, y por ello es la que
direcciona el proceso de investigacin en lo referente a las evidencias
que el investigador debe colectar y mostrar debidamente procesadas
para apoyar su hiptesis.
La hiptesis alternativa es un enunciado en forma de una desigualdad
que indica el conjunto de valores que el parmetro, correspondiente a la
variable de inters, debe tomar para ser consistente con la hiptesis de
trabajo. En base a la desigualdad, las hiptesis alternativas se
clasifican como:
1. Ensayos bilaterales o de dos colas, cuando el signo de la
desigualdad es diferente de () lo cual implica que la hiptesis
alternativa va a ser apoyada en cualquiera de los dos extremos de
los valores del parmetro. Este tipo de alternativa se establece
siempre que no se tiene una clara idea de la direccin de cambio
en el valor del parmetro.
2. Ensayos unilaterales o de una cola, que corresponden a una
hiptesis de trabajo unidireccional, de tal manera que pueden ser
de cola izquierda (<) o de cola derecha (>). La hiptesis de cola
izquierda implica que el extremo izquierdo de los valores del
parmetro apoyan a la hiptesis de trabajo; esto es, entre mas
pequeo el valor del parmetro mas consistentes son los
resultados con la hiptesis de trabajo. De manera equivalente, en
un ensayo de cola derecha, implicara que entre mas alto el valor
del parmetro mas se favorece a la hiptesis de trabajo.
Hay que hacer notar que la hiptesis alternativa siempre es establecida
como una desigualdad, en la que como tal, nunca debe aparecer el
signo de la igualdad, y debe ser establecida en trminos de la hiptesis
de trabajo.
La hiptesis nula es lo contrario a la hiptesis alternativa, por lo
que siempre incluye el signo de la igualdad. De esta manera
corresponde a la negacin de lo que el investigador desea probar en su
investigacin, por lo que esta se considera como verdadera, hasta que
se muestran suficientes evidencias que apoyan a la hiptesis de trabajo.
La hiptesis nula es una hiptesis de consecuencias estadsticas
definidas, es decir, es posible llegar a determinar que se espera del valor
del parmetro si la hiptesis nula es verdadera.
El mecanismo de una prueba de hiptesis puede ser descrito
como una comparacin entre las evidencias colectadas y lo que se
espera bajo la hiptesis nula. Este mecanismo siempre conduce a una
toma de decisin basada en probabilidades de riesgos de equivocarse.
Para establecer los diferentes escenarios a que puede conducir una
toma de decisin considere el siguiente cuadro, en donde las entradas
son el estado de naturaleza, es decir lo que realmente es en relacin a la
hiptesis nula, y por otro lado, la toma de decisin a que conduce la
evidencia colectada:

DECISION Ho Verdadera Ho Falsa=Ha Verdadera


Rechazar Ho Error tipo I Poder de la prueba
No Rechazar Ho. Confiabilidad Error tipo II

Las posibles decisiones a que puede conducir el mecanismo de una


prueba de hiptesis son:
1. Rechazar Ho, cuando se tienen suficientes evidencias que apoyan
a la hiptesis alternativa. Este tipo de decisin se considera el
mas fuerte, ya que lleva a la implcito el hecho de que el
investigador ha logrado confirmar su sospecha original mediante
su trabajo de investigacin. El error tipo I esta relacionado con
esta decisin al definirlo como: Rechazar Ho cuando Ho es
verdadera. A la probabilidad de este error se le denota por la letra
(alfa) y para propsitos de toma de decisin, el alfa de la prueba
se establece a niveles muy bajos, tales como 0.10, 0.05 o 0.01. A
este nivel de error tipo I fijado en la prueba se le llama nivel de
significancia de la prueba.
2. No Rechazar Ho, cuando el investigador no ha logrado reunir los
suficientes elementos que confirmen su hiptesis de trabajo. Es
una decisin en la que la sospecha queda como tal, y si es
razonable, queda abierta la posibilidad de seguirla investigando,
con tcnicas mejoradas o de manera mas minuciosa que lleve a la
coleccin de evidencias requeridas. El error tipo II esta
relacionado con esta decisin al definirlo como: No Rechazar Ho
cuando Ho es falsa. La probabilidad asociada a este error se le
denota por (beta).
El mecanismo para llevar a cabo una prueba de hiptesis consiste de los
siguientes pasos:
1. Establecer el juego de hiptesis.
2. Establecer la estadstica de prueba.
3. Determinar la distribucin de la estadstica de prueba bajo la
hiptesis nula.
4. Determinar el nivel de significancia y zona de rechazo.
5. Calculo de la estadstica de prueba en base a la evidencia
colectada.
6. Toma de decisin-
7. Conclusin-

Disear el experimento o muestreo:


En estadstica se tienen dos metodologas para la coleccin de
evidencias para probar una hiptesis, que son:
1. Diseo experimental.
2. Diseo de muestreo.
La coleccin de datos bajo un diseo experimental implica un proceso de
control por parte del investigador con la finalidad de asociar datos a
condiciones experimentales. El objetivo es determinar la relacin causa
efecto.
La coleccin de datos por muestreo es un examen de un sistema en
operacin en el que el investigador no tiene oportunidad de asignar
diferentes condiciones a los objetos de estudio. El objetivo bsico es la
caracterizacin del sistema en base a las variables evaluadas.
Entonces, el diseo experimental es una herramienta de metodologa
estadstica para colectar los datos bajo condiciones controladas y a la
vez construir, en base a la metodologa de coleccin, los modelos
necesarios para analizar e interpretar los resultados.

La interpretacin de resultados se lleva a cabo una vez que los


datos colectados son procesados y sometidos al mecanismo de una
prueba de hiptesis. La interpretacin comprende bsicamente la toma
de decisin y la conclusin, incluidas en el mecanismo de la prueba de
hiptesis.

De esta manera, en gran medida, el mtodo cientfico esta


apoyado fuertemente por la metodologa estadstica, desde el
planteamiento de las hiptesis, coleccin de los datos, procesamiento,
interpretacin y conclusin.

Objetivo general de la experimentacin:


En trminos muy sencillos un experimento es una prueba o ensayo que
conduce a un resultado cuantificable.
En trminos prcticos es una manipulacin deliberada de un proceso
con el propsito de medir el impacto del cambio en una o mas variables
de entrada sobre una o mas variables de salida.
Formalmente, el experimento es definido como una operacin llevada a
cabo bajo condiciones controladas para descubrir un efecto
desconocido, probar una hiptesis o ilustrar una ley conocida.
En general, los experimentos son llevados a cabo para explorar, estimar
o confirmar.

Objetivo de un diseo experimental:

El diseo de experimentos o diseo estadstico de experimentos es una


disciplina basada en principios estadsticos, y construida a travs de
aos de experiencia en la ciencia y la ingeniera. Implica el proceso de
diseo y planeacion del experimento, de tal forma que datos apropiados
puedan ser colectados y posteriormente ser analizados por mtodos
estadsticos para llegar a conclusiones validas y objetivas.
Los principales beneficios de la experimentacin diseada es que la
informacin critica es obtenida mas rpido, econmica y confiable de lo
que seria si se aplicara un enfoque no planeado.
El DOE o SDE permite al investigador entender un proceso y determinar
como las variables de entrada (factores) afectan a las variables de salida
(respuesta). Es un enfoque sistemtico para la optimizacin de
procesos. En general el DOE puede ser usado para:
1. Estudiar el efecto de varios factores sobre el comportamiento del
producto o proceso.
2. Entender la relacin entre las variables de entrada y las variables
de salida.
3. Identificar las condiciones optimas de un proceso que maximizan
o minimizan la respuesta.
4. Reducir la variabilidad en las caractersticas de un producto.
5. Mejorar la confiabilidad del producto.
6. Reducir costos de manufactura.
7. Acortar el tiempo de desarrollo de productos o procesos.

Variables y sus relaciones en un diseo experimental:


En todo experimento debemos definir la unidad experimental, como el
material mnimo requerido para aplicar los tratamientos (las causas) y
evaluar las respuestas (los efectos).
Tambin debemos definir los tratamientos como cada una de las
diferentes condiciones experimentales que van a ser evaluadas en el
experimento.
Las variables en un diseo experimental se clasifican fundamentalmente
en dos grandes grupos de acuerdo su rol en la unidad experimental:
1. Variables de entrada.
2. Variables de salida.
Las variables de entrada son todas aquellas variables a las que esta
expuesta la unidad experimental. Comprende los siguientes grupos de
variables:
1. Factores experimentales.
2. Factores de bloqueo.
3. Factores de ruido.
4. Variables deliberadamente controladas.
5. Variables no controladas.
Factores experimentales:
Los factores experimentales son aquellas variables del proceso que
deliberadamente son manipuladas en un experimento para investigar su
impacto sobre las variables de respuesta. Cada uno de los valores de
estas variables incluidos en un experimento se denomina los niveles del
factor. Si el experimento incluye solo un factor (experimento unifactorial),
entonces cada uno de los niveles se constituye en un tratamiento. Si el
experimento incluye varios factores (experimento multifactorial),
entonces la combinacin de los niveles de todos y cada uno de los
factores incluidos ser lo que se constituya como un tratamiento.
Los factores experimentales se clasifican de acuerdo a varios criterios:
De acuerdo a la naturaleza de los niveles los factores se clasifican en:
1. Cualitativos o categricos.
2. Cuantitativos o continuos.
Los cualitativos o categricos son aquellos factores donde la escala de
los niveles es puramente nominal. Para este tipo de factores el inters se
centra en la comparacin de los promedios, para seleccionar el mas
adecuado. Al graficar estos promedios no existe un orden nico de los
niveles y por lo tanto nunca deben usarse lneas continuas o de puntos
en su representacin, siendo lo mas conveniente una grafica de barras.
Los factores cuantitativos son aquellos cuyos niveles se expresan en
una escala numrica, siendo el principal objetivo del anlisis el describir
un modelo de respuesta de acuerdo a los niveles de este factor. Su
representacin grafica mas adecuada es a travs de puntos o lneas.
De acuerdo a la forma de seleccin de los niveles del factor, se clasifican
como:
1. Factores fijos.
2. Factores aleatorios.
Los factores fijos son aquellos en los que la seleccin de los niveles esta
basada en el inters del investigador, quien decide cuales son los que
deben incluirse en el experimento. Para este tipo de factores las
conclusiones estn restringidas al rango de niveles seleccionados, para
factores continuos, o estrictamente para los niveles seleccionados en
caso de los factores cualitativos.
Los factores aleatorios son aquellos en donde los niveles del factor se
seleccionan de una poblacin de niveles de una manera aleatoria. Para
este tipo de factores el inters esta centrado en investigar la variabilidad
que genera el cambio en los niveles de este factor.
Para los experimentos multifactoriales, los factores se clasifican de
acuerdo a la relacin que guardan los niveles de los factores en:
1. Factores cruzados, en los que los niveles de dos factores son
independientes, es decir, los niveles de un factor se pueden
combinar sin ninguna restriccin con los niveles del segundo
factor, generando as una estructura factorial de tratamientos.
2. Factores anidados, en los que los niveles de un factor de jerarqua
inferior depende de los niveles de un factor de jerarqua superior,
generando as una estructura jerrquica.

Factores de bloqueo: Cuando fuentes de variacin extraas e


indeseables pueden ser identificadas, podemos disear el experimento
de tal forma que eliminemos su influencia. La idea es arreglar las
unidades experimentales en grupos o bloques de unidades uniformes en
los valores de la variable de bloqueo, asignando luego, al azar, los
tratamientos dentro de cada bloque. La variabilidad entre bloques es
considerada en el anlisis, lo que conduce a una mejora en la precisin
del experimento. Cuatro criterios son frecuentemente usados para
bloquear unidades experimentales: Proximidad de unidades
experimentales; caractersticas fsicas de las unidades experimentales
que tengan un impacto fuerte en las variables de respuesta; tiempo;
administracin de tareas en el experimento.

Factores de Ruido: Son las variables que solo pueden controlarse


durante la fase experimental, ya que resulta difcil o costoso tratar de
controlarlas durante la etapa de produccin normal.

Variables deliberadamente controladas: Conjunto de variables en un


experimento que se caracterizan por tomar un valor constante durante la etapa
experimental, debido al control que ejerce el investigador sobre estas.
Variables no controladas: Conjunto muy grande de variables que se les
permite variar sin control durante un experimento. Algunas pueden ser
monitoreadas y llegar a convertirse en covariables. Otras puede ser que no
sean medibles o accidentalmente ignoradas y este grupo es el que origina el
error experimental. En cualquier caso, el impacto que tienen sobre las variables
de respuesta debe ser mnimo. Si sucede que una variable de este grupo
cambia a la par con los niveles de un factor experimental, esto ocasiona una
confusin, ya que el anlisis no puede separar el efecto en el cambio
simultaneo de ambas variables. Si el investigador no esta consciente de este
cambio simultaneo de variables, entonces la variable no controlada va a
enmascarar el efecto del factor experimental.
Las covariables deben reunir dos caractersticas: Guardar una relacin lineal
con las variables de respuesta y que no deben ser impactadas por los
tratamientos. Estas variables, que pueden ser del ambiente fsico o de las
mismas unidades experimentales, son analizadas conjuntamente con la
respuesta para mejorar la precisin del experimento.

Las variables de salida es el conjunto de variables que se van a evaluar


en la unidad experimental, una vez que el tratamiento haya impactado, para
determinar los efectos de tratamiento. Las respuestas se seleccionan en base a
dos criterios: Las respuestas que son sensibles a los factores experimentales
que se estn investigando y las respuestas que son de importancia econmica.

Componentes de un diseo experimental:


Dos caractersticas de todo diseo experimental son:
1. Repeticin.
2. Aleatorizacion.
La repeticin se refiere a que cada condicin experimental debe ser aplicada
de manera independiente, al menos a dos unidades experimentales. A travs
de las repeticiones en un tratamiento se evala la consistencia del tratamiento
en lo que se refiere a su efecto. Si los resultados en una variable de inters
son muy similares entre si, entonces el efecto del tratamiento es muy
consistente. Una medida de esta consistencia es el grado de dispersin que
tienen las repeticiones de un tratamiento con respecto a su media de
tratamiento, medida de variabilidad dentro de tratamiento que es conocida
como el error experimental. Adems, el nmero de repeticiones repercute en la
estimacin de la varianza de la media de tratamiento.
La aleatorizacin se refiere al proceso de asignacin de tratamientos a las
unidades experimentales. El objetivo de este mecanismo de asignacin es
distribuir en forma aleatoria las diferencias entre unidades experimentales, de
tal manera que ninguno de los tratamientos se favorezca o se perjudique con
alguna asignacin tendenciosa generada a base del juicio del investigador.
A travs de un diseo experimental se pretende entonces probar una hiptesis
acerca del efecto de los tratamientos bajo condiciones controladas. Para tal fin
todo diseo experimental consta de dos componentes:
1. Arreglo geomtrico de las unidades experimentales. Este componente se
enfoca a mejorar la precisin de las estimaciones reduciendo variabilidad
de unidades experimentales dentro de tratamientos. El mecanismo para
definir arreglos geomtricos es el manejo de las variables de bloqueo y
el sistema de aleatorizacion. Los principales arreglos geomtricos son:
El diseo completamente al azar, el diseo en bloques al azar y el
diseo en cuadro latino.
2. Arreglo de tratamientos. Este componente se enfoca a generar la
estructura de los tratamientos adecuada a la hiptesis que se desea
probar. Las estructuras bsicas son: Estructuras unifactoriales y
estructuras multifactoriales. En las multifactoriales podemos distinguir las
estructuras factoriales, estructuras jerrquicas y en parcelas divididas.

Modelos para establecer las relaciones entre variables en un diseo


experimental:
En diseo de experimentos todo el anlisis de resultados se lleva a cabo
mediante el ajuste de modelos. Estos modelos, en general se establecen como:
RESPUESTA = INDEPENDIENTES + ERROR
En Las variables independientes deben distinguirse aquellas que son fijas de
las que son aleatorias. Las fijas se agrupan dentro de la parte sistemtica del
modelo y las aleatorias en lo que se considera la parte aleatoria del modelo,
dentro de la cual se puede ubicar el error, por lo que la estructura del modelo
quedara como:
RESPUESTA = SISTEMTICA + ALEATORIA
En la parte sistemtica se incluira entonces los factores experimentales y los
factores de bloqueo, en tanto que en la parte aleatoria se incluiran los efectos
aleatorios y el error experimental.

EL DISEO COMPLETAMENTE AL AZAR

Es el arreglo geomtrico ms simple, en el que se supone que tanto las


unidades experimentales como el ambiente fsico en el que se lleva a cabo el
experimento son totalmente homogneos, uniformes, sin cambio, lo cual
representara un ambiente controlado y un material experimental estable. Bajo
estas condiciones ideales solo quedara por definir los factores experimentales
y sus niveles para determinar los tratamientos o condiciones experimentales
que van a ser investigadas. Por esta razn, el nico efecto incluido en el
modelo bajo este diseo, es precisamente el efecto de los tratamientos, que
sera la nica fuente de variacin identificable en este experimento.
Como puede ser sospechado, difcilmente se van a cubrir los requisitos para
poder aplicar este diseo, por lo que en la prctica solo se recomienda para
condiciones muy controladas, como es el caso de experimentos de laboratorio.

Aleatorizacion: Ya que las unidades experimentales y las condiciones fsicas


en las que se va a llevar a cabo el experimento son muy homogneas,
entonces el mecanismo de asignacin de tratamientos a las unidades
experimentales es completamente al azar, lo cual se puede lograr mediante la
aplicacin de cualquier mtodo de sorteo aleatorio. Puede ser mediante el uso
de nmeros aleatorios, mediante seleccin aleatoria de nmeros asociados a
unidades experimentales y aplicacin secuencial de tratamientos. Si en
realidad las unidades experimentales son muy homogneas, entonces
cualquier nmero de subgrupos generados al azar van a ser tambin muy
similares, lo cual asegura una comparacin muy justa de los tratamientos. Este
diseo, es una generalizacin, para comparar ms de dos tratamientos, de la
comparacin de dos medias mediante la prueba de t para muestras
independientes.
Datos en el diseo completamente al azar: Los datos en un diseo
completamente al azar solo tienen un criterio de clasificacin, correspondiente
a los tratamientos. Para identificar a cada una de las observaciones, se
requieren entonces de dos subndices ligados a la letra que representa la
variable de respuesta; de acuerdo al modelo estadstico
Yij = + i + ij
El subndice i esta asociado al tratamiento y el subndice j esta asociada a la
repeticin dentro de cada tratamiento.
Yij corresponde al valor de la variable de respuesta en la repeticin j del
tratamiento i.
es la media general del experimento.
i es el efecto del tratamiento i.
ij es el error experimental en la repeticin j del tratamiento i.

i=1,2,,t; j=1,2,,r
Lo cual indica que en el experimento hay t tratamientos, y en cada tratamiento r
es el numero de repeticiones, cuando el numero de repeticiones es el mismo
en cada tratamiento; entonces el experimento esta balanceado. Cuando el
numero de repeticiones varia de tratamiento a tratamiento, el diseo
experimental ser desbalanceado y el subndice j llegara a un numero diferente
para cada tratamiento, lo cual puede ser indicado con j=1,2,,r i .
Hiptesis que se desea probar: La hiptesis que se desea probar es la
referente al efecto de los tratamientos. La hiptesis estadstica es:
Ho: Todos los efectos de tratamientos son iguales a cero.
Ho: 1=2==t=0
Ha: Al menos uno de los efectos de tratamiento es diferente de cero.
Para expresarla en trminos de los parmetros del modelo tendra que ser una
hiptesis mltiple, que por el momento no es de inters llegar a detallar.
Lo importante en este punto es recordar que la hiptesis nula es de
consecuencias estadsticas definidas. En este caso la consecuencia de la
hiptesis nula, es que el modelo estadstico se reduce a:
Yij = + ij
Al que se le llama el modelo reducido. Para probar esta hiptesis el
razonamiento que se sigue es evaluar la magnitud de los errores en ambos
modelos y determinar que tanto impacto tienen los efectos de tratamiento. Si la
reduccin en los errores es importante, entonces el efecto de los tratamientos
se declara significativo. Por el contrario, si la magnitud de los errores
prcticamente es la misma en ambos modelos, esto significa que los efectos de
tratamiento no contribuyen a explicar la respuesta, y por lo tanto son
declarados no significativos.
Anlisis de los datos: El anlisis de los datos de un diseo experimental
siempre se lleva a cabo mediante la tcnica del anlisis de varianza. Para
aplicar esta tcnica se requiere del ajuste de los dos modelos al mismo
conjunto de observaciones, el completo y el reducido bajo la hiptesis nula,
para despus comparar la magnitud de los errores obtenida en ambos
modelos.
El ajuste de un modelo consiste en estimar sus parmetros, es decir todos
aquellos componentes del modelo que no incluyan la secuencia completa de
subndices usada en la variable de respuesta. En otras palabras, el nico
componente que no se estima en el ajuste del modelo es el que corresponde al
error experimental.
En el ajuste del modelo se deben tener en cuenta las siguientes caractersticas
tanto del conjunto de observaciones como del modelo que se desea ajustar:
1. Numero total de observaciones: Corresponde al numero total de
valores en el diseo experimental. Vamos a denotar este numero con
la letra n.
2. Numero de parmetros independientes en el modelo que se ajusta:
Parmetros independientes son aquellos que no estn sujetos a las
restricciones impuestas por la definicin de los parmetros. Por
ejemplo el modelo reducido solo tiene un parmetro, que es
independiente; en el modelo completo del diseo completamente al
azar se impone la restriccin de i=1i = 0, por lo que el numero de
parmetros independientes seria t-1. A estos faltara sumar el
parmetro , por lo que entonces serian t parmetros independientes.
3. Grados de libertad para el modelo ajustado: Se refiere al numero de
componentes independientes en el conjunto de datos despus de
haber ajustado un modelo. Los grados de libertad se van reduciendo
a medida que se introducen mas componentes en un modelo. Estos
grados de libertad son los que permiten estimar la varianza del error,
por lo que se recomienda en general que no deben ser inferiores de
10 a 12 en el modelo completo. Se estiman como:
G.L. = n parmetros independientes en el modelo.
Para el modelo completo de un diseo completamente al azar se tiene:
G.L. = n t
Para el modelo reducido se tienen:
G.L.= n 1
Al revisar la estructura del modelo reducido y el modelo completo se puede
deducir que los resultados de las diferencias entre el modelo reducido
menos el modelo completo se pueden atribuir al termino que corresponde al
efecto de los tratamientos. Entonces:
G.L.Trat = t 1
Estos grados de libertad son de particular importancia, ya que indican el
numero de parmetros independientes en un modelo ajustado al conjunto
de datos, tomando como variables independientes los tratamientos. Si el
factor es cuantitativo, entonces los grados de libertad indican el grado
mximo de polinomio en el modelo de regresin; si se trata de un factor
cualitativo, entonces los grados de libertad en los tratamientos indica el
numero mximo de comparaciones independientes entre los niveles del
factor.

Con esta informacin podemos empezar a generar la tabla de anlisis de


varianza, que resume el ajuste de modelos y sus comparaciones. Para el
diseo completamente al azar, las fuentes de variacin bsicas que se
incluyen son:
Tratamientos
Error
Total.
El total corresponde al ajuste del modelo reducido. De esta manera cuando
requiramos los grados de libertad del total, sern los grados de libertad al
ajustar el modelo reducido, esto es n-1.

El error corresponde al ajuste del modelo completo. Cuando hablemos de


los grados de libertado en un diseo completamente al zar, entonces se
calcularan como n t.

Hasta aqu el anlisis de varianza solo requiere de la informacin de


cuantas observaciones comprende el conjunto de datos y cuantos
tratamientos van a ser incluidos. Para el resto del anlisis se requiere ya del
procesamiento de los datos y ajuste de los modelos.

Ajuste de modelos por mnimos cuadrados ordinarios: Los modelos de


anova se ajustan por mnimos cuadrados ordinarios, llamados as porque el
ajuste se lleva a cabo bajo las suposiciones convencionales de anlisis,
esto es, suponiendo normalidad, independencia y homogeneidad de
varianzas en el componente de error. Una supocisin adicional es la
aditividad de los componentes del modelo. Los pasos para llevar a cabo el
ajuste son los siguientes:
1. Definir el modelo que se va a ajustar.
2. Definir las restricciones que se imponen en los parmetros del modelo.
3. Obtener la expresin para el error experimental despejando este termino
del modelo que se vaya a ajustar.
4. Obtener la expresin para la suma de cuadrados de los errores.
5. Derivar la expresin de la suma de cuadrados de los errores con
respecto a cada uno de los parmetros del modelo.
6. Igualar a cero las derivadas, para generar las ecuaciones normales de
mnimos cuadrados.
7. De las ecuaciones normales de mnimos cuadrados se despejan los
estimadores de los parmetros.
Vamos a considerar el modelo reducido del diseo completamente al azar
para ejemplificar los pasos del ajuste de un modelo:
1. Modelo que se va a ajustar: Yij = + ij
2. Restricciones en los parmetros: No hay restricciones.
3. Error experimental: ij = Yij -
4. S.C.E. = ijij2 = ij(Yij )2
5. Derivada de la S.C.E. con respecto al parmetro : 2 ij(Yij )(-1).
6. Ecuacin normal de mnimos cuadrados: -2 ij(Yij ) = 0
7. Estimador del parmetro: Media general de las observaciones.
Este proceso de estimacin es para obtener las expresiones algebraicas de los
estimadores de mnimos cuadrados ordinarios y solo es necesario desarrollarlo
cuando estas se desconozcan, ya que si se tienen a la mano, pues solo
restara aplicarlas al conjunto particular de observaciones. Por otro lado si se
tiene un paquete estadstico disponible, lo nico que hara falta es cargar
adecuadamente los datos y darle correctamente las instrucciones para que
genere los estimadores y todo el anlisis completo. Por estas razones vamos a
enfocar la atencin al manejo del paquete para captura y anlisis de resultados
mas que a la teora para generar estimaciones.

Sumas de cuadrados en la tabla de anlisis de varianza: Una vez que los


estimadores de los parmetros del modelo han sido obtenidos, pueden
obtenerse los valores ajustados para cada una de las observaciones, a los que
se les denominan los valores predichos. Por diferencia de los observados
menos los predichos se obtienen los residuales o errores estimados para cada
una de las observaciones. Al elevar al cuadrado cada uno de los residuales se
obtienen solo cantidades positivas, que al sumarlas generan las sumas de
cuadrados de los errores para el modelo ajustado.
En cuanto a las sumas de cuadrados de los errores de un modelo ajustado se
deben hacer las siguientes observaciones:
a). Mientras mas reducido sea el modelo ajustado, esto es, mientras menor
sea el numero de parmetros que contiene, la suma de cuadrados de los
errores tendera a ser mayor.
b). Cada suma de cuadrados de los errores tiene asociados un cierto
numero de grados de libertad, que como ya se discuti, se calculan por la
diferencia del numero de observaciones menos el numero de parmetros
independientes que se van a estimar
c). La suma de cuadrados de los errores refleja, en general, que tan
separados estn los valores observados de los valores ajustados por el
modelo.
d). Al comparar las sumas de cuadrados de los errores de un modelo
reducido contra un modelo completo, la diferencia puede ser atribuida a los
componentes que aparecen en el modelo completo pero que no aparecen en el
modelo reducido. As entonces en el diseo completamente al azar, la
diferencia entre el modelo reducido Yij= + ij y el modelo completo Yij=+i + ij
se puede atribuir al efecto de los tratamientos, y esta suma de cuadrados tiene
asociados t-1 grados de libertad.
Hasta aqu podemos construir la tabla de anlisis de varianza para un diseo
completamente al azar, con las siguientes columnas:

Fuente de variacin Grados de libertad Suma de cuadrados


Tratamientos t-1 Diferencia.
Error n-t S.C.E. modelo completo
Total n-1 S.C.E. modelo reducido

Estadstica de prueba en el anlisis de varianza: A partir de estas columnas


en el anlisis de varianza, que fueron generadas en base a la informacin
colectada de los datos y del ajuste de los modelos, se calcula otra columna
encabezada por el titulo de cuadrados medios, que contiene el estimador de
varianza para cada fuente de variacin. Como cualquier varianza, estas
cantidades se calculan como el cociente de la suma de cuadrados entre sus
grados de libertad.
Finalmente, la estadstica de prueba que se utiliza en el anlisis de varianza es
una F, el cociente de dos varianzas, a partir de la cual se va a poder tomar una
decisin acerca de la hiptesis planteada en trminos de los efectos de
tratamientos. La F calculada es el cociente del cuadrado medio de tratamientos
entre el cuadrado medio del error.
En los paquetes estadsticos una columna adicional es agregada a la tabla de
anlisis de varianza para mostrar el valor de probabilidad, es decir, la
probabilidad de obtener un valor de F mayor o igual a la F calculada. Con este
nico valor es posible llegar a una decisin acerca de la hiptesis, al
compararlo con el nivel de significancia de la prueba. Las decisiones basadas
en este criterio son:
Rechazar Ho si el valor de probabilidad es menor o igual al nivel de
significancia de la prueba.
No rechazar Ho si el valor de probabilidad es mayor que el nivel de
significancia de la prueba.

Ejemplo numrico 1: Observaciones de la produccin de una reaccin qumica tomada a


diferentes temperaturas fue registrada como sigue:
150 77.4
150 76.7
150 78.2
200 84.1
200 84.5
200 83.7
250 88.9
250 89.2
250 89.7
300 94.8
300 94.7
300 95.9

La primer columna representa los niveles de temperatura que se incluyeron en


el experimento y la segunda columna los valores correspondientes a la
produccin de la reaccin qumica. Como puede ser observado, se realizaron
tres repeticiones por cada uno de los cuatro niveles de temperatura.
Para empezar un anlisis exploratorio del comportamiento de los datos,
siempre es recomendable graficar las observaciones contra los niveles del
factor bajo estudio. En este caso la grafica resulta ser
Dos patrones son los que deben ser observados en una grafica exploratoria:
1. La tendencia o patrn general de las observaciones. Debe ser
identificado el comportamiento de los datos de acuerdo a los niveles
del factor bajo estudio. Aqu observamos que a medida que aumenta
la temperatura la produccin de la reaccin tambin aumenta de
manera muy consistente, esto es, que se tiene un comportamiento
lineal de la produccin con respecto a los niveles de temperatura.
2. Observaciones que se salen del patrn general de tendencia: En
estas graficas exploratorias tambin pueden ser identificadas
aquellas observaciones que no siguen el patrn de comportamiento.
Estas observaciones deben ser cuidadosamente tratadas y
checadas, pues en la gran mayora de las ocasiones son resultado
de un error, ya sea en el experimento, a la hora de registrar, o
inclusive capturar la informacin. En este ejemplo, como puede ser
observado en la grafica, todas las observaciones siguen el mismo
comportamiento de tendencia lineal.

El anlisis de los datos consiste de los siguientes puntos, que corresponden


a los de una prueba de hiptesis:
1. Establecer las hiptesis: Ho: Todos los efectos de tratamiento son
iguales a cero. Ha: al menos uno de los efectos de tratamiento es
diferente de cero.
2. Llevar a cabo la tabla de anlisis de varianza.
Anlisis de varianza de un factor
ANLISIS DE VARIANZA
Origen de las Suma de Grados de Promedio de los Probabilida Valor crtico
variaciones cuadrados libertad cuadrados F d para F
Entre grupos 510.456667 3 170.152222 511.736007 1.7736E-09 4.06618056
Dentro de los
grupos 2.66 8 0.3325

Total 513.116667 11

3. Cantidades bsicas del anova:


3.1 Coeficiente de determinacin R-cuadrado:
3.2 Desviacin estndar del error:
3.3 Probabilidad de un valor mayor de F:
El coeficiente de determinacin R-cuadrado es el porcentaje de variacin explicado
por el efecto de los tratamientos. Se calcula como una regla de tres directa, en la que
la suma de cuadrados del total es al 100 % como la suma de cuadrados de
tratamientos es al coeficiente de determinacin. Para nuestro ejemplo:
513.116667 100%
510.456667 Coeficiente de determinacin

R-Cuadrado = 510.456667100 = 99.4816


513.116667
Lo que significa que el 99.48 % de la variacin en el conjunto de observaciones
esta siendo explicado por la variacin en la temperatura y solo el 0.52 % se
debe a los factores de error.
La varianza del error lo constituye el cuadrado medio del error y la desviacin
del error se calcula como la raz cuadrada de la varianza, siendo en este caso
S = 0.5679
La probabilidad mayor de un valor de F es lo que se denomina el valor de P o
nivel de significancia observado, valor que nos permite tomar una decisin
sobre la hiptesis acerca del efecto de los tratamientos. En este caso el valor
es
P = 1.7736E-09
Aun cuando parece mayor que uno, el componente E-09 indica que hay ocho
cero antes de la parte entera, lo que representa un valor muy inferior al 0.05
que consideramos como nivel de significancia de la prueba, por lo cual la
hiptesis nula es rechazada, y por lo tanto se concluye que los tratamientos si
tienen un efecto significativo sobre la respuesta.
Ya que se trata de un factor cuantitativo, la mejor manera de investigar el efecto
de los tratamientos es a travs de una regresin polinomial, checando hasta
que nivel de tendencia llega a ser significativa.

Ejemplo numrico 2: Los datos siguientes se refieren a las perdidas de peso de ciertas
piezas mecnicas (en miligramos) debidas a la friccin cuando tres diferentes
lubricantes se utilizaron en condiciones controladas. El lubricante C es el que se ha
estado usando en el proceso, y ahora se desea evaluar dos nuevas posibilidades, el
lubricante A y el lubricante B.
Lubricante Desgaste
A 12.2
A 11.8
A 13.1
A 11
A 3.9
A 4.1
A 10.3
A 8.4
B 10.9
B 5.7
B 13.5
B 9.4
B 11.4
B 15.7
B 10.8
B 14
C 12.7
C 19.9
C 13.6
C 11.7
C 18.3
C 14.3
C 22.8
C 20.4

Anlisis exploratorio:
Mediante una grafica de barras con su error estndar, podemos determinar el
comportamiento de desgaste y la variabilidad en el conjunto de observaciones.
Como puede observarse en la grafica, los patrones de dispersin dentro de
cada lubricante son muy parecidos (por la similitud en las barras de error
estndar). Puede observarse tambin que el lubricante de mayor valor en la
respuesta es el C, seguido en orden decreciente por el lubricante B y el de mas
baja respuesta en promedio el lubricante A.
Planteamiento de la hiptesis:
Ho: Las medias de desgaste por friccin bajo los tres lubricantes empleados
son iguales.
Ha: Al menos una media de desgaste asociada a un lubricante es diferente.
Modelo estadstico para este conjunto de datos:
Bajo la Ha el modelo es el correspondiente a un diseo completamente al azar:
Yij = + i + ij
Yij corresponde al valor del desgaste en la repeticin j del tratamiento i.
es la media general del desgaste.
i es el efecto del lubricante i.
ij es el error experimental en la repeticin j del lubricante i.

i=1,2,3 j=1,2,,8

Anlisis de varianza para probar la hiptesis:


ANLISIS DE VARIANZA
Origen de las Suma de Grados de Promedio de los Probabilida Valor crtico
variaciones cuadrados libertad cuadrados F d para F
Entre grupos 230.585833 2 115.292917 8.74681521 0.00172472 3.46680011
Dentro de los
grupos 276.80375 21 13.181131

Total 507.389583 23

R-Cuadrado = 0.4544
Lo que significa que los lubricantes explican el 45 % de la variacin en el
conjunto de datos. El 55 % se debe a factares no considerados en la
investigacin.
Desviacin estndar = 3.6306 que es el promedio del error en nuestro conjunto
de datos bajo el modelo completo.
Error estndar del la media = 1.2836
Lo que viene a confirmar el patrn de similitud en la variacin de desgaste
dentro de cada lubricante, al obtener un error estndar muy similar a partir del
anlisis de varianza, con los ya obtenidos para cada lubricante por separado.
Valor de P = 0.0017
Que por ser menor al nivel de significancia de la prueba (0.05) se toma la
decisin de rechazar Ho y concluir que las medias de desgaste en los tres
lubricantes no son iguales. Esto implica que el lubricante entonces si tiene un
impacto en el nivel de desgaste, por lo cual debemos investigar el patrn de
variacin entre lubricantes y poder llegar a tomar una decisin acerca de cual
lubricante es el mas conveniente para conservar las piezas de la maquinaria.

MTODOS PARA IDENTIFICAR PATRONES DE VARIACIN POR


TRATAMIENTOS

El mtodo para factores cuantitativos es la regresin y para factores cualitativos


es la comparacin de medias. Ambos procedimientos se pueden llevar a cabo
por sus mtodos muy particulares o bien, bajo condiciones muy especificas,
ambos se pueden llevar a cabo por medio de los contrastes ortogonales.
Vamos a revisar primero los mtodos especficos para cada tipo de factor y
posteriormente se discutir el enfoque general de contrastes ortogonales.
REGRESIN:
La regresin es una metodologa de anlisis estadstico muy general,
que aplica cuando se quiere investigar la relacin que guardan una variable
dependiente con una o mas variables independientes. La regresin es muy
extensa, y aqu solo nos limitaremos, en este punto, a la regresin lineal de tipo
polinomial en una variable independiente.
Los modelos de regresin polinomial se caracterizan por la potencia en
la variable independiente. Como se muestra en la siguiente tabla los modelos
de mas importancia son:
Grado Modelo Descripcin
Lineal Yij=o + 1Xij + ij Lnea
Cuadrtico Yij = o + 1 Xij + 2 X2ij + ij Parbola

La estructura general del modelo polinomial consiste en que la variable


de respuesta se describe a travs de un intercepto (o) valor en la variable de
respuesta cuando la variable independiente es igual a cero y una serie de
trminos aditivos que consisten en el producto de la pendiente (i) multiplicada
por la variable independiente elevada a la potencia i. La pendiente o tasa de
cambio es el cambio en la variable de respuesta por unidad de cambio en la
variable independiente. De esta manera, estos polinomios pueden ser
generalizados a cualquier grado. Es conveniente, aclarar desde aqu, que el
ajuste de estos modelos va a estar limitado por el nmero de niveles en la
variable independiente en el conjunto de datos. El gado de polinomio mximo
va a estar dado por el numero de grados de libertad en los tratamientos, que
corresponde exactamente a los parmetros, quitando el intercepto, que se
incluyen en el modelo- As un modelo lineal puede ajustarse a un conjunto de
datos con dos niveles en la variable independiente, un cuadrtico requiere
mnimo tres niveles en la variable independiente para poder ser ajustado, etc.
Esto implica, que un modelo mas all de ese grado no podr ser ajustado, con
lo que no es posible llegar a determinar si en realidad dicho modelo ajusta bien
al conjunto de datos. Por esta razn se recomienda que cuando sospechemos
de un modelo polinomial de grado p, el numero de niveles en la variable
independiente sea al menos p+2, para que de esta manera tengamos
posibilidad de llevar a cabo un prueba de falta de ajuste. Esta prueba consiste
en comparar que tan bien se ajusta el modelo propuesto contra un modelo de
grado ms alto. Cada grado que aumenta la ecuacin polinomial de regresin,
se le asocia un grado de libertad, de los correspondientes a los tratamientos.
De esta manera, los grados de libertad que quedan despus de ajustar una
ecuacin polinomial de un cierto grado, se asocian a lo que se conoce como
falta de ajuste, con la que se prueba si alguna de las tendencias incluidas en
esta podra llegar a ser significativa, con lo cual se anulara el modelo
propuesto. Esta es la forma de checar si el modelo requiere de mas
parmetros de los que se estn considerando.
Ejemplo numrico 3. Continuando con el ejemplo numrico 1, podemos
investigar el efecto de los tratamientos al ajustar una regresin lineal al
conjunto de datos:

Coeficiente Error Estadstico Probabilida Inferior Superior


s Estandar t d 95% 95%
Intercepto 60.2633333 0.74439685 80.9559223 2.0211E-15 58.6047138 61.9219529
Temperatur 0.11653333 0.00321082 36.2940036 5.9937E-12 0.10937919 0.12368748

En este ajuste podemos observar que ambos parmetros son estadsticamente


diferentes de cero, ya que al probar:
Ho: 1 = 0 vs. Ha 1 0 P = 5.99 E-12, que para todo propsito practico es
igual a cero, y por lo tanto se rechaza Ho, y se concluye que la pendiente es
diferente de cero. Su valor estimado es de 0.1165 con un error estndar de
0.0032, lo que indica que la produccin aumenta 0.1165 unidades por cada
grado de incremento en la temperatura. Por cada 100 grados de aumento, la
produccin aumenta 11.65 unidades. Con este valor ya tenemos evaluado el
cambio que sufre la variable dependiente por un cambio en la independiente.
Ya no es necesario establecer comparaciones de medias para saber si son
estadsticamente diferentes, pues esto de antemano y se sabe.
Ho: 0 = 0 vs. Ha 0 0 P = 2.02 E-15, que tambin es menor del nivel de
significancia de la prueba, y por lo tanto se rechaza Ho, concluyendo que el
intercepto es diferente de cero, con un valor estimado de 60.26 con un error
estndar de 0.74444, lo que debera interpretarse como el valor de la
produccin cuando la temperatura fuera igual a cero. Aprovechando el ejemplo,
debemos comentar que esta interpretacin seria correcta siempre y cuando la
tendencia en la produccin se mantuviera constante como la que se encontr
de 150 a 350 grados, lo cual es poco creble, y en todo caso, no se tiene la
evidencia suficiente de que as sea. Entonces, queda en entredicho la
interpretacin que se pueda dar a este valor.
Al aplicar la formula encontrada de la ecuacin de regresin dada por
Produccin = 60.26 + 0.1165*Temperatura
Se determinan los valores esperados bajo el modelo de regresin ajustado, y al
graficarlos sobrepuestos contra la temperatura, resulta la curva ajustada.

Junto con la ecuacin de regresin ajustada, los paquetes tambin proporcionan el


anlisis de varianza de la regresin, como a continuacin se muestra
ANLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crtico
libertad cuadrados cuadrados F de F
Regresin 1 509.250667 509.250667 1317.2547 5.9937E-12
Residuos 10 3.866 0.3866
Total 11 513.116667

Si se observa el valor de P coincide con el que ya se haba calculado para el


parmetro de la pendiente, debido a que la hiptesis que se prueba con este
abalisis de varianza es exactamente la misma, acerca de la pendiente.
Entonces lo importante de este anlisis de varianza es conectarlo con el
anlisis de varianza para probar el efecto de los tratamientos. Para tal fin
debemos considerar los siguientes clculos:
G.L.Trat G.L.Reg.Lin = 3 1 = 2 que representan los grados de libertad
asociados a la tendencia cuadrtica y cbica que pueden ser ajustados a este
conjunto de datos por haber 4 niveles en la variable independiente.
S.C.Trat S.C.Reg.Lin = 510.4566 509.2507 = 1.2059 que corresponde a la
suma de cuadrados debida a la tendencia cuadrtica mas la suma de
cuadrados debida a la tendencia cbica. Esta suma de cuadrados con los dos
grados de libertad asociados, se le conoce como falta de ajuste.
Esta informacin puede ser anexada en una tabla de anova con separacion de tendencias
por efecto de los tratamientos.
ANLISIS DE VARIANZA
Origen de las Suma de Grados de Promedio de los Probabilida Valor crtico
variaciones cuadrados libertad cuadrados F d para F
Entre grupos 510.456667 3 170.152222 511.736007 1.7736E-09 4.06618056
Separacion
Tendencia
Lineal 509.2507 1 509.2507 1531.581053 0.000000 5.3176
Falta de Ajuste 1.2059 2 0.6029 1.813230 0.224166 4.4589

Dentro de los
grupos 2.66 8 0.3325

Total 513.116667 11

Con la prueba acerca de la falta de ajuste se concluye que el modelo ajustado


a los datos no requiere de mas parmetros. Por lo que finalmente se puede
sugerir el modelo lineal encontrado es el que mejor ajusta a este conjunto de
observaciones.

Prueba de separacin de medias:


Es un mtodo que se aplica despus de que el anlisis de varianza detecta
diferencias entre tratamientos, con la finalidad de llegar a determinar,
especficamente, cuales son las medias de tratamientos que son diferentes,
hasta llegar a formar grupos de tratamientos con medias iguales. Se han
propuesto una variedad de pruebas con este fin, algunas mas sensibles, otras
mas estrictas, generando conclusiones diferentes y que en algunas ocasiones
no se pueden explicar de manera sencilla, mucho menos interpretar.
En este punto vamos a considerar solo uno de los mtodos, que es el de uso
mas frecuente en la literatura cientfica, conocido como la prueba honesta de
Tukey. Este procedimiento fue diseado para experimentos balanceados,
donde cada tratamiento tiene un numero de repeticiones igual a r.
El procedimiento para aplicar la prueba de Tukey consiste de los siguientes
pasos:
1. Calcular el error estndar de las medias. Recordar que se calcula
como la raz cuadrada del cociente del cuadrado medio del error
entre el numero de repeticiones. Por ser balanceado el experimento,
este error estndar es el mismo para todas las medias de los
tratamientos.
2. Obtener el valor critico del rango estudentizado de acuerdo al nivel
de significancia (), numero de tratamientos (t) y grados de libertad
en el error (), representado por q(, t, ). Este valor es obtenido de
la tabla de rangos estudentizados que se localiza en los apndices
de la mayora de los libros de diseo de experimentos.
3. Obtener el valor HSD (diferencia significativa honesta) como el
producto del error estndar por el rango estdentizado.
4. Calcular la diferencia entre todas las posibles parejas de medias de
tratamientos.
5. Declarar diferencia significativa entre las medias de los tratamientos
cuando el valor absoluto de la diferencia sea estrictamente mayor
que el valor del HSD. De otro modo, las medias de los tratamientos
se declaran estadsticamente iguales.
Para facilitar el calculo e interpretacin de las comparaciones, las medias se
ordenan de menor a mayor; se arma una tabla de doble entrada donde el
criterio de clasificacin tanto por hileras como por columnas van a ser las
medias ordenadas de los tratamientos. En cada cuadro de la tabla se
calcula la diferencia entre la media de hilera y la de columna, y se establece
la decisin. Finalmente se hacen los grupos de medias iguales y sus
interconexiones, a travs de superndices alfabticos o lneas verticales
uniendo las medias de los tratamientos que corresponden a cada grupo.
Cuando el experimento esta desbalanceado, entonces se calcula la media
armnica del nmero de repeticiones por tratamiento y esta se usa para
calcular el error estndar de las medias de los tratamientos. La media
armnica del numero de repeticiones se calcula por
rh = t/i(1/ri)
Ejemplo numrico 4. Llevar a cabo el procedimiento de la prueba honesta
de Tukey en los datos del ejemplo numerico2, referente a las marcas de
lubricantes.
A continuacin se muestra una tabla con la media y varianza de cada uno
de los tratamientos.
Grupos Cuenta Suma Promedio Varianza
A 8 74.8 9.35 12.8542857
B 8 91.4 11.425 9.53642857
C 8 133.7 16.7125 17.1526786

Llevando a cabo el procedimiento de la prueba honesta de Tukey,


encontramos:
1. Error estndar de las medias de tratamiento = 1.2836
2. Rango estudentizado = q(.05,3,21) = 3.58
3. HSD(.05,3) = 4.5953
4. Parejas de medias:
A=74.8 B=91.4 C=133-7
A=74.8 A-A=0 B-A=16.6 * C-A=58.9 *
B=91.4 B-B=0 C-B=42.3 *
C=133.7 C-C=0
Conclusin: Estadsticamente las tres medias son diferentes entre si, por lo
que la seleccin optima del lubricante esta basada en aquella que genera el
menor desgaste de piezas de la maquinaria; de esta manera se
seleccionara el lubricante A.

Contrastes ortogonales:
Un contraste en estadstica es una combinacin lineal de las medias de los
tratamientos definida por la suma de productos de las medias de
tratamiento por un coeficiente. Estos coeficientes deben cumplir con la
caracterstica de que su suma es igual a cero, de tal manera que para
algunas medias sus coeficientes asociados son positivos y para otras son
negativos. Las reglas de asignacin de los coeficientes va a depender de la
tendencia que se desee encontrar o de la comparacin de medias que se
desee hacer. Cada contraste tendr asociado un grado de libertad, debido
a que la comparacin que se lleva a cabo es entre dos grupos de
tratamientos, lo que llevan el signo positivo contra los que llevan el signo
negativo. De esta manera el numero de posibles contrastes ortogonales en
un conjunto de datos corresponde exactamente a los grados de libertad
para los tratamientos.
Dos contrastes sern ortogonales si la suma de los productos de sus
correspondientes coeficientes es igual a cero. Esto implica que la
covarianza entre los dos contrastes es igual a cero, y por lo tanto los
contrastes van a ser independientes. En este sentido la ortogonalidad
implica independencia. Si todos los contrastes formulados son ortogonales
entre si, entonces esto llevara a que la suma de cuadrados acumulada en
todos los contrastes ortogonales corresponda exactamente a la suma de
cuadrados de los tratamientos. La suma de cuadrados asociada a un
contraste se calcula por el cuadrado de la combinacin lineal de las medias
multiplicada por el numero de repeticiones y dividida por la suma de los
cuadrados de los coeficientes de la combinacin lineal. Esta suma de
cuadraos siempre lleva asociada un solo grado de libertad.
Si se aplican contrastes no ortogonales, entonces existir covarianza entre
ellos y esto implica que la informacin contenida en ellos esta relacionada
en un cierto grado, con lo cual se considera que la informacin contenida en
los datos esta siendo sobreutilizada. Esto se va a reflejar en el hecho de
que el acumulado de la suma de cuadrados de los contrastes no
ortogonales no cerrara a la suma de cuadrados de los tratamientos.

Contrastes ortogonales para el calculo de tendencias: Los contrastes


ortogonales pueden ser usados para estimar las sumas de cuadrados
asociadas a los diferentes componentes de un modelo polinomial, siempre y
cuando los datos experimentales tengan las siguientes dos caractersticas:
1. Experimento balanceado, lo que es un requisito general para aplicar
contrastes.
2. Los niveles del factor deben estar igualmente espaciados
Si alguna de estas caractersticas no se da en el conjunto de datos, se
recomienda aplicar la tcnica de la regresin para llevar a cabo la
separacin de la suma de cuadrados de tratamientos en las diferentes
tendencias.
La siguiente tabla muestra los coeficientes de las combinaciones lineales
para cada una de las diferentes tendencias que se pueden ajustar a un
conjunto de datos de acuerdo al nmero de niveles del factor. Los
coeficientes estn en orden creciente del factor.

Numero Primer Segndo Cuarto


Trats Tendencia Nivel Nivel Tercer Nivel Nivel Quinto Nivel
2 Lineal -1 1
3 Lineal -1 0 1
Cuadrtica 1 -2 1
4 Lineal -3 -1 1 3
Cuadrtica 1 -1 -1 1
Cbica -1 3 -3 1
5 Lineal -2 -1 0 1 2
Cuadrtica 2 -1 -2 -1 2
Cbica -1 2 0 -2 1
Cuarto 1 -4 6 -4 1

Ejemplo numrico 5. Aplicar contrastes ortogonales al ejemplo numrico 1.


Vamos a llevar a cabo los clculos en Excel y mostrarlos en la siguiente tabla. Como
puede ser observado los niveles se acomodan en orden creciente y as tambin las
medias por nivel. De la tabla de coeficientes se seleccionan los correspondientes a 4
tratamientos.
Nivel 150 200 250 300
medias 77.4333333 84.1 89.2666667 95.1333333
Lineal -3 -1 1 3
Cuadrtica 1 -1 -1 1
Cbica -1 3 -3 1
Contr Lin -232.3 -84.1 89.2666667 285.4 58.2666667
Contr -
Cuadr 77.4333333 -84.1 89.2666667 95.1333333 -0.8
Contr -
Cubico 77.4333333 252.3 -267.8 95.1333333 2.2

En la tabla estn contenidos los clculos del coeficiente por la media y en la


ultima columna su correspondiente suma. A partir de estos clculos podemos
determinar la suma de cuadrados correspondientes a cada uno de los
contrastes:
Para la tendencia lineal: S.C.Tend. Lineal = 3*(58.2666667) 2/20 = 509.250667
Para la tendencia cuadrtica: S.C.Tend Cuadr = 3*(-0.8) 2/4 = 0.48
Para la tendencia Cbica: S.C.Tend Cubica = 3*(2.2) 2/20 = 0.726
Como puede ser comprobado, las sumas de cuadros para la tendencia lineal
coincide con la suma de cuadrados de la regresin lineal, y el acumulado de la
suma de cuadrados de la regresin cuadrtica y cbica coincide con la suma
de cuadrados de la falta de ajuste.
Se pudiera hacer el cuestionamiento acerca de la importancia de tener
diferentes mtodos para realizar un mismo calculo. Aparte de la simplicidad de
los contrastes, otra gran ventaja es que puede ser utilizado para analizar los
arreglos factoriales de tratamientos que se vern posteriormente. Mediante la
tcnica de contrastes ortogonales van a poder ser separadas las sumas de
cuadrados en componentes con un solo grado de libertad, sin importar la
naturaleza de los factores que se estn investigando.

Contrastes ortogonales para comparacin de medias: Para factores


cualitativos, la aplicacin de los contrastes ortogonales es mas especifica para
cada problema. Se requiere de un conocimiento mas o menos profundo de lo
que son los tratamientos para poderlos agrupar. La idea de los contrastes para
factores cualitativos es ir formando dos grupos de comparacin, cada uno de
los cuales va estar formado por uno o ms tratamientos con alguna
caracterstica comn. Cada uno de los grupos se irn separando en otros dos
grupos de comparacin, en base a otra caracterstica de los tratamientos, y
este proceso continuara hasta que al final los contrastes comparen un
tratamiento contra otro.
Ejemplo de aplicacin conceptual 1: Suponga que se esta llevando a cabo una
investigacin para seleccionar un ingrediente proteico en la elaboracin de un
alimento para mascotas. Se prueban tres fuentes de protena: Carne de res,
carne de cerdo y soya. Lleve a cabo la comparacin de los tratamientos por
contrastes ortogonales:
Los contrastes ortogonales que pueden planearse para estas tres fuentes son:
1. Protena de origen animal (cerdo y res) contra protena de origen
vegetal (soya).
2. Protena de origen animal (res) contra protena de origen animal
(cerdo).
Ejemplo de aplicacin conceptual 2: Supngase que se esta llevando a cabo
una investigacin en la que se desea evaluar diferentes fuentes de carnes no
convencionales en la elaboracin de un producto carnico de bajo costo. El
producto tradicional se elabora con carne de cerdo, y se desea investigar
fuentes no convencionales que incluyen: Caballo, burro, gallina y pavo. Planear
las comparaciones demedias por contrastes ortogonales.
Los contrastes ortogonales que pueden planearse para estos tratamientos son:
1. Testigo (cerdo) contra el promedio de los tratamientos (caballo,
burro, gallina y pavo).
2. Carnes de mamferos (caballo y burro) contra carnes de aves (gallina
y pavo).
3. Caballo contra burro.
4. Gallina contra pavo.
Una vez que los contrastes ortogonales han sido planeados, debemos checar
el requisito de que el experimento este balanceado, y si es as debemos
obtener los coeficientes para cada uno de los contrastes. La mecnica para el
calculo de los coeficientes es la siguiente:
1. Los coeficientes de un grupo llevaran signo positivo y los del grupo
contrastante llevaran signo negativo. Esta es una seleccin
completamente arbitraria.
2. El valor del coeficiente de un grupo ser igual al numero de
tratamientos que tiene el grupo contrastante.
Ejemplo numrico 6. Analice el ejemplo numrico 2 usando contrastes
ortogonales.
El ejemplo de los lubricantes y desgaste de las piezas consiste de tres tratamientos,
cada uno con 8 repeticiones. El A y B son lubricantes nuevos y disponibles que se
pueden usar en el proceso, y el lubricante C que es el que convencionalmente se
utiliza en el proceso. Entonces podemos generar los siguientes contrastes con sus
coeficientes y clculos requeridos para determinar las pruebas de significancia:
Lubricante A B C
Media 9.35 11.425 16.7125 Suma
C vs (A B) 1 1 -2 -12.65
A vs. B 1 -1 0 -2.075

C vs (A B) 9.35 11.425 -33.425


A vs. B 9.35 -11.425 0
A partir de las cantidades en la tabla podemos calcular las sumas de
cuadrados correspondientes a cada contraste:
Contraste convencional vs. Nuevas alternativas:
S.C. = 8*(-12.65)2/6 = 213.3633
Contraste alternativa A vs. Alternativa B:
S.C. = 8*(-2.075)2/2 = 17.2225
Estas sumas de cuadrados pueden ser agregadas a la tabla de anlisis de varianza
para completar las pruebas de significancia:
ANLISIS DE VARIANZA
Origen de las Suma de Grados de Promedio de los
variaciones cuadrados libertad cuadrados F
Entre grupos 230.585833 2 115.292917 8.74681521
C vs. A B 213.363333 1 213.363333 16.1872773
A vs. B 17.222500 1 17.222500 1.3066026
Dentro de los grupos 276.80375 21 13.181131

Total 507.389583 23

El valor de P para el contraste C vs. A B resulto en 0.00061447 que es menor


del 0.05, por lo que se concluye que este contraste es significativo, es decir,
existe diferencia entre el lubricante convencional y las nuevas alternativas.

El valor de P para el contraste C vs. A B resulto en 0.26587522 que es mayor


del 0.05, por lo que se concluye que este contraste no es significativo, es decir,
no existe diferencia entre el lubricante las nuevas alternativas. Para la
seleccin del aceite entre las nuevas alternativas, se requiere de un criterio
adicional, pues en cuanto a la variable medida, el desgaste de las piezas, no
existe una diferencia. El criterio adicional puede ser el econmico, ecolgico, o
algn otro en el que uno de ellos tuviera ventaja.

DISEO EN BLOQUES COMPLETOS AL AZAR

Cuando las unidades experimentales no son homogneas en alguna de las


variables identificadas como de impacto importante sobre la respuesta, o bien,
las condiciones fsicas en que se lleva a cabo el experimento no son totalmente
uniformes, entonces se puede emplear un diseo en bloques para asegurar
comparaciones mas justas entre los tratamientos.
La idea de un bloque en diseo de experimentos se refiere a un conjunto de
unidades experimentales que tienen valores muy similares en cuanto a la
variable de bloqueo, o bien que estn bajo condiciones experimentales muy
similares.
Una variable de bloqueo es una caracterstica de las unidades experimentales
o del ambiente fsico donde se lleva a cabo el experimento, que se ha
identificado como de impacto importante en la variable de respuesta. Esto es,
valores diferentes en la variable de bloqueo, tienen efecto sobre la variable de
respuesta. Por esto, si no se controlan a travs del diseo de experimentos,
puede enmascarar el efecto de los tratamientos.
Una variable de bloqueo debe ser seleccionada de acuerdo al tipo de
experimento que se este llevando a cabo y a las variables de respuesta que se
estn evaluando. A menudo las unidades de equipo de prueba o maquinas son
diferentes en sus caractersticas de operacin y constituyen un factor tpico que
es necesario controlar. Lotes de materia prima, personas o tiempo son posibles
fuentes de variacin que pueden ser controladas mediante un arreglo
geomtrico en bloques al azar.
Por ejemplo, si se desea evaluar las caractersticas organolpticas en pasta de
manzana para pasteles, elaborados con diferentes edulcorantes; se debe
considerar como variables importantes que las impactan, a la variedad de la
manzana, el nivel de madurez del fruto, o inclusive la regin de donde se
cosecho. Todas estas variables pudieran ser controladas como variables de
bloqueo, para obtener una estimacin ms pura del efecto de los tratamientos.
Una condicin que debe conservarse para que este diseo sea valido, es que
no debe haber un efecto cruzado entre las variables de bloqueo y las variables
de respuesta. Esto implica que el efecto de un tratamiento se modifica por los
bloques de manera proporcional en todos los tratamientos. Esto permite
identificar diferencias de tratamientos, independientemente del bloque.
En un diseo en bloques completos al azar cada bloque generado debe
contener un numero de unidades experimentales igual al numero de
tratamientos, ya que cada bloque debe contener a todos los tratamientos. Los
bloques en este diseo constituyen las repeticiones del experimento.
Para poder llevar a cabo el arreglo geomtrico en bloques al azar, es necesario
conocer el valor de la variable de bloqueo en cada una de las unidades
experimentales, para poder agruparlas en base a esta informacin y construir
los bloques, que deben quedar con valores muy similares en la variable(s) de
bloqueo. Es necesario tambin saber que la variable de bloqueo no tiene un
efecto cruzado con la variable de respuesta que se esta evaluando, esto es, el
valor de la variable de bloque no modifica el efecto de los tratamientos.

Ventajas del diseo en bloques con respecto al diseo completamente al


azar:
1. Con un agrupamiento efectivo, el diseo en bloques puede generar
resultados sustancialmente mas precisos de los que arrojara un
diseo completamente al azar de tamao comparable. En otras
palabras, el error experimental se puede controlar a niveles mas
bajos con el diseo en bloques.
2. La variabilidad de las unidades experimentales, o de las condiciones
fsicas donde se lleva a cabo el experimento, puede ser
deliberadamente introducida para ampliar el rango de validez de los
resultados experimentales sin sacrificar precisin.
Desventajas del diseo en bloques comparado con el diseo
completamente al azar:
1. Los grados de libertad para el error experimental no son tan
grandes como en un diseo completamente al azar. Un grado de
libertad es perdido para cada bloque despus del primero.
2. Mas suposiciones son requeridas para el modelo (varianza
constante de bloque a bloque y no efecto cruzado de bloque y
tratamiento) que para un diseo completamente al azar.

Aleatorizacion: Una vez que los bloques han sido formados, con unidades
experimentales lo mas parecido posible en cuanto a la variable de bloqueo,
cada bloque se considera como un grupo muy homogneo de unidades
experimentales, pero con un alto grado de variacin entre bloques. La forma de
asignar tratamientos a las unidades experimentales es al azar e
independientemente dentro de cada bloque.
Modelo estadstico: El modelo completo de un diseo en bloques al azar
contiene los efectos de tratamiento (como en el completamente al azar) y el de
los bloques, dado por
Yij = + i + j + ij
I=1,2,,t; j=1,2,,b
Yij Es la variable de repuesta en el bloque j y el tratamiento i.
Es la media general del experimento.
i Es el efecto del tratamiento i.
j Es el efecto del bloque j.
ij es el error experimental en el bloque j y el tratamiento i.

Hiptesis del investigador: La hiptesis que se desea probar bajo este arreglo
experimental es:
Ho: No hay efecto de tratamientos (i = 0 para toda i).
Ha: al menos un efecto de tratamiento es diferente de cero.
En relacin al efecto de los bloques, debemos ser claros de que no se deseaba
investigar su efecto, solo se empleo como una forma de controlar la variabilidad
en las unidades experimentales, con la finalidad de hacer mas sensible el
experimento, es decir, poder detectar efecto de tratamientos cuando
verdaderamente existan. De esta manera, no se plantea una hiptesis asociada
el efecto de los bloques. Tampoco es posible probarla, ya que prcticamente no
se tienen repeticiones de bloques. Cabe hacer mencin que si se tuvieran
repeticiones de bloques, entonces el experimento dejara de ser bloques para
convertirse en un arreglo de tratamientos factorial, y en este caso la variable de
bloqueo ya pasara a ser un factor.
ANOVA en el diseo en bloques al azar: El anlisis de varianza en un diseo en
bloques al azar debe incluir las fuentes de variacin de tratamientos y la fuente
de variacin de bloques, adems del error y total. Debe considerarse las
restricciones en los parmetros, dadas por:
1. Para los efectos de tratamientos: i = 0
2. Para los efectos de los bloques: j = 0
El arreglo en un diseo en bloques completos al azar y que no tenga datos
perdidos, siempre tendr un numero de observaciones igual al producto del
numero de bloques por el numero de tratamientos (n = t b). Entonces el
anova se construye como

Fuente de variacin Grados de libertad Suma de cuadrados


Bloques b-1 Diferencia (1)
Tratamientos t-1 Diferencia (2).
Error (t-1)(b-1) S.C.E. modelo completo
Total n-1 S.C.E. modelo reducido

Los paquetes estadsticos en general reportan dos tipos de sumas de


cuadrados en un anova, denominadas las secuenciales y las ajustadas. Estos
nombres hacen referencia a la forma en que cada una es calculada. En el caso
de las secuenciales, son calculadas mediante la diferencia en sumas de
cuadrados de los errores de modelos conteniendo trminos adicionales,
empezando con el modelo reducido y hasta llegar al modelo completo. As para
un diseo en bloques al azar la secuencia de modelos serian:
1. Yij = + ij
2. Yij = + j + ij
3. Yij = + i + j + ij
La suma de cuadrados secuencial para bloques seria la suma de cuadrados del
error en el modelo (1) menos la suma de cuadrados del error en el modelo (2).
La suma de cuadrados secuencial para tratamientos seria la suma de
cuadrados del error en el modelo (2) menos la suma de cuadrados del error en
el modelo (3). En estas sumas de cuadrados, la de tratamientos seria ajustada
por la presencia de los bloques, ya que se calculo como la diferencia con
respecto a un modelo conteniendo el efecto de los bloques.
Los modelos requeridos para el calculo de las sumas de cuadrados ajustadas
serian:
1. Yij = + ij
2. Yij = + j + ij
3. Yij = + i + ij
4. Yij = + i + j + ij
La suma de cuadrados ajustada por efecto de los tratamientos se calcula por la
diferencia en la suma de cuadrados de los errores del modelo 3 menos la suma
de cuadrados del error del modelo 4. La suma de cuadrados ajustada para los
efectos de tratamiento se calculara por la diferencia en las sumas de
cuadrados de los errores del modelo (2) menos la del modelo (4).
Cuando el diseo esta balanceado estas sumas de cuadrados coinciden. Las
diferencias se presentan cuando el diseo esta desbalanceado, y en este caso
se deben considerar para la prueba de hiptesis las sumas de cuadrados
ajustadas.

Ejemplos Numricos.
1. Una compaa constructora desea probar la eficiencia de 3 tipos de aislantes
diferentes. Ya que el rea sobre la que la compaa construye se caracteriza
por diferencias importantes en el clima, la compaa ha dividido, en base a
esta caracterstica, el rea en 4 regiones geogrficas. Dentro de cada regin
geogrfica usa aleatoriamente cada uno de los tres aislantes y registra la
perdida de energa como un ndice. Valores mas pequeos del ndice
corresponden a perdidas mas bajas de energa.
Aislante R.G. 1 R.G. 2 R.G. 3 R.G. 4
1 19.2 12.8 16.3 12.5
2 11.7 6.4 7.3 6.2
3 6.7 2.9 4.1 2.8

La hiptesis que se desea probar es:


Ho: No hay diferencias en el valor promedio del ndice de perdida de
energa en los tres aislantes. ( Ho: i = 0 para toda i).
Ha: Al menos el promedio del ndice de perdida de energa para uno de los
aislantes es diferente (Ha: al menos una i 0).
Una grafica para explorara las caractersticas de los datos es muy
recomendable. En este caso conviene graficar las observaciones de los tres
aislantes para cada regin por separado, para determinar si el efecto de los
tratamientos es proporcional en todos los bloques.
Podemos observar el comportamiento muy homogneo de los aislantes en
cada una de las regiones geogrficas, lo cual implica que no existe un
efecto cruzado de regin con aislante, con lo que se cumple uno de los
requisitos fundamentales para aplicar el diseo en bloques. Se puede
observar que el aislante 1 es el de mayores perdidas de energa, seguido
del aislante 2 y el de menor perdidas de energa es el aislante 3.

El siguiente paso es llevar a cabo el anlisis de varianza para probar la


hiptesis acerca del efecto de los tratamientos.

Origen de Promedio
las Suma de Grados de de los Probabilida
variaciones cuadrados libertad cuadrados F d
Aislantes 253.595 2 126.7975 170.898914 5.1342E-06
Regiones 55.6358333 3 18.5452778 24.9955073 0.00086444
Error 4.45166667 6 0.74194444

Total 313.6825 11

El nivel de significancia para el efecto de los aislantes es 5.13E-6, que es un


valor menor de 0.05 (P<.05) lo que conduce al rechazo de la hiptesis nula,
por lo que se concluye que los tipos de aislantes tienen un impacto
importante en la media de perdidas de energa.
El siguiente paso es detectar cuales son las diferencias entre los aislantes.
Ya que nada es especificado acerca de la naturaleza de los aislantes, lo
nico que procede es una comparacin de todas contra todas las medias,
usando la prueba honesta de Tukey.

Construimos primero las medias de la variable perdida de energa por aislante:


Repeticione
RESUMEN s Suma Promedio Varianza
Aislante 1 4 60.8 15.2 10.0866667
Aislante 2 4 31.6 7.9 6.64666667
Aislante 3 4 16.5 4.125 3.29583333

Calculamos el error estndar de las medias: 0.4307


Valor de la tabla de rangos estudentizados, con 3 medias, 6 grados de
libertad para el error y un nivel de significancia de 0.05: 4.34
Calculamos el valor de HSD: 1.8692
Enseguida, se construye la tabla de diferencias de medias:
7.9 (2) 15.2 (1)
4.125 (3) (2)-(3) = 3.775 * (1)-(3) = 11.075 *
7.9 (2) (1)-(2) = 7.3 *
* Diferencia significativa (P<.05)
De estos resultados se concluye que las 3 medias son estadsticamente
diferentes, y por lo tanto, podemos hacer una seleccin del mejor aislante
desde el punto de vista de la variable de inters, perdida de energa. Ya que el
aislante tiene por objetivo la conservacin de la energa, el mejor es aquel en el
que las perdidas son mnimas, por lo que tomamos la decisin de que el mejor
aislante es el tipo 3.

2. En una industria yesera se desea mejorar la resistencia del yeso a


las quebraduras. Para tal efecto se prueban dos aditivos orgnicos,
uno denominado n y otro denominado p, cada uno a dos niveles, y
adems un tratamiento testigo, que consiste en el uso de un producto
convencional. La variable de inters es la resistencia a las
quebraduras, que se mide a travs de la fuerza que debe aplicarse
para quebrar el yeso ya instalado. El experimento es llevado a cabo
en 5 diferentes zonas, caracterizadas por diferencias importantes en
temperatura y clima. Los datos colectados se muestran en la
siguiente tabla:

Zona 1 Zona 2 Zona 3 Zona 4 Zona 5


Producto
convencional 7.6 8.1 7.3 7.9 9.4
50n 7.3 7.7 7.7 7.7 8.2
100n 6.9 6 5.6 7.4 7
50n+75p 10.8 11.2 12 12.9 11.6
100n+75p 9.6 9.3 9 10.6 10.4

Como una etapa de exploracin de las caractersticas de los datos, conviene


revisar una grafica que muestre como se comportaron las observaciones de
acuerdo al bloque y tratamiento.

El patrn general de los bloques se mantiene en los diferentes tratamientos,


tendiendo a sobresalir el bloque 4, seguido muy de cerca del bloque 5. En
general los bloques 1,2 y 3 tienden a una menor respuesta. Se observa
entonces muy poca posibilidad de un efecto cruzado entre bloque y
tratamiento.
Se procede como siguiente punto a probar la hiptesis nula de no efecto de los
tratamientos, contra la alternativa de que al menos una media de los
tratamientos es diferente. Para tal fin se muestra el anlisis de varianza-
Origen de Promedio
las Suma de Grados de de los Probabilida
variaciones cuadrados libertad cuadrados F d
Tratamientos 80.0384 4 20.0096 66.1255783 9.5744E-10
Bloques 4.9544 4 1.2386 4.09319233 0.01796691
Error 4.8416 16 0.3026

Total 89.8344 24

Con un nivel de significancia de 9.57E-10 se rechaza la hiptesis nula y se


concluye que si existe diferencia en la resistencia promedio por efecto de los
tratamientos.

Como siguiente punto es de importancia llegar a determinar cuales son las


diferencias que pueden ser detectadas entre los tratamientos. Ya que se
conoce la naturaleza de los tratamientos, pueden llevarse a cabo los contrastes
ortogonales para separar las medias. Los cuatro contrastes que se
recomiendan son:
1. Testigo contra tratados.
2. 50 de n contra 100 de n.
3. 0 de p contra 75 de p.
4. Efecto cruzado de n y p.
A continuacin se muestran las medias de los tratamientos y sus
correspondientes coeficientes para cada uno de los contrastes:

Testigo vs 50n vs. efecto


Tratamiento Repeticiones Media tratados 100n 0 p vs. 75 p cruzado
0 5 8.06 4 0 0 0
50n 5 7.72 -1 -1 -1 1
100n 5 6.58 -1 1 -1 -1
50n+75p 5 11.7 -1 -1 1 -1
100n+75p 5 9.78 -1 1 1 1

El anlisis de varianza aumentado con los contrastes se muestra a


continuacin:

Origen de Promedio
las Suma de Grados de de los Probabilida
variaciones cuadrados libertad cuadrados F d
Tratamientos 80.0384 4 20.0096 66.1255783 9.5744E-10
Testigo vs.
tratados 3.1329 (1) 3.1329 10.3532 0.00431
50 n vs. 100
n 11.7045 (1) 11.7045 38.6797 4.4895E-06
0 p vs 75 p 64.4405 (1) 64.4405 212.9560 3.9922E-12
Efecto
cruzado 0.7605 (1) 0.7605 2.5132 0.12858022
Bloques 4.9544 4 1.2386 4.09319233 0.01796691
Error 4.8416 16 0.3026

Total 89.8344 24

Interpretacin de los contrastes ortogonales:


1. Al no ser significativo el efecto cruzado de los aditivos n y p,
podemos concluir que sus efectos son independientes, es decir, no
hay interferencia de los aditivos en su modo de accin.
2. Hay diferencia significativa de 50 n vs. 100 n, por lo que podemos
seleccionar el nivel que mas convenga de acuerdo a la variable de
respuesta. Ya que el objetivo era mejorar la resistencia a las
quebraduras del yeso, entonces, la variable de respuesta es del tipo
mientras mas grande mejor, por lo que, revisando la medias marginal
para cada uno de los niveles del aditivo n, podremos hacer la
seleccin: En Cuanto a las medias marginales por n se obtiene 9.71
para el nivel 50 contra 8.18 para el nivel 100, por lo que para mejorar
resistencia se selecciona el nivel 50 n.
3. Hay diferencia significativa de 0 p contra 75 p. De manea equivalente
al procedimiento anterior, revisando las medias marginales podemos
hacer la seleccin del nivel. Para el nivel 0 p la media marginal es
7.15 y para el nivel 75 p la media es 10.74, por lo que el nivel mas
recomendable para mejorar resistencia es 75 p.
4. Por lo tanto la mejor combinacin de niveles de aditivos es 50 n y 75
p, cuya combinacin arroja una media de 11.7, que es precisamente
la media mas alta de los tratamientos.
5. En este anlisis podemos hacer la separacin de la contribucin de
cada uno de los aditivos, a la mejora de la resistencia. Para este fin
vamos a simplificar los valores de los niveles en cada uno de los
aditivos de la siguiente manera: (-1) ser el valor asociado al nivel
bajo y (+1) ser el valor asociado al nivel alto. Estos valores son
seleccionados para simplificar clculos e interpretacin de los valores
obtenidos. El cambio en promedios de la resistencia al cambiar del
nivel bajo al nivel alto, esta dado por la diferencia en el promedio al
nivel alto menos el promedio al nivel bajo. Para el aditivo n la
diferencia as definida es -1.53, de tal manera, que el cambio por
unidad convencional (al pasar de -1 a +1, 2 unidades de diferencia)
es -0.765. Por eso al seleccionar el nivel (-1) el incremento en la
respuesta promedio seria estimado en 0.765. De manera equivalente,
para el aditivo p, la diferencia en los promedios de los niveles esta
dada por 3.59 y el cambio por unidad de incremento en el aditivo p en
unidades convencionales es de 1.795. Por eso, al seleccionar el nivel
(+1) del aditivo p, el cambio en la respuesta promedio es de 1.795.
Con este sencillo anlisis podemos evaluar el impacto independiente
que tienen cada uno de los aditivos para mejorar la resistencia.
Podemos concluir que el aditivo p es de mayor impacto en la mejora
de la resistencia, para los niveles investigados.
6. El contraste del testigo contra el promedio de los tratados resulto ser
significativo, con lo cual concluimos que el promedio de los tratados
(8.945) es significativamente diferente del promedio del testigo (8.06).
La diferencia 0.939 es la ganancia promedio por aplicacin de
tratamientos.

3. El propsito de un experimento fue mejorar el valor nutricional de la


paja de trigo como alimento para ovejas. Los tratamientos de la paja
fueron: paja picada, paja molida, paja tratada con amonio y paja
tratada con urea. Un grupo de 24 ovejas fue usado en el
experimento. Se considero el peso inicial como variable de bloqueo
para llevar a cabo una separacin en subgrupos de 4 animales mas
homogneos. En cada uno de los 6 gripos se probaron las 4 dietasen
orden aleatorio. Para cada una de las 24 ovejas fue medido el
porcentaje de materia seca digerido. Los datos se muestran en la
siguiente tabla:
bloque 1 bloque 2 bloque 3 bloque 4 bloque 5 bloque 6
paja picada 32.68 36.22 36.36 40.95 34.99 33.89
paja molida 35.9 38.73 37.55 34.64 37.36 34.35
tratada
amonio 49.43 53.5 52.86 45 47.2 49.76
tratada urea 46.58 42.82 45.41 45.08 43.81 47.4

Una presentacin grafica de los datos por tratamiento y bloque es mostrada


en la siguiente figura.

Observe que la tendencia de los tratamientos se mantiene en todos los


bloques, a excepcin del bloque 4, donde la materia seca digerida fue
mayor en la paja picada con respecto a la paja molida y el amonio iguala a
la urea. En este caso una prueba de aditividad en el modelo se hace
necesaria para determinar si el modelo del diseo en bloques completos al
azar es adecuado.

4. Se llevo a cabo un experimento bajo un diseo en bloques completos al azar


para evaluar el efecto de diferentes espaciamientos de surcos (en pulgadas)
en la siembra de frjol, sobre la produccin de paja (bushels por acre). Los
resultados fueron los siguientes.
Espac 18 Espac 24 Espac 30 Espac 36 Espac 42
Bloque 1 33.6 31.1 33 28.4 31.4
Bloque 2 37.1 34.5 29.5 29.9 28.3
Bloque 3 34.1 30.5 29.2 31.6 28.9
Bloque 4 34.6 32.7 30.7 32.3 28.6
Bloque 5 35.4 30.7 30.7 28.1 29.6
Bloque 6 36.1 27.9 27.9 26.9 33.4

Una grafica exploratoria de los datos revelara el comportamiento de los


tratamientos en cada uno de los bloques, como se muestra a continuacin:

Como puede ser observado, el comportamiento general en los bloques es a


disminuir la produccin a medida que aumenta el espaciamiento. En los
espaciamientos 30 y 42 sin embargo, en los bloques 1, 5 y 6 esta tendencia
no se mantiene. En el espaciamiento 36 tampoco la tendencia general es
observada en los bloques 2, 3 y 4. Por lo tanto, estos datos requieren
tambin de la prueba de aditividad de Tukey antes de que puedan ser
interpretados adecuadamente.

Prueba de aditividad de Tukey:


Idealmente, los bloques representan influencias que uno esperara que solo
incrementaran o disminuyeran el nivel general de respuesta, es decir,
constituiran un efecto puramente aditivo. Si los efectos de bloques y
tratamientos no fueran aditivos, un efecto cruzado entre bloques y
tratamientos ocurrira, lo cual es reflejado por un efecto diferencial de
tratamiento por bloque. Esto significa, que para algunos tratamientos un
bloque favoreciera la respuesta de inters, mientras que para otros bloques
la respuesta seria favorecida para otros tratamientos.
Estos efectos cruzados pueden ser clasificados como transformables y no
transformables. Los transformables son aquellos que pueden ser eliminados
mediante el anlisis, usando alguna transformacin de la variable de
respuesta, por ejemplo, el logaritmo, raz cuadrada o reciproco de los datos
originales. La segunda categora, los efectos cruzados no transformables,
son aquellos que no pueden ser eliminados por el anlisis.

Un grado de libertad para la no aditividad transformable:


Una prueba formal para la no aditividad transformable basada en la
deteccin de una relacin curvilnea entre los residuales despus de ajustar
el modelo del diseo en bloques al azar y sus valores estimados, es debida
a J- W. Tukey. El procedimiento consiste en:
1. Analizar la variable original yij bajo el modelo del diseo en bloques al
azar.
2. Evaluar los valores estimados de la variable original bajo el modelo en
bloques al azar.
3. Evaluar los residuales en la variable original del modelo que
corresponde al diseo en bloques al azar:
4. Definir la variable qij como el cuadrado del valor estimado por el modelo
del diseo en bloques al azar.
5. Analizar la variable qij bajo el modelo de diseo en bloques al azar.
6. Obtener los valores estimados y los residuales de la variable qij.
7. Defina P como la suma de los productos cruzados de los residuales.
8. Defina Q como la suma de los cuadrados de los residuales de la variable
qij.
9. Un grado de libertad asociado al error en el anlisis de varianza de la
variable (y) es sustrado para la prueba de aditividad, y su suma de
cuadrados (suma de cuadrados de la regresin) asociada va a estar
dada por el producto del cuadrado de (P) por (Q), que debe ser restada
de la suma de cuadrados del error.
10. La hiptesis que se plantea es en trminos del coeficiente de regresin
que cuantifica la relacin de la variable original con el cuadrado de los
estimados bajo el modelo del diseo en bloques completos al azar, Ho:
=0 contra la Ha: 0. La hiptesis se prueba con la estadstica F
definida por el cociente del cuadrado medio de la regresin entre el
cuadrado medio del residual.
11. Una decisin de no rechazar Ho conlleva a que el modelo del diseo en
bloques al azar cumple con la suposicin de aditividad. Por otro lado el
rechazo de Ho puede indicar la necesidad de transformar los datos para
lograr que el modelo aditivo sea adecuado en los datos transformados.

5. Aplicacin de la prueba de aditividad al ejemplo 3 de tratamientos de


paja.
a). Ajuste del modelo del diseo en bloques al azar a la variable original,
digestibilidad de materia seca.
Media de
bloque 1 bloque 2 bloque 3 bloque 4 bloque 5 bloque 6 trat
paja picada 32.68 36.22 36.36 40.95 34.99 33.89 35.8483333
paja molida 35.9 38.73 37.55 34.64 37.36 34.35 36.4216667
tratada
amonio 49.43 53.5 52.86 45 47.2 49.76 49.625
tratada urea 46.58 42.82 45.41 45.08 43.81 47.4 45.1833333
Media de blo 41.1475 42.8175 43.045 41.4175 40.84 41.35 41.7695833

A partir de estas medias por bloque, por tratamiento y la media general


podemos calcular los estimadores de los efectos de tratamiento:
Efectos de tratamiento:
Media de Media
trat general Efecto de tratamiento
35.8483333 41.7695833 -5.92125
36.4216667 41.7695833 -5.34791667
49.625 41.7695833 7.85541667
45.1833333 41.7695833 3.41375
41.7695833 41.7695833 0
Efectos de bloque:
Media de Media
blo general Efecto de bloque
41.1475 41.7695833 -0.62208333
42.8175 41.7695833 1.04791667
43.045 41.7695833 1.27541667
41.4175 41.7695833 -0.35208333
40.84 41.7695833 -0.92958333
41.35 41.7695833 -0.41958333

Tabla de valores observados, estimados por el modelo y residuales.


Tratamiento bloque observados Estimados Residuales
Paja Picada 1 32.68 35.2262501 -2.54625007
Paja Picada 2 36.22 36.8962501 -0.67625007
Paja Picada 3 36.36 37.1237501 -0.76375007
Paja Picada 4 40.95 35.4962501 5.45374993
Paja Picada 5 34.99 34.9187501 0.07124993
Paja Picada 6 33.89 35.4287501 -1.53875007
Paja Molida 1 35.9 35.7995834 0.1004166
Paja Molida 2 38.73 37.4695834 1.2604166
Paja Molida 3 37.55 37.6970834 -0.1470834
Paja Molida 4 34.64 36.0695834 -1.4295834
Paja Molida 5 37.36 35.4920834 1.8679166
Paja Molida 6 34.35 36.0020834 -1.6520834
Paja con A 1 49.43 49.0029167 0.42708327
Paja con A 2 53.5 50.6729167 2.82708327
Paja con A 3 52.86 50.9004167 1.95958327
Paja con A 4 45 49.2729167 -4.27291673
Paja con A 5 47.2 48.6954167 -1.49541673
Paja con A 6 49.76 49.2054167 0.55458327
Paja con U 1 46.58 44.5612501 2.01874993
Paja con U 2 42.82 46.2312501 -3.41125007
Paja con U 3 45.41 46.4587501 -1.04875007
Paja con U 4 45.08 44.8312501 0.24874993
Paja con U 5 43.81 44.2537501 -0.44375007
Paja con U 6 47.4 44.7637501 2.63624993

Tabla de anlisis de varianza para la variable (y):


Valor
Fuente de Suma de Grados de Cuadrados Probabilida crtico para
Variacion cuadrados libertad Medios F d F
Tratamientos 822.136046 3 274.045349 38.6488589 2.6922E-07 3.28738211
Bloques 17.1037708 5 3.42075417 0.482432 0.7840427 2.90129454
Error 106.359679 15 7.09064528

Total 945.599496 23
b). Tabla de valores de la variable (q) y sus promedios:
Media de
bloque 1 bloque 2 bloque 3 bloque 4 bloque 5 bloque 6 trat
paja picada 1240.88869 1361.33327 1378.17282 1259.98377 1219.31911 1255.19633 1285.81566
paja molida 1281.61017 1403.96968 1421.0701 1301.01485 1259.68798 1296.15001 1327.25046
tratada
amonio 2401.28585 2567.74449 2590.85242 2427.82032 2371.24361 2421.17304 2463.35329
tratada urea 1985.70501 2137.32848 2158.41546 2009.84098 1958.39439 2003.79332 2042.24627
Media de blo 1727.37243 1867.59398 1887.1277 1749.66498 1702.16127 1744.07817 1779.66642

Estimacin de los efectos de tratamiento:


Media de
Tratamiento tra Media gral Efecto de tra
paja picada 1285.81566 1779.66642 -493.850758
paja molida 1327.25046 1779.66642 -452.415958
tratada
amonio 2463.35329 1779.66642 683.686866
tratada urea 2042.24627 1779.66642 262.579851

Estimacin de los efectos de bloque:


Media de
Bloque blo Media gral Efecto de blo
1 1727.37243 1779.66642 -52.2939928
2 1867.59398 1779.66642 87.9275574
3 1887.1277 1779.66642 107.461276
4 1749.66498 1779.66642 -30.0014428
5 1702.16127 1779.66642 -77.5051491
6 1744.07817 1779.66642 -35.588249
Tabla de observados, estimados y residuales de la variable (q):

Tratamiento bloque Observados Estimados Residuales


Paja Picada 1 1240.88869 1233.52167 7.36702187
Paja Picada 2 1361.33327 1373.74322 -12.4099531
Paja Picada 3 1378.17282 1393.27694 -15.1041219
Paja Picada 4 1259.98377 1255.81422 4.16954687
Paja Picada 5 1219.31911 1208.31052 11.0085906
Paja Picada 6 1255.19633 1250.22742 4.96891563
Paja Molida 1 1281.61017 1274.95647 6.65369965
Paja Molida 2 1403.96968 1415.17802 -11.208342
Paja Molida 3 1421.0701 1434.71174 -13.6416441
Paja Molida 4 1301.01485 1297.24902 3.76582465
Paja Molida 5 1259.68798 1249.74532 9.9426684
Paja Molida 6 1296.15001 1291.66222 4.4877934
Paja con A 1 2401.28585 2411.0593 -9.77344757
Paja con A 2 2567.74449 2551.28085 16.4636441
Paja con A 3 2590.85242 2570.81456 20.0378587
Paja con A 4 2427.82032 2433.35185 -5.53152257
Paja con A 5 2371.24361 2385.84814 -14.6045288
Paja con A 6 2421.17304 2427.76504 -6.59200382
Paja con U 1 1985.70501 1989.95228 -4.24727396
Paja con U 2 2137.32848 2130.17383 7.15465104
Paja con U 3 2158.41546 2149.70755 8.70790729
Paja con U 4 2009.84098 2012.24483 -2.40384896
Paja con U 5 1958.39439 1964.74113 -6.34673021
Paja con U 6 2003.79332 2006.65803 -2.86470521

La suma de productos cruzados de los residuales esta dada por


P = 87.3786269
Y la suma de cuadrados de los residuales en la variable (q) esta dada por
Q = 2343.60442
El estimador del efecto curvilneo puede ahora ser calculado por
= 0.03728
y su suma de cuadrados asociada con un grado de libertad es:
S.C.R. = 3.2574
La suma de cuadrados del error con 14 grados de libertad en la variable (y)
es
106.359679-3.2574 = 103.102279
Y su correspondiente cuadrado medio 7.3644
Por esto la prueba de F para aditividad esta dada por
F = 0.4423
Que se distribuye como una F con 1 y 14 grados de libertad. Por lo tanto,
con este valor de la F no se rechaza Ho y se concluye que no existe
suficiente evidencia acerca de un efecto cruzado entre bloques y
tratamientos. As, podemos tomar la decisin de que el modelo del diseo
en bloques al azar es adecuado para la variable (y) digestibilidad de materia
seca.

Siguiendo con el anlisis de la variable (y), al detectar un efecto significativo


de tratamientos y conocer la naturaleza de los tratamientos, podemos
identificar las comparaciones de inters y llevarlas a cabo por el mtodo de
contrastes ortogonales. Los contrastes de inters son:
Tratamientos fsicos contra tratamientos qumicos.
Paja picada contra paja molida.
Paja tratada con urea contra paja tratada con amonio.
La tabla siguiente muestra los coeficientes de los contrastes:
picada vs amonio vs
Tratamiento Repeticiones Media fis vs quim molida urea
paja picada 6 35.8483333 -1 -1 0
paja molida 6 36.4216667 -1 1 0
tratada
amonio 6 49.625 1 0 -1
tratada urea 6 45.1833333 1 0 1

La tabla de anova con los contrastes integrados es mostrada a continuacin:


Valor
Fuente de Suma de Grados de Cuadrados Probabilida crtico para
Variacion cuadrados libertad Medios F d F
Tratamientos 822.136046 3 274.045349 38.6488589 2.6922E-07 3.28738211
Fis vs quim 761.964704 (1) 761.964704 111.6922 2.4027E-08 4.54307712
Picada vs
molida 0.98613333 (1) 0.98613333 0.139076 0.71441849 4.54307712
Urea vs
amonio 59.1852083 (1) 59.1852083 8.347 0.01123995 4.54307712
Bloques 17.1037708 5 3.42075417 0.482432 0.7840427 2.90129454
Error 106.359679 15 7.09064528

Total 945.599496 23

La diferencia detectada como significativa corresponde al contraste urea contra


amonio, lo cual significa que existe diferencia estadstica entre el promedio de
digestibilidad de la paja tratada con urea (45.1833333) y la paja tratada con
amonio (49.625), por lo que si la digestibilidad se desea que se incremente,
entonces debe proporcionarse a las ovejas la paja tratada con amonio.
6. Aplicacin de la prueba de aditividad al ejemplo 4.
a). Ajuste del modelo del diseo en bloques al azar a la variable original:

Medias de
18 24 30 36 42 bloques Efs. De bloq
1 33.6 31.1 33 28.4 31.4 31.5 0.27666667
2 37.1 34.5 29.5 29.9 28.3 31.86 0.63666667
3 34.1 30.5 29.2 31.6 28.9 30.86 -0.36333333
4 34.6 32.7 30.7 32.3 28.6 31.78 0.55666667
5 35.4 30.7 30.7 28.1 29.6 30.9 -0.32333333
6 36.1 27.9 27.9 26.9 33.4 30.44 -0.78333333
Medias de
tratamiento 35.15 31.2333333 30.1666667 29.5333333 30.0333333 31.2233333
-
Efs. De trat 3.92666667 0.01 1.05666667 -1.69 -1.19

Valores estimados, predichos y residuales en la variable y:


bloque trat obs media gral efe trat efe bloque estimado residual
Bloque 1 18 33.6 31.22333333 3.92666667 0.27666667 35.4266667 -1.82666667
Bloque 2 18 37.1 31.22333333 3.92666667 0.63666667 35.7866667 1.31333333
Bloque 3 18 34.1 31.22333333 3.92666667 -0.36333333 34.7866667 -0.68666667
Bloque 4 18 34.6 31.22333333 3.92666667 0.55666667 35.7066667 -1.10666667
Bloque 5 18 35.4 31.22333333 3.92666667 -0.32333333 34.8266667 0.57333333
Bloque 6 18 36.1 31.22333333 3.92666667 -0.78333333 34.3666667 1.73333333
Bloque 1 24 31.1 31.22333333 0.01000000 0.27666667 31.51 -0.41000001
Bloque 2 24 34.5 31.22333333 0.01000000 0.63666667 31.87 2.62999999
Bloque 3 24 30.5 31.22333333 0.01000000 -0.36333333 30.87 -0.37000001
Bloque 4 24 32.7 31.22333333 0.01000000 0.55666667 31.79 0.90999999
Bloque 5 24 30.7 31.22333333 0.01000000 -0.32333333 30.91 -0.21000001
Bloque 6 24 27.9 31.22333333 0.01000000 -0.78333333 30.45 -2.55000001
Bloque 1 30 33 31.22333333 -1.05666666 0.27666667 30.4433333 2.55666666
Bloque 2 30 29.5 31.22333333 -1.05666666 0.63666667 30.8033333 -1.30333334
Bloque 3 30 29.2 31.22333333 -1.05666666 -0.36333333 29.8033333 -0.60333334
Bloque 4 30 30.7 31.22333333 -1.05666666 0.55666667 30.7233333 -0.02333334
Bloque 5 30 30.7 31.22333333 -1.05666666 -0.32333333 29.8433333 0.85666666
Bloque 6 30 27.9 31.22333333 -1.05666666 -0.78333333 29.3833333 -1.48333334
Bloque 1 36 28.4 31.22333333 -1.69000000 0.27666667 29.81 -1.41000001
Bloque 2 36 29.9 31.22333333 -1.69000000 0.63666667 30.17 -0.27000001
Bloque 3 36 31.6 31.22333333 -1.69000000 -0.36333333 29.17 2.42999999
Bloque 4 36 32.3 31.22333333 -1.69000000 0.55666667 30.09 2.20999999
Bloque 5 36 28.1 31.22333333 -1.69000000 -0.32333333 29.21 -1.11000001
Bloque 6 36 26.9 31.22333333 -1.69000000 -0.78333333 28.75 -1.85000001
Bloque 1 42 31.4 31.22333333 -1.19000000 0.27666667 30.31 1.08999999
Bloque 2 42 28.3 31.22333333 -1.19000000 0.63666667 30.67 -2.37000001
Bloque 3 42 28.9 31.22333333 -1.19000000 -0.36333333 29.67 -0.77000001
Bloque 4 42 28.6 31.22333333 -1.19000000 0.55666667 30.59 -1.99000001
Bloque 5 42 29.6 31.22333333 -1.19000000 -0.32333333 29.71 -0.11000001
Bloque 6 42 33.4 31.22333333 -1.19000000 -0.78333333 29.25 4.14999999

b). Ajuste del modelo del diseo en bloques al azar en la variable q:


ef de
bloque 18 24 30 36 42 medias blo bloque
Bloque 1 1255.04871 992.8801 926.796545 888.6361 918.6961 996.411512 17.0797995
Bloque 2 1280.68551 1015.6969 948.845345 910.2289 940.6489 1019.22111 39.8893995
-
Bloque 3 1210.11218 952.9569 888.238678 850.8889 880.3089 956.501112 22.8306005
Bloque 4 1274.96604 1010.6041 943.923212 905.4081 935.7481 1014.12991 34.7981995
-
Bloque 5 1212.89671 955.4281 890.624545 853.2241 882.6841 958.971512 20.3602005
-
Bloque 6 1181.06778 927.2025 863.380278 826.5625 855.5625 930.755112 48.5766005
1235.79616 975.794767 910.301434 872.491434 902.274767 979.331712
- - - -
256.464444 3.53694492 69.0302783 106.840278 77.0569449

Valores observados, estimados y residuales en la variable q:


bloque trat q observada media gral ef de bloue ef de trat estim de q residual
Bloque 1 18 1255.04871 979.331712 17.0797995 256.464444 1252.87596 2.1727565
Bloque 2 18 1280.68551 979.331712 39.8893995 256.464444 1275.68556 4.9999565
-
Bloque 3 18 1210.11218 979.331712 -22.8306005 256.464444 1212.96556 2.85337683
Bloque 4 18 1274.96604 979.331712 34.7981995 256.464444 1270.59436 4.37168983
Bloque 5 18 1212.89671 979.331712 -20.3602005 256.464444 1215.43596 -2.5392435
-
Bloque 6 18 1181.06778 979.331712 -48.5766005 256.464444 1187.21956 6.15177683
Bloque 1 24 992.8801 979.331712 17.0797995 -3.53694492 992.874566 0.00553428
Bloque 2 24 1015.6969 979.331712 39.8893995 -3.53694492 1015.68417 0.01273428
-
Bloque 3 24 952.9569 979.331712 -22.8306005 -3.53694492 952.964166 0.00726572
Bloque 4 24 1010.6041 979.331712 34.7981995 -3.53694492 1010.59297 0.01113428
-
Bloque 5 24 955.4281 979.331712 -20.3602005 -3.53694492 955.434566 0.00646572
-
Bloque 6 24 927.2025 979.331712 -48.5766005 -3.53694492 927.218166 0.01566572
-
Bloque 1 30 926.796545 979.331712 17.0797995 -69.0302783 927.381233 0.58468794
-
Bloque 2 30 948.845345 979.331712 39.8893995 -69.0302783 950.190833 1.34548794
Bloque 3 30 888.238678 979.331712 -22.8306005 -69.0302783 887.470833 0.76784539
-
Bloque 4 30 943.923212 979.331712 34.7981995 -69.0302783 945.099633 1.17642128
Bloque 5 30 890.624545 979.331712 -20.3602005 -69.0302783 889.941233 0.68331206
Bloque 6 30 863.380278 979.331712 -48.5766005 -69.0302783 861.724833 1.65544539
-
Bloque 1 36 888.6361 979.331712 17.0797995 -106.840278 889.571233 0.93513239
-
Bloque 2 36 910.2289 979.331712 39.8893995 -106.840278 912.380833 2.15193239
Bloque 3 36 850.8889 979.331712 -22.8306005 -106.840278 849.660833 1.22806761
-
Bloque 4 36 905.4081 979.331712 34.7981995 -106.840278 907.289633 1.88153239
Bloque 5 36 853.2241 979.331712 -20.3602005 -106.840278 852.131233 1.09286761
Bloque 6 36 826.5625 979.331712 -48.5766005 -106.840278 823.914833 2.64766761
-
Bloque 1 42 918.6961 979.331712 17.0797995 -77.0569449 919.354566 0.65846572
-
Bloque 2 42 940.6489 979.331712 39.8893995 -77.0569449 942.164166 1.51526572
Bloque 3 42 880.3089 979.331712 -22.8306005 -77.0569449 879.444166 0.86473428
-
Bloque 4 42 935.7481 979.331712 34.7981995 -77.0569449 937.072966 1.32486572
Bloque 5 42 882.6841 979.331712 -20.3602005 -77.0569449 881.914566 0.76953428
Bloque 6 42 855.5625 979.331712 -48.5766005 -77.0569449 853.698166 1.86433428

c). Obtener los valores P y Q a partir de los residuales encontrados:


P = -7.25106222
Q = 136.658476
d). Obtener el estimador del efecto curvilneo y su suma de cuadrados
asociada:
Beta = -0.053059
S.C.R. = 0.38474
e). Prueba de aditividad de Tukey:
F = 0.38474/81.933927 =0.0047 con 1 grado de libertad en el numerador y 19
grados de libertad en el denominador, por lo que se toma la decisin de no
rechazar la hiptesis nula, concluyndose entonces que el modelo de bloques
al azar es apropiados a este conjunto de observaciones.
Continuando entonces con el anlisis, establecemos las tendencias lineal y cuadrtica en
el anova de la variable original:
Valor
Fuente Probabilida crtico para
variacion S.C. G.L. C.M. F d F
Bloques 8.20966667 5 1.64193333 0.39892127 0.84373767 2.71088984
Tratamientos 124.845333 4 31.2113333 7.58305123 0.00068956 2.8660814
T. Lineal 85.4426667 1 85.4426667 20.7590016 0.00019193 4.3512435
T.Cuadratica 36.8019048 1 36.8019048 8.94132674 0.00723358 4.3512435
T. Cbica 1.76816667 1 1.76816667 0.4295907 0.51965862 4.3512435
T. Cuarto 0.83259524 1 0.83259524 0.20228589 0.65771869 4.3512435
Error 82.3186667 20 4.11593333

Total 215.373667 29

Las tendencias que resultan ser significativas son la lineal y la cuadrtica, por
lo que se puede concluir que un modelo polinomial de segundo orden se ajusta
adecuadamente a este conjunto de observaciones.
Los coeficientes de la ecuacin ajustada son:
Coeficientes Error tpico
Intercepcin 52.4138 4.82431978
Variable X -1.30206 0.34008611
Variable X^2 0.01838 0.00562884

Bajo este modelo estimado podemos determinar el nivel exacto de


espaciamiento en el cual se logra una produccin mnima de paja, con el
siguiente procedimiento:
1. Derivar la variable y ajustada con respecto a la variable x:
2. Igualar a cero la derivada.
3. Despejar la variable x.
Aplicando el procedimiento, se obtiene:
1. dy/dx = -1.30206 +2*(0.01838)x
2. -1.30206 + 0.03676x =0
3. x = 35.42 pulgadas de espaciamiento.
Con una produccin mnima estimada en 29.354.
DISEO EN CUADRO LATINO

El diseo en cuadro latino es una generalizacin del diseo en bloques al azar,


consistente en que las variables de bloqueo usadas en el diseo son dos,
llamadas genricamente la variable de hileras y la variable de columnas. El
nombre de este arreglo geomtrico es debido a que el numero de niveles en las
variable de hileras es igual al numero de niveles en la variable de columnas y
es igual al numero de tratamientos, estos ultimos son denotados por letras
latinas dentro de las celdas del cuadrado que forman las hileras y las
columnas.
Una restriccin en la aleatorizacion de este arreglo geomtrico es que cada
letra correspondiente a uno de los tratamientos solo debe aparecer una vez en
cada hilera y en cada columna. El procedimiento de aleatorizacion en este
arreglo geomtrico consiste de los siguientes pasos:
1. Empezar con la construccin de un cuadro latino estndar. Este
cuadro se caracteriza por el orden alfabtico de las letras a partir de
la primera hilera y primera columna.
2. Aleatorizar las hileras para generar un segundo cuadro.
3. Aleatorizar las columnas del segundo cuadro para definir el cuadro
que va ser utilizado en el experimento.
Apliquemos el procedimiento de aleatorizacion a un cuadro latino de
dimension 44:
1. Cuadro latino estndar:
Columna 1 Columna 2 Columna 3 Columna 4
Hilera 1 A B C D
Hilera 2 B C D A
Hilera 3 C D A B
Hilera 4 D A B C

2. Aleatorizar hileras: Para este fin se pueden obtener cuatro nmeros aleatorios
que se asignan en secuencia de generacion a las hileras ordenadas en el cuadro
latino estndar. En seguida los nmeros aleatorios se ordenan en magnitud,
indicando as el orden aleatorio en que deben estar las hileras. Usando el
generador de nmeros aleatorios disponible en Excel, los nmeros aleatorios
generados son:
Orden Orden
Numero Actual de Aleatorio
Aleatorio Hileras de Hileras
0.08060046 1 1
0.09297599 2 2
0.61098286 3 4
0.47095288 4 3

As el nuevo cuadro, con hileras aleatorizadas debe ser


Columna 1 Columna 2 Columna 3 Columna 4
Hilera 1 A B C D
Hilera 2 B C D A
Hilera 3 D A B C
Hilera 4 C D A B

3. Aleatorizar columnas: Este paso se lleva a cabo de manera equivalente a las


hileras, solo que en este caso aplicado a columnas:
Orden Orden
Numero Actual de aleatorio de
Aleatorio columna Columna
0.4209566 1 2
0.41984865 2 1
0.90356138 3 4
0.88228072 4 3

Por lo que el nuevo cuadro ser:


Columna 1 Columna 2 Columna 3 Columna 4
Hilera 1 B A D C
Hilera 2 C B A D
Hilera 3 A D C B
Hilera 4 D C B A

Este seria el cuadro latino que debe usarse como arreglo geomtrico del
diseo experimental. Las letras pueden tambin ser asignadas al azar a los
tratamientos.

MODELO ESTADSTICO DEL DISEO EN CUADRTO LATINO:


Aparte de los tratamientos, este arreglo geomtrico debe incorporar en el
modelo las dos fuentes de bloqueo, las hileras y columnas. Para construir el
modelo debemos considerar 3 subindices (i, j, k) que correspondan a cada
una de las fuentes de variacin, pero el subndice de tratamiento queda
definido por los subndices de hilera y columna, lo que es generado por el
hecho de que tratamiento este anidado a hilera y columna. Esta situacin es
representada en el modelo como:
Yijk = + k(ij) + i + j + ijk
i = 1,2,,t ; j = 1,2,,t; k = 1,2,t
t = numero de tratamientos.
n = t2 , numero total de observaciones en el arreglo.
Donde
Es la media general de la poblacin.
k(ij) Es el efecto del tratamiento k en la hilera i y columna j.
i Es el efecto de la hilera i.

j Es el efecto de la columna j.

ijk Es el error experimental en la hilera i, columna j y tratamiento k.

La hiptesis que se desea probar es solo acerca del efecto de los tratamientos,
es decir:
Ho: Todos los efectos de tratamiento son iguales a cero.
Contra la Ha: al menos uno de los efectos de tratamiento es diferente de cero.
Las variables de bloqueo incluidas en este arreglo son estrictamente, como en
el arreglo en bloques, para el control de la variacin en las unidades
experimentales o de las condiciones en que se lleva a cabo el experimento,
pero no son de inters como factores de investigacin. El objetivo entonces de
las variables de bloqueo sigue siendo eliminar posibles fuentes de variacin en
el experimento que pudieran impactar sobre la variable de respuesta y
enmascarar el efecto de los tratamientos.

ANLISIS DE VARIANZA EN EL DISEO EN CUADRO LATINO:

Como Lo establece el modelo del diseo en cuadro latino, se supone que los
efectos son aditivos e independientes, por lo que para el anlisis establecemos
las siguientes restricciones acerca de los parmetros del modelo:
k(ij) = 0
i = 0
j= 0
Ya que el numero de niveles en cada fuente de variacin es t, entonces el
numero de parmetros independientes que deben ser estimados por cada
fuente de variacin es (t - 1), y as los grados de libertad son:
Para el modelo reducido: t2 1 = (t + 1)(t - 1)
Para el modelo completo: t2 1 - 3(t - 1)= t2 - 3(t )+2 = (t 1) (t 2)
La estimacin de los parmetros del modelo es la que se ha venido
identificando en los otros dos arreglos geomtricos:
k(ij) = Media del tratamiento k Media General
i = Media de la hilera i Media General.

j = Media de la columna j Media General.


La suma de cuadrados asociada al efecto de los tratamientos esta dada por:
S.C.(tratamientos) = t 2k(ij) con ( t 1 ) grados de libertad.
S.C. (hileras) = t 2i con ( t 1 ) grados de libertad.

S.C. (columnas) = t 2j con ( t 1 )grados de libertad.


La suma de cuadrados del total y sus grados de libertad asociados se
obtienen del ajuste del modelo reducido, en tanto que la suma de cuadrados
del residual y sus grados de libertad se obtienen del ajuste del modelo completo. El
resto de la tabla de anlisis de varianza reobtiene de la manera convencional.
F.V. G.L. S.C. C.M. Fc Ft Pr > Fc
Modelo 3( t - 1 ) S.C.To - S.C.E
Hileras t-1 t (S.C.(ef. Hilera))
Columnas t-1 t (S.C.(ef. Columna))
Tratamientos t-1 t (S.C. (ef. Tratamiento)
Error (t-1)(t-2) S.C.E. Mod. Completo
Total t^2 - 1 S.C.E. Mod. Reducido

Ejemplo numrico 1. Se llevo a cabo un experimento en un diseo en


cuadro latino en el que se deseaba comparar el efecto de 5 fuentes de
fertilizacin nitrogenada y un testigo sobre la produccin de azucar de
remolacha. Las fuentes a comparar fueron:
A: Sulfato de amonio.
B: Nitrato de amonio.
C: Urea
D: Nitrato de calcio.
E: Nitrato de sodio.
F: Control, sin nitrogeno.
Los resultados del experimento fueron:
c1 c2 c3 c4 c5 c6
H1 F=28.2 D=29.1 A=32.1 B=33.1 E=31.1 C=32.4
H2 E=31.0 B=29.5 C=29.4 F=24.8 D=33.0 A=30.6
H3 D=30.6 E=28.8 F=21.7 C=30.8 A=31.9 B=30.1
H4 C=33.1 A=30.4 B=28.8 D=31.4 F=26.7 E=31.9
H5 B=29.9 F=25.8 E=30.3 A=30.3 C=33.5 D=32.3
H6 A=30.8 C=29.7 D=27.4 E=29.1 B=30.7 F=21.4

Para llevar a cabo el anlisis de este conjunto de datos se aplica


primeramente el anlisis de varianza y se anexa el siguiente conjunto de
contrastes ortogonales:
1. Testigo vs. Tratados.
2. Organico vs. Inorganicos.
3. Sales de amonio vs. Sales de no amonio.
4. Sulfato de amonio vs. Nitrato de amonio.
5. Nitrato de calcio vs. Nitrato de sodio.
Los resultados se muestran en la siguiente tabla:

F.V. G.L. S.C. C.M. Fc Ft P>Fc


Hileras 5 32.1880555 6.43761111 4.25549027 2.71088984 0.00848296
Columnas 5 33.6680556 6.73361111 4.45115681 2.71088984 0.00689471
Tratamientos 5 185.764722 37.1529444 24.5594198 2.71088984 6.718E-08

Testigo vs. Tratados 1 180.200056 180.200056 119.118656 4.35124348 7.1267E-10


Organico Vs. Inorg 1 3.81633333 3.81633333 2.52273228 4.35124348 0.12790015
Amoniac Vs. No Amoniac 1 0.20166667 0.20166667 0.13330885 4.35124348 0.71885832
Sulfato vs. Nitrato
(amoniac) 1 1.33333333 1.33333333 0.88138083 4.35124348 0.35902438
Ca vs. Na (Nitratos) 1 0.21333333 0.21333333 0.14102093 4.35124348 0.71122148

Error 20 30.2555556 1.51277778


Total 35 281.876389

El efecto de tratamientos detectado por el anlisis de varianza en la prueba


de tratamientos con los 5 grados de libertad, es debida solamente a la
diferencia que existe entre los tratamientos con nitrgeno y el testigo, pues
la significancia de los contrastes ortogonales solo resulto menor de .05 para
este contraste, no detectndose ningn otro contraste como significativo, lo
que indica que en cuanto a la variable de respuesta evaluada, todos los
fertilizantes tienen el mismo efecto.

CUADROS LATINOS AUMENTADOS:


Una desventaja de este arreglo geomtrico es que cuando el numero de
tratamientos es pequeo, esto trae como consecuencia un escaso numero
de grados de libertad para el error. Por ello se recomienda,
fundamentalmente en estos casos, aumentar el diseo en cuadro latino a
travs de repeticiones completas de los cuadros, que puede estar asociada
a algn otro factor de bloqueo, diferente al empleado para definir las hileras
y columnas, por ejemplo, aos en que se lleva a cabo el experimento, sitios
en que se lleva a cabo el experimento, etc. Debemos distinguir
fundamentalmente tres tipos de cuadros latinos repetidos:
1. Con hileras y columnas comunes en cada repeticin del cuadro. Sucede
con hileras y columnas lo mismo que con los tratamientos, son los
mismos niveles en cada repeticin, por lo que las repeticiones se
asocian mas comnmente a tiempo. El modelo para este arreglo es el
del cuadro latino convencional con el efecto aditivo de repeticiones.
Yijkl = + i + l(ijk) + j + k + ijkl
En este caso, entonces, solo se agrega la fuente de variacin de repeticin
en el anova con (r-1) grados de libertad, siendo r el numero de repeticiones
de cuadros latinos completos. Cada una de las fuentes de variacin en el
modelo (hileras, columnas y tratamientos) contribuyen con (t-1) grados de
libertad. El numero total de observaciones es ahora rt , por lo que los
grados de libertad para el total son (rt-1) quedando para el error la
diferencia definida por (t-1)[r(t+1)-3].
Con tres repeticiones en un cuadro latino con tres tratamientos, los
grados de libertad en el error aumenta 9 veces en comparacin con una
sola repeticin.
Ejemplo numrico 2. Considere la situacin experimental en una industria en la
que se estn probando tres tipos de soldadura (tratamientos) y se controlan como
variables de bloqueo el fundente (columnas) y el operador que lleva a cabo el
proceso (hileras), en dos maquinas soldadoras diferentes (repeticiones). La
variable de respuesta es la resistencia de las piezas soldadas a la separacin de
piezas. Los resultados se muestran en la siguiente tabla.
R1 R1 R1 R2 R2 R2
Fund 1 Fund 2 Fund 3 Fund 1 Fund 2 Fund 3
Op 1 A = 14.0 B = 16.5 C = 11.0 C = 10 B = 16.5 A = 13.0
Op 2 C = 9.5 A = 17.0 B = 15.0 A = 12.0 C = 12.0 B = 14.0
Op 3 B = 11.0 C = 12.0 A = 13.5 B = 13.5 A = 18.0 C = 11.5
El resultado del anlisis de varianza es mostrado:

F.V. G.L. S.C. C.M. Fc Ft Pr>Fc


Modelo 7 90.7222222
Repeticion 1 0.05555556 0.05555556 0.04032258 4.9646027 0.844876514
Fundentes 2 41.3333333 20.6666667 15 4.10282102 0.000976563
Operadores 2 0.25 0.125 0.09072581 4.10282102 0.914011146
Tratamientos 2 49.0833333 24.5416667 17.8125 4.10282102 0.000505808
Error 10 13.7777778 1.37777778
Total 17 104.5

La interpretacin de resultados es que los tratamientos tienen un efecto


significativo. Las medias de los tratamientos son:
Media de
Tratamiento Totales Observaciones Trat
A 87.5 6 14.5833333
B 86.5 6 14.4166667
C 66 6 11
Donde se observa que el tratamiento C es el de menor respuesta, en
tanto que el A y B son de valores muy similares y mas altos que el del
tratamiento C. Lleve a cabo la prueba de separacin de medias de Tukey
para reportar las diferencias y llevar a cabo la toma de decisin y
recomendacin de la soldadura.
2. Con una variable de bloqueo con diferentes niveles en las repeticiones y
la otra variable de bloqueo con niveles comunes en las diferentes
repeticiones. Supngase ahora que se desean probar los mismos 3 tipos
de soldadura, pero el experimento se desea de resultados lo mas rpido
posible, por lo que un numero de operadores diferentes van a ser
empleados en cada repeticin, usando los mismos fundentes para todas
las repeticiones. En este caso los operadores van a estar asociados a
cada repeticin, por lo que este factor se cataloga como anidado dentro
de repeticin. Conviene entonces en este apartado revisar el anlisis de
los factores jerrquicos. En este ejemplo articular, el factor de jerarqua
superior es la repeticin y el de jerarqua inferior son los operadores. La
estimacin de los efectos del factor de jerarqua superior se llevan a
cabo de la manera acostumbrada, pero los efectos del factor de
jerarqua inferior se llevan a cabo dentro de cada nivel del factor de
jerarqua superior. En este ejemplo tenemos que llevar a cabo la
estimacin de cada operador dentro de cada repeticin del cuadro latino,
ya que en cada uno los operadores sern diferentes (media de operador
menos la media de repeticin). Esto implica que en cada repeticin se
debern estimar (t-1) parmetros independientes, por lo que los grados
de libertad para esta fuente de variacin sern r(t-1). El modelo
estadstico es similar al del cuadro latino con repeticiones con factores
de bloqueo comunes, con la nica diferencia de que ahora debe ser
especificado el anidamiento de una de las fuentes de bloqueo.
Yijkl = + i + l(ijk) + j(i) + k + ijkl
Los grados de libertad en el error para este modelo van a estar definidos
por (t-1)(rt 2). El incremento en los grados de libertad en el error es
menor bajo este arreglo, por la mayor cantidad de parmetros
independientes que deben ser estimados.
Ejemplo numrico 3. A continuacin se muestran los datos del segundo
experimento en la industria referente a la soldadura con diferentes
operadores en cada repeticin. Una tabla de anlisis de varianza es
mostrada enseguida de los datos. En dicha tabla se observa una
significancia para todos los efectos. Las medias de los tipos de soldadura
son requeridos para seleccionar el mejor nivel. Los valores resultaron ser:
Media A = 296 , Media B = 253.3, Media C = 210.6
Por lo que la mejor soldadura es la del tipo A.

Fundente 1 Fundente 2 Fundente 3


Rep 1 Operador 1 B = 265 A = 311 C = 249
Operador 2 A =350 C = 284 B = 330
Operador 3 C = 258 B = 305 A = 351
Rep 2 Operador 4 B = 220 A = 276 C = 189
Operador 5 A = 319 C = 232 B = 264
Operador 6 C = 175 B = 254 A = 307
Rep 3 Operador 7 B = 159 A = 205 C = 142
Operador 8 A = 262 C = 168 B = 246
Operador 9 C = 198 B = 237 A = 283
F.V. G.L. S-C. C.M. Fc Ft P > Fc

Modelo 12 84904.2222

Repeticion 2 36140.5185 18070.2593 134.60819 3.73889183 7.2122E-10


Oper(Rep 6 14565.7778 2427.62963 18.0837932 2.847726 7.4259E-06
Fund 2 1344.51852 672.259259 5.00776446 3.73889183 0.02287974
Tratamiento 2 32853.4074 16426.7037 122.365087 3.73889183 1.3582E-09

Error 14 1879.40741 134.243386


Total 26 86783.6296

Conviene llevar a cabo la prueba de separacin de medias de Tukey para


mostrar las diferencias significativas entre los tratamientos y poder
establecer la recomendacin.

3. Con hileras y columnas con diferentes niveles en cada repeticin del


cuadro.
Considere ahora la situacin en que lo nico que es comn en las
repeticiones del cuadro latino son los tratamientos, usando diferentes
niveles del factor hilera y del factor columna en cada una de las
repeticiones. Esto implica que tanto hileras como columnas estn anidadas
dentro de cada repeticin. El modelo estadstico para este arreglo
geomtrico es
Yijkl = + i + l(ijk) + j(i) + k(i) + ijkl
En base a este modelo los grados de libertada para el error experimental
quedan definidos por la expresin (t-1)(rt-r-1) . Como puede sospecharse,
por el numero de parmetros a estimar, este es el cuadro latino repetido que
tiene un menor incremento en los grados de libertad en el error, ya que la
estimacin de efectos de hilera y columna se llevan a cabo dentro de cada
repeticin.
Ejemplo numrico 4. Como un ejemplo considere la situacin en la que se
estn probando cuatro diferentes tratamientos (A, B, C, D) para mejorar el
valor nutricional de subproductos agrcolas para la alimentacin del ganado.
Se dispone de dos zonas climticas, cada una de las cuales produce cuatro
diferentes tipos de subproductos agrcolas que se pueden someter a los
mismos tratamientos, y en cada zona climtica son usados 4 diferentes
animales en los que se prueba el subproducto tratado. La variable a medir
es el porcentaje de disgestibilidad. Los resultados se muestran a
continuacin:

S U B P R O D U C T O S
ANIMAL 1 2 3 4
1 C = 0.2 A = 0.24 D = 0.2 B = 0.27
2 B = 0.28 C = 0.19 A = 0.22 D = 0.28
3 D = 0.34 B = 0.23 C = 0.21 A = 0.28
4 A = 0.32 D = 0.22 B = 0.16 C = 0.27
5 6 7 8
5 B = 0.29 A = 0.25 C = 0.18 D = 0.28
6 D = 0.28 B = 0.18 A = 0.21 C = 0.25
7 C = 0.28 D = 0.23 B = 0.2 A = 0.28
8 A = 0.3 C = 0.19 D = 0.24 B = 0.25

Se requiere en primer lugar la estimacin de los efectos de acuerdo al


modelo establecido:
Media general: 0.24375
Efecto de la repeticin: Media de repeticin Media general.
Efecto de la repeticin 1 = 0.000625
Efecto de la repeticin 2 = - 0.000625
Efectos de hilera en la repeticin 1: Media de la hilera Media Repeticin 1
Efecto de la hilera 1 (Repeticin 1) = 0.016875
Efecto de la hilera 2 (Repeticin 1) = -0.001875
Efecto de la hilera 3 (Repeticin 1) = 0.020625
Efecto de la hilera 4 (Repeticin 1) = -0.001875
Efectos de hilera en la repeticin 2: Media de la hilera Media Repeticin 2
Efecto de la hilera 5 (Repeticin 2) = 0.006875
Efecto de la hilera 6 (Repeticin 2) = -0.013125
Efecto de la hilera 7 (Repeticin 2) = 0.004375
Efecto de la hilera 8 (Repeticin 2) = 0.001875
Recalcamos que una estimacin de efectos anidados consiste en la estimacin
separada de los efectos en cada nivel del factor de jerarqua superior.
Efectos de columna en repeticin 1: Media de la columna Media repeticin 1
Efecto de la Columna 1 (Repeticin 1) = 0.040625
Efecto de la Columna 2 (Repeticin 1) = -0.024375
Efecto de la Columna 3 (Repeticin 1) = -0.046875
Efecto de la Columna 4 (Repeticin 1) = 0.030625
Efectos de columna en repeticin 2: Media de la columna Media repeticin 2
Efecto de la Columna 5 (Repeticin 2) = 0.044375
Efecto de la Columna 6 (Repeticin 2) = -0.030625
Efecto de la Columna 7 (Repeticin 2) = -0.035625
Efecto de la Columna 8 (Repeticin 2) = 0.021875
Efecto de los Tratamientos: Media de tratamiento Media general.
Efecto del tratamiento 1 = 0.01875
Efecto del tratamiento 2 = -0.01125
Efecto del tratamiento 3 = -0.0225
Efecto del tratamiento 4 = 0.015
En base a estos efectos estimados se pueden deducir los grados del libertad,
las sumas de cuadrados de los efectos, el modelo completo y el modelo
reducido, es decir, se puede derivar todo el anlisis de varianza.
Vamos a repasar primero los grados de libertad asociados a los efectos
incluidos en el modelo. Como regla general, los grados de libertad del efecto
corresponde al numero de parmetros independientes estimados para dicho
efecto. Entonces:
Para repeticiones es un grado de libertad, ya que se estimaron dos efectos de
repeticin, pero su suma es igual a cero, de tal forma que independientes solo
se estima uno.
Para hileras anidadas en repeticiones, se tienen 4 estimaciones en la repeticin
uno y otras 4 en la repeticin dos, pero, en cada caso su suma es cero, por lo
que solo quedan 3 estimaciones independientes en cada repeticin, y as, los
grados de libertad para hileras en repeticin son 6.
Para columnas anidadas en repeticin, se tiene una situacin equivalente a la
de hileras, 4 estimadores de columnas en cada repeticin, pero solo tres
independientes en cada caso, por lo que los grados de libertad de columnas
anidadas en repeticin son tambin 6.
Para tratamientos es una situacin diferente, ya que los tratamientos son
comunes en ambas repeticiones, para calcular los estimadores de los efectos
se juntan ambas repeticiones y se obtienen solo 4 estimadores, de los cuales,
por ser su suma igual a cero, se consideran 3 independientes, que son los
grados de libertad de los tratamientos.
Los grados de libertad para el total siempre se calculan como el numero total
de observaciones menos una, por lo que en este caso, cada repeticin del
cuadro latino incluye 44=16 observaciones en cada repeticin, y por ser dos
repeticiones, entonces el numero total de observaciones son 32. Los grados de
libertad del total son entonces 31.
Aplicando la expresin derivada para grados de libertad especifica para este
tipo de cuadro latino aumentado (hileras y columnas diferentes en cada
repeticin) se obtienen 15 grados de libertad.
Las sumas de cuadrados asociadas a cada uno de los efectos se obtiene
mediante los efectos estimados, elevados al cuadrado y sumados sobre todas
las observaciones.
La tabla de anlisis de varianza para estos datos es mostrada:
F.V G.L. S.C. C.M. Fc Ft Pr > Fc

Modelo 16 0.0536625

Repeticion 1 0.0000125 0.0000125 0.02377179 4.54307712 0.87952229


Hileras(rep) 6 0.0038375 0.00063958 1.2163233 2.790465 0.35123807
Colum(rep) 6 0.0401375 0.00668958 12.72187 2.790465 3.8579E-05
tratamientos 3 0.009675 0.003225 6.13312203 3.28738211 0.00621636

Error 15 0.0078875 0.00052583


Total 31 0.06155

Los valores de significancia indican una diferencia estadstica entre


tratamientos, por lo que es necesario aplicar la prueba de Tukey a las medias
de los tratamientos para determinar cuales medias son diferentes. Las medias
de los tratamientos son:
A = 0.2625
B = 0.2325
C = 0.22125
D = 0.25875
Prueba de separacin de medias de Tukey:
Ordenar las medias de mayor a menor:
A = 0.2625
D = 0.25875
B = 0.2325
C = 0.22125
Construir una tabla de diferencia de medias:
A D B C
A A-D=0.00375 A-B=0.03000 A-C=0.04125
D D-B=0.02625 D-C=.0375
B B-C=0.01125
C

Valor HSD: Diferncia honesta significativa de Tukey:


Error estndar de la media = 0.008107
Valor critico de la tabla de Tukey = 4.08
HSD = 0.0081074.08 = 0.033
Declaracion de diferencias significativas:
A-D < HSD , No significativa
A-B < HSD , No significativa
A-C > HSD , Significativa
D-B < HSD , No significativa.
D-C > HSD , Significativa.
B-C < HSD , No significativa.
Separacin de medias:
A = 0.2625a D = 0.25875a B = 0.2325ac C = 0.22125c
Los tratamientos A y D estadsticamente iguales son los que incrementaron
mas la respuesta. El tratamiento C es el de mas baja respuesta y
estadsticamente es igual al tratamiento B, que por estar en valor intermedio,
tambin es estadsticamente igual an los tratamientos A y D.

ARREGLOS DE TRATAMIENTOS:

Los arreglos de tratamientos se refieren al conjunto de tratamientos que deben


ser incluidos en un experimento para poder llevar a cabo las hiptesis que se
plantean en la investigacin. De esta manera, si la hiptesis establece solo los
efectos de tratamientos referentes a un solo factor, entonces el arreglo de
tratamientos requerido es un arreglo unifactorial.
Por otro lado, si las hiptesis que se desean probar se refieren a dos o
mas factores, entonces el arreglo a seleccionar es un arreglo multifactorial, que
puede ser un arreglo factorial o un arreglo en parcelas divididas.
El arreglo factorial es seleccionado cuando el tamao de la unidad
experimental es el mismo para cualquiera de los factores que se desean
probar. Bajo este arreglo se aleatorizan independientemente los niveles de
cada uno de los factores a las unidades experimentales. De manera
equivalente, se pueden formular todas las posibles combinaciones de los
niveles de los factores y considerarlas como tratamientos, llevando a cabo una
aleatorizacion de acuerdo al arreglo geomtrico de las unidades
experimentales.
El arreglo de parcelas divididas es seleccionado cuando el tamao de la
unidad experimental requerido para probar los niveles de un factor es mas
grande (factor de parcela principal) comparado con el tamao de la unidad
experimental para probar otro factor (factor de subparcela). En estos arreglos
de tratamientos las unidades experimentales para probar el factor de parcela
principal son aleatorizados de acuerdo a algn arreglo geomtrico
seleccionado. Posteriormente la parcela principal ya tratada con el nivel del
factor de parcela principal es dividida (de ah su nombre) en un numero de
subunidades igual al numero de niveles del factor de subparcela, el cual es
asignado de manera aleatoria.

Ejemplo tpico de un arreglo factorial:


Se desea investigar el efecto de la fuente de protena y la cantidad de protena
en la dieta para mascotas de tipo roedor, sobre sus ganancias de peso, con la
finalidad de minimizar crecimiento. Las fuentes de protena investigadas son de
tres tipos: Res, soya y puerco. Un factor fijo, cualitativo y con tres niveles. Los
niveles del factor cantidad de protena en la dieta son dos, denominados el
nivel alto y el nivel bajo. Es un factor fijo, cuantitativo con dos niveles. La
denominacin de los niveles de este factor (alto y bajo) no le quita la naturaleza
cuantitativa al factor. El arreglo factorial requerido para probar estos factores es
caracterizado como un 32, o sea, los tres niveles del factor tipo de protena y
dos niveles del factor cantidad de protena en la dieta, dando un arreglo con 6
combinaciones , cada una de las cuales constituye un tratamiento. Ya que se
cuenta con un grupo homogneo de 60 animales de este tipo, se separan en 6
grupos de 10 animales cada uno, en forma completamente aleatoria, asignando
a cada grupo un tratamiento. Este es un caso tpico en que ambos factores
requieren del mismo tamao de unidad experimental (el animal) para probar
ambos factores.
Los datos obtenidos de las ganancias de peso para cada animal se muestran
en la siguiente tabla:

ALTA BAJA
PROTENA PROTENA
Res Soya Puerco Res Soya Puerco
73 98 94 90 107 49
102 74 79 76 95 82
118 56 96 90 97 73
104 111 98 64 80 86
81 95 102 86 98 81
107 88 102 51 74 97
100 82 108 72 74 106
87 77 91 90 67 70
117 86 120 95 89 61
111 92 105 78 58 82

Las hiptesis que se desean probar son:


1. Ho: No hay efecto de la cantidad de protena.
2. Ho: No hay efecto de la fuente de protena.
3. Ho: No hay efecto de interaccin de cantidad por tipo de protena.

Efecto de interaccin:
Siempre que se lleva a cabo un experimento multifactorial el objetivo
fundamental es investigar el efecto conjunto de los factores. Esto implica
investigar como los niveles de un factor pueden modificar el efecto de otro
factor sobre una respuesta.
En nuestro ejemplo de las mascotas esto llevara a determinar como el
efecto de la cantidad de protena se ve modificado al cambiar las fuentes de
protena. En otras palabras, indagar si el efecto de la cantidad de protena
es el mismo para cada una de las fuentes investigadas.
Si el efecto de la cantidad de protena resulta ser el mismo para cada
fuente, es decir, el cambio en respuesta promedio por efecto de la cantidad
de protena para cada fuente resulta muy homogneo, esto refleja que la
fuente de protena no modifica el efecto de la cantidad, por lo tanto, bajo
esta situacin se considera que el efecto de los factores sobre la variable de
respuesta son independientes, esto es, cada uno de los factores tiene su
efecto sobre la respuesta indistintamente del nivel en el que se encuentra el
otro factor.
Sobre otro punto de vista, si el efecto de la cantidad de protena se modifica
para cada una de las fuentes, entonces existe una dependencia entre los
dos factores. La magnitud de cambio en la variable de respuesta debido a la
cantidad de protena va a depender de la fuente de protena que se este
considerando, situacin que caracteriza un efecto de interaccin de
cantidad por fuente. Esto equivale a observar diferentes pendientes o tasas
de cambio de un factor para diferentes niveles de un segundo factor. El
efecto de un factor bajo una situacin de interaccin se potencializa o inhibe
de acuerdo al nivel del segundo factor. Los efectos de los factores no son
independientes, sino todo lo contrario, existe un efecto cruzado de los
factores.
Bajo una situacin de interaccin de factores no tiene sentido entonces
concluir acerca de cada uno de los factores por separado, por la
dependencia que existe del efecto de un factor y los niveles de un segundo
factor.

En los estudios multifactoriales vamos a distinguir dos tipos de efectos:


1. Los efectos principales, que evalan el cambio en respuesta por los
niveles de un factor, ignorando los niveles del resto de los factores.
2. Los efectos de interaccin, que evalan el cambio en el efecto de un
factor a diferentes niveles de un segundo factor. Las interacciones se
clasifican de acuerdo al numero de factores que se consideran en la
interaccin como:
a), Interacciones de primer orden, cuando solo se consideran dos
factores en la interaccin. Por ejemplo, la interaccin cantidad de
protena por fuente de protena es una interaccin de primer orden y es
la nica que puede ser investigada , ya que solo se incluyen en el
experimento estos dos factores.
b). Interacciones de segundo orden o de tres factores, que estudia el
efecto conjunto de tres factores, es decir, como se modifica el efecto de
un factor al variar los niveles de un segundo y un tercer factor en el
experimento.
Sucesivamente se pueden definir, de manera equivalente las
interacciones de mas alto orden. Al llevar a cabo el anlisis de los datos
de un estudio multifactorial con repeticiones en cada combinacin de
niveles de los factores, deben ser incluidas todas las posibles
interacciones, para poder determinar cuales son significativas.

EJEMPLO TPICO DE UN ARREGLO EN PARCELAS DIVIDIDAS:

Se realiza un experimento para determinar la dispersin del pigmento en la


pintura. Se estudian 4 mezclas de un pigmento particular. El procedimiento
consiste en preparar una mezcla y aplicarla sobre una tabla mediante tres
mtodos de aplicacin (con brocha, por aspersin y con rodillo). La respuesta se
mide mediante el porcentaje de reflexion del pigmento. Se requieren de tres dias
para llevar a cabo el experimento. Los datos obtenidos se muestran a
continuacin:
M E Z C LA
Dia Mtodo de Aplicacin 1 2 3 4
1 1 64.5 66.3 74.1 66.5
2 68.3 69.5 73.8 70
3 70.3 73.1 78 72.3
2 1 65.2 65 73.8 64.8
2 69.2 70.3 74.5 68.3
3 71.2 72.8 79.1 71.5
3 1 66.2 66.5 72.3 67.7
2 69 69 75.4 68.6
3 70.8 74.2 80.1 72.4

De acuerdo a la descripcin del experimento, se preparo cada una de las mezclas


(factor de parcela principal) y la mezcla es aplicada por tres mtodos (factor de
subparcela). En cada da (bloque) se preparan y aplican las cuatro mezclas. La
parcela principal esta formada por la mezcla y da y como un ejemplo se tienen
los datos de la siguiente parcela principal:
Dia Mtodo de Aplicacin MEZCLA 1
1 1 64.5
2 68.3
3 70.3

Y la subparcela seria mtodo de aplicacin, mezcla y da, cada una de las piezas
de informacin.

Dia Mtodo de Aplicacin MEZCLA 1


1 1 64.5

Las hiptesis que se desean probar son:


1. Ho: No hay efecto de mezcla.
2. Ho: No hay efecto de mtodo de aplicacin.
3. Ho: No hay efecto de interaccin de mezcla por mtodo de
aplicacin.

Como puede ser visualizado a partir de estos ejemplos tipicos de cada arreglo
de tratamientos, la seleccin esta basada en un criterio netamente practicote
llevar a cabo la aplicacin de los niveles de los factores a las unidades
experimentales; cada una de las diferentes situaciones debe reflejarse en el
modelo estadstico y consecuentemente en el anlisis de resultados.

ARREGLO FACTORIAL DE TRATAMIENTOS:

El tema de arreglos factoriales de tratamiento debe ser revisado bajo la


siguiente secuencia de subtemas:
1. Arreglos factoriales en general.
2. Series 2 a la k.
3. Series 3 a la k.
4. Fracciones de las series 2 a la k aplicando la tcnica de la confusin.
5. Bloqueo en las series 2 a la k.
Estos arreglos constituyen la base fundamental de los arreglos empleados en
las metodologas de optimizacin, tales como la metodologa de Taguchi y la
metodologa de superficie de respuesta.

ARREGLOS FACTORIALES EN GENERAL:

En este subtema vamos a considerar los arreglos factoriales en los que


cada factor tiene su numero muy particular de niveles. Suponga que se tienen 3
factores, que convencionalmente los denotamos con letras maysculas,
digamos el factor A, el factor B y el factor C. sea a el numero de niveles en el
factor A, b el numero de niveles en el factor B y c el numero de niveles en el
factor C. Cada uno de los niveles de los factores se pueden representar con la
letra minscula del factor seguido de un subndice que corre desde cero hasta
el numero de niveles en el factor menos uno. As por ejemplo, el factor A con a
niveles, pueden ser representados por
a0,a1,aa-1
esta notacin para niveles puede ser usada tambin para el resto de los
factores.
Entonces tenemos un arreglo factorial denotado por
abc
Esta notacin convencional para caracterizar los arreglos factoriales nos
informa directamente el numero de factores que se estn investigando en el
experimento y el numero de niveles en cada uno de los factores.
Adicionalmente, el resultado de la multiplicacin corresponde al numero de
tratamientos que se generan en este arreglo. Cada tratamiento es una
condicin experimental diferente que se caracteriza por un nivel particular en
cada uno de los factores. As cada tratamiento debe corresponder a una de las
combinaciones de los niveles de los factores. Para generar una estructura
factorial se pueden emplear varios mtodos, por ejemplo el mtodo tabular, el
mtodo de diagrama de arbol o el mtodo computacional.
El mtodo tabular trabaja de manera adecuada cuando son pocos los factores
que se van a considerar, a lo mas cuatro. Se construye una tabla de doble
entrada, con hileras correspondiendo a las combinaciones de dos factores (o
los niveles de un factor) y las columnas correspondiendo a las combinaciones
de otros dos factores (o niveles de otro factor). Las celdas generadas en esta
tabla constituyen cada una de las combinaciones de tratamiento que deben ser
incluidas en el arreglo factorial.
Construya un arreglo factorial 324 en forma tabular:
Es un arreglo factorial con tres factores, A,B y C, en el que el factor A tiene tres
niveles (a0,a1,a2) , el factor B tiene dos niveles (b 0,b1) y el factor C tiene 4
niveles (c0,c1,c2,c3). Cada nivel de un factor debe combinarse con todos los
niveles de los otros factores. En este ejemplo generamos las combinaciones de
los primeros dos factores (AB) a las que colocamos como encabezados de
columna de la tabla, en tanto que los niveles del factor C los colocamos como
encabezados de hilera, formano as la siguiente estructura:

a0 a1 a2
b0 b1 b0 b1 b0 b1
c0 a 0 b 0 c0 a 0 b 1 c0 a 1 b 0 c0 a 1 b 1 c0 a 2 b 0 c0 a 2 b 1 c0
c1 a 0 b 0 c1 a 0 b 1 c1 a 1 b 0 c1 a 1 b 1 c1 a 2 b 0 c1 a 2 b 1 c1
c2 a 0 b 0 c2 a 0 b 1 c2 a 1 b 0 c2 a 1 b 1 c2 a 2 b 0 c2 a 2 b 1 c2
c3 a 0 b 0 c3 a 0 b 1 c3 a 1 b 0 c3 a 1 b 1 c3 a 2 b 0 c3 a 2 b 1 c3

Si esta tabla la desdoblamos para que nos quede en forma vertical, solo
debemos considerar los siguientes valores:
1. El numero total de combinaciones: 24
2. Numero de veces que se va a repetir cada nivel del factor A: 24/3=8
3. Numero de veces que se va a repetir cada nivel del factor B en cada
nivel del factor A: 8/2 = 4
4. Numero de veces que se va a repetir cada nivel del factor C en cada
nivel del factor B: 4/4=1.
a0 b0 c0
a0 b0 c1
a0 b0 c2
a0 b0 c3
a0 b1 c0
a0 b1 c1
a0 b1 c2
a0 b1 c3
a1 b0 c0
a1 b0 c1
a1 b0 c2
a1 b0 c3
a1 b1 c0
a1 b1 c1
a1 b1 c2
a1 b1 c3
a2 b0 c0
a2 b0 c1
a2 b0 c2
a2 b0 c3
a2 b1 c0
a2 b1 c1
a2 b1 c2
a2 b1 c3

Modelo estadstico para una estructura factorial:


Para generar el modelo estadstico de una estructura factorial debemos
considerar en primer lugar, el modelo estadstico bsico que incluira el arreglo
geomtrico que se utilizo para acomodar los tratamientos a las unidades
experimentales y el efecto de los tratamientos, como si estos constituyeran una
estructura unifactorial.
Enseguida, vamos a desdoblar los efectos de tratamientos en los efectos
principales y efectos de interaccin. Para ello debemos disponer de un
subndice, adicional a los del arreglo geomtrico, por cada factor incluido en el
arreglo factorial. Se deben considerar en el modelo estadstico todos los
efectos principales y todos los posibles efectos de interaccin entre los
factores.
Ejemplo: Genere el modelo estadstico para el ejemplo de las mascotas.
1. Modelo estadstico Bsico: Ya que se trata de un arreglo geomtrico
completamente al azar con 6 tratamientos y 10 repeticiones por
tratamiento, el modelo estadstico bsico es:

Yij = + i + ij ; i=1,2,..,6 ; j=1,2,,10

El estimador de la media general es la media de todas las observaciones, dada


por 87.86666667.
Los efectos de tratamiento vienen dados por:
12.13333333
-1.966666667
11.63333333
-8.666666667
-3.966666667
-9.166666667
El anova bajo este modelo esta dado por

Fuente de
variacin G.L. S.C. C.M Fc Ft Pr > Fc

Tratamientos 5 4612.9333 922.5866 4.2999 2.3860 0.0023


Error 54 11586.0000 214.5555
Total 59 16198.9333

La conclusin a partir de este anlisis es que si existe una diferencia


significativa de los tratamientos; sin embargo, no sabemos si esta diferencia se
puede atribuir a efectos principales o a un efecto de interaccin entre los dos
factores, por lo que se hace necesario separar la fuente de variacin de los
tratamientos bajo un modelo que incluya los efectos principales y efecto de
interaccin.

2. Desdoblamiento del efecto de tratamientos en efectos principales y


efectos de interaccin: Los factores incluidos en el arreglo factorial
de tratamientos fueron la fuente de protena, con tres niveles y la
cantidad de protena con dos niveles, por lo que requerimos de 2
subindices, uno para cada factor, mas el subndice para repeticiones.
Nuestro modelo incluyendo la estructura factorial queda como:

Yijk = + i + j + ()ij + ijk ;

i=1,2,3; j=1,2; k=1,2, ,10


Donde

Yijk = Variable de respuesta en la repeticin k del nivel i de la fuente de


protena y el nivel j de la cantidad de protena.

= Media general del experimento.

i = Efecto del nivel i del factor fuente de protena.

j = Efecto del nivel j del factor cantidad de protena.


()ij = Efecto de la interaccin del nivel i de la fuente de protena y el nivel j
de la cantidad de protena.

ijk = Error experimental en la repeticin k en el nivel i de la fuente de


protena y el nivel j de la cantidad de protena.
Para propsitos de estimacin de los efectos las restricciones que deben
imponerse son:
Restriccin para la estimacin de los efectos del factor fuente de protena.

i i = 0
Restriccin para la estimacin de los efectos del factor cantidad de protena

j j = 0
Restricciones para la estimacin de los efectos de interaccin entre los factores
cantidad y fuente de protenas.

i ()ij = 0 j ()jj = 0 ij ()jj = 0


Bajo este conjunto de restricciones las estimaciones de los efectos son:

Media general del experimento es la que corresponde a la media de todas las


observaciones. Para este conjunto de observaciones corresponde a la media
de las 60 observaciones que es igual a 87.86666667 y constituye el primer
estimador independiente del modelo.

Efecto del nivel i de la fuente de protena es igual a la media del nivel i de la


fuente de protena menos la media general. Ya que los niveles del factor fuente
de protena son res, cereal y puerco, entonces son tres estimadores los que
vamos a calcular, pero por la restriccin impuesta su suma debe ser igual a
cero y por ello solo dos sern independientes

Fuente Promedio Efecto


Res 89.6 1.733333333
Soya 84.9 -2.966666667
Puerco 89.1 1.233333333
Suma de
estimadores 1.42109E-14
Efecto del nivel j de la cantidad de protena es la media del nivel j de la cantidad de
protena menos la media general. Para este factor solo se tienen dos niveles, la cantidad
alta y la cantidad baja de protena, por lo que calculamos dos estimadores, pero solo uno
ser independiente, ya que la suma de ambos ser cero:
Cantidad Media Efecto
95.133333
Alta 3 7.266666667
Baja 80.6 -7.266666667
Suma de
efectos 1.42109E-14

Efecto de interaccin del nivel i de la fuente con el nivel j de la cantidad es igual


a la media de las observaciones en el nivel i de la fuente y el nivel j de la
cantidad menos la media del nivel i de la fuente menos la media del nivel j de la
cantidad mas la media general. Para determinar el numero de estimadores
independientes de los efectos de interaccin considere que en cada columna la
suma de los estimadores sobre las hileras debe ser cero y tambin la suma de
los estimadores sobre columnas en cada hilera debe ser cero, de tal manera
que los estimadores independientes en general van a ser:
ab a b + 1=a(b - 1) (b - 1) = (a - 1)( b - 1)
donde a es el numero de niveles del factor A y b es el numero de niveles del factor b.
Como regla general entonces, el numero de efectos independientes que se estiman en
una interaccin es igual al producto del numero de efectos independientes que se
estiman en cada uno de los factores en la interaccin. Para nuestro ejemplo construimos
la tabla de las medias de fuente de protena por cantidad de protena:
Res Soya Puerco
Alto 100 85.9 99.5
Bajo 79.2 83.9 78.7

Con estos promedios y los calculados anteriormente para cada nivel en cada uno de los
factores y la media general podemos estimar los efectos de interaccin:
Res Soya Puerco
Alto 3.13333333 -6.26666667 3.13333333
Bajo -3.13333333 6.26666667 -3.13333333

Como puede ser fcilmente verificado la suma de los estimadores de los


efectos de interaccin suman cero por hileras y columnas.
Con los efectos estimados podemos construir la tabla de anlisis de varianza que
corresponde a este modelo.
F.V. G.L. S.C. C.M. F.C. F.TABLAS Pr > F.C.
Tratamientos 5 4612.93333 922.586667 4.29998964 2.38606985 0.00229944
Fuente 2 266.533333 133.266667 0.62112895 3.16824597 0.54113191
Cantidad 1 3168.26667 3168.26667 14.7666494 4.01954091 0.00032236
Cantidad*fuente 2 1178.13333 589.066667 2.74552046 3.16824597 0.07318788
Error 54 11586.00000 214.555556
Total 59 16198.9333

La primera observacin es que tenemos fuentes de variacin que aun pueden


seguir siendo desdobladas en grados de libertad individuales por medio de
contrastes.
La tabla indica un posible efecto de interaccin entre cantidad y fuente, por lo
que una conclusin final solo puede darse hasta que se haya realizado la
separacin de este efecto en grados de libertad individuales.
Los coeficientes de los contrastes para una interaccin se calculan
multiplicando los coeficientes de los contrastes que corresponden a los efectos
principales incluidos en la interaccin, al establecerlos para todas las
combinaciones de la estructura factorial. Los contrastes para efectos
principales se definieron de la manera ya establecida. As para cantidad de
protena tenemos solo dos niveles, cada uno con tres tratamientos, por lo que
al simplificarse se puede asignar un mas uno al nivel de cantidad alto y un
menos uno al nivel de cantidad bajo. Para fuente de protena se tienen dos
grados de libertad, de tal manera que podemos definir dos contrastes:
El primero separa las fuentes por su origen, en protenas de origen animal (2,
res y cerdo) contra la de origen vegetal ( la soya). Tenemos cuatro
combinaciones de tratamientos con protenas de origen animal y dos
combinaciones con origen vegetal, de tal manera que los coeficientes serian:
Un uno positivo para las protenas de origen animal y un menos 2 para las de
origen vegetal.
El segundo de los contrastes compara las protenas de origen animal, res
contra cerdo. Ya que la de origen vegetal no se incluye en este contraste, los
coeficientes para este nivel de fuente sern ceros. Por otro lado se tienen dos
combinaciones con res y dos combinaciones con cerdo, por lo que los
coeficientes para estos niveles sern: Un mas uno para el nivel res y un menos
uno para el nivel cerdo.
Para los contrastes de interaccin, cada contraste de un factor se multiplica por cada uno
de los contrastes del segundo factor, especificando en cada uno cuales son los contrastes
que se estn considerando en la interaccin. La tabla completa de coeficientes para
todos los contrastes ortogonales es mostrada.
ALTA BAJA
CANTIDAD PROTENA PROTENA
FUENTE Res Soya Puerco Res Soya Puerco
Medias 100 85.9 99.5 79.2 83.9 78.7
Alta vs. Baja 1 1 1 -1 -1 -1
OV vs. OA 1 -2 1 1 -2 1
Res vs.Puerco 1 0 -1 1 0 -1
Cantidad(OV vs OA) 1 -2 1 -1 2 -1
Cantidad(Res vs Puerco) 1 0 -1 -1 0 1

Al aplicar estos contrastes podemos construir la siguiente tabla de anlisis de varianza,


que incorpora todas las previas y los contrastes que se han definido:
F.V. G.L. S.C. C.M. F.C. F.TABLAS Pr > F.C.
Tratamientos 5 4612.93333 922.586667 4.29998964 2.38606985 0.00229944
Fuente 2 266.5333333 133.266667 0.62112895 3.16824597 0.54113191
Veg. Vs. Animal 1 264.0333333 264.033333 1.2306059 4.01954091 0.2722052
Res vs. Cerdo 1 2.5 2.5 0.01165199 4.01954091 0.91443988
Cantidad 1 3168.266667 3168.26667 14.7666494 4.01954091 0.00032236
Cantidad*fuente 2 1178.133333 589.066667 2.74552046 3.16824597 0.07318788
Cantidad*(Veg vs. Anim) 1 1178.133333 1178.13333 5.49104091 4.01954091 0.02282668
Cantidad*(Res vs. Cerdo) 1 0 0 0 4.01954091 1
Error 54 11586.00000 214.555556
Total 59 16198.93333

El contraste de interaccin (Res Vs. Cerdo)*Cantidad tiene una suma de


cuadrados que es igual a cero, lo que indica que res y cerdo tienen ganacias
paralelas con respecto a las cantidades de protena, concluyndose que el
efecto de estas fuentes es independiente de la cantidad. De esta manera
podemos hacer inferencias acerca del contraste res vs. cerdo. El contraste Res
vs. Cerdo no es significativo, lo que indica que para estos dos niveles del factor
fuente no hay diferencia significativa (89.6 para Res vs. 89.1 para cerdo). Para
el contraste cantidad de protena en la dieta no podemos separarlo de la fuente
vegetal, ya que su calculo esta basado en las tres fuentes; sin embargo ya que
no existe diferencia entre las fuentes de protena animal, su promedio es un
estimador adecuado del comportamiento de la protena de origen animal. La
discusin del factor cantidad de protena en las fuentes de origen animal se
discutir mas adelante. La siguiente figura muestra grficamente el
comportamiento de las ganancias promedio de peso de acuerdo a la cantidad
de protena para cada una de las fuentes de origen animal.

El contraste de interaccin (origen animal vs origen vegetal)*cantidad resulto


ser significativo, por lo que se concluye que la cantidad de protena tiene un
efecto diferente para la fuente vegetal y el promedio de la fuente de origen
animal. La significancia de este contraste obliga a evaluar el efecto de la
cantidad de protena separadamente para cada fuente. Para la fuente de origen
vegetal el promedio de la cantidad alta de protena es 85.9 en tanto que para la
cantidad baja de protena es 83.9, siendo entonces el efecto de 2 unidades.
Para la fuente de origen animal, el promedio de la cantidad alta de protena es
99.75 en tanto que para la cantidad baja de protena es de 78.95, por lo que el
efecto es de 20.8 unidades. La siguiente figura nos muestra el efecto de
interaccin entre fuente y cantidad de protena, para el contraste (origen
vegetal vs origen animal)*cantidad:
ARREGLOS FACTORIALES 2K

Estos arreglos se caracterizan por tener incluidos K factores cada uno en dos
niveles. Estos arreglos son de gran inters en los diversos campos de la
ciencia y la ingeniera, donde la experimentacin es la principal herramienta de
investigacin. Esto se debe a que constituye una gran diversidad de arreglos
de tratamientos que permiten investigar una gran cantidad de factores con
pocas corridas experimentales, principalmente en la fase de exploracin de
impactos de las diferentes variables independientes sobre las variables de
respuesta. Tambin son de inters porque constituyen la base para construir
diseos experimentales en la fase de optimizacin de procesos, como son los
diseos de metodologa de superficie de respuesta y los arreglos ortogonales
de Taguchi.

Nomenclatura:
La nomenclatura particular para estos arreglos permite el manejo mas eficiente
de las combinaciones de tratamiento. Con la nomenclatura simplificada tambin
se logra un procedimiento para construir estos arreglos.
A cada uno de los factores se les asocia una letra mayscula latina,
empezando con la letra A y continuando as hasta los K factores que se
incluyen en el arreglo. Entonces tenemos los factores A, B, C,,K.
Cada uno de los factores solo tiene dos niveles, a los que se les
denomina el nivel bajo y el nivel alto. Esta nomenclatura es arbitraria para
factores cualitativos no ordinales, pero para factores cuantitativos o cualitativos
ordinales estos se asocian de acuerdo a la magnitud del nivel en el factor. Los
niveles se representan con la letra minscula correspondiente al factor,
denotando el nivel bajo con un subndice cero y el nivel alto con un subndice
uno. De esta manera los nieles del factor A son a 0 y a1, a los cuales
genricamente se les denomina el nivel bajo del factor A y el nivel alto del factor
A. De manera equivalente se sigue esta notacin para los niveles de los K
factores.

Construccin de los arreglos factoriales 2K:


Los principios de construccin que se han revisado para los arreglos factoriales
en general se aplican tambin para estos arreglos. Lo especial en el proceso va
ser el orden estndar en que se acomodan las combinaciones de tratamiento.
Este orden estndar consiste en que los niveles de los factores se colocan en
columnas, empezando por el factor A, y as sucesivamente hasta el factor K.
Los niveles del primer factor irn variando de 2 0 = 1 en 1, es decir los niveles
del factor A van alternndose de uno en uno, empezando con el nivel bajo
seguido del nivel alto, y as sucesivamente hasta el numero de combinaciones
de tratamiento. En la segunda columna los niveles del factor irn variando de
21= 2 en 2, igualmente empezando con el nivel bajo y seguido por el nivel alto.
Este proceso continuara hasta llegar al factor K., donde las primeras 2 K-1
combinaciones de tratamiento llevaran el nivel bajo del factor K y la mitad
restante el nivel alto del factor K..
Como un ejemplo considere primero la construccin del arreglo 2 2 , con
los factores A y B.. En este arreglo factorial tenemos 4 combinaciones de
tratamiento (22 ) . Por esta razn empezamos con la primer columna hasta
completar cuatro combinaciones, alternando el nivel bajo y el nivel alto del
factor A:
a0
a1
a0
a1
En la segunda columna del arreglo factorial, los niveles del factor B van ir
variando de 2 en 2, de tal forma que se generan las 4 combinaciones, como se
muestra a continuacin:
a0 b0
a1 b0
a0 b1
a1 b1
Si deseamos la construccin de una serie 2 el procedimiento es el
mismo, pero debemos completar hasta 8 combinaciones bajo el mismo
proceso, y al final agregar los niveles del factor C, que van a variar de 4 en 4,
como a continuacin se muestra.
a 0 b 0 c0
a1 b0 c0
a0 b1 c0
a1 b1c0
a 0 b 0 c1
a1 b0 c1
a0 b1 c1
a1 b1c1
Este proceso se seguira para cualquier valor de K. Sin embargo, a medida
que K aumenta, mas tardada es la descripcin de las combinaciones. Para una
mayor simplificacin, los subndices de las combinaciones se prefiri pasarlo
como exponente, que al aplicarlo tiene simplemente el efecto de desaparecer
la letra de la combinacin cuando el nivel es bajo y de dejarla cuando el nivel
es alto. En la primera combinacin todas las letras desapareceran, quedando
solamente un 1, que para distinguirlo como combinacin este se coloca entre
parntesis. Bajo estas reglas se tiene:
Arreglo 22 :
(1)
a
b
ab
Con esta notacin es mas directa la generacin de la siguiente serie, pues solo
se duplica y a cada combinacin duplicada se multiplica por el nuevo factor. As
para un 23 se tiene:
(1)
a
b
ab
(1)*c = c
a*c = ac
b*c = bc
ab*c = abc
Ejemplo: Genere una serie 25:
(1) c d cd e ce de cde
a ac ad acd ae ace ade acde
b bc bd bcd be bce bde bcde
ab abc abd abcd abe abce abde abcde

Para la interpretacin de estas combinaciones solo debemos recordar que de


los factores que entran en el factorial, las letras que aparecen en la
combinacin son los que corresponden a un nivel alto del factor, mientras que
las que no aparecen, corresponden a los factores que se encuentran a un nivel
bajo. Debemos tener presente siempre que la combinacin (1) es aquella en la
que todos los factores se encuentran a un nivel bajo.
Contrastes en las series 2K :
Los contrastes, aparte de que son la herramienta para el anlisis de los datos,
van a constituir un elemento crucial en las tcnicas de factoriales fraccionados
y bloques incompletos en estos arreglos.
Lo primero que debemos puntualizar es que los contrastes deben estar
asociados a la estimacin de efectos. En un arreglo 2 K podemos estimar los
efectos principales de cada uno de los factores y en adicin todas las posibles
interacciones de 2, 3, ., K factores.
Los efectos principales van a ser K.
Las interacciones de 2 factores van a ser KC2 .
Las interacciones de 3 factores van a ser KC3 .
Y as sucesivamente hasta llegar a una sola interaccin de los K factores.
As por ejemplo en la serie 25 los efectos que se van a poder estimar son:
5 efectos principales.
10 interacciones de 2 factores.
10 interacciones de 3 factores.
5 interacciones de 4 factores.
1 interaccin de 5 factores.
Como podemos ver en este ejemplo, los efectos que podemos estimar, en
numero corresponden a los grados de libertad de los tratamientos.
Lo importante en estos arreglos es poder construir la tabla de contrastes, que
por el lado de las hileras va llevar como encabezado a los tratamientos y por el
lado de las columnas va a llevar los efectos que se van a estimar. El numero de
columnas va ser igual al numero de hileras menos una. Los coeficientes que se
van a emplear para construir los contrastes son siempre el -1 para el nivel bajo
del factor y el +1 para el nivel alto del factor.
Ejemplo: Construya la tabla de contrastes para la serie 2 3 :
A B AB C AC BC ABC
(1) -1 -1 +1 -1 +1 +1 -1
a +1 -1 -1 -1 -1 +1 +1
b -1 +1 -1 -1 +1 -1 -1
ab +1 +1 +1 -1 -1 -1 +1
c -1 -1 +1 +1 -1 -1 +1
ac +1 -1 -1 +1 +1 -1 -1
bc -1 +1 -1 +1 -1 +1 -1
abc +1 +1 +1 +1 +1 +1 +1

Para cualquier serie 2K su tabla de contrastes tiene una propiedad muy


interesante que se deriva de sus coeficientes: Al elevar al cuadrado o cualquier
potencia par, cualquier columna genera un elemento neutro, es decir una
columna de puros unos. Esto implica que si multiplicamos las columnas
correspondientes a los estimadores del factor A y la correspondiente a la
interaccin AB, entonces obtenemos A2B = B, ya que la potencia par a la que
esta elevada la columna A la transforma a un elemento neutro, que multiplicado
por la columna B, genera el mismo resultado.

Ejemplos numricos de arreglos factoriales 2 K:


1. Un ingeniero esta interesado en el efecto que tienen la rapidez de
corte (A), la configuracin (B) y el ngulo de corte (C) sobre la
duracion de una herramienta. Se eligen dos niveles de cada factor y
se realiza un arreglo factorial 23 con 3 replicas. Los resultados se
muestran a continuacin. Analice los resultados de este experimento
y seleccione la combinacin para mejorar la durabilidad de la
herramienta.

Combinacion 1 2 3
(1) 22 31 25
a 32 43 29
b 35 34 50
ab 55 47 46
c 44 45 38
ac 40 37 36
bc 60 50 54
abc 39 41 47

2. En la industria mueblera la calidad de acabado de las piezas diseadas


es una caracterstica importante. Tres factores van a ser probados , cada
uno en dos niveles, para evaluar su impacto en el acabado. El factor A es el
tipo de madera (a0 = roble, a1 = pino) ; el factor B es la tasa de alimentacin
(b0 = 2 m/min, b1 = 4 m/min); el factor C es la profundidad de corte (c 0 = 1
mm , c1 = 3 mm). Para cada combinacin de tratamiento tres repeticiones
fueron llevadas a cabo usando un diseo completamente aleatorizado. La
siguiente tabla muestra el acabado para los 8 tratamientod- Entre mas
grande el valor mas aspero es el acabado.
Combinacion 1 2 3
(1) 6 8 9
a 10 16 15
b 18 12 15
ab 12 9 10
c 20 26 29
ac 34 28 32
bc 36 44 46
abc 25 22 24
Analice los datos y seleccione la mejor combinacin para mejorar el acabado.

Estimacin de los efectos:


Mediante la informacin que se obtiene en el anlisis por contrastes
ortogonales en estos arreglos factoriales, podemos calcular una ecuacin de
regresin lineal mltiple en los diferentes efectos principales e interacciones en
unidades estandarizadas, es decir, considerando que los niveles de los factores
son menos uno y mas uno.
El cambio promedio en respuesta entre el nivel alto y el nivel bajo de un factor
es la diferencia en los promedios del nivel alto menos el del nivel bajo. Este
cambio promedio puede obtenerse a partir de la estimacin del contraste (suma
de los productos de los coeficientes del contraste por sus correspondientes
medias) al considerar que cada nivel del factor tiene la mitad de las medias
incluidas en cada uno de los niveles. Entonces el cambio promedio en
respuesta entre los niveles de un factor se calcula como el cociente del
contraste entre la mitad del numero de combinaciones en el arreglo factorial
(2k-1).
El coeficiente de regresin se calcula como la pendiente de una recta, es decir
el cambio en la variable dependiente dividido por el cambio en la variable
independiente. El cambio en la variable dependiente el es cambio promedio en
la respuesta entre los dos niveles y el cambio en la independiente es del valor
-1 al valor +1, es decir dos unidades de cambio. De esta manera el coeficiente
de regresin se estima dividiendo el cambio promedio en la respuesta entre
dos.
Debemos puntualizar dos situaciones:
1. Estos clculos son igualmente validos para los efectos de interaccin.
2. Estos clculos pueden tambin ser llevados a cabo para factores
cualitativos, pero carecen completamente de sentido al interpretarlos
en unidades originales.

CONFUSIN EN LOS ARREGLOS FACTORIALES 2K


La confusin es una consecuencia que se presenta en la estimacin de efectos
factoriales al no llevar a cabo la totalidad de las combinaciones en un arreglo
factorial y consiste en que un contraste estima la combinacin de dos o mas
efectos factoriales.
Las combinaciones de tratamiento se dividen con dos objetivos bsicos:
1. Generar bloques incompletos.
2. Generar factoriales fraccionados.
Los bloques incompletos se aplican cuando se tienen muchos factores que se
van a investigar y consecuentemente las combinaciones que se deben probar
son muchas y si las unidades experimentales no son homogneas, entonces
probablemente no se puedan lograr bloques suficientemente grandes para
generar un diseo en bloques completos al azar, y de ah que surja la
necesidad de los bloques incompletos. En este caso se pretende confundir el
efecto de bloques con un efecto que no sea de inters en el anlisis de los
datos de un arreglo factorial, como pueden ser las interacciones de mas alto
orden.
Los factoriales fraccionados se procuran cuando no se tienen suficientes
recursos para llevar a cabo todas las combinaciones de un arreglo factorial
completo, o bien cuando los efectos que se desean estimar son aquellos de
mas bajo orden (efectos principales e interacciones de dos factores). Al
suponer que los efectos de mas alto orden no son de importancia en la variable
de respuesta, estos se pueden confundir con los de mas bajo orden, y sin
alterar demasiado la calidad de las estimaciones, estas se pueden hacer con
un numero menor de combinaciones de las que incluye el arreglo factorial
completo.
Bloques incompletos:
El numero de bloques para llevar a cabo una replica del arreglo factorial
2K debe ser una potencia de 2, llmele P, donde P<K.. Entonces P puede tomar
los valores 1,2,..,K-1. Sin embargo, los valores mas bajos de P son los que mas
frecuentemente se emplean en la experimentacin.
Cuando P=1 implica que solo se requieren dos bloques, de tal manera
que se tiene asociado un solo grado de libertad para bloques, y as un solo
efecto es el que debe confundirse con bloques. En este caso no cabe duda de
que el efecto que se selecciona para ser confundido con bloques es el de mas
alto orden de interaccin, pues este es el de menor importancia en general.
Entonces la totalidad de las combinaciones del arreglo factorial completo se
dividen de acuerdo a los signos del contraste de la interaccin de mas alto
orden. Entonces una mitad de las combinaciones se asigna a uno de los
bloques y la otra mitad al segundo bloque. De esta manera el contraste que
estima la interaccin de mas alto orden estar estimando adicionalmente el
efecto de los bloques.
Ejemplo: Considere que se desea llevar a cabo un arreglo factorial 2 4 en dos
bloques. Se desea confundir la interaccin de los 4 factores con el efecto de los
bloques. Cual es la distribucin de las combinaciones del arreglo factorial a los
bloques. La siguiente tabla hace la distribucin de los tratamientos en los dos
bloques:
Combn. A B C D ABCD Bloque
(1) -1 -1 -1 -1 +1 1
a +1 -1 -1 -1 -1 2
b -1 +1 -1 -1 -1 2
ab +1 +1 -1 -1 +1 1
c -1 -1 +1 -1 -1 2
ac +1 -1 +1 -1 +1 1
bc -1 +1 +1 -1 +1 1
abc +1 +1 +1 -1 -1 2
d -1 -1 -1 +1 -1 2
ad +1 -1 -1 +1 +1 1
bd -1 +1 -1 +1 +1 1
abd +1 +1 -1 +1 -1 2
cd -1 -1 +1 +1 +1 1
acd +1 -1 +1 +1 -1 2
bcd -1 +1 +1 +1 -1 2
abcd +1 +1 +1 +1 +1 1

El siguiente caso es cunado P=2, es decir cuando se tienen 2 2 bloques, lo que


representa cuatro bloques, teniendo as tres grados de libertad para bloques y
en cada bloque debe ir una cuarta parte del numero total de combinaciones en
el arreglo factorial. Los efectos que deben ser confundidos sern dos de ellos
independientes y el tercero lo constituir la interaccin de los dos
independientes. El objetivo en la seleccin de los independientes sern dos:
Primero que sean de alto orden y segundo, que la interaccin de los dos
tambin sea de alto orden. Para obtener la interaccin de dos efectos recuerde
que todas las letras de ambos efectos deben ser multiplicadas y aquellas que
queden con una potencia par se neutralizan y por lo tanto se anulan, quedando
solo aquellas con potencia impar.
Ejemplo: Considere que se desea correr un arreglo factorial 2 5 en 4 bloques.
Ya que son 4 bloques se deben confundir 3 efectos, dos de los cuales deben
ser independientes y el tercero resultara de la interaccin de ambos. El efecto
de mas alto orden es la interaccin de los 5 factores, es decir ABCDE. Si
seleccionamos una interaccin de 4 factores, entonces la interaccin va a
resultar en un efecto principal, lo que es totalmente reprobable. Debemos
entonces pensar en una interaccin de tres factores, pero la interaccin con la
de 5 va a resultar en una interaccin de 2 factores, lo cual tambin, en la
mayora de las ocasiones es reprobable. Esto nos lleva entonces a la
conclusin de que no es buena seleccin la interaccin de 5 factores. La
siguiente opcin es seleccionar la interaccin de 4 factores, de tal forma que
uno de los 5 factores no esta incluido. Si combinamos dicho factor con dos de
los incluidos en la de cuatro factores, originara una interaccin de 3 factores.
Esto es, suponiendo se selecciona la de 4 factores ABCD, el E no esta incluido.
El factor E lo combinamos con AB y resulta en ABE. La interaccin de ambas
selecciones resulta en una interaccin de tres factores. En las interacciones
seleccionadas, resultara en CDE. Este es el orden mas alto de efectos que
pueden ser considerados para lograr separar las combinaciones del arreglo 2 5
en 4 bloques de 8 combinaciones cada uno. La separacin esta basada ahora
en los signos de dos de las tres interacciones confundidas. A continuacin se
muestra el arreglo factorial ordenado por bloques de acuerdo a las
interacciones previamente seleccionadas.

Combinacion A B C D E ABE CDE Bloque


1 -1 -1 -1 -1 -1 -1 -1 1
ab 1 1 -1 -1 -1 -1 -1 1
cd -1 -1 1 1 -1 -1 -1 1
abcd 1 1 1 1 -1 -1 -1 1
ace 1 -1 1 -1 1 -1 -1 1
bce -1 1 1 -1 1 -1 -1 1
ade 1 -1 -1 1 1 -1 -1 1
bde -1 1 -1 1 1 -1 -1 1
a 1 -1 -1 -1 -1 1 -1 2
b -1 1 -1 -1 -1 1 -1 2
acd 1 -1 1 1 -1 1 -1 2
bcd -1 1 1 1 -1 1 -1 2
ce -1 -1 1 -1 1 1 -1 2
abce 1 1 1 -1 1 1 -1 2
de -1 -1 -1 1 1 1 -1 2
abde 1 1 -1 1 1 1 -1 2
c -1 -1 1 -1 -1 -1 1 3
abc 1 1 1 -1 -1 -1 1 3
d -1 -1 -1 1 -1 -1 1 3
abd 1 1 -1 1 -1 -1 1 3
ae 1 -1 -1 -1 1 -1 1 3
be -1 1 -1 -1 1 -1 1 3
acde 1 -1 1 1 1 -1 1 3
bcde -1 1 1 1 1 -1 1 3
ac 1 -1 1 -1 -1 1 1 4
bc -1 1 1 -1 -1 1 1 4
ad 1 -1 -1 1 -1 1 1 4
bd -1 1 -1 1 -1 1 1 4
e -1 -1 -1 -1 1 1 1 4
abe 1 1 -1 -1 1 1 1 4
cde -1 -1 1 1 1 1 1 4
abcde 1 1 1 1 1 1 1 4

Esta misma tcnica se seguira para un factorial con un mayor numero de


factores o con mas bloques incompletos.

Antes de finalizar esta seccin solo resta recalcar que la confusin para
bloques incompletos se emplea para confundir algunos efectos con el efecto de
los bloques, pero el arreglo factorial se correra de manera completa.

Factoriales fraccionados:

La confusin tambin se emplea cuando se desea seleccionar una parte del


arreglo factorial 2K completo, debido a que puede ser excesivo los recursos
requeridos en esto comparado con los efectos que se desean estimar. En
trminos generales, los efectos que se desean estimar corresponden a los
efectos principales y las interacciones de dos factores, en tanto que el resto de
los efectos resultan de escasa o nula importancia. Bajo estas circunstancias se
prefiere seleccionar solo una fraccin del arreglo factorial tal que permita la
estimacin de estos efectos y un esquema de confusin de estos efectos
(estructura de alias) razonable tal que las estimaciones sean confiables.
Partimos, como en bloques incompletos, de un efecto que permite
fraccionar en dos mitades el arreglo factorial completo. A tal efecto le
denominamos el generador de la fraccin y se denota con la letra I. Como en el
bloqueo, cuando se trata de una fraccin mitad, el generador debe ser la
interaccin de mas alto orden. Entonces en base a esta interaccin las
combinaciones de tratamiento quedan divididas en dos mitades, una con el
signo positivo en la interaccin y la otra con el signo negativo. Es realmente
indistinto cual se seleccione, reflejndose esto en el signo del generador.

Ejemplo: Suponga que se desea llevar a cabo una fraccin mitad de un arreglo
factorial 25, seleccionando como el generador la interaccin de mas alto orden.
Defina para tal mitad la estructura de alias.

En este arreglo factorial se consideran 5 factores, que denominaremos A, B, C,


D y E. El arreglo factorial completo incluye 32 combinaciones de tratamiento,
por lo que una mitad deber contener 16 combinaciones. La interaccin de mas
alto orden que se va a seleccionar como el generador es ABCDE=I.
Para construir la fraccin mitad existen 3 mtodos:
1. El arreglo factorial completo es generado, y para cada combinacin
se obtienen los signos de la interaccin mas alta. Se selecciona
como la fraccin mitad aquellas combinaciones que tengan el signo
positivo.
2. Generar el arreglo con un factor menos que el deseado, con lo cual
se tiene la fraccin mitad, agregando los niveles del ultimo factor
como la interaccin de los que ya estn definidos.
3. Mediante la operacin modulo 2 de la expresin definida por
L = X1a1 + X2a2 + X3a3 + X4a4 + X5a5
Donde las Xi toman el valor cero o uno dependiendo si el factor se encuentra
en el generador y ai toma el valor cero o uno dependiendo si el factor se
encuentra en la combinacin de tratamiento.
La estructura de alias se define al multiplicar el generador en ambos lados de la
igualdad por el por el efecto cuyos alias se desean conocer.

Resolucin del diseo:


Es el numero de factores en la interaccin de mas bajo orden que forma parte
del generador.

ARREGLO EN PARCELAS DIVIDIDAS:

Es un arreglo multifactorial en el que cada uno de los factores a investigar


requieren de diferente tamao de unidad experimental para ser aplicado. As
entonces, en un proyecto de investigacin podemos reconocer, desde el
momento de la planeacion el factor que debe aplicarse a parcela grande y cual
debe aplicarse a parcela pequea. Esta decisin implica un aspecto netamente
practico. Por ejemplo, suponga que se desean probar en un experimento
agrcola diferentes camas de siembra y diferentes niveles de fertilizacin. Si la
aplicacin del factor cama de siembra requiere de maquinaria, entonces, este
factor requerira de una unidad experimental de mayor tamao que aquella
para aplicar los diferentes niveles de fertilizacin. Entonces el experimento
debe ser planeado como un arreglo en parcelas divididas, con el factor de
parcela grande la cama de siembra y como factor de parcela pequea la
fertilizacin. El experimento incluira la aplicacin de un nivel de cama de
siembra en una parcela grande, la cual seria dividida para la aplicacin de los
diferentes niveles del factor fertilizacin.
En este arreglo debe tambin definirse en la planeacion del experimento cual
seria el arreglo geomtrico de las parcelas grandes, ya que puede ser
completamente al azar, en bloques al azar (el mas comn) o en cuadro latino.
Se supone que la parcela grande es homognea, y por lo tanto los niveles del
factor de parcela pequea se pueden distribuir completamente al azar dentro
de cada parcela grande. Debemos entonces reconocer el arreglo geomtrico
de las repeticiones de parcelas grandes, las mismas parcelas grandes y las
subparcelas dentro de cada parcela grande.
El modelo entonces debe incorporar el arreglo geomtrico de las repeticiones
de parcela grande con su correspondiente error aleatorio, con el cual se
probara el efecto del factor de parcela grande; debe incorporar tambin el
diseo completamente al azar del as subparcelas, en el que se incluira el
factor de subparcela, la interaccin del factor de parcela grande son subparcela
y el error experimental con el que se probaran estos dos ltimos efectos.

PARCELAS DIVIDIDAS EN UN DISEO COMPLETAMENTE AL AZAR:


Si las parcelas grandes son muy similares, entonces un arreglo geomtrico
completamente al azar puede ser utilizado, por lo que el modelo quedara
definido como:

Yijk = +i+j(i)+k+()ik+ijk
El subndice i esta asociado a los niveles del factor de parcela grande, por lo
que i=1,2,,a,
El subndice j esta asociado a las repeticiones de parcela grande, por lo que
j=1,2,,r.
El subndice k esta asociado a los niveles del factor de subparcela, por lo que
k=1,2,,b.
El modelo indica entonces que se tienen a niveles del factor de parcela
principal con r repeticiones en cada nivel. El error de parcela grande esta

representado por el componente j(i) el efecto de la repeticin anidada en el


nivel i del factor de parcela principal.
Los grados de libertad para este modelo quedan distribuidos de la siguiente
manera:

Fuente de variacin G.L.


Parcelas Grandes ar 1

Factor A a1
Error (a) a*(r - 1)

Subparcelas: ar*( b - 1 )

Factor B b1
Interaccin A*B ( a - 1 ) *( b - 1 )
Error (b) a*( b - 1)*( r - 1 )

Total (abr) - 1
Este modelo de parcelas divididas es muy frecuentemente empleado para
analizar datos que provienen de experimentos con mediciones repetidas al
considerar el factor tiempo como el factor de subparcela.
En algunas situaciones se sugiere emplear este arreglo experimental cuando la
precisin con que se desean llevar a cabo la comparacin de las medias no es
la misma para amos factores; se seleccionara como factor de subparcela aquel
en el que se quieren comparaciones mas precisas.

PARCELAS DIVIDIDAS EN UN DISEO EN BLOQUES COMPLETOS AL


AZAR:

Al aplicar este arreglo suponemos que las repeticiones e parcela principal


tienen un gradiente de variacin que se desea controlar como variable de
bloqueo. Entonces si el factor de parcela principal tiene a niveles, cada bloque
debe contener a unidades experimentales, donde se distribuyen al azar los
niveles del factor de parcela principal. Supngase que se tienen r bloques,
quedando el modelo descrito por

Yijk = +i+j+ ()jj+k+()ik+ijk


Donde ahora j constituye el efecto de los bloques y su interaccin con el
factor A de parcela grande constituye el error de parcela grande. El
desdoblamiento de los grados de libertad se presenta en la siguiente tabla:
Fuente de variacin G.L.
Parcelas Grandes ar - 1

Factor A a-1
Factor de bloqueo r-1
Error (a) ( a - 1 )*( r - 1 )

Subparcelas: ar*( b - 1 )

Factor B b-1
Interaccin
B*bloqueo ( r - 1 )*( b - 1 )
Interaccin A*B ( a - 1 ) *( b - 1 )
Error (b) ( a - 1 )*( b - 1 )*( r - 1 )

Total (abr) - 1
PARCELAS DIVIDIDAS EN UN DISEO EN CUADRO LATINO:
Si las parcelas principales muestran variacin en dos gradientes de bloqueo,
por hileras y columnas, entonces debe adoptarse un arreglo geomtrico de las
parcelas principales en cuadro latino. Este arreglo debe ser representado en el
modelo como:

Yijk = +i+j+k+ ()jjk+l+()il+ijkl


El subndice j esta asociado al efecto de las hileras y el subndice k al efecto de
las columnas. La interaccin de hileras columnas y tratamientos de parcela
principal es el componente de error para parcela grande.
El desdoblamiento de los grados de libertad queda como:
Fuente de variacin G.L.
Parcelas Grandes a^2 - 1

Factor A a-1
Factor de hileras a-1
Factor de columnas a-1
Error (a) ( a - 1 )*( a - 2 )

Subparcelas: a^2*( b - 1 )

Factor B b-1
Interaccin A*B ( a - 1 ) *( b - 1 )
Error (b) a * ( a - 1 )*( b - 1 )

Total (a^2)*b - 1

De las principales desventajas que se tienen con el arreglo en parcelas


divididas es la estimacin del error estndar de las diferencias de las medias,
para poder hacer las comparaciones de medias, que son diferentes para cada
factor y su interaccin. Se recomienda que en caso de ser necesarias las
comparaciones estas se hagan en algn paquete que las arroje como parte de
la salida del anlisis (como por ejemplo el SAS) o en su defecto, consultar los
errores estndar de las diferencias en una referencia de diseos
experimentales para poder aplicarlas manualmente. Desde luego este anlisis
es mas complicado cuando la interaccin resulta ser significativa.

Ejemplos:
2. Se llevo a cabo un experimento bajo un arreglo en parcelas divididas para probar
el efecto de 3 hibridos (utilizado como factor de parcela principal) acomodados
en un diseo en bloques completos al azar. Dentro de cada parcela grande se
acomodaron bajo un diseo completamente al azar las 4 densidades (10,15,20 y
25 plantas por hilera). Los datos se muestran a continuacin:
BLOQUE HIBRIDO DENSIDAD RESPUESTA
1 1 10 40.7
1 1 15 24.2
1 1 20 16.1
1 1 25 11.2
1 2 10 39.4
1 2 15 31.3
1 2 20 17.9
1 2 25 14.8
1 3 10 68.7
1 3 15 26.2
1 3 20 20.5
1 3 25 18.9
2 1 10 37.8
2 1 15 44.4
2 1 20 17.6
2 1 25 12.7
2 2 10 47.8
2 2 15 34.5
2 2 20 30.5
2 2 25 17.3
2 3 10 56.2
2 3 15 48.1
2 3 20 28.2
2 3 25 26.2
3 1 10 32.9
3 1 15 27.8
3 1 20 19.9
3 1 25 14.5
3 2 10 44.4
3 2 15 25.6
3 2 20 22.5
3 2 25 17.7
3 3 10 44.8
3 3 15 41.1
3 3 20 30
3 3 25 19.2
4 1 10 43.1
4 1 15 34.1
4 1 20 20.1
4 1 25 15.4
4 2 10 49
4 2 15 50.4
4 2 20 25.2
4 2 25 18.7
4 3 10 59.3
4 3 15 46
4 3 20 24.7
4 3 25 22
El anlisis de varianza de este experimento se muestra en la siguiente
tabla:

F.V. G.L. S.C. C.M. Fc Ft (.05) P-Valor

Parcela Grande 11 1335.6 121.418182

Bloques 3 408.985 136.328333


Hibridos 2 881.40875 440.704375 58.4924927 5.14325285 0.000116117
Hibridos*Bloques 6 45.20625 7.534375

Subparcela 36 7653.93 212.609167

Densidad 3 6429.38833 2143.12944 56.8953538 2.96035132 8.46431E-12


Debsidad*Hibrido 6 207.507917 34.5846528 0.91814615 2.45910844 0.497266439
Error (b) 27 1017.03375 37.6679167

Total 47 8989.53

De donde se puede concluir que los efectos de hibrido y densidad son


independientes, por lo que cada uno de ellos puede ser analizado
independientemente.
Por un lado, las medias de los hibridos estn dadas por
Hibidos 1 Hibrido 2 Hibrido 3
Media 25.78125 30.4375 36.25625

Y el error estndar de la diferencia de las medias esta dado por:


0.666
Por lo que a un nivel de confianza del 95 % las tres medias resultan
estadsticamente diferentes, siendo entonces el mejor hibrido el numero 3.

Por otro lado el efecto de la densidad puede ser evaluado mediante una
regresin:
Respuesta = 66.61 2.045*Densidad
Con un coeficiente de determinacin de 0.835 y un error estndar de 7.68.
De estos resultados se desprende entonces que el mejor hibrido es el 3 que
debe cultivarse bajo la densidad mas baja evaluada.

METODOLOGIA DE TAGUCHI:
La metodologa de Taguchi es sinonimo de ingeniera de calidad y tiene por
objetivo disear calidad en todo producto y su correspondiente proceso.
Taguchi introduce una filosofa en la que la calidad es medida por la desviacin
del valor de una caracterstica con respecto a su valor ptimo. Factores no
controlables (ruido) ocasionan tales desviaciones. La eliminacin de los
factores de ruido es impractico y muy a menudo imposible, de aqu que el
mtodo de Taguchi procura minimizar los efectos de ruido. A travs de esta
metodologa se determina el nivel ptimo de los factores controlables
importantes basados en el concepto de robustez. El objetivo es crear un diseo
de producto / proceso que sea lo menos sensible posible a las fluctuaciones de
los factores de ruido (robusto) al establecer los factores controlables de
impacto en los niveles ptimos.
El diseo de parmetros usa la idea fundamental del procedimiento en dos
pasos para lograr la calidad:
1. Los niveles de los parmetros que minimizan la variabilidad de la
caracterstica de calidad son seleccionados. En esta etapa se genera
un diseo que es robusto con respecto a las fuentes incontrolables
de variacin.
2. Los parmetros que tienen un efecto en el valor promedio de la
caracterstica de calidad, pero ningn impacto en la variabilidad, son
identificados. Estos parmetros conocidos como factores de ajuste,
son usados para mover la caracterstica de calidad al valor otimo sin
incrementar varianza.
FUNCIN DE PERDIDA:
Para evaluar la calidad en trminos monetarios, Taguchi crea la funcin de
perdida, la cual estima el costo que la sociedad tiene que pagar por una
desviacin de la caracterstica de calidad en un producto con respecto a su
valor blanco. En esta funcin se supone que la perdida es proporcional al
cuadrado de la desviacin de la caracterstica de calidad con respecto a su
valor blanco. Esta funcin se define de acuerdo al tipo de caracterstica de
calidad:
Caractersticas de calidad del tipo Nominal es mejor:
L(y) = K ( y m )2
L(y) es la funcin de perdida evaluada en el valor y de la caracterstica de
calidad.
K es una constante de proporcionalidad.
m es el valor optimo de la caracterstica de calidad.
El valor esperado de la funcin de perdida para este tipo de caractersticas de
calidad esta dado por:
K*(Varianza(y) + (media(y)-m) 2)

Caractersticas de calidad del tipo mas pequeas es mejor:


L(y) = K ( y 0)2
L(y) = K ( y )2
El valor esperado de la funcin de perdida es
K*(Media( y2))

Caractersticas de calidad del tipo mayor es mejor:


L(y) = K ( 1/y 0)2
L(y) = K (1/ y )2
El valor esperado de la funcin de perdida es
K*(Media( 1/y)2)

Ejemplo numrico: Un producto tiene la especificacin 1.5 0.02 en una


caracterstica de calidad. Al exceder justo estos limites el costo es de 50. 10
productos son seleccionados y se les mide su valor en dicha caracterstica:
1.53 , 1.49, 1.50, 1.49 , 1.48 , 1.52 , 1.54 , 1.53, 1.51 , 1.52
Encuentre el promedio de perdida por unidad de producto.
El procedimiento para encontrar el valor de la constante K es sustituir los datos
conocidos en la funcin de perdida:
L(1.52) = L(1.48) = 50
y-m = 0.02
50 = K*(.02)
K = 50/0.0004 = 125000
La funcin de perdida promedio esta dada por
E{L(y)} = 125000(0.000369 + 0.000121) = 61.25
Razn Seal a Ruido (RSR):
Taguchi define esta variable para el anlisis de los datos obtenidos de sus
arreglos ortogonales. Incluye, como su nombre lo indica la razn de dos
componentes:
El termino seal representa el componente deseable, que preferiblemente
estar cercano al valor optimo de la caracterstica de calidad.
El termino ruido representa el componente indeseable y es una medida de la
variabilidad de la caracterstica de calidad, la cual preferiblemente debe estar
cercana a cero.
El valor optimo de la razn seal a ruido debe ser tan grande como sea posible,
sin importar el tipo de caracterstica de calidad de que se trate.
RSR para variables de calidad del tipo nominal es mejor:
Para este tipo de caractersticas de calidad debemos distinguir dos casos:
1. Varianza no relacionada a la media: Bajo esta situacin el principal
inters es reducir la varianza de la caracterstica de calidad. La RSR
esta definida por
Z = log(varianza).
2. Varianza relacionada a la media:
Z = 10 log(media/desv.est)
RSR para variables de calidad del tipo mas pequea es mejor:
Z = -10 log (Media(y))
RSR para variables de calidad del tipo mas grande es mejor:
Z = -10 log (Media(1/y))

Ejemplos:
1. Una firma de ingeniera de construccin esta llevando a cabo
estudios de la firmeza de tensin de varias formulaciones de
concreto. Seis variables de inters han sido identificadas y los niveles
a los que han sido probados son mostrados en la siguiente tabla:
Variable Nivel 1 Nivel 2
Tamao de espcimen (A) 2 4
Cantidad de Agua (B) Baja Alta
Tiempo de curado (C) 24 48
Tcnica de mezclado (D) Manual Maquina
Agregado (E) Fino Grueso
Concentracin de cemento (F) Baja Alta
Un arreglo ortogonal L8 fue usado para estudiar los efectos de los 6
factores sobre la firmeza. Los resultados del experimento son mostrados en
la siguiente tabla:
Num C B A D E e F R1 R2
1 1 1 1 2 2 2 1 2.3 2.2
2 1 1 2 1 1 2 2 3.5 3.3
3 1 2 1 1 2 1 2 3-0 2.9
4 1 2 2 2 1 1 1 2.1 1.9
5 2 1 1 2 1 1 2 3.5 3.6
6 2 1 2 1 2 1 1 2.6 2.7
7 2 2 1 1 1 2 1 2.9 2.8
8 2 2 2 2 2 2 2 3.9 4.1

Construya una tabla de anova para identificar las variables que tienen un
efecto significativo sobre la media de la firmeza.

2. En una compaa de aviacin se desea determinar cual de los


siguientes 4 factores tienen mas impacto sobre el grosor de la
pintura. Adems se quisiera reducir la variabilidad en el grosor de la
pintura alrededor del optimo de 0.5 mm de grosor. Los factores y los
niveles son:
Variable Nivel 1 Nivel 2
Cantidad de tiner (A) 10 20
Presion de fluido (B) 15 30
Temperatura (C) 68 78
Marca de la pintura (D) X Y

Fue decidido conducir u arreglo ortogonal L8 con 4 replicas para cada


corrida experimental. La matriz de diseo no codificada y los resultados son
mostrados:
Ens A B C D R1 R2 R3 R4
1 10 15 68 X 0.638 0.489 0.541 0.477
2 10 15 78 Y 0.496 0.509 0.513 0.495
3 10 30 68 Y 0.562 0.493 0.529 0.531
4 10 30 78 X 0.564 0.632 0.507 0.757
5 20 15 68 Y 0.659 0.623 0.636 0.584
6 20 15 78 X 0.549 0.457 0.604 0.386
7 20 30 68 X 0.842 0.910 0.657 0.953
8 20 30 78 Y 0.910 0.898 0.913 0.878

3. Un ingeniero de proceso trata de mejorar la vida de una cierta


herramienta de corte. El ha corrido un experimento bajo un arreglo
ortogonal L8 usando tres factores: Velocidad de corte (A), dureza del metal
(B) y ngulo de corte (C). Los resultados obtenidos a partir del experimento
son mostrados:
Ensayo R1 R2
1 221 311
2 325 435
3 354 348
4 552 472
5 440 453
6 406 377
7 605 500
8 392 419

Lleve a cabo el anova para la RSR y obtenga la combinacin de los niveles


de los factores que producen la mas larga vida de la herramienta.

3. En un componente de un motor automotriz se desea maximizar la


fuerza de empuje de una vlvula. Los investigadores identificaron 4
factores controlables y 3 de ruido que probablemente afecten la
fuerza de empuje. La siguiente tabla muestra los factores y sus
niveles.
Factores Controlables:
A. Interferencia: Baja Media Alta
B. Grosor de la pared Delgada Media Gruesa
C. Profundidad de Insercin Superficial Media Profunda
D. Porciento de Adhesivo Bajo Medio Alto
Factores no controlables:
E. Tiempo Condicionamiento 24 hrs. 120 hrs.
F. Temperatura Condicionamiento 72 150 F
G Humedad relativa Condicionan 25 75 %

Los factores de ruido son incontrolables durante la operacin normal del


proceso, pero fueron controlados para los propsitos de la prueba. Un arreglo
L9 es apropiado para el arreglo interno, mientras que un arreglo L8 es
apropiado para el arreglo externo. Los arreglos externo e interno son
combinados para formar el diseo de parmetros completo:

A B C D 1 2 3 4 5 6 7 8
1 1 1 1 15.6 9.5 16.9 19.9 19.6 19.6 20.0 19.1
1 2 2 2 15.0 16.2 19.4 19.2 19.7 19.8 24.2 21.9
1 3 3 3 16.3 16.7 19.1 15.6 22.6 18.2 23.3 20.4
2 1 2 3 18.3 17.4 18.9 18.6 21.0 18.9 23.2 24.7
2 2 3 1 19.7 18.6 19.4 25.1 25.6 21.4 27.5 25.3
2 3 1 2 16.2 16.3 20.0 19.8 14.7 19.6 22.5 24.7
3 1 3 2 16.4 19.1 18.4 23.6 16.8 18.6 24.3 21.6
3 2 1 3 14.2 15.6 15.1 16.8 17.8 19.6 23.2 24.2
3 3 2 1 16.1 19.9 19.3 17.3 23.1 22.7 22.6 28.6

Encontrar la combinacin optima de los factores que maximizan la fuerza de


empuje con la mnima variacin por efecto de los factores de ruido.
4. En una planta procesadora de alimentos 4 parmetros (A,B,C,D)
cada uno en 3 niveles han sido identificados como factores de
posibles impactos en el contenido de humedad en carne
empaquetada. 3 factores de ruido (E,F,G) cada uno en dos niveles
van a ser tambin investigados en el experimento. En el arreglo
interno un L9 es usado con los factores A, B, C y D asignados a las
columnas 1, 2, 3 y 4.
Arreglo Ortogonal L9:
Ensayo A (A) B (B) AB (AB) AB (AB)
1 0 0 0 0
2 0 1 1 1
3 0 2 2 2
4 1 0 1 2
5 1 1 2 0
6 1 2 0 1
7 2 0 2 1
8 2 1 0 2
9 2 2 1 0

Para el arreglo externo un arreglo ortogonal L4 es usado con los factores


E,F y G asignados a las columnas 1, 2 y 3 respectivamente.
Arreglo Ortogonal L4:
Ensayo E F G
1 0 0 0
2 0 1 1
3 1 0 1
4 1 1 0

Se desea que el contenido de humedad este alrededor de un valor


codificado de 20. Calcular la respuesta media y la razn seal a ruido.
Graficar los promedios de las medias de respuesta y de las razones seal a
ruido y seleccionar los niveles de los factores. Como se pueden identificar
grficamente las interacciones BE y CF.

Los contenidos de humedad registrados en la carne empaquetada fueron


registrados:

Ensayo AO E 1 2 3 4
Ensayo AO I
1 18.5 21.2 20.5 19.3
2 16.8 17.3 20.9 18.5
3 21.1 21.8 20.8 19.4
4 20.2 17.7 19.8 20.8
5 16.2 21.5 21.2 21.4
6 18.3 18.5 17.8 17.2
7 20.6 21.4 16.9 19.5
8 17.5 20.0 21.0 20.4
9 20.4 18.8 19.6 18.3

Suponga que se decide extender el arreglo externo a un L8 con las


asignaciones como sigue:
Efecto Columna
E 1
F 2
EF 3
G 4
EG 5
Las otras dos columnas del arreglo L8 pueden ser asignadas al error
experimental.
Mostrar el diseo de parmetros completo. Calcular las respuestas
promedio y la razn seal a ruido apropiada. Graficar los promedios de las
razones seal a ruido y las respuestas promedio y discutir como van a ser
seleccionados los niveles ptimos de los factores.
Use las graficas de respuestas promedio para determinar la existencia de
los efectos de interaccin AE, BF, EF y EG.

La siguiente tabla muestra los contenidos de humedad registrados.

1 2 3 4 5 6 7 8
1 19.3 20.2 19.1 18.4 21.1 20.6 19.5 18.7
2 20.6 18.5 20.2 19.4 20.1 16.3 17.2 19.4
3 18.3 20.7 19.4 17.6 20.4 17.3 18.2 19.2
4 20.8 21.2 20.2 19.9 21.7 22.2 20.4 20.6
5 18.7 19.8 19.4 17.2 18.5 19.7 18.8 18.4
6 21.1 20.2 22.4 20.5 18.7 21.4 21.8 20.6
7 17.5 18.3 20.0 18.8 20.2 17.7 17.9 18.2
8 20.4 21.2 22.4 21.9 21.5 20.8 22.5 21.7
9 18.0 20.2 17.6 22.4 17.2 21.6 18.5 19.2

Metodologa de superficie de respuesta:


La metodologa de superficie de respuesta incluye una serie de herramientas
de optimizacin, que tienen por objetivo llegar a determinar bajo que
condiciones de las variables independientes investigadas se llega a maximizar
o minimizar la respuesta o variable dependiente de inters. Para lograr este
objetivo se emplea el ajuste de dos modelos de regresin:
En una primera etapa exploratoria se investiga secuencialmente una
regin de las variables independientes mediante el ajuste de modelos de primer
orden, en donde se supone que los resultados del ajuste del modelo van
indicando la direccin en que deben moverse las variables independientes.
Para este fin se utilizan los diseos de primer orden, que consisten de dos
porciones:
Una porcin factorial, que puede ser una factorial completo dos a la K o una
fraccin del factorial, en caso de ser muchos los factores que se estn
investigando.
Una porcin central, que consiste en un punto en el que todos los factores se
prueban en el punto medio de los niveles empleados en el factorial, lo que
correspondera al cero en unidades codificadas. Este es el nico punto es el
que lleva repeticiones y cuya finalidad es: Primero evaluar el error puro y en
segundo lugar probar curvatura en alguna de las variables cuyo efecto se esta
investigando.
Esta serie de diseos se van aplicando hasta que el anlisis de datos detecta
una curvatura. En esta regin se disea un experimento para ajustar un modelo
de segundo orden, que permita ajustar un modelo de segundo orden con la
finalidad de identificar el punto optimo.
Los diseos de segundo orden, aparte de la porcion factorial y la porcion
central, llevan adicionalmente la porcion axial o porcion estrella, que son los
valores extremos en cada una de las variables independientes que se prueban
en el cero codificado del resto de las variables independientes. El valor
codificado de esta porcion en cada una de las variables independientes se
denomina alfa ( ) y es igual a la raz cuarta del numero de puntos en la
porcion factorial, valor que le da la caracterstica de rotabilidad al diseo, es
decir, la precisin de la estimacin es la misma en cualquier punto de la regin
investigada. Por eso, estos diseos se conocen como diseo central
compuesto rotable. La finalidad de esta porcion es aumentar el numero de
niveles en cada una de las variables independientes para poder ajustar el
modelo de segundo orden. Bajo este modelo, si no existe falta de ajuste,
entonces puede ser usado para encontrar el optimo en la variable de
respuesta.
Ejemplo 1: Los siguientes datos fueron recopilados por un ingeniero qumico.
La respuesta Y corresponde al tiempo de filtracin, X1 es la temperatura y X2
es la presin. Ajuste un modelo de segundo orden y analice la superficie
ajustada.

X1 X2 Y
-1 1 54
-1 -1 45
1 1 32
1 -1 47
-1.414 0 50
1.414 0 53
0 -1.414 47
0 1.414 51
0 0 41
0 0 39
0 0 44
0 0 42
0 0 40

Ejemplo 2: Los datos que se presentan en la siguiente tabla fueron recopilados


en un experimento para optimizar el crecimiento de cristales en funcin de tres
variables. Se desean valores altos de Y (rendimiento en gramos). Ajuste un modelo de
segundo orden. Determine bajo que condiciones de las variables se logra un crecimiento
optimo.
Codif X1 Codif X2 Codif X3 Resp Y
-1 -1 -1 66
-1 -1 1 70
-1 1 -1 78
-1 1 1 60
1 -1 -1 80
1 -1 1 70
1 1 -1 100
1 1 1 75
-1.682 0 0 100
1.682 0 0 80
0 -1.682 0 68
0 1.682 0 63
0 0 -1.682 65
0 0 1.682 82
0 0 0 113
0 0 0 100
0 0 0 118
0 0 0 88
0 0 0 100
0 0 0 85
El anlisis de los datos se lleva a cabo por medio de regresin del ajuste del modelo de
segundo orden. El anova del modelo completo es mostrado en la siguiente tabla:
ANLISIS DE
VARIANZA
Grados de Suma de Promedio de los Valor crtico
libertad cuadrados cuadrados F de F
Regresin 9 3661.97123 406.885692 2.18640695 0.11943925
Residuos 10 1860.97877 186.097877
Total 19 5522.95

Lo que indica que el modelo no es significativo. Investigamos entonces los trminos


incluidos en el modelo completo y vemos que solo los trminos cuadraticos en la
variable codificada x2 y x3 son significativos, por lo que se procede a ajustar un modelo
reducido, cuyo anlisis de varianza se muestra en la siguiente tabla:
ANLISIS DE
VARIANZA
Grados
de Suma de Promedio de los Valor crtico
libertad cuadrados cuadrados F de F
Regresin 2 3087.06694 1543.53347 10.7723024 0.00095088
Residuos 17 2435.88306 143.287239
Falta de
ajuste 12 1576.55497 131.37914 0.76442482 0.67603346
Error puro 5 859.33333 171.86666
Total 19 5522.95
Lo que indica que el modelo es significativo y no existe una evidencia de la falta
de ajuste, por lo que se concluye que es el modelo que mejor explica este
conjunto de observaciones. Los estimadores de los parmetros del modelo se
muestran a continuacin:

Coeficiente Estadstico Probabilida


s Error tpico t d
Intercepcin 97.58157 4.1440598 23.5473372 2.0442E-14
codif x2^2 -12.05327 3.13701026 -3.8422819 0.00130536
codif x3^2 -9.225547 3.13701026 -2.9408725 0.00913491

Siendo ambos coeficientes negativos, se concluye que al separarse los niveles


del valor cero en las variables independientes de impacto la respuesta va a
tender a disminuir. Una grafica de los valores observados y los esperados por
el modelo ajustado nos da una vision de la aproximacin del modelo.
El valor que genera la maxima respuesta es quel en el que las variables
independientes de impacto estn en el valor cero.

Ejemplo 3.Un ingeniero qumico esta interesado en determinar las condiciones


de operacin que maximizan el rendimiento de una reaccin. Dos variables
controlables Dos variables controlables influyen en este rendimiento: El tiempo
y la temperatura de reaccin. Los datos obtenidos de un experimento se
analizan para ajustar un modelo de segundo orden y obtener las condiciones
en las cuales se optimiza la reaccin:

Variable Variable
Nat Nat. Var. Codif Var Codif Resp
1 2 x1 x2 Y
80 170 -1 -1 76.5
80 180 -1 1 77
90 170 1 -1 78
90 180 1 1 79.5
85 175 0 0 79.9
85 175 0 0 80.3
85 175 0 0 80
85 175 0 0 79.7
85 175 0 0 79.8
92.07 175 1.414 0 78.4
77.93 175 -1.414 0 75.6
85 182.07 0 1.414 78.5
85 167.93 0 -1.414 77
En primer lugar se muestra la tabla de anlisis de varianza donde se observa
que el modelo es significativo.

ANLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crtico
libertad cuadrados cuadrados F de F
Regresin 5 28.2467034 5.64934069 79.668607 5.147E-06
Residuos 7 0.49637349 0.0709105
Total 12 28.7430769

De aqu se procede a revisar los estimadores de los parmetros para investigar si todos
tienen significancia.
Probabilida
Coeficientes Error tpico Estadstico t d
Intercepcin 79.9399546 0.11908862 671.264433 4.3003E-18
x1 0.99505025 0.09415493 10.5682224 1.4845E-05
x2 0.5152028 0.09415493 5.47186207 0.00093401
x1^2 -1.37644928 0.10098417 -13.6303472 2.693E-06
x2^2 -1.001336 0.10098417 -9.91577205 2.262E-05
x1*x2 0.25 0.13314513 1.8776504 0.10251919

Solo el termino de efecto cruzado de las dos variables se detecta como no


significativo, por lo que se procede a ajustar un modelo reducido, eliminando
dicho termino.

Ejemplo 4: Un ingeniero esta interesado en determinar las condiciones optimas


requeridas para una nueva sierra. Un diseo central compuesto fue usado en un
experimento para evaluar la vida de la sierra bajo diferentes condiciones de operacin
fijadas por la velocidad de corte y la profundidad del corte.
Velocidad Profundidad x1 x2 Vida Herr.
600 0.1 154
600 0.05 132
200 0.1 166
200 0.05 83
683 0.075 156
117 0.075 144
400 0.11 166
400 0.04 91
400 0.075 167
400 0.075 175
400 0.075 170
400 0.075 176
400 0.075 156
400 0.075 170
Ajustar un modelo de segundo orden y determinar las condiciones que
optimizan la vida de la herramienta.

Al llevar a cabo el ajuste del modelo de segundo orden se obtiene la siguiente tabla de
anlisis de varianza:
ANLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crtico
libertad cuadrados cuadrados F de F
Regresin 5 10955.1767 2191.03534 48.3870007 9.1102E-06
Falta de ajuste 3 102.251895 34.083965 0.65546086 0.61339158
Error puro 5 260 52
Residuos 8 362.251895 45.2814869
Total 13 11317.4286

De donde podemos concluir que el modelo es significativo. Al considerar la


prueba de la falta de ajuste no es significativa, por lo que no es necesario
introducir nuevos parmetros al modelo.
Enseguida se muestra la tabla de coeficientes del modelo completo y sus
pruebas de significancia para determinar aquellos que sobran en el modelo:

Probabilida
Coeficientes Error tpico Estadstico t d
Intercepcin 169.016235 2.7471226 61.5248242 5.4139E-12
x1 6.74374879 2.3784531 2.83535076 0.02196856
x2 26.5151515 2.39110005 11.0891016 3.9035E-06
x1^2 -10.756724 2.47325855 -4.3492113 0.00244787
x2^2 -21.9855591 2.5138815 -8.74566247 2.2867E-05
x1*x2 -15.25 3.36457601 -4.53251761 0.001918

Al revisar los valores de probabilidad, todos resultaron ser menores de 0.05, de


donde concluimos que todos son importantes para explicar la respuesta. Una
grafica de observados contra esperados es mostrada para revisar el nivel de
ajuste del modelo:

También podría gustarte