Está en la página 1de 12

Diseños factoriales con 3 factores.

¿Para qué sirve?


Cuando se quiere investigar la influencia de tres factores (A, B y C) sobre una o
más variables de respuesta, y el número de niveles de prueba en cada uno de los
factores es a, b y c, respectivamente, se puede construir el arreglo factorial a × b ×
c, que consiste de a × b × c tratamientos o puntos experimentales.

Entre los arreglos de este tipo que se utilizan con frecuencia en aplicaciones
diversas se encuentran: la factorial 23, la factorial 33 y las factoriales mixtas con
no más de cuatro niveles en dos de los factores, por ejemplo, la factorial 4 × 3 × 2
y la factorial 4 × 4 × 2, por mencionar dos de ellos.

Modelo estadístico

En un diseño factorial a × b × c como el del ejemplo, se supone que el


comportamiento de la respuesta Y puede describirse mediante el modelo de
efectos dado por:

donde m es la media general, ai es el efecto del nivel i-ésimo del factor A, bj es el


efecto del nivel j del factor B y gk es el efecto del nivel k en el factor C; (ab)ij, (ag)ik
y (bg)jk representan efectos de interacción dobles (de dos factores) en los niveles
ij, ik, jk, respectivamente, y (abg)ijk es el efecto de interacción triple en la
combinación o punto ijk; eijkl representa el error aleatorio en la combinación ijkl y l
son las repeticiones o réplicas del experimento.

Todos los efectos cumplen la restricción de sumar cero, es decir, son desviaciones
relacionadas con la media general m.

De manera alternativa, se tiene el modelo de regresión dado por


Hipótesis de interés
El estudio factorial de tres factores (A, B y C) permite investigar los efectos: A, B,
C, AB, AC, BC y ABC, donde el nivel de desglose o detalle con el que pueden
estudiarse depende del número de niveles utilizado en cada factor.

En resumen, se tienen siete efectos de interés sin considerar desglose, y con ellos
se pueden plantear las siete hipótesis nulas H0 : Efecto A = 0, H0 : Efecto B = 0,
…, H0 : Efecto ABC = 0, cada una aparejada con su correspondiente hipótesis
alternativa.
cuyos respectivos grados de libertad se dan en la tabla 5.6. Una vez hecho el
ANOVA, se procede a interpretar los efectos activos, y luego (aunque no
necesariamente después) a diagnosticar la calidad del modelo.

Interpretación de efectos activos.


Del F0 de la tabla 5.8 se aprecia que el efecto más importante es el de C seguido
por B y la interacción de AB. En la figura 5.9 se muestran las gráficas de efectos
de interacción AB y BC; se quiere minimizar el % de sedimentación. En el
diagrama de la izquierda de la figura 5.9, el aspecto quebrado de las líneas indica
que en el efecto de interacción AB está predominando la parte de curvatura sobre
la parte lineal; la mejor combinación es la suspensión intermedia y abertura baja
(A = 0, B = –1).

En la parte derecha de la figura 5.9 las líneas se ven casi paralelas, lo cual es
evidencia visual a favor de la poca importancia de la interacción BC, y la fuerte
pendiente de estas líneas tiene que ver con la influencia del factor C : temp.

En otras palabras, en la gráfica del efecto BC se observa prácticamente sólo el


efecto de C, por ello, no es necesario representar a este último. Para minimizar la
mejor combinación para el factor C es su nivel alto. En resumen, el mejor
tratamiento es (A = 0, B = –1, C = 1).

Diagnóstico. Es importante evaluar, mediante el análisis de residuos, la calidad


del modelo de efectos antes de considerar la combinación (0, –1, 1) como la
mejor.

De antemano podemos afirmar que la contundencia del valor-p en la tabla de


ANOVA (tabla 5.8) es tan fuerte que es muy difícil que una violación moderada de
los supuestos del modelo cambie la conclusión obtenida. Sin embargo, siempre
que sea posible debe comprobarse el cumplimiento de los supuestos de
normalidad, varianza constante, independencia y la ausencia de observaciones
atípicas.

Las gráficas de residuos contra predichos y en papel normal se muestran en las


figuras 5.10ab. Se observa en ellas una aparente violación al supuesto de
varianza constante y de normalidad. Pero otra posibilidad es la presencia de tres
observaciones alejadas, las cuales se asocian con dos residuos grandes y uno
pequeño que hacen ver el no cumplimiento de los supuestos.
Si se admite que tales observaciones son parte del proceso de sedimentación que
se estudia, entonces se tiene el no cumplimiento de los supuestos de varianza
constante y normalidad. De hecho, la prueba Shapiro Wilks rechaza que los
residuos sean normales (valor-p = 0.002). El no cumplimiento de la igualdad de
varianzas es posible que se deba a que los factores A : Suspen y C : Temp tienen
un efecto real sobre la dispersión del porcentaje de sedimentación, de acuerdo a
como se observa en las figuras 5.11cd. En caso de existir tal efecto, debe tomarse
en cuenta para también buscar cómo reducir la variabilidad de la respuesta. A
pesar de lo antes dicho, y dado el valor-p contundente en el ANOVA (tabla 5.8), se
prevé la no afectación en la conclusión sobre el mejor tratamiento. Sin embargo,
para estar seguros se intenta corregir el problema de violación de supuestos
analizando una transformación apropiada de la respuesta Y, como se hace a
continuación.

Transformaciones para estabilizar varianza


En la práctica, algunas variables de respuesta no siguen una distribución normal,
sino que se distribuyen, por ejemplo, Poisson, binomial o Gamma, por mencionar
tres casos.

Resulta que en estas distribuciones la media está relacionada con la desviación


estándar (variabilidad) y, naturalmente, al cambiar la media de un tratamiento a
otro, con ella cambia la variabilidad de la respuesta.

También es cierto que, al suponer normalidad y varianza constante, éstas no se


tienen que cumplir de manera estricta, dado que el procedimiento de ANOVA es
robusto o admite desviaciones moderadas de dichos supuestos.

Existen al menos tres maneras de solucionar o minimizar el problema por falta


de normalidad y de varianza heterogénea en los residuos:

1) utilizar métodos de análisis no paramétricos, que no requieren las suposiciones


de normalidad y varianza constante.

2) hacer el análisis mediante modelos lineales generalizados (GLM), en los que se


ajusta un modelo lineal usando otras distribuciones diferentes a la normal, donde
la varianza no tiene por qué ser constante.

3) hacer el análisis sobre la respuesta transformada a una escala en la que los


supuestos se cumplan.

La transformación más apropiada de la respuesta para corregir o minimizar los


problemas de falta de normalidad y de varianza constante, depende del tipo de
relación que existe entre la media y la varianza de Y.
Esta relación se puede visualizar en la gráfica de residuos vs. predichos (véase
figura 5.10a).

Según lo pronunciado que sea la “forma de corneta” de los puntos en dicha


gráfica, se determina la transformación más apropiada. Con un paquete
estadístico se pueden probar varias transformaciones para elegir aquella en la
cual los supuestos se cumplan de mejor manera.
En la tabla el símbolo μ significa “es proporcional a”. A medida que se da la
relación de proporcionalidad con respecto a mayor potencia de la media o valor
esperado, se requiere una transformación más fuerte para lograr igualdad de
varianzas en el análisis de la respuesta transformada. El grado de
proporcionalidad se puede ver en la gráfica de residuos vs. predichos.

Diseño factorial general


Lo que se ha dicho para los dos diseños factoriales con 2 y 3 factores puede
extenderse fácilmente para cuando se tienen más factores. Considere f factores A,
B, C, …, K con niveles a, b, c, …, k, respectivamente, donde la letra K denota al f-
ésimo o último factor del conjunto a estudiar, no necesariamente el undécimo, que
es el lugar de esta letra en el alfabeto. Con estos niveles y factores se puede
construir el diseño factorial general a × b × … × k, que consiste de a × b × … × k
tratamientos o puntos de prueba. Con este diseño se pueden estudiar f efectos
principales, f (f – 1) /2 interacciones dobles, f ( f – 1)( f – 2)/(3 × 2) interacciones
triples, y así sucesivamente hasta la única interacción de los f factores (ABC … K).
El cálculo del número de interacciones de cierta cantidad m de factores se hace
mediante la operación “combinaciones de f en m f
que cuenta el número de diferentes maneras de seleccionar m factores de los f,
donde f ! = f × (f – 1) × … × 2 × 1.

De acuerdo con lo antes dicho, en la factorial general a × b × … × k, se pueden


plantear 2 f – 1 hipótesis que se prueban mediante el análisis de varianza. Si se
tienen n réplicas. Las primeras tres columnas de este ANOVA se muestran en la
tabla 5.10. La suma de cuadrados totales está dada por:

donde N = abc … kn es el total de observaciones en el experimento. Las sumas


de cuadrados de efectos son:
Al final, la suma de cuadrado del error se calcula por sustracción

En el ANOVA de la tabla 5.10 para la factorial general a × b × … × k se observa la


necesidad de contar con al menos dos réplicas del experimento para calcular la
suma de cuadrados del error (SCE), y completar toda la tabla de ANOVA. Sin
embargo, esta necesidad de réplicas (n = 2), que se ha mencionado a lo largo del
capítulo, es para el caso irreal de que interesaran los 2 f– 1 efectos. Pero resulta
que, con excepción de la factorial 22, en una factorial completa prácticamente
nunca interesan todos sus posibles efectos, puesto que en términos generales
sólo algunos de ellos están activos. El principio de Pareto, que en este contexto
también se llama principio de esparcida de efectos, dice que la mayoría de la
variabilidad observada se debe a unos pocos de los efectos posibles; por lo común
se debe a algunos efectos principales e interacciones dobles.

Modelos de efectos aleatorios

Hasta aquí los modelos de efectos que se han utilizado son modelos de efectos o
factores fijos, lo cual significa que todos los niveles de prueba en cada factor son
todos los disponibles para ese factor, o bien, se estudian todos los niveles de
interés
en ese factor; es en este sentido que los niveles están fijos. Éste es el caso, por
ejemplo, cuando en el factor operador se toman los tres únicos operadores como
los niveles de prueba, o cuando los niveles del factor máquinas son las cuatro
máquinas existentes. O bien, cuando se comparan tres tipos de material porque
son los que interesa comparar, aunque existan otros materiales de ese tipo. Con
factores fijos, las conclusiones obtenidas sólo son válidas para los niveles de
prueba que se estudian en el experimento.

En ocasiones, los niveles de prueba son una muestra aleatoria de la población


de niveles posibles. En este caso es más apropiado utilizar un modelo de efectos
o
factores aleatorios. Un ejemplo de esta situación es cuando se prueban cinco
instrumentos de medición, pero la población de los mismos es de 100
instrumentos; obviamente, no es posible experimentar con todos los equipos.
Entonces se experimenta sólo con cinco de ellos elegidos al azar, y las
conclusiones obtenidas se infieren como válidas para la población entera de
instrumentos.

La aplicación de un modelo de efectos aleatorios conlleva la necesidad de


considerar la incertidumbre asociada con la elección aleatoria de los niveles de
prueba. Es decir, ya no tiene sentido, para un factor A, preocuparse por el efecto
ai
del nivel i como con efectos fijos. Lo que ahora (con efectos aleatorios) tiene
sentido es hablar de la varianza con la que el factor aleatorio contribuye a la
variación total;
es decir, es preciso estimar dicha varianza y probar si su contribución a la
variabilidad total es significativa.
El caso de dos factores aleatorios

Si se consideran dos factores aleatorios A y B, de los cuales se prueban a y b


niveles
elegidos de una población grande de niveles, entonces si los a ¥ b tratamientos se
replican n veces, el modelo de efectos aleatorios es:

donde m es la media general, ai es el efecto debido al i-ésimo nivel del factor A, bj


es el efecto del j-ésimo nivel del factor B, (ab)ij representa al efecto de interacción
en la combinación ij y eijk es el error aleatorio que se supone sigue una
distribución normal con media cero y varianza constante, N(0, s2) y son
independientes entre sí. El aspecto de este modelo es igual al de efectos fijos
(ecuación 5.1), pero el hecho de que los efectos sean aleatorios implica que no
tiene sentido probar hipótesis directamente sobre tales efectos (medias), sino que
ahora el interés se enfoca en estudiar la varianza de dichos efectos. Para ello, se
supone que los términos ai , bj , (ab)ij y eijk son variables aleatorias
independientes normales, con media cero y varianzas s 2 a, s 2 b, s 2 ab y s2,
respectivamente. De esta manera, si se calcula la varianza en ambos lados del
modelo anterior, se obtiene el modelo de componentes de varianza dado por:

donde s 2 a, s 2 b, s 2 ab son las contribuciones de cada efecto a la variación total


y se llaman componentes de varianza; s2 es el componente de varianza debido al
error aleatorio. Las hipótesis de interés son H0 : s 2 a = 0, H0 : s 2 b = 0 y H0 : s 2
ab = 0. Los cálculos necesarios para probar estas hipótesis involucran las mismas
sumas de cuadrados del modelo de efectos fijos, de las cuales se obtienen los
correspondientes cuadrados medios. Para obtener los estadísticos de prueba F0
apropiados debe tomarse en cuenta que los valores esperados de los cuadrados
medios son:
efectos aleatorios los cuadrados medios de los efectos principales se comparan
con el cuadrado medio de la interacción, y no con el cuadrado medio del error,
como se hace en el modelo de efectos fijos. En caso de rechazar alguna de las
hipótesis sobre las varianzas, se concluye que el efecto correspondiente
contribuye de manera significativa a la variación de la respuesta.
La conclusión práctica no consiste en determinar el mejor tratamiento, sino que
generalmente se traduce en tomar medidas para que la contribución del
componente de varianza se reduzca. Al resolver las ecuaciones dadas por los
valores esperados de cuadrados medios para los componentes de varianza, se
obtienen estimadores de éstos en función de los cuadrados medios del error, esto
es:

Modelo mixto: factores aleatorios y fijos

En estos experimentos se tienen factores aleatorios y factores fijos. Por ejemplo, si


el factor A es aleatorio y B es fijo, el modelo de componentes de varianza es:

donde el componente individual del factor B desaparece, dado que es fijo, pero se
mantiene el componente de interacción por ser A aleatorio. De manera que las
hipótesis de interés que involucran al factor A son H0 : s 2
a = 0 y H0 : s 2
ab = 0, y para el factor B se prueba la misma hipótesis sobre medias de niveles
del modelo de efectos fijos. En caso de rechazarla se determina cuál tratamiento o
nivel del factor B es mejor. En el modelo de efectos mixtos la esperanza de los
cuadrados medios es:
de aquí, los estadísticos apropiados para los efectos aleatorios son F CM CM A
0 = A E / y F CM CM AB
0 = AB E / y para los efectos fijos de B el estadístico adecuado es FB
0 = CMB/CMAB.

Los componentes de varianza estimados son:

También podría gustarte