Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1.1 INTRODUCCION
Un experimento considerado como tal, no es más que una prueba, sin embargo, un experimento que
ha sido diseñado es una serie de pruebas que realiza el investigador en un determinado material al
que se lo ha sometido a diversos cambios, con la finalidad de evaluar la magnitud de los mismos y
determinar si la respuesta se debe a los cambios efectuados en el material o a otros factores.
También se podemos afirmar que un experimento es una investigación que se ha planificado para
descubrir nuevos efectos o para confirmar los resultados obtenidos investigaciones anteriores.
Los métodos del diseño experimental tienen amplia aplicación en las ciencias biológicas, sociales
administrativas y de la ingeniería. En efecto es posible considerar a la experimentación parte del
proceso científico y una de las formas en que aprendemos acerca de la manera en que funcionan los
sistemas procesos. Por lo general este aprendizaje se da a través de una serie de actividades en las
cuales planteamos preguntas acerca de un proceso, realizamos experimentos para generar datos a
partir del proceso y luego usamos la información del experimento para confirmar nuestras
conjeturas.
En el diseño de experimentos se debe cumplir dos principios básicos que son: disponer de
repeticiones y la aleatorización de los experimentos
Este principio tiene dos propiedades importantes, en primer lugar permite al experimentador
obtener una estimación del error experimental, el que se convierte en la unidad básica para
determinar si las diferencias observadas en los datos son estadísticamente significativas. En
segundo lugar el uso de las repeticiones permite al investigador obtener una estimación más
precisa del efecto de un factor en el experimento.
7
1.3 EL PROCESO DE LA INVESTIGACIÓN
Con la investigación aplicada, se trata de resolver problemas prácticos para lo cual se debe seguir
un proceso, el mismo que está conformado por una serie de etapas, las que se derivan unas de otras,
razón por la que no se puede alterar su orden , sin embargo hay ciertas diferencias en la
enumeración de los pasos de la manera de nombrarlos pero en esencia son los mismos.
Un esquema básico de las etapas que deben contemplarse en todo trabajo de investigación se
presenta a continuación
1. Título
- El problema
- Justificación
- Objetivos
- Hipótesis
3. Materiales y métodos
- Materiales
- Métodos
- Tratamientos
- Diseño experimental
- Variables evaluadas
4. Resultados y Discusión
5. Conclusiones y recomendaciones
8
El uso adecuado de las técnicas estadísticas en la experimentación requiere que el investigador
tenga presente en mente los siguientes puntos:
Generalmente los investigadores no tienen mayores conocimientos de estadística, sin embargo son
expertos en su especialidad, lo que es de gran valor para elegir los factores en estudio y decidir el
número de repeticiones que se deben utilizar.
No se debe exagerar en el uso de las técnicas estadísticas complejas , ya que en muchos de los
casos los métodos de diseño y análisis simples dan excelentes resultados.
Hay veces que no existe seguridad de que una diferencia entre los tratamientos sea lo
suficientemente grande desde el punto de vista práctico, por el solo hecho de que dos condiciones
experimentales producen respuestas estadísticamente significativas
Una investigación se efectúa para probar una hipótesis, la que generalmente parte del criterio de la
igualdad de los efectos de varios tratamientos , en este aspecto la validez de una investigación será
siempre proporcional a la precisión en el manejo del experimento , la honradez en la presentación
de los datos y el análisis adecuado de los mismos.
Además es importante indicar que el método estadístico a emplearse debe ser fijado en las primeras
etapas de la investigación, seleccionándolo de acuerdo al interés del investigador, a las finalidades
del ensayo, a la información y precisión que se desea obtener, concordando con lo anterior lo
importante es obtener los datos de acuerdo a un método estadístico, y no lo contrario buscar un
método que se adapte a los datos.
Parámetro
9
Es el valor calculado con todos los elementos de la población , se representa por las letras
mayúsculas del alfabeto griego
Estadístico
Es el valor calculado con una parte de la población, y se representa mediante las letras minúsculas
del alfabeto latino.
Población
Es el total de elementos que conforman el universo
Muestra
Es una parte de todos los elementos de la población.
Variable
Es la característica de individuo o una cosa
Variables discretas
Son aquellas que toman únicamente valores enteros, por ejemplo el número de estudiantes de un
curso, número de manzanas.
Variables continuas
Son aquellas que pueden ser medidas cuantitativamente y tienen un infinito número de valores
entre un rango dado , por ejemplo el peso en gramos , la altura en centímetros , etc.
Variables cuantitativas
Son aquellas que pueden ser medidas cuantitativamente, por ejemplo, peso, altura, etc.
Variables cualitativas
Son aquellas que no pueden ser medidas cuantitativamente y son catalogadas por una característica
que indique una cualidad , por ejemplo, olor, color sabor , etc.
Medici6n
Es la asignación de números a objetos o eventos.
Escala nominal
10
Es la que clasifica a las observaciones en categorías mutuamente excluyentes por ejemplo:
masculino - femenino, sano -enfermo, etc.
Escala ordinal
Como su nombre lo indica son las que establecen un orden que puede ser de mayor a menor, pero
no existe una distancia entre las observaciones, por ejemplo en un determinado servicio puede
haber clientes muy, satisfechos y no satisfecho.
En esta escala pueden asignarse números a las observaciones, a pesar de no conocer la distancia
entre ellas , así en el caso de los servicios se podría asignar el valor de tres a los muy satisfechos ,
dos a los satisfechos y uno a los no satisfechos, dos a los satisfechos y uno a los no satisfechos
Escala da intervalos
En esta escala a más de ordenar las mediciones, se puede conocer la distancia entre ellas. Para esta
escala es necesario una unidad de distancia y un cero, los mismos que son arbitrarios, por ejemplo
la temperatura que se mide en grados centígrados.
Escala de raz6n
En esta escala los valores son definidos, pues el cero es y no es arbitrario , aquí entran las
mediciones como altura, peso , etc.
Experimento
Es a investigación realizada con el objeto de aceptar o negar la hipótesis.
Tratamiento
Es un procedimiento utilizado para analizar el efecto de una determinada sustancia, metodología o
producto aplicado al material experimental.
Unidad experimental
Es una parte experimental en el que se va aplicar el tratamiento en estudio.
Parcela total
Es toda la unidad experimental que se ha planificado y en la cual se va aplicar el tratamiento en
estudio.
11
Efecto da borde
Es la influencia positiva o negativa que puede producir algún factor extraño en la parcela o unidad
experimental
Unidad da muestreo
Es una parte de la unidad experimental en la que se va a determinar el efecto del tratamiento.
Diseño experimental
Es una serie de normas que se usan para distribuir a los tratamientos en un ensayo o experimento
Repeticiones:
Es el número de veces que aparece un tratamiento en un experimento.
Bloque
Es una condición similar en la que se agrupa a los tratamientos en estudio.
Análisis de varianza
Es un procedimiento estadístico que sirve para estudiar la relación que existe entre una variable
dependiente y uno o más factores independientes, estableciendo un balice entre la variabilidad
inducida y la variabilidad no explicada.
Son aquellos en los que se investiga los efectos de los tratamientos como un solo factor y son:
12
Se utiliza únicamente cuando se va a comparar dos tratamientos, y su empleo está supeditado
cuando se tienen las siguientes condiciones:
Procedimiento
Este método está basado en la prueba de t para lo cual se emplea la siguiente fórmula:
xdi
t
S ( x1 x 2)
Donde:
S ( x1 x 2)
di 2
( di) 2 / n
n(n 1)
13
Ejemplo:
Se realizó una investigación para determinar si existe diferencia de rendimiento de dos híbridos de
maíz en ocho localidades de una determinada zona climática, los resultados obtenidos en ton/ha se
presenta a continuación.
LOCALIDAD
Hibrido 1 2 3 4 5 6 7 8
H-1 5.5 4.5 5.1 4.9 4.9 4.3 5.5 5.0
H-2 4.9 3.8 4.3 4.0 4.6 4.8 4.2 5.0
En base a estos resultados determinar si existe una diferencia entre estos dos híbridos, considerando
que el híbrido 1 es el que se trata de introducir y el híbrido 2 es el que han estado empleando los
agricultores desde hace varios ciclos anteriores.
Desarrollo:
1. Planteamiento de Hipótesis
Ho: H1 = H2
Ha: H1 ≠ H2
HÍBRIDOS
Loc. H1 H2 di di
1 5.5 4.9 0.6 0.36
2 4.5 3.8 0.7 0.49
3 5.1 4.3 0.8 0.64
4 4.9 4.0 0.9 0.81
5 4.9 4.6 0.3 0.09
6 4.3 4.8 0.5 0.25
7 5.5 4.2 1.3 1.69
8 5.0 5.0 0.0 0.00
4.96 4.45 4.1 4.33
xdi 0.51
xdi 0.51
t 2.56
di 2
( di) / n
2
(0.6 0.0) (4.1) 2
/8
n( n 1) 8(8 1)
14
t= 2.56 7 G.L
5%---------2.365
1%---------3.499
Conclusiones
Luego de haber realizado la prueba de t se observa que existe una diferencia significativa al 5% ,
por lo que se acepta la hipótesis alternativa y se concluye que los híbridos tienen un
comportamiento diferente correspondiendo el mejor rendimiento al hibridó 1 , el que podría
reemplazar al que lo estaban utilizando los agricultores anteriormente.
Ésta prueba debe ser empleada en aquellos casos en los que e estudian dos tratamientos y cuando el
material experimental tenga las siguientes características:
Procedimiento
El método consiste en dividir el número de unidades experimentales en dos grupos, sortear los
tratamientos para cada grupo, considerando a cada uno de estos como una muestra de la población,
razón por la que se considera dos muestras independientes. Para el caso de esta prueba el número
de individuos o unidades experimentales de cada grupo pueden o no ser iguales.
Este método está basado en la prueba de t pero por ser muestras independientes se usa la siguiente
fórmula:
( x1 x 2)
S
n1 n 2
S 2c
n1 * n 2
S 2c
X 1 2
X 2
( X 1) 2 / n1 2
( X 2) 2 / n 2
( n1 1)(n 2 1)
Donde:
15
n2= número de individuos X2
Ejemplo:
Desarrollo:
1. Planteamiento de hipótesis
Ho: D1= D2
Ha: D1≠ D2
X1 X 2
t
n1 n 2
S 2c
n1 * n 2
S 2c
465.27 (64.5) / 9 532.44 (64.5) / 8 0.27
2 2
(9 1)(8 1)
7.17 8.15
t 3.88
98
0.27
9*8
16
t= -3.88 17 G.L
5% 2.110
1% 2.898
Conclusiones
La prueba de t indica que existe diferencia significativa al 1% por lo que se acepta la hipótesis
alternativa de que 1a dietas son estadísticamente distintas es decir que existe una influencia
marcada en la producción de leche con la dieta 2 por lo que se recomendaría su empleo.
Son aquellos en los que se investiga simultáneamente dos o más factores, dando como resultado un
determinado número de tratamiento.
17
1.8 EL ANÁLISIS DE VARIANZA
No es más que el procedimiento estadístico que sirve para medir la variación total de las
observaciones, la que se divide para sus componentes , quedando el residuo como error
experimental.
Además el análisis de varianza estudia la relación entre una variable dependiente y uno o más
factores independientes, estableciendo un balance entre la variabilidad inducida y la no explicada
que viene a ser el error experimental.
1.8.1 Formato
C.V %
Siendo:
18
1.8.2 Fuente de variación
Es el lugar donde van las fuentes de variación, la misma que consta de a variación total que se
descompone, en la variación conocida, que puede ser dependiendo del tipo de diseño en
tratamientos, etc y en la variación no controlada que corresponde al error experimental.
Grados de libertad
Suma de cuadrados
19
20
EXPERIMENTOS DE UN FACTOR CONDISEÑO COMPLETAMENTE
ALEATORIZADO. DFCA
Como queda explicado, el principal propósito de ,un diseño experimental es determinar el efecto de
ciertos tratamientos sobre alguna característica de la población, entendiéndose por tratamientos
cualquier modificación en las condiciones o procedimientos experimentales o cualquier subdivisión
lógica de los datos.
Si solamente existe una variable experimental se tiene un experimento de un factor . Por otro lado,
si no se imponen restricciones en la aleatorización de los items a1asignados a los diversos
tratamientos, el diseño se denomina completamente aleatorizado.
Para el tratamiento analítico de este diseño experimental es necesario entonces que existan:
El modelo planteado asume que cada una de las observaciones yij es la suma de los tres
componentes 1ineales siguientes: el efecto del promedio global el efecto del j-ésimo tratamiento;
y el error aleatorio asociado con la observación. Otro supuestos son:
21
Tabla 2.1
Arreglo de los datos en un diseño de un factor completamente aleatorizado.
Tratamientos ( o muestras)
Observaciones Total
T1……T!.....Tn
1 y11……y1j.....y1k
2 Y21……y2j.....y2k
n Yn1……ynj.....ynk
Total de Tratamientos Y1……y2.....yk Y
# de observaciones n n……. nk
Promedio de Tratamientos Y 1 Y 2 Yk Y
Donde:
n
Y1 y
11
ij total para las respuestas experimentales obtenidas en el tratamiento j-ésimo
n
Y1 y
11
ij / n , promedio para el j-ésimo tratamiento
n
Y y1 j y i ij , total de todas las observaciones
11
La dispersión de las respuestas es cuantitativa mediante las varianzas asociadas a cada componente
del modelo, vale decir: efecto global de tratamiento y del residuo o error experimental. En el
cálculo de tales varianzas intervienen las siguientes sumas de cuadrados como medidas de
variabilidad.
a. Suma de cuadrados total SCT, que establece la variación en el conjunto de todos los datos.
SCT ( y
j i
ij Y ...)2
22
b. Suma de cuadrados entre tratamientos , SCTr; que mide la variabilidad entre los
tratamientos
SCTr ( y
j i
ij Y ...) 2
SCE ( y
j i
ij Y ...) 2
( y
j 1 i 1
ij Y j )2 ( y
j i
ij Y ...)2 ( y ij Y ...)2
j i
Planteada la hipótesis nula de que no existe efecto diferente de los tratamientos; y si ésta es
verdadera, el cuadrado de los promedios del residuo dentro de los tratamientos, CME, estima la
misma varianza que el cuadrado promedio entre los tratamientos, CMTr, difiriendo los dos
cuadrados ,promedios solamente como resultado de la variación muestral aleatoria.
23
En lo referente a la variación entre los tratamientos, debemos señalar que solo se pierde un grado
de libertad para la media global estimada por Y. . , de tal modo que habiendo k medias muestrales,
aquella varianza se calcularía tomando en cuenta k-l grados de libertad.
La hipótesis nula de no existencia de efectos causados por los tratamientos, vale decir:
Ho : T1 T2 ...... Tx
o lo que es lo mismo
Ho : u1 u2 ...... u x
se rechazaría si el valor F calculado al dividir las varianzas entre y dentro de los el tratamientos es
mayor que el valor teórico correspondiente al nivel de significación seleccionado. Esto quiere decir
que la región crítica de la dócima es la cola superior de la distribución F, según lo sugiere la figura
que sigue:
Para facilitar los diversos cálculos requeridos en la determinación del valor F, la siguiente tabla de
análisis de varianza, TAV, es útil.
Tabla 2.2
Tabla esquemática del análisis de varianza para el diseño se un factor completamente
aleatorizado
Fuente de Suma de Grados de Cuadrados Razón de
Variación Cuadrados Libertad Medios Varianza
24
Otras fórmulas para el cálculo de las sumas de cuadrados se obtienen expandiendo los binomios
cuadráticos respectivos.
Estas son:
SCT (Yi
ij
2
) (Y ..) 2 / nk
SCT 1 / n (Y . j 2 ) (Y ..) 2 / nk
25
Ejemplo 1
Tabla 2.3.
CONTENTDO DE PROTEINA EXTRAIDA CON AGUA (g/g proteína) A PARTIR DE
CHOCHO AMARGO (L mutabiflis).
TRATAMIENTOS
OBSERV. 1 2 3 4 5 6 7 8 9 Y
1 0,1571 0,2336 0,163 0,1965 0,198 0,177 0,163 0,1034 0,1436 1,5352
2 0,1804 0,2064 0,1537 0,2154 0,2115 0,197 0,1743 0,1142 0,1348 1,5877
3 0,3042 0,3101 0,2659 0,3004 0,2043 0,2358 0,206 0,1502 0,1539 2,1308
4 0,3346 0,3468 0,2836 0,3211 0,2163 0,2144 0,2258 0,1533 0,1653 2,2612
5 0,207 0,267 0,2484 0,1667 0,1647 0,2119 0,1836 0,1448 0,1375 1,7316
6 0,2284 0,2946 0,2775 0,1773 0,185 0,2144 0,1955 0,1436 0,1443 1,8606
7 0,3181 0,3012 0,2802 0,1849 0,2096 0,2256 0,2264 0,1697 0,1534 2,0691
8 0,3341 0,2751 0,2957 0,1834 0,2286 0,2444 0,2465 0,1654 0,1459 2,1191
9 0,2526 0,2126 0,2672 0,1784 0,1819 0,1792 0,1938 0,1241 0,1334 1,7232
10 0,2825 0,233 0,2886 0,1953 0,1994 0,185 0,1836 0,1348 0,1446 1,8468
11 0,3218 0,309 0,3089 0,1988 0,2658 0,2256 0,247 0,1593 0,1721 2,2083
12 0,3397 0,312 0,3249 0,2223 0,248 0,2338 0,2656 0,1641 0,1821 2,2925
Promedio 0,2717 0,2751 0,2631 0,2117 0,2094 0,2120 0,2093 0,1439 0,1509
Total 3,2605 3,3014 3,1576 2,5405 2,5131 2,5441 2,5111 1,7269 1,8109 23,3661
Ho : u1 ...... u9
H1 : Al menos dos promedios son desiguales o, en su defecto :
Ho : T1 ...... T9
H1 : Al menos dos tratamientos producen diferents cantidades de proteína.
26
La hipótesis nula sería o no rechazada basándose en una prueba F, para lo cual se calculan las
sumas de cuadrados necesarias.
SCT (Y i
ij
2
) (Y ..) 2 / nk
SCT (0.1571) 2 ......(0.1812) 2 ( 23.368) 2 / 12 x9
SCT (0.1571) 2
......(0.1812) 2
5.0561 0.7489
(Y
2
SCT j / n) ( y..)2 / nk
SCT 1 / 12 (3.2604) 2 ......(1.8096) 2 5.0561
SCT 1 / 12(63.3192) 5.0561 0.2205
Los resultados de los cálculos determinan la tabla de análisis de varianza TAV, que a continuación
se indica.
Tabla 2.4.
TAV sobre el contenido de proteína extraída a partir de chocho
Fuente de Suma de Grados de Cuadrados Medios Razón de Varianza
Variación Cuadrados Libertad
27
2.4 Análisis de Varianza para el caso en que el número de respuestas experimentales por
tratamiento no sea igual.
Puede haber situaciones diversas por las cuales durante la ejecución de un experimento uno o más
tratamientos no registren el mismo número de respuesta experimentales que los otros. Esto
equivale a plantear que para k tratamientos se tienen n, j=1 ,...., k observaciones y cada n 1 no es
necesariamente igual.
Cuando ocurre lo anterior, el cálculo de las sumas de cuadrados se realiza como sigue:
( y..) 2
SCT (Yij ) 2
Total: j i nj j
( y ) 2 ( y..) 2
Tratamientos: SCTr
j n1 n1
Residuo: SCE SCT SCTr
Si comparamos 1as expresiones anteriores con aquellas utilizadas para la situación en que el
número de respuestas experimentales en todos los tratamientos es el mismo, notaremos que las
nuevas fórmulas Solo se diferencian por la “ponderación” que las distintas n. proporcionan a los
valores Sin embargo de esta apreciación que puede parecer meramente correctiva de cálculo, es
necesario señalar que cuando se trabaja con diferente tamaño muestral se introducen “sesgos”
afectan las sumas de cuadrados del error experimental y pueden llevar a conclusiones erróneas. Por
ello se debe en lo posible propender a un diseño en el cual todos los tratamientos posean el mismo
número de respuestas experimentales y aplicar el procedimiento que se va ilustrar en el siguiente
ejemplo solo si el investigador seguro de que los distintos tamaños muestrales no afectarán
sustancialmente las condiciones de aleatorización del experimento y no se pueda por razones
económicas o técnicas “recuperar” las observaciones faltantes o perdidas
Ejemplo 2.
28
PVM1 PVM2 PVM3 PVM4 PVM5 PVM6 PVM7
14 23,8 18,5 25,3 16,4 23,9 8,1
13,7 24,4 16,7 17,2 16,9 22,3 22,9
18 22,4 12,4 21,8 17,3 18 17,8
21,4 20,8 11,6 18 16,5 20,4 17,1
19 23,8 13,2 19,9 20,6 20,5 15,5
18 14,7 13,9 20,8
24,1 18,5 17,8
∑= 86,1 157,3 87,1 134,6 87,7 105,1 120 777,9
nj 5 7 6 7 5 5 7
Hipótesis Experimental
Las frutas que se expenden en los 7 mercados populares poseen el mismo peso
Tratamientos Puestos de venta en los mercados PVM.
Análisis de varianza
SCT (14.0) 2 ......... (17.8) 2
(787.9) 2
42
SCT 15290.91 14780.63
SCT 510.28
(86.1) 2 (130) 2
SCT ......... 14780.63
5 7
SCT 1482.64 3534.76 1264.40 2588.17 1538.26 2209.20 2414.29 14780.63
SCT 15031.72 14780.63
SCT 251.09
Suma de Cuadrados del Residuo, SCE
SCE SCT SCTr
SCE 510.28 251.09
SCE 259.19
29
Puestos de venta 251.09 6 41.84 4.84
Residuo 259.19 35 7.41
Total 510.28 41
F0.05= 2.38
Dado que la razón de varianza determinó significación estadista se concluy que las ciruelas u
“ovito” que se venden en los siete mercados muestrados son de diferente peso. Se procederá,
entonces, a un análisis de comparaciones múltiples, para determinar los rangos existentes. Como
ilustración .aplicará la prueba de Tukey.
30
Tabla 2.6
Resumen de “tratamientos” ordenados por promedios.
PVM3 PVM1 PVM5 PVM7 PVM4 PVM6 PVM2
nj 6 5 5 7 7 5 7
yj 87.1 86.1 87.7 120 134.6 105.1 153.3
Como Sabemos, esta prueba utiliza el rango máximo para encontrar el valor q , en la tabla de
rangos “estudentizados”.
Y i Y j q , ( n 1) CME / n
Dado que n representa igual tamaño muestral para todos los tratamientos, lo que no es la situación
que estamos analizando, es necesario utilizar un promedio número de respuestas experimentales
obtenidas por tratamiento. Winer (1971) sugiere como mejor promedio la media armónica, que se
calcula dividiendo el número de tratamientos para la suma de los recíprocos de los distintos
tamaños, vale decir:
K
ñ
1 / n j
j
Se tendrá en cuenta que para su aplicación en la fórmula, ñ será un número entero En el caso del
ejemplo que estamos discutiendo tendríamos.
7
ñ
1/ 6 1/ 5 1/ 5 1/ 7 1/ 7 1/ 5 1/ 7
7
ñ
1195
ñ 5.86
Se utiliza ñ=6
De tablas: q0.05, 7.6 = 5.90
Entonces el estadístico de prueba sería: (5.90) 41 / 6 6.56
31
PVM3 - 2,7 3,02 4,05 4,71 6,5 7,95
PVM1 - - 0,37 1,35 2,01 3,8 5,25
PVM5 - - - 1,03 1,69 3,48 4,93
PVM7 - - - - 0,66 2,45 3,9
PVM4 - - - - - 1,79 3,24
PVM6 - - - - - - 1,45
PVM2 - - - - - - -
Se encuentra que solo la diferencia mas grande, esto es 7.95, que corresponde a los puestos de
venta 2 y 3 es significativa.
Para aplicar las otras pruebas de comparaciones múltiples se sigue un procedimiento similar,
utilizando el promedio armónico del tamaño de Las muestras asociadas a los tratamientos.
Ejemplo 3.
1. Se realizo un estudio para determinar los ºBrix de cada tratamiento, y saber si son iguales
independientemente del conservante. Considerar un nivel de confianza igual a 95%
Observaciones 1 2 3 4
1 12,2 11,2 10,2 6,5
2 11,4 11,2 10,2 5,8
3 11,2 11,2 10,4 5,8
4 11,6 11,4 10 5,6
5 11,8 11,8 10 6
6 11,4 11,8 10,4 6
32
Tabla 1. ºBrix de jugo de manzana con diferentes edulcorantes
Observaciones 1 2 3 4
1 12,2 11,2 10,2 6,5
2 11,4 11,2 10,2 5,8
3 11,2 11,2 10,4 5,8
4 11,6 11,4 10 5,6
5 11,8 11,8 10 6
6 11,4 11,8 10,4 6
∑= 69,6 68,6 61,2 35,7
(∑Yij)2 4844,16 4705,96 3745,44 1274,49
∑Yij = 235,1
∑Yij2 = 2430,05
nk
Sc(total ) Yij Fc
Y
2
ij
Sc(tratamientos) Fc
n
(4844,16) 2 (4705,96) 2 (3745,44) 2 (1274,49) 2
Sc(tratamientos) 2303,000417
6
Sc(tratamientos) 125,3412
Sc(error ) Sc(total ) Sc(tratamientos)
Sc(error ) 127,04958 125,2412
Sc(error ) 1.7083
g . l N º total de datos 1
g . l (total ) nk 1 24 1 23
g . l (tratamiettos) k 1 4 1 3
g . l (error ) k (n 1) 4(6 1) 20
SC
Cuadrados medios
GL
33
125,3412
Cuadrados medios(tratamientos)
3 41,7804
1,7083
Cuadrados medios(error )
20 0,085415
127,04958
Cuadrados medios(total )
23 5,52389478
CM (Tratamient o)
F (calculado)
CM (error ) 489,145935
F tablas 3.10
DECISIÓN:
- La hipótesis nula debe ser rechazada, es decir existen diferencias significativas entre los
ºBrix del jugo de manzana con cada edulcorante. La hipótesis alternativa puede ser
aceptada, con un nivel de confianza del 95%.
Ejemplo
2. En un estudio que tuvo como objetivo determinar la calidad del pan que se comercializa en
las 6 principales panaderías de la ciudad de Ibarra, se tomaron muestras de pan de cada una de
ellas. Las respuestas experimentales que se reportaron en la tabla siguiente corresponden a pesos
individuales de cada pan.
34
Tabla 2. Pesos en gramos de pan de muestras obtenidas Panaderías
Observaciones 1 2 3 4 5 6
1 25,5 28,4 34,2 31,1 24,5 25,6
2 24,3 27,5 29,9 31,4 26,8 23,9
3 20,2 24,5 30,5 32,6 27,7 24,7
4 27,8 23,8 32,6 28,5 25,4 26,8
5 28,8 25,6 30,5 27,5 28,4 27,7
6 26,5 26,6 31,1 29,5 29,9 26
7 24,9 27,5 29 25,5 27,9 28,5
nk
Sc(total ) Yij Fc
Sc(total ) 319,3247
Y
2
ij
Sc(tratamient os ) Fc
n
(31684)2 (33819,21)2 ....... (36328) 2 (33562)2
Sc(tratamientos) 32181,87524
7
35
Sc(tratamientos) 180,7047
g . l N º total de datos 1
g . l (total ) nk 1 42 1 41
g . l (tratamiettos) k 1 6 1 5
g . l (error ) k (n 1) 6(7 1) 36
SC
Cuadrados medios
GL
319,3247
Cuadrados medios(tratamientos)
41 41,7804
1,7083
Cuadrados medios(error )
20 0,085415
127,04958
Cuadrados medios(total )
23 5,52389478
CM (Tratamient o)
F (calculado) 489,145935
CM (error )
F tablas 3.10
Análisis de Varianza (ADEVA) de los pesos en gramos de pan de muestras obtenidas
Panaderías
DECISIÓN:
36
- La hipótesis nula debe ser rechazada ya que existen diferencias significativas entre los
pesos del pan en las diferentes panaderías de la ciudad de Ibarra, la calidad de pan no es la
misma. Se puede aceptar la hipótesis alternativa con un nivel de confianza del 95%.
Dependiendo del tipo de situación o problema que se esté analizando, los efectos de un
experimento pueden ser fijos o aleatorios y por lo tanto el modelo apropiado debe estar relacionado
precisamente con la particular característica del efecto experimental.
Ho : u1 u2 ...... uk , j 1,......k
El modelo de efectos aleatorios, en cambio, es aplicable cuando se asume que los tratamientos son
una muestra aleatoria de todos los tratamientos posibles.
37
tratamientos serán las tres fábricas y los resultados de los análisis del laboratorio correspondientes
a las características fisicoquímicas estudiadas, podrían ser las variables de interés. Planteado de
esta manera el problema, lo que se desea es conocer la variabilidad existente entre todas las
fábricas que producen el particular producto. Las tres fábricas resultan entonces ser una muestra
aleatoria de todas aquellas que elaboran la salsa de tomate.
La principal diferencia con el modelo anterior radica en que de requerirse repetir el experimento,
habrán de utilizarse los productos de las fábricas seleccionadas nuevamente al azar, dentro de las
cuales no necesariamente podrían estar las primeras.
Ho: σ2=0
donde σ2 es la varianza poblacional.
En el caso de rechazar la hipótesis nula, la conclusión seria que hay evidencia de variabilidad entre
los grupos ensayados. Para el ejemplo, acuello significaría los procesos utilizados en las fábricas
tienen un efecto significativo sobre la calidad del producto.
Para la resolución de cualquiera de los dos esquemas se utiliza el mismo modelo matemático, esto
es:
yij T j Eij
Donde:
µ= promedio general
Tj= efecto del j-ésimo tratamiento
Eij= error experimental
i= 1….n
j= 1….k
Una vez efectuado el análisis de varianza respectivo, de rechazarse la hipótesis, las pruebas de
comparaciones múltiples que generalmente siguen a dichos análisis serán diferentes.
Efectivamente mientras que para el modelo de efectos fijos se aplica las pruebas DMS, de TUKEY,
de contrastes ortogonales, etc, para el modelo de efectos aleatorios, en cambio, el interés deberá
centrarse en la correlación intraclase, es decir en un estimador del porcentaje de la variabilidad total
que es consecuencia de las diferencias entre los distintos tratamientos. En otras palabras, este
38
coeficiente de correlación intraclase mide el porcentaje de la variabilidad que puede ser explicado
por los grupos de tratamientos utilizados en el experimento.
39
40
PRUEBAS DE COMPARACIONES MULTIPLES
En los casos en que la hipótesis nula de no existencia de diferencias entre tratamientos sea
rechazada, queda por conocer cuales promedios son los que difieren. Esta interrogante no puede ser
contestada utilizando solamente la prueba F y es necesario por tanto enfocar el análisis desde otro
punto de vista.
DMS t 2CME / n
Donde:
El uso de CME como estimador de la varianza se justifica porque la prueba F basa en la suposición
de que todas las poblaciones consideradas en los tratamientos poseen la misma varianza. Entonces,
dado que el estimador por intervalo del promedio de un tratamiento individual es:
Y j t , v S y . j ; y S y j (CME / n)
Donde:
Sy 2CME / n
41
Si bien es cierto que esta técnica es útil para el caso anotado, es decir cuado el tamaño de la
muestra es igual y se ha rechazado la hipótesis nula, es necesario recalcar que de ser empleada
cuando la prueba F no señala ninguna diferencia significativa podría encontrarse pares de
promedios de tratamientos cuya diferencia exceda la DMS y determinar consecuentemente
conclusiones erróneas ya que tales diferencias pueden deberse a variaciones causadas por el error
muestral.
Además debe notarse que por no haber independencia entre los estimadores del error estándar S y
el nivel de confianza para el total de los estimadores resultaría ser (1 - α) n lo que significa que este
nivel de confianza se reduce aún cuando k sea pequeña.
Ejemplo
( y1 y2 ) t , v S y
Tratamientos 8 9 7 5 4 6 3 2 1
Promedio 0,1439 0,1509 0,2093 0,2094 0,2117 0,212 0,2631 0,2717 0,2751
0,1439 0 0,007 0,0654 0,0655 0,0678 0,0681 0,1192 0,1278 0,1312
0,1509 - 0 0,0584 0,0585 0,0608 0,0611 0,1122 0,1208 0,1242
0,2093 - - 0 1E-04 0,0024 0,0027 0,0538 0,0624 0,0658
0,2094 - - - 0 0,0023 0,0026 0,0537 0,0623 0,0657
42
0,2117 - - - - 0 0,0003 0,0514 0,06 0,0634
0,212 - - - - - 0 0,0511 0,0597 0,0631
0,2631 - - - - - - 0 0,0086 0,012
0,2717 - - - - - - - - 0,0034
0,2751 - - - - - - - 0
Solamente en este caso el análisis termina allí. Por el contrario si la prueba F es significativa, habrá
de concluirse que los promedios de los tratamientos no son iguales y el análisis tendrá que
proseguir con el propósito de llegar a determinar cuales son las diferencias que cuentan realmente
en el experimento y cuales son las que no cuentan.
Para ello será necesario efectuar contrastes o comparaciones entre los promedios de tratamientos,
sea que aquellos contrastes contemplen solamente parejas, como en el caso de la Diferencia
Mínima Significativa, o promedios que involucren comparaciones más complejas.
Por ejemplo supongamos que hay cuatro condiciones experimentales, de las cuales una es el
“control” y las otras tres, tratamientos diferentes. Cabría entonces preguntarse: difieren los distintos
tratamientos entre ellos? O difieren los tratamientos combinados del control? En este último caso
se tendría que hacer una comparación entere dos promedios, esto es, el promedio del grupo control
respecto al promedio de las tres medias de tratamientos; en el primero, en cambio, se trataría de
contrastar entre los tres promedios experimentales.
43
Contraste = (C
j
j )Y1
donde
C j C1 C2 ...... Ck 0
Considerando como otro ejemplo. Supóngase que esta vez hay un grupo control y dos tratamientos
diferentes y que se desea contrastar:
a. El promedio del grupo control con el promedio de las medias de tratamientos es decir,
establecer si existe o no diferencia significativa entre el control y el efecto experimental
general, y
b. El promedio de una grupo experimental con el otro grupo, es decir contrastar cualquier
diferencia existente entre dos tratamientos experimentales.
es decir
(Y 2 ) (Y 3 )
(Contrate 1) (Y1 )
2
Ambos conjuntos e coeficientes (1,-1/2,-1/2) o (0,1,-1) suman cero y por tanto satisfacen la
condición planteada anteriormente.
Las ventajas de utilizar los contrastes son varias, pero se resumen de la manera siguiente:
1. Pueden aplicarse tanto para comprobar las medias de dos tratamientos como para efectuar
comparaciones complejas entre los promedios combinados.
2. Para aquellos experimentos en que están presentes variables independientes es posible
encontrar conjuntos especiales de coeficientes.
44
3. La evaluación estadística puede simplificarse con el uso de coeficientes para el cálculo de las
sumas de cuadrados.
4. La independencia de dos o más contrastes pueden determinarse fácilmente comparando los
conjuntos de coeficientes.
Considerando los promedios o totales de los tratamientos, para el caso de igual número de
observaciones por tratamiento, las fórmulas que permiten calcular las sumas de cuadrados
SCTrco
n (C1 )(Y )1 2
(C )1
2
SCTrco
(C )(Y )
1 1
2
n (C ) 1
2
Nótese que la diferencia entre las expresiones es básicamente el uso del total en lugar del promedio
en la segunda fórmula, lo que determina que n pase al denominador.
Ejemplo
En un estudio sobre el cacao ecuatoriano se obtuvieron los valores del ex-tracto etéreo que a
continuación se indican. Las muestras 1 y 2 corresponden a una variedad de cacao distinta a la de
las muestras 3 y 4.
Tabla 3.1
Valores de extractó etéreo* en dos variedades de cacao ecuatoriano, producto crudo y
fermentado
VARIEDAD A VERIEDAD B
T1 T2 T3 T4
51,52 52,07 50,01 51,79
52,53 53,8 50,46 51,71
52,8 53,09 50,8 51,94
50,11 51,22 50,25 51,13
49,89 51,72 50,16 51,65
51,53 52,17 49,79 51,4
yj 51,3967 52,3450 50,2450 51,6033
En el experimento efectuado, los tratamientos 1 y 3 se refieren a producto crudo, en tanto que los
tratamientos 2 y 4 a producto fermentado. Para ilustra el uso de los contrastes comparemos
45
entonces los grupos de la variedad A respecto a los grupos de la variedad B y también los grupos 1
y 2, 3 y 4, en cada variedad. Los coeficientes apropiados serian:
Contraste 1: (1, +1, 1, -1)
Contraste 2: (1,-1, 0, 0)
Contraste 3: (0, 0, -1, 1)
Procedemos en primer lugar a calcular la tabla de análisis de varianza. Resumen de los totales.
T1 T2 T3 T4 Gran Total
yj 308.38 314.07 301.47 309.62 1233.54
(Y
2
SCT ij ) (Y ..)2 / nk
i
Y
2
SCT ij ( y..) 2 / nk
j i
46
Total 26.310 23
Contrastes 1:
SCT .co
(1)(308.38) (1)(314.07) (1)(301.47) (1)(309.62) 2
6 (1) 2 (1) 2 ( 1) 2 ( 1) 2
SCT 129.049 / 24
SCT 5.377
Contrastes 2:
SCT .co
(1)(308.38) ( 1)(314.07) (0)(301.47) (0)(309.62)
2
6 (1) 2 (1) 2
SCT 32.376 / 12
SCT 2.698
Contraste 3:
SCT .co
(0)(308.38) (0)(314.07) (1)(301.47) (1)(309.62) 2
6 ( 1) 2 (1) 2
SCT 66.423 / 12
SCT 5.535
47
Ho : U1 U 2 U 3 U 4
Contraste 1:
H1 : U1 U 2 U 3 U 4
Ho : U1 U 2
Contraste 2:
H1 : U1 U 2
Ho : U 3 U 4
Contraste 3:
H1 : U 3 U 4
3. 4 ANÁLISIS ORTOGONAL
Este tipo de análisis es adecuado para extraer de los datos experimentales partes de información
independientes. Para ello es necesario utilizar conjuntos de coeficientes C 1 tales que además de la
propiedad exigida para que sea una comparación, esto es que ∑ C 1= 0, satisfagan que:
∑(Ci)(Cj) = 0
Si por ejemplo tenemos los conjuntos de coeficientes (1,-1/2,-1/2) y (0,1,-1) éstos si serían
ortogonales porque:
∑C1= 0 se cumple
En efecto:
1+(-1/2)+(-1/2)=0 y
0+1-1= 0
Y además también ocurre que:
∑(Ci)(Cj) = 0
(1)(0)+(-1/2)(1)+(-1/2)(-1) = 0 -1/2 + 1/2 = 0
Con cada comparación ortogonal es posible obtener información no relacionada entre sí: lo que
significa identificar piezas de información que reflejen independencia estadística. El número de
tales comparaciones ortogonales depende de los grados de libertad que posea la suma de cuadrados
entre tratamientos; efectivamente para k tratamientos el número posible de comparaciones
ortogonales será igual a k-1. De otro lado, es necesario indicar que el total de la suma de cuadrados
de tales contrates corresponde a las suma de cuadrados de tratamientos, los cual no necesariamente
48
es cierto cuando se utilizan comparaciones que no sean ortogonales. En las aplicaciones prácticas,
no todas las k-1 comparaciones ortogonales pueden ser necesario evaluarse, porque no todas ellas
pueden tener “sentido” para el experimentador. Entonces podría darse que la naturaleza del
experimento solo requiera formar conjuntos incompletos ortogonales.
Ejemplo
- Entre variedades:
crudo fermentado (1, -1, 1, -1)
- Entre cacao crudo
de las dos variedades (1 , 0 -1 , 0)
- Entre cacao fermentado
de las dos variedades (0, 1, 0,-1 )
T1 T2 T3 T4
yj 308.38 314.07 301.47 309.62
SCTrco
(C )( y. )
1 j
2
n (C ) j
2
Comparación 1.
SCT .co
(1)(308.38) ( 1)(314.07) (1)(301.47) (1)(309.62)
2
6 (1) 2 (1) 2 (1) 2 ( 1) 2
SCT 191.546 / 24
SCT 7.98
Comparación 2.
49
SCT .co
(1)(308.38) (1)(301.47) 2
6 (1) 2 ( 1) 2
SCT 47.748 / 12
SCT 3.98
Comparación 3.
SCT .co
(1)(314.07) (1)(309.62)
2
6 (1) 2 (1) 2
SCT 19.803 / 12
SCT 1.65
7.98+3.98+1.65=13.61
50
Esta prueba considera un estadístico de comparación tal que es más alto para aquellos pares de
promedios de tratamientos que están más alejados. Esto significa que si Y .1 , Y .2 , Y .3 son los
promedios de tratamientos dispuestos en orden ascendente (de menor a mayor), entonces en una
prueba del tipo Ho: u1 = u3 debería haber una relación de error mayor que en una prueba Ho: u 1 =
u2.
Precisamente por lo anotado, la prueba de Duncan considera varías diferencias críticas y difiere en
ello de la prueba DMS que solo consideraba una diferencia para efectos de comparación de todos
los contrastes entra parejas de tratamientos.
Para rechazar la hipótesis Ho: u i = uj donde tanto Yi como Yj se refieren a promedios muéstrales de
K tratamientos que han sido ordenados, es necesario que ocurra lo siguiente:
Yi Y j d CME / n
donde dr(n-1) se debe encontrar en una tabla denominada de valores críticos para la prueba de rangos
de DUNCAN considerando r = rango y (n-l) = grados de libertad del error.
51
Ejemplo
Los promedios de tratamientos del experimento descrito en el ejemplo 5, ordenados en forma
ascendente se reportan a continuación.
T3 T1 T4 T2
Y j 50.245 51.396 51.603 52.345
Estadísticos de prueba:
Rango 4: (3.18)(0.325)=1.0335
Rango 3: (3.10)(0.325)= 1,0075
Rango 2: (2.95)(0.325)= 0.958
Una forma de observar las diferencias es uniendo con una línea aquellos promedios que no
difieren o en su defecto escribiendo letras idénticas, según se indica a continuación:
T3 T1 T4 T2
50.245 51.396 51.603 52.345
T3 a
T1 ab
T4 bc
T2 c
3.6 PRUEBA DE RANGO DE NEWMAN’S – KEULS
52
El procedimiento es similar al anterior, en el sentido de que también compara los rangos entre
promedios. No obstante , los valores críticos corresponden a la tabla de rangos “estudentizados” .
El estadístico de prueba es el siguiente:
Yi Y j q , r ( n 1) CME / n
Ejemplo
Para el caso que estamos analizando la situación seria la siguiente:
Al comparar la diferencia entre promedios obtenidas (ver ejemplo 7) con los distintos valores
críticos se observa que existe diferencia significativa para el caso de r=4, pues 2.1 es mayor que
1.697
Para esta prueba se utiliza el rango máximo o extremo y se aplica el valor crítico encontrado en la
tabla de rangos “estudentizados”, el cual corresponde a la diferencia crítica mayor de la prueba de
Newman’s-Keuls.
Yi Y j q , r k ( n 1) CME / n
Donde q , r ( n 1) , se obtienen como en el caso anterior pero solo para r máximo, La prueba resulta
entonces mucho más conservadora que las anteriores.
Ejemplo .
En el mismo experimento siendo el valor crítico para r=4 el máximo, el estadístico de prueba
sería:
q0.05; 4.5 * CME / n (5.22)(0.325) 1.697
53
La conclusión es similar a las anteriores, esto es que para un nivel de significación α=0.05 se
encuentra diferencias significativas solo para el rango 4 responde a los tratamientos 2 y 3.
Considerando k tratamientos con n observaciones cada uno, en esta dócima el estadístico de prueba
es calculado con el mismo valor F utilizado para contrastar la razón de varianza de la tabla de
análisis de varianza, vale decir el correspondiente a (k-1) grados de libertad en el numerador y k(n-
1) grados de libertad en denominador. En efecto, tal estadístico de prueba es:
Y i Yj ( k 1) * F 2CME / n
Y i Yj ( k 1) * F CMError / ni CMError / n j
La prueba de Scheffe sirve también para docimar contrastes ortogonales, en cuyo caso el
estadístico de prueba difiere del anterior solamente en que el valor 2 de la fórmula se debe
reemplazar por ]a suma de los cuadrados de los coeficientes del contraste. Entonces, si por ejemplo
la comparación ortogonal está definida los coeficientes (-1/2 , 1, -1/2), en lugar de 2 se debería
utilizar 3/2.
54
Ejemplo
1. Se requiere probar la eficiencia 5 compuestos enzimáticos como ablandadores de carne,
para lo cual se ensayaron 5 tratamientos y un control, obteniéndose los siguientes resultados
de dureza de la carne (Kg/cm2).
Obsvs T1 control T2 T3 T4 T5 T6
1 4,9 4,4 2,6 4,3 3,4 2,1
2 4,7 3,5 3,3 4,3 3 2,8
3 4,6 3,8 3,9 4,2 2,9 2,6
4 4,3 3,1 3,8 4,8 2,8 2,6
5 4 3,5 2,6 4,2 3,1 2,5
6 4,5 3,6 2,9 4 2,7 2,6
7 4,4 3,2 3,9 3,8 2,6 1,9
∑= 31,4 25,1 23 29,6 20,5 17,1
X= 4,485714286 3,58571429 3,285714286 4,22857143 2,928571429 2,442857143
(∑Yij)2 985,96 630,01 529 876,16 420,25 292,41
∑Yij = 146,7
∑Yij2 = 538,75
- CON FORMULAS
nk
(6 * 7 )
Fc( factor de corrección) 512,402143
Sc(total ) Yij Fc
2
Y
2
ij
Sc(tratamientos) Fc
n
(985,96) 2 (630,01) 2 (529) 2 (876,16) 2 (420,25) 2 (292,41) 2
Sc(tratamientos) 512,402143
7
Sc(tratamientos ) 20,9964286
55
g . l N º total de datos 1
g . l (total ) nk 1 42 1 41
g . l (tratamietos) k 1 6 1 5
g . l (error ) k ( n 1) 6(7 1) 36
SC
Cuadrados medios
GL
20.9964286
Cuadrados medios (tratamientos)
5 4,19928572
5,351428
Cuadrados medios(error )
36 0,14865079
26,347857
Cuadrados medios(total )
41 0,64263067
CM (Tratamient o)
F (calculado)
CM (error ) 28,2493327
F tablas 2,477
56
PRUEBAS DE COMPARACIÓN MÚLTIPLE
2SCerror
DMS t gle, *
n
2 * 0,148650
DMS 2,028093987 *
7
DMS 0,41796284
T6 T5 T3 T2 T4 T1 DMS
2,4428 2,9285 3,2857 3,5857 4,2285 4,4857
T6 2,4428 0 - - - - -
T5 2,9285 *0,4857 0 - - - - 0,4196284
T3 3,2857 *0,8429 0,3572 0 - - -
T2 3,5857 *1,1429 *0,6572 0,3 0 - -
T4 4,2285 *1,7857 *1,3 *0,9428 *0,6428 0 -
T1 4,4857 *2,0429 *1,5572 *1,2 *0,9 0,2572 0
K ( K 1)
Número de Comparaciones
2
6(6 1)
Número de Comparaciones
2
Número de Comparaciones 15
CM error
RMD RMD gle, *
n
0.148650
RMD 2,876 *
7
RMD 0,41910561
57
Valores de Tablas Calculado
2 2,876 0,41910561
3 3,023 0,44052721
4 3,119 0,45451683
5 3,188 0,46457187
6 3,24 0,47214958
T6 T5 T3 T2 T4 T1
2,4428 2,9285 3,2857 3,5857 4,2285 4,4857
T6 2,4428 0 - - - - -
T5 2,9285 *0,4857 0 - - - -
T3 3,2857 *0,8429 0,3572 0 - - -
T2 3,5857 *1,1429 *0,6572 0,3 0 - -
T4 4,2285 *1,7857 *1,3 *0,9428 *0,6428 0 -
T1 4,4857 *2,0429 *1,5572 *1,2 *0,9 0,2572 0
Duncan 0,47214958 0,46457187 0,45451683 0,44052721 0,41910561
3. Prueba de Tukey
CM error
D Q gle, *
n
0.148650
D 4,2727 *
7
D 0,62263997
T6 T5 T3 T2 T4 T1 Tukey
2,4428 2,9285 3,2857 3,5857 4,2285 4,4857
T6 2,4428 0 - - - - -
T5 2,9285 0,4857 0 - - - - 0,62263997
T3 3,2857 *0,8429 0,3572 0 - - -
T2 3,5857 *1,1429 *0,6572 0,3 0 - -
T4 4,2285 *1,7857 *1,3 *0,9428 *0,6428 0 -
T1 4,4857 *2,0429 *1,5572 *1,2 *0,9 0,2572 0
1. Prueba de Newman
CM error
N q gle , *
n
58
0.148650
N 5.189 *
7
N 0,756167
T6 T5 T3 T2 T4 T1
2,4428 2,9285 3,2857 3,5857 4,2285 4,4857
T6 2,4428 0 - - - - -
T5 2,9285 0,4857 0 - - - -
T3 3,2857 *0,8429 0,3572 0 - - -
T2 3,5857 *1,1429 *0,6572 0,3 0 - -
T4 4,2285 *1,7857 *1,3 *0,9428 *0,6428 0 -
T1 4,4857 *2,0429 *1,5572 *1,2 *0,9 0,2572 0
NEWMA
N 0,756167951 0,72920879 0,694234751 0,64468819 0,563810716
5. Prueba de SCHEFFE
S ( Fo) * ( Sd )
Fo F( gle , ) ( K 1)
2CM error
Sd
n
2CM error
Sd
n
Fo F( gle , ) ( K 1)
2 * 0.148650
Sd
Fo 2.477 * (6 1) 7
Fo 12,3858433 Sd 0,20608652
S ( Fo) * ( Sd )
S 12,3858 * 0.2060
S 2,5525554
T6 T5 T3 T2 T4 T1 Sheffe
2,4428 2,9285 3,2857 3,5857 4,2285 4,4857
T6 2,4428 0 - - - - -
59
T5 2,9285 0,4857 0 - - - - 2.5525
T3 3,2857 0,8429 0,3572 0 - - -
T2 3,5857 1,1429 0,6572 0,3 0 - -
T4 4,2285 1,7857 1,3 0,9428 0,6428 0 -
T1 4,4857 2,0429 1,5572 1,2 0,9 0,2572 0
60
61
DISEÑOS DE DOBLE CRITERIO DE CLASIFICACION
Los experimentos de bloques son muy útiles para analizar situaciones en las cuales las respuestas
de las unidades experimentales a los tratamientos no son homogéneas.
Efectivamente, si algún factor extraño ejerce influencia sobre las observaciones, lo conveniente es
aislar este factor seleccionando “bloques” de elementos, cada uno de los cuales es más homogéneo
con respecto a la variable de estudio. Una vez hecho esto, las unidades experimentales se asignarán
aleatoriamente a los diferentes bloques, permitiéndose la separación de los efectos de tratamientos
de los efectos del factor expraño, así como la separación de aquellos dos efectos del error
aleatorio.
yij u Bi T j Eij
i 1,......., n
j 1,......, k
Además:
B i 0; T ; j Eij N (0, 2 )
La matriz siguiente resume la presentación de las respuestas experimentales para un diseño de este
tipo.
Tabla 4.1
Representación generalizada de las respuestas experimentales en un diseño de bloques.
62
TRATAMIENTOS
Bloques 1 2…… K Total de Medias
bloques
.
.
n Yn1 Yn2 Ynk Yn Yn
Medias Y1 Y2 Yk Y .....
Dado que cada combinación bloque-tratamiento es una población cuya distribución probabilística
se asume normal con media u y varianza σ2 en la tabla anterior se observa que de las kn
poblaciones posibles se han extraído muestras aleatorias e independientes de tamaño uno.
(Y ij Y ...)2 (Y i
Y ...)2 (Y j Y ..) (Y ij Y i ) (Y j Y ..) 2
i
63
que no exista realmente efecto extraño a los tratamientos, la reducción de la suma de cuadrados del
error no compensaría la disminución en potencia de la prueba que resulta de la pérdida de los
grados de libertad del denominador y por lo tanto la razón de varianza es menos sensible para
detectar diferencias significativas entre los tratamientos.
La tabla de análisis de varianza para un diseño de este tipo se presentaría así:
Tabla 4.2
TAV para un diseño de bloques al azar
Ejemplo 1
Catadores
Fuente de Totales de Promedios de
1 2 3 4 5
Variación tratamientos tratamientos
1 4 3,5 4,5 3,5 4 19,5 3,9
A 4,5 4 5 4,5 4 22 4,4
B 4 4 4,5 3,5 4,5 20,5 4,1
AB 4,5 4,5 4,5 4 4,5 22 4,4
C 2,5 2,5 2,5 2,5 2,5 12,5 2,5
AC 5 4,5 4 3,5 4 21 4,2
BC 4,5 4 2,5 4 4 19 3,8
ABC 5 5 3,5 4 4 21,5 4,3
D 4 3,5 4 4 2 17,5 3,5
AD 4,5 5 3 4,5 4,5 21,5 4,3
BD 4,5 3,5 3,5 3,5 4,5 19,5 3,9
ABD 4,5 4,5 4 3,5 4,5 21 4,2
CD 4,5 4,5 3,5 3,5 4,5 20,5 4,1
ACD 4,5 4 4 3,5 5 21 4,2
BCD 4,5 4,5 4,5 3,5 3,5 20,5 4,1
64
ABCD 4 4 3,5 3 3 17,5 3,5
Total de
69 65,5 61 58,5 63 317
Bloques
Dada las características del experimento es claro que se trata de un experimento de bloques al azar
donde las condiciones de proceso son los tratamientos y los bloques son los catadores; la prueba
quedaría planteada entonces como sigue:
No es necesario plantear ninguna hipótesis con respecto al efecto de los catadores porque las
medias de los bloques, en el supuesto de bloques al azar, son meramente indicativas de las
diferencias del factor exógeno a los tratamientos que en este ejemplo lo constituye la subjetividad
de cada catador, que precisamente se desea aislar.
65
2. Nivel de significación: α = 0.05
4. Regla de Decisión: rechazar H0 nivel de significación α = 0.05 si el valor calculado con las
respuestas experimentales es mayor que el correspondiente valor teórico.
5. Cálculos:
SCB 1 / 16 (69.0) 2 ..... (63.0) 2 1256.11
SCB 20163.5 / 16 1256.11
SCT 4.11
SCTr 1 / 5 (19.5) 2 ..... (17.5) 2 1256.11
SCTr 6366.5 / 5 1256.11
SCT 17.19
66
Tabla 4.3
TABLA DE ANALISIS DE VARIANZA
Fuente de
SC GL CM F
variación
Catadores 4.11 4 1.028
Tratamientos 17.19 15 1.146 4.42 *
Residuo 15.59 60 0.259
Total 38.89 79
67
En este caso, entonces, los mejores néctares serán los correspondientes a los tratamientos A y AB.
Igual procedimiento se debe seguir para las otras pruebas de comparaciones múltiples teniendo
cuidado de utilizar apropiadamente los estadísticos de prueba que corresponden a cada una.
Para la situación en que alguna respuesta experimental no se hubiere podido obtener, en un diseño
de bloques al azar podría estimarse tal observación de la siguiente manera:
n * yi k * y j Y ..
Yij
( K 1)(n 1)
Donde:
Por cada estimación que se haga se precisa disminuir en una unidad los grados de libertad del
residuo.
Ejemplo
Considérese el experimento que se plantea en base a la matriz de datos que sigue:
Tratamientos
1 2 3 Total
Bloques 1 4.7 9.4 6.3 20.4
2 3.5 7.6 5.1 16.2
3 0.1 1.8 1.9
4 1.6 6.2 3.6 11.4
Total 9.9 23.2 16.8 49.9
Con el valor calculado, 4.55, se procede a determinar la tabla de análisis de varianza siguiendo el
mismo procedimiento anterior, cuidando eso si de restar un grado de libertad al residuo.
68
Cuando se requiere un efecto combinado o interactuante de dos variables sobre una variable
respuesta, como sería por ejemplo la situación que se presenta en un proceso térmico necesario para
esterilizar comercialmente un producto alimenticio enlatado, en el cual cada combinación de
tiempo y temperatura empleados es un tratamiento, se deben utilizar diseños factoriales tales que
cada factor actúe con un cierto número de niveles. Entonces, si a es el número de niveles del factor
A y b el número de niveles del factor B en el experimento se requerirán axb tratamientos por
replicación.
El diseño de dos factores difiere del diseño de bloques substancialmente en que ninguno de los dos
factores es considerado “exógeno” a los tratamientos. Por el contrario en tales diseños factoriales
las axb combinaciones de tratamientos se “corren” aleatoriamente para obtener la información
necesaria (respuestas experimenita1es) que permitan evaluar el efecto combinado de ambos
factores (interacción) así como el efecto independiere de cada uno.
Desde el punto de vista económico, los diseños factoriales resultan ser más eficientes puesto que
permiten simultáneamente docimar varias hipótesis. En efecto con la misma tabla de análisis de
varianza es posible que evaluemos lo siguiente:
El número de tratamientos que deberán ejecutarse depende de cuántos niveles tengan los factores
bajo estudio; por ejemplo, un diseño 4x3 significa que habrán 12 tratamientos, distintos, producto
de 4 niveles del factor A y 3 niveles del factor B. No obstante, como se requieren obtener
suficientes grados de libertad para estimar la varianza del residuo o error experimental, será
necesario replicar cuando menos una vez adicional el experimento.
Entonces, cada respuesta experimental puede expresarse por el siguiente modelo matemático:
69
Yijk Ai B j ( AB)ij Rk Eijk
donde:
µ = efecto global
Ai= efecto del i-ésimo nivel del factor A; i = 1,…….a
Bj = efecto del j-ésimo nivel de1fator B; j = 1….. b
(AB)ij = efecto de la interacción entre los factores A y B
Rk = efecto de las replicaciones, k = 1,…….., r
Eijk = Residuo o error experimental
Una interacción es un efecto adicional que se produce debido a la combinación particular de los
niveles con que actúen los factores. Por ello, cuando se grafican los promedios de las respuestas
experimentales con respecto a las combinaciones diversas de los niveles de los factores, se
obtendrán líneas que se cruzan. En cambio, la ausencia de interacción se reflejará en líneas
paralelas, según se ilustra a continuación.
70
del residuo como si se tratara de un diseño de bloque, donde los bloques vienen a ser sustituidos
por las replicaciones.
Tabla 4.4
Disposición de la matriz de respuestas experimentales de un diseño factorial 3x4, en 3
replicaciones
Total de
Combinación de Replicaciones
Tratam.
tratamientos
R1 R2 R3 Yij
a0b0 Y111 Y112 Y113 Y11
a0b1 Y121 Y122 Y123 Y12
a0b2 . . . .
a0b3 . . . .
a1b0 Y211 Y212 Y213 Y21
a1b1 . . . .
a1b2 . . . .
a1b3 . . .
a2b0 Y311 Y312 Y313 Y31
a2b1 . . . .
a2b2 . . . .
a2b3 . . . .
Total de Replicas Y.1 Y.2 Y.3 Y…
Una vez calculada la SCTr se encuentran las sumas de cuadrados de los efectos principa1es de A y
B así como la suma de cuadrados de la interacción (AB) a partir de una matriz formada con los
totales de los tratamientos.
71
FACTOR B
b0 b1 b2 b3 Total Yi…
a0 Y11 Y12 Y13 Y14 Y1….
Con la matriz de totales se opera nuevamente como si se tratara de un diseño de doble entrada
Entonces:
Debe notarse que en el cálculo de todas las sumas de cuadrados interviene el término constante (Y..
)2/abr.
Ejemplo .
72
Á, pretratamiento aplicado previo a la deshidratación (3 niveles)
a0, sin pretratamiento, SINPRE
a1, exposición de la zanahoria al vapor durante 5 minutos, VAPOR
a2, sulfitado por 5 minutos, SULFIT
B, Temperatura de la cabina de secado.
bo= 60°C
b1= 80ºC
los datos obtenidos (actividades acuosas)-en 1as tres replicaciones del experimento se presentan a
continuación:
Tabla 4.5
Actividades acuosas en zanahoria amarilla sometida a deshidratación
Replicas
Tratamiento R1 R2 R3 Total Yi
SINPRE, 60º C 0.29 0.29 0.32 0.90
SINPRE, 80º C 0.25 0.34 0.11 0.70
VAPOR, 60º C 0.27 0.35 0.26 0.88
VAPOR, 80º C 0.16 0.11 0.16 0.43
SULFIT, 60º C 0.27 0.29 0.27 0.83
SULFIT, 80º C 0.20 0.14 0.15 0.49
Total Yj 1.44 1.52 1.27 4.23
Cálculos
Tratamientos, SCTr
SCTr 1 / 3 (0.90) 2 .... (0.49) 2 ( 4.23) 2 / 18
SCTr 0.0696
73
En la tabla de análisis de varianza se puede apreciar que para un nivel de significancia, solamente
α=0.05, solamente la temperatura del proceso de secado influye significativamente en la actividad
acuosa del producto.
Tabla 4.6
TAV, diseño factorial 3x2 sobre los valores de actividad acuosa en zanahoria amarilla
Fuente de Suma de Grados de Cuadrados Medios Razón de
Variación Cuadrados Libertad Varianza
Ejemplo
74
Tabla 4.7
TAV, diseño factorial 3x4 sobre los valores en conservas de babaco.
Factores: Temperatura y tiempo de proceso térmico.*
El efecto significativo (α = 0.05) hallado para la interacción nos demuestra que los cambios en la
temperatura de esterilización inciden en el efecto que el tiempo de retención posee sobre los
valores F0, y viceversa. Ello quiere decir que para especificar un proceso térmico necesariamente
deberán considerarse estos dos factores corno interdependientes. En la gráfica siguiente, construida
sobre los promedios obtenidos en los distintos niveles del factor tiempo de retención se podrá
apreciar el significado de la interacción en el presente caso.
75
Ejemplo
Factor A: Factor B:
a1= 60 min b1= 40ºC
a2 = 90 min b2= 45ºC
a3= 120 min b3= 50ºC
a4 = 50
REPLICAS
TRATAMIENT
OS R1 R2 R3
a1b1 27,7 25,6 22,4
a1b2 11,8 13,7 11,5
a1b3 35,5 33,9 36,8
a2b1 13,1 16,8 17,8
a2b2 52,8 57,8 43,6
a2b3 11,5 15,6 17,6
a3b1 43,5 34,6 45,4
a3b2 14,5 13,8 14,7
a3b3 22,9 22,4 22,5
a4b1 35,7 32,7 35,8
a4b2 16,8 16,7 14,7
a4b3 38,9 43,6 33,3
a1 a2 a3 a4
b1 27,7 13,1 43,5 35,7
25,6 16,8 34,6 32,7
22,4 17,8 45,4 35,8
b2 11,8 52,8 14,5 16,8
13,7 57,8 13,8 16,7
11,5 43,6 14,7 14,7
b3 35,4 11,5 22,9 38,9
33,9 15,6 22,4 43,6
36,8 17,6 22,5 33,3
76
Tabla de doble entrada a x b
a1 a2 a3 a4 Sumatoria Promedios
b1 75,7 47,7 123,5 104,2 351,1 29,2583333
b2 37 154,2 43 48,2 282,4 23,5333333
b3 106,1 44,7 67,8 115,8 334,4 27,8666667
Sumatoria 218,8 246,6 234,3 268,2 967,9
Promedios 24,3111111 27,4 26,033333 29,8
a= 4
b=3
r=3
nkr
Fc ( factor de corrección )
967,9 2
(4 * 3 * 3)
Fc( factor de corrección) 26023,06694
Sc(total ) Yij Fc
2
Y
2
j
Sc A Fc
n*r
Sc A 145,0141667
Y
2
i
Sc B Fc
k *r
351,12 282,42 334,4 2
Sc B 26023,06694
4*3
Sc B 213,96055564
77
Y
2
Sc(error ) ij Sc(tabla de doble entrada)
Sc AxB 5183,401667
g . l (total ) nkr 1 36 1 35
g . l ( A) k 1 4 1 3
g . l ( B) n 1 1 3 1 2
g . l ( A)( B) (n 1)(k 1) (4 1)(3 1) 6
g . l (error ) 24
SC
Cuadrados medios
GL
145,0141
Cuadrados medios( A) 48,33
3
213,96
Cuadrados medios( B) 106,98
2
5183,4016
Cuadrados medios( AxB) 863,90027
6
285,926
Cuadrados medios(error ) 11,9135
24
5828,303
Cuadrados medios(total ) 166,5259
35
CM (Tratamient o)
F (calculado)
CM (error )
F tablas 2,477
FV SC GL CM Fc 0,05 0,01
FACTORES
78
A 145,01416 3 48,338053 4,05739 3,01 2,33
B 213,96 2 106,98 8,9796661 3,4 2,54
INTERACCIONES
AxB 5183,4016 6 863,90027 72,51389 2,51 2,04
ERROR 285,926 24 11,913583
TOTAL 5828,303 35 166,52294
Ciertas situaciones experimentales hacen imposible el “cruce” aleatorio entre los distintos niveles
de los factores bajo estudio, que es una característica especial de los factoriales axb en los Ua1eS
cada tratamiento es la combinación de tales niveles. Gráficamente estos diseños pueden
esquematizarse como se ilustra a continuación para el caso de un factorial 4*3.
Los tratamientos que por cada replicación del experimento deberían ejecutarse en orden
aleatorio, son:
a1b1, a1b2, a1b3
a2b1, a2b2, a2b3
a3b1, a3b2, a3b3
a4b1, a4b2, a4b3
En lugar de la situación anterior puede ocurrir que exista una jerarquía o “anidamiento” de los
niveles del segundo factor en cada uno de los niveles del primero. Por ejemplo cuando se toman
submuestras de las unidades o tratamientos principales, las cuales se analizan, más de una vez.
Entonces, el diseño experimental responde a este nuevo esquema, que ilustra dos “replicas”:
Nótese como los niveles del segundo factor asociado al nivel a 1 nada tiene con los niveles
asociados con a2, a3 y a4
79
El modelo matemático aplicable para un diseño anidado en el que intervienen dos variab1es o
factores de estudio es:
Yijk Ai Bij Eijk
donde:
µ = promedio global
Á1= efecto debido al factor A.
Bij= efecto debido al factor B, anidado en A.
Eijk= efecto residual.
Las suposiciones sobre las distribuciones de probabilidad son:
80
Tabla 4.8
Grados brix determinados en tres variedades de manzanas en distintas etapas de la cadena
post cosecha, provincia de Tungurahua, 1985*
Variedad Etapas
i=1,2,3 j=1,2,,,,,,9 Grados Brix
Variedad Etapas R1 R2 Yij Yi
V1: Emilia E11 14,5 12,5 27
E12 11,5 13 24,5
E13 12 13 25
E14 14 13,5 27,5
E15 14,5 14 28,5
E16 15 14,5 29,5
E17 14 13,5 27,5
E18 15 16 31
E19 15 13,2 28,2
248,7
V2: Rome Beuty E21 11,5 11 22,5
E22 12 11,5 23,5
E23 12 12 24
E24 11,5 14,5 26
E25 13,5 14,5 28
E26 13 12,5 25,5
E27 13 14 27
E28 13,5 11 24,5
E29 14 13 27
228
V3: Golden
Delicious E31 12 16 28
E32 13 15 28
E33 13,5 14 27,5
E34 14,5 14 28,5
E35 15 14 29
E36 12,8 15,4 28,2
E37 14,6 15,2 29,8
E38 15,4 15,4 30,8
E39 14,4 15,4 29,8
259,6
Total = 736,3
Cálculos:
Término constante, TC = (Y .....)2 / abr
TC (736.3) 2 /(3 * 9 * 2) (542137.69) / 54 10039.587
81
Suma de Cuadrados del Total.
SCT k j k
(Yijk ) 2 TC
SCT (14.5) 2 ...... (15.4) 2 10039,587
SCT 91.053
SC ( Et ) 1 / 2 (27) 2 ....... ( 29.8) 2 10039.587
SC ( Et )63.388
SCV 1 / 18 (248.7) 2 (228) 2 (259.6) 2 10039.587
SCV 10068.214 10039.587
SCV 28.627
82
Tabla 4.9.
TAV, diseño anidado o jerárquico de dos factores
Respuesta experimental: grados brix
Siendo que las variedades y las etapas son seleccionadas al azar, el modelo es aleatorio y por tanto
las hipótesis a probarse son:
1.Ho : A 0
2
2.Ho : B 0
2
De acuerdo con la columna de razón de varianzas se debe rechazar solamente la primera pues 9.885
es mayor que F0.05; 2.24 = 3.40
83
Con el propósito de apreciar de donde proviene la mayor variación resumimos los cálculos
anteriores en una nueva tabla de análisis de varianza.
Tabla 4.10
Fuente de Estimadores de %S2
Variación Varianza (S)2
A: Variedades 0.715 36.6
B: Etapas 0.212 10.7
Grados Brix 1.025 52.5
Total 1.952 100
Se observa en este experimento que la mayor variación proviene de las determinaciones de grados
brix, seguido de las variedades. En cambio muy poca contribución a la variabilidad otorga el factor
etapas.
Ejemplo
BLOQUES IN COMPLETOS
CATADORES
TRATAMIENT 1 2 3 4 5 6 SUM PROMEDI
84
OS A O
1 3 4 3 10 3,33333333
2 4 3 4 11 3,66666667
3 5 4,5 5 14,5 4,83333333
4 4 4 5 13 4,33333333
SUMA 7 9 8,5 7 8 9 48,5
PROMEDIO 3,5 4,5 4,25 3,5 4 4,5
t=4
k=2
b=6
r=3
^=1
(Y )
2
Totales Y
2
FC
FC SC ij
b*k
48,5 2
FC 85
6*2
FC 196,020833
SC Totales (3 2 4 2 5 2 ................... 5 2 4 2 5 2 ) 196,020833
SC Totales 202,25 - 196,020833
SC Totales 6,22916667
1
2
SC B Y j FC
k
1
SC B (7 2 92 8,52 7 2 82 92 ) 196,020833
2
SC B 2,10416
B1=7+8,5+8 = 23,5
B2=7+7 +9 = 23
B3=9+9 +8,5 = 26,5
B4=9+7 +8 = 24
B 97
2
(k * Yi ) Bi
Q1
2
2
(2 * 10) 23,5
Q1
2
Q1 3,0625
2
(k * Yi ) Bi
Q1
2
2
(2 * 11) 23
Q1
2
Q1 0,25
2
( k * Yi ) Bi
Q1
2
2
( 2 *14,5) 26,5
Q1
2
Q1 1,5625
86
2
(k * Yi ) Bi
Q1
2
2
(2 * 13) 24
Q1
2
Q1 1
Q 5,875
k
* Q
SC T ajustado= t *
2
* 5,875
SC T ajustado= 4 * 1
SC T ajustado=2,9375
GL E= r*
GL E=3*1
GL E=3
GL To = b*k -1
GL To= 4*3-1
GL To =11
87
CM T ajustado=0,97916667
CM B=SC B/GL B
CM B=2,1041/5
CM B= 0,42082
CM E=SC E/GL E
CM E= 1,1875/3
CM E= 0,39583333
CM To =SC To/GL To
CM To=6,2291/11
CM To= 0,56628182
ESTADISTICO F CALCULADO:
Fc T ajustado= CM T ajustado/CM E
Fc T ajustado= 0,97916667/0,39583333
Fc T ajustado= 2,473684211
Fc B= CM B / CM E
Fc B= 0,42082/0,39583333
Fc B= 1,063124211
F0,95 ; 0,05
88
ESTADISTICO F DE TABLAS :
89
90
DISEÑOS DE CLASIFICACION TRIPLE
Vimos que utilizando el diseño de bloques se puede “aislar’ un efecto exógeno , al de los
tratamientos y con ello realizar un análisis de varianza más sensible. Cuando hay adicionalmente
un segundo factor extraño que puede afectar sobre la variable respuesta del experimento es
necesario aplicar el denominado Diseño Cuadrado Latinos que se caracteriza por el siguiente
modelo:
Yijk Ti B j Ck Eijk
i 1,......., a
j 1,......, a
k 1,......., a
Donde:
µ = efecto global
Ti = efecto del tratamiento i
Bj = efecto de una causa extraña B
Ck = efecto de una causa extraña C
La matriz de respuestas experimentales es cuadrada tal corno lo sugiere la siguiente situación que
ilustra un diseño de tres tratamientos, mediante el cual se mide el tiempo de proceso térmico para
tres formulaciones de un producto alimenticio (tratamientos) las cuales han sido dispuestas en
envases distintos (causa extraña B) y procesadas en tres paradas” distintas (causa extraña C).
Envases (B)
C Total de
1 2 3
bloques
91
Y111 Y221….. Y331
1 Y…1
(T1) (T2) (T3)
Y312 Y122 Y232
2 Y…2
(T3) (T1) (T2)
Y213 Y323 Y133
3 Y…3
(T1) (T2) (T3)
Y.1 Y2….. Y1k Y…
En la tabla los tratamientos están expresados en paréntesis y se presentan una sola vez en filas o
columnas, mientras que las respuestas experimentales están denotadas por Y ijk. La asignación de los
tratamientos debe hacerse aleatoriamente antes de la ejecución del experimento.
La simbología es la siguiente:
B Y
ik
ijk
Para este diseño, las distintas sumas de cuadrados, que permitirán la partición de la varianza, son:
Suma de Cuadrados del Total, SCT.
92
Suma de Cuadrados del factor “exógeno” B, SCB.
93
Ejemplo 1
ORDEN DE LA PRUEBA
1 2 3 Total
74 57 50
1 Y1= 181
(T1) (T2) (T3)
FRUTAS 6 94 78
2 Y2=178
(T3) (T1) (T2)
40 29 112
3 Y3=181
(T1) (T2) (T3)
TOTALES Y....1 =120 Y....2 =180 Y....3 =240 Y…=540
Cálculos :
SCTr
1
3
(208) 2 (164) 2 (168) 2 32400
SCT 394.67
SCB
1
3
(181) 2 (178) 2 (181) 2 32400
SCB 2
Suma de Cuadrado del factor “exógeno” C, SCC. Orden
SCB
1
3
(120) 2 (180) 2 (240) 2 32400
SCB 2400
Suma de Cuadrados del residuo o Error Experimental, SCE.
94
SCB 8766 394.67 2 2400
SCB 5969.33
Tabla 5.1
TAV, diseño cuadrad latino 3x3
respuesta experimental: volumen de jugo, ml
La conclusión del experimento es que las tres máquinas dosifican igual sin importar el tipo de jugo
de fruta utilizado.
Ejemplo
1. Se desea evaluar la calidad del tomate riñón , variedad Grande Milano proveniente de cinco
semilleros (Filas) y cinco invernaderos distintos (columnas), para lo cual se desarrollo un estudio
que varía el tiempo de transplante de la plántula
La variable analizada fue el diámetro mínimo en centímetros, de los frutos cosechados a los 80 días
después del transplante con el fin de compararlos con las normas de calidad exigidas.
INVERNADEROS
Semillero 1 2 3 4 5
1 T1 T2 T3 T4 T5
2 T2 T1 T5 T3 T4
3 T3 T4 T1 T5 T2
4 T4 T5 T2 T1 T3
5 T5 T3 T4 T2 T1
95
Factor exógeno B: Semilleros
Factor exógeno C: Invernaderos
INVERNADERO
SEMILLERO Sumatoria Promedios
1 2 3 4 5
1 6 6,7 6,6 6,5 6,6 32,4 6,48
2 6,3 6,4 6,1 6,5 6,4 31,7 6,34
3 6,8 6,7 6,6 6,4 6,5 33 6,6
4 6,8 6,9 6,8 6,7 6,2 33,4 6,68
5 6,3 6,5 6,6 6,2 6,1 31,7 6,34
Sumatoria 32,2 33,2 32,7 32,3 31,8 162,2
nk
(5 * 5)
Fc( factor de corrección) 1052,3536
Sc(total ) Yij Fc
2
96
Suma de cuadrados de los tratamientos
Y
2
j
Sc tratamientos Fc
n
31,82 32,52 32,62 332 32,32
Sc tratamientos 1052,3536
5
Sc tratamient os 0,1544
Yi 2
Sc B Fc
n
32,42 31,72 332 33,42 31,72
Sc B 1052,3536
5
Sc B 0,4664
Yj 2
Sc C Fc
k
32,22 33,2 2 32,7 2 32,32 31,82
Sc C 1052,3536
5
Sc C 0,2264
97
Suma de cuadrados del error
ADEVA
Ft
F.V Sc G.L C.M Fc 0,05 0,01
Tratamientos 0,1544 4 0,0386 0,77303071 3,25916673 5,41195143
Factor Exógeno
0,4664 4 0,1166 2,33511348 3,25916673 5,41195143
B
Factor Exógeno
0,2264 4 0,0566 1,13351135 3,25916673 5,41195143
C
Error 0,5992 12 0,04993333
Dado que se ensayaron 3 temperaturas, 2 tiempos y 2 métodos, el diseño factorial aplicado fue
3*2*2. Situaciones experimentales similares determinan que cada replicación del experimento
implica ejecutar un número de tratamientos igual al producto, de los niveles con que actúan los
factores que en el caso del ejemplo es 12.
En general, si denotamos por A,B ,C a los factores que actúan respectivamente con a, b, y c niveles,
las respuestas experimentales pueden explicarse por el siguiente modelo matemático:
µ = efecto global
Ai = efecto del i-ésimo nivel del factor A; 1=1 ,...., a
Bj = efecto del j-ésimo nivel del factor B; j=1 ,..,b
Ck = efecto del k-ésimo nivel del factor C; k=1 ...., c
(AB)ij = efecto de la interacción entre los factores A,B
(AC)ik = efecto de la interacción entre los factores A,C
98
(BC)jk = efecto de la interacción entre los factores B,C
(ABC)ijk = efecto de la interacción entre los factores AB,C
R1 = efecto de la replicación del experimento; 1=1 r
Eijk1= Residuo o error experimental.
Una de las poderosas razones que hacen atractivos a los diseños factoriales, además de su
economía, es que ellos permiten evaluar efectos interactuantes entre los factores. Efectivamente, las
interacciones dobles, según hemos señalado, hacen posible la identificación de situaciones en las
cuales el “efecto” de una variable o factor cambia a diferentes niveles de la segunda variable o
factor. ¿Cómo interpretar, en cambio las interacciones triples, que aparecen en los diseños
factoriales a b c?. Tal interpretación no es sencilla porque ella se asocia a las interacciones dobles
posibles en el sentido de que hay presencia de interacción triple cuando los efectos de las
interacciones entre dos variables cambian a diferentes niveles de la tercera variable o factor. Sin
embargo, tal presencia de interacción triple no necesariamente quiere decir que los efectos de las
interacciones dobles, distintas a los niveles del tercer factor, representan por si misma interacciones
dobles significativas.
Para análisis de varianza necesario de hacerse con las respuestas experimentales conviene, partir
de arreglo similar al utilizado con un diseño de dos factores vale decir de la disposición de los
datos en una matriz cuyas filas sean las combinaciones de tratamientos y cuyas columnas sean las
replicaciones, según se ilustra a continuación.
Tabla 5.2
Representación esquemática de la matriz de
respuestas experimentales generadas por un diseño factorial a b c
99
Tratam.
tratamientos
R1 Rr Yij
a1b1c1 Y1111 … Y111r Y111
a1b1c2 Y1121 … Y112r Y112
. . . .
. . . .
. . . .
aibjck Yijk1 Yijk1 Yijkr Yijk
. . .
. .
. . .
Total de Replicas Y….1 Y...1 Y...r Y…
Luego, del mismo modo como se operó con el factorial a b, las sumas de cuadrados asociadas a los
efectos principales y de interacciones se calcularán a partir de matrices estructuradas con los totales
de los tratamientos. Como en todas las sumas de cuadrados interviene el término (Y. . ) 2 /abcr,
denotaremos con las siglas TC tal término constante. Tendríamos:
100
5. Suma de Cuadrados de los efectos principales e interacciones:
a. Factores Ay B
Se hace necesario conformar una matriz cuyos valores sean los totales asociados a los
factores A y B.
Factor B
Factor A b1 b2 … bb Total Y1
a1 Y11.. Y12.. …. Y1b.. Y1..
a2 Y21 Y22 …. Y2b Y2..
. . . . . .
. . . . . .
. . . . . .
aa Ya1 Ya2 … Yab Ya
Total Yj Y1 Y2 …. Yb Y….
101
Entonces:
Suma de Cuadrados de la interacción AB, SC(AB)Se requiere encontrar una suma de cuadrados
del total, SCTAB
b. Factor C.
Factor B
Factor A C1 C2 … Cc Total Y1
a1 Y11.. Y12.. …. Y1c. Y1..
a2 Y21 Y22 …. Y2c Y2..
. . . . . .
. . . . . .
. . . . . .
aa Ya1 Ya2 … Yac Ya
Total Yj Y1 Y2 …. Yc Y….
102
SCTAC 1 / br (Y ik ) 2 TC
ik
Entonces
SC ( AC ) SCTAC SCA SC
c. Interacción (BC)jk
Factor C
Factor B C1 C2 … Cc Total Y1
b1 Y11.. Y12.. …. Y1c. Y1..
b2 Y21 Y22 …. Y2c Y2..
. . . . . .
. . . . . .
. . . . . .
bb Yb1 Yb2 … Ybc Yb
Total Yj Y1 Y2 …. Yc Y….
Entonces:
Como la suma de, cuadrados de tratamientos, SCTr es la suma de las sumas de cuadrados de los
efectos principales de los factores y de los efectos de las interacciones, esta última suma de
cuadrados puede encontrarse restando de SCTr las demás, es decir:
103
Fuente de Suma de Grados de Cuadrados Razón de
Variación Cuadrados Libertad Medios Varianza
Ejemplo
En un estudio del proceso fermentativo de un mosto de pera (pirus comunis) se consideraron como
factores de interés al tipo de levadura, LEV (LEVPAN, LEVINO); método de prensado aplicado
para extraer el mosto, PREN (PRENI, PREN2, PREN3, PREN4), y al tipo de nutrientes adicionado
para favorecer la acción de las levaduras, NUT (NUTI, NIJT2, NUT3, NTJT4). En la tabla que
sigue se reportan las mediciones de pH realizadas luego del primer trasiego en todas las 64
combinaciones de tratamientos ensayados en este experimento factorial 2x4x4 corrido en dos
replicaciones completas.
104
Tabla 5.3
Valores de pH registrados luego del primer trasiego
en un proceso de e1aboación de vino de pera*
Combinaciones de tratamientos Replicas Total Yijk
R1 R2 (Tratamientos)
LEVPAN-PREN1-NUT1 3,25 3,1 6,35
LEVPAN-PREN1.NUT2 3,25 3,1 6,35
LEVPÁN-PREN1-NUT3 3,2 3,1 6,3
LEVPAN-PREN1-NUT4 3,2 3,2 6,4
LEVPAN-PREN2.NUT1 3,1 3,1 6,2
LEVPAN-PREN2-NUT2 3,15 3,1 6,25
LEVPAN-PREN2-NUT3 3,1 3 6,1
LEVPAN-PREN2-NUT4 3,2 3,15 6,35
LEVPAN-PREN3- NUT1 3,2 3,25 6,45
LEVPAN-PREN3-NTU2 3,1 3,3 6,4
LEVPAN-PREN3-NUT3 3,2 3,3 6,5
LEVAN-PREN3-NUT4 3,2 3,15 6,35
LEVPAN-PREN4-NUT1 3,25 3,15 6,4
LEVPAN-PREN4-NUT2 3,15 3,15 6,3
LEVPAN-PREN4-NUT3 3,1 3,1 6,2
LEVPAÑ-PREN4-NUT4 3,1 3,15 6,25
LEVINO-PREN1-NUT1 3,1 3,15 6,25
LEVNO-PREN1-NUT2 3,15 3,3 6,45
LEVINO-PREN1-NUT3 3,1 3 6,1
LEVINO-PREN1 -NUT4 3,25 3,2 6,45
LEVINO-PREN2-NET1 3,1 3,15 6,25
LEVINO-PREN2-NET2 3,15 3,1 6,25
LEVINO-PREN2-NET3 3,15 3,2 6,35
LEVINO-PREN2-NET4 3,1 3,3 6,4
LEVINO-PREN3-NET1 3,1 3,3 6,4
LEVlNO-PREN3-NET2 3,1 3,25 6,35
LEVlNO-PREN3-NET3 3,15 3,15 6,3
LEVINO-PREN3-NET4 3,25 3,15 6,4
LEVINO-PREN4-NET1 3,15 3,2 6,35
LEVINO-PREN4-NET2 3,15 3,25 6,4
LEVINO-PREN4-NET3 3,2 3,25 6,45
LEVINO-PREN4-NET4 3,3 3,1 6,4
Total Y1 101,25 101,45 202,7
105
NUT2 = Extracto de levadura
NUT3 = (NH4)2HPO4
NUT4 = Extracto de levadura + (NH4)2HPO4
Cálculos:
Término constante. TC= (Y….)2/2*4*4*2=(202.7)2/64
TC= 641.989
A: LEV B: PREN
b1 b2 b3 b4 Total Yi…
a1 25.40 24.90 25.70 25.15 101.15
a2 25.25 25.25 25.45 25.60 101.55
Yj… 50.65 50.15 51.15 50.75 y..=202.70
106
SCA= 1/32 [(101.15)2+ (101.55)2]- 641.989=2.4x10-3
SCB = 1/16 [(50.65)2 + …+ (50.75)2]- 641.989 = 0.032
SCTAB = 1/8 [(25.40)2 (25.60)2] - 641.989 = 0.057
SC(AB) = SCTAB-SCA-SCB
SC(AB) = 0.057 - 24X10-3 – 0.032
SC(AB) = 0.0229
A: LEV B: PREN
c1 c2 c3 c4
a1 25.40 25.30 25.10 25.35
a1 25.25 25.45 25.20 25.65
Yj… 50.65 50.75 51.30 501.00
A: LEV B: PREN
b1 b2 b3 b4 Total Yi…
c1 12.60 12.45 12.85 12.75 50.65
c2 12.80 12.50 12.75 12.70 50.75
c3 12.40 12.45 12.80 12.65 50.30
c4 12.85 12.75 12.75 12.65 51.00
Yj… 50.65 50.15 51.15 50.75 y..=202.70
Con las sumas de cuadrados calculadas podemos escribir la tabla de análisis da varianza siguiente:
Tabla 5.4.
TAV, medición del pH, experimento factorial 2x4x4 en dos replicaciones
107
Fuente de Variación Suma de Grados de Cuadrados Razón de F0.05
Cuadrados Libertad Medios Varianza
Replicas 0.00053 1 0.00053
LEV 0.0024 1 0.0024 0.428 417
PREN 0.0320 3 0.0107 1.906 2.92
NUT 0.016 3 0.0053 0.944 2.92
(LEV)(PREN) 0.0229 3 0.0076 1.357 2.92
(LEV)(NUT) 0.0064 3 0.0021 0.374 2.92
(PREN)(NUT) 0.034 9 0.0038 0.678 2.21
(LEV)(PREN)(NUT) 0.037 9 0.0042 0.750 2.21
Residuo 0.174 31 0.0056
Total 0.3260 63
Ejemplo
1. Se elaboró una bebida fermentada en base a suero dulce de queso fresco y harina de maíz
germinado con los siguientes factores y niveles:
Tratamiento R1 R2 Suma
a1b1c1 9 10 19
a1b1c2 9,75 10 19,75
a1b1c3 10 10 20
a1b2c1 9,75 10,5 20,25
a1b2c2 9,75 10 19,75
108
a1b2c3 10 10,3 20,3
a2b1c1 12,25 12,25 24,5
a2b1c2 12,25 12,5 24,75
a2b1c3 12,5 12,5 25
a2b2c1 12,25 12 24,25
a2b2c2 12,25 12,25 24,5
a2b2c3 12,5 12,5 25
a3b1c1 15,25 12,25 27,5
a3b1c2 15,5 15,5 31
a3b1c3 15,75 15,75 31,5
a3b2c1 15,25 15 30,25
a3b2c2 15,5 15,5 31
a3b2c3 15,8 15,75 31,55
Suma 225,3 224,55 449,85
a= 3
b= 2
c= 3
r= 2
a *b *c* r
Sc(total ) Yij Fc
2
Y
2
j
Sc tratamientos Fc
r
192 19,752 202............... 312 31,552
Sc tratamient os 5621,25063
2
Sc tratamientos 176,433125
225,32 224,52
Sc replicaciones Fc
axbxc
109
225,32 224,52
Sc replicaciones 5621,25063
3* 2 *3
Sc replicaciones 0,015625
b1 b2 Sumatoria
a1 58,75 60,3 119,05
a2 74,25 73,75 148
a3 90 92,8 182,8
Sumatoria 223 226,85 449,85
Sc A 169,81125
2232 226,852
Sc B Fc
axcxr
2232 226,852
Sc B 5621,25063
3 x3 x 2
Sc B 0,41173611
110
Sc AB 170,6856 169,8112 0.411
Sc AB 0,46263889
2) Matriz AxC
c1 c2 c3 Sumatoria
a1 39,25 39,5 40,3 119,05
a2 48,75 49,25 50 148
a3 57,75 62 63,05 182,8
Sumatoria 145,75 150,75 153,35 449,85
3) Matriz BxC
111
c1 c2 c3 Suma
b1 71 75,5 76,5 223
b2 74,75 75,25 76,85 226,85
Suma 145,75 150,75 153,35 449,85
2232 226,852
Sc B Fc
axcxr
2232 226,852
Sc B 5621,25063
2 x3 x 2
Sc B 0,41173611
112
* = significativo
**= altamente significativo
PRUEBA DE TUKEY
Factor A
a1 a2 a3
59,525 74 91,4 Tukey
a1 59,525 0 14,475 31,875 1,18861376
a2 74 - 0 17,4
a3 91,4 - - 0
Factor B
b1 b2
74,33 75,615 Tukey
b1 74,33 0 1,285 1,19507737
b2 75,615 - 0
FACTOR C
c1 c2 c3
48,583 50,25 51,116 Tukey
c1 48,583 0 1,667 2,533 1,18861376
c2 50,25 - 0 0,866
c3 51,116 - - 0
113
114
115
DISEÑOS FACTORIALES COMPLETOS 2n
6.1 INTRODUCCIÓN
Por ejemplo, en un diseño factorial 3x3x4, cada replicación del experimento requerirá que sean
ejecutados 36 tratamientos diferentes ; por supuesto, cuántos más grandes sean los números de
niveles actuantes así como el número de factores, la ejecución de un experimento factorial será más
compleja y demorada.
Dado que existen muchos procesos industriales o fenómenos en los cuales necesariamente
intervienen un elevado número de variables o factores, es preciso aplicar ciertos diseños que
permitan con la mayor economía de esfuerzos posibles, discernir con propiedad cuales de aquellos
factores resultan más relevantes para explicar un determinado fenómeno o el funcionamiento
óptimo de un proceso. Tales diseños pueden ser aplicados dentro de la concepción de que el
experimento debe ejecutarse por fases, siendo la primera de las cuales la que posibilite seleccionar
los factores de mayor importancia, vale decir aquellos que determinen efectos significativamente
diferentes en las respuestas experimentales. Los diseños 2 n, en los cuales intervienen n factores con
2 niveles cada uno, cumplen con este propósito. Debe quedar claro, sin embargo, que la limitación
a sólo 2 niveles por variable impedirá extraer conclusiones sobre el tipo de modelo matemático,
excepto el lineal, que podría explicar la relación existente entre el factor y la variable respuesta. Al
considerarse un experimento con factores cuantitativos, entonces, queda la posibilidad de llevar a
cabo una segunda fase experimental, con aquellos factores que se hayan identificado como más
importantes, aplicando esta vez más de 2 niveles por factor. Puede decirse que si se buscan
relaciones cuadráticas se requerirán 3 niveles; si relaciones cúbicas, 4 niveles, etc.
6.2 NOTACIÓN
Aunque n puede ser cualquier número, presentemos el caso de 4 factores. Entonces, las respuestas
experimentales de un diseño 24 se representarían de manera general con el siguiente modelo
matemático.
116
Donde:
Número de Factores
3 4 5
1 1 d 1 d e de
a a ad a ad ae ade
Tratamientos
b b bd b bd be bde
ab ab abd ab abd abe abde
c c cd c cd ce cde
ac ac acd ac acd ace acde
bc bc bcd bc bcd bce bcde
abc abc abcd abc abcd abce abcde
117
Total 8 16 32
Debe notarse que a partir del “patrón” 1,a, b, ab que correspondería a un diseño 2 2, los
tratamientos para factoriales mayores fácilmente se escriben con solo multiplicar la letra asociada
al factor siguiente. Por supuesto, el tratamiento ab para tres factores es el a 1b1c0 en tanto que ab
para 5 factores representa al tratamiento a 1b1c0d0e0. En esta notación la unidad representa la
combinación de los factores caracterizada porque todos ellos participan con los niveles “bajos” (vg:
1 para 23 es a0b0c0; 1 para 24 es a0b0c0d0 etc.).
Para realizar el análisis de varianza es conveniente presentar las respuestas experimentales en una
tabla con el ordenamiento estándar de los tratamientos sin importar el orden de ejecución de los
distintos tratamientos en el experimento y obtener los totales de las réplicas efectuadas según se
ilustra a continuación.
Total de
Tratamiento Replicas Tratamiento
(orden estándar) R1 R2 Yijkl
1 Y00001 Y00002 Y0000
a Y10001 Y10002 Y1000
b Y01001 Y01002 Y0100
ab Y01001 Y01002 Y0100
c Y01001 Y01002 Y0100
ac Y11001 Y11002 Y1100
bc Y01101 Y01102 Y0110
abc Y11101 Y11102 Y1110
d Y00011 Y00012 Y0001
ad Y10011 Y10012 Y1001
bd Y01011 Y01012 Y0101
abd Y11011 Y11012 Y1101
cd Y00111 Y00112 Y0011
acd Y10111 Y10112 Y1011
bcd Y01111 Y01112 Y0111
abcd Y11111 Y11112 Y1111
Totales Y…..1 Y…..2 Y…….
En esta notación el “punto” indica una sumatoria asociada a la letra del subíndice correspondiente.
Así:
Yoooo (Y
h
0000 h )
118
Y.....1 (Y
i j k l
ijkl 1 )
Y.....1 (Y
i j k l h
ijkl1h )
El análisis de varianza requiere, según hemos visto, que sean determinadas las sumas de cuadrados
asociadas a las distintas fuentes de variación. En este caso, conviene partir encontrando primero las
sumas de cuadrados global, SCT, de los tratamientos, SCTr, de las réplicas, SCR y del residuo,
SCE, de la misma forma. Como se procedió con los diseños factoriales estudiados anteriormente;
luego se subdividirá tal SCTr en aquellas correspondientes a los efectos totales de los factores y de
las interacciones.
En el caso de los experimentos ejecutados bajó un diseño 2 n, los efectos totales de los distintos
factores e interacciones pueden ser considerados como combinaciones lineales del tipo donde
En la tabla que sigue están indicados a manera de ejemplo, los coeficientes que se requiere para
encontrar los efectos totales (denotados por letras mayúsculas encerradas en paréntesis cuadrados)
de un diseño 23:
Tabla 6.2
Coeficientes asociados a los distintos tratamientos de un diseño 2 3
TRATAMIENTOS
Efectos
1 a b ab c ac bc abc
Totales
1 1 1 1 1 1 1 1 [1]
-1 1 -1 1 -1 1 -1 1 [A]
-1 -1 1 1 -1 -1 1 1 [B]
1 -1 -1 1 1 -1 -1 1 [AB]
-1 -1 -1 -1 1 1 1 1 [C]
1 -1 1 -1 -1 1 -1 1 [AC]
1 1 -1 -1 -1 -1 1 1 [BC]
-1 1 1 -1 1 -1 -1 1 [ABC]
119
1. La presencia de la letra, que identifica al factor con el nivel “alto”, implica siempre signo
positivo. Por ejemplo, para el efecto total del factor A, denotado por [A], los coeficientes
asociados a los tratamientos a., ab, ac, abc son positivos, en tanto que aquellos asociados
con las demás combinaciones de tratamientos que no poseen la letra a porque en ellos el
factor A actúa con el nivel “bajo”, son negativos.
2. Los signos de los coeficientes correspondientes a las combinaciones que dan los efectos
totales de las interacciones se obtienen multiplicando algebraicamente los coeficientes de los
factores que intervienen en la particular interacción. -
3. La columna denominada “efectos totales” registrará el resultado de la combinación lineal
4. La construcción de tablas de signos para diseño 2 4, 25, etc sigue los mismos criterios
señalados.
Una vez que han sido determinados los efectos totales las distintas sumas de cuadrados se obtienen
dividiendo el cuadrado de los efectos totales para el número total de observaciones, vale decir:
( ET ) 2
SC
r 2n
Ejemplo
FACTORES NIVELES
A: Porcentaje de zumo de babaco, ZUMO a0: 40% a1: 50%
B : Porcentaje de azúcar en la mezcla, AZÚCAR b0: 13% b1: 15%
C: Tiempo de pasteurización TIEMPO c0: 8 min. c1:10min
D: Temperatura de pasteurización TEMPERATURA d0: 90ºC d1: 95ºC
Tabla 6.3
Tiempo en minutos del proceso térmico de néctar de babaco, procesado en fundas
flexibles termoprocesables*
120
Orden Replicaciones
Tratamientos Totales
Aleatorio
Ejecutados R1 R2 Yijkl Promedio
5 1 7,3 7 14,3 7,15
1 a 7,9 8,4 16,3 8,15
3 b 7,8 7,5 15,3 7,65
6 ab 8,8 9 17,8 8,9
9 c 6,5 6,5 13 6,5
10 ac 7,8 7,8 15,6 7,8
4 bc 6,7 6,6 13,3 6,65
8 abc 7,8 7,9 15,7 7,85
7 d 4 4 8 4
2 ad 6,3 6,3 12,6 6,3
16 bd 4,6 4,6 9,2 4,6
13 abd 6,3 5,8 12,1 6,05
11 cd 3,5 3,6 7,1 3,55
14 acd 4,6 4,8 9,4 4,7
15 bcd 4 3,8 7,8 3,9
12 abcd 4,8 4,9 9,7 4,85
Totales 98,7 98,5 197,2
Considerando como si se tratara de un diseño de doble entrada calculamos las sumas de cuadrados
global, de tratamientos, de las replicaciones; y del residuo.
Los efectos totales, ET, vale decir las combinaciones lineales del tipo Y ijkl C
se presentan a
continuación:
121
Efectos
1 (a) (b) (ab) (c) (ac) (b)c (abc) (d) (ad) (bd) (abd) (cd) (acd) (bcd) (abad) Totales
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 [1]= 197,2
-1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 [A]= 21,2
-1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 [B]= 4,6
1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 [AB]= -1,8
-1 -1 -1 -1 1 1 1 1 -1 -1 -1 -1 1 1 1 1 [C]= -14
1 -1 1 -1 -1 1 -1 1 1 -1 1 -1 -1 1 -1 1 [AC] -2,8
1 1 -1 -1 -1 -1 1 1 1 1 -1 -1 -1 -1 1 1 [BC] -1,8
-1 1 1 -1 1 -1 -1 1 -1 1 1 -1 1 -1 -1 1 [ABC] 0,6
-1 -1 -1 -1 -1 -1 -1 -1 1 1 1 -1 1 1 1 1 [D] -45.4
1 -1 1 -1 1 -1 1 -1 -1 1 -1 -1 -1 1 -1 1 [AD] 2.2
1 1 -1 -1 1 1 -1 -1 -1 -1 1 -1 -1 -1 1 1 [BD] -1.2
-1 1 1 -1 -1 1 1 -1 1 -1 -1 -1 1 -1 -1 1 [ABD] -2.4
1 1 1 1 -1 -1 -1 -1 -1 -1 -1 1 1 1 1 1 [CD] -1.8
-1 1 -1 1 1 -1 1 -1 1 -1 1 1 -1 1 -1 1 [ACD] -3.8
-1 -1 1 1 1 1 -1 -1 1 1 -1 1 -1 -1 1 1 [BCD] 2.4
1 -1 -1 1 -1 1 1 -1 -1 1 1 1 1 -1 -1 1 [ABCD] 2.0
Aplicando SC = (ET)2 /(r2n) se obtienen las distintas sumas de cuadrados asociadas a los efectos
principales y a los efectos de las interacciones. Para el caso [A] tenemos:
SCA = (449.44)/(2x16) = 14.05
En la tabla 3 están reportadas todas las sumas de cuadrados en que se subdivide la suma de
cuadrados de tratamientos. Debe notarse en aquella tabla de análisis de varianza que hay un grado
de libertad para cada suma de cuadrados debido a que solo se trabajó con dos niveles por cada
factor.
122
abd 50 15 8 95 0,18 1 0,18 5,29
cd 40 13 10 95 0,10125 1 0,10125 2,98
acd 50 13 10 95 0,45125 1 0,45125 13,27
bcd 50 15 10 95 0,18 1 0,18 5,29
abcd 50 15 10 95 0,125 1 0,125 3,68
Replicaciones 0,001 1
Error 0,54 16 0,034
* F(P-0.05 )= 4.49
La influencia particularizada de los factores e interacciones dobles que aparecen como
significativos (P- 0.05) puede apreciarse con mayor claridad en la siguiente tabla que resume los
resultados de las pruebas de comparaciones múltiples efectuadas (diferencia mínima significativa).
Tabla 6.4
Influencia particularizada de los factores principales e interacciones dobles significativas
sobre el tiempo de proceso térmico en fundas
flexibles, en néctar de babaco
EECTO SIGNIFICATIVO RANGO ESTABLECIDO EN EL TIEMPO DMS
DEL PROCESO TERMICO (min) (P-0.05)
1. ZUMO DE FRUTA 40% 50%
PROMEDIOS 5500 6825 0.1382
a b
2. PORCENTAJE DE AZÚCAR 13% 15%
PROMEDIOS 6.019 6.306 0.1382
a b
3. TIEMPO DE PASTEURIZACIÓN
8 min 10 min
PROMEDIOS 6600 5725 0.1382
b a
4. TEMPERATURA DE
90ºC 95ºC
PASTEURIZACIÓN
PROMEDIOS 7.581 4.744 0.1382
b a
5. (%ZUMO) (TIEMPO
(40-10) (40-8) (50-10) (50-8)
PASTEURIZACIÓN)
PROMEDIOS 5.150 5.850 6.300 7.350 0.1382
a b c d
6. (%ZUMO) (TEMP. PASTEURIZACIÓN)
(40-95) (50-95) (40-90) (50-90)
PROMEDIOS 4.012 5.478 6.988 8.175 0.1382
a b c d
Del experimento se desprende que el porcentaje de zumo de fruta incidirá significativamente sobre
el tiempo de proceso térmico y afectará la influencia de la temperatura y tiempo de esterilización
123
aplicados. Por otro lado, también se aprecia efectos principales significativos de los otros factores
vale decir: % de azúcar añadido, temperatura y tiempo de pasteurización.
6.4 MÉTODO DE YATES
Este método permite calcular los efectos totales de los factores y de las interacciones sin necesidad
de recurrir a las tablas de coeficientes +1 , - 1 , aunque desde el punto de vista matemático tales
efectos siguen siendo el resu1tad de las combinaciones lineales planteadas con anterioridad.
La aplicación del método requiere que una vez que hayan sido calculados los totales de los
tratamientos y registrados los mismos en orden estándar, se proceda a estructurar columnas
adicionales tomando en cuenta lo siguiente:
- Se suman por parejas los totales para encontrar la parte superior de la nueva columna.
- Se restan por parejas los totales, considerando como minuendo el ubicado en la fila
inferior. Los resultados constituyen la parte inferior de la nueva columna.
- Se reitera el procedimiento hasta conformar la columna n (igual al número de factores del
diseño), Los valores de esta columna n serán los efectos totales requeridos para calcular las
sumas de cuadrados,
Ejemplo
En un experimento 23 diseñado para estudiar el efecto que sobre el tiempo de proceso térmico
(esterilización comercial) de enlatados de sopa de pollos poseen el pH del producto, la proporción
de ingredientes utilizados y la capacidad de envase, se aplicaron los niveles que se detallan a
continuación para cada uno de los factores mencionados
124
Tabla 6.5
Tiempo, en minutos, del proceso térmico aplicado a sopa de pollo enlatada*
FACTORES NIVELES
A: pH. PH a0: 4.5 a1: 6.0
B : Proporción de ingredientes, ING (distintos a la carne y b0: 2% b1: 4.5%
líquido de cobertura)
C: Capacidad del Envase, CAPENV c0: 11 onzas (lata.303x406)
c1: 19 onzas (lata 401x411)
Las respuestas experimentales obtenidas en las dos réplicas del experimento se presentan a
continuación:
RESPUESTAS
Tratamiento FACTORES ESTUDIADOS
EXPERIMENTALES
pH INGr CAPENV R1 R2 TOTAL
1 4.5 2% 303x406 18.350 15.650 34.00
a 6.0 2% 303x406 21.590 18.530 40.12
b 4.5 4.5% 303x406 18.820 17.230 36.05
ab 6.0 4.5% 303x406 21.720 17.190 38.91
c 4.5 2% 401x411 20.500 19.420 39.92
ac 6.0 2% 401x411 24.040 20.310 44.35
bc 4.5 4.5% 401x411 20.670 19.160 39.83
abc 6.0 4.5% 401x411 24.150 21.760 45.91
169.840 149.250 319.09
Combinación de
Total I II Efectos Totales
Tratamientos
1 34 74,12 149,08 319,09
a 40,12 74,96 170,01 19,49
b 36,05 84,27 8,98 2,31
ab 38,91 85,74 10,51 -1,61
c 39,92 6,12 0,84 20,93
ac 44,35 2,86 1,47 1,53
bc 39,83 4,43 -3,26 0,63
abc 45,91 6,08 1,65 4,91
125
De otro lado, los “efectos medios”, esto es los cambios que ocurren en la respuesta experimental
sobre la mitad del rango del factor bajo estudio, se obtienen dividiendo cada valor de esta última
columna para el número de tratamientos “corridos” (2 nr). La identificación de estos “efectos
medios” es muy importante solo en el caso de factores cuantitativos porque representan la misma
cantidad que los coeficientes de regresión y podrían por lo tanto utilizarse para ilustrar las
tendencias presentes en el experimento.
F(P-0.05)=5.5914
El experimento permite concluir que si bien no existen interacciones entre los factores estudiados,
tanto en el pH, como la capacidad del envase producen efectos estadísticamente significativos (P-
0.05) sobre el tiempo de proceso térmico de enlatados de sopa de pollo. Las pruebas de “Diferencia
Mínima Significativa” aplicadas a cada factor arrojaron los resultados siguientes:
pH Tiempo de Proceso
Promedio, min
4.5 18.446 b
6.0 21.440 a
CAPENV
11 oz. (303x406) 18.914 b
19 oz (401x411) 20.973 a
DMS (P-0.05)=0.6582
126
Se observa que los tiempos menores de esterilización se aplicarían con un pH 4.5 y utilizando un
envase tamaño 303x406.
Ejemplo
Factor de corrección:
FC= 23382,03125
SUMA DE CUADRADOS
Gl
Sc total= 217,50875 31
Sc tratam.= 178,14875 15
Sc rep= 2,42 1
Sc Error= 36,94 15
127
1 a b ab c ac bc abc d ad bd abd cd acd bcd abcd
58,9 59,9 50,1 53,1 48,2 50,7 52,6 47,1 65,2 50,8 58,2 54,1 57,6 51 51,3 56,2
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
a -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1
b -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1
ab 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1
c -1 -1 -1 -1 1 1 1 1 -1 -1 -1 -1 1 1 1 1
ac 1 -1 1 -1 -1 1 -1 1 1 -1 1 -1 -1 1 -1 1
bc 1 1 -1 -1 -1 -1 1 1 1 1 -1 -1 -1 -1 1 1
abc -1 1 1 -1 1 -1 -1 1 -1 1 1 -1 1 -1 -1 1
d -1 -1 -1 -1 -1 -1 -1 -1 1 1 1 1 1 1 1 1
ad 1 -1 1 -1 1 -1 1 -1 -1 1 -1 1 -1 1 -1 1
bd 1 1 -1 -1 1 1 -1 -1 -1 -1 1 1 -1 -1 1 1
abd -1 1 1 -1 -1 1 1 -1 1 -1 -1 1 1 -1 -1 1
cd 1 1 1 1 -1 -1 -1 -1 -1 -1 -1 -1 1 1 1 1
acd -1 1 -1 1 1 -1 1 -1 1 -1 1 -1 -1 1 -1 1
bcd -1 -1 1 1 1 1 -1 -1 1 1 -1 -1 -1 -1 1 1
abcd 1 -1 -1 1 -1 1 1 -1 -1 1 1 -1 1 -1 -1 1
128
ADEVA
Efecto
Tratamientos total Sc GL CM Fc Ft
0,05 0,01
[1] 865 1
[a] -19,2 11,52 1 11,52 4,677855983 4,54307712 8,68311681
[b] -19,6 12,005 1 12,005 4,874796968 4,54307712 8,68311681
[ab] 15,8 7,80125 1 7,80125 3,167805901 4,54307712 8,68311681
[c] -35,6 39,605 1 39,605 16,08216026 4,54307712 8,68311681
[ac] 9,8 3,00125 1 3,00125 1,218699242 4,54307712 8,68311681
[bc] 19 11,28125 1 11,28125 4,58090823 4,54307712 8,68311681
[abc] -8,8 2,42 1 2,42 0,982674607 4,54307712 8,68311681
[d] 23,8 17,70125 1 17,70125 7,187838387 4,54307712 8,68311681
[ad] -21,2 14,045 1 14,045 5,703167298 4,54307712 8,68311681
[bd] 10 3,125 1 3,125 1,268949648 4,54307712 8,68311681
[abd] 27,8 24,15125 1 24,15125 9,80695046 4,54307712 8,68311681
[cd] 11,2 3,92 1 3,92 1,591770439 4,54307712 8,68311681
[acd] 23,8 17,70125 1 17,70125 7,187838387 4,54307712 8,68311681
[bcd] -13,8 5,95125 1 5,95125 2,41658771 4,54307712 8,68311681
[abcd] 11,2 3,92 1 3,92 1,591770439 4,54307712 8,68311681
Error 36,94 15 2,46266667 2,40344707 3,52219368
Replicaciones 2,42 1 2,42 0,982674607 4,54307712 8,68311681
Total 217,50875 31 7,01641129 2,849111244 2,24138998 3,20363698
Significativo
Altamente significativo
Hipótesis:
H 0 : ao a1 H 0 : bo b1 H 0 : co c1 H 0 : d o d1
H1 : a0 a1 H1 : b0 b1 H1 : c0 c1 H1 : d 0 d1
129
Prueba de Comparación
Promedios
Factor A Factor B
ao: 27,63125 bo: 26,01764706
a1: 26,43125 b1: 26,41875
Factor C Factor D:
co: 26,48823529 do: 26,2875
c1: 25,91875 d1: 27,775
Decisión:
Fc > Ft Rechazo Ho y acepto H1
Fc < Ft Acepto Ho y rechazo H1
Rechazamos las hipótesis nulas y aceptamos las hipótesis alternativas, lo que quiere decir que
existen diferencias significativas entre los resultados del experimento al cambiar los del nivel alto
al nivel bajo de los factores o viceversa. También existen diferencias significativas en los
resultados de las interacciones entre los factores a un nivel tanto del 99 y el 95%.
Conclusión:
Mediante el análisis ADEVA realizado podemos concluir que todos los factores A,B,C y D
influyen significativamente sobre los resultados finales. Y que el cambio de niveles a alto o bajo de
los niveles A, B y D influyen significativamente sobre los resultados experimentales, mientras que
el cambio de nivel en el factor C presenta diferencia altamente significativas en las repuestas
experimentales. El cambio de los niveles de los factores en las interacciones de estos, ya sean estas
dobles o triples también significativa y en algunos casos altamente significativamente sobre las
puesta experimental. Finalmente pudimos concluir que el mejor tratamiento para la obtención de
compuesto fosforoso con mayor concentración de fósforo es el aob1cod1. Es decir el tratamiento
que fue realizado con un nivel del porcentaje de fósforo bajo, un nivel de material refundido alto,
un nivel de tiempo de fundición bajo y un nivel de factor de fundición alto.
130
MÉTODO DE YATES
Ft
Trat suma I II III Efecto total SC GL CM Fc 0,05 0,01
1 58,9 118,8 222 420,6
a 59,9 103,2 198,6 444,4 19,2 11,52 1 11,52 4,67785598 4,54307712 8,68311681
b 50,1 98,9 228,3 -1 19,6 12,005 1 12,005 4,87479697 4,54307712 8,68311681
ab 53,1 99,7 216,1 20,2 15,8 7,80125 1 7,80125 3,1678059 4,54307712 8,68311681
c 48,2 116 -4 14,8 35,6 39,605 1 39,605 16,0821603 4,54307712 8,68311681
ac 50,7 112,3 3 4,8 9,8 3,00125 1 3,00125 1,21869924 4,54307712 8,68311681
bc 52,6 108,6 18,5 -6 19 11,28125 1 11,28125 4,58090823 4,54307712 8,68311681
abc 47,1 107,5 1,7 21,8 8,8 2,42 1 2,42 0,98267461 4,54307712 8,68311681
d 65,2 -1 15,6 23,4 -23,8 17,70125 1 17,70125 7,18783839 4,54307712 8,68311681
ad 50,8 -3 -0,8 12,2 -21,2 14,045 1 14,045 5,7031673 4,54307712 8,68311681
bd 58,2 -2,5 3,7 -7 10 3,125 1 3,125 1,26894965 4,54307712 8,68311681
abd 54,1 5,5 1,1 16,8 -27,8 24,15125 1 24,15125 9,80695046 4,54307712 8,68311681
cd 57,6 14,4 2 16,4 11,2 3,92 1 3,92 1,59177044 4,54307712 8,68311681
acd 51 4,1 -8 2,6 -23,8 17,70125 1 17,70125 7,18783839 4,54307712 8,68311681
bcd 51,3 6,6 10,3 10 13,8 5,95125 1 5,95125 2,41658771 4,54307712 8,68311681
abcd 56,2 -4,9 11,5 -1,2 11,2 3,92 1 3,92 1,59177044 4,54307712 8,68311681
Suma 865 Error 36,94 15 2,46266667
Replicaciones 2,42 1 2,42
Total 217,50875 31 7,01641129
131
2. Se lleva a cabo un experimento preliminar para estudiar los efectos de 4 factores y sus
interacciones, sobre la producción de la operación de cierta maquina, el diseño a utilizarse es 2^4,
los datos son los siguientes:
Factor de corrección:
FC= 3850,03125
SUMA DE CUADRADOS
Gl
Sc total= 520,54875 31
Sc tratam.= 489,57875 15
Sc rep= 3,25125 1
Sc Error= 27,71875 15
132
1 a b ab c ac bc abc d ad bd abd cd acd bcd abcd
16,6 19,2 14,9 22,4 15,4 23,4 31,9 15,8 27,8 10,5 18,3 43,8 17,6 25 21,3 27,1
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
a -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1
b -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1
ab 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1
c -1 -1 -1 -1 1 1 1 1 -1 -1 -1 -1 1 1 1 1
ac 1 -1 1 -1 -1 1 -1 1 1 -1 1 -1 -1 1 -1 1
bc 1 1 -1 -1 -1 -1 1 1 1 1 -1 -1 -1 -1 1 1
abc -1 1 1 -1 1 -1 -1 1 -1 1 1 -1 1 -1 -1 1
d -1 -1 -1 -1 -1 -1 -1 -1 1 1 1 1 1 1 1 1
ad 1 -1 1 -1 1 -1 1 -1 -1 1 -1 1 -1 1 -1 1
bd 1 1 -1 -1 1 1 -1 -1 -1 -1 1 1 -1 -1 1 1
abd -1 1 1 -1 -1 1 1 -1 1 -1 -1 1 1 -1 -1 1
cd 1 1 1 1 -1 -1 -1 -1 -1 -1 -1 -1 1 1 1 1
acd -1 1 -1 1 1 -1 1 -1 1 -1 1 -1 -1 1 -1 1
bcd -1 -1 1 1 1 1 -1 -1 1 1 -1 -1 -1 -1 1 1
abcd 1 -1 -1 1 -1 1 1 -1 -1 1 1 -1 1 -1 -1 1
133
ADEVA
Efecto
total Sc GL CM Fc Ft
0,05 0,01
[1] 351 1
[a] 23,4 17,11125 1 17,11125 9,25975197 4,54307712 8,68311681
[b] 40 50 1 50 27,0574972 4,54307712 8,68311681
[ab] 22 15,125 1 15,125 8,1848929 4,54307712 8,68311681
[c] 4 0,5 1 0,5 0,27057497 4,54307712 8,68311681
[ac] -13,2 5,445 1 5,445 2,94656144 4,54307712 8,68311681
[bc] -10,6 3,51125 1 3,51125 1,90011274 4,54307712 8,68311681
[abc] -73,4 168,36125 1 168,36125 91,1086809 4,54307712 8,68311681
[d] 31,8 31,60125 1 31,60125 17,1010147 4,54307712 8,68311681
[ad] 19,4 11,76125 1 11,76125 6,36459977 4,54307712 8,68311681
[bd] 19,2 11,52 1 11,52 6,23404735 4,54307712 8,68311681
[abd] 60,4 114,005 1 114,005 61,6937993 4,54307712 8,68311681
[cd] -22,8 16,245 1 16,245 8,79098083 4,54307712 8,68311681
[acd] 23,2 16,82 1 16,82 9,10214205 4,54307712 8,68311681
[bcd] -25,4 20,16125 1 20,16125 10,9102593 4,54307712 8,68311681
[abcd] -15,4 7,41125 1 7,41125 4,01059752 4,54307712 8,68311681
Error 27,71875 15 1,84791667 1 2,40344707 3,52219368
Replicaciones 3,25125 1 3,25125 1,75941375 4,54307712 8,68311681
Total 520,54875 31 16,7918952 9,08693312 2,24138998 3,20363698
134
Significativo
Altamente significativo
Hipótesis:
H 0 : ao a1 H 0 : bo b1 H 0 : co c1 H 0 : d o d1
H1 : a0 a1 H1 : b0 b1 H1 : c0 c1 H1 : d 0 d1
Prueba de Comparación
Promedios
Factor A Factor B
ao: 10,2375 bo: 9,14705882
a1: 11,7 b1: 12,21875
Factor D
Factor C
do: 9,975
co: 10,2058824
d1: 11,9625
c1: 11,09375
Decisión:
Fc > Ft Rechazo Ho y acepto H1
Fc < Ft Acepto Ho y rechazo H1
Se rechaza las hipótesis nulas y se aceptan las alternativas a niveles de confianza del 95 y 99%, ya
que existen diferencias significativas entre los resultados del experimento, es decir tanto los
factores como los niveles de estos influyen significativamente en los resultados finales.
135
Conclusión:
A través del análisis ADEVA realizado podemos concluir que los niveles altos de factores A, B, y
D influyen sobre los resultados finales de las respuestas experimentales, en el caso del factor C
solamente influye el nivel bajo, el nivel alto de este factor solamente influye cuando interactúa con
los otros factores. Las interacciones de los factores con sus niveles altos y bajos también influyen
sobre los resultados experimentales. El mejor tratamiento para funcionamiento de la maquinaria es
el factor a1b1c0d1.
136