Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Planificación de un experimento.
A continuación, se enumeran las etapas que deben seguirse para una correcta planificación
de un diseño experimental, etapas que deben ser ejecutadas de forma secuencial. También
se introducen algunos conceptos básicos en el estudio de los modelos de diseño de
experimentos. Las etapas a seguir en el desarrollo de un problema de diseño de
experimentos son las siguientes:
Unidades experimentales,
1
Factores nuisance (molestos): factores bloque, factores ruido y covariables.
6. Especificar el modelo.
Los pasos del listado anterior no son independientes y en un determinado momento puede
ser necesario volver atrás y modificar decisiones tomadas en algún paso previo.
A continuación, se hace una breve descripción de las decisiones que hay que tomar en cada
uno de los pasos enumerados. Sólo después de haber tomado estas decisiones se
procederá a realizar el experimento.
Se debe hacer una lista completa de las preguntas concretas a las que debe dar respuesta
el experimento. Es importante indicar solamente cuestiones fundamentales ya que tratar de
abordar problemas colaterales puede complicar innecesariamente el experimento.
Una vez elaborada la lista de objetivos, puede ser útil esquematizar el tipo de conclusiones
que se espera obtener en el posterior análisis de datos.
Normalmente la lista de objetivos es refinada a medida que se van ejecutando las etapas del
diseño de experimentos.
2
Factores tratamiento: son aquellas fuentes cuyo efecto sobre la respuesta es de particular
interés para el experimentador.
Factores “nuisance”: son aquellas fuentes que no son de interés directo pero que se
contemplan en el diseño para reducir la variabilidad no planificada.
Los niveles de un factor tratamiento son los tipos o grados específicos del factor que se
tendrán en cuenta en la realización del experimento.
3
Cuando en un experimento se trabaja con más de un factor, se denomina:
Observación es una medida en las condiciones determinadas por uno de los tratamientos.
Son el material donde evaluar la variable respuesta y al que se le aplican los distintos
niveles de los factores tratamiento.
Factor bloque. En algunos casos el factor nuisance puede ser fijado en distintos niveles,
de modo que es posible controlar su efecto a esos niveles. Entonces la forma de actuar es
mantener constante el nivel del factor para un grupo de unidades experimentales, se cambia
a otro nivel para otro grupo y así sucesivamente. Estos factores se denominan factores de
4
bloqueo (factores-bloque) y las unidades experimentales evaluadas en un mismo nivel del
bloqueo se dice que pertenecen al mismo bloque. Incluso cuando el factor nuisance no es
medible, a veces es posible agrupar las unidades experimentales en bloques de unidades
similares: parcelas de tierra contiguas o períodos de tiempo próximos probablemente
conduzcan a unidades experimentales más parecidas que parcelas o períodos distantes.
FUENTE TIPO
(Factores tratamiento)
(Factores “nuisance”)
5
3.- Elegir una regla de asignación de las unidades experimentales a las condiciones
de estudio (“tratamientos”).
Anidamiento,
También se debe especificar con claridad la forma en que se realizarán las mediciones:
instrumentos de medida, tiempo en el que se harán las mediciones, etc.
6
Permite practicar la técnica experimental elegida e identificar problemas no
esperados en el proceso de recogida de datos,
El modelo matemático especificado debe indicar la relación que se supone que existe
entre la variable respuesta y las principales fuentes de variación identificadas en el paso
2. Es fundamental que el modelo elegido se ajuste a la realidad con la mayor precisión
posible.
En este modelo la respuesta viene dada por una combinación lineal de términos que
representan las principales fuentes de variación planificada más un término residual
debido a las fuentes de variación no planificada. Los modelos que se estudian en este
texto se ajustan a esta forma general. El experimento piloto puede ayudar a comprobar si
el modelo se ajusta razonablemente bien a la realidad.
Los modelos de diseño de experimentos, según sean los factores incluidos en el mismo,
se pueden clasificar en: modelo de efectos fijos, modelo de efectos aleatorios y modelos
mixtos. A continuación, se precisan estas definiciones.
Factor de efectos fijos es un factor en el que los niveles han sido seleccionados por el
experimentador. Es apropiado cuando el interés se centra en comparar el efecto sobre la
respuesta de esos niveles específicos.
Factor de efectos aleatorios es un factor del que sólo se incluyen en el experimento una
muestra aleatoria simple de todos los posibles niveles del mismo. Evidentemente se
utilizan estos factores cuando tienen un número muy grande de niveles y no es razonable
o posible trabajar con todos ellos. En este caso se está interesado en examinar la
variabilidad de la respuesta debida a la población entera de niveles del factor.
7
Ejemplo: una cadena de hipermercados que tiene en planilla 300 trabajadores de caja
está interesada en estudiar la influencia del factor trabajador en la variable “tiempo en el
cobro a un cliente”.
Modelo de efectos fijos es un modelo en el que todos los factores son factores de
efectos fijos.
Modelo de efectos aleatorios es un modelo en el que todos los factores son factores de
efectos aleatorios.
Modelo mixto es un modelo en el que hay factores de efectos fijos y factores de efectos
aleatorios.
Se deben esquematizar los pasos del análisis a realizar que deben incluir:
Contrastes a realizar,
Calcular el número de observaciones que se deben tomar para alcanzar los objetivos del
experimento.
Existen, dependiendo del modelo, algunas fórmulas para determinar este tamaño. Todas
ellas sin embargo requieren el conocimiento del tamaño de la variabilidad no planificada
(no sistemática y sistemática, si es el caso) y estimarlo a priori no es fácil, siendo
aconsejable sobreestimarla. Normalmente se estima a partir del experimento piloto y en
base a experiencias previas en trabajos con diseños experimentales semejantes.
8
9.- Revisar las decisiones anteriores. Modificar si es necesario.
De todas las etapas enumeradas, el proceso de recogida de datos suele ser la tarea que
mayor tiempo consume, pero es importante realizar una planificación previa, detallando los
pasos anteriores, lo que garantizará que los datos sean utilizados de la forma más eficiente
posible.
“Ningún método de análisis estadístico, por sofisticado que sea, permite extraer
conclusiones correctas en un diseño de experimentos mal planificado”.
Recíprocamente, debe quedar claro que el análisis estadístico es una etapa más que está
completamente integrado en el proceso de planificación.
Pero no sólo los objetivos están presentes al inicio del análisis sino también la técnica
experimental empleada. Una regla de oro en la experimentación y que debe utilizarse es la
siguiente:
Finalmente indicar que todas las personas que trabajan en el experimento se deben implicar
en el mismo, esto es:
9
Diseño Completamente Aleatorizado (DCA)
Donde
Es el término de error y
10
atención especial cuando hay heterogeneidad de la varianza.
Estudio de 04 variedades de maíz para grano tratadas con hormona común para estudiar el
efecto sobre la plántula bajo condiciones de invernadero.
C B D A B
20 19 18 17 16
A B C B C
11 12 13 14 15
D C A D A
10 9 8 7 6
A B D C D
1 2 3 4 5
Repetición
Tratamiento I II III IV V
A 1 6 8 11 17
B 2 12 14 16 19
C 4 9 13 15 20
D 3 5 7 10 18
Si los tratamientos A B y C son tipos de sustratos, una de las tantas formas de distribución
será como indica la siguiente tabla.
11
Repetición I Repetición II Repetición III Repetición IV Repetición V
A B C C A
C B A B C
B A C B A
Tierra agrícola del lugar sin incremento de turba y arena: denominamos tratamiento C
B =53 A = 32 C = 29 B = 50 A = 38
Repetición Tratamientos
A B C
I 29 53 36
II 32 55 42
III 36 60 29
IV 27 49 31
V 38 50 21
12
Los resultados del experimento no son iguales, existe variación dentro de los tratamientos y
variación entre los tratamientos, en consecuencia, se debe realizar el análisis de varianza
para conocer si esta variación es significativa estadísticamente.
t = número de tratamientos
r = número de repeticiones
PROCEDIMIENTO DE CÁLCULO
13
3 Suma Cuadrado Total (S.C.Tot )
Una vez calculado las sumas de cuadrados y los cuadrados medios, los valores de cada uno
de ellos trasladamos a la siguiente tabla de análisis de varianza
Total 1922.40 14
14
Error, (2, 12) siendo este valor 3.89
Finalmente se interpreta
Fc, 22.188 es mayor que tabulado Fα 0.05 (3.89), en consecuencia, se dice que existe
diferencia estadística significativa entre los promedios de los tratamientos
Esto nos conduce rechazar la hipótesis planteada y se aceptar la hipótesis alterna, en otras
palabras, los promedios de los tratamientos no son iguales como se ha supuesto al inicio del
experimento.
Con los datos del cuadro de análisis de varianza se hacen las pruebas de significación de
las diferencias, para ello existen varios métodos o pruebas como son: Tukey, Duncan,
Comparaciones Ortogonales Dunnet, Diferencia Mínima Significativa (DMS) etc. El paquete
estadístico SPSS ofrece 18 modelos de pruebas de comparación de promedios.
t = número de tratamientos
r = número de repeticiones
15
El valor q se encuentra en la tabla de tukey, se busca con el número de tratamientos a = t y
los grados de libertad del error experimental (g.l.e) en este caso 12 y para alfa 0.05
Para realizar las comparaciones múltiples, primero se ordenan las medias de los tratamientos en forma
ascendente o descendente
C A B
Luego, las medias se comparan por diferencia, empezando del lado derecho como sigue:
53.4 –32.4 = 21
21 supera al valor de W = 11 por tanto se dice que existe diferencia significativa entre estos
tratamientos A y B.
La tercera comparación es entre los tratamientos A y C, 32.4 – 31.8 = 0.6 este valor no
supera al valor de W = 11, entonces se dice que la diferencia de medias de tratamientos no
son significativos. Estos valores no significativos iguales se pueden unir con una barra
C A B
En los experimentos a veces se presentan casos en los que dos o más muestras o
tratamientos tienen diferente número de repeticiones. La metodología de análisis con
16
diferente número de repeticiones es la misma que para el ANVA en diseño con igual número
de repeticiones, con ligeras modificaciones en las fórmulas.
Repetición (n) A B C D
1 40 18 29 23
2 36 15 25 30
3 38 18 27 28
4 37 19 24 28
5 29 16 27 24
6 37 20 33 34
7 36 27 28 20
8 35 19 24 18
9 31 25 24
10 26 20 28
11 30 21 22
12 28 21
n1 = 12 n2 = 8 n 3= 11 n4 = 12
17
Cuadro 05. Análisis de varianza tendrá la siguiente estructura.
F de V S.C g.l C. M Fc F
Tratamientos t-1
Error
Total
18
Cuadrado Medio Error (C:M:E)
F calculado
Cuadro 06. Análisis de varianza de peso seco (g) de probetas de 4 especies maderables
Total 2066.000 42
NOTA: Se rechaza la hipótesis planteada de que las medias de peso seco de las probetas son iguales
NOTA: En la tabla Tukey no existe el valor para 39 grados de libertad, pero se puede optar por el
valor más próximo en este caso el número más próximo es 40,
Tratamientos B D C A
19
Primera comparación
Segunda comparación
0.73 < 5.85 NS. (No hay diferencia significativa) se designa como NS
Tercera comparación
Una de las formas de representar los tratamientos no significativos es uniendo con una línea
horizontal los promedios de tratamientos no significativos como sigue:
Tratamientos B D C A
________________
De 04 especies maderables
HSD de Tukey
20
2 3 1
B 8 19,0000
D 12 25,0000
C 11 25,7273
A 12 33,5833
b Los tamaños de los grupos no son iguales. Se utilizará la media armónica de los tamaños de los grupos. Los
niveles de error de tipo I no están garantizados.
21
DISEÑO EN BLOQUES COMPLETOS ALEATORIZADOS (DBCA)
Las unidades experimentales deben ser homogéneas dentro de cada bloque, salvo por
variaciones aleatorias. Dos unidades experimentales de bloques diferentes pueden exhibir
heterogeneidad, siendo de hecho el propósito de los bloques, absorber en máximo grado la
variabilidad del material experimental. En la práctica forestal los bloques se colocan
perpendicularmente al gradiente de fertilidad del suelo.
También se dice clasificación a dos criterios, entonces, es aquel modelo en cuyas unidades
experimentales existe una variable que puede modificar los efectos a generarse con los
tratamientos y afectar los resultados. La diferencia entre las unidades experimentales debe
eliminarse con el fin de que, como en el caso del Diseño Completamente al Azar, (DCA),
cada unidad experimental reciba un solo tratamientos.
Al interior de cada bloque la asignación de los tratamientos es hecha al azar, con el mismo
objetivo que la clasificación a un solo criterio: buscar una prueba para la hipótesis, de
igualdad de efectos de los tratamientos. El rechazo de la hipótesis conduce a especificar
cuál de los tratamientos es mejor al haberse eliminado con la formación de bloques, una
variable en la cuál no hay interés. Para comprender el significado del Diseño Bloques
Completos Aleatorizado, es necesario la información de los siguientes conceptos:
BLOQUES ALEATORIOS
Los bloques de unidades con frecuencia constituyen una muestra aleatoria de los bloques
disponibles para el investigador. Los sitios usados como bloques en estudios ecológicos,
forestales o de vida silvestre pueden ser muestras aleatorias de muchos sitios disponibles
para el estudio, es posible establecer parcelas en cada uno de los sitios para el tratamiento.
Los lotes de material fabricado (producto químico) usados como bloque de tratamientos
22
experimentales son lotes aleatorios, el lote se divide en unidades experimentales más
pequeñas a las que se administra el tratamiento. En experimentos sobre el terreno,
usualmente cada bloque consiste en un grupo de compacto de parcelas aproximadamente
cuadradas. De igual manera, en experimentos con animales, los animales se colocan en
grupos de resultados o bloques con base en características tales como el peso inicia
condición del animal, raza sexo, edad, o como etapa de lactancia y producción de lecha en
el ganado, y como camadas en cerdos.
ALEATORIZACIÓN
Cuando se han asignado las unidades experimentales a los bloques, se numeran en cierto
orden conveniente. Los tratamientos también se numeran y luego se asignan aleatoriamente
(al azar) los tratamientos a las unidades dentro de cada bloque. Una nueva aleatorización se
efectúa en cada bloque.
Las unidades experimentales (plantas, animales, objetos) deben ser homogéneas dentro de
23
cada bloque, salvo por variaciones aleatorias. Dos unidades experimentales de bloques
diferentes pueden exhibir heterogeneidad, siendo de hecho el propósito de los bloques,
absorber en máximo grado la variabilidad del material experimental. En la práctica forestal
los bloques se colocan perpendicularmente al gradiente de fertilidad del suelo.
También se dice clasificación a dos criterios, entonces, es aquel modelo en cuyas unidades
experimentales existe una variable que puede modificar los efectos a generarse con los
tratamientos y afectar los resultados. La diferencia entre las unidades experimentales debe
eliminarse con el fin de que, como en el caso del Diseño Completamente al Azar, (DCA),
cada unidad experimental reciba un solo tratamientos.
Mediante este diseño se logra que la variación entre bloque pueda eliminarse por medio del
análisis estadístico reduciendo el error experimental y aumentándose la precisión del
ensayo.
Los bloques deben disponerse de manera tal que se absorba una máxima variación entre
bloques, mientras que se procure mantener la variación dentro de bloques a un nivel tan
bajo como sea posible.
Este diseño puede emplearse para la prueba de un número aleatorio de tratamientos, pero
en la práctica surgirán problemas al compás del aumento del tamaño de los bloques junto
con el aumento del número de tratamientos. Aumentando el tamaño de los bloques, la
variación dentro de bloques aumenta también y el objetivo del establecimiento de bloques
no podrá lograrse de manera satisfactoria. En tales casos se podrá optar por la utilización de
un diseño incompleto, o optar por una reducción del número de unidades experimentales.
Método estadístico
i = 1 , 2, ......r, y j = 1, 2, .........t,
24
TRATAMIENTO BLOQUES
ANÁLISIS DE VARIANZA
PROCEDIMIENTO DE CÁLCULO
42986,932-42,480.6033=506.33
5. Suma
Cuadrado Error (S.C.Error)
25
6. Cuadrado Medio Bloque (C.M.Bloq.)
9. F. Calculado (Fc.)
Bloques r-1
Tratamientos t-1
Error (r-1)(t-1)
Total (r . t)-1
Total 23 506.33
El estadístico Fc es 5.59 excede al valor crítico de F0.05, 5,15 tabulado igual a 2.90 cuando
esto sucede se rechaza la hipótesis planteada
26
El nivel de significación observado es la probabilidad mayor que F=0.05 (ver tabla) por lo
que en esta etapa de desarrollo de la planta, hay diferencia significativa entre los
tratamientos de nitrógeno y la nitrogenación de las hojas.
Subconjunto
TRATAMIENTOS 1 2
A 38.2775
27
E 39.5100
D 40.6150 40.6150
F 43.2250 43.2250
B 44.0325 44.0325
C 46.7700
INTERPRETACIÓN
28
Comparaciones múltiples de los promedios
Variable dependiente: DATOS
DHS de Tukey
Intervalo de confianza al
Diferencia 95%.
entre Límite
(I) TRAT (J) TRAT medias (I-J) Error típ. Significación Límite inferior superior
A B -5.7550 1.89744 .074 -11.9197 .4097
C -8.4925* 1.89744 .005 -14.6572 -2.3278
D -2.3375 1.89744 .815 -8.5022 3.8272
E -1.2325 1.89744 .985 -7.3972 4.9322
F -4.9475 1.89744 .155 -11.1122 1.2172
B A 5.7550 1.89744 .074 -.4097 11.9197
C -2.7375 1.89744 .702 -8.9022 3.4272
D 3.4175 1.89744 .493 -2.7472 9.5822
E 4.5225 1.89744 .223 -1.6422 10.6872
F .8075 1.89744 .998 -5.3572 6.9722
C A 8.4925* 1.89744 .005 2.3278 14.6572
B 2.7375 1.89744 .702 -3.4272 8.9022
D 6.1550 1.89744 .050 -.0097 12.3197
E 7.2600* 1.89744 .017 1.0953 13.4247
F 3.5450 1.89744 .456 -2.6197 9.7097
D A 2.3375 1.89744 .815 -3.8272 8.5022
B -3.4175 1.89744 .493 -9.5822 2.7472
C -6.1550 1.89744 .050 -12.3197 .0097
E 1.1050 1.89744 .991 -5.0597 7.2697
F -2.6100 1.89744 .740 -8.7747 3.5547
E A 1.2325 1.89744 .985 -4.9322 7.3972
B -4.5225 1.89744 .223 -10.6872 1.6422
C -7.2600* 1.89744 .017 -13.4247 -1.0953
D -1.1050 1.89744 .991 -7.2697 5.0597
F -3.7150 1.89744 .408 -9.8797 2.4497
F A 4.9475 1.89744 .155 -1.2172 11.1122
B -.8075 1.89744 .998 -6.9722 5.3572
C -3.5450 1.89744 .456 -9.7097 2.6197
D 2.6100 1.89744 .740 -3.5547 8.7747
E 3.7150 1.89744 .408 -2.4497 9.8797
Basado en las medias observadas.
*. La diferencia de medias es significativa al nivel .05.
*. Se ha detectado el símbolo .05 donde se esperaba un paréntesis de cierre en el
subcomando TEST.
29
DISEÑO EN CUADRADO LATINO
Este diseño es muy eficaz en los casos en que ocurren variaciones en dos direcciones, pero
al mismo tiempo existen ciertas restricciones con respecto al número de tratamientos
distintos que pueden investigarse, ya que el número de por ejemplo 10 requerirá el
establecimiento de 100 parcelas y un número 4 y por debajo dará un número demasiado
reducido de grados de libertad para permitir una prueba segura de los tratamientos.
Ejemplo Cosecha de grano de una variedad de trigo para cinco tasas de siembra en un
diseño cuadrado latino. La etiqueta de tratamiento (A, B, ,C, D, E) aparece en los paréntesis
en seguida del valor de la cosecha Ejemplo de Diseño en Cuadrado Latino con 5
tratamientos (ABCDE) distribuidos al azar
E A C B D
C D B E A
B C D A E
A B E D C
D E A C B
30
Modelo estadístico
Cuadro del diseño en cuadrado latino con resultados al final del experimento
HILERAS COLUMNAS
1 2 3 4 5 Total Media
1 59.45 (E) 47.28 (A) 54.44 (C) 50.14 (B) 59.45 (D) 270.76 54.152
2 55.16 (C) 60.89 (D) 56.59 (B) 60.17 (E) 48.71 (A) 281.52 56.304
3 44.41 (B) 53.72 (C) 55.87 (D) 47.99 (A) 59.45 (E) 261.44 52.288
4 42.26 (A) 50.14 (B) 55.87 (E) 58.74 (D) 55.87 (C ) 262.88 52.576
5 60.89 (D) 59.45 (E) 49.43 (A) 59.45 (C ) 57.31 (B) 286.53 57.306
TRATAMIENTOS
A B C D E
31
ANÁLISIS DE VARIANZA EN CUADRADO LATINO
PROCEDIMIENTO DE CÁLCULO
32
10. Cuadrado Medio Error (C.M.Error)
9. F. Calculado (Fc.)
Total 24
El estadístico Fc para probar la hipótesis nula de que no hay diferencia entre tratamientos
igual a 27.67 que excede al valor crítico de F0.05, 4,12 igual a 3.26 con un nivel de significación
observado de Pr = 0.000 ver la tabla.
33
Peso en kilogramos de materia seca de trigo por unidad
experimental
a,b
DHS de Tukey
Subconjunto
TRATAMIENTOS N 1 2 3
A 5 47.1340
B 5 51.7180
C 5 55.7280 55.7280
E 5 58.8780
D 5 59.1680
Se muestran las medias para los grupos en subconjuntos
homogéneos.
Basado en la suma de cuadrados tipo III
El término error es la Media cuadrática (Error) = 4.719.
a. Usa el tamaño muestral de la media armónica = 5.000
b. Alfa = .05.
INTERPRETACIÓN:
Los tratamientos D, E y C tuvieron una influencia similar en el peso de grano, pero son
significativamente mayor que los tratamientos A y B. El tratamiento A, es significativamente
menor que los otros tratamientos en estudio.
EXPERIMENTOS FACTORIALES
Los experimentos factoriales se emplean en todos los campos de la investigación, son muy
útiles en investigaciones exploratorias en las que poco se sabe acerca de muchos factores.
VENTAJAS:
1.- Permite estudiar los efectos principales, efectos de interacción de factores, efectos
simples y efectos cruzados.
34
3.- El número de grados de libertad para el error experimental es alto, comparándolo con
los grados de libertad de los experimentos simples de los mismos factores, lo que
contribuye a disminuir la variancia del error experimental, aumentando por este
motivo la precisión del experimento.
DESVENTAJA
2.- Como en los experimentos factoriales c/u de los niveles de un factor se combinan
con los niveles de los otros factores; a fin de que exista un balance en el análisis
estadístico se tendrá que algunas de las combinaciones no tienen interés práctico,
pero deben incluirse para mantener el balance.
CONCEPTOS GENERALES:
FACTOR
FACTORIAL
NIVELES DE UN FACTOR. -
Ejemplo:
Niveles: a0 a1 a2
TIPOS DE FACTORES:
35
1.- Factores Cuantitativos.
Ejemplo:
Ejemplo:
Factor A: a0 a1 a2
Factor B: b0 b1
niveles de A x niveles de B
36
Repeticiones a0 b0 a0 b1 a1 b0 a1 b1 a 1b 0 a2 b1
1
2
3
4
FORMACIÓN DE FACTORIALES:
2.- Que factores son fijos (modelo I) y que factores son al azar (modelo II).
4.- Si son factores cuantitativos, cual debe ser el espaciamiento entre los niveles del factor.
Por ejemplo:
Los experimentos factoriales para un determinado diseño se diferencian entre si, por el
número de factores y por la cantidad de niveles de estos factores que intervienen en el
experimento.
pA x qB dos factores "A y "B", con "p" niveles para "A" y "q" niveles para "B"
® Número de factores.
Número de factores.
37
3A 3B = 3A x 3B 3 x 3 32 Número de niveles ( 9 tratamientos ).
Número de factores.
Es una medida del cambio en el promedio entre los niveles de un factor, promediado
sobre los diferentes niveles del otro factor. Ejemplo: Dosis de Nitrógeno en las U.E.
GRÁFICO DE LA INTERACCIÓN:
En los siguientes gráficos se muestran los casos posibles de interacción en dos factores: A
con 3 niveles y B con 2 niveles. En el eje "X" se registra los niveles de A y en el eje "Y" los
promedios de la interacción de "A" y "B". Los puntos son unidos por una línea, para cada
nivel de "B".
Para tener una idea sobre experimentos factoriales (dos variables) supongamos que se
desea determinar los efectos de la temperatura del gas y el ancho del horno sobre el tiempo
requerido para fabricar el carbón.
Decidimos llamar el ancho del horno como factor A con los siguientes niveles
a1 = 10cm
38
a2 = 20cm
a3 = 30cm
a1 a1b1 a1b2
a2 a2b1 a2b2
a3 a3b1 a3b2
Existen 06 combinaciones, a estas combinaciones se denomina también tratamientos,
cumpliendo el principio de los diseños experimentales cada combinación o tratamiento se
replica 03 veces, la repetición se denomina también bloque.
Hipótesis Nula Ho. Las variaciones del ancho del horno y temperatura no afectan el tiempo
de carbonización
39
μ es la gran media, α es el efecto en el nivel i ésimo del factor A y en el j ésimo nivel del
factor β y ρ k, es el efecto de la k ésima repetición.
Donde:
40
La sub división de la suma de cuadrados de los tratamientos se descompone para los
factores A y B y para la interacción, puede simplificarse construyendo la siguiente tabla
bidireccional, donde las entradas son los totales en la columna derecha de la tabla, dando los datos
originales:
a3 32.4 22 54.4
Usando fórmulas análogas a las que usamos para calcular las sumas de los cuadrados para
varios efectos, tenemos ahora para los efectos principales
Finalmente dividiendo las sumas de cuadrados entre sus grados de libertad y dividiendo los
cuadrados medios apropiados entre el cuadrado medio del error, obtenemos los resultados
que muestra la tabla de análisis de varianza.
41
Cuadro de análisis de varianza de los niveles de los factores
Efectos Principales
Total 149.38 17
Para el efecto principal del factor A, como Fc = 2.46 no excede a 4.10 se dice que no hay
diferencia estadística significativa, y para el efecto principal del factor B, como Fc = 68.8
excede a 4.96 hay diferencia estadística significativa y la hipótesis nula deben rechazarse.
Para el efecto de interacción, F c = 11.4 excede a 7.56 debemos rechazar la hipótesis nula.
Muchos experimentos de investigación toman en cuenta más de dos factores. En esta parte
de la asignatura se presenta el caso donde se tienen a niveles del factor A, b niveles del
factor B y c niveles del factor C, acomodamos en un experimento factorial, en general se
tendrá un total de abc … r observaciones, si existe r repeticiones del experimento
completo.
En total habrá 36 (6) = 216 unidades experimentales, que serán distribuidas en forma
aleatoria en DCA.
42
Tabla 01. Datos hipotéticos para ilustrar el ANVA en un diseño completamente aleatorizado
con arreglo factorial de 3 x 4 x 3
a1 a2 a3
b1 b2 B3 b4 b1 b2 b3 b4 b1 b2 b3 b4
3 10 9 8 24 8 9 3 2 8 9 8
2 10 9 8 29 16 11 3 2 7 5 3
8 10 2 8 27 16 15 8 2 15 7 14
C1
1 6 8 14 14 13 8 5 9 30 9 2
7 8 9 6 18 10 2 16 14 7 6 11
8 1 10 12 3 8 8 4 11 2 2 9
Total 29 45 47 56 115 71 53 39 40 69 38 47
4 12 3 8 22 7 16 2 2 2 7 2
7 10 5 8 28 18 10 6 6 6 5 9
7 9 2 7 27 15 12 7 7 16 1 13
C2
14 5 7 15 34 11 9 5 13 11 8 3
7 9 8 2 19 9 12 12 13 6 6 12
7 6 12 3 3 15 8 4 12 3 2 10
Total 46 51 37 43 133 75 67 36 53 44 29 49
5 10 5 8 23 9 17 3 2 8 6 3
9 10 27 8 28 16 11 7 8 9 8 15
15 7 6 15 30 14 12 5 11 18 3 8
C3
8 6 4 18 16 12 13 15 17 8 7 16
7 17 3 10 17 10 20 9 9 8 6 17
3 2 10 5 3 7 8 6 11 7 3 14
Total 47 52 55 64 117 68 81 45 58 58 33 73
OBSERVACIONES:
2. Para realizar el análisis de varianza (ANVA), se procesa las siguientes tablas, con
sus respectivos sumandos
43
Tabla 02. Es una tabla de a x b x c, muestra los totales de cada combinación o
tratamiento en esta se resume la suma de 6 repeticiones y a la vez se suman los totales
para hallar las sumas de las combinaciones de los niveles del factor A y B
a1 a2 a3
b1 b2 b3 b4 b1 b2 b3 b4 b1 b2 b3 b4
c1 29 45 47 56 115 71 53 39 40 69 38 47
c2 46 51 37 43 133 75 67 36 53 44 29 49
c3 47 52 55 64 117 68 81 45 58 58 33 73
Total 122 148 139 163 365 214 201 120 151 171 100 169
a1 a2 a3 TOTAL
a1 a2 a3 TOTAL
Si observamos bien la tabla 01, encontramos los valores de las combinaciones de los
niveles de los factores A y C que muestra la siguiente cuadro, los totales de cada
combinación está resumido en la tabla 04
b1 b2 b3 b4 Total
44
Total 638 533 440 452 2063
Asimismo cuando observamos la tabla 01, encontramos los valores de las combinaciones de
b x c que muestra el siguiente cuadro. El contenido de la tabla 05, son los totales de las
combinaciones de los niveles del factor B y C
MODELO MATEMÁTICO
Donde:
i = 1, 2, . . . , a
j = 1, 2, . . . , b
k = 1, 2, . . . , c
l = 1, 2, . . . , r
A a–1
B b–1
C c–1
AB (a-1) (b-1)
AC (a-1) (c-1)
BC (b-1) (c-1)
ABC (a-1)(b-1)(c-1)
Error abc(r-1)
Total abcr – 1
45
1. Hallar El factor de corrección
Cuando ingresamos los 216 datos a la calculadora con estadístico, debemos tener presente
y tomar nota de los valores de las sumas y sumas cuadrados de la variable respuesta en
este caso es X, para el ejemplo estos valores son:
RECORDAR = calculadora
46
5. Hallar suma cuadrado del factor C
47
9. Hallar suma cuadrado interacción ABC
El cuadro contiene el resumen del análisis de varianza. Los cocientes Fc para los tres
efectos principales y la interacción se forman al dividir la media cuadrada del efecto de
48
interés por la media de cuadrados de error. Existe diferencia estadística significativa para los
efectos principales del los factores A, B y C y la interacción AB. Igual resultado se logra con
el paquete estadístico SPSS
DATOS
a,b
DHS de Tukey
Niveles del factor Subconjunto
A N 1 2
a1 72 7.9444
a3 72 8.2083
a2 72 12.5000
Significación .951 1.000
Se muestran las medias para los grupos en
subconjuntos homogéneos.
Basado en la suma de cuadrados tipo III
El término error es la Media cuadrática (Error) = 27.745.
a. Usa el tamaño muestral de la media armónica =
72.000
b. Alfa = .05.
49
FACTOR FACTOR FACTOR BLOQUES TRATAMIENTOS
A TOTAL
B C I II
50
El factor C es la dosis de PROTEÍNA con los niveles c1 = 12 c2 = 24
El experimento se condicionó en DBCA, con dos repeticiones por cada combinación de los
niveles de cada factor se denomina también tratamiento.
Antes de realizar el análisis de varianza se debe resumir los totales de las combinaciones de
los niveles de los factores ABC como aparece en las siguientes tablas
TABLA A DE RESUMEN
El resultado 5.05 es la suma de los resultados del tratamiento de a1b1 repetido dos veces, o
sea la suma de 1.11 + 0.97 + 1.52 + 1.45 = 5.05. Se logra el mismo resultado sumando el
total de las repeticiones del tratamiento. 2.08 + 2.97 = 5.05, para el resto de las casillas es
igual el procedimiento, solo debe tener en cuenta la combinación de los niveles.
TABLA RESUMEN B
El resultado 8.95 es la suma de resultados del tratamiento b1c1 repetido dos veces de
acuerdo al diseño, mejor dicho es 1.11 + 0.97 + 1.30 + 1.00 + 1.22 + 1.13 + 1.19 + 1.03 =
8.95.
El mismo resultado se logra sumando los totales de las repeticiones del tratamiento b1c1,
esto es 2.08 + 2.30 + 2.35 + 2.22 = 8.95, para las otras casillas es similar el procedimiento
51
TABLA C DE RESUMEN
El resultado 6.22 es la suma de los resultados del tratamiento a1c1 repetido dos veces en el
experimento, representando sus sumando es como sigue: 1.11 + 0.97 + 1.09 + 0.99 + 0.85 +
1.21 = 6.22.
También se logra el mismo resultado sumando los totales de las repeticiones que aparecen
en la última columna de la tabla de resultados como sigue.2.08 + 2.08 + 2.06 = 6.22
SUMATORIAS DE CALCULADORA
1. FACTOR DE CORRECCIÓN
52
5. SUMA CUADRADO ERROR
Las entradas en la tabla son sumas de dos niveles de proteína; 5.05 = 2.08 + 2.97, etc.
6.
7.
8.
9.
10.
11.
12.
53
B 0.0526 2 0.0263 0.96 3.42
C 0.5355 1 0.5355 19.47** 4.28
AB 0.2543 6 0.0424 1.54 2.53
AC 0.2399 3 0.0800 2.10 3.03
BC 0.0821 2 0.0410 1.49 3.42
ABC 0.0685 6 0.0114 0.41 2.53
Error 0.6319 23 0.0275
TOTAL 2.04089 47
La suma cuadrado medio del bloque, de los factores e interacciones se logra dividiendo las
sumas de cuadrados de cada uno de ellos entre su grado de libertad, por ejemplo, el
cuadrado medio del factor A es 0.0427/3= 0.0142
Asimismo el Fc, es la división de cada uno de los cuadrados medios entre el cuadrado
medio del error, Fc para bloques es igual 0.12334/0.0275 = 4.85
Los diseños de parcelas divididas y una variación de estos, denominados bloques divididos
se usan frecuentemente en experimentos factoriales, en los que la naturaleza del material
experimental o las operaciones observadas dificultan el manejo de todas las combinaciones
de factores en una misma forma. El diseño involucra la asignación de tratamientos de un
factor a parcelas principales dispuestas en un diseño completamente aleatorio, de bloques
completos aleatorizados o de cuadrado latino. Los tratamientos del segundo factor se
asignan a subparcelas dentro de cada parcela principal. El proyecto suele sacrificar la
precisión en la estimación de los efectos promedio de los tratamientos asignados a las
parcelas principales, aunque frecuentemente aumenta la precisión para comparar los
efectos promedio de los tratamientos asignados a subparcelas; y cuando existen
interacciones, para comparar los efectos de tratamientos de subparcelas en un tratamiento
de una parcela principal dada. Esto proviene del hecho de que el error experimental para las
parcelas principales suele ser mayor que el error experimental utilizado para comparar
54
tratamientos de subparcelas. El término de error para tratamientos de subparcelas es inferior
al que se obtendría si todas las combinaciones de tratamientos fuesen dispuestas en un
diseño de bloques completos al azar (LITTLE 1965) se utiliza en los siguientes casos:
1. Cuando los tratamientos están relacionados con los niveles de uno o más factores y
necesitan mayores cantidades de material experimental en una unidad experimental que
los tratamientos de otros factores. Esto sucede en los experimentos sobre el campo,
laboratorio, industrial o social. Por ejemplo en un experimento sobre el campo uno de los
factores puede ser el método de preparación de suelo o aplicación de un fertilizante,
factores que necesitan, por lo general parcelas o unidades experimentales grandes. El
otro factor puede ser variedades, las cuales se pueden comparar usando parcelas más
pequeñas. Otro ejemplo es el experimento diseñado para comparar las cualidades de
conservación de la crema de helado hecha a partir de diferentes fórmulas y almacenada
a diferentes temperaturas.
4. El diseño se usa cuando se desea mayor precisión para comparaciones entre ciertos
factores, que para otras.
55
Supongamos que r = 3, a=4 b= 2
a4b2 a1b2 a2b1 a3b2 a3b1 a4b2 a2b2 a1b1 a2b1 a3b1 a1b2 a4b1
a4b1 a1b1 a2b2 a3b1 a3b1 a4b1 a2b1 a1b2 a2b2 a3b2 a1b1 a4b2
Dentro de cada unidad completa hay 1 grado de libertad asociado con la variación entre las
subunidades dentro de una unidad completa y lo que da un total de 12 grados de libertad
dentro de unidades completas. Estos 12 grados de libertad están particionados en 1 grado
de libertad para el efecto principal de B, 3 grados de libertad para la interacción de AB y 8
grados de libertad para un error experimental para las comparaciones entre subunidades.
56
Bloque I Bloque II Bloque III
a4b4 a1b2 a2b1 a3b4 a3b2 a4b2 a2b3 a1b4 a2b2 a3b1 a1b4 a4b1
a4b3 a1b1 a2b4 a3b1 a3b1 a4b3 a2b1 a1b2 a2b1 a3b3 a1b1 a4b4
a4b1 a1b3 a2b2 a3b3 a3b3 a4b4 a2b4 a1b3 a2b3 a3b2 a1b2 a4b2
a4b2 a1b4 a2b3 a3b2 a3b4 a4b1 a2b2 a1b1 a2b4 a34 a1b3 a4b3
Bloque IV
57
Cuadro de análisis de varianza para los datos del ejemplo avenas
1. Factor de corrección
58
7.
9.
Total 7797.39 63
59
Este proceso omite la división en subparcelas y hacer sólo el análisis de parcelas completas
Como la interacción es significante, las diferencias en las respuestas entre los lotes de
semillas varían para los tratamientos de las semillas en una forma que el azar y la hipótesis
nula no puede explicar fácilmente; es importante examinar los efectos simples. Los efectos
simples de mayor interés están entre los cuatro tratamientos de semillas dentro de cada lote
de semillas.
Ejemplo 02
Supongamos que se ensayan tres distancias de plantación 2m, 3m, y 4m para estudiar el
crecimiento de 4 especies forestales (A, B, C, D). Ya que no es fácil ni práctico para la
maquinaria delinear parcelas chicas con pequeñas distancias entre plantas, este factor
(distanciamiento entre plantas) colocamos sobre parcelas grandes, estas parcelas grandes
subdividimos en 4 subparcelas cada una, para plantar las especies forestales (factor B)
sobre estas parcelas chicas. Después de la aleatorización en uno de los bloques la figura de
la distribución queda como sigue.
B C A B C A
D A C D B C
A B B A A D
C D D C D B
4m 3m 2m 2m 3m 4m
C D B D B A
D B C B C C
60
A A D A D B
B C A C A D
2m 4m 3m 3m 2m 4m
Los efectos del factor en las parcelas grandes se estiman contrastando los totales de
parcelas grandes. Por esta característica de los diseños en parcelas divididas, es común
decir que estos arreglos conducen a la confusión de algunos efectos principales.
Modelo lineal
Donde , es un efecto general, efecto del bloque completo, el efecto del tratamiento j
sobre la parcela grande ( ij ), el elemento aleatorio de error sobre la parcela grande (ij)
ANÁLISIS DE VARIANZA
El análisis abarca dos partes a) hacer el análisis de varianza de las parcelas grandes y b)
hacer el análisis de las subparcelas o parcelas chicas
61
Parcelas grandes C = compuesto 20ton/ha, S = Sin compuesto i= 1 .... p
Para realizar el análisis estadístico de los datos decrecimiento se procede como se indica
S C S C S C S C S C
1 767 920 764 989 741 901 584 817 2856 3627 6483
2 690 898 889 948 833 1058 574 874 2986 3778 6764
3 857 960 721 848 931 993 758 918 3267 3719 6986
4 1055 877 994 1020 701 811 994 771 3744 3479 7223
SUMA 3369 3655 3368 3805 3206 3763 2910 3380 12853 14603 27456
62
Repeticiones o bloques
63
5. Cálculo de la suma de cuadrados debida a los subtratamientos, SC.SubTrat o
parcelas chicas.
Bloques r -1 = 3
Tratamientos t-1 = 1
Subtotal 3 +1 + 3 = 7
T*S (p-1)(q-1) = 3
Total (r p q-1) = 23
64
Fuentes de variación Grados de Sumas de Cuadrados F
libertad cuadrados medios
Calculada
* Significancia al 5%
** Significancia al 1 %
Compuesto 90.54
ANÁLISIS DE COVARIANZA
El análisis de covarianza es una técnica que combina los aspectos de análisis de varianza y
de regresión; covarianza significa variación simultánea de dos variables correlacionadas.
Usos:
65
3. Aclara la naturaleza de los efectos de tratamientos en experimentos aleatorios
Para mayor detalle consulte con Bioestadística Principios y Procedimientos ( Steel & Torrie)
3. Cálculo de b y x
Cuando se aplica para corregir por un diferente número de plantas, el ajuste se hace si
como si todas las unidades experimentales contaran con igual número. La técnica también
se puede aplicar en aquellos experimentos agropecuarios en que los animales tienen un
peso inicial diferente, siendo la variable independiente X dicho peso inicial y la ganancia en
peso, después de aplicar los tratamientos, la variable dependiente Y.
I = 1. . . . . . a tratamientos
J = 1. . . . . . n repeticiones
Ejemplo:
Se diseñó un experimento con siete tratamientos usando una distribución en bloques al azar
con seis repeticiones. Los tratamientos fueron 30, 65, 40, 45, 50, 55 y 60 días después de
ocurrida la polinización. El número de plantas por parcela útil fue de 52; las parcelas fueron
de dos surcos de 5m de largo y espaciados 90cm, teniendo una población equivalente a
56524 plantas por hectárea. Al cosechar el maíz, el número de plantas, por tratamiento y por
repetición, fue diferente. Los valores se presentan en la tabla 01.
Tratamientos = a
Repeticiones = n
66
Cuadro 01. Rendimiento de grano seco (Kg/parcela útil) y número de plantas de maíz
X Y X Y X Y X Y X Y X Y Xi. Yi.
Xj; Yj 264 32.06 224 30.14 278 34.07 291 37.86 304 36.02 299 33.12 1660 203.27
X = número de plantas
67
Procedimiento para calcular la suma cuadrado (S.C) para la variable X
1.
2.
3.
68
4.
5.
1.
2.
3.
4.
5.
69
Prueba F para el número de plantas X, el rendimiento de grano Y y la covarianza
NOTA: El cuadrado medio del error del número de plantas 22.80 es varianza común de la variable
número de plantas, si sacamos la raíz cuadrada de esta cantidad es 4.77 esta es la desviación
estándar de la variable X,
Valores ajustados
Causas
70
Tratamientos 6 337.47 36.78 17.39
Error 30 684.24 58.78 15.27 29 10.221 0.352
Tratamiento+error 36 1021.71 95.56 32.66 35 23.722
Tratamientos ajustados 6 13.501 2.25**
71
30 35.66 -4.19 +0.36 3.45 3.81
39.52
Número de
Desviación
plantas
72
los promedios ajustados.
En la tabla anterior, los valores son casi iguales y las diferencias se deben a las
aproximaciones de los decimales
73