Está en la página 1de 34

54

V.- EXPERIMENTOS FACTORIALES.

Los experimentos factoriales son aquellos en los que se


prueban varios niveles de dos o más factores. El número de
tratamientos es el resultado de combinar los diferentes
niveles de los factores. Un factor es un ingrediente que
interviene en un tratamiento, mientras que el nivel es cada
una de las dosis o categorías de cada factor. Por ejemplo, el
factor A podría ser RAZA con cuatro categorías (las razas de
ganado Holstein, Suizo, Charolais y Cebú) y el factor B, DIETA
con tres categorías (dieta testigo, una dieta con Canavalia y
otra con pollinaza), en este experimento el número de
tratamientos es de 12. Todo experimento con dos o más factores
tiene un arreglo de tratamientos y un diseño experimental;
así, p.e.; hablamos de un experimento con un arreglo factorial
en un diseño completamente al azar o en un diseño de bloques
al azar.
La aleatorización de los tratamientos se lleva a cabo de
acuerdo con el diseño experimental de que se trate. Recuerde
que aquí el número de tratamientos es la combinación de los
niveles de cada uno de los factores.

Las tres razones principales para realizar Experimento


Factorial son:

1.- Para obtener información de los efectos medios de todos


los factores de un experimento simple de tamaño moderado.
2.- Para ampliar la base de las inferencias de un factor para
probarlo bajo condiciones variadas de otros.
3.- Para evaluar la manera en la cual los efectos de los
factores
interactúan con cada uno.

Obviamente las razones no son independientes y el énfasis


varía con el tipo de experimento.
En general un experimento factorial es más completo
porque se puede obtener más información y un grado de
precisión mayor del mismo número de observaciones. Suponga que
desea realizar dos experimentos. En el primero se compararan
tres niveles de proteína usando 36 cerdos en total, en un DCA.
En el segundo experimento se desea comparar tres niveles de
energía también en un DCA con 36 cerdos. El total de cerdos
sería de 72 y en cada experimento la varianza de las medias de
las dietas (tratamientos) sería igual al cuadrado medio entre
12 (hay 12 cerdos por dieta). Si se hiciera un experimento
factorial (de dos vías) con los 72 cerdos, en cada una de las
combinaciones habrían 8 cerdos, y por eso en cada nivel de
energía y de proteína un total de 24 observaciones. La
varianza de las medias de las dietas sería el cuadro medio
55

entre 24, es decir, se reduce la varianza de las medias de


interés de CM/12 a CM/24 simplemente por combinar los dos
experimentos, y al mismo tiempo, se generaliza el experimento
debido a la estimación de algunas interacciones entre niveles
de proteína y niveles de energía.

5.1 Modelo estadístico.

a)El modelo estadístico para un experimento factorial, con dos


factores A y B, en un diseño completamente al azar sería,

Yijk= µ + + α i + τj + ατij + eijk

donde:
Yijk= es la ijk-esima observación en el i-esimo nivel del
factor A y j-esimo nivel del factor B; µ= es la media general;
α i= es el efecto del j-esimo nivel del factor A; τj= es el
efecto del k-esimo nivel del factor B; ατij= es la interacción
del i-esimo nivel del factor A con el j-esimo nivel del factor
B; y eijk= es el error aleatorio NID (0, σ2).

b) El modelo estadístico para un experimento factorial, con


dos factores A y B, en un diseño en bloques al azar sería,

Yijk= µ + ßi + α j + τk + ατjk + eijk

donde:
Yijk= es la ijk-esima observación en el i-esimo bloque que
contiene el j-ésimo nivel del factor A y el k-esimo nivel del
factor B; µ= es la media general; ßi= es el efecto del i-ésimo
bloque; α j= es el efecto del j-ésimo nivel del factor A; τk= es
el efecto del k-esimo nivel del factor B; ατjk= es la
interacción del j-esimo nivel del factor A con el k-esimo
nivel del factor B; y eijk= es el error aleatorio NID (0, σ2).

5.2 Ejemplo de un Diseño de Bloques al Azar con un arreglo


factorial 2 x 3.

Se desea determinar el efecto de dos niveles de proteína


(alto y bajo) y tres fuentes de proteína (res, cerdo y
vegetal) sobre el aumento de peso (g) de ratas.
Los resultados se presentan a continuación,
56

CUADRO 23
Resultados de un experimento factorial.

Alta Proteína Baja Proteína


Res Cerdo Vegetal Res Cerdo Vegetal

73 94 98 90 49 108
102 79 74 76 82 95
118 96 56 90 73 97
104 98 111 64 86 80
81 102 95 86 81 98
107 102 88 51 97 74
100 108 82 72 106 74
87 91 77 90 70 67
117 120 86 95 61 89
111 105 92 78 82 58

Total 1000 995 859 792 787 839

Cálculo de las sumas de cuadrados.

FC= 5272²/60 = 463233.07;

SCtotal = (73² + 102² + 118² +...+ 58²) - FC


= 479431.77 - 463233.07 = 16198.7;

1000² + 995² + 859² + 792² + 787² + 839²


SCtrat = - FC
10

= 467846.00 - 463233.07 = 4612.93;

SCerror= SCtotal - SCtrat = 16198.70 - 4612.93 = 11585.77;

CUADRO 24
Análisis de varianza para un diseño factorial 2x3.

FV GL SC CM Fc
57

Tratamiento: 5 4612.93
Proteína 1 3168.23 3168.23 14.8**
Grasa 2 266.50 133.20 0.62ns
Interacción 2 1178.20 589.10 2.7ns
Error 54 11585.77 214.60
Total 59 16198.70

** P<0.01

El ANOVA indica que existe diferencia entre los niveles


de proteína pero no en las fuentes de la misma, ni en la
interacción.

5.3 Comparaciones entre tratamientos.


La naturaleza del experimento indica que era mejor haber
realizado un análisis de contrastes ortogonales de los datos.
En este caso algunas comparaciones lógicas o hipótesis a
probar son,
Ho: No existe diferencia entre los niveles de proteína;
Ho: No existe diferencia entre la fuente de proteína animal
(res y cerdo) comparado con la fuente vegetal.
Ho: No existe interacción entre nivel de proteína y fuente de
proteína (animal o vegetal).
Ho: No existe diferencia entre las proteínas del cerdo y res.
Ho: No existe interacción entre el nivel de proteína y la
fuente de proteína animal.

CUADRO 25
Cálculo de los contrates ortogonales.

Alta Proteína Baja Proteína


Res Cerdo Veg. Res Cerdo Veg.
1000 995 859 792 787 839 L rc²
SCtrat

1) Niveles 1 1 1 -1 -1 -1 436 10(6)


3168.3
2) Animal vs
Vegetal 1 1 -2 1 1 -2 188 10(12)
264.0
3) Int. 1 y 2 1 1 -2 -1 -1 2 376 10(12)
1178.1
4) Res vs Cerdo 1 -1 0 1 -1 0 10 10(4)
2.5
5) Int. 1 y 4 1 -1 0 -1 1 0 0 10(4)
0.0
58

r= Número de réplicas= 10;

1) L =1000(1) + 995(1)+ 859(1) + 792(-1) + 787(-1)+ 839(-1)=


436

c² = 1² + 1² + 1² + (-1)² + (-1)² + (-1)² =6;

SC = L²/rc² = 436²/10(6)= 3168.3;

2) L= 1000(1) + 995(1) + 859(-2)+ 792(1) + 787(1) + 839(-2)=


188

c² = 1² + 1² + (-2)² + 1² + 1² + (-2)² = 12;

SC= 188²/10(12) = 264.0;

3) L =1000(1) + 995(1)+ 859(-2) + 792(-1) + 787(-1)+ 839(2)=


376

c² = 1² + 1² + (-2)² + (-1)² + (-1)² + (2)² = 12;

SC = L²/rc² = 3766²/10(12)= 1178.1;

4) L= 1000(1) + 995(-1) + 859(0)+ 792(1) + 787(-1) + 839(0)=


10

c² = 1² + (-1)² + (0)² + 1² + (-1)² + (0)² = 4;

SC= 102/10(4) = 2.5;

5) L= 1000(1) + 995(-1) + 859(0)+ 792(-1) + 787(1) + 839(0)= 0

c2 = 12 + (-1)2 + (0)2 + 12 + (-1)2 + (0)2 = 4;

SC= 0.0;

CUADRO 26
Subdivisión y significancia de la suma de cuadrados de
tratamientos para los efectos principales e interacciones.

GL SC CM

Tratamiento: 5 4613.0
1)Niveles de Prot. 1 3168.3 3168.3**
2)Animal vs Veg. 1 264.0 264.0ns
59

3)Interacción 1 y 2 1 1178.1 1178.1*


4)Res vsd Cerdo 1 2.5 2.5ns
5)Interacción 1 y 4 1 0.0 0.0ns
Error 54 11585.7 214.6

La subdivisión de la SCtrat muestra efecto significativo


de niveles de proteína como el ANOVA del Cuadro 22. Sin
embargo, este análisis muestra además efecto de la interacción
nivel de proteína y fuente animal o vegetal de proteína. Esta
interacción se puede entender mejor con el siguiente diagrama,

Nivel de Fuente de proteína


proteína Animal Vegetal Diferencia E.E.
Alto 99.8 85.9 + 13.9* ±5.67
Bajo 79.0 83.9 - 4.9 ±5.67
Diferencia +20.8** + 2.0
E.E. ± 4.6 ± 6.5

donde:
99.8= (1000 + 995)/20; 85.8= 859/10;
79.0= (792 + 787)/20; 83.9= 839/10;

Los errores estandar (EE) de las diferencias se obtienen como,

CM error CM error
EE = +
r1 r2

214.6 214.6
Dif. entre fuentes, nivel alto= + = ±5.67
20 10
214.6 214.6
Dif. entre fuentes, nivel bajo= + = ±5.67
20 10
214.6 214.6
Dif. entre niveles, fuente animal= + = ±4 .63
20 20
214.6 214.6
Dif. entre fuentes, fuente vegetal= + = ±6.55
10 10

Nota: La interacción se debió al hecho de que la media


para fuente animal fue mejor en el nivel alto de proteína; sin
embargo, la proteína vegetal lo fue en el nivel bajo. Esta
interacción no podría haberse descubierto utilizando el ANOVA
convencional del Cuadro 20.
60

5.4 Programa SAS para comparaciones pre-planeadas.

Data uno;
Input Nivel 1 Fuente 2 a1 4-6 a2 8-10 a3 12-14 a4 16-18 a5 20-
22 a6 24-26 a7 28-30 a8 32-34 a9 36-38 a10 40-42 trat 1-2;
drop a1-a10;
Pesog= a1; a=1; output;
Pesog= a2; a=2; output;
Pesog= a3; a=3; output;
Pesog= a4; a=4; output;
Pesog= a5; a=5; output;
Pesog= a6; a=6; output;
Pesog= a7; a=7; output;
Pesog= a8; a=8; output;
Pesog= a9; a=9; output;
Pesog= a10; a=10; output;
*** NIVEL 1=alto 2= bajo FUENTE 1=res 2=cerdo 3=vegetal;
Cards;
11 73 102 118 104 81 107 100 87 117 111
12 94 79 96 98 102 102 108 91 120 105
13 98 74 56 111 95 88 82 77 86 92
21 90 76 90 64 86 51 72 90 95 78
22 49 82 73 86 81 97 106 70 61 82
23 108 95 97 80 98 74 74 67 89 58
Title " ANVA para un diseño factorial";
Proc GLM;
classes Nivel Fuente;
Model Pesog= Nivel Fuente Nivel*Fuente;
run;
Title "Comparaciones ortogonales para un experimento
factorial;
Proc GLM;
classes trat;
Model Pesog= trat;
*** T R A T A M I E N T O S;
CONTRAST 'ALTA vs BAJA PROTEINA' TRAT 1 1 1 -1 -1
-1;
CONTRAST 'PROT. ANIMAL vs VEGETAL' TRAT 1 1 -2 1 1
-2;
CONTRAST 'INT. NIVEL-PROT. ANIMAL y VEG.' TRAT 1 1 -2 -1 -1
2;
CONTRAST 'RES vs CERDO' TRAT 1 -1 0 1 -1
0;
CONTRAST 'INT. NIVEL-PROT. RES y CERDO' TRAT 1 -1 0 -1 1
0;
RUN;
61

Ejercicio. Realizar el ANOVA y probar las siguientes hipótesis


para los resultados dados abajo.
Ho: No existe diferencia entre el control y las semillas
tratadas con productos químicos.
Ho: No existe diferencia entre productos químicos.

Nota ver ANVA en Apéndice.

El modelo estadístico para un experimento factorial, con


dos factores A y B, en un diseño en bloques al azar sería,

Yijk= µ + τi + α j + ßk + αßjk + eijk

donde:
Yijk= es la ijk-esima observacion en el i-esimo bloque, j-esimo
nivel del factor A y k-esimo nivel del factor B; µ= es la
media general; τi= es el efecto del i-esimo bloque; α j= es el
efecto del j-esimo nivel del factor A; ßk= es el efecto del k-
esimo nivel del factor B; αßjk= es la interacción del j-esimo
nivel del factor A con el k-esimo nivel del factor B; y eijk=
es el error aleatorio NID (0, σ2).

CUADRO 27
ANALISIS DE VARIANZA PARA UN EXPERIMENTO FACTORIAL EN UN
DISEÑO DE BLOQUES AL AZAR.

FV GL SC CM Fc

Bloque r-1 ∑Y 2
i ..
− FC
SM bloque CM bloque
ab r−1 CM error

Factor A a-1 ∑Y 2
.j.
− FC
SCA CM A
rb a −1 CM error

Factor B b-1 ∑Y 2
..k
− FC
SCB CM B
ra b −1 CM error
62

Interacción (a-1)(b-1) ∑∑Y 2


. jk
− SCA − SCB − FC
SCAxB
r (a − 1)(b − 1)
CM AxB
CM error

SCerror
Error ab(r-1) DIFERENCIA
ab ( r − 1)

Total abr-1 ΣΣΣYijk2 - FC

FC= (ΣΣΣYijk)2/abr; r= número de bloques; a= niveles del factor


A; b= niveles del factor B;

Ejemplo.

VI.- EXPERIMENTOS DE PARCELAS DIVIDIDAS.

Los experimentos de parcelas divididas se utilizan cuando


se quiere dar mayor precisión o importancia a un factor en
comparación con otro. Este diseño se divide en parcelas
denominadas grande y chicas correspondiendo a estas últimas la
mayor precisión. En algunas ocasiones este es el diseño óptimo
a elegir ya sea porque un factor requiere de áreas grandes
para su evaluación o por razones económicas; p.e. Láminas de
riego y variedades de arroz, sistemas de cultivo y
fertilización, etc.
Cabe mencionar que la diferencia entre un experimento
factorial y uno de parcelas divididas está en el proceso de
aleatorización de los tratamientos. Así mientras que en un
diseño factorial se hacen todas las combinaciones de
tratamientos y se distribuyen aleatoriamente a las unidades
experimentales, en el experimento de parcelas divididas
primero se distribuyen aleatoriamente los tratamientos de las
parcelas grandes y luego los tratamientos de las parcelas
chicas dentro de las parcelas grandes.
Analice este experimento con un ejemplo.
Se desea estudiar el efecto de la frecuencia de corte
(parcela grande) y tres alturas de corte (parcela chica ) en
la producción de materia seca del pasto Estrella de Africa.
El primer paso es localizar el área donde se realizará el
experimento. Si el terreno es homogéneo entonces es factible
utilizar un diseño completamente al azar; si el terreno
muestra un gradiente de variación la solución pudiera ser un
diseño de bloques al azar.
63

Suponga que el terreno es homogéneo, entonces se trazan


las parcelas grandes y se asignan cada una de las frecuencias
de corte a estudiar (Figura 6). Luego se asignan al azar cada
una de las alturas de corte dentro de cada una de las parcelas
grandes (Figura 6).
64

Figura 6. Ejemplo hipotético de distribución de tratamientos


en un experimento de Parcelas Divididas.
65

CUADRO 28
Resultados del experimento en parcelas divididas.

Frecuencia Altura
de corte de corte R E P L I C A S
(días) (cm) I II III IV

5 5.69 5.98 5.37 6.30 23.34


20 10 3.72 3.20 3.90 4.51 15.33
15 3.66 2.85 2.60 3.83 12.94

Total PG 13.07 12.03 11.87 14.64 51.61


66

5 6.48 7.92 4.74 6.30 25.44


40 10 3.86 4.54 4.42 5.06 17.88
15 11.15 3.54 3.91 3.66 22.26

Total PG 21.49 16.00 13.07 15.03 65.58

5 4.90 5.73 12.00 8.56 31.19


60 10 5.34 4.28 6.16 6.34 22.12
15 3.40 5.47 4.78 3.75 17.40

Total PG 13.64 15.48 22.94 18.65 70.71

Tabla de doble entrada para totales de tratamiento.

Frecuencia
de corte Altura de corte

5 10 15 Total

20 23.34 15.33 12.94 51.61


40 25.44 17.88 22.26 65.68
60 31.19 22.12 17.40 70.71
Total 52.60 55.33 79.97 187.90

a) Factor de corrección:

(187.90)² 35,306.41
F.C. = = = 980.73
36 36

b) Suma de cuadrados debida a las réplicas:

(48.20)² + (43.51)² + (47.88)² + (48.31)²


SCRep = - FC
9

8,842.71
= - 980.73 = 982.52 - 980.73 = 1.79
9

c) Suma de cuadrados debida a las parcelas grandes (Frecuencia


de corte):

(51.61)² + (65.58)² + (70.71)²


SCPG = - FC
67

12

2663.59 + 4300.74 + 4999.90


= - FC
12

11,964.23
= - 980.73 = 16.29
12

d) Suma de cuadrados debida a las parcelas chicas (Altura de


corte):

(79.97)² + (55.33)² + (52.60)²


SCPCH = - FC
12

6,395.20 + 3,061.40 + 2,766.76


= - FC
12

12,223.36
= - 980.73 = 1018.61 - 980.73 = 37.88
12

e) Suma de cuadrados debida a la interacción de los


tratamientos (frecuencia de corte y altura de corte):

23.34² + 15.33² + ... + 17.40²


SCInt = - FC - SCPG - SCPCH
4

4,174.45
= - FC - SCPG - SCPCH
4

= 1,043.61 - 980.73 - 16.29 - 37.88 = 8.71

13.07² + 12.03² + ... + 22.94² + 18.65²


SCPG x Replica = - FC
3

3084.74
= - FC = 1028.25 - 980.73 = 47.52
3
68

SCerror PG= 47.52 - SCRep- SCPG

= 47.52 - 1.79 - 16.29 = 29.44

SCTotal = 5.692 + 5.982 + ... + 4.782 + 3.752 - FC

= 1129.74 - 980.73 = 149.01

SCerror PCH = SCTotal - SCPG x Replica - SCPCH - SCInt

= 149.01 - 47.52 - 37.88 - 8.71 = 54.9

CUADRO 29
Análisis de varianza para un diseño de Parcelas
Divididas con cuatro bloques (réplicas).

FV GL SC CM Fc

Réplica 3 1.79 0.60


Frec. corte 2 16.29 8.15 1.65
error PG 6 29.44 4.90
Atura corte 2 37.88 18.94 6.21**
Interacción
(Frec. x Alt) 4 8.71 2.19 0.72
error PCH 18 54.90 3.05

Total 35 149.01

** P<0.01

Nota: Los efectos de bloque (réplica) y frecuencia de corte se


prueban utilizando la SCEPG; mientras que los efectos de Altura
de corte (parcela chica) y de la interacción de Frecuencia de
corte por Altura de corte se prueban utilizando la SCEPCH, i.e.

CMFrec. corte 8.15


Fc = = = 1.65
CMerror PG 4.90

CMAlt. corte 18.94


Fc = = = 6.21
CMerror PCH 3.05
69

CMInt. 2.19
Fc = = = 0.72
CMerror PCH 3.05

6.3 programa SAS para un experimento completamente al azar con


arreglo de parcelas divididas.

Data parcela;
Input Frec 1-2 Altura 4-5 r1 7-11 r2 13-17 r3 19-23 r4 25-29;
Drop r1 r2 r3 r4;
ms= r1; r=1; output;
ms= r2; r=2; output;
ms= r3; r=3; output;
ms= r4; r=4; output;
cards;
20 5 5.69 5.98 5.37 6.30
20 10 3.72 3.20 3.90 4.51
20 15 3.66 2.85 2.60 3.83
40 5 6.48 7.92 4.74 6.30
40 10 3.86 4.54 4.42 5.06
40 15 11.15 3.54 3.91 3.66
60 5 4.90 5.73 12.00 8.56
60 10 5.34 4.28 6.16 6.34
60 15 3.40 5.47 4.78 3.75
Title " Diseño completamente al azar con arreglo de parcelas";
proc anova;
classes frec altura;
model ms= frec r(frec) altura frec*altura;
test H=frec E=r(frec);
means frec /duncan tukey alpha=0.01 E= r(frec);
means altura /duncan tukey; run;

6.4.- Programa SAS para un Diseño de bloques al Azar con


arreglo de Parcelas Divididas.

Title " Diseño de bloques con arreglo de parcelas;


Proc anova;
classes pg bloque pch;
model Y= pg bloque pg*bloque pch pg*pch;
Test H=pg bloque E=pg*bloque;
means pg bloque/ duncan E=pg*bloque;
means pch pg*pch/duncan; run;
70

VII. ANÁLISIS DE COVARIANZA (ANCOVA).

Este análisis es un procedimiento de gran importancia en


experimentación y combina el análisis de varianza y de
regresión para remover la variabilidad que existe debida a una
o más variables cuantitativas, denominadas variables
concomitantes o covariables; ajusta las medias de los
tratamientos y así estima mucho mejor el efecto de los
factores (tratamiento) sobre la variable dependiente o
variable de respuesta. En otras palabras, el ANCOVA permite
ajustar las respuestas de las unidades experimentales al
promedio de un factor medible, que se llama covariable y de
esa manera se controlan los factores medibles que no puedan
controlarse experimentalmente.

Por ejemplo, se quiere probar el efecto de cinco dietas


en el aumento de peso en cerdos pero se tiene diferente peso
inicial de las unidades experimentales. Aquí el factor peso
inicial es medible y no puede utilizarse como un criterio de
clase (nivel de un factor) por lo que es mejor utilizar un
diseño completamente al azar con peso inicial de las unidades
experimentales como covariable. De esta manera se ajusta
respecto a peso inicial, se tienen más grados de libertad para
el cuadrado medio del error y se maneja un diseño más
sencillo. Si además del peso inicial, la edad de los animales
fuese otro factor de importancia podría incluirse teniendo así
un diseño completamente al azar con dos covariables.

Usos del ANCOVA. Los más importantes usos del ANCOVA son:
1.- Para controlar el error y aumentar la precisión, al
reducir la variación entre tratamientos debido al efecto de
variables concomitantes.
2.- Para ajustar las medias de tratamientos de la variable
dependiente por diferencias en conjuntos de valores de la
correspondientes variables independientes, es decir como sí el
efecto de la variable concomitante no hubiera existido.
3.-Para ayudar en la interpretación de datos, especialmente
con respecto a la naturaleza de los efectos de los
tratamientos.
4.- Para dividir una covarianza total o suma de productos
cruzados en sus componentes.
5.- Para estimar datos perdidos.

Suposiciones del ANCOVA:

1.- Tanto la variable independiente X (covariable) como la


variable de respuesta (Y) deben tener varianzas homogéneas.
2.- Las variables X e Y deben tener distribución normal.
71

3.- La regresión de Y sobre X debe de ser lineal.


4.- El error debe estar normal e independientemente
distribuido con media cero y varianza común.

7.1. Modelos estadísticos.

El modelo estadístico para un diseño completamente al azar


está dado por la ecuación,

Yij= µ + α i + b(Xij - X .. ) + eij

Para el diseño de bloques al azar,

Yij= µ + α i + ßj + b(Xij - X .. ) + eij

Para el diseño cuadro latino,

Yij(k)= µ + α i + Hj + Ck + b(Xij(k) - X .. ) + eij(k)

Como se podrá apreciar a cada modelo del diseño


correspondiente se le agregó el término de ajuste, b(Xij - X .. )
y donde:

Y = variable dependiente o de respuesta;


µ = media general de Y;
Xij o Xij(k) = variable independiente o covariable;
X .. = media general de X;
α = efecto de tratamientos;
ß = efecto de bloques;
H = efecto de hilera;
C = efecto de columna;
eij o eij(k) = error experimental.

7.2.- Ejemplo de un análisis de covarianza.

Se presentan los resultados de un diseño de bloques al


azar con cinco cerdos (repeticiones) y cuatro dietas
(tratamientos), donde:

X= peso inicial de los cerdos (variable independiente);


Y= peso final de los cerdos (variable dependiente).
72
73

-
TRATAMIENTOS
A B C D Total
# cerdo X Y X Y X Y X Y X Y
-
1 4 10 1 5 2 5 3 5 10 25
2 3 7 3 7 6 12 1 7 13 33
3 4 8 2 5 4 10 4 6 14 29
4 6 15 1 1 6 10 2 9 15 35
5 4 12 3 5 2 8 1 3 10 28
-
21 52 10 23 20 45 11 30 62 150

CUADRO 27
Análisis de covarianza para un diseño de bloques al azar

F.V. G.L. SC(X) SP(XY) SC(Y)

Bloques r-1 ∑X 2
.j
− FCX ∑ X. j ∑Y. j − FCXY ∑Y 2
.j
− FCY
t t

Tratamiento t-1 ∑X 2
i.
− FCX ∑ X i. ∑ Yi . − FCXY ∑Y 2
i.
− FCY
r r

Error (t-1)(r-1) D I F E R E N C I A

Total tr-1 ∑∑ X 2
ij - FCX ∑∑ X Y -FCXY
ij ij ∑∑Y 2
ij -FCY

(∑ ∑ X ) ∑∑ X (∑ ∑Y )
2 2
ij Y
ij ij ij
FCX= FCXY= FCY=
N N N

CUADRO 28
ANOVA para las variables X e Y.

ANOVA Y ANOVA X
F.V. G.L. SC CM G.L. S.C. C.M.
74

Bloque 4 16 4.0 4 5.2 1.3


Trat. 3 85 28.3 3 18.2 6.1
Error 12 122 10.2 12 29.6 2.5
Total 19 223 19 53.0

Estos ANOVAs se analizaron como un diseño de bloques al


azar normal; uno para X y otro para Y.
No se encontró efecto significativo de los tratamientos
sobre el peso inicial y final de los cerdos.

Cálculo del ANCOVA.


Calculamos sólo los términos que faltan en la tabla del
análisis de covarianza ya que las SC(X) y SC(Y) ya las
conocemos.

SP(XY):

Total= 4(10) + 2(5) + ... + 2(9) + 1(3) - FC


= 85.5

donde:
62(150) 9,300
FC= = = 465;
4(5) 20

10(25) + 12(33) +...+ 10(28)


Bloque= - FC
4
= 6.89;

21(50) + 10(25) +...+ 11(30)


Trat = - FC
5
= 38.5

Error = Total - Bloque - Trat.


= 85.3 - 6.89 - 38.5 = 40.23;

CUADRO 29
Análisis de covarianza

Y ajustado por
X
FV GL SC(X) SP(XY) SC(Y) GL SC CM F
75

Total 19 52.95 85.50 223.0


Bloque 4 5.20 6.75 16.0
Trat. 3 18.15 38.50 85.0 3 9.85 3.28
0.54
Error 12 29.60 40.25 122.0 11 67.27 6.12

Trat+Error 15 47.75 78.75 207.0 14 77.12

La reducción en la SCerror de Y debido a la regresión es

[SP(XY)]2 40.252
SCerror(corregido)= SC(Y) - ---------- = 122.0 - ------- =
67.27;
SC(X) 29.60

[SP(XY)]2 78.752
SC(trat+error)= SC(Y) - -------- = 207.0 - ------- = 77.12
SC(X) 47.75

SC(trat. ajustados) = 77.12 - 67.27 = 9.85;

Fc= 3.28/6.12 = 0.54 No significativo ya que Fc < Ft.

El ANCOVA confirma el ANOVA que no hay diferencia


significativa entre tratamientos, pero no dice si debemos
ajustar las medias de tratamientos.

Antes de analizar si existe la necesidad de ajustar las


medias de tratamientos se calcula el coeficiente de regresión
b,

b= SP(XY)/SC(X) = 40.25/29.60 = 1.36

es decir, que por cada aumento de una unidad en el peso


inicial X hay un aumento de 1.36 unidades en el peso final Y.

Luego se prueba la homogeneidad de la regresión, Ho: b=0;


si el valor de F es significativo, o sea si se acepta la
hipótesis alterna Ha: b Ï 0 entonces se ajustan las medias.

[SP(XY)]2 40.252
SC(Reg) = = = 54.73;
SC(X) 29.60
76

CM(Reg) = 54.73/1 =54.73;

Fc= CM(Reg)/CMerror= 54.73/6.12 = 8.94;


Ft (1,11; 0.05)=

Por lo tanto, se acepta Ha: b ≠ 0. Las líneas no son


paralelas, no son homogéneas y se deben de hacer los ajustes
de medias.

Ajuste de medias.

Yai = Yi . - b( Xi . - X .. )

donde:
Yai . = media ajustada para cada tratamiento;

Yi .. = media de cada grupo de tratamiento sin ajustar;


i.e.; 10, 5, 9 y 6.

b= coeficiente de regresión = 1.36;


_
Xi. = media de la covariable para cada tratamiento;
i.e.; 4,2,4 y 2.2;
_
X.. = media general = 62/20= 3.10.
_ _ _ _
Tratamiento Yi. - b (Xi. - X..) = Yai.
A 10 - 1.36(4.0-3.10) = 8.71
B 5 - 1.36(2.0-3.10) = 6.43
C 9 - 1.36(4.0-3.10) = 7.71
D 6 - 1.36(2.2-3.10) = 7.16

Si se encuentra que las medias de los tratamientos no


ajustadas resultan significativas, pero no las ajustadas, ésto
quiere decir que las diferencias encontradas entre las no
ajustadas sólo reflejaría diferencias entre la covariable, más
no entre los tratamientos.
La desviación estándar de la diferencia entre dos medias
ajustadas es:

2
+ ( X i − X .. )
2

Sd = 2
SYX r
SC( X )
77

Por ejemplo la desviación estándar de la diferencia entre las


medias de los tratamientos A y B es,

2
+ ( 4.0 − 2.0)
2

Sd = 6.12 5 = 3.28 =1.81


29.6

Esta ecuación indica que cada Sd es diferente para cada par de


medias de tratamientos que se estén comparando.

Ganancia en precisión por covarianza.

CME(Y) antes del ajuste = 122/12 =10.16 con 12 GL;


CME(Y) después del ajuste = 6.12 con 11 GL;

Ajustamos este valor (6.12) con la ecuación:

CME después del ajuste * ( 1 + CM(X)/SCE)=


6.12 * ( 1 + 6.05/29.60) = 7.37;

10.16/7.37 * 100 = 138%

Cien repeticiones con ANCOVA, son tan eficientes como 138


sin covarianza.
78

7.3 Programa SAS para Análisis de Covarianza.

Data ancova;
Input Cerdo 1-2 Trat$ 4 X 6 Y 8-9;
cards;
1 A 4 10
2 B 1 5
3 C 2 5
4 D 3 5
5 A 2 5
6 B 3 9
7 C 6 12
8 D 1 7
9 A 4 8
10 B 2 5
11 C 4 10
12 D 4 6
13 A 6 15
14 B 1 1
15 C 6 10
16 D 2 9
17 A 4 12
18 B 3 5
19 C 2 8
20 D 1 3
PROC GLM;
CLASSES TRAT;
MODEL Y= X TRAT ;
LSMEANS TRAT/PDIFF STDERR;
MEANS TRAT;
RUN;

Nota: La covariable debe ir primero en el modelo.


79

BLOQUES INCOMPLETOS, CUADROS DE YOUDEN Y LATICES.

Lo impráctico e inconveniente del diseño cuadro latino es


que el número de parcelas por tratamiento debe ser igual al
número de hileras y columnas. Esta limitante condujo al
desarrollo del diseño de bloques incompletos. Aquí el número
de bloques es menor que el número de tratamientos. Sin
embargo, cada bloque contiene el mismo número de tratamientos
y cada tratamiento aparece con igual frecuencia en el mismo
bloque.

Cuadro x. Ejemplo de la distribución de tratamientos en un


diseño de bloques incompletos aleatorios.

Bloque 1 2 3 4

Tratamiento A C A B
D B C C
B A D D

En este diseño el número de observaciones es igual al


número de bloques (b) por el número de observaciones por
bloque (k) o al número de tratamientos por el número de
repeticiones (r). h es el número de veces que pares de
tratamientos aparecen juntos en el mismo bloque, es decir,

r (k-1)= h (t-1)

En el ejemplo de arriba, t=4, r=3, b=4, k=3 y h=2; por lo


tanto,
tr=bk= 12 y r(k-1)=6.

Como el número de tratamientos y el tamaño del bloque


normalmente se especifican por las circunstancias
experimentales, los valores de los otros parámetros están
escogidos para satisfacer los puntos 1 a 3 mencionados
anteriormente.

Como los bloques son incompletos en estos diseños, las


medias observadas por los tratamientos deben ajustarse por las
diferencias entre bloques.
La media ajustada del i-ésimo tratamiento sería

_ _
Xti= X + (kΣtj - Σbi)/ht

donde: Σtj es el total del j-esimo tratamiento, bi es el total


del i-esimo bloque.
80

La media del i-esimo bloque ajustado esta dado por:

Xbi= X +

El ANVA es diferente al normal porque las SC de tratamientos,


bloque y residual no suman la SC del total. En el cuadro 2 los
términos ajustados y no ajustados se refieren a las SC
calculadas usando las medias ajustadas y no ajustadas,
respectivamente. FC se refiere al factor de corrección. La
suma de cada una de las observaciones al cuadrado divido entre
el número total de observaciones.

FC= (ΣΣYij)2/kr

Cuadro 2. Análisis de varianza de un diseño de bloques


incompletos.
81

VIII.- ALTERNATIVAS PARA MEJORAR LA PRECISIÓN DE LOS


EXPERIMENTOS.

Por precisión se entiende que tan lejos o cerca se


encuentra un estimador del parámetro; por ejemplo., si se toma
una muestra y se encuentra que su media es de 7.8 kg, cuando
el valor del parámetro (media de la población) es de 8.3,
entonces hay un error de 8.3-7.8=0.5 kg. Recuerde que para
poblaciones grandes la precisión se define como d= Z*EE.
En el análisis de experimentos, uno de los objetivos es
estimar la diferencia entre dos medias y por lo tanto la
precisión se entendería como que tan cerca o lejos se
encuentra la diferencia entre dos medias de la diferencia real
(diferencia entre las dos poblaciones de las cuales se tomaron
las muestras).
Hay varias alternativas para mejorar la precisión de los
experimentos, de las cuales las principales son las
siguientes:

1.- La agrupación de las unidades experimentales.


2.- El uso de mayor número de repeticiones.
3.- La selección de tratamientos.
4.- Selección de unidades experimentales.
5.- Tomar mediciones adicionales.

8.1.- Agrupación de las unidades experimentales.

La agrupación de las unidades en grupos o bloques de tal


manera que la variación entre grupos sea mayor que dentro de
ellos, reduce la variación. Esta es la base de la comparación
de los diseños: por ejemplo: los diseños completamente al azar
y bloques al azar con sus varianzas del error: VCA y VBA,
respectivamente.
En el Diseño de Bloques al Azar, la varianza de la media
de un tratamiento o raíz cuadrada del error estándar (EE) es:

= VBA/b; donde b= al número de bloques.

Mientras que para obtener la misma varianza en el Diseño


Completamente al Azar, el número de repeticiones, r, debe ser:

VCA/r = VBA/b o r/b=VCA/VBA

Entonces si se usa VCA/VBA para medir la eficiencia


relativa de los bloques en los diseños. Se tiene que:

VCA (b-1)CMbloque + b(t-1)CMerror


=
VBA (bt-1)CMerror
82

Por ejemplo:

VCA (5-1)12.46 + 5(5-1)5.41


= = 1.22
VBA (25-1)5.41

donde:
CMbloque=12.46
CMerror=5.41
G.L. bloques= 5-1
G.L. del error= (5(5-1).

Es decir, en el Diseño Completamente al Azar se necesitan


1.22 más repeticiones (1.22*5= 6) para obtener el mismo EE.
También se debe considerar los GL del error, p.e. se necesitan
20 G.L. con el DCA y 16 para el DBA, para obtener la misma
precisión.
Una modificación de este método es la aplicación de la
fórmula de Fisher que se aplica en los experimentos con pocas
observaciones.

VCA (GLDBA+1)(GLDCA+3) VDCA


=
VBA (GLDBA+3)(GLDCA+1) VDBA

En el ejemplo:

VCA (16+1)(20+3)
= * 1.22= 1.87
VBA (16+3)(20+1)

8.2.- El uso de más repeticiones.

En general un experimento es más preciso con más


repeticiones, pero el grado de mejoramiento disminuye a medida
que aumentan el número de repeticiones. Por ejemplo, para
duplicar la precisión de la estimación de las medias de un
experimento con cuatro repeticiones, se necesitan 16
repeticiones.

El número de repeticiones requerido para estimar


descubrir una diferencia verdadera entre medias se estima a
partir de la fórmula:
83

r = 2 
CV 
 (t1 + t2)²
 d 

donde:

DE
CV = 100 = Coeficiente de variación
X
t1= el valor de "t" de tablas al 5 o 1 % y los GL del error del
ANVA del diseño a utilizar.
t2= El valor de "t" para los GL del error y una probabilidad de
(1-P), donde P es la probabilidad de descubrir un
resultado significativo en un experimento. Si P=0.80,
entonces (1-P)=0.20 en la distribución de "t" de
una cola. d=/µ-X/= es la precisión requerida. En
las ciencias biológicas se utiliza normalmente el 10% de
precisión.

Para usar la ecuación, se especifica el número de


repeticiones que se cree son necesarios (r). Luego se resuelve
la ecuación utilizando el valor de r encontrado en cada
ocasión esta que este permanezca estable.

Ejemplo:
Estime el número de réplicas para un diseño completamente
al azar con 5 tratamientos, y con los niveles de error tipo I
y II de 5 y 10 % respectivamente. Elija según su criterio el
coeficiente de variación y la diferencia mínima a detectar
(d).

Solución:

r = 2(CV/d)² (t1 + t2)²

gl DCA= t(r-1)
t= número de tratamientos a comparar= 5
α =5%
ß=10%
1-ß= 90%
CV=15%
d=10%

Tome arbitrariamente r=7 réplicas, lo que da 30 gl para el


error, es decir t(r-1)= 5(7-19)=30.

t1 (30 gl, α=0.05)= 2.042 (Nota: valor de t de dos colas)


t2 = (30 gl, ß=0.10)= 1.310 (Nota: valor de t de una cola)
84

r= 2(15/10)² (2.042+1.310)=2(2.25)(11.22)= 50.5

A continuación se utiliza el valor de r= 50.5 = 51 estimado y


se realiza la operación de nuevo:

gl= t(r-1)= 5(51-1)= 250

b) r= 2(15/10)² (1.96 + 1.282)²

r= 2(2.25) (10.51)= 47.29

c) si se utilizara r= 48 y se realizara la operación de nuevo


se encontraría que r= 48; es decir, se estabiliza; por lo
tanto,

d) De acuerdo a los valores proporcionados se requieren 48


repeticiones.

Otro ejemplo.
a) Estime el número de réplicas para un diseño de bloques al
azar con cuatro tratamientos, y con los niveles de error tipo
I y II de 5 y 20 % respectivamente. El coeficiente de
variación es del 10% y la diferencia mínima a detectar (d) es
también del 10%.

b) Estime el número de réplicas para el caso a) pero con


una diferencia a detectar del 50% menor que la elegida en a).
¿Que sucedió? ¿Cómo lo explica?.

Solución:
Primer cálculo;

r = 2(CV/d)² (t1 + t2)²

gl DBA= (t-1)(r-1)
t=4
α=5%
ß=20%
1-ß= 80%
CV=10%
d=10%

Considerando arbitrariamente 10 réplicas, daría 30 GL para el


error

t1 (30 gl, α=0.05)= 2.042 (Nota: valor de t de dos colas)


85

t2 = (30 gl, ß=0.20)= 0.854 (Nota: valor de t de una cola)

r= 2(10/10)² (2.042+0.854)²=2(1)(2.896)²= 16.774 = 17

gl= (t-1)(r-1)= 3(17-1)= 48

Segundo cálculo:

r= 2(10/10)² (2.011 + 0.850)²

r= 2(1) (8.185)= 16.37 = 17

Por lo tanto, de acuerdo a los valores proporcionados se


requieren 17 repeticiones.

b) en este caso el valor de d=5%, todos los demás valores


permanecen iguales.

Considerando arbitrariamente 10 réplicas, daría 30 GL para el


error

t1 (30 gl, α=0.05)= 2.042 (Nota: valor de t de dos colas)


t2 = (30 gl, ß=0.20)= 0.854 (Nota: valor de t de una cola)

r>= 2(10/5)² (2.042+0.854)²=2(2)(2.896)²= 16.774 = 34

gl= (t-1)(r-1)= 3(34-1)= 99

Segundo cálculo:

r= 2(10/5)² (1.982 + 0.846)²

r= 2(2) (7.997)= 32

Por lo tanto, de acuerdo a los valores proporcionados se


requieren 32 repeticiones. Aproximadamente el doble que se
requiere para una precisión del 10%.

8.3.- Selección de tratamientos.

La selección cuidadosa de los tratamientos puede aumentar


la precisión del experimento. Por ejemplo, al estudiar la
curva de respuesta a niveles diferentes de proteína en una
dieta, la curva es más importante que la significancia de la
diferencia entre dos niveles adyacentes. Así mismo se sabe,
86

que niveles con intervalos iguales son más eficientes para


estimar una curva de respuesta. El arreglo de los tratamientos
aumenta la precisión en la estimación de los factores
principales en los experimentos factoriales. Por ejemplo, la
precisión es mayor, si en vez de realizar un experimento en
donde se comparan tres niveles de proteína en la dieta, por
ejemplo, 16, 17 y 18% se comparan niveles de 16,20 y 24% de
proteína. Es decir mientras mayor sea la distancia entre
niveles o tratamientos, mayor será la precisión y el
coeficiente de determinación (R2) del análisis de varianza.
Así mismo, el incluir otros factores puede mejorar el R2 y
la precisión, por ejemplo, en experimentos con pollos, el R2 es
mayor cuando se utilizan aves machos y hembras (por separado),
que si se utilizaran aves mixtas o sólo animales machos o
hembras.

8.4.- Selección de las unidades experimentales.

La uniformidad de las unidades experimentales es deseable


para aumentar la precisión ya que se reduce la variación. Por
ejemplo, al utilizar animales con pesos aproximados o
distribuirlos de tal manera que la media de los pesos de los
tratamientos al inicio del experimento sean lo más
aproximados. También se puede mejorar el experimento
aumentando el número de unidades experimentales. Es mejor
realizar un experimento en donde haya 10 corrales con 2
animales cada uno que un experimento con 5 corrales y 4
animales en cada uno. Aun cuando es el mismo número de
animales, el número de repeticiones es menor en el segundo
caso. En experimentos agrícolas, la forma y tamaño de la
parcela, así como la eliminación de los efectos de borde son
importantes para mejorar la precisión.

8.5.- El uso de mediciones adicionales.

Se pueden tomar mediciones adicionales de covariables


para aumentar la precisión de la estimación de los efectos de
tratamientos. Es el uso principal del Análisis de covarianza.
Normalmente se mide la covariable antes de aplicar los
tratamientos. Se ajustan las observaciones de la variable de
respuesta (dependiente) por las diferencias iniciales de la
covariable. El ajuste reduce el error experimental y da
comparaciones más precisas entre tratamientos.
87

Ejemplo

REFERENCIAS

Cochran, W.G. y G.M. Cox. 1976. Diseños Experimentales. Ed.


Trillas, México.
Little, T.M. y F.J. Jackson Hills. 1985. Métodos Estadísticos
para la Investigación en Agricultura. Trillas. México.
Montgomery, D.C. 1991. Diseño y Análisis de Experimentos.
Grupo Editorial Iberoamérica. México.
Snedecor, G.W. y G.W. Cochran. 1981. Métodos Estadísticos. Ed.
CECSA. México.
Steel R.D.G. y J.H Torrie. 1985. Bioestadística. Principios y
Procedimientos. 2a. Ed. McGraw-Hill. México.
SAS Institute Inc. 1985. SAS Guide User's: Statistics. Cary,
North Carolina, USA.

También podría gustarte