Está en la página 1de 9

18

CAPÍTULO 2
DISEÑO COMPLETAMENTE AL AZAR

2.1 INTRODUCCIÓN

En este tipo de diseño están incluidos los principios de repetición y de aleatorización, o sea
que, es utilizado cuando no hay necesidad del control local, debido a que el ambiente experimental es
homogéneo y los tratamientos se asignan a las unidades experimentales mediante una aleatorización
completa, sin ninguna restricción.

2.1.1 Ventajas

a. La estructura del análisis estadístico es simple.


b. Permite máxima flexibilidad en cuanto al número de tratamientos y número de
repeticiones.
c. La pérdida de observaciones durante la conducción del experimento no genera dificultades
en el análisis y en la interpretación de los resultados.
d. Reúne el mayor número de grados de libertad en el residuo, en comparación con otros
diseños.

2.1.2 Inconvenientes

a. Cuando el número de unidades experimentales es muy grande es difícil encontrar lugares


grandes que presenten la homogeneidad requerida.

b. Debido a que las fuentes de variación no asociadas a los tratamientos o a los niveles del
factor en estudio, están incluidas en el residuo como variación del azar, la buena precisión
de los análisis se ve comprometida.

2.1.3 Aleatorización

Considerando un experimento con t = 5 niveles del factor A (tratamientos) y r = 4 repeticiones


para cada nivel, se tiene que el número total de unidades experimentales (parcelas) incluidas en el
experimento es t × r = 5 × 4 = 20. Las (t × r) parcelas serán aleatorizadas sin restricciones, los t niveles
del factor A en estudio con sus r repeticiones, conforme se muestra en el siguiente croquis.

A1 A4 A3 A4 A2

A4 A2 A1 A5 A3

A2 A5 A2 A1 A3

A5 A3 A4 A5 A1
19

Las respuestas obtenidas en función de la aplicación de cada nivel del factor A en estudio en
sus respectivas repeticiones pueden ser representadas por yij, que es considerada como una variable
aleatoria.

2.2 ANÁLISIS ESTADÍSTICO

A continuación se muestra la representación de las observaciones de un experimento, con un


factor con t tratamientos (o niveles) y r repeticiones.

Tratamientos Repeticiones yi.


1 2 3 ... r
1 y11 y12 y13 ... y1r y1.
2 y21 y22 y23 ... y2r y2.
3 y31 Y32 y33 ... y3r y3.
. . . . . . .
. . . . . . .
. . . . . . .
t yt1 yt2 yt3 ... ytr yt.

− Y..
2.2.1 Hipótesis Y.. =
tr

Ho: τ = τi (Todos los tratamientos producen el mismo efecto)

Ha: τ ≠ τi para al menos un i; i = 1,2, . . . t. (al menos uno de los tratamientos produce
efectos distintos)

2.2.2 Modelo Estadístico

Yij = µ + τi + εij i = 1,2, . . . t


j = 1,2, . . . r
siendo,

Yij = variable de respuesta de la ij-ésima unidad experimental

µ = media general de la variable de respuesta

τi = efecto del i - ésimo tratamiento (nivel del factor) en la variable dependiente.

εij = error experimental asociado a la ij-ésima unidad experimental

2.2.3 Supuestos

Las suposiciones que validan el análisis de varianza son:


20

a. Los errores son independientes.


b. Los errores están normalmente distribuidos con media cero y varianza constante
c. Existe homogeneidad de varianzas entre los tratamientos
d. El modelo es lineal y de efectos aditivos.

2.2.4 Descomposición de la suma de cuadrados total

El análisis de varianza es un proceso aritmético y estadístico, que consiste en descomponer la


variación total en fuentes o causas de variación. Por variación total se entiende, la variación entre las
unidades experimentales (o parcelas).

La variabilidad total de las observaciones Yij, cuando no se considera la información acerca de


los tratamientos, es medida en términos de la desviación total de cada observación, esto es, la
desviación de los Yij alrededor de la media general Y . . :

Yij − Y . . (1)
Cuando se utiliza información acerca de tratamientos, las desviaciones entre cada observación
Yij alrededor de la media estimada de su respectivo tratamiento, reflejan la incertidumbre restante en
los datos, y es dada por:

Yij − Y i. (2)
La diferencia entre las desviaciones (1) y (2) refleja la diferencia entre la media estimada de
tratamientos y la media general:

(Yij − Y . . ) − (Yij − Y i. ) = Y i. − Y . . (3)

Note que a partir de la ecuación (3), se puede descomponer la desviación total Yij − Y .. en dos
componentes:

Yij − Y . . = Y i. − Y . . + Yij − Y i. (4)

Desviación total Desviación de la media Desviación alrededor de


estimada de tratamiento la media estimada de
alrededor de la media tratamiento.
general

A partir de esto, la desviación total Yij − Y .. puede ser vista como la suma de dos componentes:

1. La desviación de la media estimada de tratamientos alrededor de la media general.

2. La desviación de Yij alrededor de la media estimada de su tratamiento, que es simplemente, el


residuo eij.
21

A partir de la ecuación (4) se pueden obtener las expresiones matemáticas utilizadas para
calcular las sumas de cuadrados de tratamientos, error experimental y total. Para realizarlo, se inicia
obteniendo la suma de cuadrados de la desviación total:

( Yij − Y . . )2 = [ ( Y i. − Y . . ) + (Yij − Y i. ) ]2

Luego, se obtiene la sumatoria de las desviaciones totales al cuadrado:

2
t r __
⎡ __ __
t r __

∑∑
i =1 j =1
(Yij − Y ..) =2
∑∑ ⎢
i =1 j =1 ⎣
(Y i . − Y ..) + (Yij − Y i. )


(5)

t r __
Como ∑∑ (Yij − Y ..)2 = Suma cuadrados total, y desarrollando el binomio de lado derecho de la
i =1 j =1
ecuación (5), ésta quedaría así:

t r
⎡ __ __ __ __ __ __

SC total = ∑∑ ⎢(Y i. − Y ..) 2 + 2(Y i. − Y ..)(Yij − Y i. ) + (Yij − Y i. ) 2 ⎥ (6)
i =1 j =1 ⎣ ⎦

Sumando primero sobre j, la ecuación (6) queda:

t ⎡ __ __ __ __ r __ r __ ⎤
SC total = ∑ ⎢r (Y i. − Y ..) 2 + 2 (Y i. − Y ..)∑ (Yij − Y i. ) + ∑ (Yij − Y i. ) 2 ⎥
i =1 ⎣ j =1 j =1 ⎦

r __ r __ Yi.
Donde: ∑ (Yij − Y i. ) = ∑ Yij − r Y i. = Yi. − r
j =1 j =1 r
= Yi. − Yi. = 0 , por tanto

__ __ r __
2 (Y i. − Y ..)∑ (Yij − Y i. ) = 0, entonces:
j =1

t __ __ t r __
SC total = r ∑ (Y i. − Y ..) 2 + ∑∑ (Yij − Y i. ) 2
i =1 i =1 j =1

Suma de cuadrados Suma de cuadrados del


de tratamientos error experimental
t __ __
SCtrat = r ∑ (Y i. − Y ..) 2
i =1
t __ __ __ __ t __ __ t __ __
= r ∑ (Y i. − 2 Y i. Y .. + Y ..2 ) = r ∑ Y i. − 2r Y ..∑ Y i. + (tr ) Y ..2 (7)
2 2

i =1 i =1 i =1
22

__ Yi . t __
Yi .2
t t
Yi .2
, r ∑ Y i. = r ∑ ∑
2
Para el primer término de la ecuación (7), como: Y i. = 2
=
r i =1 i =1 r i =1 r

__ t __ __ t Yij
En el caso del segundo término − 2 r Y .. ∑Y
i =1
i. , se sabe que Y i. = ∑
i =1 r
, se tiene que:
t r

t __ t r Yij __
∑∑ Y ij

∑Y = ∑∑
i =1 j =1
i. , y Y .. = entonces:
i =1 i =1 j =1 r tr

t r t r t r

__ t __
∑∑ Yij t r Yij ∑∑ Yij ∑∑ Y ij

− 2 r Y ..∑ Y i. = − 2 r ∑∑
i =1 j =1 i =1 j =1 i =1 j =1
= −2 =
i =1 tr i =1 j =1 r tr

2
t r ⎛ t r
t ⎞ r

∑∑ Yij ∑∑ ij Y ⎜ ∑∑ Yij ⎟
⎜ ⎟
−2
i =1 j =1 i =1 j =1
=− 2 ⎝ i =1 j =1 ⎠
tr tr

Para finalizar, analicemos el tercer término:


2
t r ⎛ t r ⎞
∑∑ Y ⎜ ∑∑ Yij ⎟
Y ..2 ⎜⎝ i =1 j =1 ⎟⎠
ij
__
Y .. i =1 j =1
__
Y ..2
Sí Y .. = = , entonces (tr ) Y ..2 = (tr ) = = , entonces:
tr tr (tr ) 2 (tr ) tr

2 2 2
⎛ t r ⎞ ⎛ t r ⎞ ⎛ t r ⎞
⎜ ∑∑ Yij ⎟ ⎜ ∑∑ Yij ⎟ ⎜ ∑∑ Yij ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
−2⎝ ⎠ + ⎝ ⎠ = − ⎝ i =1 j =1 ⎠
i =1 j =1 i =1 j =1
.
tr tr tr

La expresión de suma de cuadrados para tratamientos (o sea, entre tratamientos) queda de la siguiente
manera:

2
⎛ t r ⎞
⎜ ∑∑ Yij ⎟
Yi .2 ⎜ ⎟
− ⎝ ⎠ .
t


i =1 j =1

i =1 r tr

t r __
Para el caso de la suma de cuadrados total: ∑∑ (Yij − Y ..) 2 , se tiene al desarrollar el binomio:
i =1 j =1

⎡ t r
⎤ __ __
SCtotal = ∑∑ ⎢(Yij ) 2 − 2(Yij Y ..) + (Y ..) 2 ⎥ , y al distribuir las sumatorias:
i =1 j =1 ⎣ ⎦
23

t r __ t r __
SCtotal = ∑ ∑ Yij − 2 Y ..∑∑ Yij + tr Y ..2 , y como:
2

i =1 j =1 i =1 j =1
2
⎛ t r ⎞
⎜ ∑∑ Yij ⎟
__
Y ..2 Y ..2 ⎜⎝ i =1 j =1 ⎟⎠
(tr ) Y ..2 = (tr ) = = , la suma de cuadrados total queda:
(tr ) 2 (tr ) tr

2 2 2
⎛ t r ⎞ ⎛ t r ⎞ ⎛ t r ⎞
⎜ ∑∑ Yij ⎟ ⎜ ∑∑ Yij ⎟ ⎜ ∑∑ Yij ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
= ∑ ∑ Yij −2 ⎝ ⎠ + ⎝ i=1 j =1 ⎠ ⎝ i =1 j =1 ⎠
t r t r
= ∑ ∑ ij
2 i =1 j =1 2
SCtotal Y −
i =1 j =1 tr tr i =1 j =1 tr

La suma de cuadrados del error ( o sea, dentro de tratamientos), se obtiene por diferencia:
SCee = SCtotal – SCtrat.,
2 2
⎛ t r ⎞ ⎛ t r ⎞
⎜ ∑∑ Yij ⎟ ⎜ ∑∑ Yij ⎟
⎜ ⎟ 2 ⎜ ⎟
= ∑ ∑ Yij − ⎝ ⎠ – Yi . + ⎝ i =1 j =1 ⎠ .
t r t


2 i =1 j =1
SCee
i =1 j =1 tr i =1 r tr

t r
Yi .2 t
= ∑∑ Yij − ∑
2
SCee
i =1 j =1 i =1 r

2.2.5 Prueba de F

La estadística F es definida como la razón de dos variables aleatorias independientes con


distribución χ2 (Ji-cuadrada o Chi-Square), cada una de ellas dividida por sus respectivos grados de
libertad, o sea:
Q1 / n1
F= ,
Q2 / n 2

siendo Q1 una variable aleatoria con distribución χ2 y n1 grados de libertad y Q2 una variable aleatoria
con distribución χ2 y n2 grados de libertad, ambas independientes.

Así, considerando que SCtrat/σ2 tiene distribución χ2 con (t−1) grados de libertad, bajo Ho, y
SCeet/σ tiene distribución χ2 con t (r−1) grados de libertad y, son independientes, entonces el cociente
2

entre esas variables aleatorias, o sea:

SC trat /(t − 1) CM trat


= = Fo ,
SCee / t(r − 1) CM ee

tiene distribución F de Fisher & Snedecor con (t−1) y t (r−1) grados de libertad, bajo Ho. Ese cociente
es la estadística apropiada para evaluar la Ho, o sea: t1 = . . . = tI = 0.
24

Así, se puede decidir por el rechazo de Ho, al nivel α de significancia sí:

Fo ≥ F (α; t−1; t (r−1)),

donde F(α;t−1; t (r−1)), es el cuantil de orden (1−α) de la distribución F con (t−1) y t (r−1) grados de
libertad, como se muestra en la gráfica siguiente:

Región de aceptación (o no rechazo)


de la hipótesis nula

Región de rechazo (o no aceptación)


de la hipótesis nula

1−α

F (α; t−1; t (r−1))

Sí el valor observado de F (Fo) es superior al valor crítico F(α;t−1; t (r−1)), la Ho es rechazada, por
lo tanto se concluye que existen diferencias significativas entre los tratamientos.

2.2.6 Análisis de varianza o variación con aplicación de la prueba de F

El esquema del análisis de varianza abreviado como ANDEVA, ANOVA (ANalysis Of


VAriance) o bien ANVA; y las expresiones necesarias para la aplicación de la estadística F, para la
prueba de hipótesis se presentan en el siguiente cuadro.

Grados de
Fuentes de Suma de Cuadrados
libertad Valor de F
variación (FV) Cuadrados (SC) Medios (CM)
(gl)
t
Yi2. Y..2
t –1 ∑
i =1 r

tr SCtrat / gl trat
Tratamientos CMtrat / CMee

Error t(r-1) SCtotal – SCtrat SCee / gl ee

tr-1
t r
Y..2
Total ∑i =1
∑ Yij −
j=1
2

tr
25

Regla de Decisión

Rechazar Ho. Si Valor de F ≥ F crítico (gl trat; gl error; α)


No Rechazar Ho. Si Valor de F < F crítico (gl trat; gl error; α)

Fcrítica = Valor crítico de F encontrado en la tabla F de Fisher & Snedecor, considerando los grados
de libertad de tratamientos (v1), los grados de libertad del error (v2) y un determinado nivel
de significancia (α)

2.2.7 Coeficiente de Variación (CV)

Se le puede considerar como medida relativa de la variación que no es posible controlar en el


experimento (error experimental) y se calcula de la siguiente forma:
CM ee
CV = −
× 100
Y..

El coeficiente de variación da una idea de la precisión del experimento, a un valor alto de CV


corresponde un alto error experimental, lo cual indica que existe poca capacidad del experimento para
detectar diferencias significativas entre los tratamientos.

“De modo general, altos coeficientes de variación indican experimentos mal manejados”, pero
no siempre. El hecho de que el coeficiente de variación sea alto puede deberse no solamente al mal
manejo del experimento, sino también a:

• Tipo de variable de respuesta (escala de medición)


• Tipo de tratamientos.
• Errores en el análisis de la información, etc.

El CV puede ser utilizado para comparar la precisión experimental de variables experimentales


semejantes. Es conveniente que el investigador revise bibliografía sobre los valores de coeficiente de
variación obtenidos en cada cultivo y condición donde se realizó el experimento (por ejemplo, un valor
de CV=10% puede ser considerado un valor bajo, pero para algunas condiciones no).

Considere la siguiente situación donde se tienen las siguientes observaciones de una variable
de respuesta:

Variable de respuesta
Variable de respuesta transformada (con raíz
cuadrada)
36 6
16 4
9 3
4 2
Media 16.25 3.75
Desviación estándar 14.06 1.71
CV% 86.50 45.54

Observe que hubo una reducción del valor del CV% para la variable transformada. Por eso, el CV%
no siempre es un buen indicador de la precisión experimental (Dos Anjos, 2003)
26

2.2.8 Ejemplo de Aplicación

Una persona que realiza plantaciones forestales quiso comparar los efectos de cinco
tratamientos de preparación en el sitio sobre el crecimiento inicial en altura de plántulas de pino en el
terreno. Dispuso de 25 parcelas y aplicó cada tratamiento a cinco parcelas escogidas al azar. Entonces,
las parcelas se plantaron a mano y, al final de cinco años, se midió la altura de todos los pinos y se
calculó la altura promedio de cada parcela. Las medidas de las parcelas (en pies) fueron como sigue:

Tratamientos
A B C D E
15 16 13 11 14
14 14 12 13 12
12 13 11 10 12
13 15 12 12 10
13 14 10 11 11
Yi. 67 72 58 57 59 313

Y i. 13.4 14.4 11.6 11.4 11.8 12.52

67 2 + 722 + 582 + 57 2 + 592 3132


SCTRAT = − = 34.64
5 25

3132
SCTOTAL = 15 + 14 + . . . + 11 −
2 2 2
= 64.24
25

SCERROR = 64.24 – 34.64

Resumen del análisis de varianza

Grados de Suma de Cuadrados Valor crítico


Fuentes de variación F
libertad cuadrados Medios F
Tratamientos 4 34.64 8.66 5.85 2.87
Error Experimental 20 29.6 1.48
Total 24 64.24

CV = 9.72%

Nota: El valor crítico de F lo puede obtener directamente de la Tabla 1 del Apéndice, o en MS


Excel®, en el menú INSERTAR busque función (fx) y luego seleccione la categoría Estadísticas, y
dentro de éstas DISTR.F.INV (probabilidad, grados_de_libertad1, grados_de_libertad2). Otra manera
de poder concluir, es obteniendo el valor p (p value), si éste es menor a 0.05, se rechaza la hipótesis
nula. Para este caso valor p = 0.0027607.

Conclusión:

Los tratamientos de preparación en el sitio afectan significativamente el crecimiento inicial en


altura de plántulas de pino en el terreno; debido a que el valor de F es superior al valor crítico. Se
recomienda realizar un análisis postANDEVA para poder identificar el mejor tratamiento.

También podría gustarte