Cap III

Departamento de Estadística e Informática
Curso: Métodos Estadísticos para la Investigación I Diseño Completamente al Azar
Capítulo III
Diseño Completamente al Azar
Los números redondos son siempre falsos.

Samuel Johnson
Los estadísticos generalmente hacen la pregunta incorrecta, y están dispuestos a responder

con una mentira, una que es frecuentemente una descarada mentira. Ellos preguntan “Son
los efectos de A y B diferentes?” y ellos están dispuestos a responder “no”.
Todo lo que nosotros sabemos acerca del mundo nos enseña que los efectos de A y B son
siempre diferentes – en algún lugar decimal – para cualquier A y B. De esta manera,
preguntar “¿Son los efectos diferentes?” es tonto.
Lo que deberíamos responder primero es “¿Podemos indicar la dirección en la cual los
efectos de A difieren de los efectos de B?”. ¿Es “arriba”, “abajo” o “incierta”?
La tercera respuesta a la última pregunta es que nosotros tenemos “incertidumbre sobre la
dirección”, y no que nosotros “aceptemos la hipótesis nula”.
John Tukey
1. Introducción
El diseño completamente al azar (DCA) es el más simple de todos los diseños. Es un diseño
en el cual los tratamientos son asignados aleatoriamente a las unidades experimentales sin
ningún tipo de restricción. Este diseño es utilizado cuando las unidades experimentales son
bastante homogéneas, es decir, cuando la variabilidad entre ellas es pequeña y no existe
ningún criterio de bloqueo que permita disminuirla. Dado que los tratamientos constituyen el
único criterio de clasificación para las unidades experimentales, a este diseño se le conoce
también como diseño de clasificación de una vía (One Way).
En este capítulo se verán los casos paramétrico y no paramétrico del DCA, el análisis de la
variancia y las pruebas de comparación de medias de tratamientos.
Ing. Raúl Eyzaguirre Pérez 24

reyzaguirre@lamolina.edu.pe
2. Diseño Completamente al Azar (DCA Clásico o Paramétrico)
2.1. Ventajas y Desventajas del DCA
Ventajas:
- Es un diseño flexible en tanto que el número de tratamientos y de repeticiones solo está
limitado por el número de unidades experimentales.
- El número de repeticiones puede variar entre tratamientos aunque generalmente lo ideal es
tener un número igual para cada tratamiento.
- El análisis estadístico es simple.
- El número de grados de libertad para estimar el error experimental es máximo. Esto
mejora la precisión del experimento.
Desventajas:
- Solo es aplicable en situaciones en las que el material experimental es homogéneo.
- Dado que no hay restricciones de aleatoriedad toda la variabilidad existente en las
unidades experimentales tratadas con el mismo tratamiento estará incluida en el error
experimental.
2.2. Aleatorización y Croquis Experimental
Como ya se mencionó, en este diseño no existe ninguna restricción de aleatoriedad por lo que
la asignación de los tratamientos a las unidades experimentales será completamente aleatoria
(Esto quiere decir que cualquier distribución de los tratamientos en las unidades
experimentales es igualmente probable). Para lograr la asignación aleatoria de los
tratamientos se puede utilizar cualquier método de generación de números aleatorios como
una tabla de números al azar, un modelo de urnas o un sistema de cómputo (aunque los
números generados por calculadoras y computadoras no son estrictamente aleatorios sino solo
pseudoaleatorios, son aceptables).
Por ejemplo, suponga que va a evaluar 4 tratamientos con 3 repeticiones cada uno; en este
caso necesitará de 12 unidades experimentales. Para asignar los tratamientos completamente
al azar a las unidades experimentales, genere primero un orden aleatorio para los primeros 12
números naturales. Para ello podría por ejemplo utilizar 12 papeles idénticos, numerarlos del
1 al 12, colocarlos en una urna y luego sacarlos uno a uno anotando el orden en el cual son
seleccionados. Otra alternativa sería generar 12 números aleatorios usando la computadora o
una tabla de números aleatorios y luego asignarle a cada uno un número de orden desde el 1
hasta el 12 (de menor a mayor). A continuación se presenta una secuencia de 12 números
aleatorios obtenidos utilizando la función ALEATORIO() de Excel con su respectivo número
de orden:
.755 .442 .582 .601 .479 .994 .306 .416 .435 .836 .743 .902
9 4 6 7 5 12 1 2 3 10 8 11

Con esta secuencia, el primer tratamiento es asignado a las unidades experimentales 9, 4 y 6,

el segundo a las u.e. 7, 5 y 12, el tercero a las u.e. 1, 2 y 3 y el cuarto a las u.e. 10, 8 y 11. El
croquis para este experimento podría ser el siguiente:
T3 T3 T3 T1 T2 T1 T2 T4 T1 T4 T4 T2
2.3. Modelo Aditivo Lineal
El modelo aditivo lineal para un diseño completamente al azar es el siguiente:

Yij = µ + τ i + ε ij i = 1,..., t j = 1,...ri
donde:
Yij es el valor o rendimiento observado en el i-ésimo tratamiento, j-ésima repetición.
µ es el efecto de la media general.
τi es el efecto del i-ésimo tratamiento.
εij es el efecto del error experimental en el i-ésimo tratamiento, j-ésima repetición.
t es el número de tratamientos.
ri es el número de repeticiones para el i-ésimo tratamiento.
Ejemplo 1: Se realizó un experimento para evaluar el efecto de la adición de compuestos

vitamínicos al alimento balanceado en la ganancia de peso en cerdos. Tres diferentes
compuestos fueron evaluados (A, B y C) y un control (D – sin la adición de compuesto
vitamínico). El aumento de peso tras una semana en una muestra aleatoria de 22 cerdos se
da a continuación:
Compuesto Vitamínico Aumento de peso tras una semana en lb

A 11.1 10.9 10.8 10.2 11.4 10.7
B 11.5 11 10.8 10.6 11.2 10.9
C 10.1 10.6 11.2 10.2 10.4
D 9.2 9.8 10.1 9.7 10.4
Este experimento fue conducido bajo los lineamientos de un DCA, por lo que el modelo
aditivo lineal es el siguiente:
Yij = µ + τ i + ε ij i = 1,..., t j = 1,...ri
donde:
- Yij es la ganancia de peso obtenida en el j-ésimo cerdo alimentado con el i-ésimo
compuesto vitamínico.
- µ es el efecto de la media general de las ganancias de peso.
- τi es el efecto del i-ésimo compuesto vitamínico.
- εij es el efecto del error experimental con el j-ésimo cerdo alimentado con el i-ésimo
compuesto vitamínico.

- t = 4 (Número de tratamientos)
- r1 = 6, r2 = 6, r3 = 5 y r4 = 5 (Número de repeticiones por tratamiento).
2.4. Supuestos del Modelo Estadístico
El modelo estadístico debe cumplir con los siguientes supuestos:

1. Aditividad: Los efectos del modelo son aditivos.
2. Linealidad: Las relaciones entre los efectos del modelo son lineales.
3. Normalidad: Los errores del modelo deben tener una distribución normal con media cero
y variancia σ2.
4. Independencia. Los resultados obtenidos en el experimento son independientes entre sí.
5. Homogeneidad de Variancias: Las diferentes poblaciones generadas por la aplicación de
los diferentes tratamientos tienen variancias iguales (σ2).
Más adelante se presentarán pruebas estadísticas para evaluar los supuestos de normalidad de
los errores y de homogeneidad de variancias.
2.5. Estimación de los Efectos
Los efectos del modelo son estimados por el método de Mínimos Cuadrados. Este método
permite obtener los valores de µ y τi que minimizan la suma de los errores al cuadrado, es
decir, que minimizan la siguiente expresión:
t ri t ri
Q = ∑∑ ε ij2 = ∑∑ (Yij − µ − τ i ) 2
i =1 j =i i =1 j =i
Para calcular los valores de µ y τi que minimizan la suma de los errores al cuadrado, se debe
solucionar el sistema de ecuaciones obtenido al igualar las derivadas parciales de Q con
respecto a µ y cada uno de los τi a cero, y la siguiente restricción adicional:
t
∑rτ
i =1
i i =0
La aplicación de este método da los siguientes resultados para la estimación de los

parámetros:
µ̂ = Y••
τˆi = Yi• − Y••
εˆij = Yij − Yi•
Ejemplo 1 (Cont.): Con los datos del ejemplo anterior, la media estimada es:

µˆ = 10.582
Los efectos estimados de los tratamientos:
τˆ1 = Y1• − Y•• = 10.850 − 10.582 = 0.268
τˆ2 = Y2• − Y•• = 11.000 − 10.582 = 0.418
τˆ3 = Y3• − Y•• = 10.500 − 10.582 = −0.082
τˆ4 = Y4• − Y•• = 9.840 − 10.582 = −0.742
El efecto estimado del error ε42:
εˆ42 = Y42 − Y4• = 9.8 − 9.840 = −0.04
2.6. Prueba de Anderson – Darling para Normalidad
La prueba de Anderson-Darling, al igual que la prueba chi-cuadrado para bondad de ajuste

tratada en el capítulo I, es utilizada para probar si un conjunto de datos muestrales provienen
de una población con una distribución de probabilidades específica. Aunque en esta sección
se tratará solo el caso de bondad de ajuste a la distribución normal, al igual que la prueba chi-
cuadrado esta prueba puede ser aplicada para evaluar el ajuste a cualquier distribución de
probabilidades. La prueba de Anderson-Darling se basa en la comparación de la distribución
de probabilidades acumulada empírica (resultado de los datos) con la distribución de
probabilidades acumulada teórica (defina por H0).
En un diseño completamente al azar se debe evaluar si la variable respuesta Y sigue una
distribución Normal con media µ +τi y variancia σ 2 en cada uno de los tratamientos, o si los
errores siguen una distribución Normal con media 0 y variancia σ 2.
Hipótesis:
H0: La variable sigue una distribución Normal (µ, σ2)
H1: La variable no sigue una distribución Normal (µ, σ2)
Estadístico de Prueba:
El estadístico de prueba, A2, está dado por:
A2 = − n − S
1 n
S= ∑ ( 2i − 1) ln F (Yi ) + ln (1 − F (Yn+1−i ) )
n i =1
donde n es el número de observaciones, F(Y) es la distribución de probabilidades acumulada

normal con media y variancia especificadas a partir de la muestra y Yi son los datos obtenidos
en la muestra, ordenados de menor a mayor.

Regla de decisión:
La hipótesis nula se rechaza con un nivel de significación α sí A2 es mayor que el valor crítico
A2crit. Aunque la prueba de Anderson-Darling puede ser aplicada a cualquier distribución, no
se dispone de tablas para todos los casos. A continuación se presenta una tabla para la prueba
a la distribución normal.
α 0.1 0.05 0.025 0.01

A2crit 0.631 0.752 0.873 1.035
Ejemplo 1 (Cont.):
H0: Los errores siguen una distribución Normal (0, σ2)
H1: Los errores no siguen una distribución Normal (0, σ2)
A continuación se presentan los residuales obtenidos con los datos del ejemplo:
Compuesto Vitamínico Residuales

A 0.25 0.05 -0.05 -0.65 0.55 -0.15
B 0.50 0.00 -0.20 -0.40 0.20 -0.10
C -0.40 0.10 0.70 -0.30 -0.10
D -0.64 -0.04 0.26 -0.14 0.56
La media de los residuales es 0 y la desviación estándar es 0.3708. Con estos valores, el

cálculo del estadístico de prueba se presenta en la siguiente tabla:
i (2i-1) Yi Yn+1-i F(Yi) F(Yn+1-i) ln(F(Yi)) ln(F(Yn+1-i)) Si

1 1 -0.65 0.70 0.0398 0.9705 -3.224 -3.523 -0.307
2 3 -0.64 0.56 0.0422 0.9345 -3.166 -2.726 -0.803
3 5 -0.40 0.55 0.1403 0.9310 -1.964 -2.674 -1.054
4 7 -0.40 0.50 0.1403 0.9113 -1.964 -2.422 -1.395
5 9 -0.30 0.26 0.2092 0.7584 -1.564 -1.421 -1.221
6 11 -0.20 0.25 0.2948 0.7499 -1.221 -1.386 -1.304
7 13 -0.15 0.20 0.3429 0.7052 -1.070 -1.221 -1.354
8 15 -0.14 0.10 0.3529 0.6063 -1.042 -0.932 -1.346
9 17 -0.10 0.05 0.3937 0.5536 -0.932 -0.807 -1.344
10 19 -0.10 0.00 0.3937 0.5000 -0.932 -0.693 -1.404
11 21 -0.05 -0.04 0.4464 0.4570 -0.807 -0.611 -1.353
12 23 -0.04 -0.05 0.4570 0.4464 -0.783 -0.591 -1.437
13 25 0.00 -0.10 0.5000 0.3937 -0.693 -0.500 -1.356
14 27 0.05 -0.10 0.5536 0.3937 -0.591 -0.500 -1.340
15 29 0.10 -0.14 0.6063 0.3529 -0.500 -0.435 -1.233
16 31 0.20 -0.15 0.7052 0.3429 -0.349 -0.420 -1.084
17 33 0.25 -0.20 0.7499 0.2948 -0.288 -0.349 -0.956
18 35 0.26 -0.30 0.7584 0.2092 -0.277 -0.235 -0.813
19 37 0.50 -0.40 0.9113 0.1403 -0.093 -0.151 -0.411
20 39 0.55 -0.40 0.9310 0.1403 -0.071 -0.151 -0.395
21 41 0.56 -0.64 0.9345 0.0422 -0.068 -0.043 -0.206
22 43 0.70 -0.65 0.9705 0.0398 -0.030 -0.041 -0.138
Sumando los valores de la última columna se tiene que S = -22.253 y entonces:
A2 = −22 + 22.253 = 0.2532
Este valor es menor inclusive al valor crítico correspondiente a α = 0.1. Por lo tanto se
acepta el supuesto de normalidad de los errores.
2.7. Prueba de Bartlett para Homogeneidad de Variancias
Esta prueba se utiliza para evaluar si existe homogeneidad de variancias entre k (2 ó más)
poblaciones (en el caso de un diseño experimental, las poblaciones corresponderán a los
tratamientos). Los supuestos para la aplicación de esta prueba son que las poblaciones tienen
distribuciones normales e independientes, y que las muestras son tomadas al azar.
Hipótesis:
H0: σ 12 = σ 22 = … = σ k2 = σ 2
H1: Al menos un σ i2 es diferente.
El estadístico de prueba tiene una distribución Chi-Cuadrado con k-1 grados de libertad y se
define de la siguiente manera:
 k  k
∑ i ( r − 1)  Ln s 2
p − ∑ ( (ri − 1) Ln si2 )
Q =  i =1  i =1
∼ χ (k2 -1)
 
1   k
1  1 
1+ ∑ − k 
3(k − 1)   i =1 ri − 1 
 ∑ (ri − 1) 
 i =1 
donde k es el número de poblaciones (tratamientos), ri es el tamaño de muestra para cada
población, si2 es la variancia muestral para la población i y s 2p es la variancia muestral
ponderada para las k muestras. Estas dos últimas cantidades son calculadas por las siguientes
fórmulas:
k
ri
(Yij − Yi• ) 2 ∑ (r − 1)s
i
2
i
si2 = ∑ s 2p = i =i
ri − 1 k
j =i
∑ (r − 1)
i =i
i
Regla de decisión:
La hipótesis nula se rechaza con un nivel de significación α sí Q resulta mayor que el valor de
tabla χ 2[1-α, k -1].

Ejemplo 1 (Cont.):
H0: σ 12 = σ 22 = σ 32 = σ 42
H1: Al menos un σ i2 es diferente.
s12 = 0.163 s22 = 0.1 s32 = 0.19 s42 = 0.203 s 2p = 0.1610
Q = 0.605 ∼ χ (3)
2
El valor de tabla es χ (0.95,

2
3gl) = 7.815. Como Q resulta menor que el valor de tabla, se
acepta H0. Por lo tanto se acepta el supuesto de homogeneidad de variancias.
2.8. Análisis de Variancia
En este modelo la variabilidad total se descompone en dos fuentes de variación, la explicada

por los tratamientos y la explicada por el error. Por lo tanto, el modelo de descomposición de
la variancia será el siguiente:
Variabilidad (Total) = Variabilidad (Tratamientos) + Variabilidad (Error)
La variabilidad total es cuantificada por la suma de cuadrados total, la cual se calcula de la
siguiente manera:
ri ri
t t
Y••2
SC(Total) = SC(Y ) = ∑∑ (Yij − Y•• ) 2 = ∑∑ Yij2 −
i =1 j =1 i =1 j =1 r•
Y•2•
A la expresión se le conoce como el término de corrección (TC).
r•
La variabilidad explicada por los tratamientos (o suma de cuadrados de los tratamientos) se

calcula de la siguiente manera:
Yi•2 t
SC(Tratamientos) = ∑ − TC
i =1 ri
Por último, la variabilidad explicada por el error puede ser calculada por la siguiente
expresión:
t ri t
Yi•2
SC(Error) = ∑∑ Yij2 − ∑
i =1 j =1 i =1 ri
o por diferencia desde la relación SC(Total) = SC(Tratamientos) + SC(Error), con lo que se

tiene:
SC(Error) = SC(Total) - SC(Tratamientos)

Estas dos fuentes de variación (tratamientos y error) son comparadas mediante el siguiente
procedimiento de prueba de hipótesis a partir del cuadro de análisis de variancia (Cuadro
ANVA):
Cuadro ANVA
Fuentes de Grados de Sumas de Cuadrados

Fc
Variación Libertad (gl) Cuadrados (SC) Medios (CM)
t
Yi•2 SC(Trat) CM(Trat)
Tratamientos t–1 ∑i =1 ri
− TC
gl(Trat) CM(Error)
Error
t ri t
Yi•2 SC(Error)
Experimental
r• - t ∑∑ Yij2 − ∑
i =1 j =1 i =1 ri gl(Error)
t ri
Total r• - 1 ∑∑ Y
i =1 j =1
2
ij − TC
Hipótesis:
Para el Modelo I (Efectos fijos) las hipótesis son, en términos de los efectos de los
tratamientos las siguientes:
H0: τi = 0 ∀ i
H1: τi ≠ 0 para al menos algún i
En términos de las medias de los tratamientos:
H0: µi = µ ∀ i
H1: µi ≠ µ para al menos algún i
Para el Modelo II (Efectos aleatorios) las hipótesis serán planteadas en términos de la
variancia de los tratamientos:
H0: σ τ2 = 0
H1: σ τ2 > 0
En cualquiera de los casos, la hipótesis nula implica que los tratamientos no afectan a la
variable respuesta, o lo que es lo mismo, que con todos los tratamientos se obtienen los
mismos resultados.
Valores Esperados de los Cuadrados Medios:

Si un experimento en DCA, con igual número de repeticiones por tratamiento, se repitiera
bajo las mismas condiciones indefinidamente, y se calculara la media de los cuadrados
medios obtenidos, estas medias se aproximarían a los valores presentados en la siguiente
tabla. Esto permite establecer qué parámetros se están estimando cuando se calculan los
diferentes cuadrados medios y el valor Fc.

Grados de Valor Esperado de los Cuadrados Medios

Fuentes de Variación
Libertad (GL) Modelo I Modelo II
t
τ i2
Tratamientos t–1 σ 2 + r∑ σ 2 + rσ τ2
i =1 t − 1
Error Experimental t(r – 1) σ2 σ2
Total tr - 1
CM(Trat)
Fc = ∼ F( gl(Trat ),gl(Error) )
CM(Error)
Regla de Decisión:
La hipótesis nula se rechaza con un nivel de significación α si el Fc resulta mayor que el valor
de tabla F(1−α , gl(Trat ),gl(Error) ) .
Ejemplo 1 (Cont.): A continuación se presenta el análisis de variancia y la prueba de

hipótesis correspondiente para el ejemplo tratado en esta sección:
ri
t
Y••2
SC(Total) = ∑∑ Yij2 −
i =1 j =1 r•
232.82
= (11.1 + 10.9 + ... + 10.4 ) −
2 2
= 7.1527
2
22
t
Yi•2
SC(Tratamientos) = ∑ − TC
i =1 ri
65.12 662 52.52 49.22 232.82

= + + + − = 4.2657
6 6 5 5 22
SC(Error) = SC(Total) - SC(Tratamientos) = 2.8870
Cuadro ANVA
Fuentes de Variación gl SC CM Fc
Tratamientos 3 4.2657 1.4219 8.87
Error Experimental 18 2.8870 0.1604
Total 21 7.1527

11.5
Ganancia de Peso en lb
11.0
10.5
10.0
9.5
9.0
A B C D
Tratamientos
Asumiendo un modelo de efectos fijos, las hipótesis en términos de los efectos de los
tratamientos son:
H0: τi = 0 i = 1, ..., 4
H1: τi ≠ 0 para al menos algún i
En términos de las medias de los tratamientos:
H0: µi = µ i = 1, ..., 4
o literalmente:
H0: Todos los compuestos vitamínicos tienen el mismo efecto en la ganancia de peso de los
cerdos.
H1: Con al menos uno de los compuestos vitamínicos se obtiene una ganancia de peso
diferente.
El estadístico de prueba es Fc = 8.87. El valor de tabla para un nivel de significación del
5% es F(0.95, 3,18 ) = 3.19. Dado que el estadístico de prueba resulta mayor que el valor de
tabla se rechaza H0. En conclusión, existe suficiente evidencia estadística para aceptar que
con al menos uno de los compuestos vitamínicos se obtienen ganancias de peso diferentes
en los cerdos.
El nivel de significación usual y aceptado en investigación científica para considerar que un

efecto o diferencia es significativo es 5%. Cuando la prueba resulta significativa con α = 1%
se dice que el efecto o diferencia es altamente significativo.

2.9. Coeficiente de Variación
Es una medida usada por los experimentadores para evaluar el grado de homogeneidad de los
resultados de un experimento. Para saber si un determinado coeficiente de variación es
demasiado grande o pequeño, es preciso tener experiencia con datos similares.
En el DCA, el cuadrado medio del error (CME) es el estimador de la variancia del
experimento σ 2 y el coeficiente de variación es calculado por la siguiente expresión:
CME
cv =
Y••
Con los datos del ejemplo, el coeficiente de variación será:
0.1604
cv = = 3.78%
10.58
Ejemplo 2: Se desarrolló un experimento para evaluar 4 tratamientos para la preparación

del terreno:
T1: Aplicación de herbicida
T2: Quemado del campo
T3: Escarificación
T4: Control (sin preparación del terreno)
La variable respuesta fue el tamaño de los plantones en cm a los 30 días. Los resultados
del experimento se dan a continuación:
Tratamiento
Repetición T1 T2 T3 T4
1 25 15 12 4
2 18 22 7 6
3 29 17 8 5
4 24 17 13 9
Este experimento fue conducido bajo los lineamientos de un DCA, por lo que el modelo
aditivo lineal es el siguiente:
Yij = µ + τ i + ε ij i = 1,..., t j = 1,...r
donde:
- Yij es el tamaño de los plantones a los 30 días obtenido con el i-ésimo método de
preparación del terreno y en la j-ésima repetición.
- µ es el efecto de la media general de los tamaños de los plantones.
- τi es el efecto del i-ésimo método de preparación del terreno.
- εij es el efecto del error experimental con el i-ésimo método de preparación del terreno y
en la j-ésima repetición.

- t = 4 (Número de tratamientos)
- r = 4 (Número de repeticiones por tratamiento).
En este problema los resultados obtenidos en las pruebas de Anderson-Darling y de
Bartlett son satisfactorios y por lo tanto se aceptan los supuestos de normalidad y
homogeneidad de variancias (ver anexo al final del capítulo). El cuadro de análisis de
variancia se presenta a continuación:
Cuadro ANVA
Fuente de Variación gl SC CM Fc
Tratamientos 3 773.2 257.7 24.02
Error 12 128.8 10.7
Total 15 901.9
H0: µi = µ i = 1, ..., 4
Como F = 24.02 > F[0.95, 3, 12] =3.49, entonces se rechaza H0 y se concluye que existe
suficiente evidencia estadística con un nivel de significación del 5% para aceptar que con
al menos uno de los tratamientos para la preparación del terreno se obtienen resultados
diferentes en el tamaño de los plantones. El coeficiente de variación en este problema es:
10.73
cv = = 22.68%
14.44
3. Pruebas de Comparación de Medias de Tratamientos

Note que la conclusión obtenida tras un análisis de variancia significativo es que con al menos
uno de los tratamientos se obtienen resultados diferentes. Si bien esta conclusión ya resulta
valiosa, definitivamente no es suficiente. Un investigador, querrá ir más allá en el análisis y
responder preguntas tales como: ¿Con qué tratamiento se obtienen los mejores resultados?,
¿es este tratamiento significativamente superior a los demás?, ¿es el tratamiento A mejor que
el B?. Para responder a este tipo de preguntas será necesario realizar pruebas adicionales que
permitan comparar a los distintos tratamientos, en forma individual o por grupos, unos con
otros.
A algunas de estas pruebas se les conoce también como pruebas de comparaciones múltiples,
ya que permiten efectuar un conjunto de comparaciones. Suponga por ejemplo que usted
conduce un experimento con 3 tratamientos (A, B y C). En este caso usted podría efectuar 3
comparaciones por pares (A con B, A con C y B con C). Si tiene cuatro tratamientos, el
número de comparaciones por pares sería 6, con cinco tratamientos sería 10, y en general, con
t tratamientos, el número de comparaciones por pares sería C 2t .
Debido a que se están efectuando varias pruebas de hipótesis simultáneamente y no solo una,
un problema a tener en cuenta es el de la definición del nivel de significación. Por ejemplo,
suponga que usted hace un experimento con 5 tratamientos entre los cuales realmente no

existen diferencias. En este caso la hipótesis nula de no diferencias sería verdadera para todas
las comparaciones, aunque de hecho por cuestiones de azar usted obtendría resultados
ligeramente diferentes en su experimento. Si usted realizara una prueba para comparar dos de
estos tratamientos a un nivel de significación del 5%, y repitiera esta misma prueba con
diferentes datos varias veces, encontraría diferencias significativas en aproximadamente el 5%
de las veces; pero ¿qué pasa si usted decide comparar los dos tratamientos en los que se
obtuvieron los resultados más similares?, ¿qué pasa si usted decide comparar los dos
tratamientos en los que se obtuvieron los resultados más extremos? En el primer caso la
probabilidad de encontrar diferencias significativas va a ser menor a 5% y en el segundo caso
mayor. Por esta razón, algunas de las pruebas que se verán más adelante deben ser planeadas
con anterioridad a la ejecución del experimento y no sugeridas por los resultados obtenidos.
Por último, otro factor a considerar es el número de comparaciones que se están efectuando.
En el caso descrito anteriormente, con un total de cinco tratamientos, usted efectuará 10
pruebas. Cada una de esas pruebas tendrá una probabilidad de 5% de resultar en diferencias
significativas, pero ¿cuál es la probabilidad de que al menos una de las 10 comparaciones
resulte significativa?. Dado que realmente no existen diferencias entre los 5 tratamientos,
bastará que se encuentren diferencias significativas en una de las 10 comparaciones para
cometer un error. Obviamente, la probabilidad de errar en al menos una de las 10
comparaciones será mayor al 5%. Esta característica lleva a la necesidad de definir el nivel de
significación en dos formas. Al total de comparaciones por pares que se puedan plantear entre
todos los tratamientos considerados en un experimento se le llamará una “familia de
comparaciones”, y entonces al nivel de significación para una comparación se le llamará
“error individual” y al nivel de significación para el total de comparaciones (probabilidad de
encontrar diferencias significativas en al menos una de las comparaciones) “error por
familia”. Las pruebas en las que el nivel de significación sea individual servirán para efectuar
comparaciones individuales planeadas con anterioridad; las pruebas en las que el nivel de
significación sea por familia servirán para efectuar todas las comparaciones posibles
(comparaciones múltiples).
3.1. Prueba t
Es una prueba para comparaciones planeadas con anterioridad. El nivel de significación se

toma como un error individual. Los supuestos para la realización de esta prueba son:
- Prueba F del análisis de variancia significativa.
- Variancias homogéneas.
- Las muestras son extraídas al azar.
Hipótesis:
Caso A: Caso B: Caso C:
H0: µi - µj = k H0: µi - µj = k H0: µi - µj = k
H1: µi - µj > k H1: µi - µj < k H1: µi - µj ≠ k

(Yi• − Y j • ) − k
tc = ∼ t(gl(Error))
sd
1 1
donde sd = CME  +  es la desviación estándar de la diferencia de las medias
r r 
 i j 
muestrales de los dos tratamientos. Si todos los tratamientos tienen el mismo número de
repeticiones, el estadístico de prueba se simplifica a:
(Yi• − Y j • ) − k
tc =
2CME
r
Regla de Decisión:
Caso A: La hipótesis nula se rechaza con un nivel de significación α si el tc es mayor que el
valor de tabla t(1-α, gl(Error)).
Caso B: La hipótesis nula se rechaza con un nivel de significación α si el tc es menor que el
valor de tabla t(α, gl(Error)).
Caso C: La hipótesis nula se rechaza con un nivel de significación α si el tc es menor que el
valor de tabla t(α/2, gl(Error)) o mayor que el valor de tabla t(1-α/2, gl(Error)).
Ejemplo 1 (Cont.): Uno de los objetivos del experimento era evaluar si el aumento de
peso logrado con el compuesto vitamínico B superaba al logrado con D en más de una
libra. El procedimiento para esta prueba será el siguiente:
H0: µB - µD = 1
H1: µB - µD > 1
(YB − YD ) − k (11 − 9.84) − 1

tc = = = 0.6598
1 1 1 1
CME  +  0.1604  + 
 rB rD  6 5
El valor de tabla para un nivel de significación de 5% es t(0.95, 18) = 1.734. Como el valor
calculado es menor al valor de tabla no se rechaza H0. En conclusión, no existe suficiente
evidencia estadística para aceptar que el aumento de peso logrado con el compuesto
vitamínico B supere al logrado con D en más de una libra.
3.2. Prueba DLS
La prueba DLS es una forma abreviada de la prueba t para el caso bilateral (Caso C). La
prueba consiste en calcular una diferencia límite significativa (DLS) de modo que cualquier
diferencia entre las medias de dos tratamientos mayor a dicho límite sea significativa. Los

supuestos para esta prueba son los mismos que para la prueba t y por supuesto, también debe
ser planeada con anterioridad.
Hipótesis:
H0: µi = µj
H1: µi ≠ µj
Diferencia Límite Significativa:

DLS = t(1-α/2, gl(Error)) sd
1 1
donde sd = CME  +  es la desviación estándar de la diferencia de las medias
r r 
 i j 
muestrales de los dos tratamientos.
Regla de Decisión:
La hipótesis nula se rechaza con un nivel de significación α si Yi• − Y j • > DLS.
Ejemplo 1 (Cont.): Aplique la prueba DLS para comparar los tratamientos A y B.

H0: µA = µB
H1: µA ≠ µB
1 1  1 1
DLS = t(0.975, 18) CME  +  = 2.101 0.1604 +  = 0.4858
 rA rB  6 6
Y A − YB = 10.85 − 11 = 0.15
Como Y A − YB es menor al DLS no se rechaza H0. En conclusión, no existe suficiente

evidencia estadística para aceptar que la ganancia de peso obtenida con el compuesto
vitamínico A sea diferente a la obtenida con el compuesto vitamínico B.
3.3. Prueba de Contrastes Ortogonales

La prueba t vista anteriormente permite comparar dos tratamientos; la prueba de contrastes es
el caso general, ya que permite comparar más de dos tratamientos. Específicamente, el interés
del investigador estará en comparar combinaciones lineales de las medias de los tratamientos.
Tanto la prueba t como la DLS vienen a ser casos particulares de esta prueba. Los supuestos
para esta prueba son los mismos que para la prueba t o DLS y cada combinación lineal de las
medias de los tratamientos que sea evaluada también debe ser planeada con anterioridad.
Una comparación o contraste, al que se denotará por L, es una combinación lineal de la forma:

t t
L = ∑ ciYi• = ∑ ri ci µi
i =1 i =1
en donde:
t
∑ rci =1
i i =0
Si todos los tratamientos tienen el mismo número de repeticiones, entonces la condición

anterior se reduce a:
t
∑c i =1
i =0
y el contraste puede plantearse como:

t
L = ∑ ci µi
i =1
Por ejemplo, para comparar los tratamientos 1 y 2 en un experimento con igual número de
repeticiones por tratamiento, podría plantearse el siguiente contraste:
L = µ1 − µ 2
Este es un contraste ya que el coeficiente de µ1 es 1 y el de µ2 es –1, con lo que la suma de los

coeficientes da cero. Como este contraste involucra solo dos tratamientos puede ser evaluado
con una prueba t o DLS (de hecho note que este contraste fue evaluado en el ejemplo
anterior).
Un contraste que involucre 4 tratamientos, en un experimento con igual número de
repeticiones por tratamiento, podría ser el siguiente:
L = µ1 + µ2 + µ3 - 3µ4
Cada contraste tiene un grado de libertad, por lo que en un experimento con t tratamientos
podrán efectuarse t – 1 contrastes ortogonales (ya que se tienen t – 1 grados de libertad para
los tratamientos). Dos contrastes, L1 = ∑ ri c1i µi y L2 = ∑ ri c2i µi son ortogonales si cumplen
con la siguiente condición:
t
∑ rc c
i =1
i 1i 2 i =0
Si todos los tratamientos tienen el mismo número de repeticiones, la condición anterior se

reduce a:
t
∑c ci =1
1i 2 i =0

Ejemplo: Suponga que se tienen 4 tratamientos (A, B, C y D) con igual número de

repeticiones. Un conjunto de contrastes ortogonales podría ser el siguiente:
L1 = µA + µB + µC - 3µD
L2 = µA + µB - 2µC
L3 = µA - µB
Un contraste puede ser evaluado en una prueba de hipótesis usando la distribución t. Un

conjunto de contrastes ortogonales pueden ser evaluados simultáneamente en una prueba de
hipótesis usando la distribución F. En esta sección se verá solo el primer caso.
Hipótesis:
Caso A: Caso B: Caso C:
H0: L = L0 H0: L = L0 H0: L = L0
H1: L > L0 H1: L < L0 H1: L ≠ L0
Lˆ − L0
tc = ∼ t(gl(Error))
s Lˆ
t t
donde Lˆ = ∑ ci rY
i i • es el contraste estimado y sLˆ = CME ∑ ri ci2 es la desviación estándar
i =1 i =1
del contraste estimado. Si todos los tratamientos tienen el mismo número de repeticiones, el
t
contraste estimado se puede definir por Lˆ = ∑ ciYi• y su desviación estándar será
i =1
ci2t
sLˆ = CME ∑ .
i =1 r
Regla de Decisión:
Caso A: La hipótesis nula se rechaza con un nivel de significación α si el tc es mayor que el
valor de tabla t(1-α, gl(Error)).
Caso B: La hipótesis nula se rechaza con un nivel de significación α si el tc es menor que el
valor de tabla t(α, gl(Error)).
Caso C: La hipótesis nula se rechaza con un nivel de significación α si el tc es menor que el
valor de tabla t(α/2, gl(Error)) o mayor que el valor de tabla t(1-α/2, gl(Error)).
Ejemplo 2 (Cont.): En el ejemplo de preparación del terreno, evalúe si el tamaño medio de

los plantones obtenido en terreno preparado (Tratamientos T1, T2 y T3) es superior en más
de 5 cm al obtenido en terreno sin preparación (Tratamiento T4).
El contraste a evaluar en este caso es L = µ1 + µ2 + µ3 - 3µ4, y se quiere probar si:
µ1 + µ 2 + µ3
− µ4 > 5
3
es decir, si L es mayor a 15. Luego, las hipótesis serán:
H0: L = 15
H1: L > 15
El cálculo del estadístico de prueba es el siguiente:
L̂ = Y1 + Y2 + Y3 − 3Y4 = 33.75
 (1) 2 (1) 2 (1) 2 (−3) 2 

sLˆ = CME  + + +  = 5.674
 4 4 4 4 
Lˆ − L0 33.75 − 15
tc = = = 3.305
sLˆ 5.674
El valor de tabla para un nivel de significación de 5% es t(0.95, 12) = 1.782. Como el valor
calculado es mayor al valor de tabla se rechaza H0 y se concluye que existe suficiente
evidencia estadística para aceptar que el tamaño medio de los plantones obtenido en
terreno preparado es superior en más de 5 cm al obtenido en terreno sin preparación.
3.4. Prueba de Tukey
La prueba de Tukey permite evaluar la significancia de todas las diferencias entre

tratamientos. Las hipótesis correspondientes a todas las comparaciones constituyen una
familia y por lo tanto el error es familiar. Los supuestos para la realización de esta prueba son:
Hipótesis:
H0: µi = µj ∀i≠j
H1: µi ≠ µj
Amplitud Límite Significativa de Tukey:

ALS(T) = AES(T) sd
donde:
- AES(T) es la amplitud estudiantizada significativa de Tukey, obtenida desde la tabla de
Tukey con α = nivel de significación, p = número de tratamientos del experimento y los
grados de libertad del error experimental.

CME
- sd = es la desviación estándar de la diferencia de las medias muestrales de dos
r
tratamientos para la prueba de Tukey cuando los tratamientos tienen el mismo número de
repeticiones.
Si los tratamientos no están igualmente repetidos, entonces la desviación estándar puede

calcularse por:
CME  1 1 
sd =  + 
2  ri rj 
Sin embargo, esta aproximación hace que la prueba sea ligeramente conservadora (esto es,
disminuye la probabilidad de detectar diferencias significativas) ya que el nivel de
significación real es ligeramente menor que el establecido en la prueba.
Regla de Decisión:
La hipótesis nula se rechaza con un nivel de significación α si Yi• − Y j • > ALS(T).
Ejemplo 1 (Cont.): Aplique la prueba de Tukey para evaluar la significancia de las

diferencias entre los tratamientos.
En este caso se están evaluando un conjunto de hipótesis:
H0: µA = µB H0: µA = µC H0: µA = µD
H1: µA ≠ µB H1: µA ≠ µC H1: µA ≠ µD
H0: µB = µC H0: µB = µD H0: µC = µD
H1: µB ≠ µC H1: µB ≠ µD H1: µC ≠ µD
El valor de tabla con α = 5%, p = 4 tratamientos y 18 grados de libertad para el error
experimental es AES(T) = 4.00. Dado que los tratamientos tienen diferentes números de
repeticiones, la desviación estándar para la diferencia de dos medias será diferente
dependiendo de los tratamientos que se estén comparando. En el siguiente cuadro se
resumen los cálculos necesarios para efectuar las 6 comparaciones:
Tratamientos Número de CME  1 1 

 +  ALS(T) Yi• − Y j • Significancia
comparados repeticiones 2  ri rj 
AyB 6y6 0.1675 0.6540 0.15 n.s.
AyC 6y5 0.1715 0.6859 0.35 n.s.
AyD 6y5 0.1715 0.6859 1.01 *
ByC 6y5 0.1715 0.6859 0.50 n.s.
ByD 6y5 0.1715 0.6859 1.16 *
CyD 5y5 0.1791 0.7164 0.66 n.s

“n.s.” significa que la diferencia entre ambos tratamientos no es significativa (es decir, que no
existe evidencia suficiente para rechazar H0). “*” significa que la diferencia entre ambos
tratamientos sí es significativa. Es usual utilizar el símbolo “*” para denotar diferencias o
efectos significativos con α = 5% y “**” para denotar diferencias o efectos significativos con
α = 1%. En el primer caso se dice que la diferencia o efecto es “significativo” y en el segundo
que es “altamente significativo”. Esta simbología es muy útil para presentar los resultados de
pruebas múltiples en las que se evalúan un gran número de hipótesis. Otra representación
resumida y bastante útil es la del diagrama de líneas. El método consiste en ordenar las
medias de los tratamientos en forma ascendente o descendente y unir con una línea todos los
tratamientos que no presentan diferencias significativas. En el ejemplo, el diagrama de líneas
sería el siguiente:
D C A B
9.84 10.50 10.85 11.00
3.5. Prueba de Dunnett
La prueba de Dunnett es utilizada cuando se quiere comparar a cada uno de los tratamientos
contra el tratamiento testigo o control. En esta prueba, el error también es familiar. Los
supuestos para la realización de esta prueba son:
Hipótesis:
H0: µT = µi ∀ i ≠ T (tratamiento testigo)
H1: µT ≠ µi
Amplitud Límite Significativa de Dunnett:

ALS(Dn) = t(Dn) sd
donde:
- t(Dn) es el valor de tabla para la prueba, obtenido desde la tabla de Dunnett con α = nivel
de significación, p = número de tratamientos del experimento sin incluir el control y los
grados de libertad del error experimental.
2CME
- sd = es la desviación estándar de la diferencia de las medias muestrales del
r
tratamiento testigo y el tratamiento i para la prueba de Dunnett cuando los tratamientos
tienen el mismo número de repeticiones.
Si los tratamientos no están igualmente repetidos, entonces la desviación estándar puede
calcularse por:

 1 1
sd = CME  + 
 rT ri 
Regla de Decisión:
La hipótesis nula se rechaza con un nivel de significación α si YT • − Yi • > ALS(Dn).
Ejemplo 1 (Cont.): Aplique la prueba de Dunnett para evaluar la significancia de las

diferencias de los tratamientos con el tratamiento testigo.
H0: µD = µA H0: µD = µB H0: µD = µC
H1: µD ≠ µA H1: µD ≠ µB H1: µD ≠ µC
El valor de tabla con α = 5%, p = 3 tratamientos sin considerar el control y 18 grados de
libertad para el error experimental es t(Dn) = 2.56. Dado que los tratamientos tienen
diferente número de repeticiones, la desviación estándar para la diferencia de dos medias
será diferente dependiendo de los tratamientos que se estén comparando. En el siguiente
cuadro se resumen los cálculos necesarios para efectuar las 3 comparaciones:
Tratamientos Número de  1 1
CME  +  ALS(Dn) YT • − Yi• Significancia
comparados repeticiones  rT ri 
DyA 5y6 0.2425 0.6208 1.01 *
DyB 5y6 0.2425 0.6208 1.16 *
DyC 5y5 0.2533 0.6484 0.66 *
En este caso, en los tres tratamientos (A, B y C) se obtienen diferencias significativas con
respecto al tratamiento testigo.
4. Prueba de Kruskal Wallis
La prueba de Kruskal Wallis es la alternativa no paramétrica para el diseño completamente al

azar. Para la aplicación de una prueba paramétrica, se requiere del cumplimiento de ciertos
supuestos sobre los parámetros de las poblaciones desde las cuales se obtienen los datos,
como por ejemplo la normalidad de los errores. En una prueba no paramétrica en cambio, no
son necesarios estos supuestos.
4.1. Datos
Los datos consisten de k muestras independientes (correspondientes a los k tratamientos) de

tamaños ni (i = 1, ... k). Sea N que denota el total de observaciones:
k
N = ∑ ni
i =1

Asigne el rango 1 a la observación más pequeña, 2 a la segunda y así sucesivamente hasta la

más grande de las N observaciones, la cual recibirá el rango N. En caso de empates utilice la
media de los rangos correspondientes. Sea R(Xij) el rango asignado a la observación Xij y sea
Ri la suma de los rangos asignados a la muestra i:
ni
Ri = ∑ R( X ij )
i =1
Calcule Ri para cada muestra.
4.2. Supuestos
1. Las k muestras son seleccionadas aleatoriamente desde sus respectivas poblaciones, lo

cual implica independencia entre los datos dentro de cada muestra.
2. Las muestras son independientes.
3. La escala de medida es al menos ordinal.
4. Las k poblaciones tienen distribuciones de probabilidad idénticas a no ser que algunas
tiendan a generar valores mayores o menores que las otras.
4.3. Procedimiento de Prueba
Hipótesis:
H0: Las k muestras provienen de poblaciones idénticas.

H1: Las k muestras no provienen de poblaciones idénticas.
Debido a que esta prueba está diseñada para encontrar diferencias entre las medias de las
poblaciones, las hipótesis algunas veces (cuando la variable sea cuantitativa) pueden
definirse como sigue:
H0: Las k poblaciones tienen la misma media.
H1: Las k poblaciones no tienen la misma media.
1  k Ri2 N ( N + 1) 2 
T= ∑ − 
S 2  i =1 ni 4 
donde:
1  N ( N + 1) 2 
S2 = ∑ −
2
R ( X ij ) 
N − 1  ij 4 
Si no hay empates, S 2 se simplifica a:
N ( N + 1)
S2 =
12

y el estadístico de prueba se reduce a:
12 k
Ri2
T= ∑ − 3( N + 1)
N ( N + 1) i =1 ni
Si el número de empates es moderado, la diferencia entre ambas expresiones de T será

pequeña.
Regla de Decisión:
La hipótesis nula se rechaza con un nivel de significación α si T resulta mayor que el valor de
tabla χ2(1-α, k-1).
Ejemplo 3: Para evaluar el efecto de la expectativa sobre la percepción de la calidad en

vinos, un investigador asignó aleatoriamente 24 bebedores aficionados a tres grupos A, B y
C, de 8 individuos cada uno. Cada individuo fue citado para una entrevista individual.
Desafortunadamente, uno de los individuos del grupo B y dos del grupo C no se
presentaron por lo que el investigador tuvo que trabajar con muestras de distinto tamaño. A
los individuos que sí se presentaron se les pidió que prueben una copa de vino y que la
evalúen en una escala de 10 puntos donde 1 era el calificativo menor y 10 el mayor. En
realidad, los tres grupos probaron el mismo vino; la única diferencia está en la presentación
de la muestra, la cual es diseñada para inducir a una alta expectativa sobre la calidad del
vino en los miembros del grupo A, una baja expectativa en los miembros del grupo C y una
expectativa neutral en los del grupo B. La siguiente tabla muestra los calificativos
asignados por los 21 individuos:
Grupo A 6 7 7 8 8 9 9 9
Grupo B 4 5 5 6 8 8 7
Grupo C 3 4 5 5 8 6
7
Calificativo
A B C
Grupo
H0: La presentación del vino no influye en la percepción de su calidad.

H1: La presentación del vino sí influye en la percepción de su calidad.

La asignación de los rangos a las observaciones, de menor a mayor (desde 1 a 21), se

presenta en el siguiente cuadro:
Grupo A 9 12 12 16 16 20 20 20 R1 = 125
Grupo B 2.5 5.5 5.5 9 16 16 12 R2 = 66.5
Grupo C 1 2.5 5.5 5.5 16 9 R3 = 39.5
Note que en este caso hay varios empates por lo que los cálculos serán los siguientes:
∑ R( X
ij
ij ) 2 = 92 + 122 + … + 92 = 3289.5
1  ( N + 1) 2  1  21(21 + 1) 2 
S2 = ∑ − −  = 37.425
2
R ( X ij ) N  =  3289.5
N − 1  ij 4  21 − 1  4 
1  k Ri2 N ( N + 1) 2  1  1252 66.52 39.52 21(21 + 1) 2 

T= ∑ −  =  + + −  = 8.12
S 2  i =1 ni 4  37.425  8 7 6 4 
De haber pocos empates, el cálculo se simplificaría a:
N ( N + 1) 21(21 + 1) 2
S2 = = = 38.5
12 12
12 k
Ri2 12  1252 66.52 39.52 
T= ∑
N ( N + 1) i =1 ni
− 3( N + 1) = 
21(21 + 1)  8
+
7
+
6 
 − 3(21 + 1) = 7.89
El valor de tabla para un nivel de significación del 5% es χ2(0.95, 2) = 5.991. Como el

estadístico de prueba resulta mayor que el valor de tabla se rechaza H0 y se concluye que
existe suficiente evidencia estadística para aceptar que la presentación del vino influye en la
percepción sobre su calidad.
4.4. Comparaciones Múltiples
Si la hipótesis nula es rechazada, la prueba de Kruskal Wallis presenta un procedimiento para

comparar a los tratamientos por pares. Se dirá que los tratamientos i y j difieren
significativamente si satisfacen la siguiente desigualdad:
Ri R j  N −1− T  1 1 
− > t(1−α / 2, N − k )  S 2   + 
ni n j  N −k   ni n j 
Ejemplo 3 (Cont.): Con los datos del ejemplo se tiene:

t(1−α / 2, N − k ) = t(0.975,18) = 2.101

Tratamientos Número de Ri R j
−  N −1− T  1 1 
comparados repeticiones
t(1−α / 2, N − k )  S 2   +  Sig.
ni n j  N −k   ni n j 
AyB 8y7 6.13 5.40 *
AyC 8y6 9.04 5.64 *
ByC 7y6 2.92 5.81 ns
Las diferencias encontradas entre los grupos A y B así como las encontradas entre A y C
resultan significativas, no así la diferencia entre los grupos B y C.

Anexo: Salida de Minitab

Ejemplo 1
Normal Probability Plot
.999
.99
.95
Probability
.80
.50
.20
.05
.01
.001
-0.5 0.0 0.5

RESI1
Average: 0 Anderson-Darling Normality Test
StDev: 0.370778 A-Squared: 0.253
N: 22 P-Value: 0.701
Test for Equal Variances

Response Y
Factors Trat
ConfLvl 95.0000
Bartlett's Test (normal distribution)
Test Statistic: 0.605

P-Value : 0.895
One-way ANOVA: Resp versus Trat

Analysis of Variance for Resp
Source DF SS MS F P
Trat 3 4.266 1.422 8.87 0.001
Error 18 2.887 0.160
Total 21 7.153
Individual 95% CIs For Mean

Based on Pooled StDev
Level N Mean StDev ---+---------+---------+---------+---
A 6 10.850 0.404 (-----*-----)
B 6 11.000 0.316 (----*-----)
C 5 10.500 0.436 (-----*-----)
D 5 9.840 0.451 (-----*-----)
---+---------+---------+---------+---
Pooled StDev = 0.400 9.60 10.20 10.80 11.40

Dunnett's comparisons with a control
Family error rate = 0.0500

Individual error rate = 0.0199
Critical value = 2.56
Control = level (D) of Trat
Intervals for treatment mean minus control mean
Level Lower Center Upper ----------+---------+---------+-------

A 0.3902 1.0100 1.6298 (-----------*------------)
B 0.5402 1.1600 1.7798 (-----------*------------)
C 0.0127 0.6600 1.3073 (------------*------------)
----------+---------+---------+-------
0.50 1.00 1.50
Tukey's pairwise comparisons

Intervals for (column level mean) - (row level mean)
A B C
B -0.8040
0.5040
C -0.3359 -0.1859
1.0359 1.1859
D 0.3241 0.4741 -0.0564

1.6959 1.8459 1.3764
Fisher's pairwise comparisons

A B C
B -0.6358
0.3358
C -0.1595 -0.0095
0.8595 1.0095
D 0.5005 0.6505 0.1278

1.5195 1.6695 1.1922

Ejemplo 2
Normal Probability Plot
.999
.99
.95
Probability
.80
.50
.20
.05
.01
.001
-5 0 5
RESI1
Average: 0 Anderson-Darling Normality Test
StDev: 2.92973 A-Squared: 0.211
N: 16 P-Value: 0.827
Test for Equal Variances
Response Y
Factors T
ConfLvl 95.0000
Bartlett's Test (normal distribution)
Test Statistic: 1.516

P-Value : 0.679
One-way ANOVA: Y versus T
Analysis of Variance for Y

Source DF SS MS F P
T 3 773.2 257.7 24.02 0.000
Error 12 128.8 10.7
Total 15 901.9
Individual 95% CIs For Mean

Based on Pooled StDev
Level N Mean StDev -------+---------+---------+---------
1 4 24.000 4.546 (----*----)
2 4 17.750 2.986 (----*----)
3 4 10.000 2.944 (----*----)
4 4 6.000 2.160 (-----*----)
-------+---------+---------+---------
Pooled StDev = 3.276 7.0 14.0 21.0

Dunnett's comparisons with a control

Control = level (4) of T
Intervals for treatment mean minus control mean
Level Lower Center Upper ----+---------+---------+---------+---

1 11.786 18.000 24.214 (--------*--------)
2 5.536 11.750 17.964 (--------*--------)
3 -2.214 4.000 10.214 (--------*--------)
----+---------+---------+---------+---
0.0 7.0 14.0 21.0
Tukey's pairwise comparisons

1 2 3
2 -0.629
13.129
3 7.121 0.871
20.879 14.629
4 11.121 4.871 -2.879

24.879 18.629 10.879
Fisher's pairwise comparisons

1 2 3
2 1.203
11.297
3 8.953 2.703
19.047 12.797
4 12.953 6.703 -1.047

23.047 16.797 9.047

Ejemplo 3
Kruskal-Wallis Test
Kruskal-Wallis Test on Resp
Grupo N Median Ave Rank Z

A 8 8.000 15.6 2.68
B 7 6.000 9.5 -0.78
C 6 5.000 6.6 -2.06
Overall 21 11.0
H = 7.89 DF = 2 P = 0.019
H = 8.12 DF = 2 P = 0.017 (adjusted for ties)

Ejercicios
1. Los datos que se presentan a continuación corresponden al tiempo de coagulación (en

segundos) de sangre extraída a 24 animales, asignados aleatoriamente a cuatro dietas
diferentes.
Dieta
A B C D
62 63 68 56
60 67 66 62
63 71 71 60
59 64 67 61
65 68 63
64
a) Presente el modelo aditivo lineal. Interprete cada uno de sus componentes en términos del
problema.
b) Estime los efectos de los tratamientos.
c) Calcule los residuales obtenidos con la dieta B (error experimental).
d) Efectúe la prueba de Anderson – Darling para normalidad.
e) Efectúe la prueba de Bartlett para homogeneidad de variancias.
f) Realice el análisis de variancia. Calcule el coeficiente de variación.
g) Realice la prueba de Tukey. Concluya mediante el diagrama de líneas.
2. En una estación experimental se estudiaron cuatro dosis de insecticidas (3 l/ha, 5 l/ha, 7

l/ha. y 9 l/ha.) para el control de la Racha en papa. Los resultados se presentan a
continuación en TM de rendimiento de papa por ha:
Dosis de insecticida
3 l/ha 5 l/ha 7 l/ha 9 l/ha
4.29 8.50 10.75 5.63
4.24 8.03 11.52 5.96
4.53 7.94 11.49 5.47
4.26 6.75 11.52 6.01
4.62 7.16 10.81 6.09
a) Presente el modelo aditivo lineal e interprete cada uno se sus componentes en términos del
problema.
c) Efectúe la prueba de Anderson – Darling para normalidad.
d) Efectúe la prueba de Bartlett para homogeneidad de variancias.
e) Realice el análisis de variancia. Calcule el coeficiente de variación.
f) Realice la prueba de Tukey. Concluya mediante el diagrama de líneas.

g) Antes de realizar el experimento, el experimentador sostenía que con la dosis 2 (5 l/ha) se

podía obtener un rendimiento medio superior en más de 2 Tm/ha al de la dosis 1 (3 l/ha).
A que conclusión puede llegar con la información del experimento.
3. Se realizó un estudio para evaluar el efecto de tres fármacos en la duración de la relajación

muscular inducida. En el experimento 24 pacientes fueron aleatoriamente asignados a los
cuatro grupos, cinco pacientes a los dos primeros grupos y 7 a los dos últimos. Un grupo
no recibió fármaco alguno, uno recibió Innovar, uno Droperidol y uno Fentayl antes de la
aplicación de anestesia. Para cada paciente la duración de la relajación muscular fue
registrada en minutos. Los resultados del experimento son dados a continuación:
Fármaco
Sin droga Innovar Droperidol Fentayl
5.9 16.1 10.3 7.2
8.0 11.2 6.8 10.5
11.5 9.0 5.3 8.5
6.0 8.8 3.2 4.2
9.2 10.2 6.5 6.5
7.0 6.6
7.5 9.1
a) Presente el modelo aditivo lineal. Interprete cada uno de sus componentes en términos del
problema.
c) Calcule los residuales obtenidos con la droga Innovar.
d) Efectúe la prueba de Anderson – Darling para normalidad.
e) Efectúe la prueba de Bartlett para homogeneidad de variancias.
f) Realice el análisis de variancia. Calcule el coeficiente de variación.
g) Realice la prueba de Tukey. Concluya mediante el diagrama de líneas.
h) Realice la prueba de Dunnett. ¿Qué fármaco recomendaría usted?
i) Uno de los objetivos del experimento era comparar los fármacos Droperidol y Fentayl,
razón por la cual se asignaron 7 repeticiones a cada uno. ¿Existe suficiente evidencia
estadística para aceptar que Fentayl es mejor que Droperidol?
4. Se desea comparar los resultados obtenidos en el examen parcial de Métodos Estadísticos

para la Investigación I por las clases de 4 profesores. A continuación se presentan los
resultados de una muestra aleatoria de 8 alumnos de cada clase.
Profesor Nota en el examen parcial

A 10 16 17 13 14 17 18 12
B 16 14 13 7 9 13 11 14
C 9 6 10 8 14 11 12 8
D 13 13 12 16 8 11 7 12
a) ¿Presentan los datos suficiente evidencia estadística para aceptar que las notas en el
examen parcial son diferentes entre los grupos?

b) Realice la prueba de comparación por pares.
5. Cuatro programas de entrenamiento para cierto trabajo fueron probados con 20 empleados
nuevos. Los 20 empleados fueron asignados al mismo supervisor y, al final del periodo de
entrenamiento, el supervisor calificó a los empleados de acuerdo a su habilidad para el
trabajo, asignando los rangos más bajos a aquellos empleados con la menor habilidad.
Programa Rangos
A 4 6 7 2 10
B 1 8 12 3 11
C 20 19 19 14 5
D 18 15 17 13 9
¿Indican estos datos diferencias en la efectividad de los programas de entrenamiento? Si la

respuesta es afirmativa, ¿cuáles son diferentes?


Cap III

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Cap III

Cargado por

Copyright:

Formatos disponibles

Departamento de Estadística e Informática

Curso: Métodos Estadísticos para la Investigación I Diseño Completamente al Azar

Los números redondos son siempre falsos.

Los estadísticos generalmente hacen la pregunta incorrecta, y están dispuestos a responder

Ing. Raúl Eyzaguirre Pérez 24

2. Diseño Completamente al Azar (DCA Clásico o Paramétrico)

2.1. Ventajas y Desventajas del DCA

2.2. Aleatorización y Croquis Experimental

Ing. Raúl Eyzaguirre Pérez 25

Con esta secuencia, el primer tratamiento es asignado a las unidades experimentales 9, 4 y 6,

2.3. Modelo Aditivo Lineal

El modelo aditivo lineal para un diseño completamente al azar es el siguiente:

Ejemplo 1: Se realizó un experimento para evaluar el efecto de la adición de compuestos

Compuesto Vitamínico Aumento de peso tras una semana en lb

Ing. Raúl Eyzaguirre Pérez 26

2.4. Supuestos del Modelo Estadístico

El modelo estadístico debe cumplir con los siguientes supuestos:

2.5. Estimación de los Efectos

La aplicación de este método da los siguientes resultados para la estimación de los

τˆi = Yi• − Y••

εˆij = Yij − Yi•

Ing. Raúl Eyzaguirre Pérez 27

τˆ1 = Y1• − Y•• = 10.850 − 10.582 = 0.268

τˆ2 = Y2• − Y•• = 11.000 − 10.582 = 0.418

τˆ3 = Y3• − Y•• = 10.500 − 10.582 = −0.082

τˆ4 = Y4• − Y•• = 9.840 − 10.582 = −0.742

El efecto estimado del error ε42:

εˆ42 = Y42 − Y4• = 9.8 − 9.840 = −0.04

2.6. Prueba de Anderson – Darling para Normalidad

La prueba de Anderson-Darling, al igual que la prueba chi-cuadrado para bondad de ajuste

donde n es el número de observaciones, F(Y) es la distribución de probabilidades acumulada

Ing. Raúl Eyzaguirre Pérez 28

α 0.1 0.05 0.025 0.01

Compuesto Vitamínico Residuales

La media de los residuales es 0 y la desviación estándar es 0.3708. Con estos valores, el

i (2i-1) Yi Yn+1-i F(Yi) F(Yn+1-i) ln(F(Yi)) ln(F(Yn+1-i)) Si

Sumando los valores de la última columna se tiene que S = -22.253 y entonces:

A2 = −22 + 22.253 = 0.2532

2.7. Prueba de Bartlett para Homogeneidad de Variancias

Ing. Raúl Eyzaguirre Pérez 30

s12 = 0.163 s22 = 0.1 s32 = 0.19 s42 = 0.203 s 2p = 0.1610

El valor de tabla es χ (0.95,

acepta H0. Por lo tanto se acepta el supuesto de homogeneidad de variancias.

2.8. Análisis de Variancia

En este modelo la variabilidad total se descompone en dos fuentes de variación, la explicada

La variabilidad explicada por los tratamientos (o suma de cuadrados de los tratamientos) se

o por diferencia desde la relación SC(Total) = SC(Tratamientos) + SC(Error), con lo que se

Ing. Raúl Eyzaguirre Pérez 31

Fuentes de Grados de Sumas de Cuadrados

Valores Esperados de los Cuadrados Medios:

Ing. Raúl Eyzaguirre Pérez 32

Grados de Valor Esperado de los Cuadrados Medios

Error Experimental t(r – 1) σ2 σ2

Ejemplo 1 (Cont.): A continuación se presenta el análisis de variancia y la prueba de

65.12 662 52.52 49.22 232.82

Ing. Raúl Eyzaguirre Pérez 33

El nivel de significación usual y aceptado en investigación científica para considerar que un

Ing. Raúl Eyzaguirre Pérez 34

2.9. Coeficiente de Variación

Con los datos del ejemplo, el coeficiente de variación será:

Ejemplo 2: Se desarrolló un experimento para evaluar 4 tratamientos para la preparación

Ing. Raúl Eyzaguirre Pérez 35

3. Pruebas de Comparación de Medias de Tratamientos