Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Cap III
Cap III
Capítulo III
Diseño Completamente al Azar
1. Introducción
El diseño completamente al azar (DCA) es el más simple de todos los diseños. Es un diseño
en el cual los tratamientos son asignados aleatoriamente a las unidades experimentales sin
ningún tipo de restricción. Este diseño es utilizado cuando las unidades experimentales son
bastante homogéneas, es decir, cuando la variabilidad entre ellas es pequeña y no existe
ningún criterio de bloqueo que permita disminuirla. Dado que los tratamientos constituyen el
único criterio de clasificación para las unidades experimentales, a este diseño se le conoce
también como diseño de clasificación de una vía (One Way).
En este capítulo se verán los casos paramétrico y no paramétrico del DCA, el análisis de la
variancia y las pruebas de comparación de medias de tratamientos.
Ventajas:
- Es un diseño flexible en tanto que el número de tratamientos y de repeticiones solo está
limitado por el número de unidades experimentales.
- El número de repeticiones puede variar entre tratamientos aunque generalmente lo ideal es
tener un número igual para cada tratamiento.
- El análisis estadístico es simple.
- El número de grados de libertad para estimar el error experimental es máximo. Esto
mejora la precisión del experimento.
Desventajas:
- Solo es aplicable en situaciones en las que el material experimental es homogéneo.
- Dado que no hay restricciones de aleatoriedad toda la variabilidad existente en las
unidades experimentales tratadas con el mismo tratamiento estará incluida en el error
experimental.
Como ya se mencionó, en este diseño no existe ninguna restricción de aleatoriedad por lo que
la asignación de los tratamientos a las unidades experimentales será completamente aleatoria
(Esto quiere decir que cualquier distribución de los tratamientos en las unidades
experimentales es igualmente probable). Para lograr la asignación aleatoria de los
tratamientos se puede utilizar cualquier método de generación de números aleatorios como
una tabla de números al azar, un modelo de urnas o un sistema de cómputo (aunque los
números generados por calculadoras y computadoras no son estrictamente aleatorios sino solo
pseudoaleatorios, son aceptables).
Por ejemplo, suponga que va a evaluar 4 tratamientos con 3 repeticiones cada uno; en este
caso necesitará de 12 unidades experimentales. Para asignar los tratamientos completamente
al azar a las unidades experimentales, genere primero un orden aleatorio para los primeros 12
números naturales. Para ello podría por ejemplo utilizar 12 papeles idénticos, numerarlos del
1 al 12, colocarlos en una urna y luego sacarlos uno a uno anotando el orden en el cual son
seleccionados. Otra alternativa sería generar 12 números aleatorios usando la computadora o
una tabla de números aleatorios y luego asignarle a cada uno un número de orden desde el 1
hasta el 12 (de menor a mayor). A continuación se presenta una secuencia de 12 números
aleatorios obtenidos utilizando la función ALEATORIO() de Excel con su respectivo número
de orden:
.755 .442 .582 .601 .479 .994 .306 .416 .435 .836 .743 .902
9 4 6 7 5 12 1 2 3 10 8 11
T3 T3 T3 T1 T2 T1 T2 T4 T1 T4 T4 T2
donde:
Yij es el valor o rendimiento observado en el i-ésimo tratamiento, j-ésima repetición.
µ es el efecto de la media general.
τi es el efecto del i-ésimo tratamiento.
εij es el efecto del error experimental en el i-ésimo tratamiento, j-ésima repetición.
t es el número de tratamientos.
ri es el número de repeticiones para el i-ésimo tratamiento.
Este experimento fue conducido bajo los lineamientos de un DCA, por lo que el modelo
aditivo lineal es el siguiente:
Yij = µ + τ i + ε ij i = 1,..., t j = 1,...ri
donde:
- Yij es la ganancia de peso obtenida en el j-ésimo cerdo alimentado con el i-ésimo
compuesto vitamínico.
- µ es el efecto de la media general de las ganancias de peso.
- τi es el efecto del i-ésimo compuesto vitamínico.
- εij es el efecto del error experimental con el j-ésimo cerdo alimentado con el i-ésimo
compuesto vitamínico.
- t = 4 (Número de tratamientos)
- r1 = 6, r2 = 6, r3 = 5 y r4 = 5 (Número de repeticiones por tratamiento).
Los efectos del modelo son estimados por el método de Mínimos Cuadrados. Este método
permite obtener los valores de µ y τi que minimizan la suma de los errores al cuadrado, es
decir, que minimizan la siguiente expresión:
t ri t ri
Q = ∑∑ ε ij2 = ∑∑ (Yij − µ − τ i ) 2
i =1 j =i i =1 j =i
Para calcular los valores de µ y τi que minimizan la suma de los errores al cuadrado, se debe
solucionar el sistema de ecuaciones obtenido al igualar las derivadas parciales de Q con
respecto a µ y cada uno de los τi a cero, y la siguiente restricción adicional:
t
∑rτ
i =1
i i =0
µ̂ = Y••
Ejemplo 1 (Cont.): Con los datos del ejemplo anterior, la media estimada es:
µˆ = 10.582
Los efectos estimados de los tratamientos:
Hipótesis:
H0: La variable sigue una distribución Normal (µ, σ2)
H1: La variable no sigue una distribución Normal (µ, σ2)
Estadístico de Prueba:
El estadístico de prueba, A2, está dado por:
A2 = − n − S
1 n
S= ∑ ( 2i − 1) ln F (Yi ) + ln (1 − F (Yn+1−i ) )
n i =1
Regla de decisión:
La hipótesis nula se rechaza con un nivel de significación α sí A2 es mayor que el valor crítico
A2crit. Aunque la prueba de Anderson-Darling puede ser aplicada a cualquier distribución, no
se dispone de tablas para todos los casos. A continuación se presenta una tabla para la prueba
a la distribución normal.
Ejemplo 1 (Cont.):
H0: Los errores siguen una distribución Normal (0, σ2)
H1: Los errores no siguen una distribución Normal (0, σ2)
A continuación se presentan los residuales obtenidos con los datos del ejemplo:
Este valor es menor inclusive al valor crítico correspondiente a α = 0.1. Por lo tanto se
acepta el supuesto de normalidad de los errores.
Esta prueba se utiliza para evaluar si existe homogeneidad de variancias entre k (2 ó más)
poblaciones (en el caso de un diseño experimental, las poblaciones corresponderán a los
tratamientos). Los supuestos para la aplicación de esta prueba son que las poblaciones tienen
distribuciones normales e independientes, y que las muestras son tomadas al azar.
Hipótesis:
H0: σ 12 = σ 22 = … = σ k2 = σ 2
H1: Al menos un σ i2 es diferente.
Estadístico de Prueba:
El estadístico de prueba tiene una distribución Chi-Cuadrado con k-1 grados de libertad y se
define de la siguiente manera:
k k
∑ i ( r − 1) Ln s 2
p − ∑ ( (ri − 1) Ln si2 )
Q = i =1 i =1
∼ χ (k2 -1)
1 k
1 1
1+ ∑ − k
3(k − 1) i =1 ri − 1
∑ (ri − 1)
i =1
donde k es el número de poblaciones (tratamientos), ri es el tamaño de muestra para cada
población, si2 es la variancia muestral para la población i y s 2p es la variancia muestral
ponderada para las k muestras. Estas dos últimas cantidades son calculadas por las siguientes
fórmulas:
k
ri
(Yij − Yi• ) 2 ∑ (r − 1)s
i
2
i
si2 = ∑ s 2p = i =i
ri − 1 k
j =i
∑ (r − 1)
i =i
i
Regla de decisión:
La hipótesis nula se rechaza con un nivel de significación α sí Q resulta mayor que el valor de
tabla χ 2[1-α, k -1].
Ejemplo 1 (Cont.):
H0: σ 12 = σ 22 = σ 32 = σ 42
H1: Al menos un σ i2 es diferente.
Q = 0.605 ∼ χ (3)
2
Y•2•
A la expresión se le conoce como el término de corrección (TC).
r•
Yi•2 t
SC(Tratamientos) = ∑ − TC
i =1 ri
Por último, la variabilidad explicada por el error puede ser calculada por la siguiente
expresión:
t ri t
Yi•2
SC(Error) = ∑∑ Yij2 − ∑
i =1 j =1 i =1 ri
Estas dos fuentes de variación (tratamientos y error) son comparadas mediante el siguiente
procedimiento de prueba de hipótesis a partir del cuadro de análisis de variancia (Cuadro
ANVA):
Cuadro ANVA
Total r• - 1 ∑∑ Y
i =1 j =1
2
ij − TC
Hipótesis:
Para el Modelo I (Efectos fijos) las hipótesis son, en términos de los efectos de los
tratamientos las siguientes:
H0: τi = 0 ∀ i
H1: τi ≠ 0 para al menos algún i
En términos de las medias de los tratamientos:
H0: µi = µ ∀ i
H1: µi ≠ µ para al menos algún i
Para el Modelo II (Efectos aleatorios) las hipótesis serán planteadas en términos de la
variancia de los tratamientos:
H0: σ τ2 = 0
H1: σ τ2 > 0
En cualquiera de los casos, la hipótesis nula implica que los tratamientos no afectan a la
variable respuesta, o lo que es lo mismo, que con todos los tratamientos se obtienen los
mismos resultados.
Total tr - 1
Estadístico de Prueba:
CM(Trat)
Fc = ∼ F( gl(Trat ),gl(Error) )
CM(Error)
Regla de Decisión:
La hipótesis nula se rechaza con un nivel de significación α si el Fc resulta mayor que el valor
de tabla F(1−α , gl(Trat ),gl(Error) ) .
22
t
Yi•2
SC(Tratamientos) = ∑ − TC
i =1 ri
Cuadro ANVA
Fuentes de Variación gl SC CM Fc
Tratamientos 3 4.2657 1.4219 8.87
Error Experimental 18 2.8870 0.1604
Total 21 7.1527
11.5
Ganancia de Peso en lb
11.0
10.5
10.0
9.5
9.0
A B C D
Tratamientos
Asumiendo un modelo de efectos fijos, las hipótesis en términos de los efectos de los
tratamientos son:
H0: τi = 0 i = 1, ..., 4
H1: τi ≠ 0 para al menos algún i
En términos de las medias de los tratamientos:
H0: µi = µ i = 1, ..., 4
H1: µi ≠ µ para al menos algún i
o literalmente:
H0: Todos los compuestos vitamínicos tienen el mismo efecto en la ganancia de peso de los
cerdos.
H1: Con al menos uno de los compuestos vitamínicos se obtiene una ganancia de peso
diferente.
El estadístico de prueba es Fc = 8.87. El valor de tabla para un nivel de significación del
5% es F(0.95, 3,18 ) = 3.19. Dado que el estadístico de prueba resulta mayor que el valor de
tabla se rechaza H0. En conclusión, existe suficiente evidencia estadística para aceptar que
con al menos uno de los compuestos vitamínicos se obtienen ganancias de peso diferentes
en los cerdos.
Es una medida usada por los experimentadores para evaluar el grado de homogeneidad de los
resultados de un experimento. Para saber si un determinado coeficiente de variación es
demasiado grande o pequeño, es preciso tener experiencia con datos similares.
En el DCA, el cuadrado medio del error (CME) es el estimador de la variancia del
experimento σ 2 y el coeficiente de variación es calculado por la siguiente expresión:
CME
cv =
Y••
0.1604
cv = = 3.78%
10.58
Tratamiento
Repetición T1 T2 T3 T4
1 25 15 12 4
2 18 22 7 6
3 29 17 8 5
4 24 17 13 9
Este experimento fue conducido bajo los lineamientos de un DCA, por lo que el modelo
aditivo lineal es el siguiente:
Yij = µ + τ i + ε ij i = 1,..., t j = 1,...r
donde:
- Yij es el tamaño de los plantones a los 30 días obtenido con el i-ésimo método de
preparación del terreno y en la j-ésima repetición.
- µ es el efecto de la media general de los tamaños de los plantones.
- τi es el efecto del i-ésimo método de preparación del terreno.
- εij es el efecto del error experimental con el i-ésimo método de preparación del terreno y
en la j-ésima repetición.
- t = 4 (Número de tratamientos)
- r = 4 (Número de repeticiones por tratamiento).
En este problema los resultados obtenidos en las pruebas de Anderson-Darling y de
Bartlett son satisfactorios y por lo tanto se aceptan los supuestos de normalidad y
homogeneidad de variancias (ver anexo al final del capítulo). El cuadro de análisis de
variancia se presenta a continuación:
Cuadro ANVA
Fuente de Variación gl SC CM Fc
Tratamientos 3 773.2 257.7 24.02
Error 12 128.8 10.7
Total 15 901.9
H0: µi = µ i = 1, ..., 4
H1: µi ≠ µ para al menos algún i
Como F = 24.02 > F[0.95, 3, 12] =3.49, entonces se rechaza H0 y se concluye que existe
suficiente evidencia estadística con un nivel de significación del 5% para aceptar que con
al menos uno de los tratamientos para la preparación del terreno se obtienen resultados
diferentes en el tamaño de los plantones. El coeficiente de variación en este problema es:
10.73
cv = = 22.68%
14.44
Debido a que se están efectuando varias pruebas de hipótesis simultáneamente y no solo una,
un problema a tener en cuenta es el de la definición del nivel de significación. Por ejemplo,
suponga que usted hace un experimento con 5 tratamientos entre los cuales realmente no
existen diferencias. En este caso la hipótesis nula de no diferencias sería verdadera para todas
las comparaciones, aunque de hecho por cuestiones de azar usted obtendría resultados
ligeramente diferentes en su experimento. Si usted realizara una prueba para comparar dos de
estos tratamientos a un nivel de significación del 5%, y repitiera esta misma prueba con
diferentes datos varias veces, encontraría diferencias significativas en aproximadamente el 5%
de las veces; pero ¿qué pasa si usted decide comparar los dos tratamientos en los que se
obtuvieron los resultados más similares?, ¿qué pasa si usted decide comparar los dos
tratamientos en los que se obtuvieron los resultados más extremos? En el primer caso la
probabilidad de encontrar diferencias significativas va a ser menor a 5% y en el segundo caso
mayor. Por esta razón, algunas de las pruebas que se verán más adelante deben ser planeadas
con anterioridad a la ejecución del experimento y no sugeridas por los resultados obtenidos.
Por último, otro factor a considerar es el número de comparaciones que se están efectuando.
En el caso descrito anteriormente, con un total de cinco tratamientos, usted efectuará 10
pruebas. Cada una de esas pruebas tendrá una probabilidad de 5% de resultar en diferencias
significativas, pero ¿cuál es la probabilidad de que al menos una de las 10 comparaciones
resulte significativa?. Dado que realmente no existen diferencias entre los 5 tratamientos,
bastará que se encuentren diferencias significativas en una de las 10 comparaciones para
cometer un error. Obviamente, la probabilidad de errar en al menos una de las 10
comparaciones será mayor al 5%. Esta característica lleva a la necesidad de definir el nivel de
significación en dos formas. Al total de comparaciones por pares que se puedan plantear entre
todos los tratamientos considerados en un experimento se le llamará una “familia de
comparaciones”, y entonces al nivel de significación para una comparación se le llamará
“error individual” y al nivel de significación para el total de comparaciones (probabilidad de
encontrar diferencias significativas en al menos una de las comparaciones) “error por
familia”. Las pruebas en las que el nivel de significación sea individual servirán para efectuar
comparaciones individuales planeadas con anterioridad; las pruebas en las que el nivel de
significación sea por familia servirán para efectuar todas las comparaciones posibles
(comparaciones múltiples).
3.1. Prueba t
Hipótesis:
Caso A: Caso B: Caso C:
H0: µi - µj = k H0: µi - µj = k H0: µi - µj = k
H1: µi - µj > k H1: µi - µj < k H1: µi - µj ≠ k
Estadístico de Prueba:
(Yi• − Y j • ) − k
tc = ∼ t(gl(Error))
sd
1 1
donde sd = CME + es la desviación estándar de la diferencia de las medias
r r
i j
muestrales de los dos tratamientos. Si todos los tratamientos tienen el mismo número de
repeticiones, el estadístico de prueba se simplifica a:
(Yi• − Y j • ) − k
tc =
2CME
r
Regla de Decisión:
Caso A: La hipótesis nula se rechaza con un nivel de significación α si el tc es mayor que el
valor de tabla t(1-α, gl(Error)).
Caso B: La hipótesis nula se rechaza con un nivel de significación α si el tc es menor que el
valor de tabla t(α, gl(Error)).
Caso C: La hipótesis nula se rechaza con un nivel de significación α si el tc es menor que el
valor de tabla t(α/2, gl(Error)) o mayor que el valor de tabla t(1-α/2, gl(Error)).
Ejemplo 1 (Cont.): Uno de los objetivos del experimento era evaluar si el aumento de
peso logrado con el compuesto vitamínico B superaba al logrado con D en más de una
libra. El procedimiento para esta prueba será el siguiente:
H0: µB - µD = 1
H1: µB - µD > 1
El valor de tabla para un nivel de significación de 5% es t(0.95, 18) = 1.734. Como el valor
calculado es menor al valor de tabla no se rechaza H0. En conclusión, no existe suficiente
evidencia estadística para aceptar que el aumento de peso logrado con el compuesto
vitamínico B supere al logrado con D en más de una libra.
La prueba DLS es una forma abreviada de la prueba t para el caso bilateral (Caso C). La
prueba consiste en calcular una diferencia límite significativa (DLS) de modo que cualquier
diferencia entre las medias de dos tratamientos mayor a dicho límite sea significativa. Los
supuestos para esta prueba son los mismos que para la prueba t y por supuesto, también debe
ser planeada con anterioridad.
Hipótesis:
H0: µi = µj
H1: µi ≠ µj
1 1
donde sd = CME + es la desviación estándar de la diferencia de las medias
r r
i j
Regla de Decisión:
1 1 1 1
DLS = t(0.975, 18) CME + = 2.101 0.1604 + = 0.4858
rA rB 6 6
Y A − YB = 10.85 − 11 = 0.15
t t
L = ∑ ciYi• = ∑ ri ci µi
i =1 i =1
en donde:
t
∑ rci =1
i i =0
∑c i =1
i =0
Por ejemplo, para comparar los tratamientos 1 y 2 en un experimento con igual número de
repeticiones por tratamiento, podría plantearse el siguiente contraste:
L = µ1 − µ 2
∑ rc c
i =1
i 1i 2 i =0
∑c ci =1
1i 2 i =0
Hipótesis:
Caso A: Caso B: Caso C:
H0: L = L0 H0: L = L0 H0: L = L0
H1: L > L0 H1: L < L0 H1: L ≠ L0
Estadístico de Prueba:
Lˆ − L0
tc = ∼ t(gl(Error))
s Lˆ
t t
donde Lˆ = ∑ ci rY
i i • es el contraste estimado y sLˆ = CME ∑ ri ci2 es la desviación estándar
i =1 i =1
del contraste estimado. Si todos los tratamientos tienen el mismo número de repeticiones, el
t
contraste estimado se puede definir por Lˆ = ∑ ciYi• y su desviación estándar será
i =1
ci2t
sLˆ = CME ∑ .
i =1 r
Regla de Decisión:
Caso A: La hipótesis nula se rechaza con un nivel de significación α si el tc es mayor que el
valor de tabla t(1-α, gl(Error)).
Caso B: La hipótesis nula se rechaza con un nivel de significación α si el tc es menor que el
valor de tabla t(α, gl(Error)).
Caso C: La hipótesis nula se rechaza con un nivel de significación α si el tc es menor que el
valor de tabla t(α/2, gl(Error)) o mayor que el valor de tabla t(1-α/2, gl(Error)).
µ1 + µ 2 + µ3
− µ4 > 5
3
es decir, si L es mayor a 15. Luego, las hipótesis serán:
H0: L = 15
H1: L > 15
El cálculo del estadístico de prueba es el siguiente:
L̂ = Y1 + Y2 + Y3 − 3Y4 = 33.75
Lˆ − L0 33.75 − 15
tc = = = 3.305
sLˆ 5.674
El valor de tabla para un nivel de significación de 5% es t(0.95, 12) = 1.782. Como el valor
calculado es mayor al valor de tabla se rechaza H0 y se concluye que existe suficiente
evidencia estadística para aceptar que el tamaño medio de los plantones obtenido en
terreno preparado es superior en más de 5 cm al obtenido en terreno sin preparación.
Hipótesis:
H0: µi = µj ∀i≠j
H1: µi ≠ µj
donde:
- AES(T) es la amplitud estudiantizada significativa de Tukey, obtenida desde la tabla de
Tukey con α = nivel de significación, p = número de tratamientos del experimento y los
grados de libertad del error experimental.
CME
- sd = es la desviación estándar de la diferencia de las medias muestrales de dos
r
tratamientos para la prueba de Tukey cuando los tratamientos tienen el mismo número de
repeticiones.
CME 1 1
sd = +
2 ri rj
Sin embargo, esta aproximación hace que la prueba sea ligeramente conservadora (esto es,
disminuye la probabilidad de detectar diferencias significativas) ya que el nivel de
significación real es ligeramente menor que el establecido en la prueba.
Regla de Decisión:
“n.s.” significa que la diferencia entre ambos tratamientos no es significativa (es decir, que no
existe evidencia suficiente para rechazar H0). “*” significa que la diferencia entre ambos
tratamientos sí es significativa. Es usual utilizar el símbolo “*” para denotar diferencias o
efectos significativos con α = 5% y “**” para denotar diferencias o efectos significativos con
α = 1%. En el primer caso se dice que la diferencia o efecto es “significativo” y en el segundo
que es “altamente significativo”. Esta simbología es muy útil para presentar los resultados de
pruebas múltiples en las que se evalúan un gran número de hipótesis. Otra representación
resumida y bastante útil es la del diagrama de líneas. El método consiste en ordenar las
medias de los tratamientos en forma ascendente o descendente y unir con una línea todos los
tratamientos que no presentan diferencias significativas. En el ejemplo, el diagrama de líneas
sería el siguiente:
D C A B
9.84 10.50 10.85 11.00
La prueba de Dunnett es utilizada cuando se quiere comparar a cada uno de los tratamientos
contra el tratamiento testigo o control. En esta prueba, el error también es familiar. Los
supuestos para la realización de esta prueba son:
- Variancias homogéneas.
- Las muestras son extraídas al azar.
Hipótesis:
H0: µT = µi ∀ i ≠ T (tratamiento testigo)
H1: µT ≠ µi
donde:
- t(Dn) es el valor de tabla para la prueba, obtenido desde la tabla de Dunnett con α = nivel
de significación, p = número de tratamientos del experimento sin incluir el control y los
grados de libertad del error experimental.
2CME
- sd = es la desviación estándar de la diferencia de las medias muestrales del
r
tratamiento testigo y el tratamiento i para la prueba de Dunnett cuando los tratamientos
tienen el mismo número de repeticiones.
Si los tratamientos no están igualmente repetidos, entonces la desviación estándar puede
calcularse por:
1 1
sd = CME +
rT ri
Regla de Decisión:
Tratamientos Número de 1 1
CME + ALS(Dn) YT • − Yi• Significancia
comparados repeticiones rT ri
DyA 5y6 0.2425 0.6208 1.01 *
DyB 5y6 0.2425 0.6208 1.16 *
DyC 5y5 0.2533 0.6484 0.66 *
En este caso, en los tres tratamientos (A, B y C) se obtienen diferencias significativas con
respecto al tratamiento testigo.
4.1. Datos
4.2. Supuestos
Hipótesis:
Estadístico de Prueba:
1 k Ri2 N ( N + 1) 2
T= ∑ −
S 2 i =1 ni 4
donde:
1 N ( N + 1) 2
S2 = ∑ −
2
R ( X ij )
N − 1 ij 4
Si no hay empates, S 2 se simplifica a:
N ( N + 1)
S2 =
12
12 k
Ri2
T= ∑ − 3( N + 1)
N ( N + 1) i =1 ni
Regla de Decisión:
La hipótesis nula se rechaza con un nivel de significación α si T resulta mayor que el valor de
tabla χ2(1-α, k-1).
Grupo A 6 7 7 8 8 9 9 9
Grupo B 4 5 5 6 8 8 7
Grupo C 3 4 5 5 8 6
7
Calificativo
A B C
Grupo
Note que en este caso hay varios empates por lo que los cálculos serán los siguientes:
∑ R( X
ij
ij ) 2 = 92 + 122 + … + 92 = 3289.5
1 ( N + 1) 2 1 21(21 + 1) 2
S2 = ∑ − − = 37.425
2
R ( X ij ) N = 3289.5
N − 1 ij 4 21 − 1 4
N ( N + 1) 21(21 + 1) 2
S2 = = = 38.5
12 12
12 k
Ri2 12 1252 66.52 39.52
T= ∑
N ( N + 1) i =1 ni
− 3( N + 1) =
21(21 + 1) 8
+
7
+
6
− 3(21 + 1) = 7.89
Ri R j N −1− T 1 1
− > t(1−α / 2, N − k ) S 2 +
ni n j N −k ni n j
Tratamientos Número de Ri R j
− N −1− T 1 1
comparados repeticiones
t(1−α / 2, N − k ) S 2 + Sig.
ni n j N −k ni n j
AyB 8y7 6.13 5.40 *
AyC 8y6 9.04 5.64 *
ByC 7y6 2.92 5.81 ns
Las diferencias encontradas entre los grupos A y B así como las encontradas entre A y C
resultan significativas, no así la diferencia entre los grupos B y C.
.999
.99
.95
Probability
.80
.50
.20
.05
.01
.001
A B C
B -0.8040
0.5040
C -0.3359 -0.1859
1.0359 1.1859
A B C
B -0.6358
0.3358
C -0.1595 -0.0095
0.8595 1.0095
Ejemplo 2
.999
.99
.95
Probability
.80
.50
.20
.05
.01
.001
-5 0 5
RESI1
Average: 0 Anderson-Darling Normality Test
StDev: 2.92973 A-Squared: 0.211
N: 16 P-Value: 0.827
Response Y
Factors T
ConfLvl 95.0000
1 2 3
2 -0.629
13.129
3 7.121 0.871
20.879 14.629
1 2 3
2 1.203
11.297
3 8.953 2.703
19.047 12.797
Ejemplo 3
Kruskal-Wallis Test
H = 7.89 DF = 2 P = 0.019
H = 8.12 DF = 2 P = 0.017 (adjusted for ties)
Ejercicios
Dieta
A B C D
62 63 68 56
60 67 66 62
63 71 71 60
59 64 67 61
65 68 63
64
a) Presente el modelo aditivo lineal. Interprete cada uno de sus componentes en términos del
problema.
b) Estime los efectos de los tratamientos.
c) Calcule los residuales obtenidos con la dieta B (error experimental).
d) Efectúe la prueba de Anderson – Darling para normalidad.
e) Efectúe la prueba de Bartlett para homogeneidad de variancias.
f) Realice el análisis de variancia. Calcule el coeficiente de variación.
g) Realice la prueba de Tukey. Concluya mediante el diagrama de líneas.
Dosis de insecticida
3 l/ha 5 l/ha 7 l/ha 9 l/ha
4.29 8.50 10.75 5.63
4.24 8.03 11.52 5.96
4.53 7.94 11.49 5.47
4.26 6.75 11.52 6.01
4.62 7.16 10.81 6.09
a) Presente el modelo aditivo lineal e interprete cada uno se sus componentes en términos del
problema.
b) Estime los efectos de los tratamientos.
c) Efectúe la prueba de Anderson – Darling para normalidad.
d) Efectúe la prueba de Bartlett para homogeneidad de variancias.
e) Realice el análisis de variancia. Calcule el coeficiente de variación.
f) Realice la prueba de Tukey. Concluya mediante el diagrama de líneas.
Fármaco
Sin droga Innovar Droperidol Fentayl
5.9 16.1 10.3 7.2
8.0 11.2 6.8 10.5
11.5 9.0 5.3 8.5
6.0 8.8 3.2 4.2
9.2 10.2 6.5 6.5
7.0 6.6
7.5 9.1
a) Presente el modelo aditivo lineal. Interprete cada uno de sus componentes en términos del
problema.
b) Estime los efectos de los tratamientos.
c) Calcule los residuales obtenidos con la droga Innovar.
d) Efectúe la prueba de Anderson – Darling para normalidad.
e) Efectúe la prueba de Bartlett para homogeneidad de variancias.
f) Realice el análisis de variancia. Calcule el coeficiente de variación.
g) Realice la prueba de Tukey. Concluya mediante el diagrama de líneas.
h) Realice la prueba de Dunnett. ¿Qué fármaco recomendaría usted?
i) Uno de los objetivos del experimento era comparar los fármacos Droperidol y Fentayl,
razón por la cual se asignaron 7 repeticiones a cada uno. ¿Existe suficiente evidencia
estadística para aceptar que Fentayl es mejor que Droperidol?
a) ¿Presentan los datos suficiente evidencia estadística para aceptar que las notas en el
examen parcial son diferentes entre los grupos?
5. Cuatro programas de entrenamiento para cierto trabajo fueron probados con 20 empleados
nuevos. Los 20 empleados fueron asignados al mismo supervisor y, al final del periodo de
entrenamiento, el supervisor calificó a los empleados de acuerdo a su habilidad para el
trabajo, asignando los rangos más bajos a aquellos empleados con la menor habilidad.
Programa Rangos
A 4 6 7 2 10
B 1 8 12 3 11
C 20 19 19 14 5
D 18 15 17 13 9