Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1.1. características
Los diseños completamente al azar son empleados cuando las unidades experimentales son
suficientemente homogéneas entre sí, es decir, cuando la variación entre ellas es pequeña.
Por lo que el empleo de bloques resulta inapropiado porque no hay heterogeneidad que
sea necesario absorber. Éste en el caso de muchos tipos de experimentos de laboratorio,
en los que una cantidad de material está completamente mezclado y luego se divide en
porciones pequeñas para formar las unidades experimentales, o en experimentos con
animales y plantas con condiciones ambientales muy parecidas. Todas las unidades
experimentales reúnen prácticamente las mismas características, de modo que el efecto de
un tratamiento sobre la variable bajo estudio, es el mismo independientemente de la
unidad experimental donde se mida, excepto por variaciones aleatorias, debidas a fuentes
del error en la investigación.
Los tratamientos se aplican completamente al azar sobre las unidades experimentales, bajo
la condición de que cada unidad experimental deberá tener la misma probabilidad de
recibir un tratamiento particular. Todos los tratamientos pueden tener un número igual o
diferente de repeticiones. Cuando el número de repeticiones es diferente dentro de cada
tratamiento se dice entonces que el diseño es no balanceado; en caso contrario, se dice
que el diseño es balanceado.
Hay dos ventajas al elegir un diseño balanceado. La primera es que el estimador de prueba
es relativamente insensible a las desviaciones pequeñas del supuesto de la igualdad de
varianzas de los t tratamientos cuando los tamaños de las muestras son iguales. Y la
segunda ventaja es que la potencia de las pruebas se maximiza cuándo las muestras tienen
el mismo tamaño.
1.2. Ventajas
El diseño completamente al azar es flexible en cuanto a que el número de tratamientos y
de repeticiones solo está limitado por el número de unidades experimentales disponibles.
El número de repeticiones puede variar de un tratamiento a otro, aunque generalmente lo
ideal sería tener un número igual por tratamiento. La sencillez del análisis no se pierde si
algunas unidades experimentales o tratamientos enteros faltan o se descartan
1.3. Desventajas
La principal objeción del diseño completamente al azar es su frecuente y eficiencia. Como
la aleatorización no tiene recepciones, el error experimental incluye toda la variación entre
las unidades experimentales, excepto la debida a los tratamientos. En muchas situaciones
es posible agrupar a las unidades experimentales de modo que la variación entre las
unidades dentro de los grupos sea menor que la variación entre las unidades de diferentes
grupos. ciertos diseños sacan ventaja de tal agrupamiento, excluyen la variación del error
experimental entre grupos y aumentan la precisión del experimento.
1.4. Modelo lineal
El modelo lineal para los diseños completamente al azar es el siguiente:
𝑌𝑖𝑗 = 𝜇 + 𝑟𝑖 + 𝑒𝑖𝑗
Donde
ⅈ = 1,2, … , 𝑡
𝑗 = 1,2, … , 𝑟𝑖
𝐸(𝑒𝑖) = 0
E(e2) = σ2
i
𝑡 = 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑡𝑟𝑎𝑡𝑎𝑚ⅈ𝑒𝑛𝑡𝑜𝑠
𝑟𝑖 = 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑟𝑒𝑝𝑒𝑡ⅈ𝑐ⅈ𝑜𝑛𝑒𝑠 𝑝𝑎𝑟𝑎 ⅈ − é𝑠ⅈ𝑚𝑜 𝑡𝑟𝑎𝑡𝑎𝑚ⅈ𝑒𝑛𝑡𝑜.
𝑌𝑖𝑗 = 𝑅𝑒𝑠𝑝𝑢𝑒𝑠𝑡𝑎 𝑜𝑏𝑡𝑒𝑛ⅈ𝑑𝑎 𝑒𝑛 𝑙𝑎 𝑗 − é𝑠ⅈ𝑚𝑎 𝑟𝑒𝑝𝑒𝑡ⅈ𝑐ⅈó𝑛 𝑑𝑒𝑙 ⅈ − é𝑠ⅈ𝑚𝑜 𝑡𝑟𝑎𝑡𝑎𝑚ⅈ𝑒𝑛𝑡𝑜.
𝜇 = 𝐸𝑓𝑒𝑐𝑡𝑜 𝑚𝑒𝑑ⅈ𝑜 𝑔𝑒𝑛𝑒𝑟𝑎𝑙
𝑟𝑖 = 𝐸𝑓𝑒𝑐𝑡𝑜 𝑎𝑡𝑟ⅈ𝑏𝑢ⅈ𝑑𝑜 𝑎𝑙 ⅈ − é𝑠ⅈ𝑚𝑜 𝑡𝑟𝑎𝑡𝑎𝑚ⅈ𝑒𝑛𝑡𝑜
𝑒𝑖𝑗 = 𝑇é𝑟𝑚ⅈ𝑛𝑜 𝑑𝑒 𝑒𝑟𝑟𝑜𝑟 𝑎𝑙𝑒𝑎𝑡𝑜𝑟ⅈ𝑜
𝑡
2 𝑆𝐶𝑡𝑟𝑎𝑡 𝐶𝑀𝑡𝑟𝑎𝑡
Tratamientos 𝐺𝐿𝑡𝑟𝑎𝑡 = 𝑡 − 1 𝑆𝐶𝑡𝑟𝑎𝑡 = ∑ 𝑌𝑖. − 𝐹𝐶 𝐶𝑀𝑡𝑟𝑎𝑡 =
𝐺𝐿 𝑡𝑟𝑎𝑡
𝐹𝑐𝑎𝑙 =
𝐶𝑀𝑒𝑟𝑟𝑜𝑟
𝑟𝑖
𝑖=1
𝑡 𝑆𝐶𝑒𝑟𝑟𝑜𝑟
Error 𝐺𝐿𝑒𝑟𝑟𝑜𝑟 = ∑ 𝑟𝑖 − 𝑡 𝑆𝐶𝑒𝑟𝑟𝑜𝑟 = 𝑆𝐶𝑡𝑜𝑡𝑎𝑙 − 𝑆𝐶𝑡𝑟𝑎𝑡 𝐶𝑀𝑒𝑟𝑟𝑜𝑟 =
𝐺𝐿𝑒𝑟𝑟𝑜𝑟
𝑖=1
𝑡 𝑟𝑖
𝑡
𝑆𝐶𝑡𝑜𝑡𝑎𝑙 = ∑ ∑ 𝑌2 − 𝐹𝐶
Total 𝐺𝐿𝑡𝑜𝑡𝑎𝑙 = ∑ 𝑟𝑖 − 1 𝑖𝑗
𝑖=1 𝑖=1 𝑗=1
1.7. Estructura de los datos para un ANOVA de una via de clasificacion
TRATAMIENTOS
Donde:
𝑌.. = Suma de todas las observaciones en el experimento
𝑌𝑖. = Suma de todas las observaciones que pertenecen al ⅈ - ésimo tratamiento
Determine el peso porcentual del algodón (tratamientos) en una fibra sintética afecta la
resistencia a la tensión. Se desea una confiabilidad del 95%.
Hipótesis de investigación
El incluir mayor cantidad de algodón en la tela mejora sus condiciones de resistencia
Paso 1:Hipótesis estadistica:
𝐻0 : 𝑟1 = 𝑟2 = . . . = 𝑟𝑡
𝜈𝑠
𝐻𝑎 ∶ 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑒𝑙 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑢𝑛 𝑡𝑟𝑎𝑡𝑎𝑚ⅈ𝑒𝑛𝑡𝑜 𝑒𝑠 𝑑ⅈ𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑒𝑚á𝑠
Grados de libertad
𝐺𝐿𝑡𝑟𝑎𝑡 = 𝑡 − 1 = 5 − 1 = 4
𝑡
𝐺𝐿𝑒𝑟𝑟𝑜𝑟 = ∑ 𝑟𝑖 − 𝑡 = 25 − 5 = 20
𝑖=1
𝐺𝐿𝑡𝑜𝑡𝑎𝑙 = ∑ 𝑟𝑖 − 1 = 25 − 1 = 24
𝑖=1
Suma de cuadrados
𝑌 2. . (𝑌1 + 𝑌2 + 𝑌3 + 𝑌4 + (49 + 77 + 88 + 108 + (376) 141376
𝐹𝐶 = +54)2 2 = 𝟓𝟔𝟓𝟓. 𝟎𝟒
𝑌5)2 =
Σi=1
t
ri r 1+ r 2 + r 3 + r 4 + r 5 = 5+5+5+5+5 = 25 = 25
𝑡
𝑆𝐶𝑡𝑟𝑎𝑡 = ∑ 𝑌i
2
− 𝐹𝐶 = [ 2
(49)
(77)2 (88)2 (108)2 (54)2 ] − 5655.04 = 6130.8 − 5655.04 = 𝟒𝟕𝟓. 𝟕𝟔
. + + + +
𝑟𝑖 5 5 5 5 5
𝑖=1
𝑡 𝑟𝑖 𝑟𝑖 𝑟𝑖 𝑟𝑖 𝑟𝑖 𝑟𝑖
𝑆𝐶𝑡𝑜𝑡𝑎𝑙 = ∑
∑ 𝑌 − 𝐹𝐶 = (∑ 𝑌 + ∑ 𝑌 + ∑ 𝑌 + ∑ 𝑌 + ∑ 𝑌2 ) − 𝐹𝐶
2 2 2 2 2
1𝑗 1𝑗 2𝑗 3𝑗 4𝑗 5𝑗
𝑖=1 𝑗=1 𝑗=1 𝑗=1 𝑗=1 𝑗=1 𝑗=1
T1 T2 T3 T4 T5
R1 49 144 196 361 49
R2 49 289 324 625 100
R3 225 144 324 484 121
R4 121 324 361 361 225
R5 81 324 361 529 121
𝑟𝑖 𝑟𝑖 𝑟𝑖 𝑟𝑖 𝑟𝑖 𝑡 𝑟𝑖
2
Total por ∑ 𝑌2 = 525 ∑ 𝑌2 = 1225 ∑ 𝑌2 = 1566 ∑ 𝑌 = 2360 ∑ 𝑌2 = 616 ∑ ∑ 𝑌2 =
tratamiento
1𝑗 2𝑗 3𝑗 4𝑗 5𝑗
629 2
𝐽=1 𝐽=1 𝐽=1 𝐽=1 𝐽=1 1𝑗
𝑖=1 𝑗=1
𝑆𝐶𝑡𝑜𝑡𝑎𝑙 = [525 + 1225 + 1566 + 2360 + 616] − 5655.04 = 6292 − 5665.04 = 636.96
𝐶𝑀 𝑆𝐶𝑒𝑟𝑟𝑜𝑟 161.2
𝑒𝑟𝑟𝑜𝑟 = 𝐺𝐿 = 20 = 𝟖. 𝟎𝟔
𝑒𝑟𝑟𝑜𝑟
F calculada
F tabulada
𝐹𝑡𝑎𝑏 = 𝐹𝑎(𝑣1, 𝑣2) = 𝐹0.05(4,20) = 2.87
Cuadro de ANVA
Paso 4: Decisión
Como el F calculado = 14.76 > F tabular = 2.87, entonces Rechazamos la Hipótesis nula (Ho)
Conclusión
Existe evidencia estadística para afirmar que se rechaza la hipótesis nula (Ho) para los
tratamientos, debido a que F calculado = 14.76 > F tabular = 2.87, lo que indica que al
menos el efecto de un tratamiento diferente al de los demás.
Al menos uno de los niveles del porcentaje de algodón en la tela presenta un efecto
diferente sobre su resistencia a la tensión.
Script en RStudio
setwd("F:/Sesion Practica")
library(readxl)
DCA_Montgomery <- read_excel("F:/Sesion Practica/DCA_Montgomery.xlsx",
sheet = "DCA", col_types = c("numeric",
"numeric"))
head(DCA_Montgomery)
## # A tibble: 6 x 2
## Tratamientos Peso
## <dbl> <dbl>
## 1 1 7
## 2 1 7
## 3 1 15
## 4 1 11
## 5 1 9
## 6 2 12
attach(DCA_Montgomery)
TRAT <- factor(Tratamientos)
Y <- as.numeric(as.vector(Peso))
modelo2 <- lm(Y ~ TRAT)
anova(modelo2)
Script en RStudio
De los gráficos se puede afirmar que existe cierta normalidad de los residuos,
homogeneidad de varianzas e independencia.
Test de normalidad
a) Paso 1: planteamiento de hipótesis:
Ho: Los residuales o errores se ajustan a una distribución normal.
Ha: Los residuales o errores No se ajustan a una distribución normal.
data: residuals(modelo2)
D = 0.16212, p-value = 0.08889
Paso 4: Decisión.
Como P_Value = 0.089 > Alfa = 0.05. Entonces se acepta la hipótesis nula (Ho).
Paso 5: Conclusión:
Existe evidencia estadística para afirmar que los residuales o errores se ajustan a una
distribución normal. A un nivel de significancia del 5%.
Script en RStudio
library(car)
Paso 4: Decisión.
Como P_Value = 0.8626 > Alfa = 0.05. Entonces se acepta la hipótesis nula (Ho).
Paso 5: Conclusión:
Existe evidencia estadística para afirmar que las varianzas en los cinco tratamientos son iguales. A
un nivel de significancia del 5%.
#Independencia
library(zoo)
library(lmtest)
dwtest(modelo2)
##
## Durbin-Watson test
##
## data: modelo2
## DW = 2.4022, p-value = 0.5808
## alternative hypothesis: true autocorrelation is greater than 0
Script en RStudio
anova(modelo2)
Paso 5: Conclusión:
Existe evidencia estadística para afirmar que al menos un tratamiento es diferente a los demás. A un
nivel de significancia del 5%.
Comparación de pares de medias de tratamientos
Por tanto, cualquier par de promedios de los tratamientos que difiera del valor absoluto
por más de 3.75 implicaría que el par correspondiente de medias poblacionales es
significativamente diferente, las diferencias en los promedios son:
Del ejemplo:
1 1
𝐿𝑆𝐷 = 𝑡(0.05⁄ ; 20) ∗ √8.06 ∗ ( + )
2 5 5
1 1
𝐿𝑆𝐷 = 2.086 ∗ √8.06 ∗ ( + ) = 3.75
5 5
Los valores marcados con asterisco indican pares de medias que son significativamente
diferentes. Evidentemente, los únicos pares de medias que no difieren significativamente
son 1 y 5 y 2 y 3, y el tratamiento 4 produce una resistencia a la tensión significativamente
mayor que los oros tratamientos.
#Comparacion de medias
#Scrip en RStudio
library(agricolae)
Grupos<- LSD.test(y = modelo2, trt = "TRAT", group = T, console = T)
##
## Study: modelo2 ~ "TRAT"
##
## LSD t Test for Y
##
## Mean Square Error: 8.06
##
## TRAT, means and individual ( 95 %) CI
##
## Y std r LCL UCL Min
Max ## 1 9.8 3.346640 5 7.151566 12.44843
7 15
## 2 15.4 3.130495 5 12.751566 18.04843 12 18
## 3 17.6 2.073644 5 14.951566 20.24843 14 19
## 4 21.6 2.607681 5 18.951566 24.24843 19 25
## 5 10.8 2.863564 5 8.151566 13.44843 7 15
##
## Alpha: 0.05 ; DF Error: 20
## Critical Value of t: 2.085963
##
## least Significant Difference: 3.745452
##
## Treatments with the same letter are not significantly different.
##
## Y groups
## 4 21.6 a
## 3 17.6 b
## 2 15.4 b
## 5 10.8 c
## 1 9.8 c
##
## Study: modelo2 ~ "TRAT"
##
## LSD t Test for Y
##
## Mean Square Error: 8.06
##
## TRAT, means and individual ( 95 %) CI
##
## Y std r LCL UCL Min
Max ## 1 9.8 3.346640 5 7.151566 12.44843
7 15
## 2 15.4 3.130495 5 12.751566 18.04843 12 18
## 3 17.6 2.073644 5 14.951566 20.24843 14 19
## 4 21.6 2.607681 5 18.951566 24.24843 19 25
## 5 10.8 2.863564 5 8.151566 13.44843 7 15
##
## Alpha: 0.05 ; DF Error: 20
## Critical Value of t: 2.085963
##
## Comparison between treatments means
##
## difference pvalue signif. LCL UCL
## 1 - 2 -5.6 0.0054 ** -9.3454518 -1.8545482
## 1 - 3 -7.8 0.0003 *** -11.5454518 -4.0545482
## 1 - 4 -11.8 0.0000 *** -15.5454518 -8.0545482
## 1 - 5 -1.0 0.5838 -4.7454518 2.7454518
## 2 - 3 -2.2 0.2347 -5.9454518 1.5454518
## 2 - 4 -6.2 0.0025 ** -9.9454518 -2.4545482
## 2 - 5 4.6 0.0186 * 0.8545482 8.3454518
## 3 - 4 -4.0 0.0375 * -7.7454518 -0.2545482
## 3 - 5 6.8 0.0012 ** 3.0545482 10.5454518
## 4 - 5 10.8 0.0000 *** 7.0545482 14.5454518
Prueba de Tukey
Un método más conservador para comparar pares de medias de tratamientos es el método
de Tukey, el cual consiste en comparar las diferencias entre medias muestrales con el valor
crítico dado por:
𝑇𝛼 = 𝑞𝛼(𝐾, 𝑁 − 𝐾)√𝐶𝑀𝐸/𝑛𝑖
Donde:
CME es el cuadrado medio del error, 𝑛𝑖 es el número de observaciones por tratamiento, k es
el número de tratamientos, N – k es igual a los grados de libertad para el error, 𝛼 es el nivel
de significancia prefijado y el estadístico q𝛼 (k, N – k) son puntos porcentuales de la
distribución del rango estudentizado.
Se declaran significativamente diferentes los pares de medias cuya diferencia muestral en
valor absoluto sea mayor que T𝛼. A diferencia de los métodos LSD y Duncan, el método de
Tukey trabaja con un error a muy cercano al declarado por el experimentador.
Del ejemplo:
Amplitudes Estudentizadas Significativas de Tukey
Tabla de tukey Tratamientos = 5
AES (T) (0.05,3,9) Valor = 4.23
AES (T) se obtiene por tabla estadística de Tukey, con nivel de significancia de 0.05 y 5
número tratamientos y 20 GL del error.
𝑇𝛼 = 𝑞𝛼(𝐾, 𝑁 − 𝐾)√𝐶𝑀𝐸/𝑛𝑖
𝑇𝛼 = 4.23√8.06/5 = 5.37
Scrip en RStudio
#Prueba de tukey
outHSD<-HSD.test(modelo2, "TRAT",console=TRUE)
##
## Study: modelo2 ~ "TRAT" ##
## HSD Test for Y ##
## Mean Square Error: 8.06 ##
## TRAT, means ##
## 1 9.8
Referencia bibliográfica de LSD
https://www.ugr.es/~bioestad/guiaspss/practica7/ArchivosAdjuntos/ComparacionesMulti
ples.pdf