Unidad 4 Experimento 4 Chuy

Unidad ”Experimento 4” Chuy
Marı́a de Jesús Jiménez Ángeles

July 2018
1 Experimento tipo 4, ejercicio 13.25

En ”El efecto del diseño de boquilla sobre la estabilidad y el rendimiento de
chorros de agua turbulentos”, C. theobald describe un experimento en el que
se determinó una medición de forma para varios tipos de boquillas diferentes a
diferentes niveles de velocidad de flujo de salida del chorro. El interés en este
experimento se centra principalmente en el tipo de boquilla, y la velocidad es
un factor de molestia. Los datos son los siguientes:
datos<- read.csv("ejercicio 13.25.csv")

datos
## X tipo.1 tipo.2 tipo.3 tipo.4 tipo.5

## 1 11.73 0.78 0.85 0.93 1.14 0.97
## 2 14.37 0.80 0.85 0.92 0.97 0.86
## 3 16.59 0.81 0.92 0.95 0.98 0.78
## 4 20.43 0.75 0.86 0.89 0.88 0.76
## 5 23.46 0.77 0.81 0.89 0.86 0.76
## 6 28.74 0.78 0.83 0.83 0.83 0.75
¿El tipo de boquilla afecta la medición de la forma? comparar la boquilla

con diagramas de cajas y el análisis de varianza
Use el método lsd para determinar las diferencias especı́ficas entre las bo-
quillas.
Analizar los resultados de este experimento
Se van a cuantificar los datos
dim(datos)
## [1] 6 6
names(datos)
## [1] "X" "tipo.1" "tipo.2" "tipo.3" "tipo.4" "tipo.5"
1
Número de observaciones por boquilla y observaciones totales.
apply(datos,2,length)

## 6 6 6 6 6 6
sum(apply(datos,2,length))
## [1] 36
Se tiene un resumen estadı́stico por boquillas, y varianzas por boquillas.
apply(datos,2,summary)

## Min. 11.7300 0.7500000 0.8100000 0.8300000 0.8300000 0.7500000
## 1st Qu. 14.9250 0.7725000 0.8350000 0.8900000 0.8650000 0.7600000
## Median 18.5100 0.7800000 0.8500000 0.9050000 0.9250000 0.7700000
## Mean 19.2200 0.7816667 0.8533333 0.9016667 0.9433333 0.8133333
## 3rd Qu. 22.7025 0.7950000 0.8575000 0.9275000 0.9775000 0.8400000
## Max. 28.7400 0.8100000 0.9200000 0.9500000 1.1400000 0.9700000
Promedios por boquillas.
apply(datos,2,mean)

## 19.2200000 0.7816667 0.8533333 0.9016667 0.9433333 0.8133333
Varianzas por boquillas.
apply(datos,2,var)
## X tipo.1 tipo.2 tipo.3 tipo.4

## 3.932232e+01 4.566667e-04 1.386667e-03 1.776667e-03 1.290667e-02
## tipo.5
## 7.506667e-03
A continuación se presenta una gráfica.
par(mfrow=c(1,1))
boxplot(datos,horizontal=TRUE, col="green", main= "velocidad de salida de las diferentes boq
2
velocidad de salida de las diferentes boquillas
tipo.5
tipo.4
tipo.3
tipo.2
●
tipo.1
X
0 5 10 15 20 25
De acuerdo al box plot podemos observar que las velocidades de las boquillas
2, 3, 4, 5, 6 son muy parecidas en cambio la velocida de la boquilla 1 es muy
diferente al resto de las boquillas.
1.1 Análisis de varianza

H0 : µ1 = µ2
(1)
H1 : µ1 6= µ2
para al menos dos tratamientos i 6= j(2)
SStratamiento = a − 1 (3)
3
SSE = a(n − 1) (4)
SST = an − 1 (5)
El análisis de varianza se puede usar para evaluar la igualdad de los efectos del
tratamiento. En el modelo de efectos fijos, los efectos de tratamiento se suelen
definir como desviaciones de la media general µ, demodoque;
a
X
τi = 0 (6)
i=1
La suma de la identidad de los cuadrados es;
Pa Pn Pa Pa Pn
i=1 − ȳ)2 = n
j=1 (yij i=1 (ȳi − ȳ)2 + i=1 j=1 (yij − ȳ)2 (7)
o simbólicamente;
SST = SStratamiento + SSE (8)
datos

## 1 11.73 0.78 0.85 0.93 1.14 0.97
## 2 14.37 0.80 0.85 0.92 0.97 0.86
## 3 16.59 0.81 0.92 0.95 0.98 0.78
## 4 20.43 0.75 0.86 0.89 0.88 0.76
## 5 23.46 0.77 0.81 0.89 0.86 0.76
## 6 28.74 0.78 0.83 0.83 0.83 0.75
colnames(datos)
dim(datos)
## [1] 6 6
Número de replicas ”n” por tratamiento;
n<-(dim(datos))[1]
n
## [1] 6
4
Número de ”a” de tratamientos (muestras)
a<-(dim(datos))[2]
a
## [1] 6
glE<-a*(n-1) #grados de libertad del error

glTrat<-(a-1) #grados de libertad de los tratamientos
glTot<-n*a-1 #grados de libertad totales
ymean<-mean(apply(datos,2,mean)) #promedio total
#obtención de las sumas de las diferencias de cuadrados de la identidad
SCT<-0.0
for(j in 1:a){
for(i in 1:n)
{
SCT<-SCT+sum((datos[i,j]- ymean)^2) #suma de diferencia de cuadrados total
}
}
SCTrat<-0.0
for(j in 1:a){
SCTrat<-SCTrat+sum((apply(datos,2,mean)[[j]]-ymean)^2)
}
SCTrat<-SCTrat*n #suma de diferencia de cuadrados para los tratamientos
SCE<-0.0
for(j in 1:a){
for(i in 1:n)
{
SCE<-SCE+sum((datos[i,j]- apply(datos,2,mean)[[j]])^2)
}
}
#Sumas de diferencias de cuadrados y grados de libertad
sumasdeC<-c(SCTrat,SCE,SCT)
gdl<-c(glTrat, glE, glTot)
# los cuadrados medios y el estadı́stico de prueba F
MSTrat<-SCTrat/glTrat
MSE<- SCE/glE
F0<-MSTrat/MSE # estadı́stico de prueba
cuadradmedios<-c(MSTrat, MSE, F0)
cuadradmedios
## [1] 337.158998 6.557726 51.414015
Medios cuadrados del tratamiento: 337.15 Medios cuadrados del error: 6.55
Medios cuadrados del tramiento entre medios cuadrados del error: 51.444
5
n<-(dim(datos))[1] # número de replicas "n" por tratamiento
a<-(dim(datos))[2] # número de a de tratamientos (muestras)
respuestaexp<-c()
for(j in 1:a)
{
respuestaexp<-c(respuestaexp,datos[,j])
}
nivel = rep(n, a)
tratexp = rep(1:a, nivel)
tratexp<-factor(tratexp)
datosanova<-data.frame(tratexp, respuestaexp)
datosanova
## tratexp respuestaexp
## 1 1 11.73
## 2 1 14.37
## 3 1 16.59
## 4 1 20.43
## 5 1 23.46
## 6 1 28.74
## 7 2 0.78
## 8 2 0.80
## 9 2 0.81
## 10 2 0.75
## 11 2 0.77
## 12 2 0.78
## 13 3 0.85
## 14 3 0.85
## 15 3 0.92
## 16 3 0.86
## 17 3 0.81
## 18 3 0.83
## 19 4 0.93
## 20 4 0.92
## 21 4 0.95
## 22 4 0.89
## 23 4 0.89
## 24 4 0.83
## 25 5 1.14
## 26 5 0.97
## 27 5 0.98
## 28 5 0.88
## 29 5 0.86
## 30 5 0.83
## 31 6 0.97
## 32 6 0.86
6
## 33 6 0.78
## 34 6 0.76
## 35 6 0.76
## 36 6 0.75
res.aov<-aov(respuestaexp ~ tratexp)
res.aov
## Call:
## aov(formula = respuestaexp ~ tratexp)
##
## Terms:
## tratexp Residuals
## Sum of Squares 1685.7950 196.7318
## Deg. of Freedom 5 30
##
## Residual standard error: 2.560806
## Estimated effects may be unbalanced
summary(res.aov)
## Df Sum Sq Mean Sq F value Pr(>F)

## tratexp 5 1685.8 337.2 51.41 8.17e-14 ***
## Residuals 30 196.7 6.6
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Verificación de supuestos; Normalidad
shapiro.test(respuestaexp)
##
## Shapiro-Wilk normality test
##
## data: respuestaexp
## W = 0.48996, p-value = 4.911e-10
qqnorm(respuestaexp)
7
Normal Q−Q Plot
25 ●
●
20
Sample Quantiles
●
15
●
10
5
●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●●●●●●● ● ● ● ● ● ● ●
0
−2 −1 0 1 2
Theoretical Quantiles
Los datos se consideran dentro de la normalidad.
homvarianzas<-bartlett.test(respuestaexp ~ tratexp)
homvarianzas
##
## Bartlett test of homogeneity of variances
##
## data: respuestaexp by tratexp
## Bartlett's K-squared = 173.78, df = 5, p-value < 2.2e-16
par(mfrow=c(2,2))
plot(res.aov)
8
Residuals vs Fitted Normal Q−Q
10 ●6 6●
4
Standardized residuals
5
2
●
Residuals
●
● ●
●
●
0
●
● ●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●
0
●
●
−5
●2
−2
●2
●1
●1
5 10 15 −2 −1 0 1 2
Fitted values Theoretical Quantiles
Constant Leverage:
Scale−Location Residuals vs Factor Levels
2.0
●6
●6
●1 4
1.5
●2
2
● ●
1.0
● ●
● ● ● ● ●
0
● ●
●
●
0.5
−2
●2
●
●
●
●
●
●
● ●1
●
●
●
●
0.0
●
●
−4
tratexp :
5 10 15 1 2 3 4 5 6
Fitted values Factor Level Combinations
1.2 Compraciones multiples

Una confianza del 100 por ciento en la media del i-ésimo tratamiento es µ;
r r
M SE M SE
ȳi − tα/2,a(n−1) ≤ µi ≤ ȳi + tα/2,a(n−1) (9)
n n
ic = 0.95 #nivel de confianza

alfa<-1-ic
talfa<-qt(alfa/2,a*(n-1), lower.tail = FALSE)
# atención para obtener MSE lo más facil es copiarlo de la tabla ANOVA
#sin embargo en la linea siguiente se usa el valor que se obtienen realizando los cálculos
desvtr<-sqrt(MSE/n)
# se obtienen "a"" intervalos de confianza, uno para cada tratamiento
liminf<-apply(datos,2,function(x){mean(x)-talfa*desvtr})
limsup<-apply(datos,2,function(x) {mean(x)+talfa*desvtr})
9
cis2 <- cbind(liminf,limsup)
colnames(cis2)<-c("limite inferior", "limite superior")
print(cis2)
## limite inferior limite superior

## X 17.084917 21.355083
## tipo.1 -1.353416 2.916749
## tipo.2 -1.281749 2.988416
## tipo.3 -1.233416 3.036749
## tipo.4 -1.191749 3.078416
## tipo.5 -1.321749 2.948416
Un intervalo de confianza del 100 por ciento sobre la diferencia en dos medios
de tratamiento µi − µ − jes;
r r
2M SE 2M SE
ȳi − ȳj − tα/2,a(n−1) ≤ µi − µj ≤ ȳi − ȳj + tα/2,a(n−1) (10)
n n
#calculo de intervalos de confianza

ic = 0.95
alfa<-1-ic
desvtr<-sqrt(2*MSE/n)
liminf3<-mean(datos[,3])-mean(datos[,2])- talfa*desvtr#limite de confianza inferior
limsup3<-mean(datos[,3])-mean(datos[,2])+ talfa*desvtr#limite de confianza superior
c(liminf3, limsup3)
## [1] -2.947796 3.091129
La formula de la diferencia mı́nima significativa (LSD) es:

El método Fisher LSD compara todos los pares de medias con las hipótesis
nulas H0 : µi = µj , paratodoi 6= j, utilizandolat − estadı́stica;
ȳi − ȳj
t0 = q (11)
2M SE
n
Suponiendo una hipótesis alternativa de dos lados, el par de medias µi yµj sedeclararı́ansignif icativamented
|ȳi − ȳj | > LSD (12)

Donde LSD la diferencia menos significativa es
r
2M SE
LSD = ta/2,a(n−1) (13)
n
Si los tamaños de muestra son diferentes en cada tratamiento, el LSD se
define como;
10
s
1 1
LSD = ta/2,N −a M SE ∗ ( + ) (14)
ni nj
ic = 0.95
alfa<-1-ic
LSD<-talfa*sqrt(2*MSE/n)
LSD
## [1] 3.019463
Retomamos, los promedios por tratamiento al compararlos con el LDS obtenido:

LDS=3.01
apply(datos,2,mean)

## 19.2200000 0.7816667 0.8533333 0.9016667 0.9433333 0.8133333
Las comparaciones entre los promedios de tratamiento observados son los

siguientes
6 vs. 1= 0.8133 - 19.22 = 18.4067 ¿ 3.01
6vs. 2=0.8133 - 0.7816 = 00.0317 ¡ 3.01
6 vs. 3=0.8133 - 0.8533 = 00.0400 ¡ 3.01
6 vs. 4=0.8133 - 0.9016 = 00.0883 ¡ 3.01
6 vs. 5=0.8133 - 0.9433 = 00.1300 ¡ 3.01
5 vs. 1=0.9433 - 19.22 = 18.2767 ¿ 3.01
5 vs. 2=0.9433 - 0.7816 = 00.1617 ¡ 3.01
5 vs. 3=0.9433 - 0.8533 = 00.0900 ¡ 3.01
5 vs. 4=0.9433 - 0.9016 = 00.0417 ¡ 3.01
4 vs. 1=0.9016 - 19.22 = 18.3184 ¿ 3.01
4 vs. 2=0.9016 - 0.7816 = 00.1200 ¡ 3.01
4 vs. 3=0.9016 - 0.8533 = 00.0483 ¡ 3.01
3 vs. 1=0.8533 - 19.22 = 18.3667 ¿ 3.01
3 vs. 2=0.8533 - 0.7816 = 00.0717 ¡ 3.01
2 vs. 1=0.7816 - 19.22 = 18.4384 ¿ 3.01
A partir de este análisis, vemos que existen diferencias significativas entre
algunos de los pares de medias, excepto; 6 y 2, 6 y 3, 6 y 4, 6 y 5, 5 y 2, 5 y 3,
5 y 4, 4 y 2, 4 y 3, 3 y 2. Esto implica que entre estos pares producen la misma
velocidad de flujo de salida. Pero se produce una velocida de salida mayor entre
la media que esta en la posición 5
#{r eval = FALSE}

res<-aov(respuestaexp ~ tratexp)
TukeyHSD(res)
11
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = respuestaexp ~ tratexp)
##
## $tratexp
## diff lwr upr p adj
## 2-1 -18.43833333 -22.935275 -13.941391 0.0000000
## 3-1 -18.36666667 -22.863609 -13.869725 0.0000000
## 4-1 -18.31833333 -22.815275 -13.821391 0.0000000
## 5-1 -18.27666667 -22.773609 -13.779725 0.0000000
## 6-1 -18.40666667 -22.903609 -13.909725 0.0000000
## 3-2 0.07166667 -4.425275 4.568609 1.0000000
## 4-2 0.12000000 -4.376942 4.616942 0.9999994
## 5-2 0.16166667 -4.335275 4.658609 0.9999976
## 6-2 0.03166667 -4.465275 4.528609 1.0000000
## 4-3 0.04833333 -4.448609 4.545275 1.0000000
## 5-3 0.09000000 -4.406942 4.586942 0.9999999
## 6-3 -0.04000000 -4.536942 4.456942 1.0000000
## 5-4 0.04166667 -4.455275 4.538609 1.0000000
## 6-4 -0.08833333 -4.585275 4.408609 0.9999999
## 6-5 -0.13000000 -4.626942 4.366942 0.9999992
plot(TukeyHSD(res))
12
95% family−wise confidence level
2−1
4−1
6−1
4−2
6−2
5−3
5−4
6−5
−20 −15 −10 −5 0 5
Differences in mean levels of tratexp
En el box plot tambien podemos observar las diferencias que presentaron los
pares; 6-2, 6-3, 6-4, 6-5, 5-2, 5-3, 5-4, 4-2, 4-3, 3-2
2 Método 2; una opción, todavı́a muy común, es

desarrollar cada suma de diferencias de cuadra-
dos para obtener las siguientes expresiones.
Las fórmulas de cálculo de sumas de cuadrados para el ANOVA con tamaños
de muestra iguales en cada tratamiento son;
a X n
X
2 y2
SST = (yij )− (15)
i=1 j=1
N
y
13
a
X y2 i y2
SST ratos = − (16)
i=1
n N
La suma de cuadrados de error se obtiene por sustracción como;
SSE = SST − SST ratos (17)

Usando R;
colnames(datos)
rownames(datos)
## [1] "1" "2" "3" "4" "5" "6"
dim(datos)
## [1] 6 6
n<-(dim(datos))[1]
n
## [1] 6
a<-(dim(datos))[2]
a
## [1] 6
glE<-a*(n-1)
glTrat<-(a-1)
glTot<-n*a-1
#promedio total
ymean<-mean(apply(datos,2,mean))
#obtención de las sumas de las diferencias de cuadrados de la identidad
SCT<-0.0
for(j in 1:a)
{
for(i in 1:n)
14
{
SCT<-SCT+sum(((datos[i,j])-ymean)^2)
}
}
#suma de diferencia de cuadrados total
#Variabilidad total
N= a*n
SCT=SCT - ((ymean)^2)/N
#suma de cuadrados de los tratamientos
SCTrat<-0.0
for(j in 1:a){
SCTrat<-SCTrat+sum((apply(datos,2,mean)[[j]]-ymean)^2)
}
SCTrat<-SCTrat*n
# suma de cuadrados del error
SCE<-0.0
for(j in 1:a){
for(i in 1:n)
{
SCE<-SCE+sum((datos[i,j]- apply(datos,2,mean)[[j]])^2)
}
}
#Sumas de diferencias de cuadrados y grados de libertad
c(SCTrat,SCE,SCT)
## [1] 1685.7950 196.7318 1882.1002
## [1] 382.7917 130.1667 502.3471

c(glTrat, glE, glTot)
## [1] 5 30 35
# los cuadrados medios y el estadı́stico de prueba F

MSTrat<-SCTrat/glTrat
MSE<- SCE/glE
F0<-MSTrat/MSE
c(MSTrat, MSE, F0)
## [1] 337.158998 6.557726 51.414015
Podemos ver que usando este método también obtenemos un valor de los
medios cuadrados del trato de 337.1589, los medios cuadrados del error de 6.55
y la division entre estos de 51.41.
15
3 Conclusiones
Se obtuvieron los valores, siguientes; Los medios cuadrados del trato; 337.1589.
Los medios cuadrados del error; 6.55. La division entre estos; 51.41.
En el box plot de los pares de los valores de las medias, se pudo observar
que existen ciertos conjuntos de datos que podemos suponer serian las boquillas
correctas para una velocidad de salida adecuada, pero explorando mas, al com-
parar la LSD con los pares de medias se pudo obtener que la boquilla número 4
es la que nos sirviria mejor, siendo esta con un valor de la velocidad de 0.9433
m/s.
16

Unidad 4 Experimento 4 Chuy

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Unidad 4 Experimento 4 Chuy

Cargado por

Copyright:

Formatos disponibles

Unidad ”Experimento 4” Chuy

Marı́a de Jesús Jiménez Ángeles

1 Experimento tipo 4, ejercicio 13.25

datos<- read.csv("ejercicio 13.25.csv")

## X tipo.1 tipo.2 tipo.3 tipo.4 tipo.5

¿El tipo de boquilla afecta la medición de la forma? comparar la boquilla

## [1] "X" "tipo.1" "tipo.2" "tipo.3" "tipo.4" "tipo.5"

## X tipo.1 tipo.2 tipo.3 tipo.4 tipo.5

Se tiene un resumen estadı́stico por boquillas, y varianzas por boquillas.

## X tipo.1 tipo.2 tipo.3 tipo.4 tipo.5

Promedios por boquillas.

## X tipo.1 tipo.2 tipo.3 tipo.4 tipo.5

Varianzas por boquillas.

## X tipo.1 tipo.2 tipo.3 tipo.4

A continuación se presenta una gráfica.

1.1 Análisis de varianza

La suma de la identidad de los cuadrados es;

SST = SStratamiento + SSE (8)

## X tipo.1 tipo.2 tipo.3 tipo.4 tipo.5

## [1] "X" "tipo.1" "tipo.2" "tipo.3" "tipo.4" "tipo.5"

Número de replicas ”n” por tratamiento;

glE<-a*(n-1) #grados de libertad del error

## [1] 337.158998 6.557726 51.414015

## Df Sum Sq Mean Sq F value Pr(>F)

Verificación de supuestos; Normalidad

Los datos se consideran dentro de la normalidad.

Fitted values Theoretical Quantiles

Fitted values Factor Level Combinations

1.2 Compraciones multiples

ic = 0.95 #nivel de confianza

## limite inferior limite superior

#calculo de intervalos de confianza

## [1] -2.947796 3.091129

La formula de la diferencia mı́nima significativa (LSD) es:

|ȳi − ȳj | > LSD (12)

Retomamos, los promedios por tratamiento al compararlos con el LDS obtenido:

## X tipo.1 tipo.2 tipo.3 tipo.4 tipo.5

Las comparaciones entre los promedios de tratamiento observados son los

#{r eval = FALSE}

−20 −15 −10 −5 0 5

Differences in mean levels of tratexp

2 Método 2; una opción, todavı́a muy común, es

SSE = SST − SST ratos (17)

## [1] "X" "tipo.1" "tipo.2" "tipo.3" "tipo.4" "tipo.5"

## [1] "1" "2" "3" "4" "5" "6"

## [1] 1685.7950 196.7318 1882.1002

## [1] 382.7917 130.1667 502.3471

# los cuadrados medios y el estadı́stico de prueba F

## [1] 337.158998 6.557726 51.414015

También podría gustarte