Está en la página 1de 16

Unidad ”Experimento 4” Chuy

Marı́a de Jesús Jiménez Ángeles


July 2018

1 Experimento tipo 4, ejercicio 13.25


En ”El efecto del diseño de boquilla sobre la estabilidad y el rendimiento de
chorros de agua turbulentos”, C. theobald describe un experimento en el que
se determinó una medición de forma para varios tipos de boquillas diferentes a
diferentes niveles de velocidad de flujo de salida del chorro. El interés en este
experimento se centra principalmente en el tipo de boquilla, y la velocidad es
un factor de molestia. Los datos son los siguientes:

datos<- read.csv("ejercicio 13.25.csv")


datos

## X tipo.1 tipo.2 tipo.3 tipo.4 tipo.5


## 1 11.73 0.78 0.85 0.93 1.14 0.97
## 2 14.37 0.80 0.85 0.92 0.97 0.86
## 3 16.59 0.81 0.92 0.95 0.98 0.78
## 4 20.43 0.75 0.86 0.89 0.88 0.76
## 5 23.46 0.77 0.81 0.89 0.86 0.76
## 6 28.74 0.78 0.83 0.83 0.83 0.75

¿El tipo de boquilla afecta la medición de la forma? comparar la boquilla


con diagramas de cajas y el análisis de varianza
Use el método lsd para determinar las diferencias especı́ficas entre las bo-
quillas.
Analizar los resultados de este experimento
Se van a cuantificar los datos

dim(datos)

## [1] 6 6

names(datos)

## [1] "X" "tipo.1" "tipo.2" "tipo.3" "tipo.4" "tipo.5"

1
Número de observaciones por boquilla y observaciones totales.

apply(datos,2,length)

## X tipo.1 tipo.2 tipo.3 tipo.4 tipo.5


## 6 6 6 6 6 6

sum(apply(datos,2,length))

## [1] 36

Se tiene un resumen estadı́stico por boquillas, y varianzas por boquillas.

apply(datos,2,summary)

## X tipo.1 tipo.2 tipo.3 tipo.4 tipo.5


## Min. 11.7300 0.7500000 0.8100000 0.8300000 0.8300000 0.7500000
## 1st Qu. 14.9250 0.7725000 0.8350000 0.8900000 0.8650000 0.7600000
## Median 18.5100 0.7800000 0.8500000 0.9050000 0.9250000 0.7700000
## Mean 19.2200 0.7816667 0.8533333 0.9016667 0.9433333 0.8133333
## 3rd Qu. 22.7025 0.7950000 0.8575000 0.9275000 0.9775000 0.8400000
## Max. 28.7400 0.8100000 0.9200000 0.9500000 1.1400000 0.9700000

Promedios por boquillas.

apply(datos,2,mean)

## X tipo.1 tipo.2 tipo.3 tipo.4 tipo.5


## 19.2200000 0.7816667 0.8533333 0.9016667 0.9433333 0.8133333

Varianzas por boquillas.

apply(datos,2,var)

## X tipo.1 tipo.2 tipo.3 tipo.4


## 3.932232e+01 4.566667e-04 1.386667e-03 1.776667e-03 1.290667e-02
## tipo.5
## 7.506667e-03

A continuación se presenta una gráfica.

par(mfrow=c(1,1))
boxplot(datos,horizontal=TRUE, col="green", main= "velocidad de salida de las diferentes boq

2
velocidad de salida de las diferentes boquillas

tipo.5
tipo.4
tipo.3
tipo.2


tipo.1
X

0 5 10 15 20 25

De acuerdo al box plot podemos observar que las velocidades de las boquillas
2, 3, 4, 5, 6 son muy parecidas en cambio la velocida de la boquilla 1 es muy
diferente al resto de las boquillas.

1.1 Análisis de varianza


H0 : µ1 = µ2
(1)

H1 : µ1 6= µ2
para al menos dos tratamientos i 6= j(2)

SStratamiento = a − 1 (3)

3
SSE = a(n − 1) (4)

SST = an − 1 (5)
El análisis de varianza se puede usar para evaluar la igualdad de los efectos del
tratamiento. En el modelo de efectos fijos, los efectos de tratamiento se suelen
definir como desviaciones de la media general µ, demodoque;
a
X
τi = 0 (6)
i=1

La suma de la identidad de los cuadrados es;

Pa Pn Pa Pa Pn
i=1 − ȳ)2 = n
j=1 (yij i=1 (ȳi − ȳ)2 + i=1 j=1 (yij − ȳ)2 (7)
o simbólicamente;

SST = SStratamiento + SSE (8)

datos

## X tipo.1 tipo.2 tipo.3 tipo.4 tipo.5


## 1 11.73 0.78 0.85 0.93 1.14 0.97
## 2 14.37 0.80 0.85 0.92 0.97 0.86
## 3 16.59 0.81 0.92 0.95 0.98 0.78
## 4 20.43 0.75 0.86 0.89 0.88 0.76
## 5 23.46 0.77 0.81 0.89 0.86 0.76
## 6 28.74 0.78 0.83 0.83 0.83 0.75

colnames(datos)

## [1] "X" "tipo.1" "tipo.2" "tipo.3" "tipo.4" "tipo.5"

dim(datos)

## [1] 6 6

Número de replicas ”n” por tratamiento;

n<-(dim(datos))[1]
n

## [1] 6

4
Número de ”a” de tratamientos (muestras)

a<-(dim(datos))[2]
a

## [1] 6

glE<-a*(n-1) #grados de libertad del error


glTrat<-(a-1) #grados de libertad de los tratamientos
glTot<-n*a-1 #grados de libertad totales
ymean<-mean(apply(datos,2,mean)) #promedio total
#obtención de las sumas de las diferencias de cuadrados de la identidad
SCT<-0.0
for(j in 1:a){
for(i in 1:n)
{
SCT<-SCT+sum((datos[i,j]- ymean)^2) #suma de diferencia de cuadrados total
}
}
SCTrat<-0.0
for(j in 1:a){
SCTrat<-SCTrat+sum((apply(datos,2,mean)[[j]]-ymean)^2)
}
SCTrat<-SCTrat*n #suma de diferencia de cuadrados para los tratamientos
SCE<-0.0
for(j in 1:a){
for(i in 1:n)
{
SCE<-SCE+sum((datos[i,j]- apply(datos,2,mean)[[j]])^2)
}
}
#Sumas de diferencias de cuadrados y grados de libertad
sumasdeC<-c(SCTrat,SCE,SCT)
gdl<-c(glTrat, glE, glTot)
# los cuadrados medios y el estadı́stico de prueba F
MSTrat<-SCTrat/glTrat
MSE<- SCE/glE
F0<-MSTrat/MSE # estadı́stico de prueba
cuadradmedios<-c(MSTrat, MSE, F0)
cuadradmedios

## [1] 337.158998 6.557726 51.414015

Medios cuadrados del tratamiento: 337.15 Medios cuadrados del error: 6.55
Medios cuadrados del tramiento entre medios cuadrados del error: 51.444

5
n<-(dim(datos))[1] # número de replicas "n" por tratamiento
a<-(dim(datos))[2] # número de a de tratamientos (muestras)
respuestaexp<-c()
for(j in 1:a)
{
respuestaexp<-c(respuestaexp,datos[,j])
}
nivel = rep(n, a)
tratexp = rep(1:a, nivel)
tratexp<-factor(tratexp)
datosanova<-data.frame(tratexp, respuestaexp)
datosanova
## tratexp respuestaexp
## 1 1 11.73
## 2 1 14.37
## 3 1 16.59
## 4 1 20.43
## 5 1 23.46
## 6 1 28.74
## 7 2 0.78
## 8 2 0.80
## 9 2 0.81
## 10 2 0.75
## 11 2 0.77
## 12 2 0.78
## 13 3 0.85
## 14 3 0.85
## 15 3 0.92
## 16 3 0.86
## 17 3 0.81
## 18 3 0.83
## 19 4 0.93
## 20 4 0.92
## 21 4 0.95
## 22 4 0.89
## 23 4 0.89
## 24 4 0.83
## 25 5 1.14
## 26 5 0.97
## 27 5 0.98
## 28 5 0.88
## 29 5 0.86
## 30 5 0.83
## 31 6 0.97
## 32 6 0.86

6
## 33 6 0.78
## 34 6 0.76
## 35 6 0.76
## 36 6 0.75

res.aov<-aov(respuestaexp ~ tratexp)
res.aov

## Call:
## aov(formula = respuestaexp ~ tratexp)
##
## Terms:
## tratexp Residuals
## Sum of Squares 1685.7950 196.7318
## Deg. of Freedom 5 30
##
## Residual standard error: 2.560806
## Estimated effects may be unbalanced

summary(res.aov)

## Df Sum Sq Mean Sq F value Pr(>F)


## tratexp 5 1685.8 337.2 51.41 8.17e-14 ***
## Residuals 30 196.7 6.6
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Verificación de supuestos; Normalidad

shapiro.test(respuestaexp)

##
## Shapiro-Wilk normality test
##
## data: respuestaexp
## W = 0.48996, p-value = 4.911e-10

qqnorm(respuestaexp)

7
Normal Q−Q Plot

25 ●


20
Sample Quantiles


15


10
5


● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●●●●●●● ● ● ● ● ● ● ●
0

−2 −1 0 1 2

Theoretical Quantiles

Los datos se consideran dentro de la normalidad.

homvarianzas<-bartlett.test(respuestaexp ~ tratexp)
homvarianzas

##
## Bartlett test of homogeneity of variances
##
## data: respuestaexp by tratexp
## Bartlett's K-squared = 173.78, df = 5, p-value < 2.2e-16

par(mfrow=c(2,2))
plot(res.aov)

8
Residuals vs Fitted Normal Q−Q

10 ●6 6●

4
Standardized residuals
5

2

Residuals


● ●


0


● ●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●

0


−5

●2

−2
●2
●1
●1

5 10 15 −2 −1 0 1 2

Fitted values Theoretical Quantiles

Constant Leverage:
Scale−Location Residuals vs Factor Levels
2.0

●6
●6
●1 4
Standardized residuals

Standardized residuals
1.5

●2
2

● ●
1.0

● ●
● ● ● ● ●
0

● ●


0.5

−2

●2






● ●1




0.0



−4

tratexp :
5 10 15 1 2 3 4 5 6

Fitted values Factor Level Combinations

1.2 Compraciones multiples


Una confianza del 100 por ciento en la media del i-ésimo tratamiento es µ;
r r
M SE M SE
ȳi − tα/2,a(n−1) ≤ µi ≤ ȳi + tα/2,a(n−1) (9)
n n

ic = 0.95 #nivel de confianza


alfa<-1-ic
talfa<-qt(alfa/2,a*(n-1), lower.tail = FALSE)
# atención para obtener MSE lo más facil es copiarlo de la tabla ANOVA
#sin embargo en la linea siguiente se usa el valor que se obtienen realizando los cálculos
desvtr<-sqrt(MSE/n)
# se obtienen "a"" intervalos de confianza, uno para cada tratamiento
liminf<-apply(datos,2,function(x){mean(x)-talfa*desvtr})
limsup<-apply(datos,2,function(x) {mean(x)+talfa*desvtr})

9
cis2 <- cbind(liminf,limsup)
colnames(cis2)<-c("limite inferior", "limite superior")
print(cis2)

## limite inferior limite superior


## X 17.084917 21.355083
## tipo.1 -1.353416 2.916749
## tipo.2 -1.281749 2.988416
## tipo.3 -1.233416 3.036749
## tipo.4 -1.191749 3.078416
## tipo.5 -1.321749 2.948416

Un intervalo de confianza del 100 por ciento sobre la diferencia en dos medios
de tratamiento µi − µ − jes;

r r
2M SE 2M SE
ȳi − ȳj − tα/2,a(n−1) ≤ µi − µj ≤ ȳi − ȳj + tα/2,a(n−1) (10)
n n

#calculo de intervalos de confianza


ic = 0.95
alfa<-1-ic
talfa<-qt(alfa/2,a*(n-1), lower.tail = FALSE)
desvtr<-sqrt(2*MSE/n)
liminf3<-mean(datos[,3])-mean(datos[,2])- talfa*desvtr#limite de confianza inferior
limsup3<-mean(datos[,3])-mean(datos[,2])+ talfa*desvtr#limite de confianza superior
c(liminf3, limsup3)

## [1] -2.947796 3.091129

La formula de la diferencia mı́nima significativa (LSD) es:


El método Fisher LSD compara todos los pares de medias con las hipótesis
nulas H0 : µi = µj , paratodoi 6= j, utilizandolat − estadı́stica;
ȳi − ȳj
t0 = q (11)
2M SE
n

Suponiendo una hipótesis alternativa de dos lados, el par de medias µi yµj sedeclararı́ansignif icativamented

|ȳi − ȳj | > LSD (12)


Donde LSD la diferencia menos significativa es
r
2M SE
LSD = ta/2,a(n−1) (13)
n
Si los tamaños de muestra son diferentes en cada tratamiento, el LSD se
define como;

10
s
1 1
LSD = ta/2,N −a M SE ∗ ( + ) (14)
ni nj

ic = 0.95
alfa<-1-ic
talfa<-qt(alfa/2,a*(n-1), lower.tail = FALSE)
LSD<-talfa*sqrt(2*MSE/n)
LSD

## [1] 3.019463

Retomamos, los promedios por tratamiento al compararlos con el LDS obtenido:


LDS=3.01

apply(datos,2,mean)

## X tipo.1 tipo.2 tipo.3 tipo.4 tipo.5


## 19.2200000 0.7816667 0.8533333 0.9016667 0.9433333 0.8133333

Las comparaciones entre los promedios de tratamiento observados son los


siguientes
6 vs. 1= 0.8133 - 19.22 = 18.4067 ¿ 3.01
6vs. 2=0.8133 - 0.7816 = 00.0317 ¡ 3.01
6 vs. 3=0.8133 - 0.8533 = 00.0400 ¡ 3.01
6 vs. 4=0.8133 - 0.9016 = 00.0883 ¡ 3.01
6 vs. 5=0.8133 - 0.9433 = 00.1300 ¡ 3.01
5 vs. 1=0.9433 - 19.22 = 18.2767 ¿ 3.01
5 vs. 2=0.9433 - 0.7816 = 00.1617 ¡ 3.01
5 vs. 3=0.9433 - 0.8533 = 00.0900 ¡ 3.01
5 vs. 4=0.9433 - 0.9016 = 00.0417 ¡ 3.01
4 vs. 1=0.9016 - 19.22 = 18.3184 ¿ 3.01
4 vs. 2=0.9016 - 0.7816 = 00.1200 ¡ 3.01
4 vs. 3=0.9016 - 0.8533 = 00.0483 ¡ 3.01
3 vs. 1=0.8533 - 19.22 = 18.3667 ¿ 3.01
3 vs. 2=0.8533 - 0.7816 = 00.0717 ¡ 3.01
2 vs. 1=0.7816 - 19.22 = 18.4384 ¿ 3.01
A partir de este análisis, vemos que existen diferencias significativas entre
algunos de los pares de medias, excepto; 6 y 2, 6 y 3, 6 y 4, 6 y 5, 5 y 2, 5 y 3,
5 y 4, 4 y 2, 4 y 3, 3 y 2. Esto implica que entre estos pares producen la misma
velocidad de flujo de salida. Pero se produce una velocida de salida mayor entre
la media que esta en la posición 5

#{r eval = FALSE}


res<-aov(respuestaexp ~ tratexp)
TukeyHSD(res)

11
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = respuestaexp ~ tratexp)
##
## $tratexp
## diff lwr upr p adj
## 2-1 -18.43833333 -22.935275 -13.941391 0.0000000
## 3-1 -18.36666667 -22.863609 -13.869725 0.0000000
## 4-1 -18.31833333 -22.815275 -13.821391 0.0000000
## 5-1 -18.27666667 -22.773609 -13.779725 0.0000000
## 6-1 -18.40666667 -22.903609 -13.909725 0.0000000
## 3-2 0.07166667 -4.425275 4.568609 1.0000000
## 4-2 0.12000000 -4.376942 4.616942 0.9999994
## 5-2 0.16166667 -4.335275 4.658609 0.9999976
## 6-2 0.03166667 -4.465275 4.528609 1.0000000
## 4-3 0.04833333 -4.448609 4.545275 1.0000000
## 5-3 0.09000000 -4.406942 4.586942 0.9999999
## 6-3 -0.04000000 -4.536942 4.456942 1.0000000
## 5-4 0.04166667 -4.455275 4.538609 1.0000000
## 6-4 -0.08833333 -4.585275 4.408609 0.9999999
## 6-5 -0.13000000 -4.626942 4.366942 0.9999992

plot(TukeyHSD(res))

12
95% family−wise confidence level

2−1
4−1
6−1
4−2
6−2
5−3
5−4
6−5

−20 −15 −10 −5 0 5

Differences in mean levels of tratexp

En el box plot tambien podemos observar las diferencias que presentaron los
pares; 6-2, 6-3, 6-4, 6-5, 5-2, 5-3, 5-4, 4-2, 4-3, 3-2

2 Método 2; una opción, todavı́a muy común, es


desarrollar cada suma de diferencias de cuadra-
dos para obtener las siguientes expresiones.
Las fórmulas de cálculo de sumas de cuadrados para el ANOVA con tamaños
de muestra iguales en cada tratamiento son;
a X n
X
2 y2
SST = (yij )− (15)
i=1 j=1
N
y

13
a
X y2 i y2
SST ratos = − (16)
i=1
n N
La suma de cuadrados de error se obtiene por sustracción como;

SSE = SST − SST ratos (17)


Usando R;

colnames(datos)

## [1] "X" "tipo.1" "tipo.2" "tipo.3" "tipo.4" "tipo.5"

rownames(datos)

## [1] "1" "2" "3" "4" "5" "6"

dim(datos)

## [1] 6 6

n<-(dim(datos))[1]
n

## [1] 6

a<-(dim(datos))[2]
a

## [1] 6

glE<-a*(n-1)
glTrat<-(a-1)
glTot<-n*a-1
#promedio total
ymean<-mean(apply(datos,2,mean))
#obtención de las sumas de las diferencias de cuadrados de la identidad
SCT<-0.0
for(j in 1:a)
{
for(i in 1:n)

14
{
SCT<-SCT+sum(((datos[i,j])-ymean)^2)
}
}
#suma de diferencia de cuadrados total
#Variabilidad total
N= a*n
SCT=SCT - ((ymean)^2)/N
#suma de cuadrados de los tratamientos
SCTrat<-0.0
for(j in 1:a){
SCTrat<-SCTrat+sum((apply(datos,2,mean)[[j]]-ymean)^2)
}
SCTrat<-SCTrat*n
# suma de cuadrados del error
SCE<-0.0
for(j in 1:a){
for(i in 1:n)
{
SCE<-SCE+sum((datos[i,j]- apply(datos,2,mean)[[j]])^2)
}
}
#Sumas de diferencias de cuadrados y grados de libertad
c(SCTrat,SCE,SCT)

## [1] 1685.7950 196.7318 1882.1002

## [1] 382.7917 130.1667 502.3471


c(glTrat, glE, glTot)

## [1] 5 30 35

# los cuadrados medios y el estadı́stico de prueba F


MSTrat<-SCTrat/glTrat
MSE<- SCE/glE
F0<-MSTrat/MSE
c(MSTrat, MSE, F0)

## [1] 337.158998 6.557726 51.414015

Podemos ver que usando este método también obtenemos un valor de los
medios cuadrados del trato de 337.1589, los medios cuadrados del error de 6.55
y la division entre estos de 51.41.

15
3 Conclusiones
Se obtuvieron los valores, siguientes; Los medios cuadrados del trato; 337.1589.
Los medios cuadrados del error; 6.55. La division entre estos; 51.41.
En el box plot de los pares de los valores de las medias, se pudo observar
que existen ciertos conjuntos de datos que podemos suponer serian las boquillas
correctas para una velocidad de salida adecuada, pero explorando mas, al com-
parar la LSD con los pares de medias se pudo obtener que la boquilla número 4
es la que nos sirviria mejor, siendo esta con un valor de la velocidad de 0.9433
m/s.

16

También podría gustarte