Documentos de Académico
Documentos de Profesional
Documentos de Cultura
02 Ejemplos Con R
02 Ejemplos Con R
comparativos simples en R.
1 Análisis de experimentos comparativos
simples en R.
Este texto se crea con el objetivo de brindar al participante una herramienta para el análisis de datos
provenientes de diseños comparativos simples, experimento con un único factor y dos niveles. El
software a emplear será R statistics. El motivo por el cual se opta este software es debido a que es
gratuito, trabaja en diferentes plataformas y existe extenso material en internet por si se requiere más
apoyo.
1.1 Inferencia sobre la diferencia de medias en observaciones independientes
La fuerza de la adhesión del mortero de un tipo de cemento es una característica
importante del producto. Un ingeniero está interesado en comparar la fuerza de adhesión
de un mortero modificado (fórmula modificada) a la que se ha agregado emulsiones de
polímeros de látex durante el mezclado, contra la fuerza de la argamasa (fórmula no
modificada). El experimento ha recolectado 10 observaciones de la fuerza de adhesión
de la fórmula modificada y otras 10 de la formula no modificada, es decir, se realizaron 10
réplicas del experimento.
.
Tabla 1. Datos del experimento.
Fórmula
Fórmula
j no
modificado
modificado
1 16.85 17.5
2 16.4 17.63
3 17.21 18.25
4 16.35 18
5 16.52 17.86
6 17.04 17.75
7 16.96 18.22
8 17.15 17.9
9 16.59 17.96
10 16.57 18.15
1.1.1 Cargar datos en R
Primeramente, se deben de cargar los datos en R. En este caso como son pocas observaciones se
cargan los datos de manera manual, es decir, se construye la base datos en R.
formula_modificada<-c(16.85,16.4,17.21,16.35,16.52,17.04,16.96,17.15,16.59,16.57)
Se coloca el puntero sobre la línea donde está el comando o instrucción y se oprime las teclas ctl+enter
para ejecutar el comando, dicho comando crea un vector de los datos del mortero modificado## y así para
cada comando.
formula_no_modificada<-c(17.5,17.63,18.25,18,17.86,17.75,18.22,17.9,17.96,18.15)
datos<-data.frame(formula_no_modificada,formula_modificada)
Con el código anterior genera la base de datos o tabla que contendrá la información de manera similar
a la tabla 1.
1.1.2 Gráficas en R
Una vez que se tienen los datos cargados es momento de analizarlos. En este caso, el interés en
particular es saber si la fuerza de adhesión de las dos fórmulas, modificado y no modificado, son iguales.
Para darse una idea, previo a la prueba 𝑡, se grafican los datos y de manera visual se analiza la
información de las dos fórmulas.
plot(datos$formula_no_modificada,xlab="Puntos",ylab="",rep(0,10),col="blue",xlim= c(16,18.5))
points(datos$formula_modificada,rep(0,10),col="red")
points(mean(datos$formula_no_modificada),0,col="blue",pch=20,cex=2)
points(mean(datos$formula_modificada),0,col="red",pch=20,cex=2)
legend("topright",legend=c("no modificado","modificado"),col=c("blue","red"),pch=c(1,1))
Interpretación. Con base en la figura 1 se tiene indicios de que las medias de las dos fórmulas de
morteros de cementos difieren en fuerza de adhesión, siendo mayor la media de la fórmula no
modificada. Además, se muestra indicios de que las varianzas de ambas fórmulas son iguales, la
dispersión de los puntos rojos y azules son muy similares.
Con base en la figura 2, claramente los datos proporcionados por la fórmula no modificada son de mayor
magnitud comparado con los datos proporcionados por la fórmula modificada. Este último gráfico
corrobora la información proporcionada por la figura 1.
𝐻0 : 𝜇1 = 𝜇2 𝑉𝑆 𝐻1 : 𝜇1 ≠ 𝜇2 (1)
Las hipótesis anteriores prueban si las fuerzas medias de las dos fórmulas son iguales o distintas.
El valor del estadístico t considerando igual varianza en ambas formulaciones fue de 𝑡0 = −9.1094. Los
grados de libertad son 18.
manera:
round(qt(0.05/2,18,lower.tail = F),3)
El resultado del código anterior es igual a 2.101. Como |−9.1094| > 2.101, entonces con un nivel de
significancia del 0.05 debe de rechazarse la hipótesis nula.
En la lectura no se estableció el concepto del p valor. El p valor se puede entender como el nivel de
significancia mínimo al que se rechaza la hipótesis nula. De modo que si el p valor proporcionado por la
prueba es menor al nivel de significancia preestablecido (𝛼) se rechaza la hipótesis nula. En este
documento el rechazo de la hipótesis nula de las pruebas de hipótesis será con base en el p valor.
t.test(datos$formula_modificada,datos$formula_no_modificada,alternative=
"two.sided",mu=0,paired=F,var.equal = T,conf.level = 0.95)
Mediante el análisis gráfico, figura 1 y 2, se obtuvo información de que la fuerza de adhesión media del
mortero modificado es menor a la del mortero no modificado. En este caso se podría realizar una prueba
unilateral de cola izquierda.
𝐻0 : 𝜇1 = 𝜇2 𝑉𝑆 𝐻1 : 𝜇1 < 𝜇2 (2)
El código en R es:
t.test(datos$formula_modificada,datos$formula_no_modificada,alternative=
"less",mu=0,paired=F,var.equal = T,conf.level = 0.95)
Si el interés es probar que la fuerza de adhesión de la fórmula no modificado es mayor a la del mortero
modificado, entonces se está en condiciones de llevar a cabo una prueba de hipótesis unilateral de cola
derecha.
𝐻0 : 𝜇1 = 𝜇2 𝑉𝑆 𝐻1 : 𝜇2 > 𝜇1 (3)
El código en R es:
t.test(datos$formula_no_modificada,datos$formula_modificada,alternative=
"greater",mu=0,paired=F,var.equal = T,conf.level = 0.95)
1.1.4 Verificación de los supuestos.
Cuando se realiza una prueba de hipótesis como las escritas en la ecuación 1, 2 𝑦 3 se deben de verificar
los supuestos.
1) Los datos de la resistencia de los datos del mortero modificado y no modificado deben de
distribuirse de manera normal.
El resultado es:
Como el valor del 𝑝 − 𝑣𝑎𝑙𝑢𝑒 es mayor que 𝛼 = 0.05 no se rechaza la hipótesis nula.
El resultado es:
Como el valor del 𝑝 − 𝑣𝑎𝑙𝑢𝑒 es mayor que 𝛼 = 0.05 no se rechaza la hipótesis nula.
var.test(datos$formula_no_modificada,datos$formula_modificada,alternative= "two.sided",conf.level =
0.95)
Concentración Concentración 𝒅𝒊
Localidad de zinc en el de zinc en la
Fondo (x) Superficie (y)
De la misma forma como se cargaron los datos en el ejercicio anterior, en este ejercicio se procede de
la misma manera.
fondo<-c(0.43,0.266,0.567,0.531,0.707,0.716)
superficie<-c(0.415,0.238,0.39,0.41,0.605,0.609)
datos<-data.frame(fondo,superficie)
1.2.2 Gráficas en R
Una vez que se tienen los datos cargados es momento de analizarlos. En este caso, el interés en
particular es tener idea de donde se encuentra el promedio de las 𝑑𝑖 .
Interpretación. Con base en la figura 3, al parecer la media de las diferencias 𝑑𝑖 = 𝑥𝑖 − 𝑦𝑖 es mayor que
cero. Se tiene indicios de que la concentración media de zinc en el fondo es mayor que la concentración
media de zinc de la superficie, es decir, 𝜇𝑓𝑜𝑛𝑑𝑜 − 𝜇𝑠𝑢𝑝𝑒𝑟𝑓𝑖𝑐𝑖𝑒 > 0.
En este caso se desea saber si el promedio de concentración en agua del fondo es diferente a la
concentración del agua de la superficie. Esto último se expresa como la siguiente prueba de hipótesis.
Como el 𝑝 − 𝑣𝑎𝑙𝑢𝑒 es menor a 𝛼 = 0.05 se rechaza la hipótesis nula con un nivel de significancia del
0.05.
prueba_t_pareada<-t.test(datos$fondo,datos$superficie,alternative = "two.sided",mu=0,paired=T,
conf.level = 0.99)
prueba_t_pareada<-t.test(datos$fondo,datos$superficie,alternative = "greater",mu=0,paired=T,conf.level
= 0.99)