Está en la página 1de 11

1 Análisis de experimentos

comparativos simples en R.
1 Análisis de experimentos comparativos
simples en R.
Este texto se crea con el objetivo de brindar al participante una herramienta para el análisis de datos
provenientes de diseños comparativos simples, experimento con un único factor y dos niveles. El
software a emplear será R statistics. El motivo por el cual se opta este software es debido a que es
gratuito, trabaja en diferentes plataformas y existe extenso material en internet por si se requiere más
apoyo.
1.1 Inferencia sobre la diferencia de medias en observaciones independientes
La fuerza de la adhesión del mortero de un tipo de cemento es una característica
importante del producto. Un ingeniero está interesado en comparar la fuerza de adhesión
de un mortero modificado (fórmula modificada) a la que se ha agregado emulsiones de
polímeros de látex durante el mezclado, contra la fuerza de la argamasa (fórmula no
modificada). El experimento ha recolectado 10 observaciones de la fuerza de adhesión
de la fórmula modificada y otras 10 de la formula no modificada, es decir, se realizaron 10
réplicas del experimento.

.
Tabla 1. Datos del experimento.

Fórmula
Fórmula
j no
modificado
modificado

1 16.85 17.5

2 16.4 17.63

3 17.21 18.25

4 16.35 18

5 16.52 17.86

6 17.04 17.75

7 16.96 18.22

8 17.15 17.9

9 16.59 17.96

10 16.57 18.15
1.1.1 Cargar datos en R

Primeramente, se deben de cargar los datos en R. En este caso como son pocas observaciones se
cargan los datos de manera manual, es decir, se construye la base datos en R.

formula_modificada<-c(16.85,16.4,17.21,16.35,16.52,17.04,16.96,17.15,16.59,16.57)
Se coloca el puntero sobre la línea donde está el comando o instrucción y se oprime las teclas ctl+enter
para ejecutar el comando, dicho comando crea un vector de los datos del mortero modificado## y así para
cada comando.

formula_no_modificada<-c(17.5,17.63,18.25,18,17.86,17.75,18.22,17.9,17.96,18.15)
datos<-data.frame(formula_no_modificada,formula_modificada)

Con el código anterior genera la base de datos o tabla que contendrá la información de manera similar
a la tabla 1.

1.1.2 Gráficas en R

Una vez que se tienen los datos cargados es momento de analizarlos. En este caso, el interés en
particular es saber si la fuerza de adhesión de las dos fórmulas, modificado y no modificado, son iguales.
Para darse una idea, previo a la prueba 𝑡, se grafican los datos y de manera visual se analiza la
información de las dos fórmulas.

figura 1. Gráfico de dispersión


Punto azul y rojo más grande y más intenso indican las
medias de las fórmulas.
Comando para la figura 1.

plot(datos$formula_no_modificada,xlab="Puntos",ylab="",rep(0,10),col="blue",xlim= c(16,18.5))
points(datos$formula_modificada,rep(0,10),col="red")
points(mean(datos$formula_no_modificada),0,col="blue",pch=20,cex=2)
points(mean(datos$formula_modificada),0,col="red",pch=20,cex=2)
legend("topright",legend=c("no modificado","modificado"),col=c("blue","red"),pch=c(1,1))

Interpretación. Con base en la figura 1 se tiene indicios de que las medias de las dos fórmulas de
morteros de cementos difieren en fuerza de adhesión, siendo mayor la media de la fórmula no
modificada. Además, se muestra indicios de que las varianzas de ambas fórmulas son iguales, la
dispersión de los puntos rojos y azules son muy similares.

figura 2.Graficos boxplot.

Con base en la figura 2, claramente los datos proporcionados por la fórmula no modificada son de mayor
magnitud comparado con los datos proporcionados por la fórmula modificada. Este último gráfico
corrobora la información proporcionada por la figura 1.

Comando para generar la figura 1 es

boxplot(datos, main="Gráficos boxplot")


1.1.3 Prueba 𝒕 en R

Es hora de probar las hipótesis

𝐻0 : 𝜇1 = 𝜇2 𝑉𝑆 𝐻1 : 𝜇1 ≠ 𝜇2 (1)

Las hipótesis anteriores prueban si las fuerzas medias de las dos fórmulas son iguales o distintas.

𝜇1 : Denota la media de la fuerza de adhesión de la fórmula modificada.

𝜇2 : Denota la media de la fuerza de adhesión de la fórmula no modificada.

El resultado obtenido en R fue:

El valor del estadístico t considerando igual varianza en ambas formulaciones fue de 𝑡0 = −9.1094. Los
grados de libertad son 18.

Considerando un nivel de significancia del 0.05 el valor de 𝑡0.05, 18


en R se obtienen de la siguiente
2

manera:

round(qt(0.05/2,18,lower.tail = F),3)

El resultado del código anterior es igual a 2.101. Como |−9.1094| > 2.101, entonces con un nivel de
significancia del 0.05 debe de rechazarse la hipótesis nula.

En la lectura no se estableció el concepto del p valor. El p valor se puede entender como el nivel de
significancia mínimo al que se rechaza la hipótesis nula. De modo que si el p valor proporcionado por la
prueba es menor al nivel de significancia preestablecido (𝛼) se rechaza la hipótesis nula. En este
documento el rechazo de la hipótesis nula de las pruebas de hipótesis será con base en el p valor.

En nuestro ejemplo como el p valor es igual a 0.0000000367 y es menor al nivel de significancia


preestablecido 0.05, por lo tanto, se rechaza la hipótesis nula.
Con base a la muestra obtenida y tras realizar el análisis se rechaza la hipótesis nula con un nivel de
significancia del 0.95.

En R el comando encargado de hacer la prueba 𝑡 es el siguiente:

t.test(datos$formula_modificada,datos$formula_no_modificada,alternative=
"two.sided",mu=0,paired=F,var.equal = T,conf.level = 0.95)

Mediante el análisis gráfico, figura 1 y 2, se obtuvo información de que la fuerza de adhesión media del
mortero modificado es menor a la del mortero no modificado. En este caso se podría realizar una prueba
unilateral de cola izquierda.

𝐻0 : 𝜇1 = 𝜇2 𝑉𝑆 𝐻1 : 𝜇1 < 𝜇2 (2)

El código en R es:

t.test(datos$formula_modificada,datos$formula_no_modificada,alternative=
"less",mu=0,paired=F,var.equal = T,conf.level = 0.95)

Si el interés es probar que la fuerza de adhesión de la fórmula no modificado es mayor a la del mortero
modificado, entonces se está en condiciones de llevar a cabo una prueba de hipótesis unilateral de cola
derecha.

𝐻0 : 𝜇1 = 𝜇2 𝑉𝑆 𝐻1 : 𝜇2 > 𝜇1 (3)

El código en R es:

t.test(datos$formula_no_modificada,datos$formula_modificada,alternative=
"greater",mu=0,paired=F,var.equal = T,conf.level = 0.95)
1.1.4 Verificación de los supuestos.

Cuando se realiza una prueba de hipótesis como las escritas en la ecuación 1, 2 𝑦 3 se deben de verificar
los supuestos.

1) Los datos de la resistencia de los datos del mortero modificado y no modificado deben de
distribuirse de manera normal.

Para verificar dicho supuesto se realiza la prueba de Shapiro.

𝐻0 : 𝐷𝑎𝑡𝑜𝑠 𝑑𝑒𝑙 𝑚𝑜𝑟𝑡𝑒𝑟𝑜 𝑛𝑜 𝑚𝑜𝑑𝑖𝑓𝑖𝑐𝑎𝑑𝑜 𝑠𝑜𝑛 𝑛𝑜𝑟𝑚𝑎𝑙𝑒𝑠


𝑉𝑆
𝐻1 : 𝐷𝑎𝑡𝑜𝑠 𝑑𝑒𝑙 𝑚𝑜𝑟𝑡𝑒𝑟𝑜 𝑛𝑜 𝑚𝑜𝑑𝑖𝑓𝑖𝑐𝑎𝑑𝑜 𝑛𝑜 𝑠𝑜𝑛 𝑛𝑜𝑟𝑚𝑎𝑙𝑒𝑠

El resultado es:

W = 0.96262, p-value = 0.8153

Como el valor del 𝑝 − 𝑣𝑎𝑙𝑢𝑒 es mayor que 𝛼 = 0.05 no se rechaza la hipótesis nula.

𝐻0 : 𝐷𝑎𝑡𝑜𝑠 𝑑𝑒𝑙 𝑚𝑜𝑟𝑡𝑒𝑟𝑜 𝑚𝑜𝑑𝑖𝑓𝑖𝑐𝑎𝑑𝑜 𝑠𝑜𝑛 𝑛𝑜𝑟𝑚𝑎𝑙𝑒𝑠


𝑉𝑆
𝐻1 : 𝐷𝑎𝑡𝑜𝑠 𝑑𝑒𝑙 𝑚𝑜𝑟𝑡𝑒𝑟𝑜 𝑚𝑜𝑑𝑖𝑓𝑖𝑐𝑎𝑑𝑜 𝑛𝑜 𝑠𝑜𝑛 𝑛𝑜𝑟𝑚𝑎𝑙𝑒𝑠

El resultado es:

W = 0.91863, p-value = 0.3457

Como el valor del 𝑝 − 𝑣𝑎𝑙𝑢𝑒 es mayor que 𝛼 = 0.05 no se rechaza la hipótesis nula.

El código en R que se encarga de realizar dicha prueba es

shapiro.test(datos$formula_no_modificada)##prueba de normalidad de los datos no modificado##


shapiro.test(datos$formula_modificada)##prueba de normalidad de los datos modificado##

2) La varianza del mortero modificado y no modificado deben de ser iguales.


𝐻0 : 𝜎12 = 𝜎22 𝑉𝑠 𝐻1 : 𝜎12 ≠ 𝜎22

𝜎12 : Denota la varianza del mortero modificado


𝜎22 : Denota la varianza del mortero no modificado

Tras ejecutar la prueba en el resultado fue el siguiente:

F = 0.61378, num df = 9, denom df = 9, p-value = 0.4785

El 𝑝 − 𝑣𝑎𝑙𝑢𝑒 es mayor que 𝛼 = 0.05 por lo que no se rechaza la hipótesis nula.

El código para ejecutarlo en R es

var.test(datos$formula_no_modificada,datos$formula_modificada,alternative= "two.sided",conf.level =
0.95)

1.2 Comparación de medias pareadas en r


Para realizar la comparación de medias pareadas en R se prosigue de la siguiente manera.

Vestigios de metales en el agua potable afectan su sabor, y concentraciones demasiadas


altas pueden representar un riesgo para la salud. En un artículo se reportó que se
seleccionaron seis (objetos experimentales) y se determinó la concentración de Zinc (en
mg/L) para agua de la superficie y para agua del fondo en cada una de las 6 localidades.
Los seis pares de observaciones se muestran en la tabla siguiente ¿Sugiere esta
información que el verdadero promedio de concentración en agua del fondo es diferente
la de la superficie del agua? Utilice un 𝛼 = 0.01

Concentración Concentración 𝒅𝒊
Localidad de zinc en el de zinc en la
Fondo (x) Superficie (y)

1 0.43 0.415 0.015

2 0.266 0.238 0.028

3 0.567 0.39 0.177

4 0.531 0.41 0.121

5 0.707 0.605 0.102

6 0.716 0.609 0.107

Tabla 2. Datos de las 6 localidades.


1.2.1 Cargar datos en R.

De la misma forma como se cargaron los datos en el ejercicio anterior, en este ejercicio se procede de
la misma manera.

fondo<-c(0.43,0.266,0.567,0.531,0.707,0.716)
superficie<-c(0.415,0.238,0.39,0.41,0.605,0.609)
datos<-data.frame(fondo,superficie)

Este comando crea en R una tabla igual a la tabla 2.

1.2.2 Gráficas en R

Una vez que se tienen los datos cargados es momento de analizarlos. En este caso, el interés en
particular es tener idea de donde se encuentra el promedio de las 𝑑𝑖 .

Figura 3. Gráfico de las diferencias

Comando para la figura 3

dif<-datos$fondo-datos$superficie###diferencia entre datos del fondo y superficie###


plot(dif,xlab=" Puntos",ylab="",rep(0,6),col="blue",xlim= c(0,0.18))
points(mean(dif),0,col="red",pch=20,cex=2)
legend("topright",legend=c("Dif(fondo,sup)","diferencia de medias"),col=c("blue","red"),pch=c(1,20))

Interpretación. Con base en la figura 3, al parecer la media de las diferencias 𝑑𝑖 = 𝑥𝑖 − 𝑦𝑖 es mayor que
cero. Se tiene indicios de que la concentración media de zinc en el fondo es mayor que la concentración
media de zinc de la superficie, es decir, 𝜇𝑓𝑜𝑛𝑑𝑜 − 𝜇𝑠𝑢𝑝𝑒𝑟𝑓𝑖𝑐𝑖𝑒 > 0.

1.2.3 Prueba 𝒕 pareada

En este caso se desea saber si el promedio de concentración en agua del fondo es diferente a la
concentración del agua de la superficie. Esto último se expresa como la siguiente prueba de hipótesis.

𝐻0 : 𝜇𝑓𝑜𝑛𝑑𝑜 − 𝜇𝑠𝑢𝑝𝑒𝑟𝑓𝑖𝑐𝑖𝑒 = 0 𝑉𝑠 𝐻1 : 𝜇𝑓𝑜𝑛𝑑𝑜 − 𝜇𝑠𝑢𝑝𝑒𝑟𝑓𝑖𝑐𝑖𝑒 ≠ 0

El resultado obtenido en R fue:

t = 3.6998, df = 5, p-value = 0.014

Como el 𝑝 − 𝑣𝑎𝑙𝑢𝑒 es menor a 𝛼 = 0.05 se rechaza la hipótesis nula con un nivel de significancia del
0.05.

En R el comando encargado de hacer la prueba 𝑡 es el siguiente:

prueba_t_pareada<-t.test(datos$fondo,datos$superficie,alternative = "two.sided",mu=0,paired=T,
conf.level = 0.99)

Si la pregunta a responder fuera:

¿Sugiere la información que el verdadero promedio de concentración en agua del


fondo excede al de la superficie del agua?

La hipótesis a establecer es la siguiente:

𝐻0 : 𝜇𝑓𝑜𝑛𝑑𝑜 − 𝜇𝑠𝑢𝑝𝑒𝑟𝑓𝑖𝑐𝑖𝑒 = 0 𝑉𝑠 𝐻1 : 𝜇𝑓𝑜𝑛𝑑𝑜 − 𝜇𝑠𝑢𝑝𝑒𝑟𝑓𝑖𝑐𝑖𝑒 > 0

Y el comando que realiza dicha prueba es:

prueba_t_pareada<-t.test(datos$fondo,datos$superficie,alternative = "greater",mu=0,paired=T,conf.level
= 0.99)

También podría gustarte