Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Taller 7
Objetivo:
Evaluar diferencias significativas entre uno o dos grupos mediante inferencia estadística
aplicando pruebas paramétricas (t de Student) y no paramétricas (U de Mann Whitney y
Wilcoxon).
Contenido:
1. Prueba Paramétrica de t de Student
a. Prueba de t con una muestra
b. Prueba de t para dos muestras independientes
2. Prueba No Paramétrica de U de Mann Whitney & Wilcoxon
a. Prueba No paramétrica de U de Mann Whitney & Wilcoxon para muestras
independientes
3. Prueba de t y de U de Mann-Whitney & Wilcoxon para evaluar dDiferencias entre
dos muestras pareadas (dependientes)
1. Normalidad
2. Homocedasticidad
3. Independencia de los datos
Esta prueba permite evaluar si existen diferencias significativas entre uno y dos
grupos, a través del contraste de los promedios (µ) de una variable X aleatoria. Por
ejemplo, se puede evaluar si las mujeres y los hombres tienen distinta altura promedio en
una población. Por lo tanto, con una prueba de t se contrasta si las diferencias entre dos
promedios se deben al azar o no.
Salmonella: 0,593; 0,142; 0,329; 0,691; 0.231; 0,793; 0,519; 0,392; 0,418
Asumiremos que estos datos cumplen con los supuestos de normalidad y homogeneidad
de varianza.
Entonces ahora planteamos las hipótesis con las que trabajaremos:
Consideraremos que µ (mu) es el valor promedio por contrastar de Salmonella de TODOS
los completos del carro (población), entonces, las hipótesis pueden ser expresadas como:
H0: muestra ≤ 0,3 (μ permitido)
H1: muestra > 0,3 (μ permitido)
En este caso la prueba es de una cola, ya que el contraste es con un valor promedio
conocido (0,3), y nos interesa saber si el valor de la muestra es mayor a este promedio.
Ahora realizaremos la prueba de t en R.
Comenzaremos creando el vector que contendrá los valores de Salmonella medidos:
Salmonella = c(0.593, 0.142, 0.329, 0.691, 0.231, 0.793, 0.519, 0.392,
0.418)
Asumiremos que nuestros datos cumplen con los supuestos del análisis para la prueba t.
Las hipótesis por contrastar en una prueba de t de dos muestras serían:
H0: el tiempo promedio a la metamorfosis es igual entre las localidades (μ1=μ2)
H1: el tiempo promedio a la metamorfosis es diferente entre las localidades (μ1≠μ2)
En este caso la prueba de contraste sería de dos colas ya que no se tiene conocimiento a
priori si los valores a contrastar son mayores en un grupo o en otro. Es decir, se
desconoce la potencial diferencia entre ambas poblaciones, por lo que se somete a
prueba el supuesto de que son distintos.
Comenzaremos realizando esto en R, primero generaremos los vectores lógicos para
cada grupo a comparar (en este caso, cada localidad):
TAT=data$Localidad=="Tatio"
FAR=data$Localidad=="Farellones"
y luego realizamos la prueba de t con el comando t.test, pero ahora indicaremos que
la prueba es de dos colas
t.test(data$Tiempo[TAT],data$Tiempo[FAR],alternative="two.sided",var.equa
l=T)
##var.equal=T, indica al análisis que hay que asumir que los datos presentan varianzas
homogéneas (supuesto de homocedasticidad).
Obteniendo como resultado
Two Sample t-test
data: data$Tiempo[TAT] and data$Tiempo[FAR]
t = 6.9003, df = 28, p-value = 1.685e-07
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
27.65693 51.00974
sample estimates:
mean of x mean of y
72.46667 33.13333
2 2
S p=
√ ( n1 −1 ) S 2x + ( n2−1 ) S2x
1
n1 +n2−2
2
En este caso, calcularemos los grados de libertad como n1+n2-2 =___. Como estamos
realizando un contraste de hipótesis de dos colas, entonces, la zona de rechazo
corresponde a α/2=0,025, tal como se muestra en el gráfico a continuación:
Para este caso buscaremos el tcrítico considerando entonces un valor α = 0.025, y por lo
tanto el valor de tcritico es = __.
Dado que el t crítico=____1.701____ es __<____ t calculado=__6900___, entonces _______se
rechasa___ H0 con un α =0,05 y, concluimos que el tiempo promedio a la metamorfosis
es __significativamente diferente____ entre las localidades (μ1≠μ2).
2. Prueba No paramétrica U de Mann-Whitney & Wilcoxon
La Prueba de U Mann-Whitney es una “versión” no paramétrica de la prueba t de Student
aplicada para 2 muestras independientes con datos cuantitativos ordinales. El
planteamiento de partida es:
I. Las observaciones de ambos grupos son independientes.
II. Las observaciones son variables ordinales y continuas.
III. Los datos no siguen una distribución normal.
IV. Bajo la hipótesis nula, la distribución de los valores de ambas muestras es la
misma.
V. Bajo la hipótesis alternativa, la distribución de los valores de una de las muestras
tiende a exceder a los de la otra.
En este sentido esta prueba estadística utiliza la mediana como estimador y como
medida de tendencia central a comparar.
La prueba se basa en una comparación de cada observación xi de una primera muestra
con cada observación yj en una segunda muestra. Si las muestras tienen la misma
mediana, entonces cada observación tiene un 50% de probabilidad de ser mayor o menor
que la observación correspondiente de la otra muestra.
Asumiremos que los datos cumplen con el supuesto de normalidad, lo que nos permitirá
utilizar la prueba de t para muestras pareadas. Debido a que en este caso estamos
interesados en la disminución de la presión sanguínea utilizaremos una prueba de una
cola. De este modo, las hipótesis a contrastar son:
H0: el promedio de la presión sanguínea es igual o aumenta con la administración del
fármaco (μ1≤μ2)
H1: el promedio de la presión sanguínea es menor con la administración del fármaco
(μ1>μ2)
t.test(Despues,Antes,alternative="less",var.equal=TRUE,paired=TRUE)
Dado que nuestro valor de p fue >o< a α=0.05, entonces nuestra decisión estadística es
que se ______H0. Luego, podemos concluimos que __________________en la presión
sanguínea asociada a la administración del fármaco, lo que comprueba su efectividad.
Ahora evaluaremos lo mismo, pero utilizando la prueba de Wilcoxon ya que los datos no
cumplen con el criterio de normalidad
H0: la mediana de la presión sanguínea es igual o aumenta con la administración del
fármaco (med1≤med2)
H1: la mediana de la presión sanguínea es menor con la administración del fármaco
(med1>med2)
Y corremos en el comando en R para aplicar esta prueba:
wilcox.test(Despues,Antes,alternative="less",var.equal=TRUE,paired=TRUE)
## con la opción paired=TRUE especificamos que nuestras muestras son
pareadas
El resultado es el siguiente:
Wilcoxon signed rank test with continuity correction
data: Despues and Antes
V = 4, p-value = 0.009491
alternative hypothesis: true location shift is less than 0
Warning message:
In wilcox.test.default(Despues, Antes, alternative = "less", var.equal =
TRUE, :cannot compute exact p-value with ties
Dado que nuestro valor de p fue >o< a nuestro α=0.05, entonces nuestra decisión
estadística es que se __rechaza__ H0. Es decir, llegamos a la misma conclusión que
utilizando la prueba de t pareada, es decir, el fármaco es efectivo en disminuir la presión
sanguínea. Finalmente, con el siguiente comando haremos un boxplot que nos permitirá
ver la magnitud de la disminución de presión:
boxplot(Antes,Despues,names=c("Antes","Después"),ylab="Presión",xlab="Gru
po",col=c("orchid","red"), main="Efecto del Fármaco en la Presión
Sanguinea")
Tarea.
Obs: En cada test estadístico que realice debe plantear las hipótesis alternativa y
nula. Si realiza algún tipo de grafico recuerde modificar el rotulo de los ejes, el titulo
principal y los colores del gráfico.
Data=Iris
A) Evalué si existen diferencias significativas entre el largo del pétalo para cada
par de especies (I. versicolor vs I. setosa, I. versicolor vs I. virginica y I.
virginica vs I. setosa).
B) Grafique adecuadamente la variable para cada par de comparación