Documentos de Académico
Documentos de Profesional
Documentos de Cultura
muestras
Selección de actividades resueltas
PID_00279908
Àngel J. Gil Estallo Jose Fco. Martínez Boscá Arnau Mir Torres
Ninguna parte de esta publicación, incluido el diseño general y la cubierta, puede ser copiada,
reproducida, almacenada o transmitida de ninguna forma, ni por ningún medio, sea este eléctrico,
mecánico, óptico, grabación, fotocopia, o cualquier otro, sin la previa autorización escrita
del titular de los derechos.
© FUOC • PID_00279908 3 Contraste de dos muestras. Selección de actividades resueltas
Índice
Introducción ........................................................................................ 5
Actividades ........................................................................................... 8
© FUOC • PID_00279908 5 Contraste de dos muestras. Selección de actividades resueltas
Introducción
Ejemplo
En una empresa informática se desea medir la eficiencia de dos servidores web. Para
ello, miden el tiempo de espera del cliente entre la petición que este hace y la respuesta
que le da el servidor. Se puede pedir lo siguiente:
presas, agentes, etc., diremos que hay algo en común en dichas muestras,
por lo que serán muestras dependientes o no independientes.
Aunque el contraste sobre varianzas forma parte del módulo siguiente, ha-
remos alguno para saber si son iguales o diferentes. Así podemos decidir el
tipo de contraste que haremos sobre las medias y el estadístico correspon-
diente.
© FUOC • PID_00279908 7 Contraste de dos muestras. Selección de actividades resueltas
Mapa conceptual
© FUOC • PID_00279908 8 Contraste de dos muestras. Selección de actividades resueltas
Actividades
Solución
Hemos de hacer un contraste para comparar dos medias. Dado que el enun-
ciado nos pregunta “si el servidor A es menos eficiente que el servidor B”,
considerando que un servidor es menos eficiente si es más lento, entonces
debemos contrastar si la media del tiempo de espera del servidor A es mayor
© FUOC • PID_00279908 9 Contraste de dos muestras. Selección de actividades resueltas
que la media del tiempo de espera del servidor B. Así pues, tenemos que
considerar una hipótesis alternativa unilateral. Hemos de considerar el caso
de no normalidad pero con muestras grandes (superior a treinta observacio-
nes). Las hipótesis nula y alternativa son H0 : A − B = 0, H1 : A − B 0 y
fijamos = 0.01 . El estadístico de contraste es:
xA − xB
z=
2
sA s2
+ B
nA nB
z<-(mean(ActR081$TA)-mean(ActR081$TB))/
sqrt((var(ActR081$TA)/length(ActR081$TA)) +
(var(ActR081$TB)/length(ActR081$TB)))
z
## [1] 3.713408
y el p-valor es P( Z 3.713408) :
pnorm(z, lower.tail=FALSE)
## [1] 0.0001022434
t.test(ActR081$TA,ActR081$TB,var.equal=TRUE,mu=0,conf.level=0.99)
##
## Two Sample t-test
##
## data: ActR081$TA and ActR081$TB
## t = 3.7134, df = 98, p-value = 0.0003399
## alternative hypothesis: true difference in means is not equal to 0
## 99 percent confidence interval:
## 0.3020033 1.7623967
## sample estimates:
## mean of x mean of y
## 9.9350 8.9028
c) Lo primero que se tiene que hacer es calcular las dos nuevas variables
(una para cada servidor, se enseñan los diez primeros valores de cada una):
for (i in 1:length(ActR081$TA))
{ if(ActR081$TA[i] < 9) {ActR081$PA[i]<-1}
else {ActR081$PA[i]<-0}
}
© FUOC • PID_00279908 10 Contraste de dos muestras. Selección de actividades resueltas
ActR081$PA[1:10]
## [1] 0 0 0 0 1 0 0 0 0 0
y para el servidor B:
for (i in 1:length(ActR081$TB))
{ if(ActR081$TB[i] < 9) {ActR081$PB[i]<-1}
else {ActR081$PB[i]<-0}
}
ActR081$PB[1:9]
## [1] 1 0 1 0 1 1 0 1 1
summary(ActR081$PA)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 0.00 0.00 0.12 0.00 1.00
summary(ActR081$PB)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 0.00 1.00 0.62 1.00 1.00
o hacerlo directamente:
pa<-length(ActR081$PA[ActR081$PA==1])/length(ActR081$PA)
pb<-length(ActR081$PB[ActR081$PB==1])/length(ActR081$PB)
pa
## [1] 0.12
pb
## [1] 0.62
Por lo tanto, las proporciones muestrales son 0.12 para el servidor A y 0.62
para el servidor B.
Tendremos que hacer ahora un contraste bilateral sobre la diferencia de pro-
porciones con un nivel de significación de 0.05 . Las hipótesis son:
H0 : pA = pB , H1 : pA pB . Primero calculamos la estimación de la propor-
ción poblacional común:
pcom<-(length(ActR081$TA)*0.12 +length(ActR081$TB)*0.62)/
(length(ActR081$TA)+length(ActR081$TB))
pcom
## [1] 0.37
z <- (pa-pb)/sp
z
## [1] -5.178081
2*pnorm(abs(z),lower.tail=FALSE)
## [1] 2.241794e-07
En una empresa se utilizan para hacer las copias de seguridad cintas magné-
ticas de dos tipos diferentes, A y B. La calidad de las cintas depende del nú-
mero de partículas magnéticas (NPM) por micra cuadrada en la superficie de
la cinta, de forma que cuantas más partículas, más calidad tiene la cinta.
Para estudiar la calidad de las cintas, se han tomado algunas medidas del
NPM de diez cintas de tipo A y siete cintas de tipo B y se obtuvo:
2
xA = 122.23, xB = 124.2857, sA = 337.938 y sb2 = 472.231 . Suponiendo que
las varianzas del NPM de los dos tipos de cintas son iguales, ¿podemos pen-
sar que ambos tipos de cintas tienen, en promedio, la misma calidad? (To-
mad = 0.05 ). Encontrad el p-valor del contraste.
Solución
xA − xB
t=
1 1
s +
10 7
donde xA y xB son las medias de los dos tipos de cintas que valen
xA = 122.23, xB = 124.2857 , y s es la desviación típica común.
2
9sA + 6sB2
s= = 19.79
15
scom<-sqrt((9*337.938+6*472.231)/15)
scom
## [1] 19.79028
t<-(122.23-124.2857)/(scom*sqrt((1/10)+(1/7)))
t
## [1] -0.2107814
El p-valor es:
2*pt(-0.2107814,df=15)
## [1] 0.8358945
© FUOC • PID_00279908 12 Contraste de dos muestras. Selección de actividades resueltas
Y el valor crítico:
qt(0.025,df=15,lower.tail=FALSE)
## [1] 2.13145
y por lo tanto aceptamos la hipótesis nula y concluimos que los dos tipos de
cintas tienen de media la misma calidad.
Actividad 3
Comparación de medias
Solución
ia<-c(47.2, 72.54, 59, 46.0, 74.1, 72.5, 46.9, 78.6, 42, 63.3)
ib<-c(46.1, 82.8, 63.6, 43.9, 76.4, 82.5, 50.4, 77.2, 40, 69.8)
##
## data: ia
## t = 13.753, df = 9, p-value = 2.391e-07
## alternative hypothesis: true mean is not equal to 0
## 90 percent confidence interval:
## 52.18832 68.23968
## sample estimates:
## mean of x
## 60.214
t.test(ib, alternative='two.sided', mu=0.0, conf.level=.90)
##
## One Sample t-test
##
## data: ib
## t = 11.916, df = 9, p-value = 8.177e-07
## alternative hypothesis: true mean is not equal to 0
## 90 percent confidence interval:
## 53.53638 73.00362
## sample estimates:
## mean of x
## 63.27
xA− B
t=
s
n
© FUOC • PID_00279908 14 Contraste de dos muestras. Selección de actividades resueltas
xA − xB
t=
1 1
s +
nA nB
Actividad 4
Contraste de medias
Solución
b) El test será:
t.test(Precio.Alquiler.Antes.Menos.300, Precio.Alquiler.Antes.Más.300,
alternative = "greater",var.equal=TRUE)
##
## Two Sample t-test
© FUOC • PID_00279908 16 Contraste de dos muestras. Selección de actividades resueltas
##
## data: Precio.Alquiler.Antes.Menos. 300 and Precio.Alquiler.Antes.Más.300
## t = 0.85844, df = 97, p-value = 0.1964
## alternative hypothesis: true difference in means is greater than 0
## 95 percent confidence interval:
## -0.3814182 Inf
## sample estimates:
## mean of x mean of y
## 11.80435 11.39623
Precio.Alquiler.Antes = ActR084$PrecioAm2
Precio.Alquiler.Después = ActR084$PrecioDm2
t.test(Precio.Alquiler.Antes, Precio.Alquiler.Después,paired =TRUE)
##
## Paired t-test
##
## data: Precio.Alquiler.Antes and Precio.Alquiler.Después
## t = 0.66342, df = 98, p-value = 0.5086
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -0.1810264 0.3628446
## sample estimates:
## mean of the differences
## 0.09090909
Dif.precio=ActR084$PrecioDm2 - ActR084$PrecioAm2
t.test(Dif.precio)
##
## One Sample t-test
##
## data: Dif.precio
## t = -0.66342, df = 98, p-value = 0.5086
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## -0.3628446 0.1810264
## sample estimates:
## mean of x
## -0.09090909
Como el valor 0 está dentro del intervalo, podemos decir que no tenemos
suficientes indicios para poder afirmar que el precio de los pisos ha subido.
Actividad 5
Contraste de medias
© FUOC • PID_00279908 17 Contraste de dos muestras. Selección de actividades resueltas
Solución
Precio.Alquiler.Antes.Centro = ActR085$PrecioAm2[ActR085$Ubi==1]
Precio.Alquiler.Antes.Barrios = ActR085$PrecioAm2[ActR085$Ubi==4]
b) El contraste es:
t.test(Precio.Alquiler.Antes.Centro, Precio.Alquiler.Antes.Barrios,
alternative = "greater",var.equal=TRUE)
© FUOC • PID_00279908 18 Contraste de dos muestras. Selección de actividades resueltas
##
## Two Sample t-test
##
## data: Precio.Alquiler.Antes.Centro and Precio.Alquiler.Antes.Barrios
## t = 0.54363, df = 37, p-value = 0.295
## alternative hypothesis: true difference in means is greater than 0
## 95 percent confidence interval:
## -1.004955 Inf
## sample estimates:
## mean of x mean of y
## 11.36667 10.88889
Precio.Alquiler.Después.Centro = ActR085$PrecioDm2[ActR085$Ubi==1]
Precio.Alquiler.Después.Barrios = ActR085$PrecioDm2[ActR085$Ubi==4]
t.test(Precio.Alquiler.Después.Centro,Precio.Alquiler.Después.Barrios)
alternative = "greater",var.equal=TRUE)
##
## Two Sample t-test
##
## data: Precio.Alquiler.Después.Centro and Precio.Alquiler.Después.Barrios
## t = 1.1854, df = 37, p-value = 0.1217
## alternative hypothesis: true difference in means is greater than 0
## 95 percent confidence interval:
## -0.4890769 Inf
## sample estimates:
## mean of x mean of y
## 11.60000 10.44444
t.test(Precio.Alquiler.Antes.Centro,Precio.Alquiler.Después.Centro,
conf.level = 0.95,paired=TRUE)
##
## Paired t-test
##
## data: Precio.Alquiler.Antes.Centro and Precio.Alquiler.Después.Centro
## t = -0.89323, df = 29, p-value = 0.3791
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -0.7675947 0.3009281
## sample estimates:
## mean of the differences
## -0.2333333
© FUOC • PID_00279908 19 Contraste de dos muestras. Selección de actividades resueltas
Como el valor 0 está dentro del intervalo, podemos decir que no tenemos
suficientes indicios para poder afirmar que el precio de los locales comercia-
les situados en el centro de la ciudad haya cambiado.