Está en la página 1de 5

ESTADISTICA INFERENCIAL CON R 1

HERALDO GONZALEZ SERRANO

INTERVALOS DE CONFIANZA Y TEST DE HIPOTESIS CON R


Estudiemos ahora la función en el lenguaje R, que nos ofrece tanto estimaciones
puntuales y por intervalos de confianza como test de hipótesis, es:

> t.test (datos_x, datos_y =NULL, alternative = "two.sided", mu = 0,


paired =FALSE, var.equal = FALSE, conf.level= 0.95)

Las opciones indicadas son todas las ofrecidas por defecto. Podemos poner sólo un
conjunto de datos para muestras unidimensionales (estimaciones puntuales) o dos
conjuntos para comparación de muestras.

El argumento alternative indica el tipo de contraste, bilateral two.sided, si la


hipótesis alternativa es mayor (Ho: menor o igual) se utiliza greater, si la hipótesis
alternativa es menor (Ho: mayor o igual) entonces se usa less.
En mu indicamos el valor de la hipótesis nula.
En paired=T estamos ante una situación de datos no pareados, para indicar que estamos
ante datos pareados poner paired=F.
Con var.equal estamos trabajando con los casos de igualdad o no de varianzas que sólo
se emplean en comparación de dos poblaciones. Si var.equal=T las varianzas de las dos
poblaciones son iguales si var.equal=F las varianzas de ambas poblaciones no se
suponen iguales.
Por último tenemos el argumento conf.level en el que indicamos el nivel de confianza
del test.
Si deseáramos hacer el contraste para la igualdad de varianzas (cociente de varianzas=1)
habríamos de emplear la función var.test:

var.test(x, y, ratio = 1, alternative = c("two.sided", "less",


"greater"), conf.level = 0.95, ...)

Los argumentos son los mismos que en la función t.test.

Pruebas para una muestra


Ejemplo 1
Los siguientes datos corresponden al rendimiento por hectárea de cierta nueva variedad
de trigo, medido en 9 lotes experimentales: 3,35; 3,92; 4,26; 3,36; 3,72; 4,19, 3,42;
4,38; 4,5.
Construya un intervalo de confianza al 90% de confianza para el rendimiento promedio
de la nueva variedad de trigo si suponemos que el rendimiento por hectárea se
distribuye aproximadamente normal.
En el lenguaje R procedemos como sigue
> T<-c(3.35,3.92,4.26,3.36,3.72,4.19,3.42,4.38,4.5)
> t.test(T,conf.level=0.90)

One Sample t-test


data: T
t = 25.674, df = 8, p-value = 5.681e-09
alternative hypothesis: true mean is not equal to 0
90 percent confidence interval:
3.617526 4.182474
sample estimates:
mean of x
3.9
ESTADISTICA INFERENCIAL CON R 2
HERALDO GONZALEZ SERRANO

El intervalo de confianza pedido es [3,6175;4,1825]

Note que el output entrega además la media con valor 3,9 y por defecto, el test de
hipótesis H 0 : μ = 0 en contra de la hipótesis alternativa H 1 : μ ≠ 0 . Se rechaza la
hipótesis nula ya que el valor de la prueba es p-value = 5.681e-09
X −0 3,9
El valor t = 25,674 es el valor de Tobs = = = 25,674 y df =8
s 0,455713725
n 3
indica que la muestra tenía 9 datos

Ejemplo 2
Imaginemos que deseamos verificar la hipótesis que el rendimiento medio es mayor
⎧H 0 : μ = 4
que 4; aquí el test es ⎨ , con el lenguaje R procedemos como sigue
⎩H 1 : μ > 4
> t.test(T,conf.level=0.90,alternative="greater",mu=4)

One Sample t-test

data: T
t = -0.6583, df = 8, p-value = 0.7356
alternative hypothesis: true mean is greater than 4
90 percent confidence interval:
3.687817 Inf
sample estimates:
mean of x
3.9
La hipótesis nula no se rechaza ya que el valor p-value = 0.7356 es alto

Ejemplo 3
Una operación de montaje en una fábrica manufacturera requiere aproximadamente un
período de entrenamiento de un mes para que un nuevo operario alcance la máxima
eficiencia. Se sugirió un nuevo método para el entrenamiento y se realizó una prueba
para comparar el método nuevo con el método estándar. Se entrenaron dos grupos de
9 nuevos empleados durante un período de un mes; un grupo utilizó el método
estándar y el otro grupo usó el método nuevo. Se midió el tiempo en minutos que
necesito cada empleado en armar cierto dispositivo al final del período de
entrenamiento; los resultados obtenidos fueron:

Método estándar 32 37 35 28 41 44 35 31 34
Método nuevo 35 31 29 25 34 40 27 32 31

Admitiendo que el tiempo de armado utilizado en ambos métodos son variables


aleatorias independientes y distribuidas normalmente: ¿Tiene igual varianza? ¿Se puede
aceptar la hipótesis de igualdad de tiempos de armado, en función de los datos y con
un nivel de confianza del 95%?
Estime la diferencia real de las medias poblacionales con un nivel de confianza del
95%.
ESTADISTICA INFERENCIAL CON R 3
HERALDO GONZALEZ SERRANO

Con R procedemos como sigue:


> E<-c(32,37,35,28,41,44,35,31,34)
> N<-c(35,31,29,25,34,40,27,32,31)
> var.test(E,N)

F test to compare two variances

data: E and N
F = 1.2205, num df = 8, denom df = 8, p-value = 0.7849
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.2753114 5.4109136
sample estimates:
ratio of variances
1.220527

Ahora que estamos seguros de la igualdad de varianzas veamos el intervalo de


confianza para la diferencia de medias y el test de igualdad de medias
ur
d
. Esta hipótesis de rechaza cuando TObs = S D
>t
n −1;
α
n 2

> t.test (E,N,paired=T,conf.level=0.95)

Paired t-test

data: E and N
t = 2.9938, df = 8, p-value = 0.01723
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
0.842400 6.490933
sample estimates:
mean of the differences
3.666667

Intervalo de confianza y test de hipótesis para p


Ejemplo 4
Se desea estudiar la proporción de individuos menores de 40 años en una determinada
ciudad. Se tomó una muestra aleatoria de 800 individuos y se encontró que 600 de
ellos tenían menos de 40 años. Determine la verdadera proporción de personas menores
de 40 años en la mencionada ciudad mediante un intervalo de confianza al 99% de
confianza
Solución.
Sea X = “Número de individuos menores de 40 años en la ciudad”, claramente X se
distribuye binomial de parámetro p, deseamos I.C.(p) con 1 − α = 0,99.

∧ 600
Los datos del problema son: n = 800; p = = 0,75; 1 − α = 0,99 de donde
800
α
1− = 0,995 y entonces z α = z 0 ,995 = 2,575, así, reemplazando en la fórmula
2 1−
2
declarada tenemos:
⎡ (0,75)(0,25) ⎤
⎥ = [0,7106 ; 0,7894]
(0,75)(0,25)
IC ( p ) = ⎢0,75 − 2,575 ;0,75 + 2,575
⎣ 800 800 ⎦
ESTADISTICA INFERENCIAL CON R 4
HERALDO GONZALEZ SERRANO

Podemos afirmar con un 99% de confianza que la proporción de individuos menores de


40 años en la ciudad esta entre 0,71 y 0,79

Podemos determinar el intervalo de confianza con el lenguaje R usando la función


prop.test. El ejemplo, anteriormente desarrollado, se obtiene:

> prop.test(600, 800,conf.level = 0.99)$conf.int


[1] 0.7079660 0.7878565
attr(,"conf.level")
[1] 0.99

Si no usa la opción $conf.int , el intervalo que se determina usa, por defecto, un 95%
de confianza

Conseguimos información adicional usando prop.test(x, n, conf.level = 0.99)


> prop.test(600, 800,conf.level = 0.99)

1-sample proportions test with continuity correction

data: 600 out of 800, null probability 0.5


X-squared = 199.0012, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.5
99 percent confidence interval:
0.7079660 0.7878565
sample estimates:
p
0.75

Pruebas para dos muestras


Ejemplo 5
Dos grupos son considerados en un grupo sobre la efectividad de una nueva vacuna. El
primer grupo, que recibe la vacuna contiene 200.745 individuos. El Segundo grupo, que
recibe un placebo consiste de 201.229 individuos. Hubo 57de enfermedad en el primer
grupo y 142 casos en el segundo grupo
Asumamos un modelo binomial para cada grupo, con probabilidad p1 de hacer la
enfermedad en el primer grupo y con probabilidad p 2 de hacer la enfermedad en el
segundo grupo; lo que deseamos saber es si la vacuna es o no eficiente, conocer las
relaciones entre las proporciones

Podemos usar prop.test para obtener un intervalo de confianza para la diferencia


de proporciones así como un test de hipótesis

Procedemos como sigue:


Loa dos primeros argumentos de la función son vectores que contienen,
respectivamente, el número de casos obtenidos y el segundo el tamaño de las muestras,
así:
> x <- c(57,142)
> n <- c(200745,201229)
ESTADISTICA INFERENCIAL CON R 5
HERALDO GONZALEZ SERRANO

Test de hipótesis
Ejemplo 6
El test H 0 : p1 − p 2 = 0 v/s H 1 : p1 − p 2 ≠ 0 es el que viene por defecto en prop.test
Si queremos el valor p del test procedemos como sigue
> prop.test(x, n)$p.value
[1] 2.866061e-09

El pequeño valor de p-value = 2.866061e-09 indica, claramente que la hipótesis nula


se rechaza y nos dice que la vacuna tiene algún efecto

Ejemplo 7
Para realizar un test unilateral que indique que la vacuna tiene efecto positivo, es decir,
H 1 : p1 < p 2 , usamos el argumento alt="l"
> prop.test(x, n, alt = "l")$p.value
[1] 1.433030e-09

Aquí, el valor p es aún más pequeño indicando que la vacuna es altamente eficiente
para la enfermedad en cuestión

Intervalos de confianza para la diferencia


Para obtener un intervalo de confianza para la diferencia de proporciones debemos usar,
adicionalmente, la opción conf.int.

Ejemplo 8
Para el caso de la vacuna, con un 95% de confianza ( que está por defecto) procedemos
como sigue:
> prop.test(x, n)$conf.int
[1] -0.0005641508 -0.0002792920
attr(,"conf.level")
[1] 0.95

Para obtener un intervalo de confianza con otro nivel de confianza usamos el


argumento opcional conf.level= , por ejemplo, un intervalo de confianza al 99% se
obtiene por:
> prop.test(x, n, conf.level = 0.99)$conf.int
[1] -0.0006073419 -0.0 prop.test 002361008
attr(,"conf.level")
[1] 0.99

Podemos obtener toda la información que otorga la función prop.test como sigue
> prop.test(x, n, conf.level = 0.90)

2-sample test for equality of proportions with continuity


correction

data: x out of n
X-squared = 35.2728, df = 1, p-value = 2.866e-09
alternative hypothesis: two.sided
90 percent confidence interval:
-0.0005420518 -0.0003013909
sample estimates:
prop 1 prop 2
0.0002839423 0.0007056637

También podría gustarte