Está en la página 1de 20

Intervalos de Confianza II

Universidad del Desarrollo

2019

Danilo Garrido M (UDD) Intervalos de Confianza 2019 1 / 20


En el curso anterior, nos dedicamos a estimar un parámetro, de una distribución asociada a
una muestra aleatoria simple. En muchos casos, nos interesa realizar una comparacion de los
parametros de varias poblaciones Ej
1. Comparar las medias de rendimiento de un vehiculo a gasolina o diesel.
2. Comparar el tiempo de curacion de una quemadura frente a 2 cremas distintas
3. Resistencia al fuego de un piso flotante con o sin algun aditivo en su fabricacion.
4. Comparar los rendimientos academicos entre generaciones.

Danilo Garrido M (UDD) Intervalos de Confianza 2019 2 / 20


Consideracion Técnica

Máxima Verosimilitud
Supongamos que tenemos una muestra aleatoria simple X1 , X2 , ..., Xn e Y1 , Y2 , ..., Ym en
donde
X1 , X2 , ..., Xn , Y1 , Y2 , ..., Ym
son independientes.
Sabemos que
iid iid
Xi ∼ f (θ1 ) ∧ Yi ∼ f (θ2 )
Por tanto nuestra funcion de verosimilitud

L(θ1 , θ2 ) = L(θ1 )L(θ2 )

Por tanto nuestro estimador máximo verosimil por parámetro es el mismo.

Ejemplo
iid 2 iid 2
Si Xi ∼ N (µX , σX ) y Yi ∼ N (µY , σY ) entonces el EMV de µX − µY es X̄ − Ȳ

Danilo Garrido M (UDD) Intervalos de Confianza 2019 3 / 20


IC para diferencia de medias, caso varianzas conocidas.
iid 2 iid 2
Sean X1 , ..., Xn ∼ N(µX , σX ), Y1 , ..., Ym ∼ N(µY , σY ) con σX , σY conocidos. Se puede
demostrar que:
X − Y − (µX − µY )
s ∼ N (0, 1)
σX2 2
σY
+
n m

IC Diferencia de media varianza conocida


 s s 
2
σX 2
σY 2
σX 2
σY
X − Y − z1−α/2 + , X − Y + z1−α/2 + 
n m n m

Caso varianzas iguales y conocidas, σX = σY = σ


" r r #
1 1 1 1
X − Y − z1−α/2 σ + , X − Y + z1−α/2 σ +
n m n m

n,m grandes
Si n, m son grandes, relajamos la hipótesis de normalidad...

Danilo Garrido M (UDD) Intervalos de Confianza 2019 4 / 20


IC para diferencia de medias, caso varianzas iguales pero desconocidas.

iid iid
Sean X1 , ..., Xn ∼ N(µX , σ 2 ), Y1 , ..., Ym ∼ N(µY , σ 2 ) con σ desconocido. Se puede
demostrar que:
X − Y − (µX − µY )
r ∼ tn+m−2
1 1
SP +
n m
donde
2 + (m − 1)S 2
(n − 1)SX
Sp2 = Y
n+m−2

IC Diferencia de media varianzas iguales pero desconocidas


" r r #
1−α/2 1 1 1−α/2 1 1
X − Y − tn+m−2 Sp + , X − Y + tn+m−2 Sp +
n m n m

Danilo Garrido M (UDD) Intervalos de Confianza 2019 5 / 20


Sp2

Se puede probar que un estimador máximo verosı́mil para la varianza común es


Pn 2 Pm 2
i=1 Xi − X̄ i=1 Yi − Ȳ
σ̂ 2 =
n+m
2
Pero σ̂ no es un estimador insesgado.
Es por eso que definimos Sp2
Pn 2 Pm 2
i=1 Xi − X̄ + i=1 Yi − Ȳ
Sp2 =
n+m−2
2 + (m − 1)S 2
(n − 1)SX Y
=
n+m−2

Estimador insesgado de σ 2 Ademas


2
(n − 1)SX (m − 1)SY2
UX = ∼ χ2n−1 , UY = ∼ χ2m−1
σ σ
Por tanto
U = UX + UY ∼ χ2n+m−2

Danilo Garrido M (UDD) Intervalos de Confianza 2019 6 / 20


IC para diferencia de medias, caso varianzas desconocidas y distintas.

iid 2 iid 2
Sean X1 , ..., Xn ∼ N(µX , σX ), Y1 , ..., Ym ∼ N(µY , σY ) con σX , σY desconocidas y distintas.
Se puede demostrar que:
X − Y − (µX − µY ) ·
s ∼ tdf
2
SX SY2
+
n m
donde df es el entero mas cercano a
2 /n + S 2 /m
2
SX Y
2 /n)2
(SX (S 2 /m)2
+ Y
n−1 m−1

Danilo Garrido M (UDD) Intervalos de Confianza 2019 7 / 20


Ejemplos

Una muestra aleatoria de tamaño n1 = 25, tomada de una población normal con una
desviación estándar σ1 = 5, tiene una media X 1 = 80. Una segunda muestra aleatoria de
tamaño n2 = 36, que se toma de una población normal diferente con una desviación estándar
σ2 = 3, tiene una media X 2 = 75. Calcule un intervalo de confianza del 95 % para µ1 − µ2 .
Comente

Idem al ejercicio anterior pero con varianzas desconocidas e iguales y SX = 5 y SY = 3.

Idem al ejercicio anterior pero con varianzas desconocidas y distintas, con SX = 5 y SY = 3.

Danilo Garrido M (UDD) Intervalos de Confianza 2019 8 / 20


En un estudio que se lleva a cabo en Virginia Tech sobre el desarrollo de micorriza, (una
relación simbiótica entre las raı́ces de árboles y un hongo, en la cual se transfieren minerales
del hongo a los árboles y azúcares de los árboles a los hongos), se cultivaron en un
invernadero 20 robles rojos que fueron expuestos al hongo Pisolithus tinctorus.
Todos los árboles se plantaron en el mismo tipo de suelo y recibieron la misma cantidad de
luz solar y agua. La mitad no recibió nitrógeno en el momento de plantarlos y sirvió como
control, y la otra mitad recibió 368 ppm de nitrógeno en forma de N aN O3 . Después de 140
dı́as se registraron los siguientes pesos de los tallos, en gramos:

Sinnitrogeno = (0.32, 0.53, 0.28, 0.37, 0.47, 0.43, 0.36, 0.42, 0.38, 0.43)
Connitrogeno = (0.26, 0.43, 0.47, 0.49, 0.52, 0.75, 0.79, 0.86, 0.62, 0.46)
Construya un intervalo de confianza del 95 % para la diferencia entre los pesos medios de los
tallos que no recibieron nitrógeno y los que recibieron 368 ppm de nitrógeno.

Danilo Garrido M (UDD) Intervalos de Confianza 2019 9 / 20


Sol R

sin <- c(0.32, 0.53, 0.28, 0.37, 0.47, 0.43, 0.36, 0.42, 0.38, 0.43)
con <- c(0.26, 0.43, 0.47, 0.49, 0.52, 0.75, 0.79, 0.86, 0.62, 0.46)
t.test(sin,con,var.equal = T,conf.level = 0.99)

##
## Two Sample t-test
##
## data: sin and con
## t = -2.6191, df = 18, p-value = 0.01739
## alternative hypothesis: true difference in means is not equal to 0
## 99 percent confidence interval:
## -0.34843753 0.01643753
## sample estimates:
## mean of x mean of y
## 0.399 0.565

Danilo Garrido M (UDD) Intervalos de Confianza 2019 10 / 20


Diferencias de proporciones.

iid iid
Sean X1 , ..., Xn ∼ Ber(p1 ), e Y1 , ..., Ym ∼ Ber(p2 ) (independiencia entre variables X e Y).
Para n, m grandes, se puede demostrar que:

pˆ1 − pˆ2 − (p1 − p2 ) ·


r ∼ N (0, 1)
p1 (1 − p1 ) p2 (1 − p2 )
+
n m
Asi obtenemos el siguiente IC para la diferencia de medias

IC Diferencia de media varianzas iguales pero desconocidas


r
p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 )
pˆ1 − pˆ2 ± z1−α/2 +
n m

Como pasó de pi a pˆi ?

Danilo Garrido M (UDD) Intervalos de Confianza 2019 11 / 20


Ejemplos

Supongamos que un fabricante necesita cierta pieza que puede ser proporcionada por dos
abastecedores A y B a un mismo precio. Las piezas de A son defectuosas con probabilidad p1
y las de B con probabilidad p2 . Supongamos ademas que de n1 = 100 piezas del proveedor A
se encontraron 10 piezas defectuosas mientras que de las n2 = 150 del proveedor B se econtro
11 defectuosas. Interesa determinar un intervalo del 90 % de confianza para la diferencia de
proporciones de piezas defectuosas de estos dos abastecedores.

Danilo Garrido M (UDD) Intervalos de Confianza 2019 12 / 20


Cociente de varianzas

iid 2 iid 2 2 2
Sean X1 , ..., Xn ∼ N(µ1 , σX ), Y1 , ..., Ym ∼ N(µ2 , σY ) todas independientes con σX y σY
desconocidos. Sabemos que
S2
UX = (n − 1) X 2
∼ χ2n−1
σX
y
SY2
UY = (m − 1) 2
∼ χ2m−1
σY
Asi,
UX /(n − 1) S 2 σ2
= X2 Y2 ∼ F (n − 1, m − 1)
UY /(m − 1) SY σX
Con esto, teniendo en cuenta que fα/2 y f1−α/2 (no hay simetrı́a) como los cuantiles α/2 y
1 − α/2 de la distribución asociada. construimos el IC.

Danilo Garrido M (UDD) Intervalos de Confianza 2019 13 / 20


Ejemplo

IC para razón de varianzas.


Notemos que !
SX2 σ2
n−1,m−1 Y n−1,m−1
P fα/2 ≤ ≤ f1−α/2 =1−α
SY2 σX
2

Entonces !
SY2 n−1,m−1 σ2 S 2 n−1,m−1
P 2
fα/2 ≤ Y
2
≤ Y f
2 1−α/2
=1−α
SX σX SX
Usando la propiedad de la distribucion F
1
fαn−1,m−1 = m−1,n−1
f1−α

2
σY
El intervalo de confianza para 2
es
σX
 
SY2 1 SY2 n−1,m−1

2
, f
m−1,n−1 S 2 1−α/2

SX f1−α/2 X

Danilo Garrido M (UDD) Intervalos de Confianza 2019 14 / 20


Ejemplo

En clases uso del IC para estudiar la igualdad de varianzas.


Se realiza un estudio para comparar los contenidos de nicotina de dos marcas de cigarrillo. 10
cigarrillo de la marca A dieron un contenido promedio en nicotina de 3.1 mlgr, con una
desviación estándar de 0.5 mlgr., mientras que 8 cigarrillos de la marca B dieron un
contenido promedio de 2.7 mlgr, con una desviación estandar de 0.7. Suponiendo que estos
dos conjuntos de datos provienen de distribuciones normales independientes, estamos
interesados en construir un intervalo del 95 % de confianza para la verdadera diferencia en el
contenido medio de nicotina de las 2 marcas.

Danilo Garrido M (UDD) Intervalos de Confianza 2019 15 / 20


En un estudio de hábitos de fumador para personas zurdas y derechas, una muestra aleatoria
de 400 zurdos revelo que 190 de estos fuman, y en una muestra aleatoria de 800 derechos 300
de estos fuman. Tiene evidencia suficiente para afirmar que la proporcion de zurdos
fumadores es igual a la de derechos fumadores? Use significancia del 98 %

Danilo Garrido M (UDD) Intervalos de Confianza 2019 16 / 20


x <- c(190,300)
n=c(400,800);x/n

## [1] 0.475 0.375

prop.test(x,n,alternative = 'two.sided',correct = F,conf.level = 0.98)

##
## 2-sample test for equality of proportions without continuity
## correction
##
## data: x out of n
## X-squared = 11.038, df = 1, p-value = 0.0008928
## alternative hypothesis: two.sided
## 98 percent confidence interval:
## 0.02957633 0.17042367
## sample estimates:
## prop 1 prop 2
## 0.475 0.375

p1 <- 190/400
p2 <- 300/800
sdp <- sqrt(p1*(1-p1)/400+p2*(1-p2)/800)
a <- c(p1-p2-qnorm(0.99)*sdp,p1-p2+qnorm(0.99)*sdp)
a

## [1] 0.02957633 0.17042367


Danilo Garrido M (UDD) Intervalos de Confianza 2019 17 / 20
Se realiza un estudio para comparar los contenidos de azúcar presentes en bebidas de
fantası́a. Los datos se encuentran en la siguiente tabla e indican los

bebida1 <- c(3.06,3.72, 3.10, 2.47, 2.25, 3.86, 3.27, 4.54, 3.00, 2.36)
bebida2 <- c(2.06, 1.83 ,2.14 ,2.97 ,2.63 ,3.10 ,2.64, 2.96)

Realice un test de hipotesis para determinar si los contenidos de azucar promedio de ambas
bebidas son iguales o no, indicando los supuestos bajo los cuales trabaja.

Danilo Garrido M (UDD) Intervalos de Confianza 2019 18 / 20


en R

t.test(bebida1,bebida2,var.equal = T)

##
## Two Sample t-test
##
## data: bebida1 and bebida2
## t = 2.0904, df = 16, p-value = 0.0529
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -0.0087775 1.2522775
## sample estimates:
## mean of x mean of y
## 3.16300 2.54125

Danilo Garrido M (UDD) Intervalos de Confianza 2019 19 / 20


Considere la siguiente salida de R de un test de varianzas
var.test(bebida1, bebida2, alternative="two.sided")

##
## F test to compare two variances
##
## data: bebida1 and bebida2
## F = 2.3044, num df = 9, denom df = 7, p-value = 0.2838
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.4777726 9.6716785
## sample estimates:
## ratio of variances
## 2.304401

Confirme a mano los valores entregados por el R

Danilo Garrido M (UDD) Intervalos de Confianza 2019 20 / 20

También podría gustarte