Está en la página 1de 26

Intervalos de Confianza

Computación Estadı́stica

Seomara Palominos Gambra

Diplomado en Estadı́stica Mención Minerı́a de Datos

Clase 5

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 1 / 26
Intervalos de Confianza

Estimación por Intervalos

Si bien la estimación puntual nos permite tener una noción del valor del
parámetro es poco probable que este llegue a entregar un valor exacto del
valor real del parámetro en la población.

Debido a ello trataremos de encontrar un intervalo que contenga el


verdadero valor del parámetro con una alta probabilidad.

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 2 / 26
Intervalos de Confianza

Método de la Función

Una función ϕ(X; θ) se dice función pivote para θ, si su distribución de


probabilidad no depende del parámetro θ.

Dada la función pivote ϕ(X; θ) y 0 < α < 1 buscamos encontrar valores a


y b tales que:
α α
P(ϕ(X; θ) ≤ a) = P(ϕ(X; θ) > b) =
2 2
Luego,
P(a < ϕ(X; θ) < b) = 1 − α

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 3 / 26
Intervalos de Confianza

Método de la Función

De la ecuación anterior se obtiene que:

P(A(X) < θ < B(X)) = 1 − α

Ası́ la probabilidad de que el intervalo A(X),B(X) cubre el verdadero valor


de θ es 1 − α. Este intervalo se denomina, Intervalo de 100(1 − α)% de
Confianza de θ y se denota:

IC (θ, 100(1 − α)%) = (A(X), B(X))

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 4 / 26
Intervalos de Confianza

Intervalo de Confianza para la Media con σ 2 conocida

Sea una muestra X = (X1 , . . . , Xn ) provenientes de una población que


sigue una distribución N(µ, σ 2 )

En base las propiedades de la distribución Normal una combinación lineal


de variables normalmente distribuidas también se encontrara normalmente
distribuida.

Consideremos el estimador µ̂ = X , sabemos que se encontrará


normalmente distribuido pero ¿con que parámetros?

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 5 / 26
Intervalos de Confianza

Intervalo de Confianza para la Media con σ 2 conocida

n n n
!
1X 1X 1X
E(X ) = E Xi = E (Xi ) = µ=µ
n n n
i=1 i=1 i=1
n n
!
1X 1 X σ2
Var (X ) = Var Xi = 2 Var (Xi ) =
n n n
i=1 i=1

Luego,
σ2
 
X −µ
X ∼ N µ, ⇒ Z = σ ∼ N(0, 1)
n n

Podemos visualizar que Z es una función pivote para θ

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 6 / 26
Intervalos de Confianza

Intervalo de Confianza para la Media con σ 2 conocida

 
X −µ
P z α2 ≤ σ ≤ z1− α2 = 1 − α
n
Entonces,
 
σ σ
IC (µ, 100(1 − α)%) = X − √ z1− α2 , X + √ z1− α2
n n

La interpretación: Si calculáramos todos los intervalos posibles de 95%


confianza para µ, en un 95% de ellos el verdadero valor del parámetro
estarı́a contenido en los intervalos.

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 7 / 26
Intervalos de Confianza

Intervalo de Confianza para σ 2


Sea una muestra X = (X1 , . . . , Xn ) provenientes de una población que
)2
sigue una distribución N(µ, σ 2 ) y considerando que ni=1 (Xi σ−X ∼ χ2n−1
P
2
2 1 P n 2
y definiendo S = n−1 i=1 (Xi − X ) se tiene que:

S2
(n − 1) ∼ χ2n−1
σ2
Luego,
(n − 1)S 2
 
P χ2(n−1, α ) < < χ2
(n−1,1− α2 ) = 1 − α
2 σ2
Despejando, obtenemos que:
 
(n − 1)S 2(n −1)S 2
IC (σ 2 , 100(1 − α)%) =  2
, 2 
χ n−1,1− α χ n−1, α
( 2) ( 2)

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 8 / 26
Intervalos de Confianza

Intervalo de Confianza para la Media con σ 2 desconocida

Sea X = (X1 , . . . , Xn ) m.a N(µ, σ 2 ) definimos:

X −µ (n − 1)S 2
Z= q ∼ N(0, 1) Y = ∼ χ2n−1
σ2 σ2
n

Luego,
Z X −µ
T =q = q ∼ tn−1
Y S2
n−1 n

Luego, el intervalo de confianza para µ esta dado por:


r r !
S2 S2
IC (µ, 100(1 − α)%) = X − t1− α2 , X + t1− α2
n n

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 9 / 26
Intervalos de Confianza

Intervalo de Confianza para dos poblaciones normales

Sean X = (X1 , . . . , Xn ) m.a N(µX , σX2 ) y Y = (Y1 , . . . , Ym ) m.a N(µY , σY2 ) mutuamente
independientes.

Caso σX2 , σY2 conocida

σ2 σY2 σX2 σ2
     
X ∼ N µX , X Y ∼N µY , ⇒X −Y ∼ µX − µY , + Y
n m n m

X − Y − (µX − µY )
qZ = 2
∼ N(0, 1)
σX σ2
n
+ mY
 
IC (µX − µY , 100(1 − α)%) = X − Y − z1− α2 δ, X − Y + z1− α2 δ
q
σX2 σ2
donde δ = n
+ mY

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 10 / 26
Intervalos de Confianza

Intervalo de Confianza para dos poblaciones normales

Caso σX2 = σY2 = σ desconocida


Pn
σ2 (n − 1)SX2 − X )2
 
i=1 (Xi
X ∼ N µX , X ∼ χ2n−1 donde Sx2 =
n σX2 n−1
Pm
σ2 (m − 1)SY2 j=1 (Yj − Y )2
 
Y ∼ N µY , Y ∼ χ2m−1 donde SY2 =
n σY2 m−1
Entonces,

(n − 1)SX2 + (m − 1)SY2 (n + m − 2)Sp2


Sp2 = ⇒U= ∼ χ2n+m−2
n+m−2 σ

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 11 / 26
Intervalos de Confianza

Intervalo de Confianza para dos poblaciones normales

X − Y − (µX − µY ) Z X − Y − (µX − µY )
Z = q ∼ N(0, 1) T = q = q ∼ tn+m−2
U
σ 2 n1 + m1 Sp2 n1 + m1
 
n+m−2

Finalmente el Intervalo de Confianza estará dado por:


 
IC (µX − µY , 100(1 − α)%) = X − Y − t1− α2 δ, X − Y + t1− α2 δ
q
1 1

donde δ = Sp2 n
+ m

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 12 / 26
Intervalos de Confianza

Intervalo Igualdad de Varianzas

Sea X = (X1 , . . . , Xn ) m.a N(µX , σX2 ) y Y = (Y1 , . . . , Ym ) m.a N(µY , σY2 )

Entonces,
(n − 1)SX2 (m − 1)SY2
U= ∼ χ2n−1 V = ∼ χ2m−1
σX2 σY2
Luego,
Sx2
2
σX
W = 2
SY
∼ F (n − 1, m − 1)
2
σY

Finalmente el Intervalo de Confianza esta dado por:


!
σX2 SX2
 
1 1
IC , 100(1 − α)% = ,
σY2 SY2 F n − 1, m − 1, α2 F n − 1, m − 1, 1 − α

2

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 13 / 26
Intervalos de Confianza

Ejemplo

Suponga que la densidad estándar del tiempo de vida de un válvula fabricada por una
cierta industria es del orden de 100 horas, se selecciona una muestra de 500 válvulas
obteniéndose una media de 800 horas.
Determine un intervalo de confianza del nivel del 95 % de confianza para el tiempo
de vida media de una válvula.
 2

Tenemos que: σ = 100 x = 800 n = 400 x ∼ N x, σn
 
P(a ≤ x ≤ b) = 1−α a − µ α
  Pr Z ≤ q  =
a − µ x − µ b − µ σ2 2
P q ≤ q ≤ q  = 1−α n
σ2 σ2 σ2 a−µ
n n n q = z α2
σ2
n
σ
a = x + z α2 √
n
El valor de b se obtiene de manera equivalente.

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 14 / 26
Intervalos de Confianza

Tenemos que:
σ σ
P(a ≤ x ≤ b) = 1 − α a = x + z α2 √ b = x − z α2 √
n n

Entonces,
σ σ
IC (x, (1 − α)100%) = [x − z α2 √ , x + z α2 √ ]
n n

Reemplazando en los valores de la muestra y considerando un α = 0.05 se


tiene:
IC (x, 95%) = [790, 2; 809, 8]

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 15 / 26
Intervalos de Confianza

Ejemplo

Se desea determinar si dos filiales de una industria de supermercados tienen


el mismo ingreso, las filiales cuentan con la siguiente información muestra.

mean sd N
Filial 1 71 4 5
Filial 2 62 3 7
Definiremos las v.a
X: Ingreso de la filial 1 X ∼ N(µ1 , σ12 )
Y: Ingreso de la filial 2 Y ∼ N(µ2 , σ22 )

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 16 / 26
Intervalos de Confianza

Suponiendo σ12 = σ22 , el intervalo de confianza para la diferencia de medias


estará dado por:
 
IC (µX − µY , 100(1 − α)%) = X − Y − t1− α2 δ, X − Y + t1− α2 δ

(n−1)SX2 +(m−1)SY2
q
1 1
Sp2 =

donde δ = Sp2 n + m n+m−2

Calcule, IC (µ1 − µ2 , 95%)

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 17 / 26
Intervalos de Confianza

Intervalos de Confianza en SAS

A modo de ejemplo utilizaremos la base de datos iris.


Intervalo de confianza SepalWidth.

proc ttest data = iris


plots(only)=summary plots(only)=interval alpha=0.05;
var SepalWidth;
run;

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 18 / 26
Intervalos de Confianza

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 19 / 26
Intervalos de Confianza

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 20 / 26
Intervalos de Confianza

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 21 / 26
Intervalos de Confianza

Intervalo de para la diferencia de medias de la variable SepalWidth


entre las especies Setosa y Versicolor.

proc ttest data = iris


plots(only)=summary plots(only)=interval alpha=0.05;
var SepalWidth;
class Species;
run;

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 22 / 26
Intervalos de Confianza

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 23 / 26
Intervalos de Confianza

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 24 / 26
Intervalos de Confianza

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 25 / 26
Intervalos de Confianza

Ejercicios

Genere una base de datos denominada simulation con un total de 200


observaciones , la cual contenga las variables X Z Y donde:

xi ∼ N(100, 1) si i ≤ 100
X =
xi ∼ N(150, 3) si e.o.c
Z ∼ N(20,
 1)
Grupo1 si i ≤ 100
Y =
Grupo2 si e.o.c
Usando la data anterior obtenga un intervalo de confianza para µZ
interprételo.
Obtenga un intervalo de confianza para la diferencia de medias de la
variable X considerando el grupo al cual pertenece cada observación.

Seomara Palominos Gambra (Diplomado en Estadı́sticaComputación


Mención Minerı́a
Estadı́stica
de Datos) Clase 5 26 / 26

También podría gustarte