Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
Intervalos de confianza
2
Ejemplo. Sea X la variable aleatoria que indica la proporción de votos al partido
político A.
1-α = Confianza,
Valor Alto
Objetivo ⇒ Dada X1 ,..., X n m.a.s.
Ej. 95%, 90%
Hallar θ(X1 ,..., X n ) ≡ Mínimo y θ(X1 ,..., X n ) ≡ Máximo, v. a. tal que :
Prob(θ(X1 ,..., X n ) ≤ θ ≤ θ(X1 ,..., X n )) = Valor Alto = 1 - α
IConfianza 1-α (θ ) = [θ , θ ]
Donde los extremos del intervalos se determinan a partir de los valores
muestrales, de tal forma que
Prob( θ ≤ θ ≤ θ ) = 1 - α
1-α Nivel de confianza (habitualmente 90%, 95%, 99%)
4
INTERPRETACIÓN DE UN INTERVALO DE CONFIANZA
5
CONCEPTOS PARA TENER SIEMPRE EN CUENTA:
● Longitud del intervalo: Nos interesa que sea lo más pequeña posible, para así
tener mayor precisión.
7
Sea X ~ N(μ, σ)
x estimador puntual de μ
σ (x - μ )
x se distribuye N( μ , ) Pivote = n se distribuye N(0, 1)
n σ
Pivote ~ N(0, 1)
0,4
0,3
0,2
(x - μ )
0,1
α/2 (1-α) α/2 Prob(− z1−α / 2 ≤ n ≤ z1−α / 2 ) = 1 - α
0 σ
-5 5
-Z1-α/2 Z1-α/2 Por Construcción → Despejamos μ
8
Despejamos el valor de μ.
(x - μ )
Prob ( − z 1 − α / 2 ≤ n ≤ z1−α / 2 ) = 1 - α
σ
σ σ
Prob ( − z 1 − α / 2 ≤ ( x - μ ) ≤ z1−α / 2 ) = 1-α
n n
σ σ Error
Prob ( − z 1 − α / 2 − x ≤ - μ ≤ z1−α / 2 - x) = 1-α
n n
σ σ
Prob ( z 1 − α / 2 + x ≥ μ ≥ − z1−α / 2 + x) = 1- α
n n
σ σ σ
IC1-α (μ ) = [x - z1-α/2 , x + z1-α/2 ] ≡ x ± z1-α/2
n n n
9
Caso 2: Supongamos que no conocemos el valor de la varianza σ2.
x estimador puntual de μ
Sabíamos que
σ
x se distribuye N( μ , ) (x - μ )
n Pivote = n se distribuye N(0, 1)
σ
σ desconocid o
2
(x - μ )
Pivote = n ~ t n -1
SC
10
Distribución t de Student con n grados de libertad tn
t de Student Distribución
0,4 Grad. de libe
Rango es positivo y
1
2
negativo…
0,3
Es una distribución
densidad
3
4
0,2 10 simétrica…
0,1
0
-9 -6 -3 0 3 6 9
x
(x - μ )
Pivote = n ~ t n -1 0,3
SC 0,2
0,1
α/2 (1-α) α/2
0
-6 -tn-1,1-α/2 tn-1,1-α/2 6
(x - μ )
Prob(−t n−1,1−α / 2 ≤ n ≤ tn−1,1−α / 2 ) = 1 - α
SC
Análogamente → Despejamos μ
Error
SC SC SC
IC1-α ( μ ) = [x - t n -1, 1-α/2 , x + t n -1, 1-α/2 ] ≡ x ± t n -1, 1-α/2
n n n
12
Un fabricante de componentes electrónicos afirma que sus condensadores
tienen un tiempo medio de duración de 500 horas. Para verificar si dicho
tiempo medio se mantiene, decide examinar 25 condensadores elegidos
aleatoriamente obteniendo que el tiempo medio de duración de la muestra es
de 518 horas, con cuasidesviación típica muestral de 40 horas. Construir un
intervalo de confianza del 90% y obtener, a partir de él, las conclusiones
pertinentes acerca de ña duración media de los condensadores. Se asume que
el tiempo de duración de los condensadores se distribuye normalmente.
¡Atención! Con el
40
IC 1-α ( μ ) ≡ 518 ± 1, 71 → [ 504 '30 , 531'68 ] software se calcula
25 automáticamente.
Solución: existe “confianza” (90%) para afirmar que el valor medio de los
condensadores fabricados es superior a 500h. Duran algo más de lo que pensaba…
13
●Intervalo de confianza para la varianza de X, parámetro σ2.
nS 2
σ 2 χ 2
n −1
(n − 1) Sc 2
σ 2 χ 2
n −1
14
Distribución Chi-Cuadrado χ 2
15
Características Æ E(X)=v, Var(X)=2v
Æ mayor g. l. mayor media y mayor dispersión.
Chi-Cuadrado Distribución
0,2 Grad. de liberta El rango es positivo
0,16
4
6 pues proviene de
una transformación
densidad
8
0,12 10
0,08
15
cuadrática. ¡Ojo! No
0,04 es simétrica…
0
0 10 20 30 40 50
[ 0 , +∞ )
x
Observación: nos aparecerá de forma natural cada vez que veamos sumas
de variables transformadas al cuadrado…
16
●Intervalo de confianza para la varianza de X, parámetro σ2.
0,08
nS 2
0,06
Pivote = se distribuye χ n2−1
0,04 α/2
(1-α) α/2 σ2
0,02
⎛ 2 nS2 ⎞ ⎛ ⎞
Prob ⎜⎜ χ n −1,α ≤ 2 ≤ χ n −1,1−α ⎟⎟ = 1 − α
2
2
⎜ nS nS2 ⎟
σ Prob ⎜ 2 ≥σ ≥ 2
2
⎟ = 1− α
⎝ 2 2
⎠ ⎜ χn −1,α χn−1,1−α ⎟
⎝ 2 2 ⎠
Despejamos σ 2
Límite sup. Límite inf.
Equivalentemente:
nS2 nS2 (n - 1)Sc 2 (n - 1)Sc 2
IC1-α (σ ) = [ 2
, ] IC1-α (σ ) = [ 2
2
, 2 ]
χ 2
n −1,1−α
χ 2
n −1,α
χ n −1,1−α χ n −117
,α
2 2 2 2
Intervalos de confianza para dos poblaciones normales
independientes
Población 1 Población 2
Comparar medias: θ = 0 Æ µ1 = µ2
θ > 0 Æ µ1 > µ2
Parámetro resta θ = µ1 - µ2 θ < 0 Æ µ1 < µ2
OBS: OBS:
Tomo la resta intencionadamente, Tomo el cociente intencionadamente,
la resta de normales es también El cociente de chi-cuadrados es una
normal. Æ Hallar Pivote Å distribución conocida:
F de Snedecor. Æ Hallar Pivote Å 19
Intervalos de confianza para dos poblaciones normales
independientes: notación.
Población 1 Población 2
X1,…, Xn m. a. s. Y1,…,Ym m. a. s.
20
Intervalo de confianza para la resta de valores esperados,
parámetro θ=μ1-μ2.
x - y estimador de μ 1 − μ 2
(x - y) - ( μ1 − μ 2 )
Pivote = → N(0, 1)
σ 12 σ 22 σ 2
σ 2
x - y → N( μ 1 − μ 2 , + ) 1
+ 2
n m n m
Pivote ~ N(0, 1)
( x − y ) − ( μ1 − μ 2 )
0,4
0,1
n m
α/2 (1-α) α/2
0
Por Construcción → Despejamos θ = μ1 − μ 2
-5 5
-Z1-α/2 Z1-α/2
21
Despejamos el valor de θ=μ1-μ2.
( x − y ) − ( μ1 − μ 2 )
Prob( − z1−α / 2 ≤ ≤ z1−α / 2 ) = 1 − α
σ 2
σ 2
1
+ 2
n m
σ 12 σ 22 σ 12 σ 22
Prob( − z1−α / 2 + ≤ ( x − y ) − ( μ1 − μ 2 ) ≤ z1−α / 2 + )
n m n m
σ 12 σ 22 σ 12 σ 22
Prob( −( x − y ) − z1−α / 2 + ≤ −( μ1 − μ 2 ) ≤ −( x − y ) + z1−α / 2 + )
n m n m
σ 12 σ 22 σ 12 σ 22
Prob(( x − y ) + z1−α / 2 + ≥ ( μ1 − μ 2 ) ≥ ( x − y ) − z1−α / 2 + )
n m n m
Error
Caso 2.1: Desconocemos los valores pero sabemos que son iguales σ12 = σ22 = σ2
0,3
(x - y) - (μ1 − μ2 )
0,2 Prob(−tn+m−2,1−α / 2 ≤ ≤ tn+m−2,1−α / 2 ) = 1- α
1 1 (n −1)S + (m −1)S
2 2
0,1 + c1 c2
α/2 (1-α) α/2 n m n+ m−2
0
Despejamosθ = μ1 − μ2
-6 -tn+m-2,1-α/2 tn+m-2,1-α/26
23
1 1 1 1
IC 1-α ( μ1 − μ 2 ) = [( x - y) − t n + m − 2 ,1−α / 2 SˆCONJ + , (x - y) + t n + m − 2 ,1−α / 2 SˆCONJ + ]
n m n m
Error
1 1
IC1-α ( μ1 − μ 2 ) ≡ (x - y) ± t n + m − 2 ,1−α / 2 SˆCONJ +
n m
donde
( n − 1) S c21 + ( m − 1) S c22 nS 12 + mS 22
SˆCONJ = =
n+m−2 n+m−2
24
Caso 2.2: Desconocemos los valores y además son distintas σ12 ≠ σ22
x - y estimador de μ1 − μ 2 (x - y) - ( μ1 − μ 2 )
Pivote = → tn + m−2− g
σ 2
σ 2
S S 2 2
x - y → N(μ1 − μ 2 , 1
+ 2
) + C1 C2
n m n m
σ 12 ≠ σ 22 y desconocidos Fórmula de Welch, g corrige los g. l.
S C2 1 S C2 2 Error
IC 1-α ( μ 1 − μ 2 ) ≡ ( x - y ) ± t n + m − 2 − g ,1 − α / 2 +
n m
⎛ (( m − 1) T1 − ( n − 1) T 2 ) 2 ⎞ S C2 1 S C2 2
g = Redondear ⎜⎜ 2 2
⎟⎟ , T1 = y T2 = .
⎝ ( m − 1 ) T1 + ( n − 1 ) T 2 ⎠ n m 25
Dos universidades siguen métodos distintos a la hora de
matricular a sus alumnos. Se desea comparar el tiempo medio que
tardan los alumnos en completar los trámites de la matrícula. Cada
universidad anotó dichos tiempos en 100 alumnos seleccionados al
azar, obteniéndose los siguientes resultados:
26
Solución:
Partimos de dos variables normales e independientes con varianzas iguales y desconocidas:
X1 = tiempo dedicado a la matriculación en la universidad A.
X2 = tiempo dedicado a la matriculación en la universidad B.
En ambas universidades hemos muestreado con el mismo tamaño Æ n = m = 100
Nivel de confianza 90% Æ 1- α= 0,9 Æ α=0,1 Æ α/2= 0,05 Æ t198, 1-α/2= 1,65
σ 22 SC21
Pivote que vamos a utilizar:
σ 12 SC2 2
¿Qué distribución sigue? Una distribución F de Snedecor
σ 22 SC21
σ 12 SC2 2
Fn −1, m −1
28
Distribución F-Snedecor
X ~ FV1 V2
2
X ~ χ 2
⎫ χ v1
v1
⎪ v1
⎬ ⇒ Fv 1 , v 2 = 2
2
Y ~ χ v2
⎪ χ v2
Independ. ⎭ v2
29
Características:
v2
E(X)= - Decreciente en v2 y constante en v1-.
v2 − 2
2v 22 (v 1 + v 2 − 2) Rango es positivo [ 0 , + ∞ )
Var(X) = ¡Ojo! Es una distribución
v 1 (v 2 − 2) 2 (v 2 − 4) asimétrica
densidad
10,40 30,5
0,6 80,5
0,4
0,4
0,2
0,2
0 0
0 1 2 3 4 5 0 1 2 3 4 5
x x
1
Observación : = Fv 2 , v1 − Fácil de ver - .
Fv1 , v 2
30
Intervalo de confianza para el cociente de las varianzas,
parámetro θ=σ22/ σ12.
0,2
α/2 (1-α) α/2
σ 1 SC 2
0
0 5
Fn-1,m-1, α/2 Fn-1,m-1,1-α/2
σ 22 SC21
Prob(Fn −1,m −1,α / 2 ≤ 2 2 ≤ Fn −1,m −1,1−α / 2 ) = 1 - α
σ 1 SC 2
2 2
S S
IC1-α (σ22/σ12 ) = [Fn−1,m−1,α / 2 C22 , Fn−1,m−1,1−α / 2 C22 ]
Despejamos θ = σ 22 / σ 12 SC1 SC1
2 2
S S
IC1-α (σ12/σ22 ) = [Fm−1,n−1,α / 2 C21 , Fm−1,n−1,1−α / 2 C21 ]
SC2 SC2
31
Intervalo de confianza para la proporción de éxitos p
⎛ p (1 − p ) ⎞
Utilizaremos propiedades asintóticas de p p ⎯⎯ ⎜
n →∞
⎯→ N⎜ p, ⎟
n ⎟
⎝ ⎠
En consecuencia: (p - p) →∞
n ⎯n⎯
⎯→ N(0, 1)
p(1 - p)
Siguiendo el procedimiento habitual de construcción de un I. de confianza:
Pivote ~ N(0, 1) ( p - p)
0,4 Prob (-z 1 -α /2 ≤ n ≤ z 1 -α /2 ) = 1 − α
0,3 p(1 - p)
0,2
p(1 - p)
0,1
IC 1 -α ( p ) ≡ p ± z 1 -α /2
0
-5
α/2 (1-α) α/2 5 n
p(1 - p)
Como no conocemos p lo estimamos IC1-α ( p) ≡ p ± z1-α/2
a través de la proporción muestral n
Intervalo aproximado válido para n 32
suficientemente grande
Intervalos de confianza para dos poblaciones Bernoulli
Población 1 Población 2
X ~ Be(p1) Y ~ Be(p2)
X1,…, Xn m. a. s. Y1,…,Ym m. a. s.
σ IC1-α ( p ) ≡ p ± z1-α/2
p (1 - p )
IC1-α ( μ ) ≡ x ± z1-α/2
n n
36
¿Cómo mejoramos la precisión?
Solución 1: Si conocemos una estimación de p a través de una muestra piloto podemos utilizarla.
Solución 2: Observamos que es fácil acotar la varianza
p(1 - p) = p - p 2 0 ≤ p ≤ 1 - Parábola -
Valor máximo p = 1/2 → p - p 2 ≤38
1/ 4
La Junta de Andalucía está interesada en conocer la proporción de personas sin
recursos económicos en Andalucía. Para tal fin se diseña una encuesta donde se
averiguaba si el individuo poseía o carecía de ingresos.
a)¿Cuál debe ser el tamaño de la muestra para que, con un nivel de confianza del
95%, el error de la estimación no supere el 5%?
Una vez determinado el tamaño muestral y realizada la encuesta, se obtuvo que el
10% de los andaluces encuestados no disponían de recursos económicos.
b) En ese caso, ¿cuál es el intervalo de confianza al 95% para la proporción de
individuos sin recursos? Observando el intervalo calculado, ¿podría afirmarse que la
proporción de población sin recursos es inferior al 13,5%?
a) Nuestro problema de interés es estudiar la proporción de personas sin recursos. Sin realizar
la encuesta debemos fijar calcular el tamaño muestral necesario para obtener la precisión
deseada. p (1 − p )
1 − α = 0,95 → 0 , 05 = 1, 96
n
p(1− p) α = 0,05 → α / 2 = 0,025 Utilizo la cota p (1 − p ) ≤ 1 / 4
IC1-α ( p) ≡ p ± Z1−α / 2 z0,975 = 1,96
n 1/2
0,05 = 1,96 → Despejar n.
Precisión = 0,05 n
n = 385
b) Ya tenemos la estimación puntual de la proporción Æ Intervalo de confianza:
0,10·0,90
IC 95% (p) ≡ 0,10 ± 1,96 → [0,07 , 0,13] → [7%, 13 %]
385
Por lo tanto, sí podemos afirmar que la proporción de población sin recursos es inferior al
13,5% ya que todos los valores del intervalo son inferiores a esta cifra.