Está en la página 1de 5

2

Intervalo de confianza para p


 r r 
p̂(1 − p̂) p̂(1 − p̂)
p̂ − z1−α/2 ; p̂ + z1−α/2 , (7.6)
n n
y
r
2
z1−α/2 2
z1−α/2
p̂(1−p̂)
p̂ + 2n ± z1−α/2 n + 4n2
2
z1−α/2
(7.7)
1+ n

siendo p̂ = x/n y z1−α/2 el cuantil 1 − α/2 de la distribución normal estándar. El in-


tervalo de confianza (7.7) resulta de aproximar la distribución binomial Bin(n; p) por la
distribución normal N (np; np(1 − p)). Para obtener el intervalo de confianza (7.6) deben
hacerse además algunas aproximaciones adicionales que hacen que esta fórmula sea bas-
tante inexacta; por ello no debe usarse (7.6) si x ≤ 5, o si n − x ≤ 5 o si α < 0.05.
Otra fórmula útil para obtener un intervalo de confianza para p es la siguiente

χ2 (2x, α/2) χ2 (2x + 2, 1 − α/2)


 
; , (7.9)
2n 2n

donde χ2 (2x, α/2) es el cuantil α/2 de la distribución χ2 (2x) de Pearson y χ2 (2x + 2, 1 −


α/2) es el cuantil y 1 − α/2 de la distribución χ2 (2x + 2). Esta fórmula puede usarse
cuando n es grande y x/n < 0.1. En estas condiciones, la distribución binomial Bin(n; p)
es muy similar a la distribución de Poisson P o(np), de la que se deduce (7.9).
La fórmula (7.9) también puede usarse para obtener un intervalo de confianza para
q = 1 − p si n es grande y x/n > 0.9, con tal de que se reemplace x por n − x.

Intervalo de confianza para µ


 
σ σ
x̄ − z1−α/2 √ ; x̄ + z1−α/2 √ . (7.3)
n n

El significado es: la probabilidad de que el intervalo aleatorio (7.3) contenga al verdadero


valor de la media poblacional µ, que es una constante desconocida, es igual a 1 − α. Del
intervalo aleatorio (7.3) se dice que es un intervalo de confianza para el parámetro µ al
nivel de confianza 1 − α.
 
s s
x̄ − t(n − 1, 1 − α/2) √ ; x̄ + t(n − 1, 1 − α/2) √ , (7.4)
n n

Intervalo de confianza para σ 2

(n − 1)s2 (n − 1)s2
 
; (7.5)
χ2 (n − 1, 1 − α/2) χ2 (n − 1, α/2)
5.1. INTERVALOS DE CONFIANZA 3

Intervalo de confianza para diferencia de medias


El método de los datos independientes es el muestreo consistente en observar dos muestras
aleatorias simples independientes entre sı́, una de ellas tomada la variable aleatoria X1 y
la otra tomada de la variable aleatoria X2 . .
s s !
s21 s22 s21 s22
x̄1 − x̄2 − t(ν, 1 − α/2) + ; x̄1 − x̄2 + t(ν, 1 − α/2) + , (7.16)
n1 n2 n1 n2

siendo s21 y s22 las cuasi-varianzas muestrales de las muestras de X1 y X2 , respectivamente,


y ν los grados de libertad de la distribución t de Student que aparece en (7.16), que se
calculan como el entero más próximo a

(s21 /n1 + s22 /n2 )2


ν≈ (7.17)
(s21 /n1 )2 /(n1 − 1) + (s22 /n2 )2 /(n2 − 1)

o bien a
(s21 /n1 + s22 /n2 )2
ν≈ − 2. (7.18)
(s21 /n1 )2 /(n1 + 1) + (s22 /n2 )2 /(n2 + 1)
En la segunda situación, aunque no se saben los valores de σ12 y σ22 , puede suponerse que
σ12 = σ22 . En este caso puede usarse un estadı́stico cuya distribución de probabilidad es t
de Student con n1 + n2 − 2 grados de libertad. Los extremos del intervalo de confianza
para µ1 − µ2 al nivel de confianza 1 − α están dados en este caso por
r
1 1
x̄1 − x̄2 ± t(n1 + n2 − 2, 1 − α/2)s + , (7.19)
n 1 n2

donde s21 y s22 son las cuasi-varianzas muestrales de X1 y X2 y


s
(n1 − 1)s21 + (n2 − 1)s22
s= .
n1 + n2 − 2

7.1.1 Método de los datos apareados


Supongamos que realizamos n parejas independientes1 de observaciones (x11 , x21 ); (x12 ,
x22 ); . . . (x1n , x2n ) de dos variables aleatorias X1 y X2 positivamente correladas entre sı́.
Sean µ1 y µ2 las medias marginales de X1 y X2 , respectivamente. Un estimador puntual
de la diferencia de medias µ1 − µ2 es la diferencia x̄1 − x̄2 entre las medias muestrales de
la primera y la segunda componente de las parejas de datos.
Para obtener un intervalo de confianza para µ1 −µ2 conviene definir la variable aleatoria
auxiliar Z = X1 − X2 . A partir de la muestra dada de la variable aleatoria bidimensional
(X1 , X2 ) es inmediato calcular una muestra para Z; los valores de esta muestra son

zi = x1i − x2i ,
1
Esto es equivalente a decir que observamos una muestra aleatoria simple (x11 , x21 ); (x12 , x22 ); . . . (x1n ,
x2n ) de la variable aleatoria bidimensional (X1 , X2 ).
4

para i = 1, 2, . . . , n. Un intervalo de confianza para µ1 − µ2 al nivel de confianza 1 − α es


 
sZ sZ
z̄ − t(n − 1, 1 − α/2) √ ; z̄ + t(n − 1, 1 − α/2) √ , (7.20)
n n
donde t(n − 1, 1 − α/2) es el cuantil 1 − α/2 de la distribución t(n − 1) de Student,
n n
1X 1X
z̄ = zi = (x1i − x2i ) = x̄1 − x̄2
n n
i=1 i=1

es la media muestral de la variable Z y


v
u n
u 1 X
sZ = t (zi − z̄)2
n−1
i=1

es la desviación tı́pica muestral de Z.

Diferencia de dos proporciones


Supongamos que X1 y X2 son variables aleatorias con distribuciones de probabilidad
binomiales cuyas probabilidades de éxito son p1 y p2 , respectivamente. Existen situaciones
prácticas en las que interesa estimar la diferencia p1 − p2 entre las dos probabilidades2
de éxito, en lugar de estimar cada una de ellas por separado. El estimador puntual de
la diferencia de dos proporciones coincide siempre con la diferencia entre los estimadores
puntuales de cada proporción. Sin embargo, el “intervalo de confianza” para la diferencia
p1 − p2 no puede calcularse a partir de los intervalos de confianza para p1 y para p2 , ya
que la forma de calcular el intervalo de confianza para p1 − p2 depende de cómo se haya
extraı́do la muestra aleatoria.

7.1.2 Método de los datos independientes


Supongamos que se observa la respuesta a una prueba en n1 individuos elegidos al azar de
entre los que forman parte de una determinada población. Supongamos que, independi-
entemente de la muestra anterior, se observa la respuesta a una prueba3 en n2 individuos
elegidos al azar de entre los que forman parte de una población diferente de la de la
primera muestra. La respuesta la prueba (o pruebas) puede ser positiva (+) o negativa
(−). Sean r1 y r2 los números de respuestas positivas en cada una de las muestras y p1 y
p2 las probabilidades de que se produzca una respuesta positiva en cada población.
Un estimador puntual de θ = p1 − p2 es
r1 r2
θ̂ = p̂1 − p̂2 = − .
n1 n2
Además, un intervalo de confianza para θ = p1 − p2 a un nivel de confianza aproximada-
mente igual a 1 − α está dado por
!
r1 r2 r1 s1 r2 s2 r1 r2 r1 s1 r2 s2
r r
− − z1−α/2 + 3 ; − + z1−α/2 + 3 , (7.21)
n1 n2 n31 n2 n1 n2 n31 n2
2
O proporciones.
3
Esta prueba puede ser la misma que la usada en la primera población.
5.1. INTERVALOS DE CONFIANZA 5

donde z1−α/2 es el cuantil 1 − α/2 de la distribución normal estándar N (0, 1), s1 = n1 − r1


y s2 = n2 − r2 .
El intervalo de confianza (7.21) está basado en la aproximación de la distribución
binomial por la distribución normal, por lo que no debe usarse si se verifica alguna de las
siguientes desigualdades: r1 < 6, s1 < 6, r2 < 6 o s2 < 6.

7.1.3 Método de los datos apareados


Supongamos que en n individuos de una población se observa la respuesta a dos prue-
bas. Esta respuesta puede ser positiva (+) o negativa (−) en cada una de las pruebas.
Supongamos que la muestra consiste en

• k respuestas positivas en las dos pruebas (++),

• r respuestas positivas en la primera prueba y negativas en la segunda prueba (+−),

• s respuestas negativas en la primera prueba y positivas en la segunda prueba (−+),

• m respuestas negativas en las dos pruebas (−−),

siendo k + r + s + m = n. Sean, además, p1 y p2 las probabilidades de que se produzca


una respuesta positiva a cada una de las pruebas.
Entonces, un estimador puntual de θ = p1 − p2 es

k+r k+s r−s


θ̂ = p̂1 − p̂2 = − = .
n n n
Además, un intervalo de confianza para θ = p1 − p2 a un nivel de confianza aproximada-
mente igual a 1 − α está dado por
√ √ !
r−s r+s r−s r+s
− z1−α/2 ; + z1−α/2 , (7.22)
n n n n

donde z1−α/2 es el cuantil 1 − α/2 de la distribución normal estándar N (0, 1).


La fórmula (7.23) está basada en una aproximación con la distribución normal4 , por
lo que no debe usarse si r < 6 o si s < 6.
4
La distribución de (k, r, s, m) es multinomial M n(n; p++ , p+− , p−+ , p−− ) siendo p++ , p+− , p−+ y p−−
las probabilidades de los resultados ++, +−, −+ y −−, respectivamente. De ahı́ resulta que
       
r−s r s r s
var = var + var − 2cov ,
n n n n n
p+− (1 − p+− ) p−+ (1 − p−+ ) p+− p−+
= + +2 ,
n n n
lo que puede estimarse con !
1 (r − s)2 r+s
r+s− ≈ .
n2 n n2

La distribución de (r − s)/n es aproximadamente normal si r y s son grandes de donde resulta (7.23).


6

7.1.4 Algunas erratas.


• Ejercicio 157 I a) 9604 b) 3458

• Ejercicio 158 I a) 271

• Ejercicio 159 I c) 269

• Ejercicio 168 I c) 330 ± 336

También podría gustarte