Inferencia Estadistica - UCA Intervalos de Confianza

Inferencia
Estadı́stica
(Teorı́a y problemas)
I. Espejo Miranda
F. Fernández Palacı́n
M. A. López Sánchez
M. Muñoz Márquez
A. M. Rodrı́guez Chı́a
A. Sánchez Navas
C. Valero Franco
°c Servicio de Publicaciones. Universidad de Cádiz
I. Espejo Miranda, F. Fernández Palacı́n, M. A. López Sánchez, M. Muñoz
Márquez, A. M. Rodrı́guez Chı́a, A. Sánchez Navas, C. Valero Franco
Edita: Servicio de Publicaciones de la Universidad de Cádiz

c/ Doctor Marañón, 3. 11002 Cádiz (España)
www.uca.es/publicaciones
ISBN: 978-84-9828-131-6
Se concede permiso para copiar, distribuir y/o modificar este documento bajo los
términos de la Licencia de Documentación Libre de GNU, Versión 1.2 o cualquier
otra versión posterior publicada por la Free Software Foundation. Una traducción
de la licencia está incluida en la sección titulada “Licencia de Documentación
Libre de GNU”.
Permission is granted to copy, distribute and/or modify this document under the
terms of the GNU Free Documentation License, Version 1.2 or any later version
published by the Free Software Foundation. A copy of the license is included in
the section entitled “GNU Free Documentation License”.
Inferencia Estadı́stica (Revisión: Marzo 2007)
I. Espejo Miranda, F. Fernández Palacı́n, M. A. López Sánchez,
M. Muñoz Márquez, A. M. Rodrı́guez Chı́a, A. Sánchez Navas,
C. Valero Franco
c
°2007 Servicio de Publicaciones de la Universidad de Cádiz
http://www.uca.es/teloydisren
Capı́tulo 3
Estimación por intervalos de confianza
1. Introducción
En el capı́tulo anterior se estudiaron tanto las propiedades desea-

bles para un estimador de un determinado parámetro poblacional, como
la forma de calcularlos. Estos estimadores proporcionan, para una mues-
tra concreta, un valor puntual que se denomina estimación puntual. Sin
embargo, a pesar de la indudable utilidad de este procedimiento, en la
práctica, cuando se realiza la estimación de un parámetro se necesita
obtener una medida de la fiabilidad de dicha estimación, medida de la
que se carece en el proceso de estimación puntual, de este modo, surge
la necesidad de encontrar un método que permita calcular una región
que contenga al valor del parámetro con una cierta garantı́a.
El capı́tulo se ha organizado introduciendo en primer lugar el

Método del Pivote, para calcular seguidamente Intervalos de confianza
de parámetros en poblaciones Normales basándose en el mismo. A con-
tinuación se han introducido otros métodos de obtención de estimadores
que se han considerado interesantes, pero que dada su complejidad o su
relativo uso vienen marcados con ∗∗∗ . En concreto, el Método asintótico
basado en el Teorema central del lı́mite va a permitir calcular intervalos
en poblaciones Binomiales. El tema concluye con un epı́grafe dedicado
a la determinación del tamaño muestral para cumplir con el objetivo de
42 Capı́tulo 3. Estimación por intervalos de confianza
precisión establecido.
Existen innumerables situaciones reales donde es necesario encon-

trar regiones en las cuales se tenga la confianza o cierto grado de segu-
ridad de que en ellas se halle el valor de un parámetro desconocido de
la población. A modo de ejemplos:
Ejemplo 3.1 Un vendedor desea establecer la duración de la
garantı́a de un determinado electrodoméstico, de
forma que durante el perı́odo de garantı́a deba sus-
tituir el menor número posible de piezas. El tiempo
hasta el primer fallo, viene dado por una variable
aleatoria, X, tal que, E[X] = θ, donde θ es un
parámetro desconocido.
Si el vendedor no quiere pagar ninguna pieza, el
tiempo de garantı́a deberı́a de ser nulo, pero ésto
supondrı́a una mala imagen cara al público, con los
consecuentes perjuicios. Por tanto, deberá buscar
una cota inferior del tiempo hasta que se produzca
el primer fallo del electrodoméstico, “confiando”
en que la vida media de ese electrodoméstico sea
superior a esa cota inferior. Es decir, extraı́da una
m.a.s., X, de la población, para α > 0 se busca
θ(X) tal que
P [θ(X) ≤ θ] ≥ 1 − α.
Ejemplo 3.2 Un laboratorio está interesado en estudiar la toxi-
cidad media de un determinado producto quı́mico,
para ello quiere establecer una cota superior de di-
cha media y ası́ tener cierta certeza o seguridad de
que la toxicidad del producto estará por debajo de
esa cota superior. Por tanto, si la toxicidad del pro-
ducto viene dada por una variable aleatoria, X, tal
que E[X] = θ donde θ es un parámetro descono-
cido, se quiere obtener una cota superior del nivel
de toxicidad medio “confiando” en que dicho nivel
se encuentre por debajo de esa cota. Es decir, ex-
3.1 Introducción 43
traı́da una m.a.s., X, de esta población, para α > 0

se busca θ(X) tal que
P [θ ≤ θ(X)] ≥ 1 − α.
Ejemplo 3.3 Una empresa tabaquera desea estudiar el nivel me-
dio de nicotina de sus cigarros. A la compañı́a le
interesa que el nivel medio de nicotina se encuentre
entre unos márgenes debido a que un nivel medio
alto supone que el cigarro es muy perjudicial para
la salud y un nivel medio bajo implica que el ci-
garro carece de sabor. De este modo, si el nivel de
nicotina de un cigarro viene dado por una varia-
ble aleatoria, X, tal que E[X] = θ, donde θ es un
parámetro desconocido, se desea, a partir de una
m.a.s., X, y para α > 0 obtener θ(X) y θ(X) tal
que
P [θ(X) ≤ θ ≤ θ(X)] ≥ 1 − α.
Estos ejemplos ponen de manifiesto la necesidad que existe de

construir regiones donde se tenga la “confianza” de encontrar el pará-
metro. Nuestro estudio se centra en el caso en que el parámetro sea
unidimensional y las regiones sean intervalos, por ello, de ahora en ade-
lante, se hablará de intervalos de confianza.
Dada una m.a.s. X procedente de una variable aleatoria, X, cuya

distribución depende de un parámetro desconocido θ y dadas las varia-
bles aleatorias θ(X) y θ(X). Se define intervalo de confianza de nivel
1 − α a un intervalo [θ(X), θ(X)], tal que
P [θ(X) ≤ θ ≤ θ(X)] ≥ 1 − α. (3.1)
Nótese, que en la definición anterior se habla de nivel de confianza

1 − α, sin embargo, la probabilidad en dicha expresión es mayor o igual
que 1 − α, esto se debe a que existen situaciones, como en poblaciones
discretas, donde no es posible que dicha probabilidad sea exactamente
1 − α. Como se puede apreciar, los extremos del intervalo son variables
aleatorias que dependen de la muestra y que toman para una realización
muestral determinada, x, dos valores puntuales. Ası́ pues, el objetivo de

este tema va a ser encontrar θ(X) y θ(X), extremos del intervalo de
confianza, cumpliendo determinados criterios relativos a la calidad de
dicho intervalo. Como ilustración del significado de intervalo aleatorio
se tiene el siguiente ejemplo:
Ejemplo 3.4 Sea X una variable aleatoria que sigue una dis-
tribución U (0, θ). El nivel de confianza, basado en
una muestra de tamaño uno, del intervalo aleatorio
[X, 2X] es:
· ¸
1
P [X ≤ θ ≤ 2X] = P θ ≤ X ≤ θ = 12 .
2
Tras esta apreciación, hay que tener cuidado a la hora de interpre-

tar el significado de la expresión (3.1), ya que θ es un valor desconocido
pero constante, por ello, su interpretación correcta es que la probabilidad
de que el intervalo aleatorio [θ(X), θ(X)] contenga el valor del paráme-
tro, θ, es, al menos, 1 − α. Por otra parte, una vez tomada una muestra,
se obtiene un intervalo fijo, con lo cual no tiene sentido hablar de pro-
babilidad, ya que el valor del parámetro pertenecerá o no a ese intervalo
fijo, es decir, lo hará con probabilidad 1 ó 0. La explicación anterior
justifica que tenga que hablarse en términos de “confianza” cuando se
considera una muestra concreta. De esta forma, si el intervalo obtenido
para una muestra concreta se ha construido con un nivel de confianza
de 00 95, se prevé que dicho intervalo contiene al valor del parámetro, ya
que de cada 100 realizaciones muestrales, aproximadamente el intervalo
concreto para 95 de ellas contiene dicho parámetro.
En la definición (3.1) se ha hablado de intervalo de confianza en

el caso acotado, pero de igual forma, como se aprecia en los ejemplos,
puede hablarse de intervalo de confianza acotado inferiormente para θ a
un nivel de confianza 1 − α, como el intervalo [θ(X), +∞) donde θ(X)
verifica que
P [θ(X) ≤ θ] ≥ 1 − α,
y de intervalo de confianza acotado superiormente para θ a un nivel de
confianza 1 − α como el intervalo (−∞, θ(X)], donde θ(X) verifica que
P [θ(X) ≥ θ] ≥ 1 − α.
3.2 Intervalos de confianza de longitud mı́nima 45
2. Intervalos de confianza de longitud mı́nima
Se puede observar que al ampliar la longitud de un intervalo de

confianza aumenta también su nivel de confianza, de hecho, si se conside-
ra el intervalo (−∞, +∞) se obtiene un intervalo a un nivel de confianza
1. Por otro lado, a un nivel de confianza prefijado, se puede compro-
bar que no existe un único intervalo. Por ello, se plantea el problema
de elegir de entre todos los intervalos a un nivel prefijado, alguno con
unas determinadas caracterı́sticas. Desde un punto de vista práctico, el
intervalo de longitud mı́nima es una elección interesante, ya que al con-
servar el nivel de confianza, éste nos da una estimación del parámetro
más ajustada que el resto de intervalos del mismo nivel de confianza.
Sin embargo, dicha elección presenta el problema de que este intervalo
no siempre se puede calcular; en dicho caso, se recurre a una solución
alternativa como puede ser la búsqueda del intervalo que tenga longitud
mı́nima esperada, es decir, aquel que minimice la expresión
E[θ(X) − θ(X)].
Finalmente, cuando tampoco pueda resolverse este problema, el criterio
más empleado consiste en el reparto equitativo del complementario del
nivel de confianza entre las dos colas, es decir,
α
P [θ(X) ≥ θ] =
2
α
P [θ(X) ≤ θ] = .
2
Este criterio presenta la ventaja de que conduce a un intervalo único y
que en el caso de distribución simétrica con respecto al parámetro es de
longitud mı́nima.
A continuación se dan algunos procedimientos para obtener inter-

valos de confianza en las situaciones que usualmente se presentan.
3. Método del pivote
Se considera una m.a.s. X procedente de una población definida

por una variable aleatoria X, cuya distribución dependa de un paráme-
tro desconocido θ. El objetivo de esta sección va a ser desarrollar un
método para calcular intervalos de confianza a partir de una función de

la muestra que contenga al parámetro y cuya distribución no dependa
de él. A continuación, se muestra un ejemplo que ilustra este procedi-
miento.
Ejemplo 3.5 Sea X una m.a.s. extraı́da de una N (µ, 2), se busca
un intervalo de confianza para µ a un nivel de con-
fianza 1 − α. Para ello, se sabe que X ∼ N (µ, √σn ),
por tanto
X−µ √
2 n ∼ N (0, 1),
con lo cual se pueden tomar las constantes k1 (α) y
k2 (α) verificando
h √ i
P k1 (α) ≤ X−µ2 n ≤ k 2 (α) = 1 − α,
de donde se obtiene que

h i
P X −k2 (α) √2n ≤ µ ≤ X −k1 (α) √2n = 1 − α
y por tanto un intervalo de confianza a nivel 1 − α

para µ es
h i
X − k2 (α) √2n , X − k1 (α) √2n .
Obsérvese que k1 (α) y k2 (α) son constantes cuyo

valor depende del valor escogido α.
Se dice que T (x; θ) es un pivote o cantidad pivotal si T (x; θ) es

una función monótona en θ para todo valor muestral x, la ecuación
λ = T (x; θ) tiene solución para todo λ y la distribución de T (X; θ) es
independiente de θ.
Si existe T (x; θ) pivote se puede construir un intervalo de confianza

para θ a cualquier nivel.
Ejemplo 3.6 Sea X una m.a.s. extraı́da de una población con
distribución U (0, θ). Se quiere encontrar un inter-
valo de confianza para θ a un nivel de significación
1 − α. Para ello se considera como estimador de θ
3.3 Método del pivote 47
a θ̂(X) = máx{X1 , . . . , Xn } que se sabe tiene una

función de distribución
µ ¶n
t
Fθ̂(X) (t) =
θ
que al ser función de distribución de una variable
aleatoria continua verifica que
Fθ̂(X) (θ̂(X)) ∼ U (0, 1),
con lo cual se pueden encontrar k1 (α) y k2 (α) tales

que
P [k1 (α) ≤ Fθ̂ (θ̂(X)) ≤ k2 (α)] = 1 − α.
Por simplicidad se toma k1 (α) = α2 y k2 (α) = 1− α2 .
Resolviendo las siguientes ecuaciones
Ã !n
θ̂(X) α
=
θ 2
Ã !n
θ̂(X) α
= 1− ,
θ 2
se obtiene que;
θ̂(X)
θ = 1
( α2 ) n
θ̂(X)
θ = 1 ,
(1 − α2 ) n
con lo cual un intervalo de confianza a un nivel
1 − α para θ es,
· ¸
θ̂(X) θ̂(X)
I1−α (θ) = α 1
, α 1 .
(1− 2 ) n ( 2 )n
Hay que hacer notar que este procedimiento no conduce a un único

intervalo de confianza, ya que k1 (α) y k2 (α) se pueden escoger de formas
diferentes para que cumplan
P [k1 (α) ≤ T (X; θ) ≤ k2 (α)] = 1 − α

de lo cual puede deducirse que existen diferentes θ(X) y θ(X) tal que
P [θ(X) ≤ θ ≤ θ(X)] = 1 − α.
Como ya se comentó en la sección anterior, k1 (α) y k2 (α) se eligen

de manera que θ(X) − θ(X) sea mı́nima, con lo cual, se habrá obtenido
un intervalo de confianza a un nivel 1−α de longitud mı́nima construido
a partir de T (X; θ). Sin embargo, no podrá decirse que es un intervalo de
longitud mı́nima de entre todos los intervalos de confianza a nivel 1 − α,
ya que podrı́a existir otro pivote T ∗ del cual se obtuviera un intervalo
más pequeño.
4. Intervalos de confianza en poblaciones Normales
Debido a la importancia que tienen las poblaciones Normales, se ha

dedicado este apartado al estudio de los intervalos de confianza para sus
parámetros. Por otro lado, la facilidad del cálculo de cantidades pivotales
que presentan estas poblaciones hacen recomendable la obtención de
estos intervalos de confianza a través del método pivotal.
En esta sección se tratan tanto los intervalos de confianza en una

población como en dos poblaciones Normales. En ambos casos, depen-
diendo del parámetro para el cual se busca un intervalo de confianza y
del conocimiento o no de los otros parámetros, se presentan diferentes
situaciones que a continuación van a ser estudiadas. En primer lugar se
analizan las distintas situaciones para el caso de una población X que
sigue una Normal de media µ y varianza σ 2 y de la cual se extrae una
m.a.s., X, de tamaño n. Posteriormente se estudia el caso de dos pobla-
ciones Normales de medias µ1 y µ2 , varianzas σ12 y σ22 y de las cuales se
extraen dos m.a.s., X e Y , de tamaños n1 y n2 , respectivamente.
Las tablas 3.1 y 3.2 resumen los resultados que se van a obtener
en lo que sigue.
3.4 Intervalos de confianza en poblaciones Normales 49
4.1. Intervalo de confianza para la media, conocida la

varianza
Debido a que se quiere encontrar un intervalo de confianza para

la media y se sabe que X ∼ N (µ, √σn ), puede elegirse como pivote la
tipificación de dicha variable aleatoria, es decir,
X − µ√
T (X; θ) = n ∼ N (0, 1),
σ
con lo cual, dado un nivel de confianza 1 − α, para una variable aleatoria
Z ∼ N (0, 1) se pretende encontrar k1 (α) y k2 (α) (que para un mejor
entendimiento serán denotados por k1 = k1 (α) y k2 = k2 (α)), tales que
P [k1 ≤ Z ≤ k2 ] = 1 − α.
Dados α1 , α2 ≥ 0 tales que α1 + α2 = α (α1 y α2 representan el reparto
de la probabilidad α entre las dos colas), k1 y k2 se obtendrán a partir
de las igualdades
P [Z ≤ k1 ] = α1
P [Z ≥ k2 ] = α2 .
Una vez calculados k1 y k2 se obtiene que

· ¸
X − µ√
1 − α = P k1 ≤ n ≤ k2
σ
· ¸
σ σ
= P k1 √ ≤ X − µ ≤ k2 √
n n
· ¸
σ σ
= P X − k2 √ ≤ µ ≤ X − k1 √ .
n n
Se observa que para cada elección de α1 y α2 tales que α1 +α2 = α,

se obtiene un intervalo diferente; con lo cual, como se decı́a anteriormen-
te, se escogerá de entre todos ellos el de longitud mı́nima para este pivote,
siempre que ello sea posible. Es decir,
Min X − k1 √σn − (X − k2 √σn ) = √σn (k2 − k1 )
Sujeto a FZ (k2 ) − FZ (k1 ) = 1 − α
donde FZ es la función de distribución de una N (0, 1).
Para encontrar dicho intervalo se recurre al método de los multi-

plicadores de Lagrange. A partir de la función
σ
ψ(k1 , k2 , λ) = √ (k2 − k1 ) + λ (FZ (k2 ) − FZ (k1 ) − (1 − α)) ,
n
se obtiene el siguiente sistema de ecuaciones:
∂ψ(k1 , k2 , λ) σ
= √ + λfZ (k2 ) = 0
∂k2 n
∂ψ(k1 , k2 , λ) σ
= − √ − λfZ (k1 ) = 0
∂k1 n
∂ψ(k1 , k2 , λ)
= FZ (k2 ) − Fz (k1 ) − (1 − α) = 0,
∂λ
siendo fZ la función de densidad de una N (0, 1). Sumando las dos pri-
meras ecuaciones y operando se obtiene que
1 2 1 2
e− 2 k 2 = e− 2 k 1 ,
de donde se deduce que
k12 = k22 .
Por tanto, las soluciones son:
1. k1 = k2 , esta solución no es válida pues se tendrı́a un intervalo de

longitud nula.
2. k1 = −k2 , con lo cual k2 = Z1− α2 , donde Z1− α2 , verifica que
FZ (Z1− α2 ) = 1 − α2 .
Es decir, el intervalo de confianza más pequeño coincide con el

obtenido por el reparto equitativo de α entre ambas colas; lo cual era
esperable ya que la distribución Normal es simétrica respecto a su media.
El intervalo en forma explı́cita viene dado por la expresión
· ¸
σ σ
I1−α (µ) = X − Z1− 2 √ , X + Z1− 2 √ .
α α
n n
Ejemplo 3.7 Con el fin de estudiar el número medio de flexio-

nes continuadas que pueden realizar sus alumnos,
un profesor de educación fı́sica somete a 80 de ellos,
elegidos aleatoriamente, a una prueba. Los resulta-
dos fueron los siguientes:
Flexiones 35 41 46 48 50 52 53 54 56 60
Alumnos 5 6 2 10 15 6 11 10 5 5
Se sabe que el número de flexiones se distribuye
según una Normal de varianza poblacional 70 5.
Para construir un intervalo de confianza al 95 %
para la media del número de flexiones, se tiene que
la media muestral es x = 490 78 y que Z1− α2 = 10 96.
Por tanto, el intervalo obtenido para esta muestra
concreta, viene dado por
· q ¸
0
I00 95 (µ) = 49 78 ± 1 96 7805
0 0
= [490 18, 500 38].
4.2. Intervalo de confianza para la media, desconocida la

varianza
Denotando por Sc2 a la cuasivarianza muestral y usando que X y

Sc2 son independientes, se tiene que

X − µ√ 

n ∼ N (0, 1) X − µ√
σ =⇒ n ∼ tn−1 ,
S2 
 Sc
(n − 1) c2 ∼ χ2n−1
σ
donde tn−1 representa la distribución t-student con n − 1 grados de

libertad.
√
Se puede observar que T (X, µ) = X−µ Sc n es un pivote, con lo
cual, puede usarse para obtener un intervalo de confianza para la media
de una población Normal cuando la varianza es desconocida. Operando
igual que en el caso anterior se tendrı́a

· ¸
Sc Sc
I1−α (µ) = X − tn−1,1− α2 √ , X + tn−1,1− α2 √ ,
n n
que expresado en términos de la varianza, S 2 ,

· ¸
S S
I1−α (µ) = X − tn−1,1− α2 √ , X + tn−1,1− α2 √ .
n−1 n−1
Ejemplo 3.8 A partir de una muestra de 20 linternas cuyos

periodos de duración (en horas) han sido
503 480 345 427 386 432 429 378 440 434
429 436 451 466 394 422 412 507 433 480
se quiere obtener un intervalo de confianza al 95 %
para la vida media de una población de linternas
que se distribuye normalmente.
Teniendo en cuenta que x = 4340 2, Sc = 400 63 y
que para α = 00 05 y n = 20 es tn−1,1− α2 = 20 093,
se tiene que un intervalo de confianza al 95 % para
la vida media de las linternas es
h 0
i
I00 95 (µ) = 4340 2 ± 20 093 40
√ 63
20
= [4150 18, 4530 21].
4.3. Intervalo de confianza para la varianza, conocida la

media
En este caso, puesto que Xiσ−µ ∼ N (0, 1) y Xi −µ

σ , para i = 1, . . . , n,
son independientes dos a dos, se tiene que
n µ
X ¶
Xi − µ 2
T (X; θ) = ∼ χ2n ,
σ
i=1
donde χ2n representa la distribución Chi–cuadrado con n P

grados de liber-
n
(Xi − µ)2
tad. Utilizando T (X; θ) como pivote y definiendo Sµ2 = i=1 ,
n
el intervalo de confianza a un nivel 1 − α viene dado por

" #
nS 2 nS 2
µ µ
I1−α (σ 2 ) = , .
χ2n,1− α χ2n, α
2 2
4.4. Intervalo de confianza para la varianza, desconocida la

media
Por el Teorema de Fisher se tiene que

n
X (Xi − X)2
∼ χ2n−1 .
σ2
i=1
Razonando de igual forma que en el apartado anterior se obtiene que el

intervalo de confianza a un nivel 1 − α para σ 2 es
" #
2 (n − 1)Sc2 (n − 1)Sc2
I1−α (σ ) = , ,
χ2n−1,1− α χ2n−1, α
2 2
que expresado en términos de la varianza, S 2 , queda

" #
2 nS 2 nS 2
I1−α (σ ) = , .
χ2n−1,1− α χ2n−1, α
2 2
Ejemplo 3.9 Se sabe que el peso por comprimido de un cier-

to preparado farmacéutico se distribuye según una
Normal. Con el objeto de estudiar la varianza de
la distribución, se extrae una m.a.s. de 6 artı́culos.
Sabiendo que la varianza muestral es igual a 40, se
pretende estimar la varianza poblacional mediante
un intervalo de confianza al 90 %.
Puesto que µ es desconocida, un intervalo de con-
fianza para σ 2 viene dado por
" #
nS 2 nS 2
I1−α (σ 2 ) = , ,
χ2n−1,1− α χ2n−1, α
2 2
donde α = 00 1, n = 6, y S 2 = 40. Ası́,

χ25,00 95 = 110 07 y χ25,00 05 = 10 145;
con lo cual,
· ¸
2 6 · 40 6 · 40
I00 90 (σ ) = ,
110 07 10 145
= [210 68, 2090 61].
4.5. Intervalo de confianza para la diferencia de medias de

muestras apareadas
Sean X e Y dos m.a.s. de tamaño n y apareadas, de tal forma

que la primera procede de una población N (µ1 , σ1 ) y la segunda de una
población N (µ2 , σ2 ).
Antes de proporcionar el intervalo para la diferencia de medias

de estas dos poblaciones, se hace necesario indicar qué se entiende por
muestras apareadas.
Se dice que dos muestras X e Y están apareadas cuando los datos

de las muestras vienen por parejas, uno de cada una de ellas, de manera
que cada individuo proporciona dos observaciones.
Ejemplo 3.10 Para estudiar los efectos de un determinado fárma-
co para adelgazar, se selecciona aleatoriamente 6
personas y se toma nota de sus pesos antes y des-
pués de administrarles el medicamento.
Antes 720 0 730 5 700 0 710 5 760 0 800 5
Después 730 0 740 5 740 0 740 5 750 0 820 0
Como puede observarse, los datos vienen por pare-
jas: peso antes y después, dos datos por individuo.
Parece lógico que los datos se encuentren relacio-
nados entre sı́.
En los casos de muestras apareadas, el modo de proceder para

obtener un intervalo de confianza para la diferencia de medias es con-
siderar una única muestra formada por la diferencia de los pares de

valores, D = X − Y , reduciendo ası́ el problema a encontrar un intervalo
de confianza para la media de una población.
Ejemplo 3.11 Si se quisiera construir un intervalo de confianza
para la diferencia de medias de los datos del ejem-
plo anterior, suponiendo que ambas son m.a.s. pro-
cedentes de poblaciones Normales, bastarı́a consi-
derar una nueva muestra:
D = X −Y,
siendo X los pesos antes del tratamiento y Y los
pesos después del mismo. Ası́, los valores de la nue-
va muestra D de tamaño n = 6 son
−1 −1 −4 −3 1 −10 5,
cuya media muestral es x = −10 58 y su cuasiva-

rianza Sc2 = 30 04. El intervalo de confianza para la
diferencia de medias viene dado por
h i
Sc S
I1−α (µD ) = D−tn−1,1− α2 √ n
, D+t n−1,1− α √c
2 n
.
Para α = 00 05, se tiene tn−1,1− α2 = t5,00 975 = 20 57

y el intervalo queda
I00 95 (µD ) = [−30 41, 00 25].
4.6. Intervalo de confianza para la diferencia de medias de

muestras independientes
Sean ahora dos m.a.s. X e Y de tamaños n1 y n2 , respectivamente,

independientes entre sı́, de tal forma que la primera procede de una
población N (µ1 , σ1 ) y la segunda de una población N (µ2 , σ2 ). Usando
que X y Y son independientes, se sabe que
µ ¶ 
σ1   s 
X ∼ N µ1 , √ 
 2 2
µ n1 ¶ σ1 σ
=⇒ X − Y ∼ N µ1 − µ2 , + 2,
σ2 
 n1 n2
Y ∼ N µ2 , √ 
n2
y usando que Sc21 y Sc22 son independientes, se tiene que


S2 
(n1 − 1) c21 ∼ χ2n1 −1 

σ1 S2 S2
2 =⇒ (n1 − 1) c21 + (n2 − 1) c22 ∼ χ2n1 +n2 −2 ,
S  σ1 σ2
(n2 − 1) c22 ∼ χ2n2 −1 

σ2
donde Sc21 y Sc22 son las cuasivarianzas muestrales para las muestras X
e Y respectivamente.
El pivote que permite construir el intervalo de confianza para la

diferencia de medias de ambas poblaciones, se construye basándose en
los resultados anteriores, y depende en gran medida del conocimiento o
no de las varianzas poblacionales.
4.6.1. Intervalo de confianza cuando las varianzas son

conocidas
Se sabe que
 s 
σ12 σ22 
X − Y ∼ N µ1 − µ2 , + ,
n1 n2
con lo cual se puede tomar como pivote

X − Y − (µ1 − µ2 )
q 2 ∼ N (0, 1),
σ1 σ22
n1 + n2
de donde siguiendo la metodologı́a anterior se obtiene que
· q q ¸
σ12 σ22 σ12 σ22
P X−Y −Z1− α2 n1 +n2 ≤ µ1−µ2 ≤ X−Y +Z1− α2 n1 +n2 =
=1−α
por tanto el intervalo buscado es
I1−α (µ1 − µ2 ) =
 s s 
σ12 σ22 σ12 σ22
= X −Y −Z1− α2 + , X −Y +Z1− α2 + .
n1 n2 n1 n2
Ejemplo 3.12 Se quiere estudiar la diferencia de las vidas medias

de dos tipos de lámparas. Para ello, se toma una
muestra de 150 lámparas de tipo H y otra, inde-
pendiente de la anterior, de 200 lámparas de tipo
N, obteniéndose que las de tipo H tienen una vi-
da media de 1400 horas y una desviación tı́pica de
120, y que las de tipo N tienen una vida media de
1200 horas y desviación tı́pica 80.
Para estimar la diferencia de medias se construye
un intervalo de confianza al 95 %, que viene dado
por
· q 2 ¸
σH 2
σN
X H −Y N ± Z1− 2 nH + nN .
α
Sustituyendo en la expresión anterior, se obtiene

· q ¸
0 1202 802
1400−1200 ± 1 96 150 + 200 ,
y por tanto,
I00 95 (µH − µN ) = [1770 8, 2220 2].

desconocidas e iguales
Como Sc21 y Sc22 son independientes, se sabe que


S2 
(n1 − 1) c21 ∼ χ2n1 −1  (n1 − 1)Sc21 + (n2 − 1)Sc22
σ2 =⇒ ∼ χ2n1 +n2 −2
Sc2  σ 2
(n2 − 1) 2 ∼ χ2n2 −1 
σ
y puesto que X y Sc21 , ası́ como, Y y Sc22 son independientes, se tiene el
pivote
T (X, Y , µ1 − µ2 ) =
³q ´−1
X−Y −(µ1 −µ2 ) 1 1
σ n1 + n2
= r
(n1 −1)Sc21 +(n2 −1)Sc22
σ 2 (n1 +n2 −2)
µr ¶−1
X − Y − (µ1 − µ2 ) 1 1
= q + ∼ tn1 +n2 −2 ,
(n1 −1)Sc21 +(n2 −1)Sc22 n1 n2
n1 +n2 −2
obteniéndose como intervalo de confianza
I1−α (µ1 − µ2 ) =
· r ³ ´¸
(n1 −1)Sc21 +(n2 −1)Sc22 1 1
= X − Y ± tn1 +n2 −2,1− α2 n1 +n2 −2 n1 + n2
que expresado en función de la varianza muestral queda
I1−α (µ1 − µ2 ) =
" s µ ¶#
n1 S12 + n2 S22 1 1
= X − Y ± tn1 +n2 −2,1− α2 + .
n1 + n2 − 2 n1 n2
Ejemplo 3.13 De una población N (µ1 , σ 2 ), se extrae una m.a.s.

de tamaño 10, tal que la media muestral es 4’1
y la varianza muestral es 6’09. De otra población
N (µ2 , σ 2 ) se toma otra m.a.s. de tamaño 16 e in-
dependiente de la anterior, cuya media y varianza
muestrales son 3’875 y 3’609, respectivamente. Se
quiere obtener un intervalo de confianza del 95 %
para la diferencia de medias poblacionales.
Puesto que la varianzas poblacionales son descono-
cidas pero iguales, el intervalo de confianza para la
diferencia de medias viene dado por
· r ³ ´¸
n1 S12+n2 S22 1 1
X −Y ± tn1 +n2 −2,1− α2 n1 +n2 −2 n1 + n2 .
Para α = 00 05 se tiene que t24,00 975 = 20 0639. Ası́,

· q ¸
0 0 0
¡
10·60 09+16·30 609 1 1
¢
4 1−3 875 ± 2 0639 24 10 + 16 .
Por tanto,
I00 95 (µ1 − µ2 ) = [−10 6248, 20 0748].

desconocidas y distintas
En este caso, puesto que X y Sc21 , ası́ como, Y y Sc22 son indepen-
dientes, se tiene que
X − Y − (µ1 − µ2 )
q 2 ∼ N (0, 1),
σ1 σ22
n1 + n2
ası́ como
Sc21 Sc22
(n1 − 1) + (n2 − 1) ∼ χ2n1 +n2 −2 .
σ12 σ2
Por tanto
X−Y −(µ1 −µ2 )
r
2
σ1 σ2
n1
+ n2
2
s ∼ tn1 +n2 −2 ,
Sc2 Sc2
(n1 −1) 1 2
2 +(n2 −1) σ 2
σ1 2
n1 +n2 −2
pero como se ve el estadı́stico depende de σ1 y σ2 por lo que se recurre

a la aproximación de Welch, en función de la cual el estadı́stico
X − Y − (µ1 − µ2 )
s ,
Sc21 Sc22
+
n1 n2
tiene una distribución aproximada ta,1− α2 siendo a un factor corrector

que se calcula tomando el entero más próximo a
µ 2 ¶2
Sc1 Sc22
n1 + n2
a= ³ S 2 ´2 ³ S 2 ´2 − 2
1 c1 1
n1 +1 n1 + n2 +1 nc22
y donde el intervalo de confianza para µ1 − µ2 viene dado por

 s 
2
Sc1 S 2
I1−α (µ1 − µ2 ) = X − Y ± ta,1− α2 + c2  .
n1 n2
Ejemplo 3.14 Para realizar un estudio sobre la hipertensión y

sus consecuencias, se toman dos muestras de 13 y
16 pacientes de ciudades distintas. Los datos mues-
trales obtenidos fueron los siguientes:
x1 = 166 mm. Sc1 = 28 mm.
x2 = 1640 7 mm. Sc2 = 7 mm.
Supuesto que ambas poblaciones son Normales y
que sus varianzas son desconocidas y distintas, se
quiere determinar un intervalo de confianza al 95 %
para la diferencia de medias.
Lo primero es calcular el valor de a.
µ 2 ¶2
Sc1 Sc22
n1 + n2
a = ³ S 2 ´2 ³ S 2 ´2 − 2
1 c1 1 c2
n1 −1 n1 + n2 −1 n2
= 130 4.
Luego se toma a = 13. Por otra parte, puesto que
t13,00 975 = 20 16, el intervalo buscado es
h q i
I0 95 (µ1 − µ2 ) = 166−164 7 ± 2 16 784
0
0 0 49
13 + 16
= [−150 89, 180 49].
4.7. Intervalo de confianza para el cociente de varianzas
Al ser Sc1 y Sc2 independientes, se tiene que


Sc21  2 Sc21
(n1 − 1) 2 ∼ χn1 −1 
2
 n1 −1 Sc1
σ1 n1 −1 σ 2
1 σ2
2 =⇒ = S 21 ∼ Fn1 −1,n2 −1 ,
S  S
n2 −1 c2
2
(n2 − 1) c22 ∼ χ2n2 −1 
c2
 n2 −1 σ22 σ22
σ2
con lo cual, hay que determinar k1 y k2 que verifiquen la igualdad
P [k1 ≤ Fn1 −1,n2 −1 ≤ k2 ] = 1 − α.
Usando el método del reparto equitativo del nivel de significación, se
obtiene que el intervalo de confianza buscado es
µ ¶ " #
σ12 1 Sc21 1 Sc21
I1−α = , ,
σ22 Fn1 −1,n2 −1,1− α2 Sc22 Fn1 −1,n2 −1, α2 Sc22
n
y puesto que Sc2 = 2
n−1 S , se tiene el intervalo
µ ¶ " n1 n1
#
2 2
σ12 1 n1 −1 S1 1 n1 −1 S1
I1−α = n2 2, n2 .
σ22 Fn1 −1,n2 −1,1− α2 n2 −1 S2 Fn1 −1,n2 −1, α2 2
n2 −1 S2
Ejemplo 3.15 Con el fin de estudiar el gasto de combustible de

dos motos procedentes de dos compañı́as diferen-
tes, C1 y C2, se seleccionan al azar 9 motos de la
compañı́a C1 y 12 de la C2. Las de la compañı́a C1
proporcionan una media de 18 km recorridos por
cada litro de combustible, con una cuasivarianza
de 10 1 km2 /l2 y las de la compañı́a C2, una media
de 15 km/l y una cuasivarianza de 20 9 km2 /l2 .
Sabiendo que la distancia recorrida por cada litro
de combustible se distribuye normalmente en las
dos compañı́as, se pretende obtener un intervalo
de confianza al 90 % para el cociente de varianzas.
Llamando Sc21 y Sc22 a las cuasivarianzas muestrales
de las motos de las compañı́as 1 y 2 y teniendo en
cuenta que α = 00 1, se tiene que para n1 = 9 y
n2 = 12 es
Fn1 −1,n2 −1, α2 = 00 34 y Fn1 −1,n2 −1,1− α2 = 20 95.
Ası́ pues, un intervalo de confianza al 90 % para el
cociente de varianzas viene dado por
³ 2´ · ¸
σ 1 10 1 1 10 1
I00 9 σ12 = ,
2 20 95 20 9 00 34 20 9
= [00 13, 10 12].

5.∗∗∗ Método basado en la desigualdad de Tchebychev
En el método del pivote se parte del conocimiento, salvo paráme-

tros, de la distribución de la variable aleatoria que define la población.
Sin embargo, en esta sección se aborda una metodologı́a que permite
obtener un intervalo de confianza para un parámetro de la población co-
nociendo únicamente la media y varianza del estimador de dicho paráme-
tro. Para ello, se usará la desigualdad de Tchebychev, la cual dice que
dada una variable aleatoria, X, tal que E[X] = µ y V[X] = σ 2 , se verifica
que
1
P [|X − µ| ≤ kσ] > 1 − 2 .
k
Sea θ̂(X) un estimador del parámetro que se quiere estudiar, usan-

do la desigualdad anterior se puede encontrar un intervalo de confianza
con una cota inferior del nivel de confianza prefijado. Ası́ pues, se verifica
que · q ¸
1
P |θ̂ − E[θ̂]| ≤ k V[θ̂] > 1 − 2 .
k
En el caso de que el estimador sea insesgado se podrá obtener un inter-
valo con nivel de confianza de al menos 1 − α que viene dado a partir de
las expresiones
1 1
1− 2 =1−α⇒k = √
k α
· q q ¸
1 1
P θ̂ − √ V[θ̂] ≤ θ ≤ θ̂ + √ V[θ̂] ≥ 1 − α.
α α
De lo cual se deduce que un intervalo de confianza es
 s s 
V[θ̂] V[θ̂] 
I1−α (θ) = θ̂ − , θ̂ + .
α α
En el caso particular de que se quiera encontrar un intervalo de

confianza para la media de una población de la cual se conoce la varianza,
puede tomarse como estimador X. De esta forma se obtiene el intervalo
· ¸
σ σ
I1−α (µ) = X − √ ,X + √ .
nα nα
3.6 Método asintótico basado en el Teorema Central del Lı́mite 63
Ejemplo 3.16 Se quiere comparar el intervalo obtenido en este

método con el obtenido usando el método del pivo-
te bajo la hipótesis de Normalidad. En este caso,
el intervalo venı́a dado por
h i
X − Z1− α2 √σn , X + Z1− α2 √σn ,
con lo cual la amplitud de este intervalo es

2 · Z1− α2 √σn ,
mientras que para el método basado en la desigual-
dad de Tchebychev, la amplitud del intervalo es
2· √1 √σ .
α n
Para el caso de un intervalo de confianza a un nivel

de 00 95 y puesto que Z1− α2 = 10 96 y √1α = 40 47, se
puede deducir que aunque el método aproximado
es aplicable en situaciones muy generales, presenta
la desventaja de no proporcionar un intervalo con
buenas propiedades.
6.∗∗∗ Método asintótico basado en el Teorema Central del

Lı́mite
Esta sección está dedicada a la búsqueda de intervalos de confianza

para la media de una población de la cual se posee una muestra de gran
tamaño, es decir, se va a construir un intervalo de confianza asintótico
para la media.
Cuando se busca el intervalo de confianza para la media de una

población, el estimador natural es la media muestral X. Sin embargo,
puede suceder que se desconozca su distribución y consecuentemente no
se pueda calcular dicho intervalo. Para superar esta dificultad, se utiliza
el Teorema Central del Lı́mite.
Antes de continuar es necesario introducir el concepto de conver-

gencia en distribución o en ley.
Dada (Xn )n∈N una sucesión de variables aleatorias con función de

distribución Fn . Se dice que Xn converge en ley o en distribución a una
variable aleatoria X con función de distribución F , si Fn (x) → F (x) en
todo punto de continuidad de F, este tipo de convergencia se denota por
d l
Xn −→ X o Xn −→ X.
Ası́ mismo, será de gran utilidad el siguiente teorema conocido

como Teorema de Linderberg–Lévy.
Dadas X1 , . . . , Xn , variables aleatorias independientes e idéntica-

mente distribuidas, tales que, E[X] = µ y V[X] = σ 2 < ∞. Entonces:
X − µ√ d
n −→ N (0, 1).
σ
Por tanto, siempre que el objetivo sea obtener un intervalo de

confianza para la media, se puede aplicar este teorema y usar las mismas
técnicas empleadas para obtener el intervalo de confianza para la media
de una población Normal, con la salvedad de que en este caso el nivel
de confianza de este intervalo no será exacto, sino aproximado.
Debido a que en la mayorı́a de las situaciones reales que se presen-

tan la varianza poblacional es desconocida, en este método asintótico la
varianza poblacional, se aproxima por la muestral, obteniéndose que
X − µ√ d
n −→ N (0, 1).
S
6.1. Intervalos de confianza para la proporción
Considérese una m.a.s. X extraı́da de una población definida por

una variable aleatoria X, distribuida según una Bernouilli de parámetro
p. Si la variable aleatoria toma valores 0 y 1, el estimador de máxima
verosimilitud del parámetro p es
n
1X
p̂ = Xi = X.
n
i=1
Puesto que
E[p̂] = p
p(1 − p)
V[p̂] = ,
n
puede deducirse, aplicando una variante del Teorema de Linderberg–
Levy para este tipo de distribuciones, que
p̂ − p d
q −→ N (0, 1).
p(1−p)
n
A partir de este resultado se puede construir un intervalo de confianza,

bien directamente, o a través de la doble aproximación, donde p(1 − p)
es sustituido por su estimador p̂(1 − p̂).
Véase qué intervalos se obtienen por ambos métodos:
1. Sin utilizar la doble aproximación y haciendo k = Z1− α2 .
1 − α = P [−k ≤ N (0, 1) ≤ k]
" #
p̂ − p √
= P −k ≤ p n≤k
p(1 − p)
£ ¤
= P (p̂ − p)2 n ≤ k 2 p(1 − p)
· ¸
k 2 p(1 − p)
= P (p̂2 + p2 − 2pp̂)n ≤
n
·µ 2
¶ µ 2
¶ ¸
k 2 k 2
= P 1+ p − 2p̂ + p + p̂ ≤ 0
n n
q
2 2 2
(2p̂ + kn ) ± (2p̂ + kn )2 − 4(1 + kn )p̂2
p= 2 .
2(1 + kn )
Por tanto el intervalo es

 q 
2 2 k2 2
(2p̂ + kn ) ± (2p̂ + kn )2 − 4(1 + n )p̂
I1−α (p) =  2
,
2(1 + kn )
o equivalentemente
 q 
√k 4p̂(1 − p̂) + k
p̂ 1 n n2
I1−α (p) =  k2
+ n ± k2
.
1+ n 2(1 + ) 2(1 +
k2 n)
2. Utilizando la doble aproximación y el mismo valor para k = Z1− α2 .

1 − α = P [−k ≤ N (0, 1) ≤ k] =
" #
p̂ − p √
= P −k ≤ p n≤k =
p̂(1 − p̂)
· ¸
k p kp
= P p̂ − √ p̂(1 − p̂) ≤ p ≤ p̂ + p̂(1 − p̂) ,
n n
de donde se deduce que el intervalo es
· ¸
k p
I1−α (p) = p̂ ± √ p̂(1 − p̂) .
n
Como puede observarse el primer intervalo obtenido converge al
segundo.
Ejemplo 3.17 En unas elecciones, el candidato A desea estimar,

al 95 % de confianza, la proporción de votantes que
están a su favor. Con este fin, toma una muestra
aleatoria de 100 votantes, observando que el 55 %
son partidarios suyos, obteniendo un intervalo de
confianza de sus probabilidades de triunfo igual a
· q ¸
p̂(1−p̂)
I00 95 (p) = p̂ ± Z00 975 n
· q ¸
0 0 00 55·00 45
= 0 55 ± 1 96 100
= [00 55 ± 00 1]
= [00 45, 00 65].
6.2. Intervalo de confianza para la diferencia de proporciones
Se consideran dos muestras aleatorias simples X e Y , de tamaños

n1 y n2 e independientes entre sı́, extraı́das de poblaciones con distri-
buciones Bernouilli de parámetros p1 y p2 respectivamente. El objetivo
consiste en encontrar un intervalo de confianza para la diferencia de sus

proporciones. Como en el caso anterior, se obtiene que los estimadores
máximo verosı́miles para ambas muestras son:
n n
1X 1
1X 2
p̂1 = Xi p̂2 = Yi
n1 n2
i=1 i=1
verificándose que
 s 
p1 (1 − p1 ) d p1 (1 − p1 ) 
E[p̂1 ] = p1 V[p̂1 ] = p̂1 −→ N p1 ,
n1 n1
y
 s 
p2 (1 − p2 ) d p2 (1 − p2 ) 
E[p̂2 ] = p2 V[p̂2 ] = p̂2 −→ N p2 , .
n2 n2
Puesto que ambas muestras son independientes se tiene que

 s 
d p1 (1 − p1 ) p2 (1 − p2 ) 
p̂1 − p̂2 −→ N p1 − p2 , +
n1 n2
de lo cual puede deducirse usando la doble aproximación la expresión

 
p̂1 − p̂2 − (p1 − p2 )
P −Z1− α2 ≤ q ≤ Z1− α2  = 1 − α,
p̂1 (1−p̂1 ) p̂2 (1−p̂2 )
n1 + n2
siendo el intervalo de confianza buscado igual a

 s 
p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 ) 
I1−α (p1 − p2 ) = p̂1 − p̂2 ± Z1− α2 + .
n1 n2
Ejemplo 3.18 Una determinada empresa quiere saber si su nue-

vo producto tendrá más aceptación en la población
adulta o entre los jóvenes. Para ello, considera una
m.a.s. de 400 adultos y 600 jóvenes, observando que
sólo a 100 adultos y 300 jóvenes les habı́a gustado
su innovador producto. Para comparar las propor-
ciones de adultos y jóvenes a los que les gusta el
producto, a un nivel de confianza del 99 %, se con-
sidera el intervalo de confianza
· q ¸
p̂1 (1−p̂1 ) p̂2 (1−p̂2 )
p̂1 − p̂2 ± Z1− 2
α
n1 + n2 .
Si se considera
p1 = proporción de jóvenes a los que gusta
p2 = proporción de adultos a los que gusta
entonces
300 100
p̂1 = 600 = 00 5 y p̂2 = 400 = 00 25,
con lo que el intervalo queda
· q ¸
0 5·00 5 00 25·00 75
00 5 − 00 25 ± 20 58 0 600 + 400 ,
es decir,
I00 99 (p1 − p2 ) = [00 19, 00 31].
7.∗∗∗ Intervalo asintótico para cualquier parámetro
En el apartado anterior, se estudió la construcción de un inter-

valo de confianza para la media de una población a través de métodos
asintóticos. En esta sección, se extiende el método anterior a cualquier
parámetro del cual se disponga un estimador máximo verosı́mil. Para
ello, se considera el siguiente resultado.
Teorema 3.1 Si se verifican las condiciones de Fisher–Wolfowitz el es-

3.7 Intervalo asintótico para cualquier parámetro 69
timador máximo–verosı́mil de θ, θ̂M V , es asintóticamente Normal:
θ̂M V (X) − θ d
q −→ N (0, 1),
1
(I(θ))− 2
· ¸
∂ 2 log f (x, θ)
donde I(θ) = − E .
∂θ2
Ası́, dada una m.a.s. procedente de una población cuya distribu-

ción depende de un parámetro θ desconocido y suponiendo conocido su
estimador de máxima verosimilitud, el intervalo de confianza para dicho
parámetro viene dado por la expresión
" #
θ̂M V (X) − θ
1 − α = P −Z1− α2 ≤ p ≤ Z1− α2
I(θ)
h p p i
= P θ̂M V (X) − Z1− α2 I(θ) ≤ θ ≤ θ̂M V (X) + Z1− α2 I(θ) ,
obteniéndose el intervalo
h p p i
I1−α (θ) = θ̂M V (X) − Z1− α2 I(θ) , θ̂M V + Z1− α2 I(θ) .
Ejemplo 3.19 Sea X una m.a.s. extraı́da de una población de

Poisson de parámetro desconocido λ. Se sabe que
el estimador de máxima verosimilitud para λ es
λ̂M V (X) = X
y la cantidad de información de Fisher para esta
distribución es
n
I(λ) = ,
λ
de lo cual se deduce que
X−λ √ d
√
λ
n → N (0, 1),
y donde, o bien, puede sustituirse λ, como se vio

anteriormente, en el denominador por un estimador
consistente como es X, o resolverse directamente.

Si se sustituye, se obtiene que:
X−λ √ d
√ n → N (0, 1)
X
y de aquı́, el intervalo de confianza para λ es

· q q ¸
I1−α (λ) = X − Z1− α2 X n , X + Z α
1− 2
X
n .
8. Determinación del tamaño muestral
Una vez estudiados diferentes métodos de construcción de un in-

tervalo de confianza, se pone de manifiesto la importancia del tamaño
muestral en los procesos inferenciales y más concretamente, en la cons-
trucción de intervalos de confianza para la media de una población. En
esta sección, el objetivo va a consistir en fijar el tamaño muestral para
que el error cometido en el proceso de estimación de dichos intervalos
sea menor que una cantidad prefijada.
Ası́, dependiendo del conocimiento o no de la varianza se pueden

distinguir los siguientes casos:
8.1. Determinación del tamaño muestral para estimar la

media, conocida la varianza
Tanto en el caso que la población sea una población N (µ, σ), como
en el caso de que el tamaño muestral sea suficientemente grande se ha
visto que
· ¸
Z1− α2 σ Z1− α2 σ
P X− √ ≤µ≤X+ √ = 1 − α,
n n
o equivalentemente
· ¸
Z1− α2 σ
P |X − µ| ≤ √ = 1 − α,
n
con lo cual, una medida del error cometido en la estimación de la media
Z1− α σ
viene dada por |X − µ|, siendo √ 2 una cota de dicho error.
n
3.8 Determinación del tamaño muestral 71
Por tanto, se puede calcular el tamaño muestral para que el error

absoluto cometido en la estimación sea a lo sumo una cantidad prefijada
ε, de la forma
2
Z1− 2
ασ
2
n= .
ε2
Ejemplo 3.20 Se pretende estimar la media µ de una población
Normal de varianza 170 64 y se quiere tener una
confianza del 95 % de que el error absoluto de esti-
mación sea menor de 00 05. Determı́nese el tamaño
de la muestra.
Para α = 00 05 es Z1− α2 = 10 96. Por tanto, para
ε = 00 05 se tiene que
(10 96)2 · 170 64
n= = 27106.
(00 05)2
8.2. Determinación del tamaño muestral para estimar la

media, desconocida la varianza
De igual forma que en el caso anterior, se obtiene que un intervalo

de confianza a nivel 1 − α para la media de una población es
" r r #
Sc2 Sc2
P X − tn−1,1− α2 ≤ µ ≤ X + tn−1,1− α2 = 1 − α,
n n
o equivalentemente
" r #
Sc2
P |X − µ| ≤ tn−1,1− α2 = 1 − α.
n
Razonando de igual forma que en el apartado anterior, el tamaño mues-

tral necesario para obtener un error de estimación menor que una can-
tidad prefijada, ε, debe ser
t2n−1,1− α Sc2
2
.
ε2
8.3. Determinación del tamaño muestral para la proporción
En las secciones anteriores se estudió que el intervalo de confianza

para la proporción de una población viene dada por
" r r #
p̂(1 − p̂) p̂(1 − p̂)
P p̂ − Z1− α2 ≤ p ≤ p̂ + Z1− α2 = 1 − α,
n n
o equivalentemente
" r #
p̂(1 − p̂)
P |p̂ − p| ≤ Z1− α2 = 1 − α.
n
Siguiendo el razonamiento de los apartados anteriores se obtiene que
el tamaño necesario para cometer un error menor que una cantidad
prefijada, ε, debe ser mayor que
2
Z1− α p̂(1 − p̂)
2
.
ε2
Ejemplo 3.21 Con el fin de organizar su producción, una de-
terminada fábrica emprende una investigación pa-
ra conocer la proporción de consumidores que ad-
quieren su producto. Se quiere que el error de esti-
mación máximo sea del 3 % con una confianza del
95 %, ası́ que se trata de averiguar cuál debe ser el
tamaño de la muestra para que se cumplan estos
objetivos.
Se puede observar que nada se sabe acerca de p̂.
En esta ocasión y puesto que máx p̂(1 − p̂) = 14 , se
tendrá que
1 2
Z
4 1− α
ε2
2
≤ n.
Como ε = 00 03 y α = 00 05, se tiene que Z α2 = 10 96.
Ası́,
(10 96)2
00 25 = 10670 11 ≤ n.
(00 03)2
Por tanto, el tamaño de la muestra ha de ser como
mı́nimo de 1068 consumidores.
3.9 Tablas de Intervalos de Confianza 73
9. Tablas de Intervalos de Confianza
Distribución Parámetro Casos Intervalo
Normal σ conocida x̄ ± Z1− α2 √σ

µ n
N (µ, σ 2 )
n < 30 n ≥ 30
σ desconocida Sc x̄ ± Z α √ Sc
x̄ ± tn−1,1− α2 √ 1− 2
n n
Desconocida σ conocida x̄ ± Z1− α2 √σ

µ n
n ≥ 30
σ desconocida Sc
x̄ ± Z1− α2 √
qn
Bernoulli Muestras p̂q̂
p̂ ± Z1− α2 n
p
B(p) grandes p̂ = x̄ q̂ = 1 − x̄
Ã !
nSµ2 nSµ2
,
Normal χ2 n,1− α χ2 n, α
2 2
µ conocida Xn
N (µ, σ 2 ) (xi − µ)2
σ2 i=1
Sµ2 = n
Ã !
(n − 1)Sc2 (n − 1)Sc2
µ desconocida ,
χ2 n−1,1− α χ2 n−1, α
2 2
Poisson Muestras q
λ x̄ ± Z1− α2 n x̄
P(λ) grandes
Tabla 3.1: Intervalos de confianza para una población
Distribución Parámetro Casos Intervalo

r
σ1 , σ2 σ12 σ22
(x̄1 − x̄2 ) ± Z1− α2 n1 + n2
conocidas
q
Normales 1 1
x̄1 − x̄2 ± tm,1− α2 Sp n1 + n2
Indep. σ1 = σ2
µ1 − µ2 con m = n1 + n2 − 2
N (µ1 , σ12 ) desconocidas (n1 − 1)Sc21 + (n2 − 1)Sc22
Sp2 = n1 + n2 − 2
N (µ2 , σ22 )
r
S2 S2
x̄1 − x̄2 ± ta,1− α2 nc11 + nc22
σ1 6= σ2 ¡ 2 ¢2
Sc1 /n1 + Sc22 /n2
desconocidas a = ¡ 2 ¢2 ¡ 2 ¢2 − 2
Sc1 /n1 Sc2 /n2
+
n1 + 1 n2 + 1
Normales σd σd d¯ = x̄ − x̄
d¯ ± Z1− α2 √ 1 2
Depen. µ1 − µ2 conocida n
N (µ1 , σ12 ) σd n < 30 n ≥ 30

S S
N (µ2 , σ22 ) desconocida d¯ ± tn−1,1− α2 √cd d¯ ± Z1− α2 √cd
n n
Normales µ ¶
σ12 µ1 , µ2 Sc21 /Sc22 Sc21 /Sc22
N (µ1 , σ12 ) Fn1 −1,n2 −1,1− α2 , Fn1 −1,n2 −1, α2
σ22 desconocidas
N (µ2 , σ22 )
n1 x̄1 , n2 x̄2
q
Bernoulli n1 (1 − x̄1 ) p̂1 q̂1 p̂2 q̂2
(p̂1 − p̂2 ) ± Z1− α2 n1 + n2
B(p1 ) p1 − p2 n2 (1 − x̄2 ) p̂1 = x¯1 p̂2 = x¯2
B(p2 ) n1 p1 , n2 p2 q̂1 = 1 − x¯1 q̂2 = 1 − x¯2
n1 q1 , n2 q2 ≥ 5
Tabla 3.2: Intervalos de confianza para dos poblaciones
3.10 Ejercicios 75
10. Ejercicios
10.1. Ejercicios resueltos
3.1 Se han generado aleatoriamente 20 datos extraı́dos de una

población N (0, 4), obteniéndose que X = −00 052783 y Sc2 = 30 17325.
Obtener un intervalo de confianza a un nivel de confianza 1 − α para el
caso en que σ = 1 y en el caso en que no se conozca su valor. De igual
forma, calcúlense los intervalos de confianza para σ en el caso de que
µ = 0 y en el caso de que se desconozca su valor.
Solución: Los resultados obtenidos vienen reflejados en la ta-

bla 3.3.
X = −00 052783 Amplitud del

Intervalos (α = 00 05)
Sc2 = 30 17325 intervalo
σ=1 I1−α (µ) = [−00 437, 00 331] ∆ = 00 768
σ desconocida I1−α (µ) = [−00 407, 00 317] ∆ = 00 724
µ=0 I1−α (σ 2 ) = [20 427, 40 236] ∆ = 10 809
µ desconocida I1−α (σ 2 ) = [20 449, 40 275] ∆ = 10 826
Tabla 3.3: Resultados: Distribución N (µ, σ)
Hay que señalar que el intervalo encontrado cuando σ es descono-

cida es más pequeño que el encontrado cuando es conocida. Esto se debe
a que cuando σ es desconocida se toma la cuasivarianza (o varianza),
que en este caso vale Sc2 = 30 17325, que es más pequeño que el valor de
σ 2 = 4.
3.2 Encuéntrense intervalos de confianza para la Exponencial de

parámetro λ por los métodos del pivote, la desigualdad de Tchebychev
y los métodos asintóticos I y II. Compárense los resultados obtenidos
para un nivel de confianza del 95 % cuando
a) la muestra es de tamaño 100 y la media muestral X =
00 560001
b) la muestra es de tamaño 10000 y la media muestral X =

00 502409.
Solución: Los resultados obtenidos vienen reflejados en la ta-

bla 3.4, donde la amplitud del intervalo se denota por ∆.
n = 100 n = 10000
Método Intervalo de confianza
X = 00 56000 X = 00 50241
 P
n P
n 
Xi Xi [00 463, 00 69] [00 473, 00 554]
Pivotal  i=1 i=1
,g 
g1,n,1− α 1,n, α
2 2
∆ = 00 227 ∆ = 00 081
· ¸
Desigualdad
X
[00 387, 10 013] [00 481, 00 526]
, X
1+ √1αn 1− √1αn
de Tchebychev ∆ = 00 626 ∆ = 00 045
" #
I. Asintótico I
X X
[00 468, 00 697] [00 493, 00 512]
Z1− α , Z1− α
(T.C.L.) 1+ √n2 1− √n2 ∆ = 00 229 ∆ = 00 019
· µ ¶ µ ¶¸
I. Asintótico II Z1− α Z1− α [00 45, 00 67] [00 493, 00 512]
X 1− n , X 1− n
√ 2 √ 2
(M.V.) ∆ = 00 22 ∆ = 00 019
Tabla 3.4: Resultados: Distribución Exp(λ) (α = 00 05)
10.2. Ejercicios propuestos
3.1. Un fabricante diseña un experimento para estimar la ten-

sión de ruptura media de una fibra. Para ello, observa las tensiones de
ruptura, en libras, de 16 hilos de dicha fibra seleccionados aleatoriamen-
te. Las tensiones son 200 8, 200 6, 210 0, 200 9, 190 9, 200 2, 190 8, 190 6, 200 9,
210 1, 200 4, 200 6, 190 7, 190 6, 200 3, 200 7.
Si la tensión de ruptura se distribuye según una Normal de des-

viación tı́pica σ = 00 45 libras, constrúyase un intervalo al 98 % para el
3.10 Ejercicios 77
valor real de la tensión de ruptura promedio de la fibra.
3.2. El ayuntamiento de una determinada ciudad está interesa-

do en estimar la cantidad promedio de dinero que gastan los turistas
durante su estancia en la ciudad. Una encuesta llevada a cabo entre una
muestra aleatoria de turistas obtuvo los siguientes datos expresados en
euros: 150, 175, 163, 148, 142, 189, 135, 174, 168, 152, 158, 184, 134, 146,
155, 163. Suponiendo que la cantidad gastada al dı́a es una variable alea-
toria Normal, obténganse los intervalos de confianza para el promedio
de dinero que gastan los turistas al dı́a, estimados al 90, 95 y 98 %.
3.3. A partir de una muestra de 26 embotelladoras de agua, se

observa que el número medio de botellas llenas es de 710 2 por minuto y
que su varianza es de 130 4. Suponiendo Normalidad, calcule un intervalo
de confianza del 95 % para el número medio de botellas rellenas.
3.4. Se está realizando un estudio para determinar el grado de

precisión de las medidas efectuadas por un aparato. Para ello, se realizan
10 medidas, observándose que presentan una desviación tı́pica de 00 23
unidades. Suponiendo Normalidad, obténgase un intervalo de confianza
al 99 % para la desviación tı́pica de las medidas llevadas a cabo por el
aparato.
3.5. Dos universidades siguen métodos distintos a la hora de

matricular a sus alumnos. Para comparar el tiempo que los alumnos
tardan en completar los trámites de matrı́cula se seleccionó al azar una
muestra de 100 alumnos de cada universidad, obteniéndose los siguientes
resultados, expresados en minutos,
x1 = 500 2; x2 = 520 9; S1 = 40 8; S2 = 50 4.
Supuesto que ambas muestras son independientes y procedentes de po-

blaciones Normales, obténganse los intervalos al 90, 95 y 99 % para la
diferencia de las medias del tiempo de matrı́cula.
3.6. Un agricultor siembra dos tipos de tomates hı́bridos en

cinco parcelas diferentes. Las producciones, en quintales métricos por
hectáreas son las siguientes:
1 2 3 4 5
Hı́brido I 90 85 95 76 80
Hı́brido II 84 87 90 92 90
Si se supone que las poblaciones son Normales:

a) Construya un intervalo de confianza del 90 % para la
diferencia entre las producciones medias.
b) Construya un intervalo de confianza del 90 % para el
cociente de las varianzas.
3.7. Para estudiar la diferencia de estaturas medias, medidas

en centı́metros, de estudiantes varones en las facultades de ciencias de
Cádiz y Málaga, se toma una muestra aleatoria de 15 estudiantes en
cada facultad, obteniéndose:
182 170 175 167 171 174 181 169

Cádiz
174 174 170 176 168 178 180
181 173 177 170 170 175 169 169
Málaga
171 173 177 182 179 165 174
Obtenga el intervalo de confianza al 99 % para la diferencia de es-

taturas medias entre ambos colectivos de estudiantes. Se supone que las
estaturas siguen una distribución Normal y que las varianzas poblacio-
nales son iguales.
3.8. Se está realizando un estudio sobre la evolución del nivel

de colesterol de las personas, para lo cual se seleccionan 10 individuos al
azar y se les somete a una nueva dieta alimenticia durante seis meses, tras
la cual se les volvió a medir el nivel de colesterol en mg/dl. Suponiendo
Normalidad, obtenga un intervalo de confianza al 90 % para la diferencia
de medias.
3.10 Ejercicios 79
Antes 200 156 178 241 240 256 245 220 235 200
Después 190 145 160 240 240 255 230 200 210 195
3.9. Una fábrica produce barras de hierro cuya longitud sigue

una distribución Normal. A partir de la muestra
1000 9, 1010 2, 1000 2, 1000 4, 990 8, 1000 1, 1010 5, 1000 4, 1010 7, 990 5.
a) Encuentre un intervalo de confianza para la longitud

media.
b) Tras revisar la maquinaria, se obtuvo una nueva muestra:
990 7, 1000 7, 970 8, 980 8, 1010 4, 1000 3, 980 7, 1010 1, 990 4, 990 5.
Estudie si se produjo algún cambio en la longitud media de la barras.
3.10. Partiendo de una m.a.s. de tamaño n, construya un inter-

valo de confianza utilizando la desigualdad de Tchebychev con un nivel
1 − α para el parámetro θ de las siguientes ditribuciones:
a) B(θ).
b) U (0, θ).
c) N (0, θ).
3.11. En un comercio se recibe un lote de 200 artı́culos de los

cuales 8 están defectuosos. Obténganse intervalos de confianza al 90, 95
y 99 % para la proporción de artı́culos defectuosos.
3.12. En una población de 10000 niños se desea hacer una cam-

paña de vacunación. Se quiere saber cuántas vacunas deben preverse,
con un 95 % de confianza, si de una m.a.s. de 90 encuestados 30 estaban
vacunados.
3.13. A partir de una muestra de tamaño 100, cuya media fue

00 37,
obtenga un intervalo de confianza del 920 5 % para el parámetro de
una distribución B(1, p).
3.14. A partir de una muestra de 150 enfermos escogidos entre los

admitidos en un hospital durante un periodo de tres años, se observó que
129 tenı́an algún tipo de seguro hospitalario. En un segundo hospital, se
tomó otra muestra de 160 individuos, extraı́da de forma similar, de los
cuales 144 tenı́an algún tipo de seguro. Encuentre los intervalos al 90,
95 y 99 % de confianza para la diferencia de proporciones.
3.15. Con el propósito de estudiar la cantidad de nicotina de una

determinada marca de cigarrillos se toma una muestra de 100 de ellos,
encontrándose una media de 26 mg. Se sabe que la cantidad de nicotina
se distribuye normalmente, y que su desviación tı́pica es de 8 mg.
a) Obtenga un intervalo de confianza para el contenido me-
dio en nicotina al 99 %.
b) Estudie cuál debe ser el tamaño de la muestra para que
la amplitud del intervalo disminuya en 2 mg.
3.16. Determine el tamaño muestral necesario para estimar la

media de una población Normal con varianza igual a 12 y un 90 % de
confianza, de manera que el error en la estimación no sea mayor de 00 01.

Inferencia Estadistica - UCA Intervalos de Confianza

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Inferencia Estadistica - UCA Intervalos de Confianza

Cargado por

Copyright:

Formatos disponibles

Inferencia

Edita: Servicio de Publicaciones de la Universidad de Cádiz

Estimación por intervalos de confianza

En el capı́tulo anterior se estudiaron tanto las propiedades desea-

El capı́tulo se ha organizado introduciendo en primer lugar el

Existen innumerables situaciones reales donde es necesario encon-

traı́da una m.a.s., X, de esta población, para α > 0

Estos ejemplos ponen de manifiesto la necesidad que existe de

Dada una m.a.s. X procedente de una variable aleatoria, X, cuya

Nótese, que en la definición anterior se habla de nivel de confianza

muestral determinada, x, dos valores puntuales. Ası́ pues, el objetivo de

Tras esta apreciación, hay que tener cuidado a la hora de interpre-

En la definición (3.1) se ha hablado de intervalo de confianza en

2. Intervalos de confianza de longitud mı́nima

Se puede observar que al ampliar la longitud de un intervalo de

A continuación se dan algunos procedimientos para obtener inter-

3. Método del pivote

Se considera una m.a.s. X procedente de una población definida

método para calcular intervalos de confianza a partir de una función de

de donde se obtiene que

y por tanto un intervalo de confianza a nivel 1 − α

Obsérvese que k1 (α) y k2 (α) son constantes cuyo

Se dice que T (x; θ) es un pivote o cantidad pivotal si T (x; θ) es

Si existe T (x; θ) pivote se puede construir un intervalo de confianza

a θ̂(X) = máx{X1 , . . . , Xn } que se sabe tiene una

con lo cual se pueden encontrar k1 (α) y k2 (α) tales

Hay que hacer notar que este procedimiento no conduce a un único

P [k1 (α) ≤ T (X; θ) ≤ k2 (α)] = 1 − α

Como ya se comentó en la sección anterior, k1 (α) y k2 (α) se eligen

4. Intervalos de confianza en poblaciones Normales

Debido a la importancia que tienen las poblaciones Normales, se ha

En esta sección se tratan tanto los intervalos de confianza en una

4.1. Intervalo de confianza para la media, conocida la

Debido a que se quiere encontrar un intervalo de confianza para

Una vez calculados k1 y k2 se obtiene que

Se observa que para cada elección de α1 y α2 tales que α1 +α2 = α,

donde FZ es la función de distribución de una N (0, 1).

Para encontrar dicho intervalo se recurre al método de los multi-

1. k1 = k2 , esta solución no es válida pues se tendrı́a un intervalo de

Es decir, el intervalo de confianza más pequeño coincide con el

Ejemplo 3.7 Con el fin de estudiar el número medio de flexio-

= [490 18, 500 38].

4.2. Intervalo de confianza para la media, desconocida la

Denotando por Sc2 a la cuasivarianza muestral y usando que X y

donde tn−1 representa la distribución t-student con n − 1 grados de

igual que en el caso anterior se tendrı́a

que expresado en términos de la varianza, S 2 ,

Ejemplo 3.8 A partir de una muestra de 20 linternas cuyos

4.3. Intervalo de confianza para la varianza, conocida la

En este caso, puesto que Xiσ−µ ∼ N (0, 1) y Xi −µ

donde χ2n representa la distribución Chi–cuadrado con n P

el intervalo de confianza a un nivel 1 − α viene dado por

4.4. Intervalo de confianza para la varianza, desconocida la

Por el Teorema de Fisher se tiene que

Razonando de igual forma que en el apartado anterior se obtiene que el

que expresado en términos de la varianza, S 2 , queda

Ejemplo 3.9 Se sabe que el peso por comprimido de un cier-

donde α = 00 1, n = 6, y S 2 = 40. Ası́,

4.5. Intervalo de confianza para la diferencia de medias de

Sean X e Y dos m.a.s. de tamaño n y apareadas, de tal forma

Antes de proporcionar el intervalo para la diferencia de medias

Se dice que dos muestras X e Y están apareadas cuando los datos

En los casos de muestras apareadas, el modo de proceder para

siderar una única muestra formada por la diferencia de los pares de