Está en la página 1de 42

Inferencia

Estadı́stica
(Teorı́a y problemas)

I. Espejo Miranda
F. Fernández Palacı́n
M. A. López Sánchez
M. Muñoz Márquez
A. M. Rodrı́guez Chı́a
A. Sánchez Navas
C. Valero Franco
°c Servicio de Publicaciones. Universidad de Cádiz
I. Espejo Miranda, F. Fernández Palacı́n, M. A. López Sánchez, M. Muñoz
Márquez, A. M. Rodrı́guez Chı́a, A. Sánchez Navas, C. Valero Franco

Edita: Servicio de Publicaciones de la Universidad de Cádiz


c/ Doctor Marañón, 3. 11002 Cádiz (España)
www.uca.es/publicaciones

ISBN: 978-84-9828-131-6

Se concede permiso para copiar, distribuir y/o modificar este documento bajo los
términos de la Licencia de Documentación Libre de GNU, Versión 1.2 o cualquier
otra versión posterior publicada por la Free Software Foundation. Una traducción
de la licencia está incluida en la sección titulada “Licencia de Documentación
Libre de GNU”.

Permission is granted to copy, distribute and/or modify this document under the
terms of the GNU Free Documentation License, Version 1.2 or any later version
published by the Free Software Foundation. A copy of the license is included in
the section entitled “GNU Free Documentation License”.
Inferencia Estadı́stica (Revisión: Marzo 2007)
I. Espejo Miranda, F. Fernández Palacı́n, M. A. López Sánchez,
M. Muñoz Márquez, A. M. Rodrı́guez Chı́a, A. Sánchez Navas,
C. Valero Franco
c
°2007 Servicio de Publicaciones de la Universidad de Cádiz
http://www.uca.es/teloydisren

Capı́tulo 3

Estimación por intervalos de confianza

1. Introducción

En el capı́tulo anterior se estudiaron tanto las propiedades desea-


bles para un estimador de un determinado parámetro poblacional, como
la forma de calcularlos. Estos estimadores proporcionan, para una mues-
tra concreta, un valor puntual que se denomina estimación puntual. Sin
embargo, a pesar de la indudable utilidad de este procedimiento, en la
práctica, cuando se realiza la estimación de un parámetro se necesita
obtener una medida de la fiabilidad de dicha estimación, medida de la
que se carece en el proceso de estimación puntual, de este modo, surge
la necesidad de encontrar un método que permita calcular una región
que contenga al valor del parámetro con una cierta garantı́a.

El capı́tulo se ha organizado introduciendo en primer lugar el


Método del Pivote, para calcular seguidamente Intervalos de confianza
de parámetros en poblaciones Normales basándose en el mismo. A con-
tinuación se han introducido otros métodos de obtención de estimadores
que se han considerado interesantes, pero que dada su complejidad o su
relativo uso vienen marcados con ∗∗∗ . En concreto, el Método asintótico
basado en el Teorema central del lı́mite va a permitir calcular intervalos
en poblaciones Binomiales. El tema concluye con un epı́grafe dedicado
a la determinación del tamaño muestral para cumplir con el objetivo de
42 Capı́tulo 3. Estimación por intervalos de confianza

precisión establecido.

Existen innumerables situaciones reales donde es necesario encon-


trar regiones en las cuales se tenga la confianza o cierto grado de segu-
ridad de que en ellas se halle el valor de un parámetro desconocido de
la población. A modo de ejemplos:
Ejemplo 3.1 Un vendedor desea establecer la duración de la
garantı́a de un determinado electrodoméstico, de
forma que durante el perı́odo de garantı́a deba sus-
tituir el menor número posible de piezas. El tiempo
hasta el primer fallo, viene dado por una variable
aleatoria, X, tal que, E[X] = θ, donde θ es un
parámetro desconocido.
Si el vendedor no quiere pagar ninguna pieza, el
tiempo de garantı́a deberı́a de ser nulo, pero ésto
supondrı́a una mala imagen cara al público, con los
consecuentes perjuicios. Por tanto, deberá buscar
una cota inferior del tiempo hasta que se produzca
el primer fallo del electrodoméstico, “confiando”
en que la vida media de ese electrodoméstico sea
superior a esa cota inferior. Es decir, extraı́da una
m.a.s., X, de la población, para α > 0 se busca
θ(X) tal que
P [θ(X) ≤ θ] ≥ 1 − α.
Ejemplo 3.2 Un laboratorio está interesado en estudiar la toxi-
cidad media de un determinado producto quı́mico,
para ello quiere establecer una cota superior de di-
cha media y ası́ tener cierta certeza o seguridad de
que la toxicidad del producto estará por debajo de
esa cota superior. Por tanto, si la toxicidad del pro-
ducto viene dada por una variable aleatoria, X, tal
que E[X] = θ donde θ es un parámetro descono-
cido, se quiere obtener una cota superior del nivel
de toxicidad medio “confiando” en que dicho nivel
se encuentre por debajo de esa cota. Es decir, ex-
3.1 Introducción 43

traı́da una m.a.s., X, de esta población, para α > 0


se busca θ(X) tal que
P [θ ≤ θ(X)] ≥ 1 − α.
Ejemplo 3.3 Una empresa tabaquera desea estudiar el nivel me-
dio de nicotina de sus cigarros. A la compañı́a le
interesa que el nivel medio de nicotina se encuentre
entre unos márgenes debido a que un nivel medio
alto supone que el cigarro es muy perjudicial para
la salud y un nivel medio bajo implica que el ci-
garro carece de sabor. De este modo, si el nivel de
nicotina de un cigarro viene dado por una varia-
ble aleatoria, X, tal que E[X] = θ, donde θ es un
parámetro desconocido, se desea, a partir de una
m.a.s., X, y para α > 0 obtener θ(X) y θ(X) tal
que
P [θ(X) ≤ θ ≤ θ(X)] ≥ 1 − α.

Estos ejemplos ponen de manifiesto la necesidad que existe de


construir regiones donde se tenga la “confianza” de encontrar el pará-
metro. Nuestro estudio se centra en el caso en que el parámetro sea
unidimensional y las regiones sean intervalos, por ello, de ahora en ade-
lante, se hablará de intervalos de confianza.

Dada una m.a.s. X procedente de una variable aleatoria, X, cuya


distribución depende de un parámetro desconocido θ y dadas las varia-
bles aleatorias θ(X) y θ(X). Se define intervalo de confianza de nivel
1 − α a un intervalo [θ(X), θ(X)], tal que
P [θ(X) ≤ θ ≤ θ(X)] ≥ 1 − α. (3.1)

Nótese, que en la definición anterior se habla de nivel de confianza


1 − α, sin embargo, la probabilidad en dicha expresión es mayor o igual
que 1 − α, esto se debe a que existen situaciones, como en poblaciones
discretas, donde no es posible que dicha probabilidad sea exactamente
1 − α. Como se puede apreciar, los extremos del intervalo son variables
aleatorias que dependen de la muestra y que toman para una realización
44 Capı́tulo 3. Estimación por intervalos de confianza

muestral determinada, x, dos valores puntuales. Ası́ pues, el objetivo de


este tema va a ser encontrar θ(X) y θ(X), extremos del intervalo de
confianza, cumpliendo determinados criterios relativos a la calidad de
dicho intervalo. Como ilustración del significado de intervalo aleatorio
se tiene el siguiente ejemplo:
Ejemplo 3.4 Sea X una variable aleatoria que sigue una dis-
tribución U (0, θ). El nivel de confianza, basado en
una muestra de tamaño uno, del intervalo aleatorio
[X, 2X] es:
· ¸
1
P [X ≤ θ ≤ 2X] = P θ ≤ X ≤ θ = 12 .
2

Tras esta apreciación, hay que tener cuidado a la hora de interpre-


tar el significado de la expresión (3.1), ya que θ es un valor desconocido
pero constante, por ello, su interpretación correcta es que la probabilidad
de que el intervalo aleatorio [θ(X), θ(X)] contenga el valor del paráme-
tro, θ, es, al menos, 1 − α. Por otra parte, una vez tomada una muestra,
se obtiene un intervalo fijo, con lo cual no tiene sentido hablar de pro-
babilidad, ya que el valor del parámetro pertenecerá o no a ese intervalo
fijo, es decir, lo hará con probabilidad 1 ó 0. La explicación anterior
justifica que tenga que hablarse en términos de “confianza” cuando se
considera una muestra concreta. De esta forma, si el intervalo obtenido
para una muestra concreta se ha construido con un nivel de confianza
de 00 95, se prevé que dicho intervalo contiene al valor del parámetro, ya
que de cada 100 realizaciones muestrales, aproximadamente el intervalo
concreto para 95 de ellas contiene dicho parámetro.

En la definición (3.1) se ha hablado de intervalo de confianza en


el caso acotado, pero de igual forma, como se aprecia en los ejemplos,
puede hablarse de intervalo de confianza acotado inferiormente para θ a
un nivel de confianza 1 − α, como el intervalo [θ(X), +∞) donde θ(X)
verifica que
P [θ(X) ≤ θ] ≥ 1 − α,
y de intervalo de confianza acotado superiormente para θ a un nivel de
confianza 1 − α como el intervalo (−∞, θ(X)], donde θ(X) verifica que
P [θ(X) ≥ θ] ≥ 1 − α.
3.2 Intervalos de confianza de longitud mı́nima 45

2. Intervalos de confianza de longitud mı́nima

Se puede observar que al ampliar la longitud de un intervalo de


confianza aumenta también su nivel de confianza, de hecho, si se conside-
ra el intervalo (−∞, +∞) se obtiene un intervalo a un nivel de confianza
1. Por otro lado, a un nivel de confianza prefijado, se puede compro-
bar que no existe un único intervalo. Por ello, se plantea el problema
de elegir de entre todos los intervalos a un nivel prefijado, alguno con
unas determinadas caracterı́sticas. Desde un punto de vista práctico, el
intervalo de longitud mı́nima es una elección interesante, ya que al con-
servar el nivel de confianza, éste nos da una estimación del parámetro
más ajustada que el resto de intervalos del mismo nivel de confianza.
Sin embargo, dicha elección presenta el problema de que este intervalo
no siempre se puede calcular; en dicho caso, se recurre a una solución
alternativa como puede ser la búsqueda del intervalo que tenga longitud
mı́nima esperada, es decir, aquel que minimice la expresión

E[θ(X) − θ(X)].
Finalmente, cuando tampoco pueda resolverse este problema, el criterio
más empleado consiste en el reparto equitativo del complementario del
nivel de confianza entre las dos colas, es decir,
α
P [θ(X) ≥ θ] =
2
α
P [θ(X) ≤ θ] = .
2
Este criterio presenta la ventaja de que conduce a un intervalo único y
que en el caso de distribución simétrica con respecto al parámetro es de
longitud mı́nima.

A continuación se dan algunos procedimientos para obtener inter-


valos de confianza en las situaciones que usualmente se presentan.

3. Método del pivote

Se considera una m.a.s. X procedente de una población definida


por una variable aleatoria X, cuya distribución dependa de un paráme-
tro desconocido θ. El objetivo de esta sección va a ser desarrollar un
46 Capı́tulo 3. Estimación por intervalos de confianza

método para calcular intervalos de confianza a partir de una función de


la muestra que contenga al parámetro y cuya distribución no dependa
de él. A continuación, se muestra un ejemplo que ilustra este procedi-
miento.
Ejemplo 3.5 Sea X una m.a.s. extraı́da de una N (µ, 2), se busca
un intervalo de confianza para µ a un nivel de con-
fianza 1 − α. Para ello, se sabe que X ∼ N (µ, √σn ),
por tanto
X−µ √
2 n ∼ N (0, 1),
con lo cual se pueden tomar las constantes k1 (α) y
k2 (α) verificando
h √ i
P k1 (α) ≤ X−µ2 n ≤ k 2 (α) = 1 − α,

de donde se obtiene que


h i
P X −k2 (α) √2n ≤ µ ≤ X −k1 (α) √2n = 1 − α

y por tanto un intervalo de confianza a nivel 1 − α


para µ es
h i
X − k2 (α) √2n , X − k1 (α) √2n .

Obsérvese que k1 (α) y k2 (α) son constantes cuyo


valor depende del valor escogido α.

Se dice que T (x; θ) es un pivote o cantidad pivotal si T (x; θ) es


una función monótona en θ para todo valor muestral x, la ecuación
λ = T (x; θ) tiene solución para todo λ y la distribución de T (X; θ) es
independiente de θ.

Si existe T (x; θ) pivote se puede construir un intervalo de confianza


para θ a cualquier nivel.
Ejemplo 3.6 Sea X una m.a.s. extraı́da de una población con
distribución U (0, θ). Se quiere encontrar un inter-
valo de confianza para θ a un nivel de significación
1 − α. Para ello se considera como estimador de θ
3.3 Método del pivote 47

a θ̂(X) = máx{X1 , . . . , Xn } que se sabe tiene una


función de distribución
µ ¶n
t
Fθ̂(X) (t) =
θ
que al ser función de distribución de una variable
aleatoria continua verifica que
Fθ̂(X) (θ̂(X)) ∼ U (0, 1),

con lo cual se pueden encontrar k1 (α) y k2 (α) tales


que
P [k1 (α) ≤ Fθ̂ (θ̂(X)) ≤ k2 (α)] = 1 − α.
Por simplicidad se toma k1 (α) = α2 y k2 (α) = 1− α2 .
Resolviendo las siguientes ecuaciones
à !n
θ̂(X) α
=
θ 2
à !n
θ̂(X) α
= 1− ,
θ 2
se obtiene que;
θ̂(X)
θ = 1
( α2 ) n
θ̂(X)
θ = 1 ,
(1 − α2 ) n
con lo cual un intervalo de confianza a un nivel
1 − α para θ es,
· ¸
θ̂(X) θ̂(X)
I1−α (θ) = α 1
, α 1 .
(1− 2 ) n ( 2 )n

Hay que hacer notar que este procedimiento no conduce a un único


intervalo de confianza, ya que k1 (α) y k2 (α) se pueden escoger de formas
diferentes para que cumplan

P [k1 (α) ≤ T (X; θ) ≤ k2 (α)] = 1 − α


48 Capı́tulo 3. Estimación por intervalos de confianza

de lo cual puede deducirse que existen diferentes θ(X) y θ(X) tal que

P [θ(X) ≤ θ ≤ θ(X)] = 1 − α.

Como ya se comentó en la sección anterior, k1 (α) y k2 (α) se eligen


de manera que θ(X) − θ(X) sea mı́nima, con lo cual, se habrá obtenido
un intervalo de confianza a un nivel 1−α de longitud mı́nima construido
a partir de T (X; θ). Sin embargo, no podrá decirse que es un intervalo de
longitud mı́nima de entre todos los intervalos de confianza a nivel 1 − α,
ya que podrı́a existir otro pivote T ∗ del cual se obtuviera un intervalo
más pequeño.

4. Intervalos de confianza en poblaciones Normales

Debido a la importancia que tienen las poblaciones Normales, se ha


dedicado este apartado al estudio de los intervalos de confianza para sus
parámetros. Por otro lado, la facilidad del cálculo de cantidades pivotales
que presentan estas poblaciones hacen recomendable la obtención de
estos intervalos de confianza a través del método pivotal.

En esta sección se tratan tanto los intervalos de confianza en una


población como en dos poblaciones Normales. En ambos casos, depen-
diendo del parámetro para el cual se busca un intervalo de confianza y
del conocimiento o no de los otros parámetros, se presentan diferentes
situaciones que a continuación van a ser estudiadas. En primer lugar se
analizan las distintas situaciones para el caso de una población X que
sigue una Normal de media µ y varianza σ 2 y de la cual se extrae una
m.a.s., X, de tamaño n. Posteriormente se estudia el caso de dos pobla-
ciones Normales de medias µ1 y µ2 , varianzas σ12 y σ22 y de las cuales se
extraen dos m.a.s., X e Y , de tamaños n1 y n2 , respectivamente.

Las tablas 3.1 y 3.2 resumen los resultados que se van a obtener
en lo que sigue.
3.4 Intervalos de confianza en poblaciones Normales 49

4.1. Intervalo de confianza para la media, conocida la


varianza

Debido a que se quiere encontrar un intervalo de confianza para


la media y se sabe que X ∼ N (µ, √σn ), puede elegirse como pivote la
tipificación de dicha variable aleatoria, es decir,
X − µ√
T (X; θ) = n ∼ N (0, 1),
σ
con lo cual, dado un nivel de confianza 1 − α, para una variable aleatoria
Z ∼ N (0, 1) se pretende encontrar k1 (α) y k2 (α) (que para un mejor
entendimiento serán denotados por k1 = k1 (α) y k2 = k2 (α)), tales que
P [k1 ≤ Z ≤ k2 ] = 1 − α.
Dados α1 , α2 ≥ 0 tales que α1 + α2 = α (α1 y α2 representan el reparto
de la probabilidad α entre las dos colas), k1 y k2 se obtendrán a partir
de las igualdades
P [Z ≤ k1 ] = α1
P [Z ≥ k2 ] = α2 .

Una vez calculados k1 y k2 se obtiene que


· ¸
X − µ√
1 − α = P k1 ≤ n ≤ k2
σ
· ¸
σ σ
= P k1 √ ≤ X − µ ≤ k2 √
n n
· ¸
σ σ
= P X − k2 √ ≤ µ ≤ X − k1 √ .
n n

Se observa que para cada elección de α1 y α2 tales que α1 +α2 = α,


se obtiene un intervalo diferente; con lo cual, como se decı́a anteriormen-
te, se escogerá de entre todos ellos el de longitud mı́nima para este pivote,
siempre que ello sea posible. Es decir,
Min X − k1 √σn − (X − k2 √σn ) = √σn (k2 − k1 )
Sujeto a FZ (k2 ) − FZ (k1 ) = 1 − α
50 Capı́tulo 3. Estimación por intervalos de confianza

donde FZ es la función de distribución de una N (0, 1).

Para encontrar dicho intervalo se recurre al método de los multi-


plicadores de Lagrange. A partir de la función
σ
ψ(k1 , k2 , λ) = √ (k2 − k1 ) + λ (FZ (k2 ) − FZ (k1 ) − (1 − α)) ,
n
se obtiene el siguiente sistema de ecuaciones:
∂ψ(k1 , k2 , λ) σ
= √ + λfZ (k2 ) = 0
∂k2 n
∂ψ(k1 , k2 , λ) σ
= − √ − λfZ (k1 ) = 0
∂k1 n
∂ψ(k1 , k2 , λ)
= FZ (k2 ) − Fz (k1 ) − (1 − α) = 0,
∂λ
siendo fZ la función de densidad de una N (0, 1). Sumando las dos pri-
meras ecuaciones y operando se obtiene que
1 2 1 2
e− 2 k 2 = e− 2 k 1 ,
de donde se deduce que
k12 = k22 .
Por tanto, las soluciones son:

1. k1 = k2 , esta solución no es válida pues se tendrı́a un intervalo de


longitud nula.
2. k1 = −k2 , con lo cual k2 = Z1− α2 , donde Z1− α2 , verifica que
FZ (Z1− α2 ) = 1 − α2 .

Es decir, el intervalo de confianza más pequeño coincide con el


obtenido por el reparto equitativo de α entre ambas colas; lo cual era
esperable ya que la distribución Normal es simétrica respecto a su media.
El intervalo en forma explı́cita viene dado por la expresión
· ¸
σ σ
I1−α (µ) = X − Z1− 2 √ , X + Z1− 2 √ .
α α
n n
3.4 Intervalos de confianza en poblaciones Normales 51

Ejemplo 3.7 Con el fin de estudiar el número medio de flexio-


nes continuadas que pueden realizar sus alumnos,
un profesor de educación fı́sica somete a 80 de ellos,
elegidos aleatoriamente, a una prueba. Los resulta-
dos fueron los siguientes:
Flexiones 35 41 46 48 50 52 53 54 56 60
Alumnos 5 6 2 10 15 6 11 10 5 5
Se sabe que el número de flexiones se distribuye
según una Normal de varianza poblacional 70 5.
Para construir un intervalo de confianza al 95 %
para la media del número de flexiones, se tiene que
la media muestral es x = 490 78 y que Z1− α2 = 10 96.
Por tanto, el intervalo obtenido para esta muestra
concreta, viene dado por
· q ¸
0
I00 95 (µ) = 49 78 ± 1 96 7805
0 0

= [490 18, 500 38].

4.2. Intervalo de confianza para la media, desconocida la


varianza

Denotando por Sc2 a la cuasivarianza muestral y usando que X y


Sc2 son independientes, se tiene que


X − µ√ 

n ∼ N (0, 1) X − µ√
σ =⇒ n ∼ tn−1 ,
S2 
 Sc
(n − 1) c2 ∼ χ2n−1
σ

donde tn−1 representa la distribución t-student con n − 1 grados de


libertad.

Se puede observar que T (X, µ) = X−µ Sc n es un pivote, con lo
cual, puede usarse para obtener un intervalo de confianza para la media
de una población Normal cuando la varianza es desconocida. Operando
52 Capı́tulo 3. Estimación por intervalos de confianza

igual que en el caso anterior se tendrı́a


· ¸
Sc Sc
I1−α (µ) = X − tn−1,1− α2 √ , X + tn−1,1− α2 √ ,
n n

que expresado en términos de la varianza, S 2 ,


· ¸
S S
I1−α (µ) = X − tn−1,1− α2 √ , X + tn−1,1− α2 √ .
n−1 n−1

Ejemplo 3.8 A partir de una muestra de 20 linternas cuyos


periodos de duración (en horas) han sido
503 480 345 427 386 432 429 378 440 434
429 436 451 466 394 422 412 507 433 480
se quiere obtener un intervalo de confianza al 95 %
para la vida media de una población de linternas
que se distribuye normalmente.
Teniendo en cuenta que x = 4340 2, Sc = 400 63 y
que para α = 00 05 y n = 20 es tn−1,1− α2 = 20 093,
se tiene que un intervalo de confianza al 95 % para
la vida media de las linternas es
h 0
i
I00 95 (µ) = 4340 2 ± 20 093 40
√ 63
20
= [4150 18, 4530 21].

4.3. Intervalo de confianza para la varianza, conocida la


media

En este caso, puesto que Xiσ−µ ∼ N (0, 1) y Xi −µ


σ , para i = 1, . . . , n,
son independientes dos a dos, se tiene que
n µ
X ¶
Xi − µ 2
T (X; θ) = ∼ χ2n ,
σ
i=1

donde χ2n representa la distribución Chi–cuadrado con n P


grados de liber-
n
(Xi − µ)2
tad. Utilizando T (X; θ) como pivote y definiendo Sµ2 = i=1 ,
n
3.4 Intervalos de confianza en poblaciones Normales 53

el intervalo de confianza a un nivel 1 − α viene dado por


" #
nS 2 nS 2
µ µ
I1−α (σ 2 ) = , .
χ2n,1− α χ2n, α
2 2

4.4. Intervalo de confianza para la varianza, desconocida la


media

Por el Teorema de Fisher se tiene que


n
X (Xi − X)2
∼ χ2n−1 .
σ2
i=1

Razonando de igual forma que en el apartado anterior se obtiene que el


intervalo de confianza a un nivel 1 − α para σ 2 es
" #
2 (n − 1)Sc2 (n − 1)Sc2
I1−α (σ ) = , ,
χ2n−1,1− α χ2n−1, α
2 2

que expresado en términos de la varianza, S 2 , queda


" #
2 nS 2 nS 2
I1−α (σ ) = , .
χ2n−1,1− α χ2n−1, α
2 2

Ejemplo 3.9 Se sabe que el peso por comprimido de un cier-


to preparado farmacéutico se distribuye según una
Normal. Con el objeto de estudiar la varianza de
la distribución, se extrae una m.a.s. de 6 artı́culos.
Sabiendo que la varianza muestral es igual a 40, se
pretende estimar la varianza poblacional mediante
un intervalo de confianza al 90 %.
Puesto que µ es desconocida, un intervalo de con-
fianza para σ 2 viene dado por
" #
nS 2 nS 2
I1−α (σ 2 ) = , ,
χ2n−1,1− α χ2n−1, α
2 2
54 Capı́tulo 3. Estimación por intervalos de confianza

donde α = 00 1, n = 6, y S 2 = 40. Ası́,


χ25,00 95 = 110 07 y χ25,00 05 = 10 145;
con lo cual,
· ¸
2 6 · 40 6 · 40
I00 90 (σ ) = ,
110 07 10 145
= [210 68, 2090 61].

4.5. Intervalo de confianza para la diferencia de medias de


muestras apareadas

Sean X e Y dos m.a.s. de tamaño n y apareadas, de tal forma


que la primera procede de una población N (µ1 , σ1 ) y la segunda de una
población N (µ2 , σ2 ).

Antes de proporcionar el intervalo para la diferencia de medias


de estas dos poblaciones, se hace necesario indicar qué se entiende por
muestras apareadas.

Se dice que dos muestras X e Y están apareadas cuando los datos


de las muestras vienen por parejas, uno de cada una de ellas, de manera
que cada individuo proporciona dos observaciones.
Ejemplo 3.10 Para estudiar los efectos de un determinado fárma-
co para adelgazar, se selecciona aleatoriamente 6
personas y se toma nota de sus pesos antes y des-
pués de administrarles el medicamento.
Antes 720 0 730 5 700 0 710 5 760 0 800 5
Después 730 0 740 5 740 0 740 5 750 0 820 0
Como puede observarse, los datos vienen por pare-
jas: peso antes y después, dos datos por individuo.
Parece lógico que los datos se encuentren relacio-
nados entre sı́.

En los casos de muestras apareadas, el modo de proceder para


obtener un intervalo de confianza para la diferencia de medias es con-
3.4 Intervalos de confianza en poblaciones Normales 55

siderar una única muestra formada por la diferencia de los pares de


valores, D = X − Y , reduciendo ası́ el problema a encontrar un intervalo
de confianza para la media de una población.
Ejemplo 3.11 Si se quisiera construir un intervalo de confianza
para la diferencia de medias de los datos del ejem-
plo anterior, suponiendo que ambas son m.a.s. pro-
cedentes de poblaciones Normales, bastarı́a consi-
derar una nueva muestra:
D = X −Y,
siendo X los pesos antes del tratamiento y Y los
pesos después del mismo. Ası́, los valores de la nue-
va muestra D de tamaño n = 6 son

−1 −1 −4 −3 1 −10 5,

cuya media muestral es x = −10 58 y su cuasiva-


rianza Sc2 = 30 04. El intervalo de confianza para la
diferencia de medias viene dado por
h i
Sc S
I1−α (µD ) = D−tn−1,1− α2 √ n
, D+t n−1,1− α √c
2 n
.

Para α = 00 05, se tiene tn−1,1− α2 = t5,00 975 = 20 57


y el intervalo queda
I00 95 (µD ) = [−30 41, 00 25].

4.6. Intervalo de confianza para la diferencia de medias de


muestras independientes

Sean ahora dos m.a.s. X e Y de tamaños n1 y n2 , respectivamente,


independientes entre sı́, de tal forma que la primera procede de una
población N (µ1 , σ1 ) y la segunda de una población N (µ2 , σ2 ). Usando
que X y Y son independientes, se sabe que
µ ¶ 
σ1   s 
X ∼ N µ1 , √ 
 2 2
µ n1 ¶ σ1 σ
=⇒ X − Y ∼ N µ1 − µ2 , + 2,
σ2 
 n1 n2
Y ∼ N µ2 , √ 
n2
56 Capı́tulo 3. Estimación por intervalos de confianza

y usando que Sc21 y Sc22 son independientes, se tiene que



S2 
(n1 − 1) c21 ∼ χ2n1 −1 

σ1 S2 S2
2 =⇒ (n1 − 1) c21 + (n2 − 1) c22 ∼ χ2n1 +n2 −2 ,
S  σ1 σ2
(n2 − 1) c22 ∼ χ2n2 −1 

σ2
donde Sc21 y Sc22 son las cuasivarianzas muestrales para las muestras X
e Y respectivamente.

El pivote que permite construir el intervalo de confianza para la


diferencia de medias de ambas poblaciones, se construye basándose en
los resultados anteriores, y depende en gran medida del conocimiento o
no de las varianzas poblacionales.

4.6.1. Intervalo de confianza cuando las varianzas son


conocidas

Se sabe que
 s 
σ12 σ22 
X − Y ∼ N µ1 − µ2 , + ,
n1 n2

con lo cual se puede tomar como pivote


X − Y − (µ1 − µ2 )
q 2 ∼ N (0, 1),
σ1 σ22
n1 + n2
de donde siguiendo la metodologı́a anterior se obtiene que

· q q ¸
σ12 σ22 σ12 σ22
P X−Y −Z1− α2 n1 +n2 ≤ µ1−µ2 ≤ X−Y +Z1− α2 n1 +n2 =
=1−α
por tanto el intervalo buscado es
I1−α (µ1 − µ2 ) =
 s s 
σ12 σ22 σ12 σ22
= X −Y −Z1− α2 + , X −Y +Z1− α2 + .
n1 n2 n1 n2
3.4 Intervalos de confianza en poblaciones Normales 57

Ejemplo 3.12 Se quiere estudiar la diferencia de las vidas medias


de dos tipos de lámparas. Para ello, se toma una
muestra de 150 lámparas de tipo H y otra, inde-
pendiente de la anterior, de 200 lámparas de tipo
N, obteniéndose que las de tipo H tienen una vi-
da media de 1400 horas y una desviación tı́pica de
120, y que las de tipo N tienen una vida media de
1200 horas y desviación tı́pica 80.
Para estimar la diferencia de medias se construye
un intervalo de confianza al 95 %, que viene dado
por
· q 2 ¸
σH 2
σN
X H −Y N ± Z1− 2 nH + nN .
α

Sustituyendo en la expresión anterior, se obtiene


· q ¸
0 1202 802
1400−1200 ± 1 96 150 + 200 ,

y por tanto,
I00 95 (µH − µN ) = [1770 8, 2220 2].

4.6.2. Intervalo de confianza cuando las varianzas son


desconocidas e iguales

Como Sc21 y Sc22 son independientes, se sabe que



S2 
(n1 − 1) c21 ∼ χ2n1 −1  (n1 − 1)Sc21 + (n2 − 1)Sc22
σ2 =⇒ ∼ χ2n1 +n2 −2
Sc2  σ 2
(n2 − 1) 2 ∼ χ2n2 −1 
σ
y puesto que X y Sc21 , ası́ como, Y y Sc22 son independientes, se tiene el
pivote
T (X, Y , µ1 − µ2 ) =
³q ´−1
X−Y −(µ1 −µ2 ) 1 1
σ n1 + n2
= r
(n1 −1)Sc21 +(n2 −1)Sc22
σ 2 (n1 +n2 −2)
58 Capı́tulo 3. Estimación por intervalos de confianza
µr ¶−1
X − Y − (µ1 − µ2 ) 1 1
= q + ∼ tn1 +n2 −2 ,
(n1 −1)Sc21 +(n2 −1)Sc22 n1 n2
n1 +n2 −2

obteniéndose como intervalo de confianza

I1−α (µ1 − µ2 ) =
· r ³ ´¸
(n1 −1)Sc21 +(n2 −1)Sc22 1 1
= X − Y ± tn1 +n2 −2,1− α2 n1 +n2 −2 n1 + n2

que expresado en función de la varianza muestral queda

I1−α (µ1 − µ2 ) =
" s µ ¶#
n1 S12 + n2 S22 1 1
= X − Y ± tn1 +n2 −2,1− α2 + .
n1 + n2 − 2 n1 n2

Ejemplo 3.13 De una población N (µ1 , σ 2 ), se extrae una m.a.s.


de tamaño 10, tal que la media muestral es 4’1
y la varianza muestral es 6’09. De otra población
N (µ2 , σ 2 ) se toma otra m.a.s. de tamaño 16 e in-
dependiente de la anterior, cuya media y varianza
muestrales son 3’875 y 3’609, respectivamente. Se
quiere obtener un intervalo de confianza del 95 %
para la diferencia de medias poblacionales.
Puesto que la varianzas poblacionales son descono-
cidas pero iguales, el intervalo de confianza para la
diferencia de medias viene dado por
· r ³ ´¸
n1 S12+n2 S22 1 1
X −Y ± tn1 +n2 −2,1− α2 n1 +n2 −2 n1 + n2 .

Para α = 00 05 se tiene que t24,00 975 = 20 0639. Ası́,


· q ¸
0 0 0
¡
10·60 09+16·30 609 1 1
¢
4 1−3 875 ± 2 0639 24 10 + 16 .

Por tanto,
I00 95 (µ1 − µ2 ) = [−10 6248, 20 0748].
3.4 Intervalos de confianza en poblaciones Normales 59

4.6.3. Intervalo de confianza cuando las varianzas son


desconocidas y distintas

En este caso, puesto que X y Sc21 , ası́ como, Y y Sc22 son indepen-
dientes, se tiene que

X − Y − (µ1 − µ2 )
q 2 ∼ N (0, 1),
σ1 σ22
n1 + n2

ası́ como
Sc21 Sc22
(n1 − 1) + (n2 − 1) ∼ χ2n1 +n2 −2 .
σ12 σ2
Por tanto
X−Y −(µ1 −µ2 )
r
2
σ1 σ2
n1
+ n2
2
s ∼ tn1 +n2 −2 ,
Sc2 Sc2
(n1 −1) 1 2
2 +(n2 −1) σ 2
σ1 2
n1 +n2 −2

pero como se ve el estadı́stico depende de σ1 y σ2 por lo que se recurre


a la aproximación de Welch, en función de la cual el estadı́stico

X − Y − (µ1 − µ2 )
s ,
Sc21 Sc22
+
n1 n2

tiene una distribución aproximada ta,1− α2 siendo a un factor corrector


que se calcula tomando el entero más próximo a
µ 2 ¶2
Sc1 Sc22
n1 + n2
a= ³ S 2 ´2 ³ S 2 ´2 − 2
1 c1 1
n1 +1 n1 + n2 +1 nc22

y donde el intervalo de confianza para µ1 − µ2 viene dado por


 s 
2
Sc1 S 2
I1−α (µ1 − µ2 ) = X − Y ± ta,1− α2 + c2  .
n1 n2
60 Capı́tulo 3. Estimación por intervalos de confianza

Ejemplo 3.14 Para realizar un estudio sobre la hipertensión y


sus consecuencias, se toman dos muestras de 13 y
16 pacientes de ciudades distintas. Los datos mues-
trales obtenidos fueron los siguientes:
x1 = 166 mm. Sc1 = 28 mm.
x2 = 1640 7 mm. Sc2 = 7 mm.
Supuesto que ambas poblaciones son Normales y
que sus varianzas son desconocidas y distintas, se
quiere determinar un intervalo de confianza al 95 %
para la diferencia de medias.
Lo primero es calcular el valor de a.
µ 2 ¶2
Sc1 Sc22
n1 + n2
a = ³ S 2 ´2 ³ S 2 ´2 − 2
1 c1 1 c2
n1 −1 n1 + n2 −1 n2

= 130 4.
Luego se toma a = 13. Por otra parte, puesto que
t13,00 975 = 20 16, el intervalo buscado es
h q i
I0 95 (µ1 − µ2 ) = 166−164 7 ± 2 16 784
0
0 0 49
13 + 16
= [−150 89, 180 49].

4.7. Intervalo de confianza para el cociente de varianzas

Al ser Sc1 y Sc2 independientes, se tiene que



Sc21  2 Sc21
(n1 − 1) 2 ∼ χn1 −1 
2
 n1 −1 Sc1
σ1 n1 −1 σ 2
1 σ2
2 =⇒ = S 21 ∼ Fn1 −1,n2 −1 ,
S  S
n2 −1 c2
2
(n2 − 1) c22 ∼ χ2n2 −1 
c2
 n2 −1 σ22 σ22
σ2
con lo cual, hay que determinar k1 y k2 que verifiquen la igualdad
P [k1 ≤ Fn1 −1,n2 −1 ≤ k2 ] = 1 − α.
Usando el método del reparto equitativo del nivel de significación, se
3.4 Intervalos de confianza en poblaciones Normales 61

obtiene que el intervalo de confianza buscado es

µ ¶ " #
σ12 1 Sc21 1 Sc21
I1−α = , ,
σ22 Fn1 −1,n2 −1,1− α2 Sc22 Fn1 −1,n2 −1, α2 Sc22

n
y puesto que Sc2 = 2
n−1 S , se tiene el intervalo

µ ¶ " n1 n1
#
2 2
σ12 1 n1 −1 S1 1 n1 −1 S1
I1−α = n2 2, n2 .
σ22 Fn1 −1,n2 −1,1− α2 n2 −1 S2 Fn1 −1,n2 −1, α2 2
n2 −1 S2

Ejemplo 3.15 Con el fin de estudiar el gasto de combustible de


dos motos procedentes de dos compañı́as diferen-
tes, C1 y C2, se seleccionan al azar 9 motos de la
compañı́a C1 y 12 de la C2. Las de la compañı́a C1
proporcionan una media de 18 km recorridos por
cada litro de combustible, con una cuasivarianza
de 10 1 km2 /l2 y las de la compañı́a C2, una media
de 15 km/l y una cuasivarianza de 20 9 km2 /l2 .
Sabiendo que la distancia recorrida por cada litro
de combustible se distribuye normalmente en las
dos compañı́as, se pretende obtener un intervalo
de confianza al 90 % para el cociente de varianzas.
Llamando Sc21 y Sc22 a las cuasivarianzas muestrales
de las motos de las compañı́as 1 y 2 y teniendo en
cuenta que α = 00 1, se tiene que para n1 = 9 y
n2 = 12 es
Fn1 −1,n2 −1, α2 = 00 34 y Fn1 −1,n2 −1,1− α2 = 20 95.
Ası́ pues, un intervalo de confianza al 90 % para el
cociente de varianzas viene dado por
³ 2´ · ¸
σ 1 10 1 1 10 1
I00 9 σ12 = ,
2 20 95 20 9 00 34 20 9

= [00 13, 10 12].


62 Capı́tulo 3. Estimación por intervalos de confianza

5.∗∗∗ Método basado en la desigualdad de Tchebychev

En el método del pivote se parte del conocimiento, salvo paráme-


tros, de la distribución de la variable aleatoria que define la población.
Sin embargo, en esta sección se aborda una metodologı́a que permite
obtener un intervalo de confianza para un parámetro de la población co-
nociendo únicamente la media y varianza del estimador de dicho paráme-
tro. Para ello, se usará la desigualdad de Tchebychev, la cual dice que
dada una variable aleatoria, X, tal que E[X] = µ y V[X] = σ 2 , se verifica
que
1
P [|X − µ| ≤ kσ] > 1 − 2 .
k

Sea θ̂(X) un estimador del parámetro que se quiere estudiar, usan-


do la desigualdad anterior se puede encontrar un intervalo de confianza
con una cota inferior del nivel de confianza prefijado. Ası́ pues, se verifica
que · q ¸
1
P |θ̂ − E[θ̂]| ≤ k V[θ̂] > 1 − 2 .
k
En el caso de que el estimador sea insesgado se podrá obtener un inter-
valo con nivel de confianza de al menos 1 − α que viene dado a partir de
las expresiones
1 1
1− 2 =1−α⇒k = √
k α
· q q ¸
1 1
P θ̂ − √ V[θ̂] ≤ θ ≤ θ̂ + √ V[θ̂] ≥ 1 − α.
α α
De lo cual se deduce que un intervalo de confianza es
 s s 
V[θ̂] V[θ̂] 
I1−α (θ) = θ̂ − , θ̂ + .
α α

En el caso particular de que se quiera encontrar un intervalo de


confianza para la media de una población de la cual se conoce la varianza,
puede tomarse como estimador X. De esta forma se obtiene el intervalo
· ¸
σ σ
I1−α (µ) = X − √ ,X + √ .
nα nα
3.6 Método asintótico basado en el Teorema Central del Lı́mite 63

Ejemplo 3.16 Se quiere comparar el intervalo obtenido en este


método con el obtenido usando el método del pivo-
te bajo la hipótesis de Normalidad. En este caso,
el intervalo venı́a dado por
h i
X − Z1− α2 √σn , X + Z1− α2 √σn ,

con lo cual la amplitud de este intervalo es


2 · Z1− α2 √σn ,
mientras que para el método basado en la desigual-
dad de Tchebychev, la amplitud del intervalo es
2· √1 √σ .
α n

Para el caso de un intervalo de confianza a un nivel


de 00 95 y puesto que Z1− α2 = 10 96 y √1α = 40 47, se
puede deducir que aunque el método aproximado
es aplicable en situaciones muy generales, presenta
la desventaja de no proporcionar un intervalo con
buenas propiedades.

6.∗∗∗ Método asintótico basado en el Teorema Central del


Lı́mite

Esta sección está dedicada a la búsqueda de intervalos de confianza


para la media de una población de la cual se posee una muestra de gran
tamaño, es decir, se va a construir un intervalo de confianza asintótico
para la media.

Cuando se busca el intervalo de confianza para la media de una


población, el estimador natural es la media muestral X. Sin embargo,
puede suceder que se desconozca su distribución y consecuentemente no
se pueda calcular dicho intervalo. Para superar esta dificultad, se utiliza
el Teorema Central del Lı́mite.

Antes de continuar es necesario introducir el concepto de conver-


gencia en distribución o en ley.
64 Capı́tulo 3. Estimación por intervalos de confianza

Dada (Xn )n∈N una sucesión de variables aleatorias con función de


distribución Fn . Se dice que Xn converge en ley o en distribución a una
variable aleatoria X con función de distribución F , si Fn (x) → F (x) en
todo punto de continuidad de F, este tipo de convergencia se denota por
d l
Xn −→ X o Xn −→ X.

Ası́ mismo, será de gran utilidad el siguiente teorema conocido


como Teorema de Linderberg–Lévy.

Dadas X1 , . . . , Xn , variables aleatorias independientes e idéntica-


mente distribuidas, tales que, E[X] = µ y V[X] = σ 2 < ∞. Entonces:

X − µ√ d
n −→ N (0, 1).
σ

Por tanto, siempre que el objetivo sea obtener un intervalo de


confianza para la media, se puede aplicar este teorema y usar las mismas
técnicas empleadas para obtener el intervalo de confianza para la media
de una población Normal, con la salvedad de que en este caso el nivel
de confianza de este intervalo no será exacto, sino aproximado.

Debido a que en la mayorı́a de las situaciones reales que se presen-


tan la varianza poblacional es desconocida, en este método asintótico la
varianza poblacional, se aproxima por la muestral, obteniéndose que

X − µ√ d
n −→ N (0, 1).
S

6.1. Intervalos de confianza para la proporción

Considérese una m.a.s. X extraı́da de una población definida por


una variable aleatoria X, distribuida según una Bernouilli de parámetro
p. Si la variable aleatoria toma valores 0 y 1, el estimador de máxima
verosimilitud del parámetro p es
n
1X
p̂ = Xi = X.
n
i=1
3.6 Método asintótico basado en el Teorema Central del Lı́mite 65

Puesto que

E[p̂] = p
p(1 − p)
V[p̂] = ,
n
puede deducirse, aplicando una variante del Teorema de Linderberg–
Levy para este tipo de distribuciones, que
p̂ − p d
q −→ N (0, 1).
p(1−p)
n

A partir de este resultado se puede construir un intervalo de confianza,


bien directamente, o a través de la doble aproximación, donde p(1 − p)
es sustituido por su estimador p̂(1 − p̂).

Véase qué intervalos se obtienen por ambos métodos:

1. Sin utilizar la doble aproximación y haciendo k = Z1− α2 .

1 − α = P [−k ≤ N (0, 1) ≤ k]
" #
p̂ − p √
= P −k ≤ p n≤k
p(1 − p)
£ ¤
= P (p̂ − p)2 n ≤ k 2 p(1 − p)
· ¸
k 2 p(1 − p)
= P (p̂2 + p2 − 2pp̂)n ≤
n
·µ 2
¶ µ 2
¶ ¸
k 2 k 2
= P 1+ p − 2p̂ + p + p̂ ≤ 0
n n
q
2 2 2
(2p̂ + kn ) ± (2p̂ + kn )2 − 4(1 + kn )p̂2
p= 2 .
2(1 + kn )

Por tanto el intervalo es


 q 
2 2 k2 2
(2p̂ + kn ) ± (2p̂ + kn )2 − 4(1 + n )p̂
I1−α (p) =  2
,
2(1 + kn )
66 Capı́tulo 3. Estimación por intervalos de confianza

o equivalentemente
 q 
√k 4p̂(1 − p̂) + k
p̂ 1 n n2
I1−α (p) =  k2
+ n ± k2
.
1+ n 2(1 + ) 2(1 +
k2 n)

2. Utilizando la doble aproximación y el mismo valor para k = Z1− α2 .


1 − α = P [−k ≤ N (0, 1) ≤ k] =
" #
p̂ − p √
= P −k ≤ p n≤k =
p̂(1 − p̂)
· ¸
k p kp
= P p̂ − √ p̂(1 − p̂) ≤ p ≤ p̂ + p̂(1 − p̂) ,
n n
de donde se deduce que el intervalo es
· ¸
k p
I1−α (p) = p̂ ± √ p̂(1 − p̂) .
n
Como puede observarse el primer intervalo obtenido converge al
segundo.

Ejemplo 3.17 En unas elecciones, el candidato A desea estimar,


al 95 % de confianza, la proporción de votantes que
están a su favor. Con este fin, toma una muestra
aleatoria de 100 votantes, observando que el 55 %
son partidarios suyos, obteniendo un intervalo de
confianza de sus probabilidades de triunfo igual a
· q ¸
p̂(1−p̂)
I00 95 (p) = p̂ ± Z00 975 n
· q ¸
0 0 00 55·00 45
= 0 55 ± 1 96 100

= [00 55 ± 00 1]
= [00 45, 00 65].

6.2. Intervalo de confianza para la diferencia de proporciones

Se consideran dos muestras aleatorias simples X e Y , de tamaños


n1 y n2 e independientes entre sı́, extraı́das de poblaciones con distri-
buciones Bernouilli de parámetros p1 y p2 respectivamente. El objetivo
3.6 Método asintótico basado en el Teorema Central del Lı́mite 67

consiste en encontrar un intervalo de confianza para la diferencia de sus


proporciones. Como en el caso anterior, se obtiene que los estimadores
máximo verosı́miles para ambas muestras son:

n n
1X 1
1X 2

p̂1 = Xi p̂2 = Yi
n1 n2
i=1 i=1

verificándose que
 s 
p1 (1 − p1 ) d p1 (1 − p1 ) 
E[p̂1 ] = p1 V[p̂1 ] = p̂1 −→ N p1 ,
n1 n1

y
 s 
p2 (1 − p2 ) d p2 (1 − p2 ) 
E[p̂2 ] = p2 V[p̂2 ] = p̂2 −→ N p2 , .
n2 n2

Puesto que ambas muestras son independientes se tiene que


 s 
d p1 (1 − p1 ) p2 (1 − p2 ) 
p̂1 − p̂2 −→ N p1 − p2 , +
n1 n2

de lo cual puede deducirse usando la doble aproximación la expresión


 
p̂1 − p̂2 − (p1 − p2 )
P −Z1− α2 ≤ q ≤ Z1− α2  = 1 − α,
p̂1 (1−p̂1 ) p̂2 (1−p̂2 )
n1 + n2

siendo el intervalo de confianza buscado igual a


 s 
p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 ) 
I1−α (p1 − p2 ) = p̂1 − p̂2 ± Z1− α2 + .
n1 n2
68 Capı́tulo 3. Estimación por intervalos de confianza

Ejemplo 3.18 Una determinada empresa quiere saber si su nue-


vo producto tendrá más aceptación en la población
adulta o entre los jóvenes. Para ello, considera una
m.a.s. de 400 adultos y 600 jóvenes, observando que
sólo a 100 adultos y 300 jóvenes les habı́a gustado
su innovador producto. Para comparar las propor-
ciones de adultos y jóvenes a los que les gusta el
producto, a un nivel de confianza del 99 %, se con-
sidera el intervalo de confianza
· q ¸
p̂1 (1−p̂1 ) p̂2 (1−p̂2 )
p̂1 − p̂2 ± Z1− 2
α
n1 + n2 .

Si se considera
p1 = proporción de jóvenes a los que gusta
p2 = proporción de adultos a los que gusta
entonces
300 100
p̂1 = 600 = 00 5 y p̂2 = 400 = 00 25,
con lo que el intervalo queda
· q ¸
0 5·00 5 00 25·00 75
00 5 − 00 25 ± 20 58 0 600 + 400 ,

es decir,
I00 99 (p1 − p2 ) = [00 19, 00 31].

7.∗∗∗ Intervalo asintótico para cualquier parámetro

En el apartado anterior, se estudió la construcción de un inter-


valo de confianza para la media de una población a través de métodos
asintóticos. En esta sección, se extiende el método anterior a cualquier
parámetro del cual se disponga un estimador máximo verosı́mil. Para
ello, se considera el siguiente resultado.

Teorema 3.1 Si se verifican las condiciones de Fisher–Wolfowitz el es-


3.7 Intervalo asintótico para cualquier parámetro 69

timador máximo–verosı́mil de θ, θ̂M V , es asintóticamente Normal:

θ̂M V (X) − θ d
q −→ N (0, 1),
1
(I(θ))− 2
· ¸
∂ 2 log f (x, θ)
donde I(θ) = − E .
∂θ2

Ası́, dada una m.a.s. procedente de una población cuya distribu-


ción depende de un parámetro θ desconocido y suponiendo conocido su
estimador de máxima verosimilitud, el intervalo de confianza para dicho
parámetro viene dado por la expresión
" #
θ̂M V (X) − θ
1 − α = P −Z1− α2 ≤ p ≤ Z1− α2
I(θ)
h p p i
= P θ̂M V (X) − Z1− α2 I(θ) ≤ θ ≤ θ̂M V (X) + Z1− α2 I(θ) ,

obteniéndose el intervalo
h p p i
I1−α (θ) = θ̂M V (X) − Z1− α2 I(θ) , θ̂M V + Z1− α2 I(θ) .

Ejemplo 3.19 Sea X una m.a.s. extraı́da de una población de


Poisson de parámetro desconocido λ. Se sabe que
el estimador de máxima verosimilitud para λ es
λ̂M V (X) = X
y la cantidad de información de Fisher para esta
distribución es
n
I(λ) = ,
λ
de lo cual se deduce que
X−λ √ d

λ
n → N (0, 1),

y donde, o bien, puede sustituirse λ, como se vio


anteriormente, en el denominador por un estimador
70 Capı́tulo 3. Estimación por intervalos de confianza

consistente como es X, o resolverse directamente.


Si se sustituye, se obtiene que:
X−λ √ d
√ n → N (0, 1)
X

y de aquı́, el intervalo de confianza para λ es


· q q ¸
I1−α (λ) = X − Z1− α2 X n , X + Z α
1− 2
X
n .

8. Determinación del tamaño muestral

Una vez estudiados diferentes métodos de construcción de un in-


tervalo de confianza, se pone de manifiesto la importancia del tamaño
muestral en los procesos inferenciales y más concretamente, en la cons-
trucción de intervalos de confianza para la media de una población. En
esta sección, el objetivo va a consistir en fijar el tamaño muestral para
que el error cometido en el proceso de estimación de dichos intervalos
sea menor que una cantidad prefijada.

Ası́, dependiendo del conocimiento o no de la varianza se pueden


distinguir los siguientes casos:

8.1. Determinación del tamaño muestral para estimar la


media, conocida la varianza

Tanto en el caso que la población sea una población N (µ, σ), como
en el caso de que el tamaño muestral sea suficientemente grande se ha
visto que
· ¸
Z1− α2 σ Z1− α2 σ
P X− √ ≤µ≤X+ √ = 1 − α,
n n
o equivalentemente
· ¸
Z1− α2 σ
P |X − µ| ≤ √ = 1 − α,
n
con lo cual, una medida del error cometido en la estimación de la media
Z1− α σ
viene dada por |X − µ|, siendo √ 2 una cota de dicho error.
n
3.8 Determinación del tamaño muestral 71

Por tanto, se puede calcular el tamaño muestral para que el error


absoluto cometido en la estimación sea a lo sumo una cantidad prefijada
ε, de la forma
2
Z1− 2
ασ
2
n= .
ε2
Ejemplo 3.20 Se pretende estimar la media µ de una población
Normal de varianza 170 64 y se quiere tener una
confianza del 95 % de que el error absoluto de esti-
mación sea menor de 00 05. Determı́nese el tamaño
de la muestra.
Para α = 00 05 es Z1− α2 = 10 96. Por tanto, para
ε = 00 05 se tiene que
(10 96)2 · 170 64
n= = 27106.
(00 05)2

8.2. Determinación del tamaño muestral para estimar la


media, desconocida la varianza

De igual forma que en el caso anterior, se obtiene que un intervalo


de confianza a nivel 1 − α para la media de una población es
" r r #
Sc2 Sc2
P X − tn−1,1− α2 ≤ µ ≤ X + tn−1,1− α2 = 1 − α,
n n

o equivalentemente
" r #
Sc2
P |X − µ| ≤ tn−1,1− α2 = 1 − α.
n

Razonando de igual forma que en el apartado anterior, el tamaño mues-


tral necesario para obtener un error de estimación menor que una can-
tidad prefijada, ε, debe ser
t2n−1,1− α Sc2
2
.
ε2
72 Capı́tulo 3. Estimación por intervalos de confianza

8.3. Determinación del tamaño muestral para la proporción

En las secciones anteriores se estudió que el intervalo de confianza


para la proporción de una población viene dada por
" r r #
p̂(1 − p̂) p̂(1 − p̂)
P p̂ − Z1− α2 ≤ p ≤ p̂ + Z1− α2 = 1 − α,
n n
o equivalentemente
" r #
p̂(1 − p̂)
P |p̂ − p| ≤ Z1− α2 = 1 − α.
n
Siguiendo el razonamiento de los apartados anteriores se obtiene que
el tamaño necesario para cometer un error menor que una cantidad
prefijada, ε, debe ser mayor que
2
Z1− α p̂(1 − p̂)
2
.
ε2
Ejemplo 3.21 Con el fin de organizar su producción, una de-
terminada fábrica emprende una investigación pa-
ra conocer la proporción de consumidores que ad-
quieren su producto. Se quiere que el error de esti-
mación máximo sea del 3 % con una confianza del
95 %, ası́ que se trata de averiguar cuál debe ser el
tamaño de la muestra para que se cumplan estos
objetivos.
Se puede observar que nada se sabe acerca de p̂.
En esta ocasión y puesto que máx p̂(1 − p̂) = 14 , se
tendrá que
1 2
Z
4 1− α
ε2
2
≤ n.
Como ε = 00 03 y α = 00 05, se tiene que Z α2 = 10 96.
Ası́,
(10 96)2
00 25 = 10670 11 ≤ n.
(00 03)2
Por tanto, el tamaño de la muestra ha de ser como
mı́nimo de 1068 consumidores.
3.9 Tablas de Intervalos de Confianza 73

9. Tablas de Intervalos de Confianza

Distribución Parámetro Casos Intervalo

Normal σ conocida x̄ ± Z1− α2 √σ


µ n
N (µ, σ 2 )
n < 30 n ≥ 30
σ desconocida Sc x̄ ± Z α √ Sc
x̄ ± tn−1,1− α2 √ 1− 2
n n

Desconocida σ conocida x̄ ± Z1− α2 √σ


µ n
n ≥ 30
σ desconocida Sc
x̄ ± Z1− α2 √
qn
Bernoulli Muestras p̂q̂
p̂ ± Z1− α2 n
p
B(p) grandes p̂ = x̄ q̂ = 1 − x̄
à !
nSµ2 nSµ2
,
Normal χ2 n,1− α χ2 n, α
2 2
µ conocida Xn
N (µ, σ 2 ) (xi − µ)2
σ2 i=1
Sµ2 = n
à !
(n − 1)Sc2 (n − 1)Sc2
µ desconocida ,
χ2 n−1,1− α χ2 n−1, α
2 2

Poisson Muestras q
λ x̄ ± Z1− α2 n x̄
P(λ) grandes
Tabla 3.1: Intervalos de confianza para una población
74 Capı́tulo 3. Estimación por intervalos de confianza

Distribución Parámetro Casos Intervalo


r
σ1 , σ2 σ12 σ22
(x̄1 − x̄2 ) ± Z1− α2 n1 + n2
conocidas
q
Normales 1 1
x̄1 − x̄2 ± tm,1− α2 Sp n1 + n2
Indep. σ1 = σ2
µ1 − µ2 con m = n1 + n2 − 2
N (µ1 , σ12 ) desconocidas (n1 − 1)Sc21 + (n2 − 1)Sc22
Sp2 = n1 + n2 − 2
N (µ2 , σ22 )
r
S2 S2
x̄1 − x̄2 ± ta,1− α2 nc11 + nc22
σ1 6= σ2 ¡ 2 ¢2
Sc1 /n1 + Sc22 /n2
desconocidas a = ¡ 2 ¢2 ¡ 2 ¢2 − 2
Sc1 /n1 Sc2 /n2
+
n1 + 1 n2 + 1
Normales σd σd d¯ = x̄ − x̄
d¯ ± Z1− α2 √ 1 2
Depen. µ1 − µ2 conocida n

N (µ1 , σ12 ) σd n < 30 n ≥ 30


S S
N (µ2 , σ22 ) desconocida d¯ ± tn−1,1− α2 √cd d¯ ± Z1− α2 √cd
n n
Normales µ ¶
σ12 µ1 , µ2 Sc21 /Sc22 Sc21 /Sc22
N (µ1 , σ12 ) Fn1 −1,n2 −1,1− α2 , Fn1 −1,n2 −1, α2
σ22 desconocidas
N (µ2 , σ22 )
n1 x̄1 , n2 x̄2
q
Bernoulli n1 (1 − x̄1 ) p̂1 q̂1 p̂2 q̂2
(p̂1 − p̂2 ) ± Z1− α2 n1 + n2
B(p1 ) p1 − p2 n2 (1 − x̄2 ) p̂1 = x¯1 p̂2 = x¯2
B(p2 ) n1 p1 , n2 p2 q̂1 = 1 − x¯1 q̂2 = 1 − x¯2
n1 q1 , n2 q2 ≥ 5
Tabla 3.2: Intervalos de confianza para dos poblaciones
3.10 Ejercicios 75

10. Ejercicios

10.1. Ejercicios resueltos

3.1 Se han generado aleatoriamente 20 datos extraı́dos de una


población N (0, 4), obteniéndose que X = −00 052783 y Sc2 = 30 17325.
Obtener un intervalo de confianza a un nivel de confianza 1 − α para el
caso en que σ = 1 y en el caso en que no se conozca su valor. De igual
forma, calcúlense los intervalos de confianza para σ en el caso de que
µ = 0 y en el caso de que se desconozca su valor.

Solución: Los resultados obtenidos vienen reflejados en la ta-


bla 3.3.

X = −00 052783 Amplitud del


Intervalos (α = 00 05)
Sc2 = 30 17325 intervalo
σ=1 I1−α (µ) = [−00 437, 00 331] ∆ = 00 768
σ desconocida I1−α (µ) = [−00 407, 00 317] ∆ = 00 724
µ=0 I1−α (σ 2 ) = [20 427, 40 236] ∆ = 10 809
µ desconocida I1−α (σ 2 ) = [20 449, 40 275] ∆ = 10 826

Tabla 3.3: Resultados: Distribución N (µ, σ)

Hay que señalar que el intervalo encontrado cuando σ es descono-


cida es más pequeño que el encontrado cuando es conocida. Esto se debe
a que cuando σ es desconocida se toma la cuasivarianza (o varianza),
que en este caso vale Sc2 = 30 17325, que es más pequeño que el valor de
σ 2 = 4.

3.2 Encuéntrense intervalos de confianza para la Exponencial de


parámetro λ por los métodos del pivote, la desigualdad de Tchebychev
y los métodos asintóticos I y II. Compárense los resultados obtenidos
para un nivel de confianza del 95 % cuando
a) la muestra es de tamaño 100 y la media muestral X =
00 560001
76 Capı́tulo 3. Estimación por intervalos de confianza

b) la muestra es de tamaño 10000 y la media muestral X =


00 502409.

Solución: Los resultados obtenidos vienen reflejados en la ta-


bla 3.4, donde la amplitud del intervalo se denota por ∆.

n = 100 n = 10000
Método Intervalo de confianza
X = 00 56000 X = 00 50241
 P
n P
n 
Xi Xi [00 463, 00 69] [00 473, 00 554]
Pivotal  i=1 i=1
,g 
g1,n,1− α 1,n, α
2 2
∆ = 00 227 ∆ = 00 081
· ¸
Desigualdad
X
[00 387, 10 013] [00 481, 00 526]
, X
1+ √1αn 1− √1αn
de Tchebychev ∆ = 00 626 ∆ = 00 045
" #
I. Asintótico I
X X
[00 468, 00 697] [00 493, 00 512]
Z1− α , Z1− α
(T.C.L.) 1+ √n2 1− √n2 ∆ = 00 229 ∆ = 00 019
· µ ¶ µ ¶¸
I. Asintótico II Z1− α Z1− α [00 45, 00 67] [00 493, 00 512]
X 1− n , X 1− n
√ 2 √ 2

(M.V.) ∆ = 00 22 ∆ = 00 019

Tabla 3.4: Resultados: Distribución Exp(λ) (α = 00 05)

10.2. Ejercicios propuestos

3.1. Un fabricante diseña un experimento para estimar la ten-


sión de ruptura media de una fibra. Para ello, observa las tensiones de
ruptura, en libras, de 16 hilos de dicha fibra seleccionados aleatoriamen-
te. Las tensiones son 200 8, 200 6, 210 0, 200 9, 190 9, 200 2, 190 8, 190 6, 200 9,
210 1, 200 4, 200 6, 190 7, 190 6, 200 3, 200 7.

Si la tensión de ruptura se distribuye según una Normal de des-


viación tı́pica σ = 00 45 libras, constrúyase un intervalo al 98 % para el
3.10 Ejercicios 77

valor real de la tensión de ruptura promedio de la fibra.

3.2. El ayuntamiento de una determinada ciudad está interesa-


do en estimar la cantidad promedio de dinero que gastan los turistas
durante su estancia en la ciudad. Una encuesta llevada a cabo entre una
muestra aleatoria de turistas obtuvo los siguientes datos expresados en
euros: 150, 175, 163, 148, 142, 189, 135, 174, 168, 152, 158, 184, 134, 146,
155, 163. Suponiendo que la cantidad gastada al dı́a es una variable alea-
toria Normal, obténganse los intervalos de confianza para el promedio
de dinero que gastan los turistas al dı́a, estimados al 90, 95 y 98 %.

3.3. A partir de una muestra de 26 embotelladoras de agua, se


observa que el número medio de botellas llenas es de 710 2 por minuto y
que su varianza es de 130 4. Suponiendo Normalidad, calcule un intervalo
de confianza del 95 % para el número medio de botellas rellenas.

3.4. Se está realizando un estudio para determinar el grado de


precisión de las medidas efectuadas por un aparato. Para ello, se realizan
10 medidas, observándose que presentan una desviación tı́pica de 00 23
unidades. Suponiendo Normalidad, obténgase un intervalo de confianza
al 99 % para la desviación tı́pica de las medidas llevadas a cabo por el
aparato.

3.5. Dos universidades siguen métodos distintos a la hora de


matricular a sus alumnos. Para comparar el tiempo que los alumnos
tardan en completar los trámites de matrı́cula se seleccionó al azar una
muestra de 100 alumnos de cada universidad, obteniéndose los siguientes
resultados, expresados en minutos,

x1 = 500 2; x2 = 520 9; S1 = 40 8; S2 = 50 4.

Supuesto que ambas muestras son independientes y procedentes de po-


blaciones Normales, obténganse los intervalos al 90, 95 y 99 % para la
diferencia de las medias del tiempo de matrı́cula.
78 Capı́tulo 3. Estimación por intervalos de confianza

3.6. Un agricultor siembra dos tipos de tomates hı́bridos en


cinco parcelas diferentes. Las producciones, en quintales métricos por
hectáreas son las siguientes:

1 2 3 4 5
Hı́brido I 90 85 95 76 80
Hı́brido II 84 87 90 92 90

Si se supone que las poblaciones son Normales:


a) Construya un intervalo de confianza del 90 % para la
diferencia entre las producciones medias.
b) Construya un intervalo de confianza del 90 % para el
cociente de las varianzas.

3.7. Para estudiar la diferencia de estaturas medias, medidas


en centı́metros, de estudiantes varones en las facultades de ciencias de
Cádiz y Málaga, se toma una muestra aleatoria de 15 estudiantes en
cada facultad, obteniéndose:

182 170 175 167 171 174 181 169


Cádiz
174 174 170 176 168 178 180
181 173 177 170 170 175 169 169
Málaga
171 173 177 182 179 165 174

Obtenga el intervalo de confianza al 99 % para la diferencia de es-


taturas medias entre ambos colectivos de estudiantes. Se supone que las
estaturas siguen una distribución Normal y que las varianzas poblacio-
nales son iguales.

3.8. Se está realizando un estudio sobre la evolución del nivel


de colesterol de las personas, para lo cual se seleccionan 10 individuos al
azar y se les somete a una nueva dieta alimenticia durante seis meses, tras
la cual se les volvió a medir el nivel de colesterol en mg/dl. Suponiendo
Normalidad, obtenga un intervalo de confianza al 90 % para la diferencia
de medias.
3.10 Ejercicios 79
Antes 200 156 178 241 240 256 245 220 235 200
Después 190 145 160 240 240 255 230 200 210 195

3.9. Una fábrica produce barras de hierro cuya longitud sigue


una distribución Normal. A partir de la muestra

1000 9, 1010 2, 1000 2, 1000 4, 990 8, 1000 1, 1010 5, 1000 4, 1010 7, 990 5.

a) Encuentre un intervalo de confianza para la longitud


media.
b) Tras revisar la maquinaria, se obtuvo una nueva muestra:

990 7, 1000 7, 970 8, 980 8, 1010 4, 1000 3, 980 7, 1010 1, 990 4, 990 5.

Estudie si se produjo algún cambio en la longitud media de la barras.

3.10. Partiendo de una m.a.s. de tamaño n, construya un inter-


valo de confianza utilizando la desigualdad de Tchebychev con un nivel
1 − α para el parámetro θ de las siguientes ditribuciones:
a) B(θ).
b) U (0, θ).
c) N (0, θ).

3.11. En un comercio se recibe un lote de 200 artı́culos de los


cuales 8 están defectuosos. Obténganse intervalos de confianza al 90, 95
y 99 % para la proporción de artı́culos defectuosos.

3.12. En una población de 10000 niños se desea hacer una cam-


paña de vacunación. Se quiere saber cuántas vacunas deben preverse,
con un 95 % de confianza, si de una m.a.s. de 90 encuestados 30 estaban
vacunados.

3.13. A partir de una muestra de tamaño 100, cuya media fue


00 37,
obtenga un intervalo de confianza del 920 5 % para el parámetro de
una distribución B(1, p).
80 Capı́tulo 3. Estimación por intervalos de confianza

3.14. A partir de una muestra de 150 enfermos escogidos entre los


admitidos en un hospital durante un periodo de tres años, se observó que
129 tenı́an algún tipo de seguro hospitalario. En un segundo hospital, se
tomó otra muestra de 160 individuos, extraı́da de forma similar, de los
cuales 144 tenı́an algún tipo de seguro. Encuentre los intervalos al 90,
95 y 99 % de confianza para la diferencia de proporciones.

3.15. Con el propósito de estudiar la cantidad de nicotina de una


determinada marca de cigarrillos se toma una muestra de 100 de ellos,
encontrándose una media de 26 mg. Se sabe que la cantidad de nicotina
se distribuye normalmente, y que su desviación tı́pica es de 8 mg.
a) Obtenga un intervalo de confianza para el contenido me-
dio en nicotina al 99 %.
b) Estudie cuál debe ser el tamaño de la muestra para que
la amplitud del intervalo disminuya en 2 mg.

3.16. Determine el tamaño muestral necesario para estimar la


media de una población Normal con varianza igual a 12 y un 90 % de
confianza, de manera que el error en la estimación no sea mayor de 00 01.

También podría gustarte