Está en la página 1de 8

Estimación por Intervalos de Confianza.

Cuando realizamos un estudio, debemos como primer paso identificar la


característica en estudio, la cual es representada por una variable aleatoria X. Una
vez identificada la variable, debemos identificar la distribución de la población,
distribución que es representada por un modelo probabilístico teorizado f (•) , que
por lo general depende de uno o más parámetros, por cierto desconocidos. En la
mayoría de los casos estos parámetros corresponden a: la media µ , a la varianza
σ 2 , a la proporción π , etc.
Como hemos mencionamos anteriormente, existen muchas razones por la
cual no es posible estudiar a la población, luego, tampoco podremos conocer el
valor de estas medidas que describen a la población, ahora bien, en el proceso de
toma de decisiones, con frecuencia es necesario conocer las características de
una población y una forma de tomar este conocimiento es elegir una muestra que
por una parte sea representativa de la población y por otra cada elemento que
compone la muestra debe escogerse al azar, así, una vez conocidas las
características de la muestra podemos inferir dichos valores hacia la población.
Cuando usamos medidas muestrales para representar las correspondientes
medidas poblacionales, se dice que estamos realizando una estimación puntual.
En la estimación puntual hemos usado un único valor muestral para
representar al parámetro poblacional.
Los estimadores son denotados por el mismo símbolo con que se denotan
los parámetros, sólo que se le coloca un gorro, por ejemplo si denotamos por θ al
parámetro entonces su estimador será denotado por ɵ
θ.
Definición: Un estimador es una regla o algoritmo el cual evaluado por los
valores observados de la muestra arroja un valor llamado estimación.

Observar que los estimadores son estadísticos.

Como ya hemos visto, existen dos métodos ampliamente usados para encontrar
estimadores; el método de los momentos y el método de la máxima verosimilitud.

Ejemplos de estimadores:
i) El estimador de la media poblacional µ es ɵ µ = X media muestral, que es
un estimador insesgado y de varianza mínima.
El estimador de la varianza poblacional σ 2 es σ
ˆ = S , varianza muestral,
2 2
ii)
1 n
donde S 2 = ∑ (X i − X ) 2
n − 1 i =1
x
iii) El estimador de la proporción poblacional π es πˆ = p = , proporción
n
muestral.

62
A pesar que en la estimación puntual está involucrado un único estimador,
el número de estimaciones posibles depende del número de muestras que se
puedan obtener de la población dada, además, en la estimación puntual no es
posible saber que tan cerca está nuestra única estimación del verdadero valor del
parámetro, de aquí, que la estimación por intervalos de confianza sea de mayor
aplicación.

Estimación por Intervalos de confianza.

La ventaja de usar estimación por intervalos de confianza en vez de la


estimación puntual, es que en la estimación por intervalos se indica la precisión de
la estimación de la muestra y se establece un intervalo dentro del cual es muy
probable que se encuentre el parámetro poblacional.
Para formar el intervalo dentro del cual se ha de encontrar el parámetro
poblacional, debemos encontrar dos estadísticos t1 y t2, que constituyen los
extremos del intervalo, y además debemos fijar un nivel de confianza, el cual es
denotado por 1 − α , de modo que si θ es el parámetro, entonces

P( t 1 ≤ θ ≤ t 2 ) = 1 − α

Un método ampliamente usado en la determinación de los intervalos de


confianza, es el método del pivote, en la cual una cantidad llamada pivote debe
cumplir con las siguientes dos características:

i) Ser función de las medidas muestrales y del parámetro desconocido θ .


ii) Tener una distribución que no dependa del parámetro desconocido θ .

Intervalos de confianza para µ , media de una población.

Sabemos que el estimador puntual de la media poblacional es µˆ = X .


Además por teoremas 3.1 o 3.2, la distribución muestral de X es normal con
σ2
media µ X = µ y varianza σ 2X = , cuando la muestra es extraída de una
n
población distribuida normal o por teorema del limite central X tiene distribución
aproximadamente normal con media µ X = µ y varianza σ 2X cuando la población de
donde es extraída la muestra no es distribuida normal.
Si la población de donde se extrae la muestra es distribuida normal y la
(X − µ)
varianza es conocida entonces la cantidad pivote es Z = y el intervalo de
σ
n
confianza del 100(1 − α )% para µ es:
σ σ
µ : ( X − z0 ; X + z0 )
n n

63
donde z 0 es tal que P(−z 0 ≤ Z ≤ z 0 ) = 1 − α

Si la población de donde se extrae la muestra es distribuida normal y la


(X − µ)
varianza no es conocida entonces la cantidad pivote es t = y el intervalo
S
n
de confianza del 100(1 − α )% para µ es:

S S
(
µ : X − t0
n
; X + t0
n )
donde t 0 es tal que P(− t 0 ≤ t ≤ t 0 ) = 1 − α para n-1 grados de libertad.

Ahora si la población de donde es extraída la muestra no es distribuida


normal y n ≥ 30, entonces por teorema del limite central el estadístico X tiene
distribución aproximadamente normal con media µ y varianza σ 2X según
graficamos a continuación.
I) población finita con varianza conocida.
I.1.- Si el muestreo se ha realizado sin reemplazo, que como hemos
mencionado, es lo más común de encontrar y la fracción de muestreo
N−nσ
2
n
> 0.05 , entonces la varianza de X es σ =
2
. 
 N −1  n
X
N
I.2.- Si el muestreo se ha realizado sin reemplazo y la fracción de muestreo
σ2
≤ 0.05 , entonces varianza de X es σ X =
n 2
.
N n
De esta forma, si nos encontramos en la situación (I), entonces el intervalo
de confianza del 100(1 − α)% para µ es:

µ : (X − z 0 σ X ; X + z 0 σ X )
donde z 0 es tal que P(−z 0 ≤ Z ≤ z 0 ) = 1 − α y σ X es calculado a partir de I.1)
o I.2) según corresponda el caso.

II) población finita con varianza desconocida.


II.1.- Si el muestreo se ha realizado sin reemplazo y la fracción de muestreo
n
> 0.05 , entonces el estimador de la varianza de X es
N
 N−nS
2
S =
2
 .
 N −1  n
X

64
II.2.- Si el muestreo se ha realizado sin reemplazo y la fracción de muestreo
S2
≤ 0.05 , entonces el estimador de la varianza de X es S X =
n 2
.
N n
De esta forma, si nos encontramos en la situación (II), entonces el intervalo
de confianza del 100(1 − α)% para µ es:

µ : (X − t 0S X ; X + t 0S X )

donde t 0 es tal que P(− t 0 ≤ T ≤ t 0 ) = 1 − α para n-1 grados de libertad y S X es


calculado a partir de II.1) o II.2) según corresponda el caso.

III.- Si el muestreo se realiza con reemplazo o la población es infinita entonces


cuando la varianza de X es conocida, el intervalo de confianza del
100(1 − α)% para µ es:
µ : (X − z 0 σ X ; X + z 0 σ X )
σ2
donde z 0 es tal que P(−z 0 ≤ Z ≤ z 0 ) = 1 − α con σ = 2
X .
n
Ahora, si la varianza es desconocida entonces el intervalo de confianza del
100(1 − α)% para µ es:
µ : (X − t 0S X ; X + t 0S X )
donde t 0 es tal que P(− t 0 ≤ T ≤ t 0 ) = 1 − α para n-1 grados de libertad donde
S2
el estimador de la varianza de X es S =2
X .
n
Estimación por Intervalo para la proporción π de una población

Suponga que extraemos una muestra aleatoria de tamaño n desde una


población ya sea infinita o de un tamaño grande. Sea X la variable aleatoria
número de observaciones que satisfacen una condición de interés, obviamente
X
cualquier valor x de X es a lo sumo igual a n. Sea p̂ = el estimador puntual
n
para la proporción poblacional π .
Ahora si n es grande o x ≥ 5 y n-x ≥ 5, entonces la distribución muestral de
ɵ
p se aproxima a la distribución normal con media µ p̂ = π y varianza
π(1 − π)
σp2ˆ = , así el intervalo de confianza del 100(1 − α)% para la proporción
n
π es:

65
 
π:  pˆ − z 0 pˆ(1 − pˆ) ; pˆ + z 0 pˆ(1 − pˆ)  , donde z0 es tal que
 n n 

P( − z 0 ≤ Z ≤ z 0 ) = 1 − α .

Intervalos de confianza para µ1 − µ 2 diferencia de medias poblacionales.

De acuerdo a lo visto anteriormente, un estimador puntual de µ1 − µ 2 es X − Y


donde X es la media de una muestra aleatoria de tamaño n extraída de una
población 1 con media µ1 y varianza σ12 y Y es la media de una muestra aleatoria
de tamaño m, independiente de la primera, extraída de una población 2 con
media µ 2 y varianza σ 22 .
Si ambas poblaciones se distribuyen normal y las varianzas son conocidas,
entonces el intervalo del 100(1 − α)% para µ1 − µ 2 es
 σ12 σ 22 σ12 σ 22 
µ1 − µ 2 :  X − Y − z 0 + ; X − Y + z0 +
 n m n m 

donde z 0 es tal que P(−z 0 ≤ Z ≤ z 0 ) = 1 − α .

Si ambas poblaciones se distribuyen normal y las varianzas son


desconocidas pero supuestamente iguales, entonces el intervalo del 100(1 − α)%
para µ1 − µ 2 es
 1 1 1 1 
µ1 − µ 2 :  X − Y − t 0 S p + ; X − Y + t 0Sp + 
 n m n m 
donde t 0 es tal que P(− t 0 ≤ T ≤ t 0 ) = 1 − α para n+m-2 y S 2p es la varianza
ponderada.

Si ambas poblaciones se distribuyen normal y las varianzas son


desconocidas pero desiguales, entonces el intervalo del 100(1 − α)% para µ1 − µ 2
es
 S12 S 22 S12 S 22 

µ1 − µ 2 : X − Y − t 0 + ; X − Y + t0 +
 n m n m 

donde t 0 es tal que P(− t 0 ≤ T ≤ t 0 ) = 1 − α para ν grados de libertad, donde ν es
obtenido según expresión del teorema 3.8

Nota: Si las poblaciones no se distribuyen normal, pero los tamaños de las


muestras son lo suficientemente grandes como para la aplicación del teorema del
limite central, entonces usaremos uno de los tres intervalos anteriormente
definidos según corresponda.

66
Intervalos de confianza para la varianza de población distribuida normal.

Suponga que hemos sacado una muestra aleatoria de tamaño n desde una
población distribuida normal con varianza desconocida. Sabemos que el estimador
puntual de la varianza poblacional σ 2 es σˆ 2 = S 2 , luego un intervalo de confianza
del 100(1 − α)% para σ 2 es:

 (n − 1)S 2 (n − 1)S 2 
σ2 :  ; 
 χb χ a2
2

α
donde χ a2 y χ 2b son tales que P(χ a2 ≤ χ 2 ≤ χ 2b ) = 1 − α y P(χ 2 < χ a2 ) = P(χ 2 > χ 2b ) =
2
para n-1 grados de libertad.

Intervalos de confianza para el cuociente de varianzas de dos poblaciones


distribuidas normal.

Suponga que tenemos dos poblaciones independientes distribuidas normal


con varianzas desconocidas σ12 y σ 22 respectivamente. El estimador puntual de
σ12 es S12 , varianza de una muestra aleatoria de tamaño n, y el estimador puntual
de σ 22 es S 22 , varianza de una muestra aleatoria de tamaño m. De esta forma el
σ12
intervalo de confianza del 100(1 − α)% para es:
σ 22

σ12  S12 S12 


:  ; 
σ 22  S 22 f b S 22 f a 

α
donde f a y f b son tales que P(f a ≤ F ≤ f b ) = 1 − α y P(F < f a ) = P(F > f b ) =
2
para n-1 grados de libertad al numerador y m-1 grados de libertad al
denominador.

Intervalos de confianza para la diferencia de proporciones π1 − π2 de dos


poblaciones

Sea x1, x2, ...,xn una muestra aleatoria seleccionada de una población 1 y, sea x el
número de elementos que tienen una característica de interés en esta muestra.
Sea y1, y2, ...ym una muestra aleatoria, independiente de la primera, seleccionada
de una población 2, sea y el número de elementos que tienen la característica de
interés en esta muestra, luego:

67
x y
pˆ 1 = y pˆ 2 = son los estimadores puntuales de las proporciones
n m
poblacionales respectivas. Por otra parte , si n y m son grandes y bajo
condiciones ya establecidas anteriormente se puede probar que la variable
aleatoria pˆ 1 − pˆ 2 tiene distribución aproximadamente normal con media
µpˆ1 − pˆ2 = π1 − π2 y varianza σp2ˆ1 − pˆ2 = π1 (1 − π1 ) + π2 (1 − π2 ) . De esta forma, dado
n m
un nivel de confianza del 100(1- α )%, el intervalo de confianza para la diferencia
de proporciones es:

 pˆ1 (1 − pˆ 1 ) pˆ 2 (1 − pˆ 2 ) 
π1 − π2 :  pˆ 1 − pˆ 2 ± z 0 + 
 n m 
 

68
FORMULARIO INTERVALOS DE CONFIANZA

Pivote Intervalo de confianza


(X − µ) µ : ( X − z0
σ
; X + z0
σ
)
Z= n n
σ
n
( X − µ) S S
t=
S
(
µ : X − t0
n
; X + t0
n )
n
(X − µ)  N−nσ
2 µ : (X − z 0 σ X ; X + z 0 σ X )
Z = σ =2

 N −1  n
σX X

 N−nS
2 µ : (X − t 0S X ; X + t 0S X )
t =
(X − µ) S = 2

 N −1  n
X
SX

p − π) π :  pˆ − z 0 pˆ(1 − pˆ) pˆ(1 − pˆ) 
Z = ; pˆ + z 0 
p(1 − ɵ
ɵ p)  n n 
n
(n − 1)S 2  
σ 2 :  (n − 12)S (n − 1)S 2
2
χ2 = ; 
σ 2
 χb χ a2 
X −Y − (µ1 − µ2 )  2 2 
 X − Y ± z σ1 + σ2 
Z = µ1 − µ 2 :  0
n m 
σ12 σ22 
+
n m
X −Y − (µ1 − µ2 )  1 1 
t= ~ t(n +m −2) µ1 − µ 2 :  X − Y ± t0S p n + m 
1 1  
Sp +
n m
X −Y − (µ1 − µ2 )  2 2 
 X − Y ± z S1 + S 2 
t= ~ t(ν ) µ1 − µ 2 : 
 0
n m 
S12 S 22 
+
n m
p1 − p2 − (π 1 − π 2 ) π1 − π2 :
Z=  p (1 − pˆ 1 ) pˆ 2 (1 − pˆ 2 ) 
π 1 (1 − π 1 ) π 2 (1 − π 2 )  pˆ 1 − pˆ 2 ± z 0 ˆ1 + 
+ 
 n m 

n m
S12 σ12  S12 S12 
:  ; 
σ 2
σ 22  S 22 f b S 22 f a 
F= 2
1

S 2
σ 22

69

También podría gustarte