Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Este error de muestreo, también llamado precisión, se mide con el error estándar del estimador
σ θ^ =√ V (θ)^
Por lo tanto, toda estimación se debe acompañar del error estándar del estimador.
Una expresión más formal del estimador y su error estándar las podemos obtener por lo que se
llama estimación por intervalo de confianza o simplemente estimación por intervalo.
…donde (1-α) se llama coeficiente o nivel de confianza (a veces indicado por γ), k es una constante
no negativa y resulta ser el multiplicador de confianza correspondiente al valor (1-α) y α es la
probabilidad de que el intervalo no incluya al verdadero parámetro. También se conoce al valor de
α como significación o significancia.
Demostración.
^ |⩽k⋅σ ^ )=1−α
P(|θ−θ θ
Quitando las barras de valor absoluto:
donde se reconocen:
Insistimos: lo que resulta aleatorio es el intervalo (porque depende de los valores de la muestra).
Una duda que pudiera presentarse es: ¿cuál es la distribución del estimador?
La respuesta depende del estimador que utilicemos, del tamaño de la muestra y del conocimiento
o no de la varianza poblacional. Daremos indicaciones para dos de ellos: la media muestral y la
proporción muestral.
Estimación por intervalo de confianza para la media de una población con varianza
poblacional conocida (muestra grande, es decir: 30 o más ejemplares).
El Teorema Central del Límite (TCL) nos asegura que con una muestra lo suficientemente grande
las medias muestrales se distribuyen según una normal. En consecuencia, la expresión
La amplitud del intervalo de confianza (W, por el inglés width: amplitud) será: W =L s−Li
Obsérvese que la estructura del intervalo puede interpretarse como:
Hasta ahora, dado un determinado tamaño de la muestra y un nivel de confianza dado, se calcula el
tamaño del intervalo de confianza. Un problema interesante surge de la necesidad de dar el tamaño
de la muestra que asegure un determinado nivel de confianza y un error (o precisión, es decir: ya
dada la amplitud del intervalo de confianza) ya prefijados.
Hasta ahora:
α (dado: Z) → σ(dado) →n (dado) →se determinan los límites: (Li; Ls), es decir 2e
Ahora aprenderemos a:
e(dado) → σ(dado) → α(dado: Z) →se determina el valor de n
e=Zα / 2⋅ σ error o “media amplitud”
√n
Despejando:
2
√ n=Z α /2⋅σe y elevando al cuadrado: n= Z α/2⋅σ
( e ) (Ec.3)
Observación importante: es raro que el resultado de la (Ec.3) sea un número entero. Lo usual es
que resulte un número con decimales. Pero debemos tener en cuenta que necesitamos un número
entero de ejemplares para conformar nuestra muestra. No podemos fraccionar un ejemplar, de
modo que es necesario redondear el resultado. Analicemos este asunto: si redondeamos al entero
inferior, no podemos asegurar que se cumpla el nivel de confianza (1-α) solicitado; en cambio, si
redondeamos al entero superior nos excedemos ligeramente en el valor solicitado de confianza…
¡pero cumplimos con él! De modo que el redondeo “correcto” deberá ser al entero superior.
(
^p∼N μ ^p=π ;σ ^p=
√ )
π(1−π)
n
para n→∞
Observación: debe tomarse en cuenta que el desvío muestral debe afectarse de un factor de
corrección para poblaciones finitas (FCPF) cuando el número de ejemplares de la población N no
es demasiado grande cuando se lo compara con la cantidad de ejemplares de la muestra n. Como
orientación para utilizar esa corrección, debe considerarse que:
n
N
>0,05 FCPF =
√ N−n
N −1
Aplicando la transformación Z para la proporción, se tiene:
( | | )
^p−π
P Zi < σ < Z s =(1−α)
^p
Como el desvío es positivo, podemos pasarlo multiplicando a los otros dos miembros, es decir:
P ( Z i⋅σ p^ <|p^ −π|< Z s⋅σ ^p) =(1−α)
Haciendo los cambios necesarios para dejar el parámetro en el miembro central de la desigualdad,
obtendremos:
P ( p^ −Z i⋅σ ^p <π< p^ + Z s⋅σ ^p )=(1−α)
Debemos detenernos un instante porque surge un inconveniente. Si observamos la expresión
anterior, vemos que contiene el error estándar del estimador σ p^ . Pero este valor se calcula a
partir del conocimiento de π, puesto que, como se observó anteriormente:
σ p^ =
√ π(1−π)
n
Llegamos a un punto en que para determinar un intervalo de confianza para π (que desconocemos),
es necesario el conocimiento previo… ¡de π!. Esto constituye lo que se conoce como primera
paradoja. Para resolver la cuestión, vamos a reemplazar el valor de π por un estimador insesgado
del mismo, es decir por ^p . En consecuencia, el intervalo de confianza para la proporción será:
[ √
P p^ −Z ⋅
i
p^ (1− ^p )
n
< π< ^p + Z s⋅
√
p^ (1− p^ )
n ]=(1−α) (Ec.4)
Los conceptos de error estándar del estimador, límites inferior y superior del intervalo y amplitud
del intervalo en la expresión (Ec.4) resultan análogos a los tratados en el caso de la media. Sin
embargo nos detendremos un instante en el valor de la “precisión” o “error”. Podemos escribirlo
como:
e=Z⋅σ ^p=Z⋅
√
^p (1− p^ ) W
n
=
2
(Ec.5)
O sea que la expresión (Ec.5) debe considerar la sustitución de π por su estimador ^p comentado
anteriormente. Esto será especialmente útil cuando queramos determinar el tamaño de la muestra.
Tamaño de la muestra para estimar la proporción de una población mediante un intervalo de confianza.
De modo análogo a lo realizado con la media, para determinar el tamaño de la muestra debemos
despejar el valor de n de la expresión (Ec.5). De ese modo:
2
e
Z
=
√
p^ (1− ^p )
n
y elevando al cuadrado: () e
Z
=
p^ (1− ^p )
n
A continuación, despejamos el valor de n:
p^ (1− ^p )
n= 2
(Ec.6)
(e /Z )
Detengámonos un momento en esta última expresión y analicémosla.
Estamos tratando de determinar el valor de n; sin embargo, la expresión contiene el estimador de la
proporción que es:
x
^p=
n
Es decir que, por un lado queremos determinar n porque lo ignoramos y por otro debería ser un dato
porque forma parte del estimador. Claramente no es posible conocer aquello que estamos buscando.
Esto constituye lo que se denomina segunda paradoja. Para resolver esto, volvamos a la (Ec.6).
Nota importante: hemos citado dos estimadores (media y proporción) cuya distribución es normal.
De modo alguno debe entenderse que eso sucede en todos los casos. Se verá más adelante que otras
distribuciones son posibles. Ejemplo: la varianza se distribuye según una distribución χ2 (ji-
cuadrado, también conocida como chi-cuadrado) que es asimétrica y de valores solamente positivos.