Está en la página 1de 9

Intervalo de confianza para una proporción

Dada una variable aleatoria con distribución Binomial B(n, p), el objetivo es la construcción de un intervalo de confianza para el parámetro p, basada en una observación de la variable que ha dado como valor x. El mismo caso se aplica si estudiamos una Binomial B(1, p) y consideramos el número de veces que ocurre el suceso que define la variable al repetir el experimento n veces en condiciones de independencia.

Existen dos alternativas a la hora de construir un intervalo de confianza para p:

Considerar la aproximación asintótica de la distribución Binomial en la distribución Normal.

Utilizar un método exacto.

Aproximación asintótica

Tiene la ventaja de la simplicidad en la expresión y en los cálculos, y es la más referenciada en la mayoría de textos de estadística. Se basa en la aproximación

Intervalo de confianza para una proporción Dada una variable aleatoria con distribución Binomial B( n ,

que, trasladada a la frecuencia relativa, resulta

Intervalo de confianza para una proporción Dada una variable aleatoria con distribución Binomial B( n ,

Tomando como estadístico pivote

Intervalo de confianza para una proporción Dada una variable aleatoria con distribución Binomial B( n ,

que sigue una distribución N(0, 1), y añadiendo una corrección por continuidad al pasar de una variable discreta a una continua, se obtiene el intervalo de confianza asintótico:

que sigue una distribución N(0, 1), y añadiendo una corrección por continuidad al pasar de una

Donde z α/2 es el valor de una distribución Normal estándar que deja a su derecha una probabilidad deαpara un intervalo de confianza de (1 − α) · 100 %Las condiciones generalmente aceptadas para considerar válida la aproximación asintótica anterior son:

que sigue una distribución N(0, 1), y añadiendo una corrección por continuidad al pasar de una

El intervalo obtenido es un intervalo asintótico y por tanto condicionado a la validez de la aproximación utilizada.

Intervalos de confianza para proporciones

En la inferencia sobre una proporción el problema se concreta en estimar y contrastar la proporción p de individuos de una población que presentan una determinada característica A (proporción de votantes a un partido político, proporción de parados, ... problema se noveliza mediante una variable dicotómica que toma el valor 1 si se presenta la característica de interés y 0 en caso contrario, esto es, una variable de

). El

Bernoulli,

que sigue una distribución N(0, 1), y añadiendo una corrección por continuidad al pasar de una

,de la que se dispone de una muestra de tamaño n. Entonces, la

proporción poblacional p no es otra cosa que la media poblacional de dicha variable,

estimándose con la correspondiente proporción muestral o media muestral,

.
.
que sigue una distribución N(0, 1), y añadiendo una corrección por continuidad al pasar de una

En el caso de dos poblaciones, se trata de comparar la proporción en la que se presenta una cierta característica A en las mismas (comparar la proporción de voto a un partido en

dos regiones, comparar la proporción de parados entre hombres y mujeres, ...

). El

problema se modeliza mediante dos variables de Bernoulli independientes, de las que se

dispone de sendas muestras aleatorias de tamaño y , respectivamente.
dispone de sendas muestras aleatorias de tamaño
y
, respectivamente.

Intervalo de confianza sobre la proporción poblacional

A partir del estadístico

A partir del estadístico Se construye el intervalo Siendo el valor que en una distribución normalhoja adjunta un ejemplo. Cuando se va a realizar una encuesta para estimar una proporción, lo habitual es plantearse a priori obtener una cierta fiabilidad y precisión en la estimación, buscando el tamaño muestral necesario para conseguirlas. La longitud del intervalo de confianza para p resulta: " id="pdf-obj-4-4" src="pdf-obj-4-4.jpg">

Se construye el intervalo

A partir del estadístico Se construye el intervalo Siendo el valor que en una distribución normalhoja adjunta un ejemplo. Cuando se va a realizar una encuesta para estimar una proporción, lo habitual es plantearse a priori obtener una cierta fiabilidad y precisión en la estimación, buscando el tamaño muestral necesario para conseguirlas. La longitud del intervalo de confianza para p resulta: " id="pdf-obj-4-9" src="pdf-obj-4-9.jpg">

Siendo

Siendo el valor que en una distribución normal estándar deja a su derecha una

el valor que en una distribución normal estándar deja a su derecha una

probabilidad de

.
.

Véase en la hoja adjunta un ejemplo.

Cuando se va a realizar una encuesta para estimar una proporción, lo habitual es plantearse a priori obtener una cierta fiabilidad y precisión en la estimación, buscando el tamaño muestral necesario para conseguirlas. La longitud del intervalo de confianza para p resulta:

A partir del estadístico Se construye el intervalo Siendo el valor que en una distribución normalhoja adjunta un ejemplo. Cuando se va a realizar una encuesta para estimar una proporción, lo habitual es plantearse a priori obtener una cierta fiabilidad y precisión en la estimación, buscando el tamaño muestral necesario para conseguirlas. La longitud del intervalo de confianza para p resulta: " id="pdf-obj-4-37" src="pdf-obj-4-37.jpg">
De aquí podremos calcular el valor de n en función de la longitud del intervalo, L

De aquí podremos calcular el valor de n en función de la longitud del intervalo, L, y de su

fiabilidad, 1-

:
:
De aquí podremos calcular el valor de n en función de la longitud del intervalo, L

Adviértase que llegamos a un resultado en principio incongruente: queremos saber cuántas observaciones tenemos que realizar para estimar p y para ello necesitaremos conocer su estimación, valor que conoceremos una vez hayamos realizado las observaciones. ¿Cómo solucionar este problema? Existen tres posibles vías:

a) Si tuviésemos información (encuestas anteriores, opiniones de experto,

) sobre el

... posible valor de la proporción a estimar, sustituiríamos este valor en la anterior expresión. b) Podríamos realizar una pequeña encuesta (encuesta piloto) que nos proporcionase una primera evaluación de la proporción muestral. Además, esta encuesta puede servir para probar y reformar el cuestionario, organizar el trabajo de campo, etc. c) Si no contásemos con información alguna ni tuviésemos la posibilidad de realizar la encuesta piloto, nos pondríamos en la situación más desfavorable, esto es, la que da lugar al tamaño muestral más grande para la fiabilidad y precisión deseadas. Esa situación se produce cuando n alcanza su máximo, lo cual ocurre cuando p=q=0.5.

En este caso, por otro lado el más habitual, resulta:

En la hoja adjunta se obtiene el tamaño muestral para una fiabilidad y una precisión determinada
En la hoja adjunta se obtiene el tamaño muestral para una fiabilidad y una precisión determinada
En la hoja adjunta se obtiene el tamaño muestral para una fiabilidad y una precisión
determinada en el caso más desfavorable (p=q=0.5).

Intervalo de confianza sobre la diferencia de proporciones poblacionales

A partir del estadístico

En la hoja adjunta se obtiene el tamaño muestral para una fiabilidad y una precisión determinada

Se construye el intervalo

Siendo el valor que en una distribución normal estándar deja a su derecha una probabilidad de
Siendo
el valor que en una distribución normal estándar deja a su derecha una
probabilidad de
.

Véase en la hoja adjunta un ejemplo.

Se construye el intervalo Siendo el valor que en una distribución normal estándar deja a suhoja adjunta un ejemplo. " id="pdf-obj-7-10" src="pdf-obj-7-10.jpg">