Está en la página 1de 4

FÓRMULA

1. Muestras y proporciones de población

Ahora estamos listos para construir nuestro intervalo de confianza. 

Comenzamos con la estimación de la diferencia entre nuestras proporciones de


población. Ambas proporciones de población se estiman mediante una proporción de
muestra. Estas proporciones de muestra son estadísticas que se encuentran
dividiendo el número de éxitos en cada muestra y luego dividiendo por el tamaño de
muestra respectivo.

La primera proporción de población se denota por p  1 . Si el número de éxitos en


nuestra muestra de esta población es k  1 , entonces tenemos una proporción muestral
de :
k1
p̂ 1=
n1

Denotamos esta estadística por p̂ 1 . Leemos este símbolo como "p 1 -sombrero"


porque se parece al símbolo p 1 con un sombrero encima.
De manera similar, podemos calcular una proporción muestral de nuestra segunda
población. El parámetro de esta población es p  2 . Si el número de éxitos en nuestra
muestra de esta población es k  2 , y nuestra proporción muestral es :
k2
p̂ 2=
n2
Estas dos estadísticas se convierten en la primera parte de nuestro intervalo de
confianza. La estimación de p  1 es p̂ 1 . La estimación de p  2 es p̂ 2.  Por tanto, la
estimación de la diferencia p  1 - p  2 es p̂ 1 - p̂ 2.

2. Distribución muestral de la diferencia de proporciones muestrales

A continuación, necesitamos obtener la fórmula del margen de error. Para hacer esto,
primero consideraremos la distribución muestral de p̂ 1 . Esta es una distribución
binomial con probabilidad de éxito p 1 y n 1 ensayos. La media de esta distribución es
la proporción p 1 . La desviación estándar de este tipo de variable aleatoria tiene una
varianza de :
La distribución muestral de p̂ 2 es similar a la de p̂ 1 . Simplemente cambie todos los
índices de 1 a 2 y tendremos una distribución binomial con media de p 2 y varianza de:

Ahora necesitamos algunos resultados de la estadística matemática para determinar la


distribución muestral de p̂ 1 - p̂ 2 . La media de esta distribución es p 1 - p 2 . Debido
al hecho de que las varianzas se suman, vemos que la varianza de la distribución
muestral es p 1 (1 - p 1 ) / n 1 + p 2 (1 - p 2 ) / n 2. La desviación estándar de la
distribución es la raíz cuadrada de esta fórmula.

Hay un par de ajustes que debemos hacer. La primera es que la fórmula para la
desviación estándar de p̂ 1 - p̂ 2 usa los parámetros desconocidos de p 1 y p 2 . Por
supuesto, si realmente conociéramos estos valores, entonces no sería un problema
estadístico interesante en absoluto. No necesitaríamos estimar la diferencia entre p 1 y
p 2. En su lugar, podríamos simplemente calcular la diferencia exacta.

Este problema se puede solucionar calculando un error estándar en lugar de una


desviación estándar. Todo lo que tenemos que hacer es reemplazar las proporciones
de población por proporciones de muestra. Los errores estándar se calculan a partir de
estadísticas en lugar de parámetros. Un error estándar es útil porque estima
efectivamente una desviación estándar. Lo que esto significa para nosotros es que ya
no necesitamos saber el valor de los parámetros p 1 y p 2 . . Dado que se conocen
estas proporciones de muestra, el error estándar viene dado por la raíz cuadrada de la
siguiente expresión:

El segundo elemento que debemos abordar es la forma particular de nuestra


distribución muestral. Resulta que podemos usar una distribución normal para
aproximar la distribución muestral de p̂ 1 - p̂ 2 . La razón de esto es algo técnica, pero
se describe en el siguiente párrafo.
Tanto p̂ 1 como p̂ 2 tienen una distribución muestral que es binomial. Cada una de
estas distribuciones binomiales puede aproximarse bastante bien mediante una
distribución normal. Por tanto, p̂ 1 - p̂ 2 es una variable aleatoria. Se forma como una
combinación lineal de dos variables aleatorias. Cada uno de estos se aproxima
mediante una distribución normal. Por lo tanto, la distribución muestral de p̂ 1 - p̂ 2
también se distribuye normalmente.

3. Fórmula de intervalo de confianza

Ahora tenemos todo lo que necesitamos para armar nuestro intervalo de confianza. La
estimación es (p̂ 1 - p̂ 2 ) y el margen de error es z * [ p̂ 1 (1 - p̂ 1 ) / n 1 + p̂ 2 (1 - p̂
2 ) / n 2. ] 0.5 . El valor que ingresamos para z * viene dictado por el nivel de confianza
C. Los valores comúnmente utilizados para z * son 1,645 para un 90% de confianza y
1,96 para un 95% de confianza. Estos valores para z * denotan la porción de la
distribución normal estándar donde exactamente Cel porcentaje de la distribución está
entre -z * y z *.

La siguiente fórmula nos da un intervalo de confianza para la diferencia de dos


proporciones de población:

Aplicando la fórmula obtendremos 2 valores.


Ubicamos estos 2 valores en la recta numérica y establecemos nuestro intervalo.
Si el 0 está dentro de nuestro intervalo, significa que fue exitoso.
Si el 0 está fuera de nuestro intervalo, significa que no fue exitoso.

BIBLIOGRAFÍA
GREELANE. Ciencia, Tecnología, Matemáticas. Intervalos de confianza para la
diferencia de dos proporciones de población. Actualizada el 06 Marzo de 2017,
acceso 20 de julio de 2021. Disponible en :https://www.greelane.com/es/ciencia-
tecnolog%c3%ada-matem%c3%a1ticas/mates/difference-of-two-population-
proportions-4061672/

También podría gustarte