Está en la página 1de 2

Distribución hipergeometrica

En teoría de la probabilidad la distribución hipergeométrica es una distribución


discreta relacionada con muestreos aleatorios y sin reemplazo. Suponga que se
tiene una población de N elementos de los cuales, d pertenecen a la categoría A y
N-d a la B. La distribución hipergeométrica mide la probabilidad de obtener x
({\displaystyle 0\leq x\leq d}{\displaystyle 0\leq x\leq d}) elementos de la
categoría A en una muestra sin reemplazo de n elementos de la población original.

Propiedades
La función de probabilidad de una variable aleatoria con distribución
hipergeométrica puede deducirse a través de razonamientos combinatorios y es
igual a

{\displaystyle P(X=x)={\frac {{d \choose x}{N-d \choose n-x}}{N \choose n}},}


{\displaystyle P(X=x)={\frac {{d \choose x}{N-d \choose n-x}}{N \choose n}},}
donde {\displaystyle N}N es el tamaño de población, {\displaystyle n}n es el
tamaño de la muestra extraída, {\displaystyle d}d es el número de elementos en la
población original que pertenecen a la categoría deseada y {\displaystyle x}x es el
número de elementos en la muestra que pertenecen a dicha categoría. La notación
{\displaystyle {a \choose x}}{\displaystyle {a \choose x}} hace referencia al
coeficiente binomial, es decir, el número de combinaciones posibles al seleccionar
{\displaystyle x}x elementos de un total {\displaystyle a}a.

El valor esperado de una variable aleatoria X que sigue la distribución


hipergeométrica es

{\displaystyle E[X]={\frac {nd}{N}}}{\displaystyle E[X]={\frac {nd}{N}}}


y su varianza,

{\displaystyle Var[X]={\bigg (}{\frac {N-n}{N-1}}{\bigg )}{\bigg (}{\frac {nd}{N}}


{\bigg )}{\bigg (}1-{\frac {d}{N}}{\bigg )}.}{\displaystyle Var[X]={\bigg (}{\frac
{N-n}{N-1}}{\bigg )}{\bigg (}{\frac {nd}{N}}{\bigg )}{\bigg (}1-{\frac {d}{N}}{\bigg
)}.}
En la fórmula anterior, definiendo
{\displaystyle p={\frac {d}{N}}}{\displaystyle p={\frac {d}{N}}}
y

{\displaystyle q=1-p\,,}{\displaystyle q=1-p\,,}


se obtiene

{\displaystyle Var[X]=npq{\frac {N-n}{N-1}}.}{\displaystyle Var[X]=npq{\frac {N-


n}{N-1}}.}
La distribución hipergeométrica es aplicable a muestreos sin reemplazo y la
binomial a muestreos con reemplazo. En situaciones en las que el número esperado
de repeticiones en el muestreo es presumiblemente bajo, puede aproximarse la
primera por la segunda. Esto es así cuando N es grande y el tamaño relativo de la
muestra extraída, n/N, es pequeño.

También podría gustarte