Está en la página 1de 15

DISTRIBUCIN HIPERGEOMTRICA

(ir a script de la hipergeomtrica)


Hasta ahora hemos analizado distribuciones que modelizaban situaciones en
las que se realizaban pruebas que entraaban una dicotoma (proceso de
Bernouilli) de manera que en cada experiencia la probabilidad de obtener cada
uno de los dos posibles resultados se mantena constante. Si el proceso consista
en una serie de extracciones o selecciones ello implicaba la reposicin de cada
extraccin o seleccin , o bien la consideracin de una poblacin muy grande.
Sin embargo si la poblacin es pequea y las extracciones no se remplazan las
probabilidades no se mantendrn constantes . En ese caso las distribuciones
anteriores no nos servirn para la modelizar la situacin. La distribucin
hipergeomtrica viene a cubrir esta necesidad de modelizar procesos de
Bernouilli con probabilidades no constantes (sin reemplazamiento) .
La distribucin hipergeomtrica es especialmente til en todos aquellos casos
en los que se extraigan muestras o se realizan experiencias repetidas sin
devolucin del elemento extrado o sin retornar a la situacin experimental
inicial.
Modeliza , de hecho, situaciones en las que se repite un nmero determinado
de veces una prueba dicotmica de manera que con cada sucesivo resultado se ve
alterada la probabilidad de obtener en la siguiente prueba uno u otro resultado. Es
una distribucin .fundamental en el estudio de muestras pequeas de poblaciones
.pequeas y en el clculo de probabilidades de, juegos de azar y tiene grandes
aplicaciones en el control de calidad en otros procesos experimentales en los que
no es posible retornar a la situacin de partida.
La distribucin hipergeomtrica puede derivarse de un proceso experimental
puro o de Bernouilli con las siguientes caractersticas:
El proceso consta de n pruebas , separadas o separables de
entre un conjunto de N pruebas posibles.
Cada una de las pruebas puede dar nicamente dos
resultados mutuamente excluyentes: A y no A.
En la primera prueba las probabilidades son :P(A)= p y
P(A)= q ;con p+q=l.
Las probabilidades de obtener un resultado A y de obtener un resultado no A
varan en las sucesivas pruebas, dependiendo de los resultados anteriores.
(Derivacin de la distribucin) . Si estas circunstancias a
leatorizamos de forma que la variable aleatoria X sea el nmero de
resultados A obtenidos en n pruebas la distribucin de X ser una
Hipergeomtrica de parmetros N,n,p as
Un tpico caso de aplicacin de este modelo es el siguiente :
Supongamos la extraccin aleatoria de n elementos de un
conjunto formado por N elementos totales, de los cuales Np son del tipo A y Nq
son del tipo (p+q=l) .Si realizamos las extracciones sin devolver los elementos
extrados , y llamamos X. al nmero de elementos del tipo A que extraemos en n
extracciones X seguir una distribucin hipergeomtrica de parmetros N , n , p
Funcin de cuanta.
La funcin de cuanta de una distribucin Hipergeomtrica har corresponder a
cada valor de la variable X (x = 0,1,2, . . . n) la probabilidad del suceso "obtener
x resultados del tipo A ", y (n-x) resultados del tipo no A en las n pruebas
realizadas de entre las N posibles.
Veamos :
Hay un total de formas distintas de obtener
x resultados del tipo A y n-x del tipo ,
si partimos de una poblacin formada por Np elementos del tipo A
y Nq elementos del tipo

Por otro lado si realizamos n pruebas o extracciones hay un total de
posibles muestras ( grupos de n elementos)
aplicando la regla de Laplace tendramos

que para valores de X comprendidos entre el conjunto de enteros 0,1,. .n ser
la expresin de la funcin de cuanta de una distribucin , Hipergeomtrica de
parmetros N,n,p .
Media y varianza.
Considerando que una variable hipergeomtrica de parmetros N, n, p puede
considerarse generada por la reiteracin de un proceso dicotmico n veces en el
que las n dicotomas NO son independientes ; podemos considerar que una
variable hipergeomtrica es la suma de n variables dicotmicas NO
independientes.
Es bien sabido que la media de la suma de variables aleatorias (sean stas
independientes o no) es la suma de las medias y por tanto la media de una
distribucin hipergeomtrica ser , como en el caso de la binomial :
En cambio si las variables sumando no son independientes la varianza de la
variable suma no ser la suma de las varianzas.
Si se evala el valor de la varianza para nuestro caso se obtiene que la varianza
de una distribucin hipergeomtrica de parmetros N,n,p es : si

para demostracin de esta expresin vase Wilks S. ,Mathematical
Statistics,1962
Esta forma resulta ser la expresin de la varianza de una binomial (n, p)
afectada por un coeficiente corrector [N-n/N-1] , llamado coeficiente de
exhaustividad o Factor Corrector de Poblaciones Finitas (F.C.P.F.) y que da
cuenta del efecto que produce la no reposicin de los elementos extrados en el
muestreo.
Este coeficiente es tanto ms pequeo cuanto mayor es el tamao muestral
(nmero de pruebas de n ) y puede comprobarse como tiende a aproximarse a 1
cuando el tamao de la poblacin N es muy grande . Este ltimo hecho nos
confirma lo ya comentado sobre la irrelevancia de la reposicin o no cuando se
realizan extracciones sucesivas sobre una poblacin muy grande. Con una
poblacin muy grande se cual fuere el tamao de n , el factor corrector sera uno
lo que convertira , en cierto modo a la hipergeomtrica en una binomial (ver D.
Binomial) . As
Lmite de la distribucin hipergeomtrica cuando N tiende a infinito.
Hemos visto como la media de la distribucin hipergeomtrica [H{N,n,p)],
tomaba siempre el mismo valor que la media de una distribucin binomial
[B{n,p)] tambin hemos comentado que si el valor del parmetro N creca hasta
aproximarse a infinito el coeficiente de exhaustividad tenda a ser 1, y, por lo
tanto, la varianza de la hipergeomtrica se aproximaba a la de la binomial : puede
probarse asimismo , cmo la funcin de cuanta de una distribucin
hipergeomtrica tiende a aproximarse a la funcin de cuanta de una distribucin
binomial cuando


Puede comprobarse en la
representacin grfica de una
hipergeomtrica con N =100000
como sta ,es idntica a la de una
binomial con los mismos
parmetros restantes n y p , que
utilizamos al hablar de
la binomial




Moda de la distribucin hipergeomtrica
De manera anloga a como se obtena la moda en la distribucin binomial es
fcil obtener la expresin de sta para la distribucin hipergeomtrica. De manera
que su expresin X
0
sera la del valor o valores enteros que verificasen.



3) DISTRIBUCIN HIPERGEOMTRICA.

Los experimentos que tienen este tipo de distribucin tienen las siguientes
caractersticas:
a) Al realizar un experimento con este tipo de distribucin, se
esperan dos tipos de resultados.
b) Las probabilidades asociadas a cada uno de los resultados no
son constantes.
c) Cada ensayo o repeticin del experimento no es independiente
de los dems.
d) El nmero de repeticiones del experimento (n) es constante.


Ejemplo:
En una urna o recipiente hay un total de N objetos, entre los cuales
hay una cantidad a de objetos que son defectuosos, si se seleccionan
de esta urna n objetos al azar, y sin reemplazo, cul es la
probabilidad de obtener x objetos defectuosos?
Solucin:

Luego;




donde:
p(x,n) = probabilidad de obtener x objetos defectuosos de
entre n seleccionados

muestras de n objetos en donde hay x que son
defectuosos y n-x buenos

todas las muestras posibles de seleccionar de n objetos
tomadas de entre N objetos en total = espacio muestral


Considerando que en la urna hay un total de 10 objetos, 3 de los
cuales son defectuosos, si de seleccionan 4 objetos al azar, cul es
la probabilidad de que 2 sean defectuosos?

Solucin:

N = 10 objetos en total
a = 3 objetos defectuosos
n = 4 objetos seleccionados en muestra
x = 2 objetos defectuosos deseados en la muestra






donde:


probabilidad asociada a cada muestra de 4 objetos que
se seleccionaron, con lo que se demuestra que las probabilidades no son
constantes


formas o maneras de obtener 2 objetos defectuosos entre los
4 seleccionados = muestras de 4 objetos entre los que 2 son defectuosos


Como se observa en el desarrollo de la solucin del problema, la
pretensin es demostrar que las probabilidades asociadas a cada uno de
los resultados no son constantes.

Luego la probabilidad de obtener 2 objetos defectuosos entre los 4
seleccionados al azar sera:






Ejemplos:
1. Para evitar que lo descubran en la aduana, un viajero ha colocado 6
tabletas de narctico en una botella que contiene 9 pldoras de vitamina que
son similares en apariencia. Si el oficial de la aduana selecciona 3 tabletas
aleatoriamente para analizarlas, a) Cul es la probabilidad de que el viajero
sea arrestado por posesin de narcticos?, b) Cul es la probabilidad de que
no sea arrestado por posesin de narcticos?.

Solucin:
a) N = 9+6 =15 total de tabletas
a = 6 tabletas de narctico
n = 3 tabletas seleccionadas
x = 0, 1, 2, o 3 tabletas de narctico = variable que nos indica el nmero
de tabletas de narctico que se puede encontrar al seleccionar las 3
tabletas

p(viajero sea arrestado por posesin de narcticos) = p(de que entre las 3
tabletas seleccionadas haya 1 o ms tabletas de narctico)






otra forma de resolver;

p(el viajero sea arrestado por posesin de narcticos) = 1 p(de que entre
las tabletas seleccionadas no haya una sola de narctico)




b) p(no sea arrestado por posesin de narcticos)






2. De un lote de 10 proyectiles, 4 se seleccionan al azar y se disparan. Si el lote
contiene 3 proyectiles defectuosos que no explotarn, cul es la probabilidad
de que , a) los 4 exploten?, b) al menos 2 no exploten?

Solucin:
a) N = 10 proyectiles en total
a = 7 proyectiles que explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2, 3 o 4 proyectiles que explotan = variable que nos define el
nmero de proyectiles que explotan entre la muestra que se dispara



b) N = 10 proyectiles en total
a = 3 proyectiles que no explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2 o 3 proyectiles que no explotan

p(al menos 2 no exploten) = p( 2 o ms proyectiles no exploten) = p(x = 2 o 3;
n=4) =




3. a)Cul es la probabilidad de que una mesera se rehse a servir bebidas
alcohlicas nicamente a dos menores de edad si verifica aleatoriamente solo 5
identificaciones de entre 9 estudiantes, de los cuales 4 no tienen la edad
suficiente?, b) Cal es la probabilidad de que como mximo 2 de las
identificaciones pertenezcan a menores de edad?
Solucin:

a) N = 9 total de estudiantes
a = 4 estudiantes menores de edad
n = 5 identificaciones seleccionadas
x = variable que nos define el nmero de identificaciones que pertenecen
a personas menores de edad
x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad



b) N = 9 total de estudiantes
a = 4 estudiantes menores de edad
n = 5 identificaciones seleccionadas
x = variable que nos define el nmero de identificaciones que pertenecen a
personas menores de edad
x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad







4. Una compaa manufacturera utiliza un esquema para la aceptacin de
los artculos producidos antes de ser embarcados. El plan es de dos etapas.
Se preparan cajas de 25 para embarque y se selecciona una muestra de 3
para verificar si tienen algn artculo defectuoso. Si se encuentra uno, la
caja entera se regresa para verificarla al 100%. Si no se encuentra ningn
artculo defectuoso, la caja se embarca. a)Cul es la probabilidad de que se
embarque una caja que tiene tres artculos defectuosos?, b)Cul es la
probabilidad de que una caja que contiene solo un artculo defectuoso se
regresa para verificacin?




7. DISTRIBUCIN GEOMTRICA.

Esta distribucin es un caso especial de la Binomial, ya que se desea que
ocurra un xito por primera y nica vez en el ltimo ensayo que se
realiza del experimento, para obtener la frmula de esta distribucin,
haremos uso de un ejemplo.

Ejemplo:
Se lanza al aire una moneda cargada 8 veces, de tal manera que la
probabilidad de que aparezca guila es de 2/3, mientras que la
probabilidad de que aparezca sello es de 1/3, Determine la probabilidad de
que en el ltimo lanzamiento aparezca una guila.

Solucin:
Si nosotros trazamos un diagrama de rbol que nos represente los 8
lanzamientos de la moneda, observaremos que la nica rama de ese rbol
que nos interesa es aquella en donde aparecen 7 sellos seguidos y por
ltimo una guila; como se muestra a continuacin:

S S S S S S S A

S denotamos;
x = el nmero de repeticiones del experimento necesarias para que ocurra
un xito por primera y nica vez = 8 lanzamientos
p = probabilidad de que aparezca una guila = p( xito) = 2/3
q = probabilidad de que aparezca un sello = p(fracaso) = 1/3

Entonces la probabilidad buscada sera;

P(aparezca una guila en el ltimo lanzamiento)=p(S)*p(S)*p(S)*p(S)*p(S)*p(S)*p(S)*p(A) =

=q*q*q*q*q*q*q*p =
Luego, la frmula a utilizar cuando se desee calcular probabilidades con
esta distribucin sera;



Donde:
p(x) = probabilidad de que ocurra un xito en el ensayo x por primera y
nica vez
p = probabilidad de xito
q = probabilidad de fracaso

Resolviendo el problema de ejemplo;
x = 8 lanzamientos necesarios para que aparezca por primera vez una
guila
p = 2/3 probabilidad de que aparezca una guila
q = 1/3 probabilidad de que aparezca un sello

p(x=8) =
DISTRIBUCIN GEOMTRICA O DE PASCAL
La distribucin geomtrica es un modelo adecuado para aquellos procesos en
los que se repiten pruebas hasta la consecucin del xito a resultado deseado y
tiene interesantes aplicaciones en los muestreos realizados de esta manera .
Tambin implica la existencia de una dicotoma de posibles resultados y la
independencia de las pruebas entre s.
Proceso experimental del que se puede hacer derivar
Esta distribucin se puede hacer derivar de un proceso experimental puro o de
Bernouilli en el que tengamos las siguientes caractersticas
El proceso consta de un nmero no definido de pruebas o experimentos
separados o separables. El proceso concluir cuando se obtenga por primera
vez el resultado deseado (xito).
Cada prueba puede dar dos resultados mutuamente excluyentes : A y no A
La probabilidad de obtener un resultado A en cada prueba es p y la de
obtener un resultado no A es q
siendo (p + q = 1).
Las probabilidades p y q son constantes en todas las pruebas ,por tanto , las
pruebas ,son independientes (si se trata de un proceso de "extraccin" ste se
llevar a , cabo con devolucin del individuo extrado) .
(Derivacin de la distribucin). Si en estas circunstancias aleatorizamos de
forma que tomemos como variable aleatoria X = el nmero de pruebas
necesarias para obtener por primera vez un xito o resultado A , esta
variable se distribuir con una distribucin geomtrica de parmetro p.

Obtencin de la funcin de cuanta
De lo dicho anteriormente , tendremos que la variable X es el nmero de
pruebas necesarias para la consecucin del primer xito. De esta forma la
variables aleatoria toma valores enteros a partir del uno ; 1,2,
La funcin de cuanta P(x) har corresponder a cada valor de X la probabilidad
de obtener el primer xito precisamente en la X-sima prueba. Esto es , P(X) ser
la probabilidad del suceso obtener X-1 resultados "no A" y un xito o resultado A
en la prueba nmero X teniendo en cuenta que todas las pruebas son
independientes y que conocemos sus probabilidades tendremos:

dado que se trata de sucesos independientes y conocemos las probabilidades

luego la funcin de cuanta quedara

Algunos autores
consideran la aleatorizacin
como "nmero de pruebas
anteriores al primer xito". De
esta manera el conseguir el xito
a la primera sera X=0 . En la
siguiente representacin grfica
de la funcin de cuanta de la
geomtrica puede apreciarse este
tipo de aleatorizacin , sin
embargo nosotros preferimos ,
por razones prcticas, utilizar la aleatorizacin antes comentada





Funcin de distribucin
En base a la funcin de cuanta se puede expresar la funcin de distribucin
de la siguiente manera.
desarrollando la expresin
tendramos
de
donde
La Funcin Generatriz de Momentos (F.G.M.) quedara:



por lo que queda establecida que la F.G.M. tiene la
expresin
En base a la FGM podemos obtener la media y varianza:
As
Haciendo t =0 tendramos que
La varianza sera

Haciendo t =0 tendramos que
De esta
manera
Luego
La moda es el valor de la variable que tiene asociada mayor probabilidad el
valor de su funcin de cuanta es el mayor. Es fcil comprobar (vase
simplemente la representacin grfica anterior) que .Por lo
tanto la media de la distribucin geomtrica es siempre 1.
En cuanto a la mediana M
e
ser aquel valor de la variable en el cual la funcin
de distribucin toma el valor 0,5. As

por lo que

También podría gustarte