Hasta ahora hemos analizado distribuciones que modelizaban situaciones en las que se realizaban pruebas que entraaban una dicotoma (proceso de Bernouilli) de manera que en cada experiencia la probabilidad de obtener cada uno de los dos posibles resultados se mantena constante. Si el proceso consista en una serie de extracciones o selecciones ello implicaba la reposicin de cada extraccin o seleccin , o bien la consideracin de una poblacin muy grande. Sin embargo si la poblacin es pequea y las extracciones no se remplazan las probabilidades no se mantendrn constantes . En ese caso las distribuciones anteriores no nos servirn para la modelizar la situacin. La distribucin hipergeomtrica viene a cubrir esta necesidad de modelizar procesos de Bernouilli con probabilidades no constantes (sin reemplazamiento) . La distribucin hipergeomtrica es especialmente til en todos aquellos casos en los que se extraigan muestras o se realizan experiencias repetidas sin devolucin del elemento extrado o sin retornar a la situacin experimental inicial. Modeliza , de hecho, situaciones en las que se repite un nmero determinado de veces una prueba dicotmica de manera que con cada sucesivo resultado se ve alterada la probabilidad de obtener en la siguiente prueba uno u otro resultado. Es una distribucin .fundamental en el estudio de muestras pequeas de poblaciones .pequeas y en el clculo de probabilidades de, juegos de azar y tiene grandes aplicaciones en el control de calidad en otros procesos experimentales en los que no es posible retornar a la situacin de partida. La distribucin hipergeomtrica puede derivarse de un proceso experimental puro o de Bernouilli con las siguientes caractersticas: El proceso consta de n pruebas , separadas o separables de entre un conjunto de N pruebas posibles. Cada una de las pruebas puede dar nicamente dos resultados mutuamente excluyentes: A y no A. En la primera prueba las probabilidades son :P(A)= p y P(A)= q ;con p+q=l. Las probabilidades de obtener un resultado A y de obtener un resultado no A varan en las sucesivas pruebas, dependiendo de los resultados anteriores. (Derivacin de la distribucin) . Si estas circunstancias a leatorizamos de forma que la variable aleatoria X sea el nmero de resultados A obtenidos en n pruebas la distribucin de X ser una Hipergeomtrica de parmetros N,n,p as Un tpico caso de aplicacin de este modelo es el siguiente : Supongamos la extraccin aleatoria de n elementos de un conjunto formado por N elementos totales, de los cuales Np son del tipo A y Nq son del tipo (p+q=l) .Si realizamos las extracciones sin devolver los elementos extrados , y llamamos X. al nmero de elementos del tipo A que extraemos en n extracciones X seguir una distribucin hipergeomtrica de parmetros N , n , p Funcin de cuanta. La funcin de cuanta de una distribucin Hipergeomtrica har corresponder a cada valor de la variable X (x = 0,1,2, . . . n) la probabilidad del suceso "obtener x resultados del tipo A ", y (n-x) resultados del tipo no A en las n pruebas realizadas de entre las N posibles. Veamos : Hay un total de formas distintas de obtener x resultados del tipo A y n-x del tipo , si partimos de una poblacin formada por Np elementos del tipo A y Nq elementos del tipo
Por otro lado si realizamos n pruebas o extracciones hay un total de posibles muestras ( grupos de n elementos) aplicando la regla de Laplace tendramos
que para valores de X comprendidos entre el conjunto de enteros 0,1,. .n ser la expresin de la funcin de cuanta de una distribucin , Hipergeomtrica de parmetros N,n,p . Media y varianza. Considerando que una variable hipergeomtrica de parmetros N, n, p puede considerarse generada por la reiteracin de un proceso dicotmico n veces en el que las n dicotomas NO son independientes ; podemos considerar que una variable hipergeomtrica es la suma de n variables dicotmicas NO independientes. Es bien sabido que la media de la suma de variables aleatorias (sean stas independientes o no) es la suma de las medias y por tanto la media de una distribucin hipergeomtrica ser , como en el caso de la binomial : En cambio si las variables sumando no son independientes la varianza de la variable suma no ser la suma de las varianzas. Si se evala el valor de la varianza para nuestro caso se obtiene que la varianza de una distribucin hipergeomtrica de parmetros N,n,p es : si
para demostracin de esta expresin vase Wilks S. ,Mathematical Statistics,1962 Esta forma resulta ser la expresin de la varianza de una binomial (n, p) afectada por un coeficiente corrector [N-n/N-1] , llamado coeficiente de exhaustividad o Factor Corrector de Poblaciones Finitas (F.C.P.F.) y que da cuenta del efecto que produce la no reposicin de los elementos extrados en el muestreo. Este coeficiente es tanto ms pequeo cuanto mayor es el tamao muestral (nmero de pruebas de n ) y puede comprobarse como tiende a aproximarse a 1 cuando el tamao de la poblacin N es muy grande . Este ltimo hecho nos confirma lo ya comentado sobre la irrelevancia de la reposicin o no cuando se realizan extracciones sucesivas sobre una poblacin muy grande. Con una poblacin muy grande se cual fuere el tamao de n , el factor corrector sera uno lo que convertira , en cierto modo a la hipergeomtrica en una binomial (ver D. Binomial) . As Lmite de la distribucin hipergeomtrica cuando N tiende a infinito. Hemos visto como la media de la distribucin hipergeomtrica [H{N,n,p)], tomaba siempre el mismo valor que la media de una distribucin binomial [B{n,p)] tambin hemos comentado que si el valor del parmetro N creca hasta aproximarse a infinito el coeficiente de exhaustividad tenda a ser 1, y, por lo tanto, la varianza de la hipergeomtrica se aproximaba a la de la binomial : puede probarse asimismo , cmo la funcin de cuanta de una distribucin hipergeomtrica tiende a aproximarse a la funcin de cuanta de una distribucin binomial cuando
Puede comprobarse en la representacin grfica de una hipergeomtrica con N =100000 como sta ,es idntica a la de una binomial con los mismos parmetros restantes n y p , que utilizamos al hablar de la binomial
Moda de la distribucin hipergeomtrica De manera anloga a como se obtena la moda en la distribucin binomial es fcil obtener la expresin de sta para la distribucin hipergeomtrica. De manera que su expresin X 0 sera la del valor o valores enteros que verificasen.
3) DISTRIBUCIN HIPERGEOMTRICA.
Los experimentos que tienen este tipo de distribucin tienen las siguientes caractersticas: a) Al realizar un experimento con este tipo de distribucin, se esperan dos tipos de resultados. b) Las probabilidades asociadas a cada uno de los resultados no son constantes. c) Cada ensayo o repeticin del experimento no es independiente de los dems. d) El nmero de repeticiones del experimento (n) es constante.
Ejemplo: En una urna o recipiente hay un total de N objetos, entre los cuales hay una cantidad a de objetos que son defectuosos, si se seleccionan de esta urna n objetos al azar, y sin reemplazo, cul es la probabilidad de obtener x objetos defectuosos? Solucin:
Luego;
donde: p(x,n) = probabilidad de obtener x objetos defectuosos de entre n seleccionados
muestras de n objetos en donde hay x que son defectuosos y n-x buenos
todas las muestras posibles de seleccionar de n objetos tomadas de entre N objetos en total = espacio muestral
Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son defectuosos, si de seleccionan 4 objetos al azar, cul es la probabilidad de que 2 sean defectuosos?
Solucin:
N = 10 objetos en total a = 3 objetos defectuosos n = 4 objetos seleccionados en muestra x = 2 objetos defectuosos deseados en la muestra
donde:
probabilidad asociada a cada muestra de 4 objetos que se seleccionaron, con lo que se demuestra que las probabilidades no son constantes
formas o maneras de obtener 2 objetos defectuosos entre los 4 seleccionados = muestras de 4 objetos entre los que 2 son defectuosos
Como se observa en el desarrollo de la solucin del problema, la pretensin es demostrar que las probabilidades asociadas a cada uno de los resultados no son constantes.
Luego la probabilidad de obtener 2 objetos defectuosos entre los 4 seleccionados al azar sera:
Ejemplos: 1. Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de narctico en una botella que contiene 9 pldoras de vitamina que son similares en apariencia. Si el oficial de la aduana selecciona 3 tabletas aleatoriamente para analizarlas, a) Cul es la probabilidad de que el viajero sea arrestado por posesin de narcticos?, b) Cul es la probabilidad de que no sea arrestado por posesin de narcticos?.
Solucin: a) N = 9+6 =15 total de tabletas a = 6 tabletas de narctico n = 3 tabletas seleccionadas x = 0, 1, 2, o 3 tabletas de narctico = variable que nos indica el nmero de tabletas de narctico que se puede encontrar al seleccionar las 3 tabletas
p(viajero sea arrestado por posesin de narcticos) = p(de que entre las 3 tabletas seleccionadas haya 1 o ms tabletas de narctico)
otra forma de resolver;
p(el viajero sea arrestado por posesin de narcticos) = 1 p(de que entre las tabletas seleccionadas no haya una sola de narctico)
b) p(no sea arrestado por posesin de narcticos)
2. De un lote de 10 proyectiles, 4 se seleccionan al azar y se disparan. Si el lote contiene 3 proyectiles defectuosos que no explotarn, cul es la probabilidad de que , a) los 4 exploten?, b) al menos 2 no exploten?
Solucin: a) N = 10 proyectiles en total a = 7 proyectiles que explotan n = 4 proyectiles seleccionados x = 0, 1, 2, 3 o 4 proyectiles que explotan = variable que nos define el nmero de proyectiles que explotan entre la muestra que se dispara
b) N = 10 proyectiles en total a = 3 proyectiles que no explotan n = 4 proyectiles seleccionados x = 0, 1, 2 o 3 proyectiles que no explotan
p(al menos 2 no exploten) = p( 2 o ms proyectiles no exploten) = p(x = 2 o 3; n=4) =
3. a)Cul es la probabilidad de que una mesera se rehse a servir bebidas alcohlicas nicamente a dos menores de edad si verifica aleatoriamente solo 5 identificaciones de entre 9 estudiantes, de los cuales 4 no tienen la edad suficiente?, b) Cal es la probabilidad de que como mximo 2 de las identificaciones pertenezcan a menores de edad? Solucin:
a) N = 9 total de estudiantes a = 4 estudiantes menores de edad n = 5 identificaciones seleccionadas x = variable que nos define el nmero de identificaciones que pertenecen a personas menores de edad x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad
b) N = 9 total de estudiantes a = 4 estudiantes menores de edad n = 5 identificaciones seleccionadas x = variable que nos define el nmero de identificaciones que pertenecen a personas menores de edad x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad
4. Una compaa manufacturera utiliza un esquema para la aceptacin de los artculos producidos antes de ser embarcados. El plan es de dos etapas. Se preparan cajas de 25 para embarque y se selecciona una muestra de 3 para verificar si tienen algn artculo defectuoso. Si se encuentra uno, la caja entera se regresa para verificarla al 100%. Si no se encuentra ningn artculo defectuoso, la caja se embarca. a)Cul es la probabilidad de que se embarque una caja que tiene tres artculos defectuosos?, b)Cul es la probabilidad de que una caja que contiene solo un artculo defectuoso se regresa para verificacin?
7. DISTRIBUCIN GEOMTRICA.
Esta distribucin es un caso especial de la Binomial, ya que se desea que ocurra un xito por primera y nica vez en el ltimo ensayo que se realiza del experimento, para obtener la frmula de esta distribucin, haremos uso de un ejemplo.
Ejemplo: Se lanza al aire una moneda cargada 8 veces, de tal manera que la probabilidad de que aparezca guila es de 2/3, mientras que la probabilidad de que aparezca sello es de 1/3, Determine la probabilidad de que en el ltimo lanzamiento aparezca una guila.
Solucin: Si nosotros trazamos un diagrama de rbol que nos represente los 8 lanzamientos de la moneda, observaremos que la nica rama de ese rbol que nos interesa es aquella en donde aparecen 7 sellos seguidos y por ltimo una guila; como se muestra a continuacin:
S S S S S S S A
S denotamos; x = el nmero de repeticiones del experimento necesarias para que ocurra un xito por primera y nica vez = 8 lanzamientos p = probabilidad de que aparezca una guila = p( xito) = 2/3 q = probabilidad de que aparezca un sello = p(fracaso) = 1/3
Entonces la probabilidad buscada sera;
P(aparezca una guila en el ltimo lanzamiento)=p(S)*p(S)*p(S)*p(S)*p(S)*p(S)*p(S)*p(A) =
=q*q*q*q*q*q*q*p = Luego, la frmula a utilizar cuando se desee calcular probabilidades con esta distribucin sera;
Donde: p(x) = probabilidad de que ocurra un xito en el ensayo x por primera y nica vez p = probabilidad de xito q = probabilidad de fracaso
Resolviendo el problema de ejemplo; x = 8 lanzamientos necesarios para que aparezca por primera vez una guila p = 2/3 probabilidad de que aparezca una guila q = 1/3 probabilidad de que aparezca un sello
p(x=8) = DISTRIBUCIN GEOMTRICA O DE PASCAL La distribucin geomtrica es un modelo adecuado para aquellos procesos en los que se repiten pruebas hasta la consecucin del xito a resultado deseado y tiene interesantes aplicaciones en los muestreos realizados de esta manera . Tambin implica la existencia de una dicotoma de posibles resultados y la independencia de las pruebas entre s. Proceso experimental del que se puede hacer derivar Esta distribucin se puede hacer derivar de un proceso experimental puro o de Bernouilli en el que tengamos las siguientes caractersticas El proceso consta de un nmero no definido de pruebas o experimentos separados o separables. El proceso concluir cuando se obtenga por primera vez el resultado deseado (xito). Cada prueba puede dar dos resultados mutuamente excluyentes : A y no A La probabilidad de obtener un resultado A en cada prueba es p y la de obtener un resultado no A es q siendo (p + q = 1). Las probabilidades p y q son constantes en todas las pruebas ,por tanto , las pruebas ,son independientes (si se trata de un proceso de "extraccin" ste se llevar a , cabo con devolucin del individuo extrado) . (Derivacin de la distribucin). Si en estas circunstancias aleatorizamos de forma que tomemos como variable aleatoria X = el nmero de pruebas necesarias para obtener por primera vez un xito o resultado A , esta variable se distribuir con una distribucin geomtrica de parmetro p.
Obtencin de la funcin de cuanta De lo dicho anteriormente , tendremos que la variable X es el nmero de pruebas necesarias para la consecucin del primer xito. De esta forma la variables aleatoria toma valores enteros a partir del uno ; 1,2, La funcin de cuanta P(x) har corresponder a cada valor de X la probabilidad de obtener el primer xito precisamente en la X-sima prueba. Esto es , P(X) ser la probabilidad del suceso obtener X-1 resultados "no A" y un xito o resultado A en la prueba nmero X teniendo en cuenta que todas las pruebas son independientes y que conocemos sus probabilidades tendremos:
dado que se trata de sucesos independientes y conocemos las probabilidades
luego la funcin de cuanta quedara
Algunos autores consideran la aleatorizacin como "nmero de pruebas anteriores al primer xito". De esta manera el conseguir el xito a la primera sera X=0 . En la siguiente representacin grfica de la funcin de cuanta de la geomtrica puede apreciarse este tipo de aleatorizacin , sin embargo nosotros preferimos , por razones prcticas, utilizar la aleatorizacin antes comentada
Funcin de distribucin En base a la funcin de cuanta se puede expresar la funcin de distribucin de la siguiente manera. desarrollando la expresin tendramos de donde La Funcin Generatriz de Momentos (F.G.M.) quedara:
por lo que queda establecida que la F.G.M. tiene la expresin En base a la FGM podemos obtener la media y varianza: As Haciendo t =0 tendramos que La varianza sera
Haciendo t =0 tendramos que De esta manera Luego La moda es el valor de la variable que tiene asociada mayor probabilidad el valor de su funcin de cuanta es el mayor. Es fcil comprobar (vase simplemente la representacin grfica anterior) que .Por lo tanto la media de la distribucin geomtrica es siempre 1. En cuanto a la mediana M e ser aquel valor de la variable en el cual la funcin de distribucin toma el valor 0,5. As