Está en la página 1de 9

DISTRIBUCIONES DISCRETAS DE PROBABILIDAD

Frecuentemente las observaciones que se generan en experimentos estadsticos tienen


algunos tipos generales de comportamiento, por eso sus variables se pueden describir
esencialmente con unas pocas distribuciones, las cuales pueden representarse mediante
una ecuacin.

Frente a la complejidad de los fenmenos bajo estudio, el experimentador aproxima y
hace algunos postulados tentativos acerca del mecanismo aleatorio y deriva un modelo
por el empleo de esos postulados en combinacin con las leyes de probabilidad.

Un modelo de probabilidad para la variable aleatoria X es una forma especfica de
distribucin de probabilidades que es asumida para reflejar el comportamiento de X.
Las probabilidades son registradas en trminos de parmetros desconocidos que
relacionan las caractersticas de la poblacin y el mtodo de muestreo.

Dichas distribuciones son idealizaciones del mundo real, por lo tanto sus resultados no
siempre coinciden con la realidad.

Una variable aleatoria es una funcin que asigna un nmero real a cada resultado del
espacio muestral de un experimento aleatorio.

Dicho de otra forma, una variable aleatoria es una funcin valorada numricamente,
cuyo valor est regido por factores en los que interviene el azar.

Las variables aleatorias pueden ser discretas o continuas, segn su rango de valores.

Una variable aleatoria es discreta si el nmero de valores que puede tomar es contable;
generalmente puede asumir nicamente valores enteros. Cada uno de sus valores tiene
cierta probabilidad.

La descripcin del conjunto de posibles valores de X y la probabilidad asociada a cada
uno se denomina distribucin de probabilidad. Si la variable puede tomar un nmero
pequeo de valores, la forma ms simple consiste en construir una tabla que contenga
los posibles valores y sus respectivas probabilidades; si no son pocos, lo ms adecuado
es expresar dicha probabilidad como una ecuacin.

EJEMPLO


Se lanza una moneda 3 veces. Construir la distribucin de probabilidad de X, si ste es
el nmero de caras.

Solucin:

x 0 1 2 3
f(x) 1/8 3/8 3/8 1/8



Siempre que se evalen variables aleatorias, se cumple que:

1. f(x) 0
2. f x ( ) =

1
3. p(X=x) = f(x)


MODELOS DE DISTRIBUCIONES DISCRETAS

1. Distribucin Uniforme Discreta: Es la ms simple. Se aplica a un experimento que
puede ocurrir de n formas mutuamente excluyentes y cada una de esas formas tiene la
misma probabilidad de las otras; por tanto, cada probabilidad es 1/n.





EJEMPLO
Se disea un generador de nmeros pseudoaleatorios. Cuntos cincos se esperara
obtener si se generan 10000 nmeros?
Solucin:

P(X = 5) = 1/10

Por lo tanto, el nmero esperado de cincos es 10000*1/10 = 1000



2. Ensayos Bernoulli: Consideraremos repeticiones sucesivas de un experimento u
observacin en la cual cada repeticin es llamada un ensayo. Adems, asumimos que
hay slo 2 entradas posibles para cada ensayo individual (xito-fracaso); el uso de esos
trminos es por conveniencia, pero no tienen la misma connotacin de la vida real
(xito es lo que interesa, no necesariamente lo que convenga); por ejemplo, en un
accidente el nmero de muertos puede ser considerado un xito.

La naturaleza de los resultados de un experimento proporciona un punto de partida
conveniente para desarrollar modelos de probabilidad de variables aleatorias que son
definidas en trminos de repeticiones de ensayos; dichos ensayos son realizados bajo
una serie de condiciones que llamaremos postulados (son aproximados y proporcionan
modelos simples y tiles). Los ensayos que obedecen esos postulados son llamados
ensayos de Bernoulli.


Ejemplo clsico: Lanzamiento de una moneda.

Este modelo se aplica a poblaciones finitas de las que tomamos elementos al azar con
reemplazo o a poblaciones conceptualmente infinitas (como las piezas que producir
una mquina), siempre que el proceso generador sea estable.

Llamemos

=
fracaso un constituye elemento el si
xito un constituye elemento l e i s
x
0
1


Poblacin

A: Caracterstica de inters. B: Caracterstica de no inters.

Si se extrae un elemento al azar y ese elemento posee la caracterstica de inters se
dice que se obtuvo un xito; en caso contrario, se dice que se obtuvo un fracaso.

q
N N
N
B P p
N N
N
A P =
+
= =
+
=
2 1
2
2 1
1
) ( ) (

Siempre p + q = 1

Sea x el nmero de elementos que poseen la caracterstica de inters; x = 0,1

x 0 1
f(x) q p


Entonces: 1 , 0 ; ) (
1
= =

x q p x P
x x

= + = = = p p q x f x x E * 1 * 0 ) ( * ) (

= + = = p p q x f x x E * 1 * 0 ) ( * ) (
2 2 2 2





3. Distribucin binomial:
Cuando un nmero fijo n de ensayos repetidos de Bernoulli es realizado con
probabilidad de xito p en cada ensayo, es decir, la probabilidad de un xito permanece
constante.

Adems, debe cumplirse que los ensayos sean independientes.

Por ejemplo, supngase que se resuelve al azar un examen de escogencia mltiple y se
quiere encontrar la probabilidad de ganarlo.

La funcin de probabilidad binomial puede escribirse como:

x n x
q p
x
n
x f

|
|
.
|

\
|
= ) ( ,

A continuacin se muestra la representacin grfica de una distribucin binomial con
valores de n y p determinados:



| | pq p p p p x E x E = = = = ) 1 ( ) ( ) (
2 2 2 2
o


EJEMPLO
Se sabe que los discos producidos en una empresa salen defectuosos con probabilidad,
independientemente unos de otros, de 0.01. La compaa vende los discos en paquetes
de 10 y garantiza el reembolso del dinero si ms de uno de 10 discos sale defectuoso.
Cul es la proporcin de paquetes que se devuelven?
Si alguien compra 3 paquetes, cul es la probabilidad de que devuelva por lo menos
uno de ellos?


Solucin:

P(X>1) = 1 P(X=0) - P(X=1)

0043 . 0 99 . 0 * 01 . 0
1
10
99 . 0 * 01 . 0
0
10
1
9 10 0
=
|
|
.
|

\
|

|
|
.
|

\
|
=

Lo cual implica que el 0.4% de los paquetes podrn ser devueltos.

De lo anterior se deduce que el nmero de paquetes que puede devolver la persona
constituye una variable aleatoria binomial con n = 3 y p = 0.0043.

Por lo tanto, la probabilidad de que devuelva por lo menos uno de los paquetes es:

P(X>1) = 1 P(X=0)
= 1 0.996
3
= 0.012



Media y varianza de la distribucin binomial: Media = np Varianza = npq

Para justificar estas frmulas, consideremos el caso en que n=1. Recordemos que en un
ensayo de Bernoulli, la media es p y la varianza es pq:


Para el caso de n ensayos de Bernoulli:
E(X) = E(X
1
)+.........+E(X
n
) = p+p+......+p = np

Lo mismo se aplicara para varianza

Otra forma: Partir de E(X) = xf(x) y utilizar la funcin de probabilidad binomial.

En todos los libros de Estadstica se encuentran tablas de la distribucin binomial para
valores seleccionados de p. Para ilustrar su uso, veamos el siguiente ejemplo:




EJEMPLO
Un examen de seleccin mltiple contiene 20 preguntas, cada una con cuatro posibles
respuestas, de las cuales slo una es correcta. Suponga que un estudiante slo adivina
las respuestas.
a) Cul es la probabilidad de que el estudiante conteste correctamente ms de la
mitad de las preguntas?
b) Cul es la probabilidad de que el estudiante conteste correctamente menos de 5
preguntas?
c) Cul es la probabilidad de que el estudiante gane el examen?
d) Cul es el nmero esperado de respuestas correctas?
e) Responder las preguntas a) y c) si cada pregunta tiene 5 opciones.


Solucin:

p = n = 20

a) P(X>10) = 1 P(Xs10) = 1 0.9961 = 0.0039

b) P(X<5) = P(Xs4) = 0.4148

c) P(X>12) = 1 P(Xs11) = 1 0.9991 = 0.0009

d) = np = 20 * = 5 respuestas correctas

e) La probabilidad de xito sera ya de 1/5, por tanto:

P(X>10) = 1 P(Xs10) = 1 0.9994 = 0.0006

P(X>12) = 1 P(Xs11) = 1 0.9999 = 0.0001



4. Distribucin hipergeomtrica
Como el muestreo sin reemplazo viola las condiciones de Bernoulli si la muestra no es
grande, algunas veces es necesario plantear un tipo diferente de distribucin. (Es
evidente que la mayora de muestreos se realiza sin reemplazo, esto implica que si la
poblacin es pequea las probabilidades cambiarn en cada observacin).

Cuando se selecciona sin reemplazo una muestra aleatoria de tamao n de una
poblacin de tamao N y el inters recae en la probabilidad de seleccionar x xitos de
los k artculos considerados como xitos en la poblacin, se realiza un experimento
hipergeomtrico y su funcin de probabilidad viene determinada por:


|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
=
n
N
x n
k N
x
k
x f ) (

La distribucin hipergeomtrica requiere el conocimiento de k y N.

La media y la varianza de la distribucin hipergeomtrica son:

|
.
|

\
|

= =
N
k
N
k
n
N
n N
y
N
nk
1 * *
1
2
o



EJEMPLO
Los componentes de un sistema de seis elementos se toman aleatoriamente de un
recipiente con 20 componentes usados. El sistema funcionar si por lo menos 4 de los 6
componentes estn en condiciones de funcionar; si 15 de los 20 componentes en el
recipiente estn en condiciones de funcionar, cul es la probabilidad de que el sistema
funcione?


Solucin:

P(X>4) =
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
+
|
|
.
|

\
|
|
|
.
|

\
|
+
|
|
.
|

\
|
|
|
.
|

\
|
6
20
0
5
6
15
1
5
5
15
2
5
4
15
= 0.8687




5. Distribucin de Poisson

Este es el modelo de probabilidad ms adecuado para eventos que ocurren
aleatoriamente a travs del tiempo o el espacio.

Poisson supone:
a) Independencia: El nmero de ocurrencias en un intervalo determinado es
independiente del nmero de ocurrencias en cualquier otro intervalo.
b) La posibilidad de dos ocurrencias simultneas puede ser asumida como cero.
c) El nmero promedio de ocurrencias por unidad de tiempo o espacio se considera una
constante.

d) La probabilidad de que suceda determinado nmero de eventos en un proceso de
Poisson depende nicamente de la longitud del intervalo observado y no de su
ubicacin.

La distribucin de probabilidad de la variable aleatoria de Poisson X, que representa el
nmero de resultados que ocurren en un intervalo de tiempo, rea, espacio o volumen
especfico se denota as:

!
) (
) (
x
t e
x f
x t


= ,

donde es el nmero promedio de resultados por unidad de tiempo o regin y t es la
longitud del intervalo.
A continuacin se observa la representacin grfica de una distribucin de Poisson con
una media baja:








EJEMPLO
La contaminacin es un problema en la fabricacin de discos de almacenamiento
ptico. El nmero de partculas contaminantes que aparecen en la superficie de un
disco ptico tiene una distribucin Poisson; el nmero promedio de partculas por
centmetro cuadrado de superficie del medio de almacenamiento es 0.1. El rea de un
disco bajo estudio es de 100 centmetros cuadrados. Encuentre la probabilidad de
encontrar por lo menos una partcula contaminante en el disco.


Solucin:

P(X>1) = 1 P(X=0)

= 1 -
! 0
) 10 (
0 100 * 1 . 0
e


La media y la varianza de la distribucin de Poisson tienen el valor t.

En una distribucin binomial con n grande y p pequea se puede aproximar a Poisson.