Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PROBABILIDAD Y ESTADISTICA
MT32M
PRESENTA:
OLIVAS HIDALGO
JASSIEL EDUARDO
Distribución Hipergeométrica
La función de densidad de probabilidad más sencilla es la hipergeométrica. Es la más básica
porque se crea combinando nuestro conocimiento de las probabilidades a partir de los diagramas
de Venn, las reglas de adición y multiplicación y la fórmula de recuento combinatorio.
Para hallar el número de formas de obtener 2 ases de los cuatro que hay en la baraja, calculamos:
Y si no nos importara qué más tenemos en la mano para las otras tres cartas calcularíamos:
Uniendo todo esto, podemos calcular la probabilidad de obtener exactamente dos ases en una
mano de póquer de 5 cartas como:
donde x = el número que nos interesa procedente del grupo con A objetos.
h(x) es la probabilidad de x aciertos, en n intentos, cuando los aciertos A (ases en este caso) están
en una población que contiene N elementos. La distribución hipergeométrica es un ejemplo de
distribución de probabilidad discreta porque no hay posibilidad de éxito parcial, es decir, no
puede haber manos de póquer con 2 1/2 ases. Dicho de otro modo, una variable aleatoria
discreta tiene que ser un número entero, o que se pueda contar, solamente. Esta distribución de
probabilidad funciona en los casos en que la probabilidad de éxito cambia con cada extracción
de cartas. Otra forma de decir esto es que los eventos NO son independientes. Al utilizar una
baraja de cartas, estamos haciendo un muestreo SIN reemplazo. Si volvemos a poner cada carta
después de haberla sacado, la distribución hipergeométrica sería una pdf inadecuada.
Para que el hipergeométrico funcione:
1. La población debe ser divisible en dos y solo dos subconjuntos independientes (ases y no
ases en nuestro ejemplo). La variable aleatoria X = el número de elementos del grupo de
interés.
2. El experimento debe tener probabilidades cambiantes de éxito con cada experimento (el
hecho de que las cartas no sean reemplazadas después de la extracción en nuestro
ejemplo hace que esto sea cierto en este caso). Otra forma de decir esto es que se
muestrea sin reemplazo y, por lo tanto, cada selección no es independiente.
3. La variable aleatoria debe ser discreta, en lugar de continua.
Distribución de Poisson
Otra distribución de probabilidad útil es la distribución de Poisson o distribución del tiempo de
espera. Esta distribución se utiliza para determinar cuántos empleados de caja son necesarios
para mantener el tiempo de espera en la fila a niveles especificados, cuántas líneas telefónicas
son necesarias para evitar que el sistema se sobrecargue, y muchas otras aplicaciones prácticas.
Una modificación de la distribución de Poisson, la Pascal, inventada hace casi cuatro siglos, es
utilizada hoy en día por las compañías de telecomunicaciones de todo el mundo para los factores
de carga, los niveles de conexión de los satélites y los problemas de capacidad de internet. La
distribución recibe su nombre de Simeón Poisson, que la presentó en 1837 como una extensión
de la distribución binomial, que veremos que se puede estimar con la Poisson.
Hay dos características principales de un experimento de Poisson:
1. La distribución de probabilidad de Poisson da la probabilidad de que se produzca un
número de eventos en un intervalo fijo de tiempo o espacio si estos eventos se producen
con una tasa promedio conocida.
2. Los eventos son independientes del tiempo transcurrido desde el último evento. Por
ejemplo, un editor de libros podría estar interesado en el número de palabras escritas
incorrectamente en un libro en particular. Puede ser que, en promedio, haya cinco
palabras mal escritas en 100 páginas. El intervalo son las 100 páginas y se supone que no
hay relación entre el momento en que se producen los errores ortográficos.
3. La variable aleatoria X = el número de ocurrencias en el intervalo de interés.
Notación para el Poisson: P = Función de distribución de probabilidad de Poisson
X ~ P(μ)
Se lee como “X es una variable aleatoria con una distribución de Poisson”. El parámetro es μ (o
λ); μ (o λ) = la media del intervalo de interés. La media es el número de ocurrencias que se
producen por término promedio durante el periodo del intervalo.
La fórmula para calcular las probabilidades que provienen de un proceso de Poisson es:
donde P(X) es la probabilidad de X aciertos, μ es el número esperado de aciertos basado en datos
históricos, e es el logaritmo natural aproximadamente igual a 2,718, y X es el número de aciertos
por unidad, normalmente por unidad de tiempo.
Para utilizar la distribución de Poisson, deben cumplirse ciertos supuestos. Estos son: la
probabilidad de un éxito, μ, no cambia dentro del intervalo, no puede haber éxitos simultáneos
dentro del intervalo y, por último, que la probabilidad de un éxito entre intervalos es
independiente, el mismo supuesto de la distribución binomial.
En cierto modo, la distribución de Poisson puede considerarse una forma inteligente de convertir
una variable aleatoria continua, normalmente el tiempo, en una variable aleatoria discreta al
dividir el tiempo en intervalos independientes discretos. Esta forma de pensar en la Poisson nos
ayuda a entender por qué se puede utilizar para estimar la probabilidad de la variable aleatoria
discreta de la distribución binomial. La Poisson pide la probabilidad de un número de aciertos
durante un periodo mientras que la binomial pide la probabilidad de un número determinado de
aciertos para un número dado de ensayos.
Estimación de la distribución binomial con la distribución de Poisson
Anteriormente comprobamos que la distribución binomial proporcionaba una aproximación a la
distribución hipergeométrica. Ahora hallamos que la distribución de Poisson puede proporcionar
una aproximación para la binomial. Decimos que la distribución binomial se acerca a la Poisson.
La distribución binomial se aproxima a la distribución de Poisson es a medida que n se hace más
grande y p es pequeño, de manera que np se convierte en un valor constante. Hay varias reglas
generales sobre cuándo se puede decir que se va a utilizar una Poisson para estimar una binomial.
Una de ellas sugiere que np, la media de la binomial, debe ser inferior a 25. Otro autor sugiere
que debería ser inferior a 7. Y otro, observando que la media y la varianza de la Poisson son ambas
iguales, sugiere que np y npq, la media y la varianza de la binomial, deben ser mayores que 5. No
existe una regla general aceptada sobre cuándo se puede utilizar la Poisson para estimar la
binomial.
A medida que avanzamos por estas distribuciones de probabilidad, llegamos a distribuciones más
sofisticadas que, en cierto sentido, contienen las distribuciones menos sofisticadas dentro de
ellas. Esta proposición ha sido demostrada por los matemáticos. Esto nos lleva al nivel más alto
de sofisticación en la siguiente distribución de probabilidad que puede ser usada como una
aproximación a todas las que hemos discutido hasta ahora. Esta es la distribución normal.