Documentos de Académico
Documentos de Profesional
Documentos de Cultura
06.3 - Aproximacion de Binomial y Poisson Por Normal PDF
06.3 - Aproximacion de Binomial y Poisson Por Normal PDF
En el gráfico vemos una variable binomial(n = 100 ; p = 0,5) junto con una variable normal( µ = 50 ; σ = 5).
Esta propiedad nos permite utilizar una variable normal estándar, que se encuentra
tabulada, para ahorrarnos la engorrosa tarea de sumar una cantidad elevada de
términos de probabilidades binomiales, especialmente cuando n es muy grande y la
cantidad de éxitos está lejos de 0 y lejos de n, con lo cual la sumatoria tiene muchos
términos aunque se intente restar del 1 en vez de sumar.
Queda por hacer una observación antes de poder utilizar esta propiedad. Al estar
aproximando una distribución discreta por una continua, lo que se hace es tomar
intervalos de la continua, que representan los valores puntuales de la discreta. Por
ejemplo, consideraremos que la discreta vale 43, si la continua tiene cualquier valor
entre 42,5 y 43,5. Entonces la probabilidad de que la discreta esté entre 8 y 12 no es
la probabilidad de que la continua esté entre 8 y 12 sino de que esté entre 7,5 y
12,5. Considerar esto se conoce como "corrección por continuidad".
Ejemplo:
Se tiene una variable aleatoria X:Bi(n = 50 ; p = 0,4). ¿Cuál es la probabilidad de
que X sea menor a 20?
n
P ( X < 20) = ∑ P ( X = x) = ∑ p x (1 − p ) n − x
19 19
x =0 x =0 x
Podríamos hacer . Esto
demandaría sumar 20 términos, y arroja el resultado 0,44648
Sin embargo, y a menos que se necesite el resultado exacto, podemos usar la
aproximación normal para resolver el problema. Estamos buscando P(X < 20), lo
cual es igual a:
P(0 ≤ X ≤ 19)
Hacemos la corrección por continuidad:
P(0 ≤ X ≤ 19) ≅ P(-0,5 ≤ X ≤ 19,5)
Tomamos el cambio de variables:
X − np
Y=
n p (1 − p )
con lo cual Y tendrá una distribución aproximadamente normal estándar.
Dejamos X en función de Y:
X = n p (1 − p) Y + np
Luego reemplazamos X por su definición en términos de Y en la probabilidad que
estábamos buscando:
− 0,5 − np 19,5 − np
P ( −0,5 ≤ X ≤ 19,5) = P ≤Y ≤ = P (− 5,92 ≤ Y ≤ −0,14 )
n p (1 − p ) n p (1 − p )
Lo cual, por propiedades de la función de distribución acumulada queda:
P(-5,92 ≤ Y ≤ -0,14) = F Y(-0,14) - F Y(-5,92)
Como estamos considerando a Y una normal estándar, entonces:
F Y(-0,14) - F Y(-5,92) = Φ (-0,14) - Φ (-5,92) = (1 - Φ (0,14)) - (1 - Φ (5,92))
= Φ (5,92) - Φ (0,14) = 1 - 0,55567 = 0,44433
Observemos que el resultado aproximado 0,44433 es prácticamente igual al
resultado exacto 0,44648.
Demostración
Se provee esta demostración porque constituye un buen ejemplo de aplicación del
teorema central del límite.
Si X es la cantidad de éxitos en una muestra en n experimentos de Bernoulli,
entonces X es una variable aleatoria cuya distribución se conoce como binomial.
Toda variable binomial es en esencia la suma de n variables de Bernoulli (unos y
ceros). Como vimos para la distribución binomial:
E(X) = n.p
σx2 = n.p.(1-p)
También vimos que, por el teorema central del límite, para n lo suficientemente
grande, la suma de n variables tiene aproximadamente una distribución normal, con
determinadas media y varianza. Particularmente cuando X es binomial, si
np ≥ 5 y n (1 − p ) ≥ 5
(lo cual también garantiza que p esté lo suficientemente
alejada de 0 y 1 para que no se "aplaste") entonces su ditribución se puede
n.p.(1 − p)
X : N (n.p ; n.p.(1 − p) )
aproximar por una normal, con media n.p y desvío . Queda:
(aproximadamente).
X − np
Y=
n p (1− p)
Luego, tomando el cambio de variables , Y tiene una distribución
aproximadamente normal estándar.
Esta propiedad nos permite utilizar una variable normal estándar, que se encuentra
tabulada, para ahorrarnos la engorrosa tarea de sumar una cantidad elevada de
términos de probabilidades de Poisson al calcular probabilidades acumuladas,
especialmente cuando necesitamos calcular la probabilidad acumulada para un valor
que esté lejos del cero.
Queda por hacer una observación antes de poder utilizar esta propiedad. Al estar
aproximando una distribución discreta por una continua, lo que se hace es tomar
intervalos de la continua, que representan los valores puntuales de la discreta. Por
ejemplo, consideraremos que la discreta vale 43, si la continua tiene cualquier valor
entre 42,5 y 43,5. Entonces la probabilidad de que la discreta esté entre 8 y 12 no es
la probabilidad de que la continua esté entre 8 y 12 sino de que esté entre 7,5 y
12,5. Considerar esto se conoce como "corrección por continuidad".
Ejemplo:
Se tiene una variable aleatoria X:Pois( µ = 60). ¿Cuál es la probabilidad de que X sea
menor a 70?
e−µ µ x
P( X < 70) = ∑ P( X = x) = ∑
69 69
x =0 x =0 x!
Podríamos hacer . Esto demandaría
sumar 70 términos, y arroja el resultado 0,88821.
Sin embargo, y a menos que se necesite el resultado exacto, podemos usar la
aproximación normal para resolver el problema. Estamos buscando P(X < 70), lo
cual es igual a:
P(0 ≤ X ≤ 69)
Hacemos la corrección por continuidad:
P(0 ≤ X ≤ 69) ≅ P(-0,5 ≤ X ≤ 69,5)
Tomamos el cambio de variables:
X − µ
Y =
µ
con lo cual Y tendrá una distribución aproximadamente normal estándar.
Dejamos X en función de Y:
X = µ Y +µ
Luego reemplazamos X por su definición en términos de Y en la probabilidad que
estábamos buscando:
− 0,5 − µ 69,5 − µ
P ( −0,5 ≤ X ≤ 69,5) = P ≤Y ≤ = (− ≤ ≤ )
µ µ P 7,81 Y 1,23
Lo cual, por propiedades de la función de distribución acumulada queda:
P(-7.81 ≤ Y ≤ 1,23) = F Y(1,23) - F Y(-7,81)
Como estamos considerando a Y una normal estándar, entonces:
F Y(1,23) - F Y(-7,81) = Φ (1,23) - Φ (-7,81) = Φ (1,23) - (1 - Φ (7,81))
= Φ (1,23) + Φ (7,81) - 1 = 0,89065 + 1 - 1 = 0,89065
Observemos que el resultado aproximado 0,89065 es prácticamente igual al
resultado exacto 0,88821.
Problemas típicos
Deben considerarse modelos de problemas típicos los dos ejemplos dados en esta
sección.