Está en la página 1de 5

El siguiente material se encuentra en etapa de corrección y no deberá

ser considerado una versión final.


Para hacer comentarios y sugerencias, o reportar errores, enviar mail
a Alejandro D. Zylberberg <alejandro@probabilidad.com.ar>
Versión Actualizada al: 1 de junio de 2004
Aproximación de Binomial y Poisson por
Normal
Para calcular probabilidades de distribuciones discretas con números grandes, es
preciso sumar muchos términos, lo cual puede resultar poco práctico. Sin embargo
las características de algunas distribuciones, como la binomial y la Poisson,
permiten muy buenas aproximaciones mediante la distribución normal. Y como la
distribución normal se puede obtener de una tabla, el problema de sumar una gran
cantidad de términos queda reducido a buscar uno o dos valores en una tabla.
A continuación se presentan los métodos y justificaciones de cómo efectuar tales
aproximaciones.

Aproximación de la distribución binomial por la distribución normal

Si X es una variable distribuida binomialmente, con n ≥ 10 y p cercano a 0,5


X − np
Y=
n p (1 − p )
entonces la variable aleatoria tiene una distribución
aproximadamente normal estándar.

Esto es válido porque si p es cercano a 0,5 y n es lo suficientemente grande


(generalmente se pide n ≥ 10) entonces la forma de la distribución binomial, a pesar
de ser discreta, se parece mucho a la de la una distribución normal. El cambio de
variable Y no es otra cosa que la estandarización de esa variable aproximadamente
normal (ya que n.p es la media de X y que el denominador es el desvío de X).

En el gráfico vemos una variable binomial(n = 100 ; p = 0,5) junto con una variable normal( µ = 50 ; σ = 5).
Esta propiedad nos permite utilizar una variable normal estándar, que se encuentra
tabulada, para ahorrarnos la engorrosa tarea de sumar una cantidad elevada de
términos de probabilidades binomiales, especialmente cuando n es muy grande y la
cantidad de éxitos está lejos de 0 y lejos de n, con lo cual la sumatoria tiene muchos
términos aunque se intente restar del 1 en vez de sumar.

Queda por hacer una observación antes de poder utilizar esta propiedad. Al estar
aproximando una distribución discreta por una continua, lo que se hace es tomar
intervalos de la continua, que representan los valores puntuales de la discreta. Por
ejemplo, consideraremos que la discreta vale 43, si la continua tiene cualquier valor
entre 42,5 y 43,5. Entonces la probabilidad de que la discreta esté entre 8 y 12 no es
la probabilidad de que la continua esté entre 8 y 12 sino de que esté entre 7,5 y
12,5. Considerar esto se conoce como "corrección por continuidad".

Ejemplo:
Se tiene una variable aleatoria X:Bi(n = 50 ; p = 0,4). ¿Cuál es la probabilidad de
que X sea menor a 20?
n
P ( X < 20) = ∑ P ( X = x) = ∑   p x (1 − p ) n − x
19 19

x =0 x =0  x 
Podríamos hacer . Esto
demandaría sumar 20 términos, y arroja el resultado 0,44648
Sin embargo, y a menos que se necesite el resultado exacto, podemos usar la
aproximación normal para resolver el problema. Estamos buscando P(X < 20), lo
cual es igual a:
P(0 ≤ X ≤ 19)
Hacemos la corrección por continuidad:
P(0 ≤ X ≤ 19) ≅ P(-0,5 ≤ X ≤ 19,5)
Tomamos el cambio de variables:
X − np
Y=
n p (1 − p )
con lo cual Y tendrá una distribución aproximadamente normal estándar.
Dejamos X en función de Y:
X = n p (1 − p) Y + np
Luego reemplazamos X por su definición en términos de Y en la probabilidad que
estábamos buscando:
 − 0,5 − np 19,5 − np 

P ( −0,5 ≤ X ≤ 19,5) = P ≤Y ≤ = P (− 5,92 ≤ Y ≤ −0,14 )

 n p (1 − p ) n p (1 − p ) 
Lo cual, por propiedades de la función de distribución acumulada queda:
P(-5,92 ≤ Y ≤ -0,14) = F Y(-0,14) - F Y(-5,92)
Como estamos considerando a Y una normal estándar, entonces:
F Y(-0,14) - F Y(-5,92) = Φ (-0,14) - Φ (-5,92) = (1 - Φ (0,14)) - (1 - Φ (5,92))
= Φ (5,92) - Φ (0,14) = 1 - 0,55567 = 0,44433
Observemos que el resultado aproximado 0,44433 es prácticamente igual al
resultado exacto 0,44648.

Demostración
Se provee esta demostración porque constituye un buen ejemplo de aplicación del
teorema central del límite.
Si X es la cantidad de éxitos en una muestra en n experimentos de Bernoulli,
entonces X es una variable aleatoria cuya distribución se conoce como binomial.
Toda variable binomial es en esencia la suma de n variables de Bernoulli (unos y
ceros). Como vimos para la distribución binomial:
E(X) = n.p
σx2 = n.p.(1-p)
También vimos que, por el teorema central del límite, para n lo suficientemente
grande, la suma de n variables tiene aproximadamente una distribución normal, con
determinadas media y varianza. Particularmente cuando X es binomial, si
np ≥ 5 y n (1 − p ) ≥ 5
(lo cual también garantiza que p esté lo suficientemente
alejada de 0 y 1 para que no se "aplaste") entonces su ditribución se puede
n.p.(1 − p)

X : N (n.p ; n.p.(1 − p) )
aproximar por una normal, con media n.p y desvío . Queda:
(aproximadamente).
X − np
Y=
n p (1− p)
Luego, tomando el cambio de variables , Y tiene una distribución
aproximadamente normal estándar.

Aproximación de la distribución de Poisson por la distribución normal

Si X es una variable de Poisson, con µ >> 1, entonces la variable aleatoria


X − µ
Y =
µ
tiene una distribución aproximadamente normal estándar.

Esto es válido porque si µ es mucho mayor que 1, entonces la forma de la


distribución de Poisson, a pesar de ser discreta, se parece mucho a la de la una
distribución normal. El cambio de variable Y no es otra cosa que la estandarización
de esa variable aproximadamente normal (ya que µ es a la vez la media y la varianza
de X)
50
En el gráfico vemos una variable de Poisson( µ = 50) junto con una variable normal( µ = 50 ; σ = ).

Esta propiedad nos permite utilizar una variable normal estándar, que se encuentra
tabulada, para ahorrarnos la engorrosa tarea de sumar una cantidad elevada de
términos de probabilidades de Poisson al calcular probabilidades acumuladas,
especialmente cuando necesitamos calcular la probabilidad acumulada para un valor
que esté lejos del cero.

Queda por hacer una observación antes de poder utilizar esta propiedad. Al estar
aproximando una distribución discreta por una continua, lo que se hace es tomar
intervalos de la continua, que representan los valores puntuales de la discreta. Por
ejemplo, consideraremos que la discreta vale 43, si la continua tiene cualquier valor
entre 42,5 y 43,5. Entonces la probabilidad de que la discreta esté entre 8 y 12 no es
la probabilidad de que la continua esté entre 8 y 12 sino de que esté entre 7,5 y
12,5. Considerar esto se conoce como "corrección por continuidad".

Ejemplo:
Se tiene una variable aleatoria X:Pois( µ = 60). ¿Cuál es la probabilidad de que X sea
menor a 70?
e−µ µ x
P( X < 70) = ∑ P( X = x) = ∑
69 69

x =0 x =0 x!
Podríamos hacer . Esto demandaría
sumar 70 términos, y arroja el resultado 0,88821.
Sin embargo, y a menos que se necesite el resultado exacto, podemos usar la
aproximación normal para resolver el problema. Estamos buscando P(X < 70), lo
cual es igual a:
P(0 ≤ X ≤ 69)
Hacemos la corrección por continuidad:
P(0 ≤ X ≤ 69) ≅ P(-0,5 ≤ X ≤ 69,5)
Tomamos el cambio de variables:
X − µ
Y =
µ
con lo cual Y tendrá una distribución aproximadamente normal estándar.
Dejamos X en función de Y:
X = µ Y +µ
Luego reemplazamos X por su definición en términos de Y en la probabilidad que
estábamos buscando:
 − 0,5 − µ 69,5 − µ 
P ( −0,5 ≤ X ≤ 69,5) = P ≤Y ≤ = (− ≤ ≤ )
µ µ  P 7,81 Y 1,23
 
Lo cual, por propiedades de la función de distribución acumulada queda:
P(-7.81 ≤ Y ≤ 1,23) = F Y(1,23) - F Y(-7,81)
Como estamos considerando a Y una normal estándar, entonces:
F Y(1,23) - F Y(-7,81) = Φ (1,23) - Φ (-7,81) = Φ (1,23) - (1 - Φ (7,81))
= Φ (1,23) + Φ (7,81) - 1 = 0,89065 + 1 - 1 = 0,89065
Observemos que el resultado aproximado 0,89065 es prácticamente igual al
resultado exacto 0,88821.

Problemas típicos
Deben considerarse modelos de problemas típicos los dos ejemplos dados en esta
sección.

Este material se encuentra en etapa de corrección y no deberá ser


considerado una versión final.
Para hacer comentarios y sugerencias, o reportar errores, enviar mail
a Alejandro D. Zylberberg <alejandro@probabilidad.com.ar>
Versión Actualizada al: 1 de junio de 2004

También podría gustarte