Está en la página 1de 31

L

RA
NE
UNIDAD 5

Distribuciones de Probabilidad.

GE
Objetivo 5.1. Conocer, comprender y aplicar a problemas de la realidad, el concepto de
distribución de probabilidad a partir del estudio de algunos modelos probabilı́sticos teóricos.
CA
5.1. Variable Aleatoria: concepto y ejemplos.

El cálculo de probabilidades utiliza variables numéricas que se denominan aleatorias,


porque sus valores vienen determinados por el azar. En todo proceso de observación o experimento
TI

podemos definir una variable aleatoria asignando a cada resultado del experimento un número:

1) Si el resultado del experimento es numérico porque contamos o medimos, los posibles valores
de la variable coinciden con los resultados del experimento.
Í S

Si arrojamos dos dados, sabemos que la suma X de los puntos que caen hacia arriba debe ser
un entero entre 2 y 12, pero no podemos predecir que valor de X aparecerá en el siguiente
ensayo y podemos decir que X depende del azar. El tiempo de vida de un foco que se extrae
D

aleatoriamente de un lote de focos depende también del azar. El número de varones de una
familia con 5 hijos también depende de la casualidad.
TA

2) Si el resultado del experimento es cualitativo, hacemos corresponder a cada resultado un


número arbitrariamente; por ejemplo, 0, si un elemento es bueno, y 1, si es defectuoso.
En otras palabras, si las observaciones no se dan en términos de números, podemos asignarles
números y reducir las observaciones cualitativas al caso cuantitativo; ası́ tenemos que la función
que asigna números o valores a cada uno de los elementos del espacio muestral con una
ES

probabilidad definida.

97
L
RA
98 Variable Aleatoria: concepto y ejemplos.

Diremos que se ha definido una variable aleatoria o que se ha construido un modelo de


distribución de probabilidad cuando se especifican los posibles valores de la variable con sus
probabilidades respectivas.

NE
Por ejemplo, si se lanza una moneda 3 veces, el número de caras X es una variable
aleatoria que toma los valores 0, 1, 2, 3; es decir puede que ninguna vez, una sola, dos o tres
veces salga cara como resultado; la probabilidad de que X = 2 es 3/8 ya que el espacio muestral
S = {ccc, cc+, c + c, c + +, +cc, +c+, + + c, + + +}. Ası́ pues, el espacio muestral es el dominio

GE
de la función y el conjunto de valores que la variable puede tomar es el rango de la función, que
es un subconjunto de los números reales R.

Si el rango X es el conjunto de los números enteros Z o un subconjunto de Z, la variable


aleatoria se llama variable aleatoria discreta, y si el rango es el conjunto de los números reales R
o un subconjunto de R, la variable aleatoria se llama variable aleatoria continua.

Son ejemplos de variables aleatorias continuas: la estatura, el peso, el volumen, el pH,


CA
etc. Algunos ejemplos de variables discretas son: el número de alumnos que asisten diariamente
durante un semestre, la edad, el número de accidentes automovilı́sticos en una ciudad por dı́a, el
número de piezas defectuosas por lote, el número de alumnos aprobados por grupo en un examen,
etc.
TI

Definición 5.1. Una variable aleatoria X es una función cuyo dominio es el espacio muestral
S y cuyo rango es un subconjunto de los números reales R que tiene asociada a su conjunto de
valores una función de probabilidad.
D Í S
TA
ES
L
RA
Distribuciones de Probabilidad. 99

5.2. Distribuciones de probabilidad.

Definición 5.2. Una tabla, gráfica o expresión matemática (fórmula) que dé las probabilidades

NE
con que una variable aleatoria toma diferentes valores, se llama distribución de probabilidad
de la variable aleatoria. Al conjunto de pares ordenados (X,f (X)) donde X es el conjunto de
valores de una variable aleatoria y f (X) las probabilidades asignadas a X, se le llama función
de probabilidad en el caso de que la variable aleatoria X sea discreta; y función de densidad de
probabilidad en el caso de que la variable aleatoria sea continua.

GE
Llamando Ω al espacio muestral, se verificará:

V.A. Discreta V.A. Continua


� �
p(xi ) = 1 f (x)dx = 1
i∈Ω Ω
CA
Ejemplo 5.1. Supongamos que nos interesamos por el número de varones X en el experimento
de observar al azar dos niños recién nacidos ¿Cuál es la distribución de probabilidad asociada a
este experimento?

Solución. Lo primero que se debe hacer es identificar la variable aleatoria X y los posibles valores
TI

que puede tomar esta, con lo que definimos: H = hombre y M = mujer.


Identifiquemos el espacio muestral, los valores que puede tomar la variable aleatoria X y su
función de probabilidad que esta representada en la tercera columna de la siguiente Tabla:
Í S

S Valores de X f (xi ) = P (X = xi )
1
MM 0 f (0) = P (X = 0) = 4
MH 1 2
f (1) = P (X = 1) =
D

4
HM 1
1
HH 2 f (2) = P (X = 2) = 4
4
Total = =1
TA

Ejemplo 5.2. Sea X la variable aleatoria que indica la suma de los puntos en las caras superiores
al lanzar dos dados no cargados, ¿Cuál es el espacio muestral, el conjunto de valores de X y sus
respectivas probabilidades?
ES

Solución. Según la Definición 4.1 de la Página 76 el espacio muestral es el conjunto de todos los
resultados posibles distintos del experimento aleatorio, en este ejemplo, el lanzamiento de los dos
L
RA
100 Distribuciones de probabilidad.

dados, obteniendo todos los resultados:


 

 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)

NE

 


(2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)


 


(3, 1) 
(3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
S=

 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)


 


 (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)


 


(6, 1) 
(6, 2) (6, 3) (6, 4) (6, 5) (6, 6)

GE
La variable aleatoria X fue definida como la suma de los puntos en las caras superiores, por lo que
el conjunto de todos los valores que puede tomar esta variable aleatoria es:

X = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}

S Valores de X f (xi ) = P (X = xi )
CA
1
(1, 1) 2 f (2) = P (X = 2) = 36
2
(1, 2), (2, 1) 3 f (3) = P (X = 3) = 36
3
(1, 3), (3, 1), (2, 2) 4 f (4) = P (X = 4) = 36
4
(1, 4), (4, 1), (2, 3), (3, 2) 5 f (5) = P (X = 5) = 36
5
(1, 5), (5, 1), (2, 4), (4, 2), (3, 3) 6 f (6) = P (X = 6) = 36
6
(1, 6), (6, 1), (2, 5), (5, 2), (3, 4), (4, 3) 7
TI

f (7) = P (X = 7) = 36
5
(2, 6), (6, 2), (3, 5), (5, 3), (4, 4) 8 f (8) = P (X = 8) = 36
4
(3, 6), (6, 3), (4, 5), (5, 4) 9 f (9) = P (X = 9) = 36
3
(4, 6), (6, 4), (5, 5) 10 f (10) = P (X = 10) = 36
Í S

2
(5, 6), (6, 5) 11 f (11) = P (X = 11) = 36
1
(6, 6) 12 f (12) = P (X = 12) = 36

Total: f (xi ) = 36
36 = 1
D

5.2.1. Función de distribución acumulada.


TA

Si X es una variable aleatoria, entonces para cualquier número real x0 , existe la probabilidad
P (X ≤ x0 ) del evento X ≤ x0 (X toma cualquier valor menor o igual a x0 ).

La probabilidad P (X ≤ x0 ) que depende de la elección de x0 es la probabilidad acumulada


hasta x0 y es el conjunto de valores de la función de distribución o de distribución acumulada y
se denota por F (x0 ). Es decir, al conjunto de pares ordenados (X,F (X)) se le llama función de
ES
L
RA
Distribuciones de Probabilidad. 101

distribución acumulada.
F (x0 ) = P (X ≤ x0 )

NE
.

En consecuencia F (x) determina en forma única la distribución de probabilidades de la


variable aleatoria correspondiente.

Ejemplo 5.3. Determinar la función de distribución acumulada del Ejemplo 5.1.

GE
Solución. La distribución acumulada F (x) está representada en la tercera columna de la siguiente
tabla:

X f (xi ) P (X ≤ x) = F (x)
1 1
0 f (0) = 4 P (X ≤ 0) = F (0) = 4
2 3
1 f (1) = 4 P (X ≤ 1) = F (1) = 4
1 4
2 f (2) = P (X ≤ 2) = F (2) =
CA
4 4

1 2 3
Obsérvese que F (1) = P (X ≤ 1) = P (X = 0) + P (X = 1) = 4 + 4 = 4

Ejemplo 5.4. Determinar la función de distribución acumulada del Ejemplo 5.2.

Solución. La distribución acumulada F (x) está representada en la tercera columna de la siguiente


TI

tabla:

X f (xi ) P (X ≤ x) = F (x)
1 1
2 P (X = 2) = 36 P (X ≤ 2) = F (2) = 36
Í S

2 3
3 P (X = 3) = 36 P (X ≤ 3) = F (3) = 36
3 6
4 P (X = 4) = 36 P (X ≤ 4) = F (4) = 36
4
5 P (X = 5) = 36 P (X ≤ 5) = F (5) = 10
36
5
6 P (X = 6) = 36 P (X ≤ 6) = F (6) = 15
D

36
6
7 P (X = 7) = 36 P (X ≤ 7) = F (7) = 21
36
5
8 P (X = 8) = 36 P (X ≤ 8) = F (8) = 26
36
4
9 P (X ≤ 9) = F (9) = 30
TA

P (X = 9) = 36 36
3
10 P (X = 10) = 36 P (X ≤ 10) = F (10) = 33
36
2
11 P (X = 11) = 36 P (X ≤ 11) = F (11) = 35
36
1
12 P (X = 12) = 36 P (X ≤ 12) = F (12) = 36
36

Obsérvese que:
ES

F (5) = P (X ≤ 5) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5)
L
RA
102 Distribuciones de probabilidad.

� 1 2 3 4 10
F (5) = P (X = xi ) = + + + =
36 36 36 36 36
xi ≤5

NE
Se puede demostrar que la probabilidad P (x1 < X ≤ x2 ) de un evento x1 < X ≤ x2 se
puede expresar en términos de la función de distribución acumulada de F (x), donde x1 y x2 son
dos valores cualesquiera x1 < x2

Observe que X ≤ x1 y x1 < X ≤ x2 son eventos mutuamente excluyentes, es decir, su

GE
unión es el evento X ≤ x2 según la Definión 4.4 de la Página 83.

Por el Axiona 3 de probabilidad (visto en la Sección 4.4 de la Página 82), obtenemos

P (X ≤ x2 ) = P (X ≤ x1 ) + P (x1 < X ≤ x2 )

que se escribe como


CA
P (x1 < X ≤ x2 ) = P (X ≤ x2 ) − P (X ≤ x1 )
= F (x2 ) − F (x1 )

En consecuencia F (x) determina en forma única la distribución de probabilidades de la variable


aleatoria correspondiente.
TI

Ejemplo 5.5. Con los datos del ejemplo anterior, determinar P (3 < X ≤ 5)

Solución. Utilizando el resultado visto recientemente tenemos:


Í S

P (3 < X ≤ 5) = P (X ≤ 5) − P (X ≤ 3)
= F (5) − F (3)
10 3
D

= −
36 36
7
=
36
TA

Propiedades de la Función de Distribución Acumulada.



1) P (S) = P (X = xi ) = 1, si X es discreta.
ES

xi � ∞
P (S) = P (−∞ < X < ∞) = f (v)dv = 1, si X es continua.
−∞
L
RA
Distribuciones de Probabilidad. 103

2) P (x1 < X ≤ x2 ) = F (x2 ) − F (x1 )

3) P (X = x) = 0, si X es continua (el área de un punto es cero).

NE
4) Si X es continua:

P (x1 < X ≤ x2 ) = P (x1 < X < x2 ) = P (x1 ≤ X < x2 ) = P (x1 ≤ X ≤ x2 )

GE
5.3. Media y varianza de la distribución de probabilidad de
una variable aleatoria discreta y continua.

5.3.1. Media (µ).

La media o valor medio de una distribución se representa por µ, y se define por:


CA

µ= xi f (x), si X es discreta (5.1)
xi ∈S

� ∞
µ= xf (x)dx, si X es continua (5.2)
−∞
TI

En estas dos fórmulas f (x) es la función de probabilidad (para variables discretas) y la


función densidad de probabilidad (para variables continuas).

Conviene mencionar que la media µ se conoce como esperanza matemática de X o,


Í S

brevemente, esperanza de X, y se representa por E [X].

En este curso veremos únicamente el desarrollo de la esperanza de una variable aleatoria


discreta.
D

Ejemplo 5.6. Calcular la esperanza matemática del Ejemplo 5.1.

Solución. Como es una variable aleatoria discreta y según la Ecuación (5.1) la media viene dada
TA
ES
L
RA
Media y varianza de la distribución de probabilidad de una variable aleatoria discreta y
104 continua.

por:

µ = E [X] = xi f (x)

NE
xi ∈S

= 0f (0) + 1f (1) + 2f (2)


= 0P (X = 0) + 1P (X = 1) + 2P (X = 2)
1 2 1
=0 +1 +2
4 4 4

GE
=1

Es decir, en promedio se espera observar un varón en el experimento de observar al azar dos niños
recién nacidos.

Ejercicio 5.1. Calcular la esperanza matemática del Ejemplo 5.2.


CA
5.3.2. Varianza (σ 2 ).

La varianza de una distribución se representa mediante σ 2 y se define por



σ2 = (xi − µ)2 f (x), si X es discreta (5.3)
xi ∈S
TI

� ∞
σ2 = (x − µ)2 f (x)dx, si X es continua (5.4)
−∞

En estas dos fórmulas f (x) es la función de probabilidad (para variables discretas) y la


Í S

función densidad de probabilidad (para variables continuas).

Claramente σ 2 ≥ 0 porque (x − µ)2 ≥ 0, y f (x) ≥ 0, para todo x. A la raı́z cuadrada


positiva de la varianza la llamamos desviación estándar y se denota σ.
D

En palabras, la varianza es una medida de dispersión o variabilidad de los valores que puede
tomar la variable aleatoria X correspondiente.
TA

Al igual que la esperanza matemática, en este curso se verá únicamente la varianza y


desviación estándar para variables discretas

Ejemplo 5.7. La varianza y la desviación estándar de la distribución del Ejemplo 5.1 son:
ES
L
RA
Distribuciones de Probabilidad. 105

Solución. Según la Ecuación (5.3) la varianza será:



σ2 = (xi − µ)2 f (x)

NE
xi ∈S

= (0 − 1)2 f (0) + (1 − 1)2 f (1) + (2 − 1)2 f (2)


= 1P (X = 0) + 0P (X = 1) + 1P (X = 2)
1 1
= +0+
4 4

GE
1
=
2
y la desviación estándar será: �
√ 1
σ= σ2 =
2
CA
Ejercicio 5.2. Determinar la varianza y la desviación estándar del Ejemplo 5.2.

5.4. Distribución de Bernoulli.

Supongamos un experimento donde se observan elementos de una población, con las


TI

siguientes caracterı́sticas:

1) La observación consiste en clasificarlos en dos categorı́as, que llamaremos A (aceptable) y D


Í S

(defectuoso).
2) La proporción de elementos A y D en la población es constante y no se modifica cualquiera
que sea la cantidad observada. Esto implica que si la población es finita, los elementos se
reemplazan una vez observados. Llamaremos p a la probabilidad de defectuoso, y q = 1 − p a
D

la de aceptable.
3) Las observaciones son independientes, es decir, la probabilidad de elemento defectuoso es
TA

siempre la misma y no se modifica por cualquier combinación de elementos defectuosos o


aceptables observados

Este modelo se aplica a poblaciones finitas de las que tomamos elementos al azar
con reemplazamiento, y también a poblaciones conceptualmente infinitas, como las piezas
ES

que producirá una máquina, siempre que el proceso generador sea estable (proporción de
L
RA
106 Distribución de probabilidad Binomial.

piezas defectuosas constante a largo plazo) y sin memoria (el resultado en cada momento es
independiente de lo previamente ocurrido).

NE
Ejemplos de procesos de Bernoulli son observar el sexo de un recién nacido, si un cliente
está satisfecho o no con un servicio, la aparición del número 10 en tiradas sucesivas de una ruleta
o la aparición de un elemento defectuoso en una fabricación.

En este proceso podemos definir distintas variables aleatorias que darán lugar a distintas
distribuciones de probabilidad.

GE
Definimos la variable aleatoria de Bernoulli por:

0, si el elemento es aceptable
x=
1, si el elemento es defectuoso

La función de probabilidades de esta variable se escribe:


CA
P (x) = px (1 − p)1−x ; x = {0, 1} (5.5)

Su media es p y varianza p(1 − p)

El modelo de Bernoulli tiene un solo parámetro, p, es apropiado cuando se tenga un


TI

experimento que resulte en proposiciones: si o no; éxito o fracaso; varón o niña; artı́culos
defectuosos o no defectuosos; etc. Obsérvese que, en el uso estadı́stico, resultados “favorables”
o “satisfactorios” no significa necesariamente resultados que sean “deseable” en la práctica.
Í S

Un ejemplo de un experimento de Bernoulli es, en el lanzamiento de un dado legal, una sola


vez, consideremos éxito el que salga un número primo par, entonces la probabilidad de éxito es
1/6 y la de fracaso (cualquier otro número diferente de 2) es 5/6
D

5.5. Distribución de probabilidad Binomial.


TA

Ahora definiremos un experimento Binomial, éste debe cumplir con las siguientes
propiedades:

1) El experimento consta de n ensayos estadı́sticamente independientes y repetidos.


ES

2) Cada ensayo tiene dos resultados posibles uno llamado “éxito” y otro “fracaso” (cada ensayo
es un experimento de Bernoulli).
L
RA
Distribuciones de Probabilidad. 107

3) La probabilidad de éxito en cada ensayo es la misma e igual a “p” y, la de fracaso, “q = 1 − p”


donde p + q = 1.

NE
4) Existe una variable aleatoria discreta X, asociada al experimento que cuenta el número de
éxitos en los n ensayos o el número de ensayos con éxito, entonces los valores de X son:
X = 0, 1, 2, 3, ...n.

Algunos ejemplos de experimentos binomiales son:

GE
1) El nacimiento de un niño.
2) El lanzamiento de una moneda legal.
3) Extracción de sangre para una transfusión (si sale el tipo y Rh deseado es éxito, de cualquier
otro, fracaso).
4) Partes defectuosas y no defectuosas producidas por una máquina.
CA
Ahora trataremos de obtener la función de probabilidad Binomial f (x) que da la
probabilidad de obtener X éxitos en n ensayos.

Si quisiéramos la probabilidad de obtener x éxitos consecutivos, seguidos por n−x fracasos,


la probabilidad serı́a:
TI

p · p · p · · · (1 − p) · (1 − p) · (1 − p) · · · = px (1 − p)n−x
� �� � � �� �
x n−x

Pero deseamos la probabilidad de obtener x éxitos y n − x fracasos en cualquier orden de


Í S

ocurrencia (no necesariamente x éxitos primero, seguidos de n − x fracasos seguidos también). El


número de arreglos que se pueden tener es:
� �
D

n! n
=
x!(n − x)! k

Si definimos ahora el suceso A de probabilidad p y consideremos n pruebas independientes, en


TA

cada una de las cuales puede o no presentarse el suceso A. Sea X el número de veces en que se
presenta A.
A , ����
���� Ac , ����
A , · · · , ����
A , ���� Ac , ����
Ac
p p p 1−p 1−p 1−p
ES
L
RA
108 Distribución de probabilidad Binomial.

Por la hipótesis de independencia, la probabilidad de este suceso es:

p · p · p · · · (1 − p) · (1 − p) · (1 − p) · · · = pk (1 − p)n−k

NE
� �� � � �� �
k n−k

X toma valores de 0 a n, y su función de densidad es:

� �
n k
P (X = k) = p (1 − p)n−k ; k = 0, 1, ..., n (5.6)

GE
k

Se dice que X sigue una distribución Binomial y se indica por: X ∼ Bin(n, p) y su media
es np y varianza np(1 − p)

Ejemplo 5.8. Se conoce que 10 % de cierta población es daltónica. Si se selecciona una muestra
de 15 personas al azar de esta población, calcule las probabilidades siguientes:
CA
a) 4 sean daltónicos.
b) 2 o menos sean daltónicos.
c) 3 o más sean daltónicos.
d) entre 1 y 3 inclusive sean daltónicos.
e) E[X]
TI

Solución. Lo primero que se tiene que hacer es definir la variable aleatoria


Sea X = “el número de personas daltónicas”;
p = 0.1: nuestro éxito, en base a la variable X
Í S

n = 15 que es la cantidad de personas elegidas al azar.


Entonces X ∼ Bin(n = 15, p = 0.1)
D

a) Que 4 sean daltónicos.


� �
15
P (x = 4) = 0.14 0.911 = 0.0428
TA

b) Que 2 o menos sean daltónicos.

2 � �
� 15
P (x ≤ 2) = 0.1k 0.915−k = P (x = 0) + P (x = 1) + P (x = 2)
k
ES

k=0
= 0.2059 + 0.3432 + 0.2669
= 0.8159
L
RA
Distribuciones de Probabilidad. 109

c) Que 3 o más sean daltónicos.

15 � �
� 15

NE
P (x ≥ 3) = 0.1k 0.915−k = P (x = 3) + P (x = 4) + · · · + P (x = 15) = 0.1841
k
k=3

Resultado obtenido al calcularse las 13 probabilidades y sumando; pero este metodo puede
resultar un poco tedioso, utilizaremos la técnica del complemento, de acuerdo a la Definición
4.5 de la Página 83, tenemos que de todos los posibles valores que puede tomar X:

GE
0 1 2� 3
� �� � 4 5 6 7 8 9 10
�� 11 12 13 14 15�
complemento lo que se pide

Y según el Axioma 2 visto en la Sección 4.4 de la Página 82, la probabilidad solicitada la


calculamos ası́:

P (x ≥ 3) = 1 − P (x < 3) = 1 − P (x ≤ 2) = 1 − 0.8159 = 0.1841


CA
d) Entre 1 y 3 inclusive sean daltónicos.

3 � �
� 15
P (1 ≤ x ≤ 3) = 0.1k 0.915−k = P (x = 1) + P (x = 2) + P (x = 3) = 0.7386
k
k=1
TI

e) E[X] = 15 ∗ 0.1 = 1.5

Nota (Complementos para desigualdades). En la siguiente tabla se muestran los conjuntos con
Í S

desigualdades (primera columna), sus complementos (segunda columna) y las igualdades para el
cálculo de sus respectivas probabilidades.

A Ac Igualdad de probabilidades
D

X≤x X>x P (X ≤ x) = 1 − P (X > x)


X≥x X<x P (X ≥ x) = 1 − P (X < x)
X<x X≥x P (X < x) = 1 − P (X ≥ x)
TA

X>x X≤x P (X > x) = 1 − P (X ≤ x)

Ejercicio 5.3. La probabilidad de que un televisor de determinada marca salga defectuoso es


de 0.20. Si se toma una muestra aleatoria de 20 televisores, ¿cuál es la probabilidad de que la
muestra contenga:
ES

a) Exactamente dos defectuosos?


L
RA
110 Distribución de Poisson.

b) Ningún defectuoso?
c) ¿Cuántos televisores defectosos se esperan tener en dicha muestra?

NE
5.6. Distribución de Poisson.

La distribución de Poisson es otra distribución discreta, cuyo nombre se debe al matemático


francés, Simeon Denis Poisson (1781-1840), quien la introdujo en 1837. Esta distribución tiene

GE
grandes usos en muchos campos, especialmente en Biologı́a y Medicina.

Una variable del tipo Poisson cuenta éxitos (es decir, objetos de un tipo determinado) que
ocurren en una región del espacio o del tiempo. En este tipo de experimentos los éxitos buscados
son expresados por unidad de área, tiempo, pieza, etc. Por ejemplo:

1) Número de defectos de una tela por m2 .


CA
2) Número de aviones que aterrizan en un aeropuerto por dı́a hora, minuto, etc.
3) Número de bacterias por cm2 de cultivo.
4) Número de llamadas telefónicas a un conmutador por hora, minuto, etc.
5) Número de llegadas de embarcaciones a un puerto por dı́a, mes, etc.
TI

6) Número de clientes que llegan a un banco por hora, dı́a, semana, etc.

El experimento que genera una variable aleatoria de Poisson debe cumplir las siguientes
condiciones:
Í S

1) Los eventos ocurren en forma independiente; es decir, la ocurrencia de un evento en un


intervalo de tiempo o espacio no afecta la probabilidad de una segunda ocurrencia del evento
en el mismo u otro intervalo.
D

2) Teóricamente es posible que el evento pueda ocurrir infinitas veces en el intervalo.


TA

3) La probabilidad de que ocurra un evento en un intervalo es proporcional a la longitud del


intervalo y no depende de lo que ocurra fuera de él.

4) La probabilidad de encontrar uno o más éxitos en una región del tiempo o del espacio tiende a
cero a medida que se reducen las dimensiones de la región en estudio.
ES
L
RA
Distribuciones de Probabilidad. 111

Si X es el número de ocurrencias de un evento aleatorio en un intervalo de tiempo o espacio


(o volumen), la probabilidad de que X ocurra, está dada por la función de probabilidad de Poisson

NE
e−λ λx
f (x) = P (X = x) = , λ ≥ 0; x = 0, 1, 2, ... (5.7)
x!

La letra griega λ (lambda) es el parámetro de esta distribución que representa tanto la media
como la varianza de ocurrencias del evento aleatorio en el intervalo, es decir, E[X] = V ar[X] =

GE
λ. El sı́mbolo e es una constante cuyo valor aproximado a 4 cifras de cimales es 2.7183 (base de
los logaritmos naturales).

La distribución de Poisson se puede considerar como el lı́mite al que tiende la distribución


binomial cuando n tiende a ∞ y p tiende a 0, siendo np constante (y menor que 7); en esta
situación serı́a difı́cil calcular probabilidades en una variable binomial y, por tanto, se utiliza una
aproximación a través de una variable Poisson con media λ = np. A esta distribución se le da
CA
el nombre de ley de los sucesos raros, dado que permite modelar sucesos que ocurren con una
probabilidad pequeña.

Nota (Importante). Las variables Poisson cumplen la propiedad de que la suma de variables
Poisson independientes es otra Poisson con media igual a la suma las medias.
TI

Ejemplo 5.9. Si un banco recibe en promedio 6 cheques sin fondo por dı́a, ¿cuáles son las
probabilidades de que reciba, a) cuatro cheques sin fondo en un dı́a dado, b) 10 cheques sin
fondos en cualquiera de dos dı́as consecutivos?
Í S

Solución.

a) Sea X = variable que define el número de cheques sin fondo que llegan al banco en un dı́a
D

cualquiera (X = 0, 1, 2, 3, ...) y λ = 6 cheques sin fondo por dı́a.

e−6 64
P (X = 4) = = 0.1339
TA

4!

b) Sea Y = variable que define el número de cheques sin fondo que llegan al banco en dos dı́as
consecutivos (Y = 0, 1, 2, 3, ...) y λ = 6 · 2 = 12 cheques sin fondo que llegan al banco en
dos dı́as consecutivos; lo anterior gracias a la propiedad de las variables de Poisson.
ES

e−12 1210
P (Y = 10) = = 0.1048
10!
L
RA
112 Distribución de Poisson.

Ejercicio 5.4. El número promedio de automóviles que se detienen por minuto para poner
gasolina en cierta gasolinera de la Ciudad de San Salvador es 1.2. ¿Cuál es la probabilidad
de qué en determinado minuto se detengan:

NE
a) Menos de dos automóviles.
b) Más de tres automóviles.
c) Dos ó tres automóviles para poner gasolina.

GE
d) Al menos dos automóviles.

Ejemplo 5.10. Cierta enfermedad tiene una probabilidad muy baja de ocurrir, p = 1/100, 000.
Calcular la probabilidad de que en una ciudad con 500, 000 habitantes haya más de 3 personas
con dicha enfermedad. Calcular el número esperado de habitantes que la padecen.

Solución. Si consideramos la variable aleatoria X que contabiliza el número de personas que


CA
padecen la enfermedad, es claro que sigue un modelo binomial, pero que puede ser muy bien
aproximado por un modelo de Poisson, y como np = 5 ≤ 7 se puede utilizar la aproximación de
la Binomial a la Poisson, de modo que
� �
1
X ∼ Bin n = 500, 000, p = =⇒ X ∼ P oisson(λ = 5)
100, 000
TI

Ası́ el número esperado de personas que padecen la enfermedad es E[X] = 5. Como V ar[X] = 5,
existe una gran dispersión, y no serı́a extraño encontrar que en realidad hay muchas más personas
o menos que están enfermas. La probabilidad de que haya más de tres personas enfermas es:
Í S

P (X > 3) = 1 − P (X ≤ 3)
= 1 − [P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3)]
� −5 0 �
D

e 5 e−5 51 e−5 52 e−5 53


=1− + + +
0! 1! 2! 3!
= 1 − 0.2650
TA

= 0.7350

Ejercicio 5.5. Si ya se conoce que solo el 3 % de los alumnos de un determinado Colegio de la


capital faltan a clases ¿calcular la probabilidad de que si tomamos 100 alumnos al azar 5 de ellos
ES

falten a clases?
L
RA
Distribuciones de Probabilidad. 113

5.7. Distribución de probabilidad Normal.

Sin lugar a duda, el modelo de mayor uso de todas las distribuciones continuas es

NE
la distribución normal o distribución Gaussiana (atribuida a C.F. Gauss, quien primero hizo
referencia a ella en 1809 en relación con la teorı́a de los errores de medidas fı́sicas; sin embargo,
ya habı́a sido descubierta por De Moivre en 1733 como la forma limitante a la binomial. También
fue conocida por Laplace en 1774, pero por un error histórico ha sido acreditada a Gauss). Esta
distribución no solo sirve como distribución modelo de muchos problemas prácticos de la vida

GE
real sino que también es utilizada en muchas investigaciones teóricas.

La distribución normal es la distribución continua más importante, por las siguientes


razones:

1) Muchas variables aleatorias que aparecen en relación con experimentos u observaciones


prácticas están distribuidas normalmente.
CA
2) Otras variables están distribuidas normalmente en forma aproximada.
3) Algunas veces una variable no está distribuida normalmente, ni siquiera en forma aproximada,
pero se puede convertir en una variable con distribución normal por medio de una
transformación sencilla.
TI

4) Ciertas distribuciones se pueden aproximar mediante la distribución normal (como el caso de


las distribuciones binomial y de Poisson).
5) En estadı́stica teórica, muchos problemas pueden ser resueltos fácilmente en el supuesto de
una población normal. En el trabajo aplicado, encontramos que métodos elaborados según la
Í S

ley de probabilidades normal dan resultados satisfactorios, aunque no se cumpla totalmente el


supuesto de una población normal.
6) Ciertas variables que son básicas para justificar pruebas estadı́sticas están distribuidas
D

normalmente.

La distribución normal se define mediante su función densidad de probabilidad


TA

1 1 2
f (x) = √ e− 2σ2 (x−µ) , −∞ < x < ∞ (5.8)
2πσ 2

donde µ y σ son, respectivamente, la media y la desviación estándar de la variable aleatoria normal


general X. En la Figura 5.1 aparece la forma de la distribución normal, una curva normal en forma
ES

de campana.
L
RA
114 Distribución de probabilidad Normal.

NE
GE
Figura 5.1: Curva en forma de campana de una distribución normal

La Ecuación (5.8) es una fórmula aparentemente muy complicada, especialmente si


deseamos calcular densidades y probabilidades con ella, puesto que su función de distribución
acumulada es una integral que no se puede evaluar por métodos elementales, no nos debe
preocupar porque se pueden calcular fácilmente usando las tablas que se han publicado para tal
CA
efecto (Tabla de la distribución Normal). Pero si debemos familiarizarnos con las propiedades
geométricas de la densidad normal.

Las siguientes son observaciones importantes acerca de las caracterı́sticas de las distribu-
ciones normales.
TI

1) La curva que representa a f (x) se denomina “campana de Gauss” y es simétrica respecto a µ


, X toma valores entre −∞ e ∞.
Í S

2) Toda la familia de distribuciones normales se diferencia por medio de dos parámetros: la media
µ y la desviación estándar σ.

3) El punto más alto de una curva normal se encuentra sobre la media, la cual coincide con la
D

mediana y la moda.

4) En los valores µ − σ y µ + σ ocurren puntos de inflexión.


TA

5) Las probabilidades correspondientes a la variable aleatoria normal se dan mediante áreas bajo
la curva normal. Toda el área bajo la curva de una distribución normal es 1. Como esta
distribución es simétrica, el área bajo la curva y a la izquierda de la media es 0.50 y el área bajo
la curva y a la derecha de la media es 0.50.
ES

6) Los porcentajes de los valores que se encuentran en algunos intervalos comúnmente usados
son:
L
RA
Distribuciones de Probabilidad. 115

a. 68.3 % de los valores de una variable aleatoria normal se encuentran más o menos una
desviación estándar de la media. P (µ − σ < x < µ + σ) ≈ 0.683
b. 95.4 % de los valores de una variable aleatoria normal se encuentran más o menos dos

NE
desviaciones estándar de la media. P (µ − 2σ < x < µ + 2σ) ≈ 0.954
c. 99.7 % de los valores de una variable aleatoria normal se encuentran más o menos tres
desviaciones estándar de la media. P (µ − 3σ < x < µ + 3σ) ≈ 0.997

En la Figura 5.2 aparece una gráfica de las propiedades a, b y c.

GE
CA

Figura 5.2: Representación de los intervalos


TI

7) La curva es asintótica con el eje X.

8) Como el exponente de la distribución normal en la Ecuación (5.8) es negativo, cuanto mayor es


Í S

la desviación de X con relación a µ, tanto menor es la densidad de probabilidad de (X, f (x)).

9) Un cambio en el valor de µ desplaza la distribución normal a la izquierda o a la derecha. En la


D

Figura 5.3 se muestran tres distribuciones normales que tienen la misma desviación estándar,
pero diferentes medias. (−10, 0 y 20).
TA

10) La distribución normal es simétrica, siendo la forma de la curva normal al lado izquierdo de
la media, la imagen especular de la forma al lado derecho de la media. Las colas de la curva
normal se extienden al infinito en ambas direcciones y en teorı́a jamás tocan el eje horizontal.
Dado que es simétrica, la distribución normal no es sesgada; su sesgo es cero.
ES

11) La desviación estándar determina qué tan plana y ancha es la curva normal. Desviaciones
estándar grandes corresponden a curvas más planas y más anchas, lo cual indica mayor
L
RA
116 Distribución de probabilidad Normal.

NE
GE
Figura 5.3: Tres distribuciones normales con diferente media e igual varianza

variabilidad en los datos. En la Figura 5.4 se muestran dos curvas normales que tienen la
misma media pero distintas desviaciones estándar.
CA
TI

Figura 5.4: Dos distribuciones normales con igual media y diferentes varianzas
Í S

12) Realmente no existe la distribución normal sino infinitas distribuciones normales, para cada
pareja de valores de µ y de σ existe una distribución normal; pero se puede establecer una
relación entre ellas.
D

5.7.1. La distribución normal estándar.


TA

La distribución normal cuya media es cero y cuya desviación estándar es 1 se llama


distribución normal estándar y para distinguirla de las demás, usamos la letra z para la variable
normal estándar. La Figura 5.5 es la gráfica de la distribución normal estándar. Esta distribución
tiene el mismo aspecto general que cualquier otra distribución normal, pero tiene las propiedades
ES

especiales, µ = 0 y σ = 1.
L
RA
Distribuciones de Probabilidad. 117

NE
GE
Figura 5.5: Distribución normal estándar

Dado que µ = 0 y σ = 1, la fórmula de la función de densidad de probabilidad normal


estándar es una versión más simple de la Ecuación (5.8).
CA
1 1 2
f (z) = √ e− 2 z , −∞ < z < ∞ (5.9)

Como ocurre con otras variables aleatorias continuas, los cálculos de la probabilidad en
cualquier distribución normal se hacen calculando el área bajo la gráfica de la función de densidad
de probabilidad. Por tanto, para hallar la probabilidad de que una variable aleatoria normal
TI

esté dentro de un determinado intervalo, se tiene que calcular el área que se encuentra bajo la
curva normal y sobre ese intervalo.

Para la distribución normal estándar ya se encuentran calculadas las áreas bajo la curva
Í S

normal y se cuenta con tablas que dan estas áreas y que se usan para calcular las probabilidades.
En nuestro curso utilizaremos la tabla que contiene áreas, o probabilidades acumuladas.

Los tres tipos de probabilidades que se necesitan calcular son:


D

1) La probabilidad de que la variable aleatoria normal estándar z sea menor o igual que un valor
dado;
TA

2) La probabilidad de que z esté entre dos valores dados;


3) La probabilidad de que z sea mayor o igual que un valor dado.

Para mostrar el uso de las tablas de probabilidad acumulada de la distribución normal estándar en
ES

el cálculo de estos tres tipos de probabilidades, se consideran algunos ejemplos.


L
RA
118 Distribución de probabilidad Normal.

Ejemplo 5.11. Para el primer caso, veremos cómo se calcula la probabilidad de que z sea menor
o igual a 1.00; es decir P (z ≤ 1.00).

NE
Solución. Esta probabilidad acumulada es el área bajo la curva normal a la izquierda de z = 1.00
como se muestra en la Figura 5.6.

GE
CA
Figura 5.6: Área bajo la curva de z ≤ 1.00

Consulte la tabla de la distribución de probabilidad normal estandar acumulda. Esta probabilidad


acumulada correspondiente a z = 1.00 es el valor que en la tabla se localiza en la intersección
del renglón cuyo encabezado es 1.0 y la columna cuyo encabezado es 0.00. Primero localice 1.0
TI

en la columna del extremo izquierdo de la tabla y después localice 0.00 en el renglón en la parte
superior de la tabla. Observe que en el interior de la tabla, el renglón 1.0 y la columna 0.00 se
cruzan en el valor 0.8413; por tanto, P (z ≤ 1.00) = 0.8413. Estos pasos se muestran en la Figura
Í S

5.7 del extracto de las tablas de probabilidad.

Para ilustrar cómo se calcula el segundo tipo de probabilidad veamos el siguiente ejemplo
Ejemplo 5.12. Calcular la probabilidad de que z esté en el intervalo entre −0.50 y 1.25; esto es,
D

P (−0.50 ≤ z ≤ 1.25).

Solución. En la gráfica de la Figura 5.8 se muestra esta área o probabilidad.


TA

Para calcular esta probabilidad son necesarios tres pasos. Primero, se encuentra el área bajo la
curva normal a la izquierda de z = 1.25. Segundo, se encuentra el área bajo la curva normal a la
izquierda de z = −0.50. Por último, se resta el área a la izquierda de z = −0.50 del área a la
izquierda de z = 1.25 y se encuentra, P (−0.50 ≤ z ≤ 1.25).
ES

Para encontrar el área bajo la curva normal a la izquierda de z = 1.25, primero se localiza en
la tabla de probabilidad normal estándar el renglón 1.2 y después se avanza por ese renglón
L
RA
Distribuciones de Probabilidad. 119

NE
GE
Figura 5.7: Parte de la tabla acumulada normal estandar para valores de z ≥ 0
CA
TI
Í S

Figura 5.8: Área bajo la curva de z entre −0.50 y 1.25

hasta la columna 0.05. Como el valor que aparece en el renglón 1.2 columna 0.05 es 0.8944,
P (z ≤ 1.25) = 0.8944. De manera similar, para encontrar el área bajo la curva a la izquierda de
D

z = −0.50 en la tabla localizamos el valor en el renglón −0.5 y la columna 0.00; como el valor
que se encuentra es 0.3085, P (z ≤ −0.50) = 0.3085. Por tanto,
TA

P (−0.50 ≤ z ≤ 1.25) = P (z ≤ 1.25) − P (z ≤ −0.50) = 0.8944 − 0.3085 = 0.5859

A continuación se presenta otro ejemplo para calcular la probabilidad de que z esté en el


ES

intervalo entre dos valores dados. Con frecuencia se desea calcular la probabilidad de que una
L
RA
120 Distribución de probabilidad Normal.

variable aleatoria normal tome un valor dentro de cierto número de desviaciones estándar respecto
a la media.

NE
Ejemplo 5.13. Suponga que desea calcular la probabilidad de que la variable aleatoria normal
estándar se encuentre a no más de una desviación estándar de la media; es decir, P (−1.00 ≤
z ≤ 1.00).

Solución. Para calcular esta probabilidad tiene que hallar el área bajo la curva entre −1.00 y 1.00.

GE
Antes se encontró que P (z ≤ 1.00) = 0.8413. Siguiendo los pasos anteriores encontrará que el
área bajo la curva a la izquierda de z = −1.00 es 0.1587, de manera que P (z ≤ −1.00) = 0.1587.
Por tanto,

P (−1.00 ≤ z ≤ 1.00) = P (z ≤ 1.00) = P (z ≤ −1.00) = 0.8413 − 0.1587 = 0.6826

Esta probabilidad se muestra en forma gráfica en la Figura 5.9.


CA
TI
Í S

Figura 5.9: Área bajo la curva a no más de una desviación estándar de la media

Para ilustrar cómo se calcula el tercer tipo de probabilidad veamos el siguiente ejemplo
D

Ejemplo 5.14. Suponga que desea calcular la probabilidad de tener un valor z por lo menos
igual a 1.58; es decir, P (z ≥ 1.58).
TA

Solución. El valor en el renglón z = 1.5, columna 0.08 de la tabla normal acumulada es 0.9429;
por tanto, P (z ≤ 1.58) = 0.9429. Pero, como toda el área bajo la curva normal es 1

P (z ≥ 1.58) = 1 − 0.9429 = 0.0571


ES

En la Figura 5.10 se muestra esta probabilidad.


L
RA
Distribuciones de Probabilidad. 121

NE
GE
Figura 5.10: Área bajo la curva de z ≥ 1.58

En los ejemplos anteriores se muestra cómo calcular probabilidades dados determinados


valores de z. En algunas situaciones se da una probabilidad y se trata de hacer lo contrario,
encontrar el correspondiente valor de z. Para comprender este caso, veamos el siguente ejemplo.
CA
Ejemplo 5.15. Suponga que desea hallar un valor z tal que la probabilidad de obtener un valor
z mayor sea 0.10.

Solución. Este problema es la situación contraria a la presentada en los ejemplos anteriores, en


TI

ellos se dio el valor z y se halló la probabilidad o área correspondiente. En este ejemplo se da la


probabilidad, o el área, y se pide hallar el valor correspondiente de z. Para esto se usa la tabla de
probabilidad normal estándar de una manera un poco diferente. En la Figura 5.11 se muestra en
forma gráfica esta situación.
D Í S
TA
ES

Figura 5.11: Área bajo la curva igual a 0.10


L
RA
122 Distribución de probabilidad Normal.

Recuerde que la tabla de probabilidad normal estándar da el área bajo la curva a la izquierda de un
determinado valor z. Se ha recibido la información de que el área en la cola superior (derecha) de
la curva es 0.10. Por tanto, el área bajo la curva a la izquierda del valor desconocido de z debe ser

NE
0.9000. Al recorrer el cuerpo de la tabla, se encuentra que 0.8997 es la probabilidad acumulada
más cercana a 0.9000. En la Figura 5.12 se reproduce la sección de la tabla en la que se encuentra
este resultado.

GE
CA

Figura 5.12: Parte de la tabla acumulada normal estandar para valores de z ≥ 0


TI

Al leer el valor de z en la columna del extremo izquierdo y en el renglón superior de la tabla,


se encuentra que el valor de z es 1.28. De manera que un área de aproximadamente 0.9000 (en
realidad de 0.8997) es la que se encuentra a la izquierda de z = 1.28. En términos de la pregunta
Í S

originalmente planteada, 0.10 es la probabilidad aproximada de que z sea mayor que 1.28.

Estos ejemplos ilustran que la tabla de probabilidades acumuladas para la distribución de


probabilidad normal estándar se puede usar para hallar probabilidades correspondientes a valores
D

de la variable aleatoria normal estándar z. Es posible hacer dos tipos de preguntas. En el primer
tipo de pregunta se dan valores, o un valor de z, y se pide usar la tabla para determinar el área
TA

o probabilidad correspondiente. En el segundo tipo de pregunta se da un área, o probabilidad,


y se pide usar la tabla para encontrar el correspondiente valor de z. Por tanto, se necesita tener
flexibilidad para usar la tabla de probabilidad normal estándar para responder la pregunta deseada.
En la mayorı́a de los casos, hacer un bosquejo de la gráfica de la distribución de probabilidad
normal estándar y sombrear el área deseada será una ayuda para visualizar la situación y encontrar
ES

la respuesta correcta.
L
RA
Distribuciones de Probabilidad. 123

Ejercicio 5.6. Determinar las siguientes probabilidades:

a) P (z < 1.26)

NE
b) P (z > 1)
c) El área a la izquierda de z es 0.7291.

5.7.2. Cálculo de probabilidades en cualquier distribución de probabilidad

GE
normal.

La razón por la cual la distribución normal estándar se ha visto de manera tan amplia es
que todas las distribuciones normales son calculadas mediante la distribución normal estándar.
Esto es, cuando distribución normal con una media µ cualquiera y una desviación estándar σ
cualquiera, las preguntas sobre las probabilidades en esta distribución se responden pasando
primero a la distribución normal estándar. Use las tablas de probabilidad normal estándar y los
CA
valores apropiados de z para hallar las probabilidades deseadas. A continuación se da la fórmula
que se emplea para convertir cualquier variable aleatoria X con media µ y desviación estándar σ
en la variable aleatoria normal estándar z.

x−µ
z= (5.10)
TI

Un valor x igual a su media µ da como resultado

µ−µ
z= =0
Í S

De manera que un valor x igual a su media corresponde a z = 0. Ahora suponga que x se encuentra
una desviación estándar arriba de su media. Es decir, x = µ + σ. Aplicando la Ecuación (5.10) el
D

valor correspondiente es
(µ + σ) − µ σ
z= = =1
σ σ
TA

Ası́ que un valor de x que es una desviación estándar mayor que su media corresponde a z = 1.
En otras palabras, z se interpreta como el número de desviaciones estándar a las que está una
variable aleatoria x de su media µ.

Para ver cómo esta distribución permite calcular probabilidades en cualquier distribución
ES

normal veamos el siguiente ejemplo.

Ejemplo 5.16. Admita que tiene una distribución en la que µ = 10 y σ = 2. ¿Cuál es la


L
RA
124 Distribución de probabilidad Normal.

probabilidad de que la variable aleatoria x esté entre 10 y 14?

Solución. Empleando la Ecuación (5.10) se ve que para

NE
x−µ 10 − 10
z= = =0
σ 2

y que para x = 14
14 − 10 4
z= = =2

GE
2 2
Ası́, la respuesta a la pregunta acerca de la probabilidad de que x esté entre 10 y 14 está dada por
la probabilidad equivalente de que z esté entre 0 y 2 en la distribución normal estándar. Como se
muestra a continuación
� �
10 − 10 x − 10 14 − 10
P (10 ≤ x ≤ 14) = P ≤ ≤ = P (0 ≤ z ≤ 2)
2 2 2
CA
En otras palabras, la probabilidad que se está buscando es que la variable aleatoria x esté entre su
media y dos desviaciones estándar arriba de la media. Usando z = 2 y la tabla de probabilidad
normal estándar acumulada, se ve que P (z ≤ 2) = 0.9772. Como P (z ≤ 0) = 0.5000, se tiene
que
P (0.00 ≤ z ≤ 2.00) = P (z ≤ 2) − P (z ≤ 0) = 0.9772 − 0.5000 = 0.4772
TI

Por tanto, la probabilidad de que x esté entre 10 y 14 es 0.4772.

Ejercicio 5.7. Sea X una variable aleatoria normal con media 0.8 y varianza 4, determinar las
probabilidades:
Í S

a) P (X < 2.44) b) P (X > −2.9) c) P (2 < X < 10)

Ejercicio 5.8. Sea X una variable aleatoria normal con media 2 y varianza 0.25, determinar la
D

constante k tal que:

a) P (X < k) = 0.2 b) P (X > k) = 0.25 c) P (−1 < X < k) = 0.5


TA

5.7.3. Aproximación normal de las probabilidades binomiales.

En la Sección 5.5 se presentó la distribución binomial discreta. Recuerde que un


ES

experimento binomial consiste en una serie de n ensayos idénticos e independientes, habiendo


para cada ensayo dos resultados posibles, éxito o fracaso. La probabilidad de éxito en un ensayo
L
RA
Distribuciones de Probabilidad. 125

es la misma que en cualquier otro de los ensayos y se denota p. La variable aleatoria binomial
es el número de éxitos en n ensayos y lo que se quiere saber es la probabilidad de x éxitos en n
ensayos.

NE
La evaluación de una función de probabilidad binomial, a mano o con una calculadora, se
dificulta cuando el número de ensayos es muy grande. La distribución normal proporciona una
aproximación a las probabilidades binomiales que es fácil de usar bajo ciertas condiciones.

Definición 5.3. Sea X ∼ Bin(n, p), es decir, X tiene una distribución binomial con n ensayos

GE
y una probabilidad de éxito p. Cuando n es grande, la distribución de X es aproximadamente
normal con µ = np y desviación estándar σ = np(1 − p), es decir:

X ∼ N (µ = np, σ = np(1 − p))

Nota. Como regla práctica, diremos que podemos utilizar la aproximación normal cuando n y p
CA
cumplan que p ≤ 1/2 y np ≥ 5 ó p ≥ 1/2 y n(1 − p) ≥ 5.

En general, para pasar de una distribución binomial a normal se usa un factor de corrección
de una variable discreta a continua de 0.5 ası́:
� �
(k − 0.5) − np (k + 0.5) − np
a) P (x = k) ≈ P
TI

� ≤z≤ �
np(1 − p) np(1 − p)
� �
(k − 0.5) − np
b) P (x ≥ k) ≈ P z ≥ �
np(1 − p)
Í S

� �
(k + 0.5) − np
c) P (x ≤ k) ≈ P z ≤ �
np(1 − p)
D

Para ilustrar la aproximación normal a la binomial veamos el siguiente ejemplo.

Ejemplo 5.17. Suponga que una empresa sabe por experiencia que 10 % de sus facturas tienen
TA

algún error. Toma una muestra de 100 facturas y desea calcular la probabilidad de que 12 de
estas facturas contengan algún error. Es decir, quiere hallar la probabilidad binomial de 12 éxitos
en 100 ensayos.

Solución. Aplicando la aproximación normal a este caso se tiene, µ = np = (100)(0.1) = 10 y


ES

� �
σ = np(1 − p) = (100)(0.1)(0.9) = 3. En la Figura 5.13 se muestra la distribución normal
con µ = 10 y σ = 3.
L
RA
126 Distribución de probabilidad Normal.

NE
GE
Figura 5.13: Aproximación normal a una probabilidad binomial con n = 100 y p = 0.1

Recuerde que en una distribución de probabilidad continua las probabilidades se calculan como
CA
áreas bajo la curva de la función de densidad de probabilidad. En consecuencia, la probabilidad
que tiene un solo valor de la variable aleatoria es cero. Por tanto, para aproximar la probabilidad
binomial de 12 éxitos se calcula el área correspondiente bajo la curva normal entre 11.5 y 12.5.
Convirtiendo la distribución normal estándar para calcular P (11.5 ≤ x ≤ 12.5), se tiene
TI

� �
11.5 − 10 x−µ 12.5 − 10
P (x = 12) = P ≤ ≤ = P (0.50 ≤ z ≤ 0.83)
3 σ 3

En la tabla de la probabilidad normal estándar aparece que el área bajo la curva (Figura 5.13) a
Í S

la izquierda de 12.5 es 0.7967. De manera similar, el área bajo la curva a la izquierda de 11.5 es
0.6915. Por tanto, el área entre 11.5 y 12.5 es

P (x = 12) = P (0.50 ≤ z ≤ 0.83) = P (z ≤ 0.83) − P (z ≤ 0.50) = 0.7967 − 0.6915 = 0.1052


D

El cálculo normal de la probabilidad de 12 éxitos en 100 ensayos es aproximadamente 0.1052.


TA

Ejemplo 5.18. Suponga que se quiere calcular la probabilidad de 13 o menos facturas con errores
en una muestra de 100 facturas.

Solución. En la Figura 5.14 se muestra el área bajo la curva que aproxima esta probabilidad.
ES

Observe que debido al uso del factor de continuidad el valor que se usa para calcular esta
L
RA
Distribuciones de Probabilidad. 127

NE
GE
Figura 5.14: Aproximación normal a una probabilidad binomial con n = 100 y p = 0.1

probabilidad es 13.5. El valor z que corresponde a 13.5 es


CA
13.5 − 10
z= = 1.17
3

En la tabla de probabilidad normal estándar acumulada se observa que el área bajo la curva normal
estándar y a la izquierda de z = 1.17 es 0.8790. El área bajo la curva normal que aproxima la
probabilidad de 13 o menos facturas con errores es la porción sombreada que se observa en la
TI

gráfica de la Figura 5.14.

Ejercicio 5.9. Un fabricante sabe por experiencia que 4 % de su producto es rechazado por
defectos. Un nuevo lote de 800 unidades se van a inspeccionar, ¿cuál es la probabilidad
Í S

aproximada de que 35 o menos unidades sean rechazadas?


D
TA
ES

También podría gustarte