Documentos de Académico
Documentos de Profesional
Documentos de Cultura
RA
NE
UNIDAD 5
Distribuciones de Probabilidad.
GE
Objetivo 5.1. Conocer, comprender y aplicar a problemas de la realidad, el concepto de
distribución de probabilidad a partir del estudio de algunos modelos probabilı́sticos teóricos.
CA
5.1. Variable Aleatoria: concepto y ejemplos.
podemos definir una variable aleatoria asignando a cada resultado del experimento un número:
1) Si el resultado del experimento es numérico porque contamos o medimos, los posibles valores
de la variable coinciden con los resultados del experimento.
Í S
Si arrojamos dos dados, sabemos que la suma X de los puntos que caen hacia arriba debe ser
un entero entre 2 y 12, pero no podemos predecir que valor de X aparecerá en el siguiente
ensayo y podemos decir que X depende del azar. El tiempo de vida de un foco que se extrae
D
aleatoriamente de un lote de focos depende también del azar. El número de varones de una
familia con 5 hijos también depende de la casualidad.
TA
probabilidad definida.
97
L
RA
98 Variable Aleatoria: concepto y ejemplos.
NE
Por ejemplo, si se lanza una moneda 3 veces, el número de caras X es una variable
aleatoria que toma los valores 0, 1, 2, 3; es decir puede que ninguna vez, una sola, dos o tres
veces salga cara como resultado; la probabilidad de que X = 2 es 3/8 ya que el espacio muestral
S = {ccc, cc+, c + c, c + +, +cc, +c+, + + c, + + +}. Ası́ pues, el espacio muestral es el dominio
GE
de la función y el conjunto de valores que la variable puede tomar es el rango de la función, que
es un subconjunto de los números reales R.
Definición 5.1. Una variable aleatoria X es una función cuyo dominio es el espacio muestral
S y cuyo rango es un subconjunto de los números reales R que tiene asociada a su conjunto de
valores una función de probabilidad.
D Í S
TA
ES
L
RA
Distribuciones de Probabilidad. 99
Definición 5.2. Una tabla, gráfica o expresión matemática (fórmula) que dé las probabilidades
NE
con que una variable aleatoria toma diferentes valores, se llama distribución de probabilidad
de la variable aleatoria. Al conjunto de pares ordenados (X,f (X)) donde X es el conjunto de
valores de una variable aleatoria y f (X) las probabilidades asignadas a X, se le llama función
de probabilidad en el caso de que la variable aleatoria X sea discreta; y función de densidad de
probabilidad en el caso de que la variable aleatoria sea continua.
GE
Llamando Ω al espacio muestral, se verificará:
Solución. Lo primero que se debe hacer es identificar la variable aleatoria X y los posibles valores
TI
S Valores de X f (xi ) = P (X = xi )
1
MM 0 f (0) = P (X = 0) = 4
MH 1 2
f (1) = P (X = 1) =
D
4
HM 1
1
HH 2 f (2) = P (X = 2) = 4
4
Total = =1
TA
Ejemplo 5.2. Sea X la variable aleatoria que indica la suma de los puntos en las caras superiores
al lanzar dos dados no cargados, ¿Cuál es el espacio muestral, el conjunto de valores de X y sus
respectivas probabilidades?
ES
Solución. Según la Definición 4.1 de la Página 76 el espacio muestral es el conjunto de todos los
resultados posibles distintos del experimento aleatorio, en este ejemplo, el lanzamiento de los dos
L
RA
100 Distribuciones de probabilidad.
NE
(2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
(3, 1)
(3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
S=
(4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
(5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
(6, 1)
(6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
GE
La variable aleatoria X fue definida como la suma de los puntos en las caras superiores, por lo que
el conjunto de todos los valores que puede tomar esta variable aleatoria es:
S Valores de X f (xi ) = P (X = xi )
CA
1
(1, 1) 2 f (2) = P (X = 2) = 36
2
(1, 2), (2, 1) 3 f (3) = P (X = 3) = 36
3
(1, 3), (3, 1), (2, 2) 4 f (4) = P (X = 4) = 36
4
(1, 4), (4, 1), (2, 3), (3, 2) 5 f (5) = P (X = 5) = 36
5
(1, 5), (5, 1), (2, 4), (4, 2), (3, 3) 6 f (6) = P (X = 6) = 36
6
(1, 6), (6, 1), (2, 5), (5, 2), (3, 4), (4, 3) 7
TI
f (7) = P (X = 7) = 36
5
(2, 6), (6, 2), (3, 5), (5, 3), (4, 4) 8 f (8) = P (X = 8) = 36
4
(3, 6), (6, 3), (4, 5), (5, 4) 9 f (9) = P (X = 9) = 36
3
(4, 6), (6, 4), (5, 5) 10 f (10) = P (X = 10) = 36
Í S
2
(5, 6), (6, 5) 11 f (11) = P (X = 11) = 36
1
(6, 6) 12 f (12) = P (X = 12) = 36
�
Total: f (xi ) = 36
36 = 1
D
Si X es una variable aleatoria, entonces para cualquier número real x0 , existe la probabilidad
P (X ≤ x0 ) del evento X ≤ x0 (X toma cualquier valor menor o igual a x0 ).
distribución acumulada.
F (x0 ) = P (X ≤ x0 )
NE
.
GE
Solución. La distribución acumulada F (x) está representada en la tercera columna de la siguiente
tabla:
X f (xi ) P (X ≤ x) = F (x)
1 1
0 f (0) = 4 P (X ≤ 0) = F (0) = 4
2 3
1 f (1) = 4 P (X ≤ 1) = F (1) = 4
1 4
2 f (2) = P (X ≤ 2) = F (2) =
CA
4 4
1 2 3
Obsérvese que F (1) = P (X ≤ 1) = P (X = 0) + P (X = 1) = 4 + 4 = 4
tabla:
X f (xi ) P (X ≤ x) = F (x)
1 1
2 P (X = 2) = 36 P (X ≤ 2) = F (2) = 36
Í S
2 3
3 P (X = 3) = 36 P (X ≤ 3) = F (3) = 36
3 6
4 P (X = 4) = 36 P (X ≤ 4) = F (4) = 36
4
5 P (X = 5) = 36 P (X ≤ 5) = F (5) = 10
36
5
6 P (X = 6) = 36 P (X ≤ 6) = F (6) = 15
D
36
6
7 P (X = 7) = 36 P (X ≤ 7) = F (7) = 21
36
5
8 P (X = 8) = 36 P (X ≤ 8) = F (8) = 26
36
4
9 P (X ≤ 9) = F (9) = 30
TA
P (X = 9) = 36 36
3
10 P (X = 10) = 36 P (X ≤ 10) = F (10) = 33
36
2
11 P (X = 11) = 36 P (X ≤ 11) = F (11) = 35
36
1
12 P (X = 12) = 36 P (X ≤ 12) = F (12) = 36
36
Obsérvese que:
ES
F (5) = P (X ≤ 5) = P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5)
L
RA
102 Distribuciones de probabilidad.
� 1 2 3 4 10
F (5) = P (X = xi ) = + + + =
36 36 36 36 36
xi ≤5
NE
Se puede demostrar que la probabilidad P (x1 < X ≤ x2 ) de un evento x1 < X ≤ x2 se
puede expresar en términos de la función de distribución acumulada de F (x), donde x1 y x2 son
dos valores cualesquiera x1 < x2
GE
unión es el evento X ≤ x2 según la Definión 4.4 de la Página 83.
P (X ≤ x2 ) = P (X ≤ x1 ) + P (x1 < X ≤ x2 )
Ejemplo 5.5. Con los datos del ejemplo anterior, determinar P (3 < X ≤ 5)
P (3 < X ≤ 5) = P (X ≤ 5) − P (X ≤ 3)
= F (5) − F (3)
10 3
D
= −
36 36
7
=
36
TA
xi � ∞
P (S) = P (−∞ < X < ∞) = f (v)dv = 1, si X es continua.
−∞
L
RA
Distribuciones de Probabilidad. 103
NE
4) Si X es continua:
GE
5.3. Media y varianza de la distribución de probabilidad de
una variable aleatoria discreta y continua.
� ∞
µ= xf (x)dx, si X es continua (5.2)
−∞
TI
Solución. Como es una variable aleatoria discreta y según la Ecuación (5.1) la media viene dada
TA
ES
L
RA
Media y varianza de la distribución de probabilidad de una variable aleatoria discreta y
104 continua.
por:
�
µ = E [X] = xi f (x)
NE
xi ∈S
GE
=1
Es decir, en promedio se espera observar un varón en el experimento de observar al azar dos niños
recién nacidos.
� ∞
σ2 = (x − µ)2 f (x)dx, si X es continua (5.4)
−∞
En palabras, la varianza es una medida de dispersión o variabilidad de los valores que puede
tomar la variable aleatoria X correspondiente.
TA
Ejemplo 5.7. La varianza y la desviación estándar de la distribución del Ejemplo 5.1 son:
ES
L
RA
Distribuciones de Probabilidad. 105
NE
xi ∈S
GE
1
=
2
y la desviación estándar será: �
√ 1
σ= σ2 =
2
CA
Ejercicio 5.2. Determinar la varianza y la desviación estándar del Ejemplo 5.2.
siguientes caracterı́sticas:
(defectuoso).
2) La proporción de elementos A y D en la población es constante y no se modifica cualquiera
que sea la cantidad observada. Esto implica que si la población es finita, los elementos se
reemplazan una vez observados. Llamaremos p a la probabilidad de defectuoso, y q = 1 − p a
D
la de aceptable.
3) Las observaciones son independientes, es decir, la probabilidad de elemento defectuoso es
TA
Este modelo se aplica a poblaciones finitas de las que tomamos elementos al azar
con reemplazamiento, y también a poblaciones conceptualmente infinitas, como las piezas
ES
que producirá una máquina, siempre que el proceso generador sea estable (proporción de
L
RA
106 Distribución de probabilidad Binomial.
piezas defectuosas constante a largo plazo) y sin memoria (el resultado en cada momento es
independiente de lo previamente ocurrido).
NE
Ejemplos de procesos de Bernoulli son observar el sexo de un recién nacido, si un cliente
está satisfecho o no con un servicio, la aparición del número 10 en tiradas sucesivas de una ruleta
o la aparición de un elemento defectuoso en una fabricación.
En este proceso podemos definir distintas variables aleatorias que darán lugar a distintas
distribuciones de probabilidad.
GE
Definimos la variable aleatoria de Bernoulli por:
0, si el elemento es aceptable
x=
1, si el elemento es defectuoso
experimento que resulte en proposiciones: si o no; éxito o fracaso; varón o niña; artı́culos
defectuosos o no defectuosos; etc. Obsérvese que, en el uso estadı́stico, resultados “favorables”
o “satisfactorios” no significa necesariamente resultados que sean “deseable” en la práctica.
Í S
Ahora definiremos un experimento Binomial, éste debe cumplir con las siguientes
propiedades:
2) Cada ensayo tiene dos resultados posibles uno llamado “éxito” y otro “fracaso” (cada ensayo
es un experimento de Bernoulli).
L
RA
Distribuciones de Probabilidad. 107
NE
4) Existe una variable aleatoria discreta X, asociada al experimento que cuenta el número de
éxitos en los n ensayos o el número de ensayos con éxito, entonces los valores de X son:
X = 0, 1, 2, 3, ...n.
GE
1) El nacimiento de un niño.
2) El lanzamiento de una moneda legal.
3) Extracción de sangre para una transfusión (si sale el tipo y Rh deseado es éxito, de cualquier
otro, fracaso).
4) Partes defectuosas y no defectuosas producidas por una máquina.
CA
Ahora trataremos de obtener la función de probabilidad Binomial f (x) que da la
probabilidad de obtener X éxitos en n ensayos.
p · p · p · · · (1 − p) · (1 − p) · (1 − p) · · · = px (1 − p)n−x
� �� � � �� �
x n−x
n! n
=
x!(n − x)! k
cada una de las cuales puede o no presentarse el suceso A. Sea X el número de veces en que se
presenta A.
A , ����
���� Ac , ����
A , · · · , ����
A , ���� Ac , ����
Ac
p p p 1−p 1−p 1−p
ES
L
RA
108 Distribución de probabilidad Binomial.
p · p · p · · · (1 − p) · (1 − p) · (1 − p) · · · = pk (1 − p)n−k
NE
� �� � � �� �
k n−k
� �
n k
P (X = k) = p (1 − p)n−k ; k = 0, 1, ..., n (5.6)
GE
k
Se dice que X sigue una distribución Binomial y se indica por: X ∼ Bin(n, p) y su media
es np y varianza np(1 − p)
Ejemplo 5.8. Se conoce que 10 % de cierta población es daltónica. Si se selecciona una muestra
de 15 personas al azar de esta población, calcule las probabilidades siguientes:
CA
a) 4 sean daltónicos.
b) 2 o menos sean daltónicos.
c) 3 o más sean daltónicos.
d) entre 1 y 3 inclusive sean daltónicos.
e) E[X]
TI
2 � �
� 15
P (x ≤ 2) = 0.1k 0.915−k = P (x = 0) + P (x = 1) + P (x = 2)
k
ES
k=0
= 0.2059 + 0.3432 + 0.2669
= 0.8159
L
RA
Distribuciones de Probabilidad. 109
15 � �
� 15
NE
P (x ≥ 3) = 0.1k 0.915−k = P (x = 3) + P (x = 4) + · · · + P (x = 15) = 0.1841
k
k=3
Resultado obtenido al calcularse las 13 probabilidades y sumando; pero este metodo puede
resultar un poco tedioso, utilizaremos la técnica del complemento, de acuerdo a la Definición
4.5 de la Página 83, tenemos que de todos los posibles valores que puede tomar X:
GE
0 1 2� 3
� �� � 4 5 6 7 8 9 10
�� 11 12 13 14 15�
complemento lo que se pide
3 � �
� 15
P (1 ≤ x ≤ 3) = 0.1k 0.915−k = P (x = 1) + P (x = 2) + P (x = 3) = 0.7386
k
k=1
TI
Nota (Complementos para desigualdades). En la siguiente tabla se muestran los conjuntos con
Í S
desigualdades (primera columna), sus complementos (segunda columna) y las igualdades para el
cálculo de sus respectivas probabilidades.
A Ac Igualdad de probabilidades
D
b) Ningún defectuoso?
c) ¿Cuántos televisores defectosos se esperan tener en dicha muestra?
NE
5.6. Distribución de Poisson.
GE
grandes usos en muchos campos, especialmente en Biologı́a y Medicina.
Una variable del tipo Poisson cuenta éxitos (es decir, objetos de un tipo determinado) que
ocurren en una región del espacio o del tiempo. En este tipo de experimentos los éxitos buscados
son expresados por unidad de área, tiempo, pieza, etc. Por ejemplo:
6) Número de clientes que llegan a un banco por hora, dı́a, semana, etc.
El experimento que genera una variable aleatoria de Poisson debe cumplir las siguientes
condiciones:
Í S
4) La probabilidad de encontrar uno o más éxitos en una región del tiempo o del espacio tiende a
cero a medida que se reducen las dimensiones de la región en estudio.
ES
L
RA
Distribuciones de Probabilidad. 111
NE
e−λ λx
f (x) = P (X = x) = , λ ≥ 0; x = 0, 1, 2, ... (5.7)
x!
La letra griega λ (lambda) es el parámetro de esta distribución que representa tanto la media
como la varianza de ocurrencias del evento aleatorio en el intervalo, es decir, E[X] = V ar[X] =
GE
λ. El sı́mbolo e es una constante cuyo valor aproximado a 4 cifras de cimales es 2.7183 (base de
los logaritmos naturales).
Nota (Importante). Las variables Poisson cumplen la propiedad de que la suma de variables
Poisson independientes es otra Poisson con media igual a la suma las medias.
TI
Ejemplo 5.9. Si un banco recibe en promedio 6 cheques sin fondo por dı́a, ¿cuáles son las
probabilidades de que reciba, a) cuatro cheques sin fondo en un dı́a dado, b) 10 cheques sin
fondos en cualquiera de dos dı́as consecutivos?
Í S
Solución.
a) Sea X = variable que define el número de cheques sin fondo que llegan al banco en un dı́a
D
e−6 64
P (X = 4) = = 0.1339
TA
4!
b) Sea Y = variable que define el número de cheques sin fondo que llegan al banco en dos dı́as
consecutivos (Y = 0, 1, 2, 3, ...) y λ = 6 · 2 = 12 cheques sin fondo que llegan al banco en
dos dı́as consecutivos; lo anterior gracias a la propiedad de las variables de Poisson.
ES
e−12 1210
P (Y = 10) = = 0.1048
10!
L
RA
112 Distribución de Poisson.
Ejercicio 5.4. El número promedio de automóviles que se detienen por minuto para poner
gasolina en cierta gasolinera de la Ciudad de San Salvador es 1.2. ¿Cuál es la probabilidad
de qué en determinado minuto se detengan:
NE
a) Menos de dos automóviles.
b) Más de tres automóviles.
c) Dos ó tres automóviles para poner gasolina.
GE
d) Al menos dos automóviles.
Ejemplo 5.10. Cierta enfermedad tiene una probabilidad muy baja de ocurrir, p = 1/100, 000.
Calcular la probabilidad de que en una ciudad con 500, 000 habitantes haya más de 3 personas
con dicha enfermedad. Calcular el número esperado de habitantes que la padecen.
Ası́ el número esperado de personas que padecen la enfermedad es E[X] = 5. Como V ar[X] = 5,
existe una gran dispersión, y no serı́a extraño encontrar que en realidad hay muchas más personas
o menos que están enfermas. La probabilidad de que haya más de tres personas enfermas es:
Í S
P (X > 3) = 1 − P (X ≤ 3)
= 1 − [P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3)]
� −5 0 �
D
= 0.7350
falten a clases?
L
RA
Distribuciones de Probabilidad. 113
Sin lugar a duda, el modelo de mayor uso de todas las distribuciones continuas es
NE
la distribución normal o distribución Gaussiana (atribuida a C.F. Gauss, quien primero hizo
referencia a ella en 1809 en relación con la teorı́a de los errores de medidas fı́sicas; sin embargo,
ya habı́a sido descubierta por De Moivre en 1733 como la forma limitante a la binomial. También
fue conocida por Laplace en 1774, pero por un error histórico ha sido acreditada a Gauss). Esta
distribución no solo sirve como distribución modelo de muchos problemas prácticos de la vida
GE
real sino que también es utilizada en muchas investigaciones teóricas.
normalmente.
1 1 2
f (x) = √ e− 2σ2 (x−µ) , −∞ < x < ∞ (5.8)
2πσ 2
de campana.
L
RA
114 Distribución de probabilidad Normal.
NE
GE
Figura 5.1: Curva en forma de campana de una distribución normal
Las siguientes son observaciones importantes acerca de las caracterı́sticas de las distribu-
ciones normales.
TI
2) Toda la familia de distribuciones normales se diferencia por medio de dos parámetros: la media
µ y la desviación estándar σ.
3) El punto más alto de una curva normal se encuentra sobre la media, la cual coincide con la
D
mediana y la moda.
5) Las probabilidades correspondientes a la variable aleatoria normal se dan mediante áreas bajo
la curva normal. Toda el área bajo la curva de una distribución normal es 1. Como esta
distribución es simétrica, el área bajo la curva y a la izquierda de la media es 0.50 y el área bajo
la curva y a la derecha de la media es 0.50.
ES
6) Los porcentajes de los valores que se encuentran en algunos intervalos comúnmente usados
son:
L
RA
Distribuciones de Probabilidad. 115
a. 68.3 % de los valores de una variable aleatoria normal se encuentran más o menos una
desviación estándar de la media. P (µ − σ < x < µ + σ) ≈ 0.683
b. 95.4 % de los valores de una variable aleatoria normal se encuentran más o menos dos
NE
desviaciones estándar de la media. P (µ − 2σ < x < µ + 2σ) ≈ 0.954
c. 99.7 % de los valores de una variable aleatoria normal se encuentran más o menos tres
desviaciones estándar de la media. P (µ − 3σ < x < µ + 3σ) ≈ 0.997
GE
CA
Figura 5.3 se muestran tres distribuciones normales que tienen la misma desviación estándar,
pero diferentes medias. (−10, 0 y 20).
TA
10) La distribución normal es simétrica, siendo la forma de la curva normal al lado izquierdo de
la media, la imagen especular de la forma al lado derecho de la media. Las colas de la curva
normal se extienden al infinito en ambas direcciones y en teorı́a jamás tocan el eje horizontal.
Dado que es simétrica, la distribución normal no es sesgada; su sesgo es cero.
ES
11) La desviación estándar determina qué tan plana y ancha es la curva normal. Desviaciones
estándar grandes corresponden a curvas más planas y más anchas, lo cual indica mayor
L
RA
116 Distribución de probabilidad Normal.
NE
GE
Figura 5.3: Tres distribuciones normales con diferente media e igual varianza
variabilidad en los datos. En la Figura 5.4 se muestran dos curvas normales que tienen la
misma media pero distintas desviaciones estándar.
CA
TI
Figura 5.4: Dos distribuciones normales con igual media y diferentes varianzas
Í S
12) Realmente no existe la distribución normal sino infinitas distribuciones normales, para cada
pareja de valores de µ y de σ existe una distribución normal; pero se puede establecer una
relación entre ellas.
D
especiales, µ = 0 y σ = 1.
L
RA
Distribuciones de Probabilidad. 117
NE
GE
Figura 5.5: Distribución normal estándar
Como ocurre con otras variables aleatorias continuas, los cálculos de la probabilidad en
cualquier distribución normal se hacen calculando el área bajo la gráfica de la función de densidad
de probabilidad. Por tanto, para hallar la probabilidad de que una variable aleatoria normal
TI
esté dentro de un determinado intervalo, se tiene que calcular el área que se encuentra bajo la
curva normal y sobre ese intervalo.
Para la distribución normal estándar ya se encuentran calculadas las áreas bajo la curva
Í S
normal y se cuenta con tablas que dan estas áreas y que se usan para calcular las probabilidades.
En nuestro curso utilizaremos la tabla que contiene áreas, o probabilidades acumuladas.
1) La probabilidad de que la variable aleatoria normal estándar z sea menor o igual que un valor
dado;
TA
Para mostrar el uso de las tablas de probabilidad acumulada de la distribución normal estándar en
ES
Ejemplo 5.11. Para el primer caso, veremos cómo se calcula la probabilidad de que z sea menor
o igual a 1.00; es decir P (z ≤ 1.00).
NE
Solución. Esta probabilidad acumulada es el área bajo la curva normal a la izquierda de z = 1.00
como se muestra en la Figura 5.6.
GE
CA
Figura 5.6: Área bajo la curva de z ≤ 1.00
en la columna del extremo izquierdo de la tabla y después localice 0.00 en el renglón en la parte
superior de la tabla. Observe que en el interior de la tabla, el renglón 1.0 y la columna 0.00 se
cruzan en el valor 0.8413; por tanto, P (z ≤ 1.00) = 0.8413. Estos pasos se muestran en la Figura
Í S
Para ilustrar cómo se calcula el segundo tipo de probabilidad veamos el siguiente ejemplo
Ejemplo 5.12. Calcular la probabilidad de que z esté en el intervalo entre −0.50 y 1.25; esto es,
D
P (−0.50 ≤ z ≤ 1.25).
Para calcular esta probabilidad son necesarios tres pasos. Primero, se encuentra el área bajo la
curva normal a la izquierda de z = 1.25. Segundo, se encuentra el área bajo la curva normal a la
izquierda de z = −0.50. Por último, se resta el área a la izquierda de z = −0.50 del área a la
izquierda de z = 1.25 y se encuentra, P (−0.50 ≤ z ≤ 1.25).
ES
Para encontrar el área bajo la curva normal a la izquierda de z = 1.25, primero se localiza en
la tabla de probabilidad normal estándar el renglón 1.2 y después se avanza por ese renglón
L
RA
Distribuciones de Probabilidad. 119
NE
GE
Figura 5.7: Parte de la tabla acumulada normal estandar para valores de z ≥ 0
CA
TI
Í S
hasta la columna 0.05. Como el valor que aparece en el renglón 1.2 columna 0.05 es 0.8944,
P (z ≤ 1.25) = 0.8944. De manera similar, para encontrar el área bajo la curva a la izquierda de
D
z = −0.50 en la tabla localizamos el valor en el renglón −0.5 y la columna 0.00; como el valor
que se encuentra es 0.3085, P (z ≤ −0.50) = 0.3085. Por tanto,
TA
intervalo entre dos valores dados. Con frecuencia se desea calcular la probabilidad de que una
L
RA
120 Distribución de probabilidad Normal.
variable aleatoria normal tome un valor dentro de cierto número de desviaciones estándar respecto
a la media.
NE
Ejemplo 5.13. Suponga que desea calcular la probabilidad de que la variable aleatoria normal
estándar se encuentre a no más de una desviación estándar de la media; es decir, P (−1.00 ≤
z ≤ 1.00).
Solución. Para calcular esta probabilidad tiene que hallar el área bajo la curva entre −1.00 y 1.00.
GE
Antes se encontró que P (z ≤ 1.00) = 0.8413. Siguiendo los pasos anteriores encontrará que el
área bajo la curva a la izquierda de z = −1.00 es 0.1587, de manera que P (z ≤ −1.00) = 0.1587.
Por tanto,
Figura 5.9: Área bajo la curva a no más de una desviación estándar de la media
Para ilustrar cómo se calcula el tercer tipo de probabilidad veamos el siguiente ejemplo
D
Ejemplo 5.14. Suponga que desea calcular la probabilidad de tener un valor z por lo menos
igual a 1.58; es decir, P (z ≥ 1.58).
TA
Solución. El valor en el renglón z = 1.5, columna 0.08 de la tabla normal acumulada es 0.9429;
por tanto, P (z ≤ 1.58) = 0.9429. Pero, como toda el área bajo la curva normal es 1
NE
GE
Figura 5.10: Área bajo la curva de z ≥ 1.58
Recuerde que la tabla de probabilidad normal estándar da el área bajo la curva a la izquierda de un
determinado valor z. Se ha recibido la información de que el área en la cola superior (derecha) de
la curva es 0.10. Por tanto, el área bajo la curva a la izquierda del valor desconocido de z debe ser
NE
0.9000. Al recorrer el cuerpo de la tabla, se encuentra que 0.8997 es la probabilidad acumulada
más cercana a 0.9000. En la Figura 5.12 se reproduce la sección de la tabla en la que se encuentra
este resultado.
GE
CA
originalmente planteada, 0.10 es la probabilidad aproximada de que z sea mayor que 1.28.
de la variable aleatoria normal estándar z. Es posible hacer dos tipos de preguntas. En el primer
tipo de pregunta se dan valores, o un valor de z, y se pide usar la tabla para determinar el área
TA
la respuesta correcta.
L
RA
Distribuciones de Probabilidad. 123
a) P (z < 1.26)
NE
b) P (z > 1)
c) El área a la izquierda de z es 0.7291.
GE
normal.
La razón por la cual la distribución normal estándar se ha visto de manera tan amplia es
que todas las distribuciones normales son calculadas mediante la distribución normal estándar.
Esto es, cuando distribución normal con una media µ cualquiera y una desviación estándar σ
cualquiera, las preguntas sobre las probabilidades en esta distribución se responden pasando
primero a la distribución normal estándar. Use las tablas de probabilidad normal estándar y los
CA
valores apropiados de z para hallar las probabilidades deseadas. A continuación se da la fórmula
que se emplea para convertir cualquier variable aleatoria X con media µ y desviación estándar σ
en la variable aleatoria normal estándar z.
x−µ
z= (5.10)
TI
µ−µ
z= =0
Í S
De manera que un valor x igual a su media corresponde a z = 0. Ahora suponga que x se encuentra
una desviación estándar arriba de su media. Es decir, x = µ + σ. Aplicando la Ecuación (5.10) el
D
valor correspondiente es
(µ + σ) − µ σ
z= = =1
σ σ
TA
Ası́ que un valor de x que es una desviación estándar mayor que su media corresponde a z = 1.
En otras palabras, z se interpreta como el número de desviaciones estándar a las que está una
variable aleatoria x de su media µ.
Para ver cómo esta distribución permite calcular probabilidades en cualquier distribución
ES
NE
x−µ 10 − 10
z= = =0
σ 2
y que para x = 14
14 − 10 4
z= = =2
GE
2 2
Ası́, la respuesta a la pregunta acerca de la probabilidad de que x esté entre 10 y 14 está dada por
la probabilidad equivalente de que z esté entre 0 y 2 en la distribución normal estándar. Como se
muestra a continuación
� �
10 − 10 x − 10 14 − 10
P (10 ≤ x ≤ 14) = P ≤ ≤ = P (0 ≤ z ≤ 2)
2 2 2
CA
En otras palabras, la probabilidad que se está buscando es que la variable aleatoria x esté entre su
media y dos desviaciones estándar arriba de la media. Usando z = 2 y la tabla de probabilidad
normal estándar acumulada, se ve que P (z ≤ 2) = 0.9772. Como P (z ≤ 0) = 0.5000, se tiene
que
P (0.00 ≤ z ≤ 2.00) = P (z ≤ 2) − P (z ≤ 0) = 0.9772 − 0.5000 = 0.4772
TI
Ejercicio 5.7. Sea X una variable aleatoria normal con media 0.8 y varianza 4, determinar las
probabilidades:
Í S
Ejercicio 5.8. Sea X una variable aleatoria normal con media 2 y varianza 0.25, determinar la
D
es la misma que en cualquier otro de los ensayos y se denota p. La variable aleatoria binomial
es el número de éxitos en n ensayos y lo que se quiere saber es la probabilidad de x éxitos en n
ensayos.
NE
La evaluación de una función de probabilidad binomial, a mano o con una calculadora, se
dificulta cuando el número de ensayos es muy grande. La distribución normal proporciona una
aproximación a las probabilidades binomiales que es fácil de usar bajo ciertas condiciones.
Definición 5.3. Sea X ∼ Bin(n, p), es decir, X tiene una distribución binomial con n ensayos
GE
y una probabilidad de éxito p. Cuando n es grande, la distribución de X es aproximadamente
normal con µ = np y desviación estándar σ = np(1 − p), es decir:
�
X ∼ N (µ = np, σ = np(1 − p))
Nota. Como regla práctica, diremos que podemos utilizar la aproximación normal cuando n y p
CA
cumplan que p ≤ 1/2 y np ≥ 5 ó p ≥ 1/2 y n(1 − p) ≥ 5.
En general, para pasar de una distribución binomial a normal se usa un factor de corrección
de una variable discreta a continua de 0.5 ası́:
� �
(k − 0.5) − np (k + 0.5) − np
a) P (x = k) ≈ P
TI
� ≤z≤ �
np(1 − p) np(1 − p)
� �
(k − 0.5) − np
b) P (x ≥ k) ≈ P z ≥ �
np(1 − p)
Í S
� �
(k + 0.5) − np
c) P (x ≤ k) ≈ P z ≤ �
np(1 − p)
D
Ejemplo 5.17. Suponga que una empresa sabe por experiencia que 10 % de sus facturas tienen
TA
algún error. Toma una muestra de 100 facturas y desea calcular la probabilidad de que 12 de
estas facturas contengan algún error. Es decir, quiere hallar la probabilidad binomial de 12 éxitos
en 100 ensayos.
� �
σ = np(1 − p) = (100)(0.1)(0.9) = 3. En la Figura 5.13 se muestra la distribución normal
con µ = 10 y σ = 3.
L
RA
126 Distribución de probabilidad Normal.
NE
GE
Figura 5.13: Aproximación normal a una probabilidad binomial con n = 100 y p = 0.1
Recuerde que en una distribución de probabilidad continua las probabilidades se calculan como
CA
áreas bajo la curva de la función de densidad de probabilidad. En consecuencia, la probabilidad
que tiene un solo valor de la variable aleatoria es cero. Por tanto, para aproximar la probabilidad
binomial de 12 éxitos se calcula el área correspondiente bajo la curva normal entre 11.5 y 12.5.
Convirtiendo la distribución normal estándar para calcular P (11.5 ≤ x ≤ 12.5), se tiene
TI
� �
11.5 − 10 x−µ 12.5 − 10
P (x = 12) = P ≤ ≤ = P (0.50 ≤ z ≤ 0.83)
3 σ 3
En la tabla de la probabilidad normal estándar aparece que el área bajo la curva (Figura 5.13) a
Í S
la izquierda de 12.5 es 0.7967. De manera similar, el área bajo la curva a la izquierda de 11.5 es
0.6915. Por tanto, el área entre 11.5 y 12.5 es
Ejemplo 5.18. Suponga que se quiere calcular la probabilidad de 13 o menos facturas con errores
en una muestra de 100 facturas.
Solución. En la Figura 5.14 se muestra el área bajo la curva que aproxima esta probabilidad.
ES
Observe que debido al uso del factor de continuidad el valor que se usa para calcular esta
L
RA
Distribuciones de Probabilidad. 127
NE
GE
Figura 5.14: Aproximación normal a una probabilidad binomial con n = 100 y p = 0.1
En la tabla de probabilidad normal estándar acumulada se observa que el área bajo la curva normal
estándar y a la izquierda de z = 1.17 es 0.8790. El área bajo la curva normal que aproxima la
probabilidad de 13 o menos facturas con errores es la porción sombreada que se observa en la
TI
Ejercicio 5.9. Un fabricante sabe por experiencia que 4 % de su producto es rechazado por
defectos. Un nuevo lote de 800 unidades se van a inspeccionar, ¿cuál es la probabilidad
Í S